本站小編為你精心準備了人IDE基因啟動子生物信息學探討參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
摘要:對人ide基因啟動子進行生物信息學分析以獲得人IDE基因啟動子、CpG島及轉錄因子結合位點特征.從UCSC基因組數據庫成功獲得人IDE基因5’調控區(qū)2000bp序列.Promoter2.0、FPROM、NNPP預測人IDE基因分別有3個、2個、6個啟動子.Relativeprofilescorethresh-old選擇80%、85%、90%、95%、100%時,JASPAR預測該序列存在5170、1771、454、87和5個可能的轉錄因子結合位點.Relativeprofilescorethreshold選擇80%,搜索到6個潛在的TCF7L2轉錄因子結合位點.采用進化足跡法,LAGAN預測方法獲得位于人和小鼠同源IDE基因啟動子保守區(qū)域相同位置的轉錄因子結合位點為14個,包含轉錄因子SPI-1、cap、c-FOS、FREAC-3、c-ETS、Cdxa、HSF2等.發(fā)現一個CpG島,位于1303~1705bp之間,大小為403bp.人IDE基因啟動子、CpG島及轉錄因子結合位點的生物學信息學分析,為下一步基因表達調控實驗奠定了基礎.
關鍵詞:生物信息學分析;IDE基因;5’調控區(qū);轉錄因子;啟動
子胰島素降解酶(insulindegradationenzyme,IDE;EC3.4.24.56),又名胰島素酶、胰島素蛋白酶,是一種非典型的M16A亞家族鋅金屬蛋白酶,水解生物醫(yī)學中幾個重要的中等大小的肽底物,包括胰島素、胰島素樣生長因子-2、胰高血糖素、胰淀素和β淀粉樣蛋白,并具有調節(jié)功能:調節(jié)蛋白酶體活性、激素受體活性、過氧化物酶體脂肪酸氧化、細胞的生長發(fā)育.胰島素降解酶參與阿爾茨海默病(AlzheimerDisease,AD)、2型糖尿?。═ype2Di-abetes,T2D)的發(fā)病機制,也被鑒定為水痘-帶狀皰疹病毒感染和細胞擴散的細胞受體.2型糖尿病由漸進性β細胞功能障礙、胰島素分泌不足,或胰島素抵抗引起[1-3].在疾病早期階段對2型糖尿病患者進行胰島素短期強化治療是近年來被關注的一項策略[4-5].胰島素降解酶通過降解胰島素的機制來控制體內循環(huán)胰島素水平.胰島素降解減少使循環(huán)的空腹和外周胰島素水平長期升高,進一步加劇胰島素抵抗.因此,胰島素降解酶是治療2型糖尿病的潛在的藥物靶標[6-7].目前對于人IDE基因表達調控的機制還缺乏了解,用生物信息學的方法對基因的啟動子進行預測和分析可以加快基因調控機制和發(fā)病機制的研究進程.本研究利用生物信息學軟件對人IDE基因核心啟動子區(qū)域、CpG島、轉錄因子結合位點進行生物信息學分析,為人IDE基因啟動子的克隆、基因的轉錄調控機制研究奠定了理論基礎.
1材料與方法
1.1材料人IDE基因GeneID:3416,位于10q23.33,有25個外顯子,6個轉錄變異體.變異體1編碼最長的蛋白質,mRNA登錄號:NM_004969.3.本研究選擇變異體1作為研究人IDE基因的材料.
1.2方法
1.2.1人IDE基因5’調控區(qū)序列的獲得在UC-SC網站中,以“IDE”為檢索詞搜索人IDE基因在基因組序列(GRCh38/hg38)中的位點.以轉錄起始點為界限,截取基因組序列中其上游-2000bp~-1bp共2000bp序列作為IDE基因5’調控區(qū)進行序列分析.
1.2.2小鼠同源IDE基因5’調控區(qū)序列的獲得在NCBI的小鼠RefSeqRNA數據庫中搜索NM_004969.3的同源序列,得到唯一序列NM_031156.3,一致性為86%,說明兩者的同源性較高.NM_031156.3為小鼠胰島素降解酶的mR-NA.按照人IDE基因5’調控區(qū)序列獲得的方法獲得小鼠同源基因5’調控區(qū)序列.
1.2.3啟動子區(qū)預測和分析利用在線軟件NeuralNetworkPromoterPrediction,Promoter2.0與FPROM對人IDE基因5’調控區(qū)中潛在的啟動子區(qū)進行預測和分析.參數設置:NeuralNetworkPromoterPrediction啟動子剪切值設為0.85,Promoter2.0取其默認設置,FPROM的TATA盒啟動子的閾值選擇0.8.
1.2.4人IDE基因5’調控區(qū)轉錄因子結合位點預測利用在線軟件JASPAR對人IDE基因5’調控區(qū)轉錄因子結合位點進行預測,參數設置如下:JASPARmatrixmodelsspecies選擇Homosapiens,Numberofmatrices選擇200,Type選擇Withineachmatrix,Relativeprofilescorethreshold選擇80%、85%、90%、95%、100%.進一步采用進化足跡法分析,在CONREAL網站使用4種不同的預測方法(CONREAL、LAGAN、MAVID、BLASTZ)確定人和小鼠同源IDE基因啟動子區(qū)保守的核苷酸序列,在JASPAR、Trans-facv.8.2兩種脊椎動物轉錄因子結合位點數據庫中搜索位于保守區(qū)域的相同的轉錄因子.參數設置如下:thresholdforPWMs設為80%,thresholdforhomology設為50%.
1.2.5人IDE基因啟動子區(qū)甲基化CpG島預測利用在線軟件EMBOSS與MethPrimer對人IDE基因5’調控區(qū)進行CpG島預測.相關參數設置為:CpG檢測含量/期望含量(Obs/Exp)>0.60,GC%>50%,CpG島長度>200bp.
2結果
2.1人IDE基因啟動子分析在UCSC數據庫中獲得人IDE基因5’調控區(qū)2000bp序列,在染色體上的位點為:chr10∶92574077~92576076.將這2000bp序列作為候選啟動子用3種啟動子預測軟件進行分析.Promoter2.0預測人IDE基因有3個啟動子,FPROM預測人IDE基因有2個啟動子.NeuralNet-workPromoterPrediction在正義鏈上預測人IDE基因有6個啟動子.
2.2人類IDE基因5’調控區(qū)轉錄因子結合位點分析利用JASPAR軟件對人IDE基因5’調控區(qū)轉錄因子結合位點進行預測,Relativeprofilescorethreshold選擇80%、85%、90%、95%、100%時,獲得正負鏈上轉錄因子結合位點數依次為5170、1771、454、87和5個,其中Relativeprofilescorethreshold選擇100%時轉錄因子結合位點預測結果如表4所示.選擇轉錄因子TCF7L2,Relativeprofilescorethreshold選擇80%,搜索到6個潛在的TCF7L2轉錄因子結合位點.
2.3人IDE基因啟動子區(qū)甲基化CpG島預測使用EMBOSS軟件對人IDE基因5’調控區(qū)2000bp序列進行CpG島預測,結果顯示有一個CpG島位于上述序列的1433~1657bp之間,大小為225bp.使用MethPrimer軟件在人IDE基因5’端轉錄起始點上游發(fā)現一個CpG島,位于1303~1705bp之間,大小為403bp(圖2).EMBOSS軟件預測的CpG島位于MethPrimer軟件預測的CpG島之內,說明兩個軟件預測的結果基本完全一致.
3討論
人IDE基因位于10q23~q25,全長約120kb,與人IDE基因染色體區(qū)域連鎖的區(qū)域被鑒定為2型糖尿病相關數量性狀的基因位點.IDE基因敲除小鼠的特點是胰島素降解降低、高胰島素血癥和葡萄糖耐受不良的糖尿病表型[8].抑制IDE基因表達會增加淀粉樣蛋白在胰腺β細胞系中積聚[9].另一方面,IDE基因過度表達增加胰島素的降解和下調胰島素信號通路[10].IDE對胰島素具有優(yōu)先親和力,胰島素的存在會抑制IDE介導的其它物質降解,包括β淀粉樣物質.Cook等[11]研究結果表明,IDE基因表達減少可能是阿爾茨海默病的危險因素,IDE可能與載脂蛋白E相互作用,從而影響β淀粉樣蛋白代謝.IDE基因兩端的多態(tài)性對IDE基因表達有相反的影響,從而導致對不同疾病易感性不同:啟動子的變異增加IDE基因表達但防止阿爾茨海默病,而3’-UTR變化降低IDE基因表達并增加糖尿病風險[12].本研究用生物信息學軟件對人IDE基因5’端調控區(qū)2000bp序列進行生物信息學分析,Pro-moter2.0預測人IDE基因有3個啟動子,其中1400bp處為高度可能的啟動子.FPROM預測人IDE基因有2個啟動子,每個啟動子預測到一個TATA盒.NeuralNetworkPromoterPrediction預測人IDE基因有6個啟動子,每個啟動子預測到一個轉錄起始位點,分值在0.90以上的啟動子有3個.由于預測軟件的原理及準確度不同,預測結果出現差異,結合預測分值以及與HPRM45827序列的比對基本可確定人IDE基因啟動子位于IDE基因5’上游1900bp范圍內,轉錄起始位點位于5’調控區(qū)2000bp序列的1982bp的G堿基處.軟件預測到的序列可作為核心區(qū)域進行進一步的研究和實驗驗證.真核生物啟動子的起始涉及許多蛋白質因子,這些因子結合到各種形形色色的順式作用元件上.啟動子含有所有這些結合位點,它們能以正常效率在適當的調控下支持轉錄[13].利用JASPAR軟件對人IDE基因5’調控區(qū)轉錄因子結合位點進行預測,預測到大量的轉錄因子結合位點,說明人IDE基因的轉錄因子比較豐富,表達調控機制比較復雜.Relativeprofilescorethreshold選擇80%,搜索到6個潛在的TCF7L2轉錄因子結合位點.TCF7L2是含有高遷移率族(HMG)盒的轉錄因子,在Wnt信號通路中起關鍵作用,與血糖穩(wěn)態(tài)有關,該基因變異與2型糖尿病風險增加有關.Lu等[14]研究表明T2D組TCF7L2基因rs7903146的TT基因型的胰島素抵抗程度較CC基因型輕.
在進化保守的啟動子區(qū)域發(fā)現的轉錄因子結合位點相對于啟動子其它區(qū)域中發(fā)現的更為可靠[15].采用進化足跡法,LAGAN預測方法獲得位于序列保守區(qū)域相同位置的轉錄因子結合位點為14個.包含轉錄因子SPI-1、cap、c-FOS、FREAC-3、c-ETS、CdxA、HSF2、Thing1-E47、MZF1、del-taEF1.SPI-1轉錄因子在髓系和B系細胞發(fā)育過程中激活基因表達.SPI-1結合到啟動子附近的PU盒上,與其它轉錄因子和輔助因子一起調節(jié)基因的表達.該蛋白還可以調控靶基因的選擇性剪接.cap蛋白與CBL相關,它的功能是參與胰島素信號轉導與刺激.cap基因突變可能與人類胰島素抵抗紊亂有關.研究表明cap可能參與糖尿病腎病的發(fā)生[16].c-FOS是AP-1轉錄因子亞基,是細胞增殖、分化和轉化的調節(jié)因子.代謝通路分析表明c-FOS轉錄因子參與通用轉錄通路、糖皮質激素受體的調控網絡、MAPK信號通路、cAMP信號通路.FREAC-3屬于叉頭域家族的轉錄因子.c-ETS是ETS家族的轉錄因子,起轉錄激活或抑制作用,靶基因較多,參與干細胞發(fā)育、細胞的衰老和死亡以及腫瘤發(fā)生.HSF2屬于HSF家族的轉錄因子,特異性結合熱休克啟動子元件并激活轉錄.MZF1屬于鋅指蛋白Kruppel家族,與阿爾茨海默病有關[17].突變分析表明MZF1結合位點有助于基礎啟動子活性[18].deltaEF1是一種鋅指轉錄因子,可能在白細胞介素2轉錄抑制中起作用.
該基因突變與后部多形性角膜dystrophy-3和遲發(fā)性福斯角膜內皮營養(yǎng)不良相關.這些轉錄因子涉及到髓系和B系細胞發(fā)育、Wnt信號通路、胰島素抵抗、細胞增殖、細胞分化和轉化、靶基因的選擇性剪接、阿爾茨海默病的發(fā)生、腫瘤發(fā)生、熱休克等通路,說明IDE基因參與的通路可能比較多.轉錄因子的預測還能解釋一些疾病的發(fā)病機制.MZF1與阿爾茨海默病有關、而IDE也與阿爾茨海默病的發(fā)生相關,MZF1轉錄因子對IDE基因的轉錄調節(jié)是不是涉及阿爾茨海默病的發(fā)病機制還有待研究.TCF7L2與胰島素抵抗程度有關,說明TCF7L2基因突變后可能引起IDE轉錄抑制導致胰島素抵抗程度發(fā)生變化.cap基因突變可能與人類胰島素抵抗紊亂有關,cap轉錄因子對IDE轉錄的調節(jié)可能解釋這一現象.MZF1、MZF_1-4、deltaEF1、c-ETS靠近TSS,在1~150bp范圍內,說明這些轉錄因子對轉錄起始有重要的作用.vanWaveren等[19]研究表明在OXPHOS基因TSS附近一些轉錄因子如NRF1,NRF2和YY1F顯示明顯的位置傾向.甲基化CpG島通過抑制特定的轉錄因子結合抑制染色質活性,對于基因的轉錄有重要的調控作用.本研究使用EMBOSS、MethPrimer軟件在人IDE基因5’調控區(qū)2000bp序列的1303~1705bp之間發(fā)現一個CpG島,此區(qū)域的甲基化修飾對調節(jié)人IDE基因的轉錄起始可能發(fā)揮著極其重要的作用.
作者:鮑思元1,2;金科華2;陳紅霞2;陳嬌娥2;胡旺平2 單位:1.湖北科技學院糖尿病心腦血管病變湖北省重點實驗室,2.湖北科技學院基礎醫(yī)學院