下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
生物信息學(xué)在dna甲基化研究中的應(yīng)用
在多細(xì)胞生物的發(fā)育過程中,細(xì)胞的如何分裂在很大程度上取決于其內(nèi)部的遺傳因素,基因的表達(dá)模式不僅取決于細(xì)胞內(nèi)遺傳因素的作用,還與表觀遺傳因素密切相關(guān)。在中醫(yī)學(xué)中,d'a基因的異質(zhì)結(jié)特征表現(xiàn)為第5個天然雜交軌道上的第五個碳原子-cpg-3和d'a基因的異質(zhì)結(jié)特征。在動物中,二甲基化合物形成5-cpg-3和d'a。對于遺傳誘導(dǎo)因素,d'a參與了各種細(xì)胞生理活動,如基因的時空異質(zhì)表達(dá)、x染色體的失去、衰老和腫瘤的發(fā)生。甲基化的cpg-2脂肪酸通過引入特定的轉(zhuǎn)移抑制因子,或阻礙轉(zhuǎn)移激活因素的結(jié)合,以抑制遺傳因素的表達(dá)。為了在基因調(diào)節(jié)中發(fā)揮重要作用,以sun雜志作為代表的人類表觀矩陣聯(lián)盟于2000年10月開始了人類表觀矩陣(hep),以控制人類多個組織的dna基因。目前,該計劃已完成12個組織的第6號、20號和22號染色體的檢測工作。人類基因組中,70%~80%的CpG雙核苷酸處于DNA甲基化狀態(tài).非甲基化的CpG不是均勻分布,而是呈現(xiàn)局部聚集傾向,形成一些GC含量較高、CpG雙核苷酸相對聚集的區(qū)域,即CpG島.根據(jù)Gardiner-Garden等的定義,CpG島是一段長度不小于200bp、GC含量不小于50%、CpG含量與期望含量之比不小于0.6的區(qū)域.由于該定義將一些重復(fù)片段也包含其中,Takai和Jones將CpG島重新定義為長度不小于500bp、GC含量不小于55%、CpG含量與期望含量之比不小于0.65的區(qū)域.據(jù)統(tǒng)計,多于50%的基因的啟動子區(qū)含有CpG島.在早期的認(rèn)識中,CpG島都是非甲基化的,但是隨著研究的不斷深入,人們發(fā)現(xiàn)在印跡基因、失活的X染色體甚至是正常的體細(xì)胞中都存在甲基化的CpG島.部分CpG島的異常甲基化常常伴隨著癌癥等疾病的發(fā)生.近年來,隨著高通量的DNA甲基化檢測技術(shù)的出現(xiàn),DNA甲基化的生物信息學(xué)研究得到了很大的發(fā)展.一系列具有較好精度的DNA甲基化預(yù)測工具不僅成為實驗檢測技術(shù)的補充,也反映了DNA甲基化本身是有規(guī)律可尋的,這啟發(fā)了研究者們對于DNA甲基化內(nèi)在機制的探索.DNA甲基化具有序列偏好性的觀點得到進一步證實,CpG島邊界序列通過結(jié)合特定轉(zhuǎn)錄因子使CpG島不易被甲基化的機制假說也有了更多的證據(jù).同時,研究疾病特別是癌癥中DNA甲基化的特點和規(guī)律、發(fā)現(xiàn)與特定癌癥相關(guān)的甲基化生物標(biāo)記(biomarker),成為DNA甲基化研究中新的熱點問題.本文綜述了目前關(guān)于人的DNA甲基化研究中生物信息學(xué)研究的最新進展.首先介紹了DNA甲基化的高通量檢測方法和相關(guān)數(shù)據(jù)庫,然后重點綜述了DNA甲基化的預(yù)測研究和CpG島不易被甲基化的機制探索,緊接著簡要闡述了DNA甲基化同癌癥以及其他表觀遺傳學(xué)現(xiàn)象之間的關(guān)系,最后一部分是作者基于DNA甲基化的工作體會對于今后研究方向的展望.1檢測dna甲基化的方法DNA甲基化的檢測大體分為兩個步驟:a.待檢測樣品的前期處理;b.目標(biāo)序列的定位和甲基化狀態(tài)的量化.待檢測樣品的前期處理方法主要包括三大類:a.亞硫酸氫鈉(sodiumbisulfite)法,亞硫酸氫鈉把非甲基化的胞嘧啶轉(zhuǎn)化為尿嘧啶,而保持甲基化的胞嘧啶不變,以此實現(xiàn)兩類的分離,此方法因其準(zhǔn)確率高而被譽為檢測DNA甲基化的“金方法”;b.限制性內(nèi)切酶(restrictionenzyme)法,限制性內(nèi)切酶可以切割非甲基化的位點,而甲基化以后的識別位點將被保留;c.利用特定抗體對甲基化的胞嘧啶進行免疫沉淀反應(yīng)(immunoprecipitation).這三種方法的主要特點見表1.前期處理實現(xiàn)了甲基化和非甲基化的胞嘧啶分離以后,可以對分離出的甲基化DNA片段進行基因芯片雜交或者大規(guī)模深度測序,實現(xiàn)高通量的檢測(圖1).以上兩個步驟的不同組合產(chǎn)生了多種高通量的實驗檢測技術(shù),如亞硫酸氫鈉+測序、亞硫酸氫鈉+芯片技術(shù)、酶切+芯片技術(shù)、甲基化抗體+芯片技術(shù)等.目前很多實驗室利用以上技術(shù)對不同組織中的DNA甲基化狀態(tài)進行了檢測,具體情況見表2.2數(shù)據(jù)庫建設(shè)模式數(shù)據(jù)庫的構(gòu)建是生物信息學(xué)研究的重要內(nèi)容.目前發(fā)表的較大規(guī)模的DNA甲基化相關(guān)數(shù)據(jù)庫有4個:MethDB、MethyCancer、PubMeth和MethCancerDB,數(shù)據(jù)情況見表3.其中,MethDB是最早整合文獻中DNA甲基化數(shù)據(jù)的數(shù)據(jù)庫,也是涵蓋物種和組織最多的數(shù)據(jù)庫,其余3個數(shù)據(jù)庫都采用了文獻挖掘的方法,收集了文獻中已報道的與特定癌癥相關(guān)的一些DNA甲基化模式.MethDB和MethyCancer還提供了DNA甲基化的可視化工具.通過對現(xiàn)有的分散的DNA甲基化數(shù)據(jù)的整理分析,這些數(shù)據(jù)庫提供了內(nèi)容獨立、記錄相對完整、格式比較統(tǒng)一的數(shù)據(jù)資源,為后期的深入挖掘提供了極大便利.隨著大規(guī)模深度測序技術(shù)在DNA甲基化檢測中的應(yīng)用,建立相應(yīng)數(shù)據(jù)庫用以存儲和分析相關(guān)數(shù)據(jù),開發(fā)類似于CpGViewer的可視化分析工具將具有重要價值.3cpg島甲基化狀態(tài)的預(yù)測實驗手段檢測DNA甲基化狀態(tài)的方法雖然比較可靠,但是其對于人力財力的需求以及檢測技術(shù)方面的缺陷,使得目前大規(guī)模的DNA甲基化的實驗數(shù)據(jù)還比較有限.研究計算預(yù)測DNA序列甲基化狀態(tài)的方法顯得極為重要.另一方面,作為實驗檢測技術(shù)的補充,預(yù)測算法能夠挖掘出數(shù)據(jù)中隱藏的重要特征,為人們進一步認(rèn)識DNA甲基化機理提供重要依據(jù)和研究思路.目前發(fā)表的對DNA甲基化模式進行預(yù)測的方法中,按照預(yù)測目標(biāo)的類型可以分為,對單個CpG雙核苷酸的甲基化狀態(tài)預(yù)測、對CpG島片段以及CpG島的甲基化狀態(tài)預(yù)測.Methylator(/Methylator/index.html)是目前唯一的預(yù)測單個CpG雙核苷酸甲基化狀態(tài)的工具.該工具基于MethDB數(shù)據(jù)庫中人的2839個DNA甲基化模式數(shù)據(jù),以CpG位點周圍39bp的序列模式為特征,采用支持向量機的方法得到了87%的正確率.該研究還表明,基因的非翻譯區(qū)的甲基化程度要高于外顯子和內(nèi)含子.由于單個CpG雙核苷酸的甲基化狀態(tài)在細(xì)胞生長過程中是動態(tài)變化的,因此Methylator的應(yīng)用相對有限.2006年,Rollins等發(fā)表了人腦組織全基因組范圍的甲基化數(shù)據(jù).基于其得到的1948個甲基化區(qū)域和2386個非甲基化區(qū)域,產(chǎn)生了兩個預(yù)測CpG島片段甲基化狀態(tài)的工具——HDMFinder和MethCGI.HDMFinder(/HDMFinder/methylation.htm)利用包括Alu在內(nèi)的17個序列特征能夠?qū)﹂L度為800bp的CpG島片段以及800bp的普通DNA序列的甲基化狀況進行準(zhǔn)確預(yù)測,并且還對22個常染色體中的甲基化模式進行了預(yù)測.我們開發(fā)的MethCGI則專門針對CpG島片段(包括200bp、300bp以及400bp)進行了預(yù)測,正確率達(dá)到了84%,提供了在線預(yù)測服務(wù)(/MethCGI/MethCGI.html).通過分析特定轉(zhuǎn)錄因子結(jié)合位點在甲基化和非甲基化的CpG島片段中的分布情況,我們得到了4個在兩類中差異最大的轉(zhuǎn)錄因子結(jié)合位點,這些結(jié)合位點可能為下一步研究DNA甲基化的內(nèi)在機理提供重要依據(jù).另外,MethCGI對MethDB數(shù)據(jù)庫中包含的來自多個組織的甲基化數(shù)據(jù)也得到了較好的預(yù)測精度,表明CpG島片段的甲基化模式并沒有很強的組織特異性.CpG島的甲基化狀態(tài)同基因表達(dá)的模式密切相關(guān),因此對于CpG島甲基化狀態(tài)的預(yù)測一直是人們關(guān)注的重點.2003年,Feltus等通過在細(xì)胞系中加入過量DNA甲基化轉(zhuǎn)移酶(DNMT1),發(fā)現(xiàn)大部分的CpG島仍然保持非甲基化狀態(tài),同時有部分CpG島呈現(xiàn)超甲基化,采用序列特征對兩類的分類正確率可以達(dá)到82%.在特征選擇的過程中,他們發(fā)現(xiàn)兩類CpG島在長度、GC含量、CpG比例以及和啟動子的關(guān)系上沒有顯著性差異.但是其后對來自體內(nèi)的DNA甲基化數(shù)據(jù)的研究表明,甲基化和非甲基化的CpG島在長度、GC含量以及CpG比例上存在顯著差異.Bock等基于人外周血白細(xì)胞中第22號染色體得到的132個CpG島的甲基化狀態(tài)數(shù)據(jù),先后得到了兩個預(yù)測CpG島甲基化狀態(tài)的分類器.第一個采用了序列模式,特定的重復(fù)序列以及特殊的DNA結(jié)構(gòu)三大類特征,第二個增加了預(yù)測的組蛋白修飾狀態(tài)和染色質(zhì)結(jié)構(gòu)特征,并提供了在線預(yù)測工具Epigraph(http://epigraph.mpi-inf.mpg.de/WebGRAPH/).由于組蛋白修飾以及染色質(zhì)結(jié)構(gòu)分布是否存在DNA序列的偏好性仍是一個有爭議的問題,我們通過增加Barski等實驗獲得的基因組尺度的組蛋白甲基化數(shù)據(jù),對CpG島的甲基化狀態(tài)進行了預(yù)測.該預(yù)測模型得到了更高分類正確率的同時,還發(fā)現(xiàn)了4種顯著影響CpG島甲基化的組蛋白修飾特征(H3K4me1、H3K4me2、H3K4me3以及H3K9me1),一定程度上量化了部分組蛋白甲基化同CpG島甲基化之間的關(guān)系.4可能會發(fā)生異常甲基化雖然人類基因組上有的CpG島處于甲基化狀態(tài),但是大部分CpG島是不易被甲基化的,這同基因組上約80%的CpG雙核苷酸處于甲基化狀態(tài)的現(xiàn)象形成鮮明對比.該現(xiàn)象促使人們思考為什么CpG島不易被甲基化.早在1994年Brandeis等就發(fā)現(xiàn),Sp1的結(jié)合位點在人胚胎干細(xì)胞的APRT基因中能夠保護CpG島在重新甲基化的過程中不被甲基化,后來對人乳腺組織中BRCA1基因的研究結(jié)果同樣表明,啟動子區(qū)Sp1和CTCF結(jié)合位點突變與否將決定該區(qū)域CpG島的甲基化狀態(tài).Turker等以Sp1在小鼠Aprt基因中的功能對小鼠體細(xì)胞中DNA甲基化模式的形成提出了一個動態(tài)平衡假說,認(rèn)為在DNA的重新甲基化過程中,首先是B1之類的重復(fù)序列被甲基化,這些序列被稱為甲基化中心,然后甲基化會從中心往外延伸,Sp1結(jié)合位點通過同Sp1的結(jié)合能夠阻礙甲基化向CpG島區(qū)的蔓延,從而保護CpG島不被甲基化.后來的研究又發(fā)現(xiàn),在Sp1缺失的情況下Aprt基因仍然有表達(dá),即CpG島并沒有因Sp1的缺失而超甲基化,另一方面,Sp1(以及CTCF)的結(jié)合位點并非存在于所有不易甲基化的CpG島附近,這也意味著還應(yīng)該有其他因子參與保護機制的形成.利用人腦組織基因組尺度的CpG島甲基化數(shù)據(jù),我們系統(tǒng)分析了不易甲基化的CpG島內(nèi)部以及島邊界序列的序列特征,發(fā)現(xiàn)一些具有鋅指結(jié)構(gòu)的轉(zhuǎn)錄因子(包括Sp1和CTCF)可能的結(jié)合位點在CpG島的400bp邊界序列中顯著富集,而且其中80%的結(jié)合位點在人、大鼠和小鼠中是顯著保守的.基于以上結(jié)果,我們認(rèn)為,從小鼠Aprt基因得到的關(guān)于CpG島不易被甲基化的保護機制同樣存在于人的基因組中:Alu序列是重新甲基化過程中的甲基化中心,在甲基化轉(zhuǎn)移酶的作用下,DNA甲基化從Alu序列出發(fā)往外延伸,當(dāng)CpG島周圍富集的轉(zhuǎn)錄因子結(jié)合位點同具有鋅指結(jié)構(gòu)的轉(zhuǎn)錄因子結(jié)合以后則可以阻止甲基化向CpG島的蔓延,因此在這種阻止與蔓延的作用達(dá)到動態(tài)平衡以后,就形成了比較穩(wěn)定的甲基化模式.當(dāng)細(xì)胞所在的環(huán)境發(fā)生變化時,這種平衡可能會被打破,阻止功能的增強或者侵入能力的提高則可能使DNA甲基化往CpG島外或者往內(nèi)移動,從而建立新的平衡.比如,如果某些順式元件發(fā)生突變,則本可以結(jié)合并阻礙DNA甲基化蔓延的特定轉(zhuǎn)錄因子可能因為結(jié)合能力的減弱使其阻礙功能變?nèi)跎踔料?這種情況下,其附近的CpG島可能會被甲基化.因此,發(fā)生癌變的組織中抑癌基因的異常甲基化以及與老化過程相關(guān)的甲基化可能是由于這種保護機制的減弱造成的.上述推測的保護機制示意圖見圖2.5dna甲基化模式DNA甲基化同眾多疾病的發(fā)生與發(fā)展密切相關(guān),比如Ⅱ型糖尿病、自身免疫疾病以及各種癌癥.特別是癌癥,其發(fā)生過程中癌細(xì)胞基因組整體的欠甲基化和局部區(qū)域的超甲基化是其典型特征.超甲基化體現(xiàn)在抑癌基因的啟動子區(qū)被異常甲基化,整體的欠甲基化同重復(fù)序列(如轉(zhuǎn)座子)以及癌基因的啟動子區(qū)的甲基化程度減小、基因組遺傳不穩(wěn)定性的增加密切相關(guān).研究特定癌癥中超甲基化基因的工作較多,包括乳腺癌、結(jié)腸癌、髓細(xì)胞性白血病、肝癌、涎腺腺樣囊性癌和卵巢癌等.其中,Keshet等基于結(jié)腸癌的數(shù)據(jù)發(fā)現(xiàn),結(jié)腸癌中超甲基化的基因不僅屬于一個特定的功能類型并在染色體上聚集,而且這些基因中還存在著共同的motif,他們推測這類基因可能受到相同轉(zhuǎn)錄因子的調(diào)節(jié).目前,對于癌細(xì)胞和正常細(xì)胞中DNA甲基化模式差異性的認(rèn)識還存在不同觀點.Weber等對原代纖維細(xì)胞、正常結(jié)腸黏膜和結(jié)腸癌細(xì)胞系中6000個CpG島甲基化模式進行了比較,認(rèn)為腫瘤細(xì)胞中僅有小部分CpG島的啟動子區(qū)存在異常甲基化.但是Gebhard等在髓細(xì)胞性白血病中卻發(fā)現(xiàn)了大量異常超甲基化的基因,并認(rèn)為癌細(xì)胞中的甲基化模式顯著不同于正常細(xì)胞.以上兩種結(jié)論的差異是來源于細(xì)胞系之間或是所采用的技術(shù)平臺之間的差異,還有待于對更多癌細(xì)胞中的DNA甲基化模式進行分析研究.此外,Bibikova等對結(jié)腸癌、乳腺癌、肺癌和前列腺癌細(xì)胞系以及正常細(xì)胞中371個基因中的1536個位點的甲基化狀態(tài)進行聚類分析,發(fā)現(xiàn)了55個可以較好地區(qū)分癌細(xì)胞和正常細(xì)胞以及區(qū)分各種癌細(xì)胞類型的位點.該方法表明,各種癌癥都存在其特異的DNA甲基化生物標(biāo)記.6dna甲基化和組蛋白甲基化細(xì)胞發(fā)育過程中,各種表觀遺傳學(xué)現(xiàn)象之間不是孤立存在而是密切聯(lián)系的.DNA甲基化同組蛋白甲基化共同調(diào)控基因表達(dá)的現(xiàn)象最早在鏈孢霉(Neurosporacrassa)中得到證實,進一步的生化研究結(jié)果認(rèn)為,DNA甲基化是受組蛋白甲基化調(diào)節(jié)的.而在哺乳動物中,有研究認(rèn)為,DNA甲基化是建立和維持其他表觀遺傳學(xué)現(xiàn)象的基礎(chǔ),比如DNA甲基化位點可以募集諸如組蛋白去乙?;傅染哂幸种乒δ艿膹?fù)合物,同時去除掉該位點附近的組蛋白乙?;瘶?biāo)記.也有研究認(rèn)為,DNA甲基化是受組蛋白修飾調(diào)控的,比如有報道稱組蛋白修飾H3K9me能夠促進DNA甲基化的進程.目前,雖然哺乳動物中存在基因組尺度的DNA甲基化和組蛋白修飾數(shù)據(jù),但是還沒有研究者針對同一個組織進行兩種修飾的系統(tǒng)研究.2008年初,北京生命科學(xué)研究所采用覆瓦芯片(TilingArray)技術(shù)對水稻第4和10號染色體中的DNA甲基化和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度固定資產(chǎn)借款合同還款計劃與利率調(diào)整3篇
- 研學(xué)旅行教學(xué)課程設(shè)計
- 二零二五年度商業(yè)地產(chǎn)買賣委托代理合同3篇
- 二零二五年度數(shù)據(jù)中心安全維護與管理服務(wù)合同
- 內(nèi)部公司會議方案樣本(2篇)
- 質(zhì)量管理課程設(shè)計簡介
- 會計員安全生產(chǎn)責(zé)任制(4篇)
- 運籌學(xué)課程設(shè)計旅游
- 二零二五年度互聯(lián)網(wǎng)公司員工持股計劃協(xié)議范本3篇
- 二氧化碳滅火器的維修安全操作規(guī)程(3篇)
- 《論拒不執(zhí)行判決、裁定罪“執(zhí)行能力”之認(rèn)定》
- 工業(yè)設(shè)計基礎(chǔ)知識單選題100道及答案解析
- 山西省晉中市2023-2024學(xué)年高一上學(xué)期期末考試 化學(xué) 含解析
- 過程審核表(產(chǎn)品組評分矩陣評審提問表(評分))-2024年百度過
- 操作手冊模板【范本模板】
- 2025年湖北省武漢市高考數(shù)學(xué)模擬試卷附答案解析
- 【工作總結(jié)】建筑中級職稱專業(yè)技術(shù)工作總結(jié)
- 江蘇省2022年普通高中學(xué)業(yè)水平合格性考試數(shù)學(xué)試題(考試版)
- 2023年二輪復(fù)習(xí)解答題專題三:一次函數(shù)的應(yīng)用方案選取型(原卷版+解析)
- 2024版小學(xué)英語新課程標(biāo)準(zhǔn)測試題及答案
- 多旋翼無人機駕駛員執(zhí)照(CAAC)備考試題庫大全-上部分
評論
0/150
提交評論