測序技術介紹_第1頁
測序技術介紹_第2頁
測序技術介紹_第3頁
測序技術介紹_第4頁
測序技術介紹_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

測序技術介紹第1頁/共72頁測序技術發(fā)展史第2頁/共72頁一代測序1954年,Whitfeld等用化學降解法測定多聚核糖核苷酸序列,是關于DNA測序技術的較早報道。1977年,Sanger發(fā)明DNA雙脫氧核苷酸末端終止測序法(chainterminatorsequencing),A.M.Maxam和W.Gilbert發(fā)明DNA化學降解測序法(chemicaldegradationsequencing),2項技術的出現(xiàn),標志第1代測序技術誕生。第3頁/共72頁Sanger測序法的原理每一次DNA測序反應都由4個獨立反應組成;由于DNA雙鏈中核苷酸以3′,5′-磷酸二酯鍵相連,因此在測序過程中摻入2′,3′-雙脫氧核苷三磷酸———ddNTP(不含3′-OH),當ddNTP位于DNA雙鏈的延伸末端時,無羥基3′端不能與其他脫氧核苷酸形成3′,5′-磷酸二酯鍵,因此,DNA雙鏈合成便終止;若在終止位點摻入ddATP,則新生鏈末端為A,若摻入ddTTP、ddCTP、ddGTP,相應地,新生鏈末端則是T、C或G。第4頁/共72頁第5頁/共72頁第6頁/共72頁第7頁/共72頁第8頁/共72頁該測序技術的具體做法如下:將模板、引物、4種dNTP(其中含有一種為放射性同位素標記的核苷酸)與DNA聚合酶共同保溫,形成的混合物包含許多長短不一的片段,最后利用聚丙烯酰胺變性凝膠電泳(SDS)分離該混合物,得到放射性同位素自顯影條帶圖譜,人們依據(jù)凝膠電泳圖即可讀出DNA雙鏈的堿基序列組成。第9頁/共72頁第10頁/共72頁第11頁/共72頁第12頁/共72頁自動化測序?qū)嶋H上已成為當今dna序列分析的主流。美國PEABI公司已生產(chǎn)出373型、377型、310型、3700和3100型等dna測序儀,其中310型是臨床檢測實驗室中使用最多的一種型號。第13頁/共72頁測序過程中的常見問題分析在進行DNA測序時,緊接引物的10—30Bases有時不一定能完全讀清楚。由于DNA結構上的原因,有時會出現(xiàn)反應中途無法進行之情況。如:G/Crich;G/CCluster;PolyA、PolyT的連續(xù)結構等。此外,另一種情況為反應中途出現(xiàn)的套峰現(xiàn)象,此種情況一般為DNA結構中的重復序列,造成測序用引物和模板之間有二個以上的結合位點。具體問題分析如下:1:測序結果有很多套峰,出現(xiàn)很多N值原因分析:PCR產(chǎn)物直接進行測序,在PCR產(chǎn)物長度以后將無反應信號,機器將產(chǎn)生許多N值。

在序列的起始端出現(xiàn)N值,主要是由于有未去除的染料單體造成的干擾峰,是機器無法正確判讀出位何值。有時,引物二聚體或者起始端小片段的丟失,也會出現(xiàn)N值。模版本身含雜合序列,有等位基因。第14頁/共72頁測序過程中的常見問題分析2:為什么找不到我的PCR引物序列?用PCR引物作為測序引物,所測序列是從引物3末端后第一個堿基開始的,所以就找不到您的測序引物了??梢赃M行反向測序,得到引物的反向互補序列。還可以將所測片段克隆到適當載體中,由于通用引物與插入序列有一段距離,就可以測出您的引物序列。3:測序結果和文獻資料不一樣,為什么?原因有很多,如同一種動物,在不同的種族之間,或者不同的個體之間,基因序列也不一定完全一樣。如果是PCR產(chǎn)物克隆測序,那還有PCR過程中的錯配因素等等。我們提供的測序結果是客戶樣品序列的忠實結果,不能保證和文獻序列完全一致。4:過短的PCR產(chǎn)物為什么不適于直接測序?首先由于一般的PCR產(chǎn)物純化試劑盒要求產(chǎn)物片段大于200bp,過短的PCR產(chǎn)物不能進行純化;再者,測序的前50bp和后50bp的序列是不好的,所以不適于直接測序。第15頁/共72頁測序過程中的常見問題分析5:酒精如果沒有揮發(fā)完全,在約300bp處會出現(xiàn)連續(xù)異常的G峰,酒精揮發(fā)時間過長會導致DNA斷裂。第一個峰,重疊干擾。如果不判讀為干擾峰,那就說明樣品不純,如果是基因組DNA,就很好地說明了樣品為雜合子,該位點可能存在SNP現(xiàn)象(T/G)。如果判讀為干擾峰,我們只需認定樣品此處堿基為T為行了。第二個峰,錯位干擾。如果不判讀為干擾峰,則說明樣本可能比預期多一個堿基(G),如果判讀為干擾峰,我們?nèi)灾恍枵J定樣品此處堿基為T為行了。第16頁/共72頁測序過程中的常見問題分析6:為什么用PCR產(chǎn)物或質(zhì)粒測序時,經(jīng)常會出現(xiàn)套峰現(xiàn)象?下圖是pGEM-T載體測序的結果,在83位點處測序結果出現(xiàn)雙峰,即模板中含有兩個或兩個以上的相同載體,但是插入片段不同。解決辦法:重新挑取單克隆或者重新提取質(zhì)粒。需要注意的是,重新進行PCR反應或者酶切鑒定僅能證明該克隆含有插入片段,并不足以證明模板的單一。第17頁/共72頁測序過程中的常見問題分析7:poly結構的測序結果以polyT為例,在polyA/T結構之后往往出現(xiàn)移碼現(xiàn)象,而在polyG/C之后會往往導致測序信號的衰減。解決辦法:使用反向引物對模板進行測序,測到該poly結構處,即可完成模板全長的拼接。第18頁/共72頁第二代測序技術(Next-GenerationSequencing)第19頁/共72頁各自的優(yōu)點454測序平臺得到的片段能夠達到400bp,并且讀長的質(zhì)量高;Solexa測序平臺的性價比最高,在數(shù)據(jù)量相同的情況下,測序成本僅為454測序平臺的1/10;SOLiD測序平臺準確度能夠達到99.94%,在片段覆蓋率為15×時,測序準確度可接近100%。第20頁/共72頁2005年底,454公司推出第一個基于焦磷酸測序原理的高通量基因組測序系統(tǒng)——GenomeSequencer20System,這是核酸測序技術發(fā)展史上里程碑式的事件。隨后,羅氏公司以1.55億美元收購了454公司,并在2006年推出了更新的GSFLX測序系統(tǒng),該系統(tǒng)可在10小時的運行中獲得100萬條讀長(reads),4~6億個堿基信息(basepair),且準確率達到99%以上。2008年,GSFLX系統(tǒng)再次升級,通量提高了5倍,讀長和準確率也有所增加。雖然454GS測序平臺也許不是市場占有率最高的測序儀,但截至2011年3月,利用該系統(tǒng)進行研究的論文已發(fā)表超過1000余篇,而它在讀長上的優(yōu)勢明顯勝于另兩套系統(tǒng),因此在從頭測序(denovo)和宏基因組測序(metagenome)方面有著不可替代的地位。第21頁/共72頁2006年,Solexa公司也推出了自己的NGS系統(tǒng)——GenomeAnalyzer,簡稱GA。這套基于DNA簇(DNAcluster)、橋式PCR(BridgePCR)和可逆阻斷(Reversibleterminator)等核心技術的系統(tǒng)具有高通量、低錯誤率、低成本、應用范圍廣等優(yōu)點。2007年,Illumina公司以6億美元的高價收購了Solexa,使GA得以商品化。GA最早期的版本一次運行可獲得1Gb的數(shù)據(jù),因此也有1GbAnalyzer的含義,而最新的Hiseq2000平臺則能夠在10天的運行中獲得300Gb以上的數(shù)據(jù),讀取的堿基長度達到150bp左右。更有消息稱,Illumina已完成了600Gb的運行測試并在部分客戶中開展了前期體驗,Tb(1000Gb)級的測試Run也將于年內(nèi)進行。據(jù)不完全統(tǒng)計,Illumina公司已售出超過600臺/套GAIIx和Hiseq2000平臺,2010年僅深圳華大基因研究院一家就購買了128臺Hiseq2000,一舉成為全球最大的基因組測序與分析中心,Illumina公司在測序領域的影響力由此可見一斑。第22頁/共72頁在Sanger測序時代,美國應用生物系統(tǒng)公司(ABI)一直是該行業(yè)的龍頭老大,其壟斷地位無人能撼,從早期的377到全自動化的3730xl,ABI的測序儀被廣泛應用在基因組學研究的各個方面。然而在第二代測序技術迅猛發(fā)展之初,ABI起步較晚,顯得有些漫不經(jīng)心。直到2005年454公司推出GS平臺,ABI的領先地位受到威脅,這才開始發(fā)力,迅速收購了研發(fā)NGS的一家小公司Agencourt,并于2007年推出了它的SOLiD測序平臺。此后SOLiD不斷升級,目前已到SOLiD5版本(SOLiD5500xl)。SOLiD的全稱是SequencingbyOligoLigationDetection,即寡聚物連接檢測測序,其基本原理是通過熒光標記的8堿基單鏈DNA探針與模板配對連接,發(fā)出不同的熒光信號,從而讀取目標序列的堿基排列順序。在該方法下,目標序列的所有堿基都被讀取了兩遍,因此SOLiD最大的優(yōu)勢就是它的高準確率。據(jù)悉,SOLiD5平臺的測序通量已達到30Gb/天,成本低于60美元/Gb,準確率高達99.99%。并且由于SOLiD系統(tǒng)采用的不是PCR反應進行DNA合成與測序,因此對于高GC含量的樣本,SOLiD系統(tǒng)具有非常大的優(yōu)勢。第23頁/共72頁2023/4/16454測序原理焦磷酸測序法(Pyrosequencing)的原理第24頁/共72頁2023/4/16454測序原理焦磷酸測序法(Pyrosequencing)的原理第25頁/共72頁2023/4/16454測序原理焦磷酸測序法(Pyrosequencing)的原理第26頁/共72頁2023/4/16454測序原理在454測序儀中,A、T、G、C四種堿基是分別存儲在單獨的試劑瓶中的,每步反應四種堿基依次加入反應池,當堿基配對結合,就會釋放出一個焦磷酸(PPi),而這個焦磷酸在酶的作用下,將熒光素氧化成氧化熒光素,并發(fā)出光信號,從而讀取出這一位置的堿基信息。454測序儀的整個實驗步驟可大致概括為:樣品處理文庫制備emPCR反應板準備上機測序第27頁/共72頁2023/4/16454測序原理樣品處理:樣品處理主要是針對大片段的DNA分子,如基因組DNA、Fosmid或BAC質(zhì)粒等,利用超聲或氮氣打斷將這些DNA分子片段化,然后采用瓊脂糖凝膠電泳回收或磁珠純化,選擇500-800bp的DNA片段。對于非編碼RNA或PCR產(chǎn)物,則不需要這一步驟。第28頁/共72頁2023/4/16454測序原理文庫制備包括接頭連接和磁珠純化兩步,454的文庫接頭分A、B兩種,各44bp,由20bp的PCR引物、20bp的測序引物及4bp(TCAG)的“key”堿基構成,其中B接頭的5’端帶有生物素(Biotin)標記,用于磁珠純化步驟。經(jīng)過磁珠結合與DNA變性之后,只有A+目的片段+B形式的連接產(chǎn)物得以富集,另兩種形式(AA、BB)的產(chǎn)物都被去除。第29頁/共72頁2023/4/16454測序原理emPCR(乳液PCR)是454測序的一個關鍵步驟,將富集到的文庫與測序磁珠、各反應物混合,加入特定的礦物油和表面活性劑,再利用振蕩器劇烈振蕩,使反應體系形成油包水(water-in-oil)的穩(wěn)定乳濁液。在理想條件下,每一個液滴,或稱微反應器(microreactor)中將只包含一個磁珠和一條單鏈DNA,通過控制該步驟的條件,1mL乳液中可以形成至少10的6次方個理想的微反應器。經(jīng)過PCR擴增后,每一個磁珠上將形成密集的DNA簇,這些DNA序列完全相同,即可用于后續(xù)的步驟。隨后,乳液混合物被打破,擴增的片段依然結合在磁珠上。第30頁/共72頁2023/4/16454測序原理454測序的反應板稱為PTP(PicoTiterPlate),含有350萬個由光纖組成的小孔,每個孔的直徑為29μm,而測序磁珠的直徑為20μm,因此每個孔中僅能容納一個磁珠。將磁珠與測序試劑加入PTP中,使之可用于上機測序。第31頁/共72頁2023/4/16454測序原理測序步驟如前所述,四種堿基在泵的控制下依次加入反應板,反應完成后再洗去,每延伸一個或若干個堿基,就會發(fā)出一次光信號,通過記錄信號的有無和強度,即可測定DNA序列。第32頁/共72頁2023/4/16第33頁/共72頁2023/4/16454測序原理優(yōu)缺點:454測序準確度較高,當讀長超過400bp時,其準確性仍能達到99%以上;主要的錯誤來自于同聚物,即相同堿基的連續(xù)延伸,如ATTTG這樣一段序列,A和G的讀取沒有問題,但T只記錄了一次光信號,僅信號強度與ATG序列的T有所不同,因此同聚物越長,可能產(chǎn)生的誤差就越大。目前,由于454測序儀在讀長上的明顯優(yōu)勢,它在大基因組從頭測序(denovo)、轉(zhuǎn)錄組分析、基因組結構分析等領域有著廣泛的應用。第34頁/共72頁Solexa測序2023/4/16第35頁/共72頁Solexa測序2023/4/16常用術語:SBS:邊合成邊測序反應,每次SBS會延伸一個堿基,大約耗時70分鐘。Run:單次上機測序反應,可以產(chǎn)生4G-75G測序通量不等。Lane:單泳道,每條泳道可以直接物理區(qū)分測序樣品,1次run最多可以同時上樣8條Lane。Channel:Lane的同義詞。Tile:小區(qū),每條Lane中排有2列tile,合計120個小區(qū)。每個小區(qū)上分布數(shù)目繁多的簇結合位點。Cluster:簇,在Solexa測序技術中會采用橋式PCR方式生產(chǎn)DNA簇,每個DNA簇才能產(chǎn)生亮度達到CCD可以分辨的熒光點。第36頁/共72頁Solexa測序2023/4/16Index:標簽,在Solexa多重測序(MultiplexedSequencing)過程中會使用Index來區(qū)分樣品,并在常規(guī)測序完成后,針對Index部分額外進行7個循環(huán)的測序,通過Index的識別,可以在1條Lane中區(qū)分12種不同的樣品。Barcode:

Index同義詞Fasta:一種序列存儲格式。一個序列文件若以FASTA格式存儲,則每一條序列的第一行以“>”開頭,而跟隨“>”的是序列的ID號(即唯一的標識符)及對該序列的描述信息;第二行開始是序列內(nèi)容,序列短于61nt的,則一行排列完;序列長于61nt的,則每行存儲61nt,最后剩下小于61nt的,在最后一行排列完;第二條序列另起一行,仍然由“>”和序列的ID號開始,以此類推。第37頁/共72頁Solexa測序2023/4/16Fastq:Fastq是Solexa測序技術中一種反映測序序列的堿基質(zhì)量的文件格式。第一行以“@”符號開頭,后面緊跟一個序列的描述信息;第二行是該序列的內(nèi)容;第三行以“+”符號開頭,后面緊跟的內(nèi)容與第一行一樣,同樣是該序列的描述信息;而第四行是第二行中的序列內(nèi)容每個堿基所對應的測序質(zhì)量值。PF%:PF%是指符合測序質(zhì)量標準的簇的百分比(MultiplexedSequencing),與測序的通量相關聯(lián)。Read:Solexa是成簇反應的,每個簇對應一條DNA序列片段,成為一個read。第38頁/共72頁Solexa測序2023/4/16第39頁/共72頁Solexa測序2023/4/16第40頁/共72頁Solexa測序2023/4/16第41頁/共72頁Solexa測序2023/4/16第42頁/共72頁Solexa測序2023/4/16第43頁/共72頁Solexa測序2023/4/16第44頁/共72頁Solexa測序2023/4/16第45頁/共72頁Solexa測序2023/4/16第46頁/共72頁Solexa測序2023/4/16應用:

Solexa平臺的應用范圍極廣,幾乎囊括了目前基因組學研究的所有方面,例如基因組從頭測序(denovo)、重測序(re-sequencing)、基因組結構分析、轉(zhuǎn)錄組測序、表達譜分析、小RNA及非編碼RNA測序、表觀遺傳學研究等等。第47頁/共72頁SOLiD測序2023/4/16第48頁/共72頁SOLiD測序2023/4/16第49頁/共72頁SOLiD測序2023/4/16第50頁/共72頁SOLiD測序2023/4/16第51頁/共72頁SOLiD測序2023/4/16第52頁/共72頁SOLiD測序2023/4/16第53頁/共72頁SOLiD測序2023/4/16第54頁/共72頁SOLiD測序2023/4/16第55頁/共72頁SOLiD測序2023/4/16第56頁/共72頁SOLiD測序2023/4/16第57頁/共72頁SOLiD測序2023/4/16第58頁/共72頁SOLiD測序2023/4/16第59頁/共72頁SOLiD測序2023/4/16第60頁/共72頁SOLiD測序2023/4/16第61頁/共72頁SOLiD測序2023/4/16第62頁/共72頁SOLiD測序2023/4/16第63頁/共72頁三者比較Roche/454測序技術讀取長度(600~1000bp),在3種測序技術中最長,可以對未知基因組進行從頭測序,但其通量最低(0.5~1Gb/run)。當遇到polymer(如AAAAAA等)時,堿基個數(shù)和熒光信號強度不成線性關系,即判斷重復堿基有困難。2023/4/16第64頁/共72頁三者比較Illumina/Solexa屬于高度自動化的系統(tǒng),讀取片段比其它種類的測序多,適合進行大量小片段的測序(如microRNAprofiling),其測序通量大,其新機型Hiseq2000產(chǎn)出量為600Gb/run,但基于可逆反應時隨反應輪數(shù)增加效率降低、信號減弱,并且讀長(通常為100bp)比Roche/454短,給從頭測序拼接帶來困難。2023/4/16第65頁/共72頁三者比較ABI/SOLiD技術每個堿基讀?。泊?,有非常高的準確性,特別是針對SNP的檢測。此外,靈活的系統(tǒng)和完善的磁珠編碼系統(tǒng)可以進行樣品的pooling來分割測序區(qū)域,特別適用于具有高質(zhì)量參考基因組序列物種的重測序,但是該測序讀長(50bp)最短,并且讀取長度受反應輪數(shù)的限制,給從頭測序拼接帶來困難。2023/4/16第66頁/共72頁第三代測序技術原理:脫氧核苷酸用熒光標記,顯微鏡可以實時記錄熒光的強度變化。當熒光標記的脫氧核苷酸被摻入DNA鏈的時候,它的熒光就同時能在DNA鏈上探測到。當它與DNA鏈形成化學鍵的時候,它的熒光基團就被DNA聚合酶切除,熒光消失。這種熒光標記的脫氧核苷酸不會影響DNA聚合酶的活性,并且在熒光被切除之后,合成的DNA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論