




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基因組測(cè)序基因組測(cè)序生物信息系列講座之二大綱I. 核酸DNA的發(fā)現(xiàn)以及測(cè)序歷史簡(jiǎn)介II. 雙脫氧化(Sanger dideoxy method)測(cè)序III.大片段的DNA測(cè)序與基因組測(cè)序的大發(fā)展VI.人類基因組V. 1000美元個(gè)體化基因組測(cè)序計(jì)劃(The “$1,000 dollar genome)On WebCT- “The $1000 genome”- review of new sequencing techniques by George ChurchPart I.核酸測(cè)序原理核酸發(fā)現(xiàn)與測(cè)序簡(jiǎn)史MC chapter 12DNA測(cè)序的簡(jiǎn)史DNA測(cè)序的方法A.雙脫氧法 (Sanger d
2、ideoxy) (primer extension/chain-termination) method: 最流行也是最廣為接受的方法。B.Maxam-Gilbert化學(xué)剪切法(chemical cleavage method): DNA is labelled and then chemically cleaved in a sequence-dependent manner. This method is not easily scaled and is rather tediousC.焦磷酸測(cè)序(Pyrosequencing): measuring chain extension by p
3、yrophosphate monitoring。焦磷酸測(cè)序技術(shù)是新一代DNA序列分析技術(shù),該技術(shù)無須進(jìn)行電泳,DNA片段也無須熒光標(biāo)記,操作極為簡(jiǎn)便,可以快速、準(zhǔn)確地確定DNA序列。Single stranded DNA5353Sanger 雙脫氧測(cè)序原理a) 常規(guī)的PCR,粘附(Anneal)Sanger 雙脫氧測(cè)序原理b) 在延伸的時(shí)候?qū)NA聚合酶與加入正常的dNTP,同時(shí)摻入少量的雙脫氧的ddNTP53DNA聚合酶延伸方向Sanger 雙脫氧測(cè)序原理5353TTTTddAddAddAddA以ddATP為例,可以看到在反應(yīng)中帶有T的模板被摻入的互補(bǔ)的ddATP隨機(jī)停止。因?yàn)閐dATP不能
4、夠再使其主鏈延伸。如何讀取這些DNA片段? 同位素標(biāo)記同位素標(biāo)記的引物 (如 32P)同位素標(biāo)記的dNTPs (如35S 或者 32P) 熒光標(biāo)記化學(xué)合成時(shí)帶有熒光素標(biāo)記的ddNTPs被摻入到反應(yīng)中。每一種ddNTP都帶有自身特定的熒光波長(zhǎng)以便于觀測(cè)測(cè)序結(jié)果分析目前一般采用凝膠電泳法分析-能夠比較好的將每一條dNTP產(chǎn)生的DNA條帶分離開。DNA測(cè)序膠: 老方法利用電泳或者放射自顯影的方法來分析DNA序列在反應(yīng)中加入不同的ddNTP得到結(jié)果帶有同位素標(biāo)記的引物或者ddNTP被摻入到反應(yīng)中,以便于觀測(cè)自動(dòng)測(cè)序儀輸出DNA測(cè)序的實(shí)例樣本 一個(gè)帶有28個(gè)DNA樣品的膠圖: 綠帶:堿基A,,藍(lán)帶 C,
5、 黃帶G,紅帶 T. 越小的片段跑得越快自動(dòng)測(cè)序儀/sci/techresources/Human_Genome/publicat/hgn/v10n3/images/megabaces.jpg測(cè)序的趨勢(shì)相對(duì)而言一般很少實(shí)驗(yàn)室會(huì)自己做測(cè)序,一則自身測(cè)序費(fèi)用比較高,而且熒光試劑容易粹滅,同時(shí)也比較消耗時(shí)間,另外可能出現(xiàn)一些其它問題引起結(jié)果不成功。所以大部分的測(cè)序都是送到相關(guān)的測(cè)序中心或者公司完成:-下面這個(gè)序列就是一個(gè)自動(dòng)測(cè)序儀記錄的一段DNA片段Part II.大片段DNA測(cè)序與基因組測(cè)序的大發(fā)展19蜜蜂基因組是如何獲得的?基因組文庫(kù)的建立 目前基將基因組片段
6、打碎建立文庫(kù)?;蚪M文庫(kù)含有某種生物體全部基因的隨機(jī)片段的重組DNA克隆群體。Page 22酵母人工染色體酵母人工染色體(YACs) 200-1000 kbBacteriophage P1 90 kbCosmids 40 kbBacteriophage l l 9-23 kb質(zhì)粒(2-6 kb)Page 23大片段載體大片段載體Lambda phage 插入大小: 2030 kbCosmids 插入大小: 3545 kbBACs and PACs (bacterial and P1 artificial chromosomes (Viral) respectively) 插入大小: 10030
7、0 kbYACs (yeast artificial chromosomes) 插入大小: 2001,000 kbPage 24大片段插入載體大片段插入載體 Lambda 噬菌體 以及 cosmids 插入穩(wěn)定 但插入片段的容量可能不足以做大規(guī)模的測(cè)序 YACs 能夠插入大片段 但不太穩(wěn)定,比較難實(shí)際操作Page 25BACs and PACs BACs and PACs 大規(guī)模測(cè)序通用質(zhì)粒 對(duì)插入片段大小比較合適,而且容易使用 與其它正常質(zhì)粒一樣能夠擴(kuò)增和分離全基因組鳥槍法測(cè)序 但是片段比較大時(shí),如在基因組測(cè)序時(shí),僅僅由Sanger方法并不合適,因此Shotgun測(cè)序,將基因大片段打碎后測(cè)序
8、。鳥槍法戰(zhàn)略(Shotgun Strategy)又稱隨機(jī)測(cè)序戰(zhàn)略,是由美國(guó)塞萊拉遺傳公司創(chuàng)始人克雷格文特爾發(fā)明,主要針對(duì)大片段的全長(zhǎng)測(cè)序。因?yàn)檎麄€(gè)基因組太長(zhǎng)而每次只能測(cè)得一個(gè)500的小片斷(read)。鳥槍法測(cè)序步驟 第一,建立高度隨機(jī)、插入片段大小為2kb左右的基因組文庫(kù)??寺?shù)要達(dá)到一定數(shù)量,即經(jīng)末端測(cè)序的克隆片段的堿基總數(shù)應(yīng)達(dá)到基因組5倍以上。 第二,高效、大規(guī)模的末端測(cè)序。 第三,序列集合。 第四,填補(bǔ)缺口。鳥槍法測(cè)序簡(jiǎn)要SIZE SELECTSHEAR鳥槍法測(cè)序技術(shù)LIGATE & CLONESEQUENCE550bpPage 30重疊群重疊群Contigs 重疊群是指一組相
9、互重疊的染色體DNA序列 如何建立重疊群基因克??? For sequencing one wants to create “minimum tiling path” Contig of smallest number of inserts that covers a region of the chromosome基因組genomic DNA重疊群contig最小路徑minimumtiling pathPage 31限制性酶切產(chǎn)生不同的重疊群限制性酶切產(chǎn)生不同的重疊群Contigs 通過限制性內(nèi)切酶酶切 將重疊片段序列排列 直到建立一個(gè)完整的contig兩種不同的全基因組鳥槍法測(cè)序序列拼接與組
10、裝 獨(dú)立的測(cè)序片段(read)通過逐步把它們拼接起來形成序列更長(zhǎng)的重疊群(Contig),直至得到完整序列的過程稱為重疊群裝配(Scaffold)。目前DNA 序列拼接應(yīng)用的主要軟件是由美國(guó)華盛頓大學(xué)Phil Green實(shí)驗(yàn)室開發(fā)的Phred Phrap Consed系統(tǒng)。目前36個(gè)國(guó)家900 多個(gè)實(shí)驗(yàn)室都在使用上述系統(tǒng)。非贏利研究機(jī)構(gòu)或個(gè)人可申請(qǐng)免費(fèi)利用該系統(tǒng)。此外還有一序列的商業(yè)軟件,如主流的基因組拼接軟件(GenomeAssembly),華大基因開發(fā)的SOAPdenovo都可以做基因組的拼接,然后可以用補(bǔ)漏軟件進(jìn)行補(bǔ)漏,得到完整的基因組序列?;蚪M基因組de novo測(cè)序測(cè)序 基因組de
11、 novo測(cè)序也叫做基因組從頭測(cè)序,是指不依賴于任何已知基因組序列信息對(duì)某個(gè)物種的基因組進(jìn)行測(cè)序,然后應(yīng)用生物信息學(xué)手段對(duì)測(cè)序序列進(jìn)行拼接和組裝,最終獲得該物種基因組序列圖譜。De novo基因原理淺解 假設(shè)有原始序列:I did not know what is written in this paper.那么通過de novo分段重復(fù)測(cè)序得到了3次不同的結(jié)果。 測(cè)序結(jié)果1:id idn otkn owwh ati swr itteni nthisp aper 測(cè)序結(jié)果2: idid notkn owwha tiswrrit enin th isp ap er 測(cè)序結(jié)果3: i di dno
12、 tkno ww hati swri tteni nth ispap er 將3次重疊(overlap)部分進(jìn)行拼接組成contig(重疊群) idn otkn owwhidid notkn owwha dno tkno wwididnotknowwha (Contig)De novo測(cè)序原理mapping測(cè)序 通過現(xiàn)有的已知同源主鏈序列,將同源測(cè)序片段組裝拼裝,建立新序列。該序列與的主鏈類似,但不一定相同。測(cè)序?qū)嶒?yàn)室測(cè)序?qū)嶒?yàn)室39組裝缺口測(cè)序缺口測(cè)序缺口- 我們?nèi)绻呀?jīng)知道重疊群的順序和方向,那么可以通過跨越式測(cè)序得到缺口的序列信息。物理缺口物理缺口- 沒有重疊群覆蓋,同時(shí)也沒有DNA測(cè)序結(jié)
13、果 測(cè)序缺口物理缺口重復(fù)序列干擾鳥槍法測(cè)序拼接41重復(fù)序列REPEATS重復(fù)序列 真核生物染色體基因組中重復(fù)出現(xiàn)的核苷酸序列。這些序列一般不編碼多肽,在基因組內(nèi)可成簇排布,也可散布于基因組。重復(fù)序列的屏蔽軟件重復(fù)序列的屏蔽軟件 CENSOR是一個(gè)通過參考序列篩選查詢序列中的重復(fù)序列并屏蔽同源重復(fù)序列的軟件工具,其能夠?qū)⑺姓业降闹貜?fù)生成報(bào)告以及分類CENSOR也可提供離線軟件包Repeat masker RepeatMasker通過已知數(shù)據(jù)庫(kù)中的重復(fù)元素篩選FASTA格式的查詢序列,并返回一個(gè)屏蔽之后的可以用于準(zhǔn)備數(shù)據(jù)庫(kù)檢索查詢序列的DNA序列。Repeat masker的離線軟件包的離線軟件
14、包兩種屏蔽方法的差別兩種屏蔽方法的差別 Repeatmasker用法類似于CENSOR,但這兩個(gè)工具各自有自身的優(yōu)點(diǎn),在于他們的數(shù)據(jù)庫(kù)選取中有差異,如果要確保數(shù)據(jù)更加可信。所以同時(shí)用兩個(gè)工具或者與與其他類似的工具組合使用。48一些錯(cuò)配的重復(fù)序列 a b c a c b a b c d I II III I II III a b c d b c a b d c e f I II III IV I III II IV a d b e c f a collapsed tandemexcisionrearrangement人類基因組計(jì)劃 人類基因組計(jì)劃 (英語:Human Genome Project
15、, HGP)是一項(xiàng)規(guī)模宏大,跨國(guó)跨學(xué)科的科學(xué)探索工程。其宗旨在于測(cè)定組成人類染色體(指單倍體)中所包含的30億個(gè)堿基對(duì)組成的核苷酸序列,從而繪制人類基因組圖譜,并且辨識(shí)其載有的基因及其序列,達(dá)到破譯人類遺傳信息的最終目的。人類基因組數(shù)據(jù)庫(kù)/projects/genome/guide/human//http:/hgpd.lifesciencedb.jp/cgi//index.html個(gè)體化基因組測(cè)序計(jì)劃 已有的研究表明,基因或基因組變異是腫瘤發(fā)生的根本原因,利
16、用單細(xì)胞全基因組測(cè)序技術(shù),可以對(duì)獲取的腫瘤細(xì)胞進(jìn)行更為精確和深入的分析,了解癌細(xì)胞的基因如何突變,以及腫瘤的來源、屬于哪種基因型等,為早期檢測(cè)和診斷腫瘤和腫瘤的個(gè)體化治療提供指導(dǎo)。 而基因分析是個(gè)體化醫(yī)療的前提,因此個(gè)體化的基因測(cè)序技術(shù)的發(fā)展能夠驅(qū)動(dòng)著個(gè)體化醫(yī)療的進(jìn)程。乳腺癌患者全基因組測(cè)序 2012年歐洲內(nèi)科腫瘤學(xué)會(huì)(ESMO)研究者首次完成了對(duì)個(gè)體的乳腺癌患者全基因組測(cè)序以期制定個(gè)體化治療的大型臨床試驗(yàn)。 截至2012年9月23日,共有 402名乳腺癌患者已經(jīng)完成了這項(xiàng)檢測(cè),還有26名患者分析正在進(jìn)行中。276名患者得到了基因組檢測(cè)結(jié)果,其中248例進(jìn)行了完整的全基因組分析。 Andr博士說,在172例患者中發(fā)現(xiàn)了一個(gè)能作為抗腫瘤藥物靶點(diǎn)的基因組改變。有趣的是,20%的患者表現(xiàn)出一個(gè)罕見和意料之外的基因組改變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度珠寶企業(yè)社會(huì)責(zé)任與環(huán)保合作合同
- 二零二五年度汽車贈(zèng)與及二手車置換增值服務(wù)合同
- 二零二五年度放棄祖屋繼承權(quán)的明確合同
- 2025年度石材幕墻安裝與維護(hù)管理合同協(xié)議
- 二零二五年度水資源保護(hù)融資合同
- 二零二五年度土地租賃合同糾紛處理指南
- 2025年度貨物損失賠償協(xié)議書:跨境電商供應(yīng)鏈風(fēng)險(xiǎn)分擔(dān)合同
- 二零二五年度師徒互助職業(yè)技能提升協(xié)議
- 二零二五年度足浴店轉(zhuǎn)讓與市場(chǎng)推廣合作框架協(xié)議
- 2025年度涂料行業(yè)綠色生產(chǎn)推廣合同
- 2025年天翼云解決方案架構(gòu)師認(rèn)證考試指導(dǎo)題庫(kù)-上(單選題)
- 行為規(guī)范教育中學(xué)校長(zhǎng)在國(guó)旗下講話:嚴(yán)格要求自己規(guī)范自己的行為
- 2024年12月廣東廣州市港務(wù)局直屬事業(yè)單位引進(jìn)緊缺專業(yè)人才8人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 七下綜合世界真奇妙-共享“地球村”
- DBJ50-T-100-2022 建筑邊坡工程施工質(zhì)量驗(yàn)收標(biāo)準(zhǔn)
- 2025年寧夏工商職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年信陽職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年常考版參考題庫(kù)含答案解析
- DB11-T 1004-2023 房屋建筑使用安全檢查評(píng)定技術(shù)規(guī)程
- 《藝術(shù)與傳播》課件
- 烹飪安全知識(shí)培訓(xùn)課件
- 2024年廣東職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫(kù)含答案解析
評(píng)論
0/150
提交評(píng)論