比較基因組學(xué)原理及應(yīng)用學(xué)習(xí)教案_第1頁
比較基因組學(xué)原理及應(yīng)用學(xué)習(xí)教案_第2頁
比較基因組學(xué)原理及應(yīng)用學(xué)習(xí)教案_第3頁
比較基因組學(xué)原理及應(yīng)用學(xué)習(xí)教案_第4頁
比較基因組學(xué)原理及應(yīng)用學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1比較比較(bjio)基因組學(xué)原理及應(yīng)用基因組學(xué)原理及應(yīng)用第一頁,共91頁。第1頁/共90頁第二頁,共91頁?;蚪M學(xué)概念基因組學(xué)概念(ginin)及范疇及范疇基因組基因組(genome)(genome)泛指一個(gè)泛指一個(gè)(y )(y )有生命體、病毒或細(xì)胞器的全部遺傳有生命體、病毒或細(xì)胞器的全部遺傳物質(zhì);在真核生物,基因組是指一套染色體(單倍體物質(zhì);在真核生物,基因組是指一套染色體(單倍體)DNADNA。 基因組學(xué)基因組學(xué)(genomics)就是發(fā)展和應(yīng)用就是發(fā)展和應(yīng)用DNA制圖、測(cè)序新技術(shù)以及制圖、測(cè)序新技術(shù)以及(yj)計(jì)算計(jì)算機(jī)程序,分析生命體(包括人類)全部基因組結(jié)構(gòu)及功機(jī)程序,分

2、析生命體(包括人類)全部基因組結(jié)構(gòu)及功能。能。第2頁/共90頁第三頁,共91頁。基因組學(xué)概念基因組學(xué)概念第3頁/共90頁第四頁,共91頁。定義:比較基因組學(xué)定義:比較基因組學(xué)(Comparative Genomics)是基是基于基因組圖譜于基因組圖譜(tp)和測(cè)序基礎(chǔ)上,對(duì)已知的基因和和測(cè)序基礎(chǔ)上,對(duì)已知的基因和基因組結(jié)構(gòu)進(jìn)行比較,來了解基因的功能、表達(dá)機(jī)理基因組結(jié)構(gòu)進(jìn)行比較,來了解基因的功能、表達(dá)機(jī)理和物種進(jìn)化的學(xué)科。和物種進(jìn)化的學(xué)科。研究?jī)?nèi)容:種間的比較基因組學(xué)研究?jī)?nèi)容:種間的比較基因組學(xué) 和和 種內(nèi)的比較基因種內(nèi)的比較基因組學(xué)組學(xué)第4頁/共90頁第五頁,共91頁。第5頁/共90頁第六頁,

3、共91頁。工具:工具: 1、FASTA 2、BLAST 3、CLUSTAL W基因組分類:基因組分類: 1、通過比較確知其功能的。、通過比較確知其功能的。 2、在數(shù)據(jù)庫中有相匹配的蛋白,但不知道其功能、在數(shù)據(jù)庫中有相匹配的蛋白,但不知道其功能。 3、在現(xiàn)有的數(shù)據(jù)庫中找不到、在現(xiàn)有的數(shù)據(jù)庫中找不到(b do)任何相匹配的任何相匹配的蛋白質(zhì)序列的新基因。蛋白質(zhì)序列的新基因。第6頁/共90頁第七頁,共91頁。第7頁/共90頁第八頁,共91頁。第8頁/共90頁第九頁,共91頁。第9頁/共90頁第十頁,共91頁。第10頁/共90頁第十一頁,共91頁。第11頁/共90頁第十二頁,共91頁。第12頁/共90

4、頁第十三頁,共91頁。果與序列的積累相同步,尤其是人類全基因組序列的分析與比較使比較基因組學(xué)成為整個(gè)生物學(xué)領(lǐng)域最新、最重要、進(jìn)展最快和影響最大的學(xué)科之一。第13頁/共90頁第十四頁,共91頁。第14頁/共90頁第十五頁,共91頁。第15頁/共90頁第十六頁,共91頁。第16頁/共90頁第十七頁,共91頁。測(cè)序完成情況測(cè)序完成情況(qngkung)統(tǒng)計(jì)統(tǒng)計(jì)第17頁/共90頁第十八頁,共91頁。第18頁/共90頁第十九頁,共91頁。第19頁/共90頁第二十頁,共91頁。第20頁/共90頁第二十一頁,共91頁。 Fig1. 雙脫氧(tu yng)終止法測(cè)序第21頁/共90頁第二十二頁,共91頁。第2

5、2頁/共90頁第二十三頁,共91頁。第23頁/共90頁第二十四頁,共91頁。Fig.2 ABI 3730XL第24頁/共90頁第二十五頁,共91頁。第25頁/共90頁第二十六頁,共91頁。Fig.3 Roche 454GS FLX 平臺(tái)(pngti)第26頁/共90頁第二十七頁,共91頁。第27頁/共90頁第二十八頁,共91頁。Fig.4 IlluminaSolexa平臺(tái)(pngti)第28頁/共90頁第二十九頁,共91頁。第29頁/共90頁第三十頁,共91頁。 Fig.5 ABI SOLiD平臺(tái)(pngti)第30頁/共90頁第三十一頁,共91頁。第31頁/共90頁第三十二頁,共91頁。參考

6、文獻(xiàn): DNA測(cè)序技術(shù)(jsh)的發(fā)展歷史與最新進(jìn)展, 解增言等;DNA測(cè)序技術(shù)(jsh)發(fā)展及其展望, 孫海汐等。第32頁/共90頁第三十三頁,共91頁。第33頁/共90頁第三十四頁,共91頁。第34頁/共90頁第三十五頁,共91頁。朱琳第35頁/共90頁第三十六頁,共91頁。第36頁/共90頁第三十七頁,共91頁。ACTGTTAGACTTTAGCA C T G T T A G| | | | | | | A C T - T T A G第37頁/共90頁第三十八頁,共91頁。面臨的問題: 進(jìn)化的過程中同源序列可經(jīng)過多次的插入或缺失(qu sh),導(dǎo)致它們長度不同,這就給比對(duì)帶來了麻煩。要解決的

7、問題: 最優(yōu)比對(duì)算法-尋找(xnzho)最佳的缺失方式使比對(duì)序列的相似度達(dá)到整體最大第38頁/共90頁第三十九頁,共91頁。首先構(gòu)建具有m行n列的矩陣(j zhn)M,根據(jù)殘基配對(duì)的函數(shù),給每個(gè)矩陣(j zhn)單元格賦值,將矩陣(j zhn)初始化。再進(jìn)行變換操作,規(guī)則是將某單元格右下方路徑中的最大值疊加到該單元格即M(I,j)=M(I,j)+maxM(i+1,j+1);M(i+1,j+2,jmax)-gap penalty ; M(i+2,imax,j+1)-gap penalty使用最簡(jiǎn)單的打分系統(tǒng)進(jìn)行比對(duì),殘基相同時(shí)分值是1,不同時(shí)分值為0,空位罰分。此外還有Smith-waterma

8、n 算法第39頁/共90頁第四十頁,共91頁?;蚪M比對(duì)基因組比對(duì) 只能對(duì)序列密切相關(guān)或非常(fichng)相似的基因組比對(duì),序列太長,既有的算法無能為力方法:suffix tree 數(shù)據(jù)結(jié)構(gòu)(sh j ji u) 軟件MUMer 能找出兩個(gè)基因組的DNA序列上最大且唯一的匹配區(qū)域,然后除去序列中用Smith-waterman 最佳局部比對(duì)算法對(duì)大量插入序列、重復(fù)序列、短變異區(qū)域進(jìn)行局部鑒定時(shí)插入的空位,完成這兩個(gè)基因組序列的比對(duì)。第40頁/共90頁第四十一頁,共91頁。三條或多條序列的同時(shí)比對(duì)是序列的分析中最常用的技術(shù)之一。通過一系列同源(tn yun)序列的全局比對(duì)來實(shí)現(xiàn)的遞進(jìn)法:基本思想

9、是同源序列與系統(tǒng)發(fā)育相關(guān)。具體步驟: 1、比對(duì)所有(suyu)可能的序列對(duì)。 2、用相鄰連接法使用兩兩比對(duì)的相似度分值構(gòu)建(tree)。 3、這種樹用于指導(dǎo)遞進(jìn)的多序列比對(duì)。第41頁/共90頁第四十二頁,共91頁。三大(sn d)核酸數(shù)據(jù)庫:GenBank、EMBL、DDBJ第42頁/共90頁第四十三頁,共91頁。數(shù)據(jù)庫搜索使用的最廣泛(gungfn)的算法: FASTA算法和BLAST算法。 FASTA算法運(yùn)用一種包括四個(gè)連續(xù)階段的啟發(fā)式方法來檢測(cè)被查序列與一組序列是相似性。 BLAST算法采用非常快的算法來查找數(shù)據(jù)庫中與預(yù)查詢序列最相似是序列。基本思想是:兩個(gè)同源序列即使有很大的差異,也有

10、可能(knng)共有高分值的相似片段,這使我們可以理解可靠的區(qū)分相關(guān)和非相關(guān)的序列。第43頁/共90頁第四十四頁,共91頁。 對(duì)新蛋白質(zhì)序列進(jìn)行分析的第一步是用BLAST進(jìn)行數(shù)據(jù)庫搜索。如果有明顯相似性可以推測(cè)其序列的功能如果沒有,可用模式識(shí)別方法根據(jù)特定(tdng)的結(jié)構(gòu)域或蛋白質(zhì)家族的特征進(jìn)行搜索。 -模式數(shù)據(jù)庫已經(jīng)成為識(shí)別新序列的特定(tdng)功能活性的重要工具。InterPro數(shù)據(jù)庫是最重要的蛋白質(zhì)模式數(shù)據(jù)庫之一。第44頁/共90頁第四十五頁,共91頁。第45頁/共90頁第四十六頁,共91頁。第46頁/共90頁第四十七頁,共91頁。第47頁/共90頁第四十八頁,共91頁。第48頁/共

11、90頁第四十九頁,共91頁。0.2898, 盤鮑與雜色鮑的親緣關(guān)系較遠(yuǎn) 。第49頁/共90頁第五十頁,共91頁。n果蠅,斑馬魚,小鼠,擬南芥第50頁/共90頁第五十一頁,共91頁。第51頁/共90頁第五十二頁,共91頁。第52頁/共90頁第五十三頁,共91頁。第53頁/共90頁第五十四頁,共91頁。1.全基因組的比較(bjio)研究第54頁/共90頁第五十五頁,共91頁。第55頁/共90頁第五十六頁,共91頁。第56頁/共90頁第五十七頁,共91頁。第57頁/共90頁第五十八頁,共91頁。第58頁/共90頁第五十九頁,共91頁。2.系統(tǒng)發(fā)生的進(jìn)化關(guān)系(gun x)分析第59頁/共90頁第六十頁

12、,共91頁。第60頁/共90頁第六十一頁,共91頁。第61頁/共90頁第六十二頁,共91頁。第62頁/共90頁第六十三頁,共91頁。第63頁/共90頁第六十四頁,共91頁。,稍慢一點(diǎn)。所以在建立多序列比較時(shí)加入一支稍遠(yuǎn)的物種序列( 450 My ) 將提高保守序列的鑒別能力。比較分析較近的物種序列如: 人與himpanzees或與其它的類人猿可以用來鑒定在近期(jn q)進(jìn)化史上發(fā)生的基因改變和重組等。因此在建立多序列的比較分析中加入一支近距離的物種序列不僅有助于編碼和非編碼的功能序列的識(shí)別, 也能揭示那些相關(guān)物種特征的基因組信息、第64頁/共90頁第六十五頁,共91頁。上的最大的同源性分值,

13、 它適用于高度分化但組織結(jié)構(gòu)同源的序列比對(duì), 整體比對(duì)適用于基因序列整體上同源性較高的比較分析, 如保守片斷 ( conserved segments ) 的比對(duì), 可以使用 VISTA進(jìn)行分析。第65頁/共90頁第六十六頁,共91頁。型。第66頁/共90頁第六十七頁,共91頁。L D S C HG E S L C Kr目標(biāo):使用目標(biāo):使用(shyng)局部?jī)?yōu)化算法尋找比對(duì)的結(jié)局部?jī)?yōu)化算法尋找比對(duì)的結(jié)果果第67頁/共90頁第六十八頁,共91頁。L D S C HG E S L C Kr目標(biāo):使用局部?jī)?yōu)化算法目標(biāo):使用局部?jī)?yōu)化算法(sun f)尋找比對(duì)的結(jié)尋找比對(duì)的結(jié)果果第68頁/共90頁第六十

14、九頁,共91頁。GapLDSCHGap000000G0SijE0S0L0C0K0Smith-Waterman算法算法(sun f);Sij = max of Si-1, j-1 + (xi, yj) Si-1, j - d (從左到右從左到右) Si, j-1 - d (從上到下從上到下) 0第69頁/共90頁第七十頁,共91頁。GapLDSCHGap000000G0SijE0S0L0C0K0-12-12-3第70頁/共90頁第七十一頁,共91頁。GapLDSCHGap000000G000E0S0L0C0K0-12-12-4第71頁/共90頁第七十二頁,共91頁。GapLDSCHGap0000

15、00G000000E002000S002600L040050C001092K000008-12-2第72頁/共90頁第七十三頁,共91頁。GapLDSCHGap000000G000000E002000S002600L040050C001092K000008L D S C HG E S L C K第73頁/共90頁第七十四頁,共91頁。第74頁/共90頁第七十五頁,共91頁。第75頁/共90頁第七十六頁,共91頁。第76頁/共90頁第七十七頁,共91頁。李春麗第77頁/共90頁第七十八頁,共91頁。 4 調(diào)控模式類似于原核生物調(diào)控模式類似于原核生物與真核生物共同之處:與真核生物共同之處: 1 細(xì)

16、胞遺傳信息傳遞,尤其是細(xì)胞遺傳信息傳遞,尤其是轉(zhuǎn)錄和翻譯系統(tǒng)轉(zhuǎn)錄和翻譯系統(tǒng) 2 分泌系統(tǒng)分泌系統(tǒng)說明該細(xì)菌與真核生物親緣關(guān)系較說明該細(xì)菌與真核生物親緣關(guān)系較近。近。第78頁/共90頁第七十九頁,共91頁。第79頁/共90頁第八十頁,共91頁。第80頁/共90頁第八十一頁,共91頁。第81頁/共90頁第八十二頁,共91頁。第82頁/共90頁第八十三頁,共91頁。l二者差別在于二者差別在于(ziy)基因數(shù)量上,流基因數(shù)量上,流感嗜血桿菌基因組有感嗜血桿菌基因組有1743個(gè)個(gè)ORF,尿殖道,尿殖道支原體只有支原體只有470個(gè)個(gè)ORF。第83頁/共90頁第八十四頁,共91頁。第84頁/共90頁第八十五

17、頁,共91頁。,共有77%基因第85頁/共90頁第八十六頁,共91頁。第86頁/共90頁第八十七頁,共91頁。理環(huán)境。n其次酵母的生命周期也很適合被用來作遺傳分析,有可能構(gòu)建一套16 條染色體單倍型的詳盡的圖譜。n第三,現(xiàn)今的技術(shù)可以將其6000 個(gè)基因中的任何一個(gè)用突變的等位基因替代或準(zhǔn)確地從基因組中缺失。第87頁/共90頁第八十八頁,共91頁。組研究。n另一個(gè)應(yīng)用是把比較基因組作圖用于復(fù)雜性狀的分析。許多遺傳性狀是由一個(gè)以上的基因控制的,這些基因的識(shí)別通常在老鼠中比在人中來得容易。一旦一個(gè)候選疾病基因或疾病區(qū)域被在老鼠中確認(rèn),我們就可以篩選(shixun)同源基因或同源區(qū)域,看看是否與人類遺傳病相對(duì)應(yīng)。第8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論