系統(tǒng)進化樹的構(gòu)建方法與軟件應(yīng)用.ppt_第1頁
系統(tǒng)進化樹的構(gòu)建方法與軟件應(yīng)用.ppt_第2頁
系統(tǒng)進化樹的構(gòu)建方法與軟件應(yīng)用.ppt_第3頁
系統(tǒng)進化樹的構(gòu)建方法與軟件應(yīng)用.ppt_第4頁
系統(tǒng)進化樹的構(gòu)建方法與軟件應(yīng)用.ppt_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

系統(tǒng)進化樹的構(gòu)建方法與軟件應(yīng)用,姓名:張鏡懸 E-mail:J.,什么是系統(tǒng)進化樹,系統(tǒng)進化樹又稱為演化樹,是表明被認為具有共同祖先的各物種間演化關(guān)系的樹.在樹中每個節(jié)點代表其各個分支的最近共同祖先,而節(jié)點的線段長度對應(yīng)了其演化的距離。 (/wiki/Phylogenetic_tree),直系同源和旁系同源,直系同源:同源的基因是由共同的祖先基因進化而產(chǎn)生的。 旁系同源:同源的基因是由于基因復制產(chǎn)生的。 這也就告訴我們用于分子進化分析中的序列必須是直系同源的才可以真實的反映其進化的過程。,系統(tǒng)進化樹的分類,根據(jù)樹是否有根,進化樹可以分為有根樹和無根樹兩類。,有根樹和無根樹的進化層面上的意義,有根樹反應(yīng)了樹上物種或者基因進化的時間順序,通過分析有根樹的長度,可以了解不同的物種或者基因以什么方式和速率進化。 無根樹只反映分類單元之間的距離,而不涉及誰是誰的祖先問題 做有根樹需要指定outgroup。所謂out group , 就是你所分析的東西之外的一個group。比如你分析人類的不同人種,就選個chimpanzee,你要分析哺乳動物,就選個鱷魚烏龜之類,總之保證它在 你要分析的group之外,但又不太遠就行了。將你選定的東西指定為outgroup,做出來的樹就是有根樹。out group可以不只一個,它是一個group。,系統(tǒng)進化樹的結(jié)構(gòu),node,branch,進化樹的結(jié)構(gòu)主要分為三部分: 樹葉 樹枝 節(jié)點 其中我們把從同一個節(jié)點上分出的兩個分支叫做sister group. Sister group 從結(jié)構(gòu)上可以理解為從進化史上看兩者非常接近,其次兩者擁有唯一的共同的祖先。,系統(tǒng)進化樹的結(jié)構(gòu),c,d,b,a,d,c,b,a,d,b,c,a,從結(jié)構(gòu)上看,我們認為這三個樹是等價的,構(gòu)建系統(tǒng)進化樹的理論方法,最大簡約法(maximum parsimony,MP)最早源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進化分析中。最大簡約法的理論基礎(chǔ)是奧卡姆哲學原則,這個原則認為:解釋一個過程的最好理論是所需假設(shè)數(shù)目最少的那一個。對所有可能的拓撲結(jié)構(gòu)進行計算,并計算出所需替代數(shù)最小的那個拓撲結(jié)構(gòu),作為最優(yōu)樹。 優(yōu)點:最大簡約法對于分析某些特殊的分子數(shù)據(jù)如插入、缺失等序列有用。在分析的序列位點上沒有回復突變或平行突變,且被檢驗的序列位點數(shù)很大的時候,最大簡約法能夠推導獲得一個很好的進化樹。 缺點:在分析序列上存在較多 的回復突變或平行突變,而被檢驗的序列位點數(shù)又比較少的時候,最大簡約法可能會給出一個不合理的或者錯誤的進化樹推導結(jié)果。,構(gòu)建系統(tǒng)進化樹的理論方法,最大似然法(maximum likelihood,ML) 最早應(yīng)用于系統(tǒng)發(fā)育分析是在對基因頻率數(shù)據(jù)的分析上,后來基于分子序列的分析中也已經(jīng)引入了最大似然法的分析方法。當樣本量很大的時候,似然法可以獲得參數(shù)統(tǒng)計的最小方差。 最大似然法分析中,選取一個特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個拓撲結(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓撲結(jié)構(gòu) 作為最優(yōu)樹。 最大似然進化模型 簡單假設(shè)所有核苷酸(或者氨基酸)之間相互轉(zhuǎn)變的概率是一樣的 程序會把所有可能的核苷酸輪流置于進化樹的內(nèi)部節(jié)點上,并且計算每個這樣的序列產(chǎn)生實際數(shù)據(jù)的可能性。 所有可能再現(xiàn)的幾率被加總,產(chǎn)生一個特定點的似然值,然后這個數(shù)據(jù)集的所有比對位點的似然值的加和就是整個進化樹的似然值。,構(gòu)建系統(tǒng)進化樹的理論方法,鄰近法(Neighbor-Joining Method,NJ ) 該方法通過確定距離最近(或相鄰)的成對分類單位來使系統(tǒng)樹的總距離達到最小。相鄰是指兩個分類單位在某一無根分叉樹中僅通過一個節(jié)點(node)相連。通過循序地將相鄰點合并成新的點,就可以建立一個相應(yīng)的拓撲樹。,構(gòu)建系統(tǒng)進化樹的所涉及的工具,PHYLIP MEGA R Matlab BioEdit TreeView PHYML ClustalX,構(gòu)建系統(tǒng)進化樹的所涉及的工具,構(gòu)建系統(tǒng)進化樹的所涉及的工具,構(gòu)建樹,可以用PHYLIP或者MEGA 構(gòu)建MP樹,可以使用PHYLIP或者MEGA 構(gòu)建ML樹可以使用PHYML,速度快,同時構(gòu)建ML樹還可以用PHYLIP,或者可以使用BioEdit 貝葉斯的算法以MrBayes為代表,不過速度比較慢 關(guān)于系統(tǒng)發(fā)育分析的更多知識請參閱: /biology/bioinfo2/78842.shtml,軟件的選擇,構(gòu)建系統(tǒng)進化樹的主要步驟,大體來說構(gòu)建系統(tǒng)進化樹的步驟有三步: 序列比對 (ClustalX2),構(gòu)建系統(tǒng)進化樹的主要步驟,2. 掐頭去尾 選取所需序列 轉(zhuǎn)換格式(BioEdit or ClustalX2),Example:,3. 利用相關(guān)軟件繪制系統(tǒng)進化樹(BioEdit,MEGA),實例講解,下面的內(nèi)容將教大家如何來構(gòu)建自己的系統(tǒng)進化樹。 首先我們需要弄清楚一個很重要的問題,什么是Fasta 格式?,在生物信息學中,F(xiàn)ASTA格式(又稱為Pearson格式),是一種基于文本用于表示核苷酸序列或氨基酸序列的格式。在這種格式中堿基對或氨基酸用單個字母來編碼,且允許在序列前添加序列名及注釋。序列文件的第一行是由大于號“”或分號“;”打頭的任意文字說明(習慣常用“”作為起始),用于序列標記。從第二行開始為序列本身,只允許使用既定的核苷酸或氨基酸編碼符號。,構(gòu)建我們自己的Fasta 文件,很多情況下,F(xiàn)asta文件是直接可以從數(shù)據(jù)庫中下載得到的,但是根據(jù)實際要求的不同,有時候我們需要自己構(gòu)建Fasta文件,如果您已近有了想用來構(gòu)建進化樹的序列,您可以如右圖所示構(gòu)建自己的文件,文件的保存格式是: 文件名.txt,實例講解,下面我們以禽流感病毒為例,構(gòu)建系統(tǒng)進化樹。 首先我們要下載我們所需的序列。 /genomes/FLU/Database/nph-select.cgi?go=genomeset,實例講解,請在Define search set: 中選擇我們想要的禽流感病毒的Type, Host, Country/Region, Subtype.,這里我們選在了A型禽流感病毒,當然在這次練習中您喜歡的任意類型。,實例講解,請在Define search set: 中選擇我們想要的禽流感病毒的Type, Host, Country/Region, Subtype.,這里我們選在了A型禽流感病毒,當然在這次練習中您喜歡的任意類型。當您確定之后請點擊 Show results,實例講解,當您點擊完 Show results 之后你要做的就是選在我們所需的序列了,實例講解,因為禽流感病毒不像別的很多別的病毒只有核苷酸序列,它擁有八個或者七個Negative -sense RNA。,實例講解,這里我們只要選中其中一種就可以了,比如說,我們可以選擇個樣本來構(gòu)建系統(tǒng)進化樹。樣本選擇完之后請點擊Download, 文件類型選擇Nucleotide (Fasta),并把文件保存在計算機您熟悉的地方。(當然根據(jù)需求的不同您也可以選在蛋白序列),實例講解,文件下載完之后,下載的Fasta 文件直接用 ClustalX 2.0.12打開,實例講解,在進行多序列比對之前我們需要對軟件進行一些設(shè)置,1.選擇Alignment標簽 2.選擇Output format options,請將Clustalw sequences numbers選項設(shè)置為 On 之后點擊 Ok ,在返回主界面之后請點擊Alignment 標簽選擇 Do Complete Alignment選項,選擇保存路徑之后點擊ok,剩下的時間可以去喝點咖啡休息一下。,實例講解,從圖中我們可以發(fā)現(xiàn)起始序列最短的是從位置22開始的,而尾端序列最短的是在位置1738,通過設(shè)置我們可以保存這樣一批已經(jīng)經(jīng)過掐頭去尾后的序列,保存格式為:文件名.aln。當然我們也可以直接保存為Fasta format, 如果選擇前者我們需要用BioEdit轉(zhuǎn)換格式,如果是后者我們可以直接進入建樹階段。,點擊主界面中的 File標簽選擇 Save as選項,并按照例子設(shè)置參數(shù),實例講解,經(jīng)過ClustalX2掐頭去尾后的序列可以用BioEdit軟件打開,選擇FileSave as保存類型為:文件名.fasta. 當我們查詢結(jié)果的時候可以發(fā)現(xiàn)這和用ClustalX2保存的fasta文件是一致的。,實例講解,下一步我們將介紹如何用MEGA構(gòu)建我們的進化樹,首先請大家用MEGA軟件將我們之前保留的Fasta文件打開。,實例講解,下一步我們將介紹如何用MEGA構(gòu)建我們的進化樹,首先請大家用MEGA軟件將我們之前保留的Fasta文件打開這時候會有兩個窗口,選擇File標簽Convert file format to Mega.,實例講解,選擇File標簽Convert file format to Mega.,當給出相應(yīng)的文件路徑之后點擊ok ,然后制定輸出文件格式:文件名.meg,實例講解,雙擊剛才保存的meg文件.,選擇數(shù)據(jù)類型,在本次測試中我們用的是核苷酸序列,對于右邊的參數(shù)信息請點擊help按鈕。,更具實際的情況我們這里選擇No選項,實例講解,下一步進入建樹的最后階段,在Plylogeny中選擇建樹方法,這里我們選擇NJ法。,參數(shù)設(shè)置好之后點擊compute.,蛋白質(zhì)序列一般選擇Poisson Correction(泊松校正),對于核苷酸序列一般采用Kimura-2模型,實例講解,根據(jù)Mega的計算最終我們得到了序列中的進化關(guān)系。,Mega軟件還可以自動提供一份簡要的分析報告,你只需要點擊Caption按鈕報告便可以自動生成。,如果Bootstrap Value 70我們認為這個分支是可靠的,進化樹評估優(yōu)化方法簡介:常用的兩種方法就是Bootstrap和Jackknife。 所謂Bootstraping法 就是從整個序列的堿基(氨基酸)中任意選取一半,剩下的一半序列隨機補齊組成一個新的序列。這樣,一個序列就可以變成了許多序列,一個多序列組也就可以變 成許多個多序列組。根據(jù)某種算法(最大簡約性法、最大可能性法、鄰位相連法)每個多序列組都可以生成一個進化樹。將生成的許多進化樹進行比 較,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論