分子進化分析_第1頁
分子進化分析_第2頁
分子進化分析_第3頁
分子進化分析_第4頁
分子進化分析_第5頁
已閱讀5頁,還剩108頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

關(guān)于分子進化分析第1頁,講稿共113頁,2023年5月2日,星期三分子進化分析介紹系統(tǒng)發(fā)育樹重建方法相關(guān)進化模式例子第2頁,講稿共113頁,2023年5月2日,星期三 從物種的一些分子特性出發(fā),從而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系。

蛋白和核酸序列

通過序列同源性的比較進而了解基因的進化以及生物系統(tǒng)發(fā)生的內(nèi)在規(guī)律。分子進化研究的目的第3頁,講稿共113頁,2023年5月2日,星期三系統(tǒng)發(fā)育樹是什么? 對一組實際對象的世系關(guān)系的描述(如基因,物種等)。第4頁,講稿共113頁,2023年5月2日,星期三一個系統(tǒng)發(fā)育樹末端物種頂端中間節(jié)點中間枝條根末端分支葉子節(jié)點第5頁,講稿共113頁,2023年5月2日,星期三ABCDE?FG樹只代表分支的拓撲結(jié)構(gòu)FGCDE?AB第6頁,講稿共113頁,2023年5月2日,星期三分子進化研究的基礎(假設)核苷酸和氨基酸序列中含有生物進化歷史的全部信息。第7頁,講稿共113頁,2023年5月2日,星期三在各種不同的發(fā)育譜系及足夠大的進化時間尺度中,許多序列的進化速率幾乎是恒定不變的。(分子鐘理論,1965)分子進化研究的基礎(理論)第8頁,講稿共113頁,2023年5月2日,星期三雖然很多時候仍然存在爭議,但是分子進化確實能闡述一些生物系統(tǒng)發(fā)生的內(nèi)在規(guī)律。分子進化研究的基礎(實際)第9頁,講稿共113頁,2023年5月2日,星期三從一個分歧數(shù)據(jù)可以推測其他序列分歧度分歧時間xy分子鐘理論第10頁,講稿共113頁,2023年5月2日,星期三直系同源(orthologs):同源的基因是由于共同的祖先基因進化而產(chǎn)生的.旁系同源(paralogs):同源的基因是由于基因復制產(chǎn)生的.(以上定義源自Fitch,W.M.(1970)Distinguishinghomologousfromanalogousproteins.Syst.Zool.19,99–113)直系同源與旁系同源第11頁,講稿共113頁,2023年5月2日,星期三paralogsorthologs第12頁,講稿共113頁,2023年5月2日,星期三paralogsorthologsErikL.L.SonnhammerOrthology,paralogyandproposedclassificationforparalogsubtypesTRENDSinGeneticsVol.18No.12December20020168-9525/02/$–seefrontmatter?2002ElsevierScienceLtd.Allrightsreserved.第13頁,講稿共113頁,2023年5月2日,星期三以上兩個概念代表了兩個不同的進化事件用于分子進化分析中的序列必須是直系同源的,才能真實反映進化過程。第14頁,講稿共113頁,2023年5月2日,星期三趨同進化的基因(geneshaveconvergedfunctionbyseparateevolutionarypaths)第15頁,講稿共113頁,2023年5月2日,星期三異源基因或水平轉(zhuǎn)移基因(xenologousorhorizontallytransferredgenes)第16頁,講稿共113頁,2023年5月2日,星期三Bacterium1Bacterium3Bacterium2Eukaryote1Eukaryote4Eukaryote3Eukaryote2Bacterium1Bacterium3Bacterium2Eukaryote1Eukaryote4Eukaryote3Eukaryote2Phylogramsshowbranchorderandbranchlengths進化樹,有分支和支長信息2.進化分支圖,進化樹Cladogramsshowbranchingorder-branchlengthsaremeaningless進化分支圖,只用分支信息,無支長信息。第17頁,講稿共113頁,2023年5月2日,星期三Rootedbyoutgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteriaoutgrouprooteukaryoteeukaryoteeukaryoteeukaryote無根樹archaeaarchaeaarchaeaMonophyleticgroup(單源群)Monophyleticgroup3.有根樹,無根樹,外圍群有根樹外圍群第18頁,講稿共113頁,2023年5月2日,星期三4.基因樹,物種樹WeoftenassumethatgenetreesgiveusspeciestreesabcABDGenetreeSpeciestree第19頁,講稿共113頁,2023年5月2日,星期三系統(tǒng)發(fā)育樹重建分析步驟多序列比對(自動比對,手工比對)建立取代模型(建樹方法)建立進化樹進化樹評估第20頁,講稿共113頁,2023年5月2日,星期三系統(tǒng)發(fā)育樹重建的基本方法最大簡約法(maximumparsimony,MP)距離法(distance)最大似然法(maximumlikelihood,ML)Bayes法第21頁,講稿共113頁,2023年5月2日,星期三最大簡約法(MP) 最大簡約法(maximumparsimony,MP)最早源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進化分析中。最大簡約法的理論基礎是奧卡姆(Ockham)哲學原則,這個原則認為:解釋一個過程的最好理論是所需假設數(shù)目最少的那一個。對所有可能的拓撲結(jié)構(gòu)進行計算,并計算出所需替代數(shù)最小的那個拓撲結(jié)構(gòu),作為最優(yōu)樹。

第22頁,講稿共113頁,2023年5月2日,星期三序列個數(shù)與樹的個數(shù)的關(guān)系第23頁,講稿共113頁,2023年5月2日,星期三優(yōu)點: 最大簡約法不需要在處理核苷酸或者氨基酸替代的時候引入假設(替代模型)。 此外,最大簡約法對于分析某些特殊的分子數(shù)據(jù)如插入、缺失等序列有用。最大簡約法(MP)第24頁,講稿共113頁,2023年5月2日,星期三缺點: 在分析的序列位點上沒有回復突變或平行突變,且被檢驗的序列位點數(shù)很大的時候,最大簡約法能夠推導獲得一個很好的進化樹。 然而在分析序列上存在較多的回復突變或平行突變,而被檢驗的序列位點數(shù)又比較少的時候,最大簡約法可能會給出一個不合理的或者錯誤的進化樹推導結(jié)果。最大簡約法(MP)第25頁,講稿共113頁,2023年5月2日,星期三距離法 距離法又稱距離矩陣法,首先通過各個物種之間的比較,根據(jù)一定的假設(進化距離模型)推導得出分類群之間的進化距離,構(gòu)建一個進化距離矩陣。進化樹的構(gòu)建則是基于這個矩陣中的進化距離關(guān)系。第26頁,講稿共113頁,2023年5月2日,星期三計算序列的距離,建立距離矩陣通過距離矩陣建進化樹第27頁,講稿共113頁,2023年5月2日,星期三一種簡單的距離矩陣第28頁,講稿共113頁,2023年5月2日,星期三由進化距離構(gòu)建進化樹的方法有很多,常見有:1.Fitch-MargoliashMethod(FM法)

2.Neighbor-JoiningMethod(NJ法/鄰接法)

3.NeighborsRelatonMethod(鄰居關(guān)系法)4.UnweightedPairGroupMethod(UPGMA法)通過矩陣建樹的方法第29頁,講稿共113頁,2023年5月2日,星期三最大似然法(ML) 最大似然法(maximumlikelihood,ML)最早應用于系統(tǒng)發(fā)育分析是在對基因頻率數(shù)據(jù)的分析上,后來基于分子序列的分析中也已經(jīng)引入了最大似然法的分析方法。第30頁,講稿共113頁,2023年5月2日,星期三 最大似然法分析中,選取一個特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個拓撲結(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓撲結(jié)構(gòu)作為最優(yōu)樹。在最大似然法的分析中,所考慮的參數(shù)并不是拓撲結(jié)構(gòu)而是每個拓撲結(jié)構(gòu)的枝長,并對似然率球最大值來估計枝長。最大似然法(ML)第31頁,講稿共113頁,2023年5月2日,星期三 最大似然法的建樹過程是個很費時的過程,因為在分析過程中有很大的計算量,每個步驟都要考慮內(nèi)部節(jié)點的所有可能性。 最大似然法是一個比較成熟的參數(shù)估計的統(tǒng)計學方法,具有很好的統(tǒng)計學理論基礎,在當樣本量很大的時候,似然法可以獲得參數(shù)統(tǒng)計的最小方差。只要使用了一個合理的、正確的替代模型,最大似然法可以推導出一個很好的進化樹結(jié)果。最大似然法(ML)第32頁,講稿共113頁,2023年5月2日,星期三堿基變化的通用模型第33頁,講稿共113頁,2023年5月2日,星期三 由于最大似然法的分析過程需要耗費較多的時間,針對這種情況,發(fā)展出了許多優(yōu)化的可以加快最大似然法尋找最優(yōu)樹的搜索方法,如啟發(fā)式搜索,分枝交換搜索等。最大似然法具有堅實的統(tǒng)計學理論基礎,充分的使用了分析序列中的信息資源,只要采用了合理的替代模型,可以得出很好的進化樹分析結(jié)果。最大似然法(ML)第34頁,講稿共113頁,2023年5月2日,星期三選擇外類群

(Outgroup)選擇一個或多個已知與分析序列關(guān)系較遠的序列作為外類群外類群可以輔助定位樹根外類群序列必須與剩余序列關(guān)系較近,但外類群序列與其他序列間的差異必須比其他序列之間的差異更顯著。bacteriaoutgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea外圍群第35頁,講稿共113頁,2023年5月2日,星期三進化樹的可靠性分析自展法(BootstrapMethod)從排列的多序列中隨機有放回的抽取某一列,構(gòu)成相同長度的新的排列序列重復上面的過程,得到多組新的序列對這些新的序列進行建樹,再觀察這些樹與原始樹是否有差異,以此評價建樹的可靠性第36頁,講稿共113頁,2023年5月2日,星期三原始排列AlphaAACAACBetaAACCCCGammaACCAACDeltaCCACCAEpsilonCCAAAC

Bootstrap1AlphaACAAACBetaACCCCCGammaACAAACDeltaCACCCAEpsilonCAAAAC

Bootstrap2AlphaAAAACCBetaAACCCCGammaCCAACCDeltaCCCCAAEpsilonCCAACC

Bootstrap3AlphaACAAACBetaACCCCCGammaCCAAACDeltaCACCCAEpsilonCAAAAC第37頁,講稿共113頁,2023年5月2日,星期三分子進化模式1、專性胞內(nèi)菌Rickettsia核心基因進化機制2、藍藻二元信號轉(zhuǎn)導中的環(huán)化酶進化機制3、藍藻限制性修復系統(tǒng)進化機制4、蘇云金芽孢桿菌殺蟲蛋白進化機制5、SARS進化機制第38頁,講稿共113頁,2023年5月2日,星期三1、專性胞內(nèi)菌Rickettsia核心基因進化機制

第39頁,講稿共113頁,2023年5月2日,星期三第40頁,講稿共113頁,2023年5月2日,星期三第41頁,講稿共113頁,2023年5月2日,星期三2、藍藻二元信號轉(zhuǎn)導中的環(huán)化酶進化機制第42頁,講稿共113頁,2023年5月2日,星期三第43頁,講稿共113頁,2023年5月2日,星期三第44頁,講稿共113頁,2023年5月2日,星期三第45頁,講稿共113頁,2023年5月2日,星期三第46頁,講稿共113頁,2023年5月2日,星期三第47頁,講稿共113頁,2023年5月2日,星期三3、藍藻限制性修復系統(tǒng)進化機制第48頁,講稿共113頁,2023年5月2日,星期三第49頁,講稿共113頁,2023年5月2日,星期三第50頁,講稿共113頁,2023年5月2日,星期三第51頁,講稿共113頁,2023年5月2日,星期三4、蘇云金芽孢桿菌殺蟲蛋白進化機制

第52頁,講稿共113頁,2023年5月2日,星期三第53頁,講稿共113頁,2023年5月2日,星期三第54頁,講稿共113頁,2023年5月2日,星期三5、SARS進化機制第55頁,講稿共113頁,2023年5月2日,星期三第56頁,講稿共113頁,2023年5月2日,星期三第57頁,講稿共113頁,2023年5月2日,星期三第58頁,講稿共113頁,2023年5月2日,星期三第59頁,講稿共113頁,2023年5月2日,星期三此部分供同學們自學第60頁,講稿共113頁,2023年5月2日,星期三常見的分子進化分析程序1.Phylip

由華盛頓大學遺傳學系開發(fā),是一個免費的系統(tǒng)發(fā)育分析軟件包,可以通過以下地址下載。/phylip.html2.PAUP*最早是在蘋果機上開發(fā)的具有菜單界面的進化分析軟件,早先版本只有MP法,后續(xù)版本已經(jīng)包括距離法和ML法,現(xiàn)今有mac,win,linux等多種版本,該軟件不是免費軟件,使用者需要向開發(fā)者購買。第61頁,講稿共113頁,2023年5月2日,星期三Phylip軟件包介紹Phylip是一個免費的系統(tǒng)發(fā)生(phylogenetics)分析軟件包。以下鏈接可以下載:

http://evolution.genetics,/phylip.html由華盛頓大學遺傳學系開發(fā),1980年首次公布,目前的版本是3.6(2000年6月)。第62頁,講稿共113頁,2023年5月2日,星期三Phylip軟件包介紹Phylip包含了35個獨立的程序,這些獨立的程序都實現(xiàn)特定的功能,這些程序基本上包括了系統(tǒng)發(fā)生分析的所有方面。Phylip有多種不同平臺的版本(包括windows,Macintosh,DOS,Linux,Unix和OpenVMX)。第63頁,講稿共113頁,2023年5月2日,星期三Phylip是目前最廣泛使用的系統(tǒng)發(fā)生分析程序,主要包括一下幾個程序組:分子序列組,距離矩陣組,基因頻率組,離散字符組,進化樹繪制組。

Phylip軟件包介紹第64頁,講稿共113頁,2023年5月2日,星期三分子序列組:1.蛋白質(zhì)序列:protpars,proml,promlk,

protdist2.核酸序列:dnapenny,dnapars,

dnamove,dnaml,dnamlk,

dnainvar,dnadist,dnacompPhylip軟件包分組介紹第65頁,講稿共113頁,2023年5月2日,星期三距離矩陣組:Fitch,kitsch,neighbor基因頻率組:Gendist,contml離散字符組Pars,mix,move,penny,dollop,dolmove,dolpenny,clique,factorPhylip軟件包分組介紹第66頁,講稿共113頁,2023年5月2日,星期三進化樹繪制組:drawtree,drawgram其他:restdist,restml,seqboot,contrasttreedist,consense,retreePhylip軟件包分組介紹第67頁,講稿共113頁,2023年5月2日,星期三Phylip軟件包的文檔是非常詳細的,對于每個獨立的程序,都有一個獨立的文檔,詳細的介紹了該程序的使用及其說明。此外,Phylip軟件包還包括程序的源代碼(c語言)。Phylip軟件包的文檔第68頁,講稿共113頁,2023年5月2日,星期三Phylip軟件包的應用1,根據(jù)你的分析數(shù)據(jù),選擇適當?shù)某绦蛉?,你分析的是DNA數(shù)據(jù),就在核酸序列分析類中選擇程序(dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacomp)如果分析的是離散數(shù)據(jù),如突變位點數(shù)據(jù),就在離散字符組里面選擇程序。第69頁,講稿共113頁,2023年5月2日,星期三2.選擇適當?shù)姆治龇椒ㄈ缒惴治龅氖荄NA數(shù)據(jù),可以選擇簡約法(DNAPARS),似然法(DNAML,DNAMLK),距離法等(DNADIST)。。。Phylip軟件包的應用第70頁,講稿共113頁,2023年5月2日,星期三3.進行分析選擇好程序后,執(zhí)行,讀入分析數(shù)據(jù),選擇適當?shù)膮?shù),進行分析,結(jié)果自動保存為outfile,outtree。

Phylip軟件包的應用第71頁,講稿共113頁,2023年5月2日,星期三 Outfile是一個記錄文件,記錄了分析的過程和結(jié)果,可以直接用文本編輯器(如寫字板)打開。 outtree是分析結(jié)果的樹文件,可以用phylip提供的繪樹程序打開查看,也可以用其他的程序來打開,如treeviewPhylip軟件包的應用第72頁,講稿共113頁,2023年5月2日,星期三第73頁,講稿共113頁,2023年5月2日,星期三出發(fā)數(shù)據(jù)-已經(jīng)排列好的蛋白序列。重構(gòu)算法-距離法(protdist.exe)最大簡約法(protpars.exe)最大似然法(proml.exe)統(tǒng)計分析-撥靴法(bootstrap)實際應用(從蛋白序列推導進化樹)第74頁,講稿共113頁,2023年5月2日,星期三實際操作Phylip軟件包中的每個分析程序都是一個獨立的應用程序。我們選擇好了分析算法后,按一定的順序組合使用選擇的程序,就可以獲得按選擇的算法分析的結(jié)果(進化樹)。例子:從我們剛剛通過clustal比對獲得的蛋白序列推測進化樹。

選擇方法:距離法(protdist.exe)第75頁,講稿共113頁,2023年5月2日,星期三

第一步:雙擊執(zhí)行protdist.exe,根據(jù)提示輸入分析的文件名(程序默認是infile)。

第76頁,講稿共113頁,2023年5月2日,星期三第二步:設定各個參數(shù),執(zhí)行程序,獲得距離矩陣數(shù)據(jù)輸出文件outfile。第三步:選擇通過距離矩陣推測進化樹的算法(fitch.exe,kotsch.exe,neighbor.exe)。第四步:將剛獲得的輸出文件改名為infile,執(zhí)行選擇的推測算法(neighbor.exe)。設置好參數(shù)后執(zhí)行程序,獲得outfile和outtree兩個結(jié)果輸出。第77頁,講稿共113頁,2023年5月2日,星期三第78頁,講稿共113頁,2023年5月2日,星期三獲得的結(jié)果文件中,outtree文件是一個樹文件,可以用treeview等軟件打開。outfile是一個分析結(jié)果的輸出報告,包括了樹和其他一些分析報告,可以用記事本直接打開。outfileouttree第79頁,講稿共113頁,2023年5月2日,星期三加入統(tǒng)計分析(bootstrap)我們剛剛獲得的進化樹是純粹的根據(jù)先前獲得的排列數(shù)據(jù)所推導出來的。有很多可能使得這個樹并不一定可靠。1.測序的出錯。2.多序列比對算法本身的問題。3.其他的問題。我們可以引進一些統(tǒng)計分析來尋找更優(yōu)的進化樹最常見的就是bootstrap分析。第80頁,講稿共113頁,2023年5月2日,星期三Bootstrap分析Phylip軟件包中有兩個用于執(zhí)行bootstrap分析的程序。(seqboot.exe,consence.exe)。分析過程:1.Seqboot產(chǎn)生大量的數(shù)據(jù)組2.應用選擇的算法對產(chǎn)生的數(shù)據(jù)組進行分析。3.由consence獲得最優(yōu)樹。第81頁,講稿共113頁,2023年5月2日,星期三PAUP*的使用PAUP*的數(shù)據(jù)格式(Nexus)#NEXUSbegintaxa; dimensionsntax=12; taxlabelsLemur_catta …Tarsius_syrichta;end;begincharacters; dimensionsnchar=898; formatmissing=?gap=-matchchar=.interleavedatatype=dna; optionsgapmode=missing; matrixLemur_cattaAAGCTTCATAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCATCCATATTATTHomo_sapiensAAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTACATCCTCATTACTATTPanAAGCTTCACCGGCGCAATTATCCTCATAATCGCCCACGGACTTACATCCTCATTATTATTGorillaAAGCTTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATCATTATTATTPongoAAGCTTCACCGGCGCAACCACCCTCATGATTGCCCATGGACTCACATCCTCCCTACTGTTHylobatesAAGCTTTACAGGTGCAACCGTCCTCATAATCGCCCACGGACTAACCTCTTCCCTGCTATT第82頁,講稿共113頁,2023年5月2日,星期三beginassumptions; charsetcoding=2-457660-896; charsetnoncoding=1458-659897-898; charset1stpos=2-457\3660-896\3; charset2ndpos=3-457\3661-896\3; charset3rdpos=4-457\3662-.\3;

exsetcoding=noncoding; exsetnoncoding=coding;

usertype2_1=4 [weightstransversions2timestransitions] acgt [a] .212 [c]2.21 [g] 12.2 [t] 212. ; usertype3_1=4 [weightstransversions3timestransitions] acgt [a] .313 [c]3.31 [g] 13.3 [t] 313. ;

taxsethominoids=Homo_sapiensPanGorillaPongoHylobates;end;beginpaup; constraintsch=((Homo_sapiens,Pan)); constraintschg=((Homo_sapiens,Pan,Gorilla));end;第83頁,講稿共113頁,2023年5月2日,星期三PAUP*的數(shù)據(jù)格式(Nexus)主要包括taxa,characters,assumptions,sets,trees,codons,distances,paup八個數(shù)據(jù)塊。對于一個常規(guī)的分析,taxa,characters塊是必須的。而分析的命令可以通過菜單操作(mac),或者鍵盤命令(win,linux),也可以在nexus文件中加入paup命令塊第84頁,講稿共113頁,2023年5月2日,星期三1.TAXA塊主要是定義所分析的數(shù)據(jù)(如分子序列)個數(shù),以及這些數(shù)據(jù)的名稱(如物種名稱)。2.CHARACTERS塊主要是定義數(shù)據(jù)矩陣(如多序列比對結(jié)果)和其他一些相關(guān)的信息(如序列特征值,序列有效區(qū)域等)PAUP*的Nexus的文件塊第85頁,講稿共113頁,2023年5月2日,星期三3.ASSUMPTIONS塊定義了對數(shù)據(jù)的一些設定,如那些特征值是不需考慮的,怎么處理gap這個特征值等,用戶自定義的一些數(shù)據(jù)也放在這塊,如自定義的打分矩陣。4.SETS塊定義了一系列的數(shù)據(jù)組,如特征值組,物種組等,這些設置都是為了方便后續(xù)的分析。第86頁,講稿共113頁,2023年5月2日,星期三5.TREES塊定義了用戶自己設定的樹。用于后續(xù)的分析,如作為限制樹等。6.CODONS塊定義了遺傳密碼子的一些信息。如編碼的位置(哪些是編碼的,密碼子的位點等)。7.DISTANCES塊定義了一些距離矩陣。第87頁,講稿共113頁,2023年5月2日,星期三8.PAUP塊是軟件的核心塊,所有的分析命令和一些參數(shù)設置(90多個命令)都放在這一塊。這一塊并不是分析輸入數(shù)據(jù)所必須的,這些命令可以寫在這一塊(文件中),這時載入文件時就開始根據(jù)該塊的命令進行分析(有點類似dos的批處理過程)。當然也可以通過鍵盤命令逐一敲入,交互進行分析。

批處理的方式在分析過程比較長,耗時比較久的時候是比較有用的。當然在進行處理之前一定要先保證該批處理過程沒有問題。第88頁,講稿共113頁,2023年5月2日,星期三一個PAUP*的基本分析實例1.通過clustalw/clustalx獲取一個多序列比對結(jié)果(可能要經(jīng)過人工調(diào)整,推薦用bioedit做輔助編輯器)。保存成nexus格式的文件,或者用其他格式轉(zhuǎn)換軟件轉(zhuǎn)換成nexus格式。paup*中也有一個tonexus命令可以將其他格式(包括phylip,GCG等格式)的文件轉(zhuǎn)換為nexus格式的文件。第89頁,講稿共113頁,2023年5月2日,星期三2.在PAUP*程序中讀入數(shù)據(jù)(Nexus格式)輸入命令的地方打開文件的窗口程序自帶的測試數(shù)據(jù)執(zhí)行該文件還是編輯該文件?執(zhí)行文件時將文件數(shù)據(jù)讀入程序,編輯文件則調(diào)用一個文本編輯器。如果不是nexus格式,執(zhí)行時候會出錯,然后調(diào)用文本編輯器打開。第90頁,講稿共113頁,2023年5月2日,星期三3.數(shù)據(jù)輸入完成,開始分析…兩個很有用的命令

?:顯示所有的命令

命令?:顯示命令的所有參數(shù)第91頁,講稿共113頁,2023年5月2日,星期三分析…(開始一)1.開始之前打開記錄文件?(跟蹤整個分析過程)命令:logstartfile=your_log_file_name;停止:logstop;第92頁,講稿共113頁,2023年5月2日,星期三2.設置數(shù)據(jù)哪些用于分析?如:includecoding/only;excludecoding/only;哪些物種要分析(刪除不要的)?如:delete1;或者deletetaxa_name…undelete1;……分析…(開始二)第93頁,講稿共113頁,2023年5月2日,星期三3.確定建樹方法最大簡約法?最大似然法?距離法?命令:Setcriterion=parsimony|likelihood|distance;

分析…(建樹一)第94頁,講稿共113頁,2023年5月2日,星期三4.確定其他參數(shù)Set?查看其他參數(shù)的設置,改為自己所需要的設置。如:setmaxtree=10000increase=noautoclose=yes;分析…(建樹二)第95頁,講稿共113頁,2023年5月2日,星期三5.確定搜索方法(對于距離法不適用)窮盡法:alltrees分支跳躍查找:bandb啟發(fā)式搜索:hsearch

其他:puzzle(只在likelihood時有效)…分析…(建樹三)第96頁,講稿共113頁,2023年5月2日,星期三6.開始搜索樹之前(設置各個建樹方法的參數(shù))距離法:dset如:dsetdistance=tamneinegbrlen=allow最大簡約法:pset如psetcollapse=nogapmode=newstate最大似然法:lset如:lsetnst=6clock=yes分析…(建樹四)第97頁,講稿共113頁,2023年5月2日,星期三7.再次確認參數(shù)是否要設置外圍群(outgroup)?如outgroup1,2;或者outgrouptaxa_set;其他參數(shù)?分析…(建樹五)第98頁,講稿共113頁,2023年5月2日,星期三7.開始搜索樹距離法:NJ,UPGMA最大簡約法,最大似然法Hsearch?參數(shù)是否要更改?如:hsearchandseq=randomswap=spr分析…(建樹六)第99頁,講稿共113頁,2023年5月2日,星期三8.進化樹的評估選擇評估方法?Bootstrap(自展法)

用的最多,是對進化樹重新取樣的評估方法,可以對距離法,簡約法,似然法以及衍生出的任何其他方法構(gòu)建的進化樹進行評估。其分析結(jié)果是一組數(shù)字,這個數(shù)字描述了進化樹進化分支的支持比例,也就是進化樹分支的穩(wěn)健性。分析…(樹評估一)第100頁,講稿共113頁,2023年5月2日,星期三分析…(樹評估二)未經(jīng)過bootstrap的樹Bootstrap后的樹第101頁,講稿共113頁,2023年5月2日,星期三BOOTSTRAP[options][/heuristic-search-options|branch-and-bound-search-options];使用分支限制或者是啟發(fā)式搜索的方法進行bootstrap分析。參數(shù):?BSEED=integer-value隨機數(shù)種子。?NREPS=integer-valuebootstrap重復的次數(shù),默認值為100。?SEARCH=HEURISTIC|BANDB|FASTSTEP|NJ|UPGMA搜索方式?CONLEVEL=integer-valuebootstrap重復次數(shù)的最低比率,默認為50。?KEEPALL=YES|NO?WTS=IGNORE|SIMPLE|REPEATCNT|PROPORTIONAL?NCHAR=CURRENT|number-of-characters每次重復采樣的數(shù)目。?GRPFREQ=YES|NO顯示bootstrap分割頻率?TREEFILE=bootstrap-tree-file-name樹的文件?FORMAT=NEXUS|ALTNEXUS|FREQPARS|PHYLIP|HENNIG?BRLENS=YES|NO分支的長度?*REPLACE=YES|NO?CUTOFFPCT=integer-value定義顯示的最低bootstrap分割頻率。Examplebootstrapnreps=200treefile=boot.tresearch=heuristic/addseq=random;分析…(樹評估三)PAUP*中的bootstrap命令第102頁,講稿共113頁,2023年5月2日,星期三對折分析(jackknife)跟bootstrap類似,只是在對原始數(shù)據(jù)取樣的時候不會取重復的數(shù)據(jù)位點。因為它重復取樣的時候是在原始數(shù)據(jù)中除去一個或者多個比對位點。

對折分析得出的結(jié)果和bootstrap是一樣的。命令和參數(shù)都類似,用的比bootstrap少很多。分析…(樹評估四)第103頁,講稿共113頁,2023年5月2日,星期三JACKKNIFE[options][/heuristic-search-options|branchand-bound-search-options];對折分析?PCTDELETE=real-value每個對折分析循環(huán)中刪除的dataset百分數(shù)?JSEED=integer-value隨機數(shù)種子?NREPS=integer-value對折循環(huán)次數(shù)?SEARCH=HEURISTIC|BANDB|FASTSTEP|NJ|UPGMA樹的搜索方法(NJ和UPGMA僅在最優(yōu)規(guī)則為distance時才可用)?RESAMPLE=NORMAL|JAC?CONLEVEL=integer-valueboostrap中出現(xiàn)的最小比例(最為保留group),默認為50,即50%?KEEPALL=YES|NO低于conle

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論