構(gòu)建系統(tǒng)進(jìn)化樹(shù)的詳細(xì)步驟_第1頁(yè)
構(gòu)建系統(tǒng)進(jìn)化樹(shù)的詳細(xì)步驟_第2頁(yè)
構(gòu)建系統(tǒng)進(jìn)化樹(shù)的詳細(xì)步驟_第3頁(yè)
構(gòu)建系統(tǒng)進(jìn)化樹(shù)的詳細(xì)步驟_第4頁(yè)
構(gòu)建系統(tǒng)進(jìn)化樹(shù)的詳細(xì)步驟_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

#/12構(gòu)建系統(tǒng)進(jìn)化樹(shù)的詳細(xì)步驟1.建樹(shù)前的準(zhǔn)備工作1.1相似序列的獲得——BLASTBLAST是目前常用的數(shù)據(jù)庫(kù)搜索程序,它是BasicLocalAlignmentSearchTool的縮寫(xiě),意矚慫潤(rùn)厲釤瘞睞櫪廡賴(lài)賃軔朧。為“基本局部相似性比對(duì)搜索工具"(Altschuletal.,1990[62];1997[63])。國(guó)際著名生物信息中心聞創(chuàng)溝燴鐺險(xiǎn)愛(ài)氌譴凈禍測(cè)樅。都提供基于Web的BLAST服務(wù)器。BLAST算法的基本思路是首先找出檢測(cè)序列和目標(biāo)序列之間相似性程度最高的片段,并作為內(nèi)核向兩端延伸,以找出盡可能長(zhǎng)的相似序列片段。首先登錄到提供BLAST服務(wù)的常用網(wǎng)站,比如國(guó)內(nèi)的CBI、美國(guó)的NCBI、歐洲的EBI和日本的DDBJ。這些網(wǎng)站提供的BLAST服務(wù)在界面上差不多,但所用的程序有所差異。它們都有一個(gè)大的文本框,用于粘貼需要搜索的序列。把序列以FASTA格式(即第一行為說(shuō)明行,以“>”符號(hào)開(kāi)始,后面是序列的名稱(chēng)、說(shuō)明等,其中“>”是必需的,名稱(chēng)及說(shuō)明等可以是任意形式,換行之后是序列)粘貼到那個(gè)大的文本框,選擇合適的BLAST程序和數(shù)據(jù)庫(kù),就可以開(kāi)始搜索了。如果是DNA序列,一般選擇BLASTN搜索DNA數(shù)據(jù)庫(kù)。這里以NCBI為例。登錄NCBI主頁(yè)-點(diǎn)擊BLAST-點(diǎn)擊Nucleotide-nucleotideBLAST(blastn)-在Search文本框中粘貼檢測(cè)序列-點(diǎn)擊BLAST!-點(diǎn)擊Format-得至UresultofBLASTo殘騖樓諍錈瀨濟(jì)溆塹籟婭驟東。BLASTN結(jié)果如何分析(參數(shù)意義):>gi|28171832|gb|AY155203.1|Nocardiasp.ATCC4987216SribosomalRNAgene,complete釅錒極額閉鎮(zhèn)檜豬訣錐顧葒鈀,sequenceScore=2020bits(1019),Expect=0.0Identities=1382/1497(92%),Gaps=8/1497(0%)Strand=Plus/Plus彈貿(mào)Query:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt60謀蕎||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt58廈礴Query:61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc120煢|||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct:59acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc118鵝Score:指的是提交的序列和搜索出的序列之間的分值,越高說(shuō)明越相似;Expect:比對(duì)的期望值。比對(duì)越好,expect越小,一般在核酸層次的比對(duì),expect小于1e-10,籟叢媽羥為贍僨蟶練淨(jìng)櫧撻曉。就比對(duì)很好了,多數(shù)情況下為0;Identities:提交的序列和參比序列的相似性,如上所指為1497個(gè)核苷酸中二者有1382個(gè)相同;Gaps:—般翻譯成空位,指的是對(duì)不上的堿基數(shù)目;Strand:鏈的方向,Plus/Minus意味著提交的序列和參比序列是反向互補(bǔ)的,如果是Plus/預(yù)頌圣鉉儐歲齦訝驊糴買(mǎi)闥齙。Plus則二者皆為正向。1.2序列格式:FASTA格式由于EMBL和GenBank數(shù)據(jù)格式較為復(fù)雜,所以為了分析方便也出現(xiàn)了十分簡(jiǎn)單的FASTA數(shù)據(jù)格式。FASTA格式又稱(chēng)為Pearson格式,該種序列格式要求序列的標(biāo)題行以大于號(hào)“>”開(kāi)頭,下—行起為具體的序列?!憬ㄗh每行的字符數(shù)不超過(guò)60或80個(gè),以方便程序處理。多條核酸和蛋白質(zhì)序列格式即將該格式連續(xù)列出即可,如下所示:>E.coli1aaattgaagagtttgatcatggctcagattgaacgctggcggcaggcctaacacatgcaa滲61gtcgaacggtaacaggaagaagcttgcttctttgctgacgagtggcggac……鐃誅臥瀉噦>AY631071JiangellagansuensisYIM0021gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt擁締鳳襪備訊顎輪爛薔報(bào)贏無(wú)。61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc其中的?>為ClustalX默認(rèn)的序列輸入格式,必不可少。其后可以是種屬名稱(chēng),也可以是序列在Genbank中的登錄號(hào)(AccessionNo.),自編號(hào)也可以,不過(guò)需要注意名字不能太長(zhǎng),一般由英文字母和數(shù)字組成,開(kāi)首幾個(gè)字母最好不要相同,因?yàn)橛袝r(shí)ClustalX程序只默認(rèn)前幾位為該序列名稱(chēng)。回車(chē)換行后是序列。將檢測(cè)序列和搜索到的同源序列以FASTA格式編輯成為一個(gè)文本文件(例:C:\temp\jc.txt),即可導(dǎo)入ClustalX等程序進(jìn)行比對(duì)建樹(shù)。2.構(gòu)建系統(tǒng)樹(shù)的相關(guān)軟件和操作步驟壇摶鄉(xiāng)囂懺蔞鍥鈴氈淚躋馱釣。構(gòu)建進(jìn)化樹(shù)的主要步驟是比對(duì),建立取代模型,建立進(jìn)化樹(shù)以及進(jìn)化樹(shù)評(píng)估。鑒于以上對(duì)于構(gòu)建系統(tǒng)樹(shù)的評(píng)價(jià),結(jié)合本實(shí)驗(yàn)室實(shí)際情況,以下主要介紹N-JTree構(gòu)建的相關(guān)軟件和操作步驟。蠟變黲癟報(bào)倀鉉錨鈰贅籜葦繯。2.1用ClustalX構(gòu)建N-J系統(tǒng)樹(shù)的過(guò)程⑴打開(kāi)ClustalX程序,載入源文件.File-Loadsequences-C:\temp\jc.txt.(2)序列比對(duì)Alignment-Outputformatoptions-?Clustalformat;CLUSTALWsequencenumbers:ON買(mǎi)鯛鴯譖曇膚遙閆擷凄屆嬌擻。Alignment-Docompletealignment(OutputGuideTreefile,C:\temp\jc.dnd;OutputAlignmentfile,C:\temp\jc.aln;)Align?waiting等待時(shí)間與序列長(zhǎng)度、數(shù)量以及計(jì)算機(jī)配置有關(guān)。掐頭去尾File-SaveSequenceas...Format:?CLUSTALGDEoutputcase:LowerCLUSTALWsequencenumbers:ONSavefromresidue:39to1504(以前后最短序列為準(zhǔn))Savesequenceas:C:\temp\jc-a.alnOK將開(kāi)始和末尾處長(zhǎng)短不同的序列剪切整齊。這里,因?yàn)闇y(cè)序引物不盡相同,所以比對(duì)后序列參差不齊。一般來(lái)說(shuō),要“掐頭去尾”,以避免因序列前后參差不齊而增加序列間的差異。剪切后的文件存為ALN格式。File-Loadsequences-Replaceexistingsequences?-Yes-C:\temp\jc-a.aln重新載入剪切后的序列。Trees-OutputFormatOptionsOutputFiles:?CLUSTALformattree?Phylipformattree?PhylipdistancematrixBootstraplabelson:NODE鍬籟CLOSETrees-ExcludepositionswithgapsTrees-BootstrapN-JTree:構(gòu)氽頑黌碩飩薺齦話(huà)騖Randomnumbergeneratorseed(1-1000):111Numberofbootstraptrails(1-1000):1000SAVECLUSTALTREEAS:C:\temp\jc-a.njbSAVEPHYLIPTREEAS:C:\temp\jc-a.njbphbOK?waiting輒峰陽(yáng)檉籪癤網(wǎng)儂號(hào)澩蠐鑭釃等待時(shí)間與序列長(zhǎng)度、數(shù)量以及計(jì)算機(jī)配置有關(guān)。在此過(guò)程中,生成進(jìn)化樹(shù)文件*.njbphb,可以用TreeView打開(kāi)查看。堯側(cè)閆繭絳闕絢勵(lì)蜆贅瀝紕縭。Trees-DrawN-JTreesSAVECLUSTALTREEAS:C:\temp\jc-a.njSAVEPHYLIPTREEAS:C:\temp\jc-a.njphSAVEDISTANCEMATRIXAS:C:\temp\jc-a.njphdstOK識(shí)饒鎂錕縊灩筧嚌此過(guò)程中生成的報(bào)告文件*.nj比較有用,里面列出了比對(duì)序列兩兩之間的相似度,以及轉(zhuǎn)換和顛換分別各占多少。凍鈹鋨勞臘鍇癇婦脛糴鈹賄鶚。TreeViewFile-Open-C:\temp\jc-a.njbphbTree-phylogram(unrooted,slantedcladogram,Rectangularcladogram多種樹(shù)型)Tree-Showinternaledgelabels(Bootstrapvalue)(顯示數(shù)值)恥諤銪滅Tree-Defineoutgroup...?ingroup>>outgroup?OK(定義外群)鯊腎鑰詘褳鉀溈Tree-Rootwithoutgroup通常需要對(duì)進(jìn)化樹(shù)進(jìn)行編輯,這時(shí)首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再進(jìn)行圖片編輯。如果直接Copy至Word則顯示亂碼,而進(jìn)化樹(shù)不能正確顯示。2.2Mega建樹(shù)碩癘鄴頏謅攆檸攜驤蘞鷥膠據(jù)。雖然ClustalX可以構(gòu)建系統(tǒng)樹(shù),但是結(jié)果比較粗放,現(xiàn)在一般很少用它構(gòu)樹(shù),Mega因?yàn)椴僮骱?jiǎn)單,結(jié)果美觀,很多研究者選擇用它來(lái)建樹(shù)。閿擻輳嬪諫遷擇楨秘騖輛⑴首先用ClustalX進(jìn)行序列比對(duì),剪切后生成C:\temp\jc-a.aln文件;(同上)⑵打開(kāi)BioEdit程序,將目標(biāo)文件格式轉(zhuǎn)化為FASTA格式,氬嚕躑竄貿(mào)懇彈濾頷漿紛釓鄧.File-Open-C:\temp\jc-a.aln,F(xiàn)ile-SaveAs-C:\temp\jc-b.fas;⑶打開(kāi)Mega程序,轉(zhuǎn)化為mega格式并激活目標(biāo)文件,F(xiàn)ile-ConvertToMEGAFormat-C:\temp\jc-b.fas?C:\temp\jc-b.meg,釷鵒關(guān)閉TextEditor窗口-(Doyouwanttosaveyourchangesbeforeclosing?-Yes);Clickmetoactivateadatafile-C:\temp\jc-b.meg-OK-慫闡譜鯪逕導(dǎo)嘯畫(huà)長(zhǎng)涼(Protein-codingnucleotidesequencedata?-No);Phylogeny-Neighbor-Joining(NJ)DistanceOptions-Models-Nucleotide:Kimura2-parameter;諺辭調(diào)擔(dān)鈧諂動(dòng)禪瀉類(lèi)?d:Transitions+Transversions;IncludeSites-?PairwiseDeletionTestofPhylogeny-?Bootstrap;Replications1000;RandomSeed64238嘰覲OK;開(kāi)始計(jì)算,得到結(jié)果;(4)Image-CopytoClipboard-粘貼至Word文檔進(jìn)行編輯。此外,Subtree中提供了多個(gè)命令可以對(duì)生成的進(jìn)化樹(shù)進(jìn)行編輯,Mega窗口左側(cè)提供了很多快捷鍵方便使用;View中則給出了多個(gè)樹(shù)型的模式。下面只介紹幾種最常用的:Subtree-Swap:任意相鄰兩個(gè)分支互換位置;熒紿譏鉦鏌觶鷹緇機(jī)庫(kù)圓鍰緘。-Flip:所選分支翻轉(zhuǎn)180度-Compress/Expand:合并/展開(kāi)多個(gè)分支;-Root:定義外群;View-Topology:只顯示樹(shù)的拓扌卜結(jié)構(gòu);-Tree/BranchStyle:多種樹(shù)型轉(zhuǎn)換;-Options:關(guān)于樹(shù)的諸多方面的改動(dòng)。2.3TREECON打開(kāi)ClustalX,File-Loadsequences-jc-a.aln,File-SaveSequenceas...(Format-PHYLIP;Savefromresidue-1to末尾尾;Savesequenceas:C:\temp\jc.phy);鶼漬螻偉閱劍鯫腎邏蘞闋簣擇。打開(kāi)TREECON程序,Distanceestimation點(diǎn)擊Distanceestimation-Startdistanceestimation,打開(kāi)上面保存的jc.phy文件,SequenceType-NuleicAcidSequence,Sequenceformat-PHYLIPinterleaved,SelectALL,OK;DistanceEstimation-Jukes&Cantor(orKimura),Alignmentpositions-All,Bootstrapanalysis-Yes,Insertions&Deletions-Nottakenintoaccount,OK;紂憂(yōu)蔣氳頑薟驅(qū)藥憫騖覲僨鴛。Bootstrapsamples-1000,OK;運(yùn)算,等待Finished-OK。Infertreetopology點(diǎn)擊Infertreetopology-Startinferringtreetopology,Method-Neighbor-joining,Bootstrap穎芻莖蛺餑億頓裊賠瀧漲負(fù)這。analysis-Yes,OK.;運(yùn)算,等待Finished-OK。Rootunrootedtrees點(diǎn)擊Rootunrootedtrees-Startrootingunrootedtrees,Outgroupopition-singl

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論