生物信息學(xué)概論的案例1ppt課件_第1頁
生物信息學(xué)概論的案例1ppt課件_第2頁
生物信息學(xué)概論的案例1ppt課件_第3頁
生物信息學(xué)概論的案例1ppt課件_第4頁
生物信息學(xué)概論的案例1ppt課件_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Biological Sequence Analysis 周杰 王莉Contents DB Searching the Blast family, pattern hunter, blat, etc. Sequence Alignment Clustalx, Tcoffee, mafft, ProsCons, etc. Sequence Pattern Analysis Sequence Logo, Codon Usage, etc. Protein Sequence Analysis ORF,funcntion,regulato

2、ry,strucuture,interaction,etc Phylogenetic analysis MEGA, PAUP, Phylip, Mrbayes, etc.Google ScholarEntrezBLASTSeedingMegaBlast 快速尋找高度相似的序列 主要特點(diǎn): 比BLAST快數(shù)百倍 Large Word size Greedy algorithm輸入輸出格式 所有類blast程序都接受fasta格式序列文件 所有類blast程序都輸出類似blast的結(jié)果文件。Fasta格式 seq1 CGGCGCTAGCATCGTACACGATCGACACACTGACATCGACA

3、CTAGCTAGCGATCGATCGATCGATGCTACTGACTGACTGATGCTGAC seq2 GATCGATCAGCACGAGCAGCAGCACGACTACTATGCAGTCGATCGTAGCTGACGTACTGATGCAGTCTGACTGATCGTAGCTACGACTACACTACGATC各種序列格式及轉(zhuǎn)換READSEQREADSEQ!Sequence Alignment Software ClustalX (Windows) Tcoffee Mafft Proscons MUSCLE MAUVE, LAGAN, etc (Genome alignment) Progressiv

4、e AlignmentComparison CLUSTAL WIN/UNIX下圖形界面,使用最廣泛,適合短和不太多的序列。 Tcoffee 比CLUSTAL略精確一些,慢,不常用 Mafft 精度可調(diào),較多500-10000條或較長序列5k-5000k aa/nt都可使用,UNIX下命令行界面。 Porscons 目前為止最為精確的對(duì)位軟件,慢,UNIX下命令行界面。 MUSCLE 快,可對(duì)較長或較多的序列,WIM/UNIX下命令行界面。Why CLUSTALW?輸入輸出格式 所有序列對(duì)位程序都接受fasta格式序列文件 所有序列對(duì)位程序都輸出fasta格式結(jié)果文件或者類似clustalw格式

5、的結(jié)果文件。Genome Alignment Tools MUMmer (2019) LAGAN, M-LAGAN (2019) MAUVE (2019) Rearrangement and InversionMAUVE序列模式分析 Sequence Logo Many othersProtein Sequence Analysis ORF Function Prediction 2nd, 3rd structural prediction、comparison Protein interaction predicion ORFORF Finder (demo)功能預(yù)測 第一步: databa

6、se search Blast然后嘗試搜索各個(gè)數(shù)據(jù)庫 找到最接近的蛋白,尋找它的注釋和功能信息MPSS/mpss/Structure Prediction二級(jí)結(jié)構(gòu)預(yù)測Tertiary Structure Predictionrussell.embl-heidelberg.de/gtsp/flowchart2.htmlProtein Structural ComparisonProtein Interaction Prediction 用蛋白序列搜索各大相互作用數(shù)據(jù)庫 BIND, STRING, DIPPhylogenetic Analysis PHYLIP MEGA Tree

7、View PAUP* MrBayes PAML PHYML /phylip/software.htmlPhylipJoe Felsenstein “No Thanks to”特點(diǎn) 發(fā)布早,使用非常廣泛 命令行driven 能夠處理各種類型的數(shù)據(jù) 包括除Bayesian之外的幾乎所有方法 模塊化 可批量處理Flowchart文件格式 輸入均為PHYLIP格式 輸出進(jìn)化樹文件為newick格式(1,2),3),4);(1:1.0,2:2.0):1.0,3:2.0):1.0,4:1.0);MEGADemo timeTreeViewPA

8、UP* By David Swoffold 特點(diǎn) 包括幾乎所有構(gòu)樹方法 Bayes方法,蛋白序列的ML方法除外 在Mac上有良好的圖形界面 MP方法有非常完善的參數(shù)設(shè)定及選項(xiàng),MP樹的最佳選擇 ML方法也比較完善結(jié)合Modeltest) 靈活的分析流程及參數(shù)設(shè)定,適合各種要求 100$文件格式 輸入文件 NEXUS 輸出文件 NEXUS, newickNEXUS format#NEXUSBEGIN DATA;dimensions ntax=5 nchar=664;format missing=?symbols=ABCDEFGHIKLMNPQRSTUVWXYZinterleave datatyp

9、e=DNA gap= -;matrixO.lichuanensis TGAAACTTTGGCTCTTTTTTAGGCATCTGCTTGGTCGCCCAO.rhodostigmatus TGAAACTTTGGCTCTCTTCTAGGCATCTGCCTAATTACCCAO.popei TGAAATTTTGGTTCTCTTCTTGGCATCTGCTTAGCCACCCAS.chintingenis TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCAS.boulengeri TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCA;End;PAU

10、P*批處理腳本示例#nexusbegin PAUP;log file=hsearchl.log;set autoclose=yes;hsearch start=stepwise addseq=randomn reps=100 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes;savetrees file=hsearch1.all.tre;filter best=yes permdel=yes;savetrees file=hsearch1.best.tre;log stop;end; MacClade

11、By the Maddison brothersMrbayes By John Huelsenbeck & Fredrik RonquistFeatures of Bayesian Method Handles complex models with many parameters Based on likelihood, statistically consistent Faster than ML method,can handle 50 taxon phylogeny Combine multiple types of data (DNA, protein,morphology, etc)文件格式 只接受NEXUS格式 只輸出NEXUS格式用處 用來輸入和編輯數(shù)據(jù),生成NEXUS格式文件,供PAUP,MrBayes等程序使用 圖形化顯示和編輯進(jìn)化樹 性狀進(jìn)化分析 祖先性狀重建PA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論