第三章 BLAST與序列特征分析_第1頁
第三章 BLAST與序列特征分析_第2頁
第三章 BLAST與序列特征分析_第3頁
第三章 BLAST與序列特征分析_第4頁
第三章 BLAST與序列特征分析_第5頁
已閱讀5頁,還剩59頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章 BLAST與序列比對 上機they are not extrapolated from comparisons of closely related proteins. 進行比對的數(shù)據(jù)庫進行比對的數(shù)據(jù)庫 圖形化結(jié)果圖形化結(jié)果 E值(值(E-value)表示僅僅因為隨機性造成獲得這一)表示僅僅因為隨機性造成獲得這一 比對結(jié)果的可能性。這一數(shù)值比對結(jié)果的可能性。這一數(shù)值 越接近零,發(fā)生這一事件的可能性越小。越接近零,發(fā)生這一事件的可能性越小。 上機實習(xí)1:網(wǎng)上運行blastx和blastn (NCBIblast網(wǎng)址:/BLAST/) le

2、sson.seq.screen.Contig34 TTTTTTTTTTTTTTTTTAGTGCCAGTTTTTTTTTTTATTTGTAAAGCTCTGCCATAAACTTCTAGCGTGTGCCAATGGTCACCTGCCACACTCGCACCA GGTTGTCCGTGTAGCCAGCAAACAGAGTCTGGCCATCAGCAGACCAGGCCAGGGAGGTGCACTGGGGTGGTTCTGCCTTGCTGCTGGTACTGATAACTT CTTGCTTCAGTTCATCTACAATGATCTTTCCCTCTAAATCCCAGATCTTGATGCTGGGGCCTGTGGAGCACACAG

3、CCAGTAGCGGTTAGGGCTGAAGCA CAGGGCGTTGATGATGTCCCCACCATCTAGCGTGTAAAGGTGTTTGCCTTCGTTGAGATCCCATAACATGGCCTGGCCATCCTTGCCTCCAGAAGCACA GAGGGATCCATCTGGAGAGACAGTCACCGTGTTCAGATAGCCTGTGTGGCCAATGTGGTTGGTCTTCAGCTTGCAGTTAGCCAGGTTCCATACCTTGAC CAGCTTGTCCCAGCCACAGGAGACGATGATAGGGTTGCTGCTGTTGGGCGAGAAGCGGACACAAGACACCCACTC

4、TGAGTGGCTCTCATCCTGGACAGT GTATTTGCACACACCCAGGGTATTCCATAGCTTGATGGTTTTATCTCGAGATCCAGAGACAATCTGCCGGTTGTCAGAGGAGAAGGCCACACTCAGCAC ATCCTTGGTATGGCCCACAAATCGCCTCGTGGTGGTGCCCGTTGTGAGATCCCAGAAGGCGCAGGGTTCCATCCCAGGAGCCTGAGAGGGCAAACTGGC CATCTGAGGAGATAACCACATCACTAACAAAGTGGGAGTGACCCCGCAGAGCACGCTGTGGAATTCCATAGTTGG

5、TCTCATCCCTGGTCAGTTTCCACA TGATGATGGTCTTATCTCGAGAGGCGGAGAGGATCATGTCCGGGAACTGCGGGGTAGTAGCGATCTGGGTTACCCAGCCGTTGTGGCCCTTGAGGGTGC CACGAAGGGTCATCTGCTCAGTCATGGCGGCGGCGAGAGCGTGTTCGCTGCAGCGACGAGGATGGCACTGGATGGCTTAGAGAAACTAGCACCACAGTC GACC 1.對contig34進行網(wǎng)上blastn(演示), 2.blastx(自行操作)比對 本地運行BLAST 下載NCBI上blast程序:

6、/blast/executables/release / 安裝(安裝到C:) 數(shù)據(jù)庫的格式化(makeblastdb) 程序運行 (blastn/blastp/blastx/tblastn/tblastx) l登陸NCBI的FTP下載blast程序 l本地數(shù)據(jù)庫的構(gòu)建 l查看db文件 由由fasta格式的序列組成格式的序列組成 數(shù)據(jù)庫的格式化 makeblastdb命令用于數(shù)據(jù)庫的格式化: makeblastdb常用參數(shù) -in database_name 需要格式化的數(shù)據(jù)庫名稱 -dbtype nucl/prot 待格式化數(shù)據(jù)庫的序列類型 (核苷酸選n

7、ucl;蛋白質(zhì)選prot) 例:makeblastdb -in db -dbtype prot 對對蛋白質(zhì)蛋白質(zhì)數(shù)據(jù)庫數(shù)據(jù)庫“db”進行格式化進行格式化 程序運行 localblast包含五個blast子程序: blast option1 option2 option3 *可在dos下輸入各個blast查看各個參數(shù)的意義及使用 三個必需參數(shù) -db database_name,數(shù)據(jù)庫名稱,比對完成格式化的數(shù)據(jù)庫; -query input_file,搜索文件名稱; -out output_file,BLAST結(jié)果文件名稱; 兩個常用參數(shù) -evalue expectation,期待值,默認值為

8、10.0,可采用科學(xué)計數(shù)法來 表示,如1e-5; -outfmt 比對顯示選項,其具體的說明可以用以下的比對實例說明 例:blastx -db db -query in -out out -evalue 2e-5 -outfmt 7 (表格顯 示比對結(jié)果) 采用blastx程序,將in中的序列到數(shù)據(jù)庫db中進行比對,結(jié)果以表 格形式輸入到out文件 上機實習(xí):本地運行blastx 進入DOS命令行提示符狀態(tài)(“運行”cmd db“makeblastdb -in db -dbtype prot” blastx “blastx -query in -db db -out out -evalue 1

9、e-5 -outfmt 7 ” 察看結(jié)果“more out ”或在 windows下雙擊打開 Blast程序程序 序列輸入序列輸入 數(shù)據(jù)庫數(shù)據(jù)庫 結(jié)果輸出結(jié)果輸出 因為我的程序安裝在因為我的程序安裝在D盤盤copy文件夾中的文件夾中的 bin文件夾中文件夾中 輸入輸入“d:” -回車回車 #到到D盤盤 輸入輸入”cd copy” -回車回車 #到到copy文件夾文件夾 cd bin -回車回車 #到到bin文件夾文件夾 dir #顯示文件夾內(nèi)容顯示文件夾內(nèi)容 輸入輸入“dir”-回車回車 察看察看bin文件夾下內(nèi)容文件夾下內(nèi)容 bin文件夾下包含文件夾下包含 以以.exe為后綴的程序文為后綴的

10、程序文 件以及這次實習(xí)需要件以及這次實習(xí)需要 用到的數(shù)據(jù)可文件用到的數(shù)據(jù)可文件“bd” 和目標序列文件和目標序列文件“in” 輸入輸入“more db.fas”-回車察看回車察看db文件內(nèi)容文件內(nèi)容 空格鍵翻頁 輸入“q”跳出 輸入輸入“makeblastdb in db.fas dbtype prot”-回車回車 對對db數(shù)據(jù)庫進行格式化數(shù)據(jù)庫進行格式化 輸入輸入“dir”-回車回車 察看察看bin文件夾下內(nèi)容文件夾下內(nèi)容 格式化以后產(chǎn)生的文件格式化以后產(chǎn)生的文件 輸入輸入“blastx -query in.txt -db db.txt -out out.txt -evalue 1e-5 -

11、outfmt 7” -回車回車 運行運行blastx程序程序 產(chǎn)生的結(jié)果文件產(chǎn)生的結(jié)果文件“out” 用用”more out” 察看結(jié)果文件察看結(jié)果文件 選擇選擇outfmt參數(shù)時參數(shù)時 比對結(jié)果顯示序列兩兩比對比對結(jié)果顯示序列兩兩比對 用用”more out” 察看結(jié)果文件察看結(jié)果文件 多序列比對的目的 從物種的一些分子特性出發(fā),從而了解 物種之間的生物系統(tǒng)發(fā)生的關(guān)系。 通過序列同源性的比較進而了解基因的 進化以及生物系統(tǒng)發(fā)生的內(nèi)在規(guī)律。 多序列比對的應(yīng)用:多序列比對的應(yīng)用: 系統(tǒng)發(fā)育分析系統(tǒng)發(fā)育分析(phylogenetic analysis)(phylogenetic analysis)

12、 結(jié)構(gòu)預(yù)測結(jié)構(gòu)預(yù)測(structure prediction)(structure prediction) 序列基序鑒定序列基序鑒定(sequence motif (sequence motif identification)identification) 功能預(yù)測功能預(yù)測(function prediction)(function prediction) ClustalW/ClustalXClustalW/ClustalX:一種全局的多序列比對程:一種全局的多序列比對程 序,可以用來繪制親緣樹,分析進化關(guān)系。序,可以用來繪制親緣樹,分析進化關(guān)系。 BioeditBioedit MuscleM

13、uscle MafftMafft ClustalW/XClustalW/X的運行的運行 本地運行本地運行 命令行操作的命令行操作的ClustalClustalW W 窗口化操作的窗口化操作的ClustalXClustalX 下載頁面:下載頁面:ftp:/ftp.ebi.ac.uk/pub/software/ 歐洲生物學(xué)中心(歐洲生物學(xué)中心(EBI)還提供了)還提供了Clustal W的網(wǎng)上運行服的網(wǎng)上運行服 務(wù)務(wù)(httphttp:/www.ebi.ac.uk/clustalw):/www.ebi.ac.uk/clustalw) 目標序列目標序列 各種參數(shù)設(shè)定各種參數(shù)設(shè)定 下載下載Clusta

14、lX Jalview 結(jié)果下載結(jié)果下載 上機實習(xí)3:本地運行 ClustalX dmrt1.fasta 多序列比對 (Multiple Alignment) 在文件夾下在文件夾下,找到,找到clustalx.exe 雙擊打開雙擊打開 Clustalx窗口窗口 點擊點擊File下拉菜單中下拉菜單中 Load sequences選項選項, 打開序列文件打開序列文件dmrt1.txt 打開后的界面打開后的界面 點擊進行多序列比對點擊進行多序列比對 可在可在Alignment下拉菜單中的下拉菜單中的Alignment Parameters中設(shè)定各個參數(shù)中設(shè)定各個參數(shù) 點擊點擊Alignment下拉菜單中的下拉菜單中的Do Complete Alignment進行比對進行比對 選擇選擇OK進行比對進行比對 比對結(jié)果比對結(jié)果 “*”、“:”、“.” 和空格依次代表改位點的序列一致性由高到低和空格依次代表改位點的序列一致性由高到低 Bioedit的使用 打開序列文件 基本界面 比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論