新版blast本地化構(gòu)建+數(shù)據(jù)庫下載+序列間的相似性檢索_第1頁
新版blast本地化構(gòu)建+數(shù)據(jù)庫下載+序列間的相似性檢索_第2頁
新版blast本地化構(gòu)建+數(shù)據(jù)庫下載+序列間的相似性檢索_第3頁
新版blast本地化構(gòu)建+數(shù)據(jù)庫下載+序列間的相似性檢索_第4頁
新版blast本地化構(gòu)建+數(shù)據(jù)庫下載+序列間的相似性檢索_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、新版blast本地化構(gòu)建+數(shù)據(jù)庫下載+序列間的相似性檢索Ethn obota ny前面記錄了 blast-2.2.23-ia32-win32的本地化構(gòu)建及相似性檢索,NCBI新近對blast程序做了一些修改推出了 blast+,這里結(jié)合網(wǎng)上資料、 blast+的user manual對blast+的本地化構(gòu) 建及使用作一引薦。1blast+的本地化構(gòu)建鏈接到:ftp:/ftp. ncbi. nlm.n /blast/executables/blast+/LATEST下載ncbi-blast-2.2.23+-ia32-win32.tar.gz (綠色版),解壓到d盤,并將文件夾更名為

2、 blast (我 習慣這樣做,因為在 dos中寫命令時方便),這樣就安裝完畢了, blast下具2個文件即bin 和 doc。2數(shù)據(jù)庫下載2.1法1:直接從NCBI下載subject序列去掉txt的擴展名做成數(shù)據(jù)庫即*db,然后將query 序列的txt擴展名掉做成查詢文件*in。(格式必須是fasta,名字可以自己隨便命名)2.2法2:從NCBI中的ftp庫下載所需要的某一個庫或幾個庫,其鏈接為ftp:/ftp .n cbi. nlm.n /blast/db/2.3法3 :利用新版blast自帶的update_blastdb.pl進行下載,這需要安裝perl程序。2.3.1 p

3、erl程序的下載和安裝可google "Perl for Windows ”獲得,也可直接按此連接 下載并,安裝到任何盤均可。2.3.2 運行 update_blastdb.pl 進行下載開始 運行cmd+確認進入dos系統(tǒng) 輸入以下命令打開bin文件夾。斑命令提示符hinvnsnffr Windnus XPR.1.2AHR1<C> 版權(quán)所有 1985-2001 Microsoft Co®= Docunent0 andtingsAdminis= tt):>cd blastbin 0): blastbin>接著輸入下述命令回

4、車查看操作幫助(這一步可以不做,不妨礙后續(xù)操作)P: blaatbln>pei*l update Jslastdb.pl還可輸入下述命令回車查看NCBI中的庫(無需登錄NCBI你就可以看到你所需要的庫)17 -V- J.I I ZD:XblastXbin>pevl update_blastdb.pl 一一showperl以下載載體庫(vector)為例演示如何下載庫。輸入如下命令回車即可。直到后面出現(xiàn) done即表示已經(jīng)下載完畢。如果下載其他數(shù)據(jù)庫,你就可以在上面的 update_blastdb.pl后面的vector換成其它數(shù)據(jù)庫的名字即可。再做本地b

5、last時即可以你下載的壓縮文件名代替你bin中*db數(shù)據(jù)庫,進行搜索。上述三種方法各有優(yōu)缺點,前兩種下載速度較快,但是每次進行檢索都需要對數(shù)據(jù)庫進行格式化(轉(zhuǎn)化成二進制數(shù)據(jù)),第三種方法下載速度較慢,但是是NCBI中已經(jīng)格式化好的,在進行本地檢索時不需再進行格式化,直接用即可。3序列間的相似性檢索以人的BCL2-like mRNA檢索人類的mRNA庫為例介紹核酸序列的本地檢索。3.1下載人類的mRNA數(shù)據(jù)庫(只能用后 2種方法的其中一種),這里用ftp下載,速度較快, 其鏈接為 /refseq/H_sapiens/mRNA_Prot/human.rn

6、a.fna.gz解壓后置于blast的bin文件夾下。3.2去NCBI下載BCL2-like的mRNA序列,其登錄號為 NM_207002.2用作你做該實驗的 query序列,將該序列置于 bin中命名為human,并去掉擴展名。3.3格式化數(shù)據(jù)庫開始運行cmd+確認 進入dos系統(tǒng) 輸入以下命令打開 bin文件夾。環(huán)命令提示符hinvnsnffr Windnus XPR.1.2AHR1<C> 版權(quán)所有 1985-2001 Microsoft Corp.C:Documents and SettingsAdministratop>d:D:>cd blastbinD:bla

7、stbin>輸入以下命令對數(shù)據(jù)庫進行格式化。1: blast Xbin>makeblastdb-exe -in human . rna. f na -parse_seqids -liash_index -dbtype nucl-in參數(shù)后面接將要格式化的數(shù)據(jù)庫,-parse_seqids,-hashndex兩個參數(shù)一般都帶上,主要是為blastdbcmd取子序列時使用,-dbtype nucl告訴程序這是核酸數(shù)據(jù)庫。3.4 運行 blastn (blast+)輸入以下命令進行數(shù)據(jù)檢索。D:Xblastbin>blastn.exe -task blastn -query hum

8、an -db human.pna.fna -out test.tx k這樣即可在bin下查看結(jié)果。 以上實驗所輸入的全部命令如下:4蛋白序列間的比對檢索數(shù)據(jù)庫格式化命令:makeblastdb.exe - in db - parse_seqids- hash_index- dbtype prot比對命令:blastp.exe task blastp cjner- db db out test.txt關(guān)于參數(shù)的說明:blastp.exe程序執(zhí)行命令,exe前的程序根據(jù)自己的需要而換;-task后面選擇你所要用的程序,blastn,blatp,tblastx等;-query后接查詢序列的文件名稱;-db后接格式化好的數(shù)據(jù)庫名稱;-out后接要輸出的文件名稱及格式;-dbtype后接所格式化的序列的類型,核酸用nucl,蛋白質(zhì)用prot;makeblastdb.exe 格式化數(shù)據(jù)庫的命令;-helpbl

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論