版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、生物序列的相似性搜索一 blast簡介及其應用2005年3月生物信息學常見的應用與軟件序列數(shù)據(jù)的保存格式與相關數(shù)據(jù)庫資源在數(shù)據(jù)庫中進行序列相似性搜索多序列比對進化樹構建與分子進化分析 Motif的尋找與序列的模式識別RNA二級結構,蛋白質二、三級結構的預測基因芯片的數(shù)據(jù)分析內容提要1. 基本概念相似性,同源性2. Blast 介紹Blast資源和相關問題3. Blast的應用網(wǎng)絡版,單機版4. 深入了解Blast(改進程序,算法基礎)其他的序列相似性搜索工具(fasta)5生物序列的相似性相似性(similarity):是指一種很直接的數(shù)量關系,比如部分相同或相似的百分比或其它一些合適 的度量
2、。比如說,A序列和B序列的相似 性是80%,或者4/5。這是個量化的關 系。當然可進行自身局部比較。7生物序列的同源性同源性(homology):指從一些數(shù)據(jù)中推斷出的兩個基因或蛋 白質序列具而共同祖先的結論,屬于質的 判斷。就是說A和B的關系上,只有是同 源序列,或者非同源序列兩種關系。而說 A和B的同源性為80%都是不科學的。相似性和同源性關系序列的相似性和序列的同源性有一定的關系,一 般來說序列間的相似性越高的話,它們是同源序 列的可能性就更高,所以經??梢酝ㄟ^序列的相 似性來推測序列是否同源。正因為存在這樣的關系,很多時候對序列的 相似性和同源性就沒有做很明顯的區(qū)分,造成經 常等價混用
3、兩個名詞。所以有出現(xiàn)A序列和B序 列的同源性為80% 說。序列相似性比較和序列同源性分析序列相似性比較:就是將待研究序列與DNA或蛋白質序列庫進行比較, 用于確定該序列的生物屬性,也就是找出與此序列相似 跑刼唐列產什么2完感迄一工作只需要使用倉兩序列 比較算穽。倉用的程序包有BLAST. FASTA#;序列同源性分析:是將待研究序列加入到一組與之同源,但來自不同物種 的序列中進行多序列同時比較,以確定該序列與其它序 歹j間的向源程央小。這是理矗分析方癥申最關璉的一軌 室成這一工作叢須使用多序列比轂算法。常用的程序包 有 CLUSTAL 等;Blast簡介(一)BLAST是由美國國立生物技術信息
4、中心(NCBI)開發(fā)的一個基于序列相似性的數(shù)據(jù)庫搜 秦程序。BLAST是“局部相似性基本查詢工 具 ” (Basic Local Alignment Search Tool)的縮寫。Blast簡介(二)Blast是一個序列相似性搜索的程序包,其中包含了很多個獨立的程序,這些程序是根據(jù)查詢的對象和數(shù)據(jù)庫的不同來定義的。比如說查詢的序列為核酸,查詢數(shù)據(jù) 庫亦為核酸序列數(shù)據(jù)庫,那么就應該選擇 blastn 程序。下表列出了主要的blast程序。主要的blast程序程序洛查詢序列數(shù)據(jù)庫搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)庫中的序列Blastp蛋白質蛋白質蛋口質序列搜索逐一蛋白質數(shù)據(jù)庫中
5、的序 列Blastx核酸蛋口質核酸序列6框翻譯成蛋白質序列后和蛋口 質數(shù)據(jù)庫中的序列逐一搜索。Tblastn蛋口質核酸蛋口質序列和核酸數(shù)據(jù)庫中的核酸序列6 框翻譯后的蛋白質序列逐一比對。TBlastx核酸核酸核酸序列6框翻譯成蛋白質序列,再和核 酸數(shù)據(jù)庫中的核酸序列6框翻譯成的蛋 白質序列逐一進行比對。15怎么獲得blast服務,怎么使用的問題?為什么使用blast,可以獲得什么樣的信息?其他問題:實際使用時選擇哪種方式(網(wǎng) 絡,本地化),參數(shù)的選擇,結果的解 釋Blast資源1. NCBI主站點:/BLAST/(網(wǎng)絡版) ftp:/ftp.
6、/blast/ (單機版)2. 其他站點:http:/nema.cap.ecl.ac.uk/ncbi blast.htmlhttp:/www.fruitfly.OTg/blast/ (果蟲電)17Blast結果給出的信息Blast結果會列出跟查詢序列相似性比較 高,符合限定要求的序列結果,根據(jù)這些 結果可以獲取以下一些信息。1. 查詢序列可能具有某種功能2. 查詢序列可能是來源于某個物種3. 查詢序列可能是某種功能基因的同源基因這些信息都可以應用到后續(xù)分析中o19兩種版本的Blast比較(一)網(wǎng)絡版本包括NCBI在內的很多網(wǎng)站都提供了在線 的blast服務,這也
7、是我們最經常用到的 blast服務。網(wǎng)絡版本的blast服務就有方便, 容易操作,數(shù)據(jù)庫同步更新等優(yōu)點。但是 缺點是不利于操作大批量的數(shù)據(jù),同時也 不能自己定義搜索的數(shù)據(jù)庫。兩種版本的Blast比較(二)單機版單機版的blast可以通過NCB啲ftp站點獲得, 有應合木同平臺的版本(包ffilinux, dos 等)。獲得程序的同時必須獲取相應的數(shù) 搪庫才能注本血進行blast分僑童機版的 優(yōu)點是可以處理大批的數(shù)據(jù),可以自己定 義數(shù)據(jù)庫,但是需要耗費本地機的大量資 源,此外操作也沒有網(wǎng)絡版直觀、方便, 需要一定的計算機操作水平。本地WEB版的Blast在NCBI的FTP上,在blast程序的目
8、錄 下,還提供了一種供用戶在自己的服務器 上建立Blast網(wǎng)頁服務的軟件包(wwwblast)。使用該軟件包,用戶可以建立一個簡 易的進行Blast運算的網(wǎng)站供實驗室人員使 用。用于搜索的數(shù)據(jù)庫同樣可以靈活的定 義。Blast程序評價序列相似性的兩個數(shù)據(jù)Score:使用打分矩陣對匹配的片段進行打分,這是 對各對氨基酸殘基(或堿基)打分求和的結果,一般來 說,匹配片段越長、相似性越高則Scow值越大。E value:在相同長度的情況下,兩個氨基酸殘基(或 堿基)隨機排列的序列進行打分,得到上述Score值的 概率的大小。E值越小表示隨機情況下得到該Scow值的 可能性越低。23NCBI提供的Bl
9、ast服務25Blast任務提交表單(一)Go gle I地址(Q) |<J /blast/Blast.cgi?CMD=Web8<LAYOUT=TwoWindows&AUTO-FORMAT=5emiauto8<ALIGNMENTS=5NCBI網(wǎng)頁詳情離高層 /標明二|摻搜索阿頁 歪檢索網(wǎng)址Tran§12iAS蘭ilusults for1序列信息部分NucleotideProtein序列范圍(默認全部)>itiy_que r y_s e que nc e AAATCTGTGTAGCTGTCGCTCGGC
10、TGCkTGCCTAGTGCACCTACGCAGTATAAACAATAA TAAATTTTAC TGTC GTTGAC AAGAAC TCGTCCCTCTTCTGCAGACTGCTTACGGTTTC GTC C GTGTTGC AGTC GATC ATC AGCAAGGTAAGATGGAGAGCCTTGTTCTTGGTGTC AAC GAGAASearchSet subseqmcE填入查詢(query)的序列To:|1000From: 1100Choose datzb&SENow:如果接受其他參數(shù)默認設置,點擊開始搜索Blast任務提交表單(二)文件(E)編輯(或查看收藏(亠工具(I)
11、幫助(出卜后退(9囤奮搜索閨收藏夾乞媒體宙I堅r尋回鬲Go gle-|竊 NCBI Blast - Microsoft Internet Explorer:GSAj地址(Q) | h Up :vwvw ncbi nlm nih goWbl&st/Bl&s匕 cgi?CMD = Web&LAYOUT=T內oWi ndo內s&AUTO_FORMAT=Sem4uto&ALIGNMENono o s e databasei est huma n 亍Now:Limit by entrez quety三I後搜索兩頁 匪檢索網(wǎng)址 PageRank O網(wǎng)頁詳'猗
12、匡高尾一ZOptions for advanced blastingselect &om:| 頊EfiS2 設置各種參數(shù)部分設置搜索的范圍,enrez關鍵詞,或者選擇特定物種一些過濾選項,包括簡單重復序列,人類基因組屮的重復序列等也坦 疋 Low c omplexity 廠 Human repeats 廠 Mask for lookup table only 廠 Mask lower case27如果你對blast的命令行選項熟悉的話,町以在這里加入更多的參數(shù)#Blast任務提交表單(三)#3 后退-" J Q 4駁r昌0 勻爲Q地址(0) 1 筍 ht(p:/rtWA.rc
13、bl.nrn.nlh.QOHast/Sd$t.cO?CNT»/etftLArOUr=TwXWndc»A$JTO.F0RNAT=5ernldirc6AlJGFJMErjr5=5CBAUGrJMErjGo gk -1揍攪索網(wǎng)貝儀曲網(wǎng)址勺 NCBI Blost - Microsoft Internet Explorer3 設置結果輸出顯示格式dancedE值范圍onnar顯示數(shù)冃100 AH£runrtitsj503寸篩選結杲Expect 坤舒:"MS斑 111Daiiv/$9選擇需要顯示的選項 以及顯示的文伸格我4lignmentjJ in| HTMLTlf
14、otmarKcnrl non 8)Alignment 的顯示方式29提交任務#三1冷舷網(wǎng)頁 畋橙索網(wǎng)址I gg迺空 O巨帀說怙.由高層 /祁町The 花evb£ aie ectimared to be leady in 】wimitet: 20 ceconde bui may be done sooner.Showttlt(D)雀b«p:f/www.ncb.chLch.goMJast丿Blast egGo gle* Please press 'FORT4ATI * when you udsh to check yout xesults. ?cu iriay chan
15、ge the forinatting options foi your re suit via the fortribdow andpregs "FOT xcGulte of a dilferent 0 e Gtch by entnng eny other valid r$ quo 0t ID to eee other roc&ntjobs.FoimatV Gg»bicUR LinkM P 丫汕F.ttnegl W RCBI gj Alignment m | HTML Zdromat#Nurabei of:DescnphonsplOO T Aiiyunenls 50
16、 | Pai wise町以修改顯示結果格式31結果頁面(一)#結果頁面(二)33結果頁面(二)Sequences producing significantalignments:Score E (bits) Valuegi 1216365 lsplP26374 IR盒E2_HUMAN RAB PROTEINS GERYLGERANYLT. gi 1585774 I sp I P2438 6 IR盒E1_HUMAN RAB PROTEINS GERANGERANYLT. gi 1585775 lsplP37727 |R盒E1_R盒T RAB PROTEINS GERANYLGEkNYLTRA.
17、gi 113626886 I sp 1061 598 IGDIC_MOUSE RAE GDP DISSOCIATIOTbXNHIB.i 17 29566 lsplP3995 8 IGDI1_YEMT SECRETORYPATHWAY GDPi 113626823 I sp 1097556 IGDTjCANF 直 RAB GDP DISSOCIATION INK DISSOCIATION INHRAB GDP DISSOCIATION INHIBITOR RAB GDP DISSOCIATION INHIBITi 113638229 lsplP50397 |GDIB_MOUSE RAE GDPi
18、 11707888 I sp I P50398 IGDm_R_ATi 12 212 08 lsplP21856 IGD_EOVINi 11362682 2 I sp 1097 555 IGDgCANF盒 RAE GDP DISSOCIATION INHIB.i 11 7078電 I sp I P311 50 IGDM_HUMAN RAB GDP DISSOCIATION INHIBI. i 11363828 ISDIP50395 IGDIB HUIVIANRAE GDP DISSOCIATION INHIBgi l2 7CI789:lp IP503 99 IGDIB R且T :|1723467
19、010305 I YD4C呂西PORAB GDP DISSOCIATION INHIBITO PUTATIVE SECRETORY PATHWAY gi 15 85776 I sg p6 4 IRAEP_YEST RAB PROTEINS GERANYLGERANYLT.gi 11707887 Is乂 73 96 IGDS MOUSE&ii2498422 lspl( &iilH35402 &i111135075IsBl 預 gil211351.95lsplP! gi I 391551.6 I sp I P9/ &ii23178BlsplP3CI599 gil24
20、98412lsplP75499 gi1547891lsplP36225I gil586602lsplF37747lGL gi 112643859 IspIQ9T0P4 IG gi1586678lsplP37637IYHHRAB GDP DISSOCIATION INHIBI31IR£EP CANAL RAB PROTEINS GERANYLGERANVGLF MYCGE UDP-GALACTOPYRANOSE MUTASESOLUBLESOLUBLE PYRIDINE NUCLEOTIDSOLUBLEPYRIDINEPYRIDINENUCLEOTID1216877846127 oo1
21、271261251241211209779743534I4ANjA PSEAENUCLEOTID HYPOTHETICAL SYMPORTER IN G CHITIN SYNTHASE 2 (CHITIN-UD. UDP-GALACTOPYRANOSE MUTASE MICROTUBULE-ASSOCIATED PROTE P-GALACTOPYRANOSE MUTASE ERREDOXIN-DEPENDENT GLUT矗 THETICAL 2225 KDA PROTE333332323232323231帶有genbank的鏈接,點擊i J以進入相應的genbank序列4e-299e-292e
22、-286e-286e-287e-28Se-28、27X 一 一 581580448 e e § 627001123336匹配情況,分值,e值#結果頁面(三)qi ll3626886lsplO61598 IGDICJOJSE RAB GDP DISSOCIATION INHIBITOR BETA-2 (RAB GDI BETA-2) (GDI-3) Length = 445Score =127 bits (320) f Ezpect = 4e-2 9Identities = 77/264 (29%), Positives = 139/264 (52%), Gaps = 19/264 (
23、7%)Query: 226 GRRFNIDLVSKLLYSQGLLZDLLZKSDVSRYVEFKNVTRILAFREGKVEQVPCSRADVFN 285 GR 4N+DL+ K L + G L+ +L+ +V+RY+FK + GK+ +VP + A+Sb jet: 69 GRDWNVDLI PKFLMAhlGQLVKIvILLF TEVTR MDFKVI E&S FVYKGGKIYKVPS TEAEALA 128Query: Sbjet:Query:Sbjet:Query:Sbjet:Query:Sbjet:286129343139397246457300SKELTMVEKRILI
24、4KFLTFCLEY-EQHPDEYQAFRQCS FSEYLKTKKLTPMLQHFVLHS S + + EKR KFL + + e+ P + + S + K L + F HS SSLMGLFEKRRFR YVANFDEKDPRTFEGVDPKKTSMRDVYKKFDLGQDVIDFTGHSI AMTSESSCTTID+A+ C TILALYRTDDYLDQPCCETINRIKLNFLQCLGRFGNTPFLFPLYGQGEIPQGFCRMCAVFL R+G +P+L+PLYG GE+PQGF R+ A+ YGKSPYLYPLYGLGELPQGFARLSAIVGGIHCLRHKVQCFWDK
25、ESGRCKAIIDHFGQGG Y L + +V +G+G十GGTYMLNKPIEEZIVQNGK WGVKSE -GEIARCKQAVLITDQSILKTDLDQQTSIL IVP 4804- I I T4- D + +I+PVICILSHPIKNTW-DANSCQIIIP 322DS YLSEEICSMVQYKQIS R 十Q+ R EKVGQVIR342188396245456299詳細的比對上的序列的排列情況Score = 52.0 bits (123)z Expect = 3e-06Identities = 22/44 (50%)z Positives = 32/44 (72%)Q
26、uery: 8 EFDWIIGTGLPESILAAACSRSGQRVLHIDSRSYYGGNWASFS 51 E4-DV4-+GTGL E IL+ S +G+VLH+D YYGG AS +Sb jet: 4 E YDVIVLGTGL TEC ILSG IMS VNGKKVLHIWQN P Y YGGES AS IT 4735一個具體的例子(blastp)假設以下為一未知蛋白序列>query_seqMSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTAS WFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVR
27、GGDGKMKEL SPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATV LQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARM ASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRT ATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFG MSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDK KKKTDEAQPLPQRQKKQ
28、PTVTLLPAADM DDFSRQLQNSMSGASADST QA 我們通過blast搜索來獲取一些這個序列 的信息。具體步驟1. 登陸blast主頁http :/www. ncbi. nlm. nih. gov/B LAST/2. 根據(jù)數(shù)據(jù)類型,選擇合適的程序3. 填寫表單信息4. 提交任務查看和分析結果37分析過程(一)3后退-總曲奮|條投索 韌蜿夾 險媒體器丨屜r孕83 日鶴電址(Q) http:/Jv«ww .ncbi .rim. nh cnJElA51/Goc"|2 NCBIBLAST1.登陸ncbi的blast主頁Pub Med infoEntrezBLAST
29、MIMTaxonomyStructure FAQs News References Credits心 15 August 2003 We will be reorganizing the executable director/ of our FTP site. REad mo巳NucleotideProteinrducaiiori Program selection guide Tutorial URL API guide Dscontiguaus msgablast l-tegablast NuclPDTidP-rurieoti7i= BLAST (bl列tn) Search for sh
30、ort, nearly exact matches Search trace archies with meoabtet or dBconfiaucus megablast Protein protein ELST (tiastp- PHI- and PSI-BUiST search for <frcrx, npa*!/ ox?匚t matches Seach the conserved dcrnairi database (rpstlast) Seerch by demain architecture (edart)2 選擇程序,因為查詢序列是蛋口序列nJ以選擇blastp,點擊進入D
31、ownload Executables Databases Source codeSupport Helpdesk Mailing listTranslatedGenomes Tra-slated query vs. protein database (blasts) Prcten query vs. translated datebase (tblastn) Tfrslatod qjsry g transiatGd databass (tbasto) Flies, nomatcctes plants G35ts, mdaria Mictctaal g=nomes, other eukaryo
32、tic genomes也可以選擇tblastnspecialMMa Algn two saqu©仃cqs (bl2seq).Scr©=n fcr vector ccntmrAtio仃(VsTScrccn) irnrrmootbn BLAST (rjBlast) Retrieve resdts by RID Get this pago with 歸心crQJfrg Irk作為演示,我們這里選blastp39分析過程(二)分析過程(三)6限制條件,我們限制在病毒里面找。Optionsfor advanced blastingI JtTl 化 hP EtltfeT:queryV
33、Low comploxity 廠 Mask for lo okup table only 廠 Mask lower case3 NCDI Dlosl - Microsoft. Internet explorer立件(E)編揖吏看收藏工貝(I)幫肋(d)4后退 *八盤由金| 披耒收藏夾菊媒樣(釦邑r孕囹勻爲地址(B) |j http:/WWW.nebi.nlm.nih gov/blast/Blast.cgi?CMD-Wob8«LAYOUT-TwoWindows8<AUTOFORMAT-Semioul:o8<ALIGNMENTS-S08</Go I三|維撰索網(wǎng)51 戳檢
34、索網(wǎng)址:尸旳曲"k © 地助詳情匡)鬲層 ,初Composition- based sWisticsChcc" filt"7其他選項保持默認值#分析過程(三)W ord Srre#分析過程(四)分析過程(四)43分析過程(四)分析過程(四)8 輸出格式選項保持默認值9點擊開始搜索#分析過程(五)45#3 粉搜素網(wǎng)頁 匪検素網(wǎng)址 廠滬皿咸0網(wǎng)頁洋佶y向高層/標聊http;/fwww rebi. /blastfBk.cgiGo gle-#2 NCB1NucleotideProteinformatting- BLASTTranslatio
35、ns Retrieve results for an RIDYour request has been sac cess珈ly submitted and put into the Blast Queue.Query 二 query_$eq (422 letters)10查詢序列的一些相關信息#Your search was limited by an Entrez query Viruses ORGNPiirrh conspiA-Ptl domainhave boon dafaefod. click on tlw iinng bolovv forl snlts150KOKO3)1250500
36、_一 MO 422Corona.nucleoca在edd庫里面找到 兩個保守區(qū)域, 點擊lJ以進入#rIhe request ID is |1 3327B620.X6S3-2381638 BLASTO3The results ere C3imaicd to be icadyinS seconds but may be done sooner.Please press "FORMAT I" when you wish to check your re suits. Yov may change the fccrmaitaig options foryour n仇dt via
37、the fottu below wd piess "PDRMA recjwesi lesults of a different search by erjteiing any other velid re cjue et ID to see othei tec ent jobs.#分析過程IJ hllp;JMwrv.n:bi.rim.nikgoYjbld$t/Blost.cgiS gk>弓 締翅索網(wǎng)頁 幺穩(wěn)索同址| 津彗awQ詫匡向高辰 沃田2 NCBIresults of BLAS 1BLASTP 2.2.6 Apr-09-2003RID: 1063216620-20693-
38、2381638 BLAS7Q3Qucry= aucrr_5eq(422 letters)圖形結果Mouse-over to show dcflmc aid scores Click to show aligiuicrfts分析過程(七)49分析過程(七)5 RID = 10b37 /bbZO-7 05H3-Z3H1AS1Q3, qupry_<en - Microsoft internet Explorer文件(D 褊輯(或査若® 收藏(為工且(D 幫助他)J后退 f 9 也珞|邈搜隸 園收藏夾 裁媒體 |越學宙到爲序 0 d三搜耒網(wǎng)頁 Qk檢隸網(wǎng)址|Go glc IP旳用冰 網(wǎng)
39、頁詳斷 匡)高層 加(b its)Valuegi gl gn. gi gi g-L gigx gig 1 gi gx g i gigi gn gJ. gi gi gi gi gn gx gi RJL g 1 gi gx gi gi g j, gi gn gj.3154094915 IAAF49024. 1 I30421455 Igb|AAP30714, 1 |nucleocapsid protein 3AR3 coron put ar i ve nucleocapsid protein S. 29836503|:ref |NP_828858 1 | nucleocapsid protean S
40、ARS cor. 32454352 | 亨b | AAP8?974 1 | nucloocapsid protein SARS coron.3$® i 844 G I NCAP_6vM1 Nuclcocapsi d protein (N st rue.127875 sp 甲 844G|NCAP CVM1 L匸*395178 dhiL I CAA45lil99 11 nuclcocapsidL protein Murine hepagrh I AAA4f5462 1 |AAA4®362 nucleocapsid protein muri. g I s?p IP597 1 了
41、1NIZAPIZVFV Nucleocapsid protein N str. 7769360 I gb | AAF69349 1 | AFZOgOGTl 1 nucleocapsid protein . 127876 gp P 18447 NCAP_CVM3 Nucl&ocapsid protein (N struc 1278T7 I & IP034 17 INCAP一CVMJH Nucleocapsid protein (N stru. 32129785® |Q8336O|NcQ_CVTin)V Nucleocapsid protein (N st. 9石29合I
42、B I ref |肝_04冇.了02 1 I nucleocapsid protein Murine he. 5896¥ I emb |CAA25193 1 | nucleocapsid pro-tein Murine hepat. 462 遜 |zp | Q 029 15 | NCAP_CVRSD Nucleocapsid protein331 沁932129797193237739G01 引32©99gb gb gbAAF97743. 1AF207551 8(N st runucleocapsid protciii irAAF68926. 1 LAF202?9p2_l
43、1 rtuclcocapsid protein . AAC 16422, 1 nucleocapsid protein murine hepa 了212978孑 |s?p |Q9PYg0|NC:AP_匚Nucleocapsid protein (N str. 32129705 I sp |Q9DQX6 |NCAP_CVkNg Nucleocapsid protein (N st.127873 wp P10527 NCAP_CVBM Nucloocapsid protein (N etruc. 127882 sp P2G020 NCAP CVBOK Nucleocapsid protciii (
44、N stru. 32129802 IsdIQ9QAR3INcIp CVDLY Nucleocapsid protein (N st. lf=jO8155|"f|NF_l!=iCiO&l nucleocapsid protein Bovine c. 了 21 29801 | s?p | Q9ijAR 1 | NiZAP _匚 VBLS Nucle ocapsid protein (N st. 127872 I 鄉(xiāng)p I” 19902 |NCAP CVBF Nucloocapsid protein (N etruc 617990 I 2匸 I AAFwCoG 1 clcocaps
45、id. m-uriitc hepatitis vi.gb AAQG7202上 1 1 nuclcocapsid protein Human erxtc Q8V432INC3APCVDLU Nucleocapsid protein Q8JSP" |NUAP_CVP:TA Nucleocapsid protein 8448 IMCAP_CVMS Nucleocapsid protein (N _-.- . ©innuc lcoprot c iix ncur iitc hep at it is nucleoprot ein. murinc hepatitis vi P 了.了&q
46、uot;9 IMCAP_CVHOC Nucleocapsid protein (N stru.3439825321297893212978&127856 3212970 953冬5 涼21.4 462686sp兮p |P6|sp|Q8BB23|NCAP_CVP67 Nucloocapsid protoigb g L SDAAA76578 1AAA74733. 1(N st. (N st. st ruc (N st.vi了21288(J:3|s?p |Q9WC:DD|NIZAP_匚URNJ Nucleocapsid protein (N st. 3132L948 I gb | AO155
47、£65. 1 | nucleocapsid protein murme hep.00700 I -rs lCCT?7C:nPVTMT T.T,59559559559l?491471-47MTM6?46146146146145M4L44142e-170 e-170 e-170 e-168 7c-36 2c-35 3e-35 4e-35 5e-35 6g-35 8c-35 8e-35 9e-35 le-3<l 3g-34 4c-34匹配序列列表142142L4l1381381381 38?37137136135 1 35 ?35135?341341 321 30121e-33 le
48、-33 le-33 2g-33 2c-32 2e-32 2e-32 2e-32 3g-32 3c-32 8c-32 le-31 le-31 2e-31 2g-31 4c-31 4c-31 2e-3O 4e-30 5e-29 O1 7#分析過程(八)Query;ISbjct:IQuery:61Sbjct:61Query:121Sbjct:121Query;IB1Sbjct:181Query:241Sbjct:241Query:301Sbjct:301Query:361St> jet:36160GO120具體匹配情況120 180R ID = 1 (>bH276feZ0-Z059?&g
49、t;-Z3816:«.BLftS1Q3r queryceq - Microsoft Internet B<plorer文件® 編輯查看(刃收酒©)工A(D幫助® 0囤釦遵覆索囪收磁零BR俗0電T臺冋目益爭刃dtfitt(D)屐| tttp :/ww. ncti .rtm .rih .govfblajVBIact. cgiGo gle-f二巒歿素顧取檢耒網(wǎng)址PRank網(wǎng)頁洋潔匡高層 /檢明Cet selected sequencesSelect allDeselect all廠 >21131540949gbIAAP49024. 1nucleoc
50、aDsid orotein SAKS coronaviruspi31581515333707. 1nucleocapsid protein 1( SARS coronOTLr»Js Frankfurt 1gi33578023gbAAT5M95. 1rtucleocapsid protein SAKS coronavirus FEALength = 422Score = 595 bils (1533), Expect = ITOIdentities = 340/422 (8偸h Positives = 540/422 (80«)MSDKGPQ S1TQR3AFEIIFGGP
51、rD3TDNNQHGGRN5AFIEQRRPQGL?NNIASYF TALTQHMSDBGPQSlIQRSAFEITFGGPTDSTDHKQIfGGRNGARPKQRRPQGLPNW ASVFTALTQH MSDNGPQSMQRSAPRIlFCCPrDSTDKKQKCCRNGAEPKQRRPQGLPNNIASVFrALTQHGKEELRFPRGQGVFIKTirSGPDDQIGYYRRATRRVRGGDGEnKELSPRWYFTTLGTGPEA GKEELRFPRGQGVPIKlKSCPDDQIGTtRArRRVRGCDGKKKELSPRWYFmcrGPEA GKEELRFPRGQGVFE門仍
52、 GPDDQIGYYRRATRRVRGGjGEnKELSPRWYFYYLGTGPEASLPYG2J(KEGIVWAlECUNrPKDHIG7WNNNAAraQLPQGTTLPKGFYAEXXXXX SIJYGAIiXEGITOA7EGALMrPKDHIG7WINNAAmQLPQGTTLFEGFYAE SLFYGATTKEGTiAVVAIEGAI.)irPKDHIG7EnPNWAAnrLQI.PQGTTLPKGFTAE«;SRiSGXffiffiX肝XXXMSXffiffiXXXXXXMXffiffiPARHASGGGETAMXXXXMXffiffiEEXXXXKXKK 240PARJUSGGGETAES3AS SRSSSRSKNSRNSTPG SSR;NSPAEKASGGGETALALLLLDRLNQLESKVSGKGQ 24 0AAEASKKPRQKRTATKQTinTQAFGRlPEQTQGNFGgDLIRQGTDYK 300AAEASKKPRQKRTAIKQTQAF
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 寵物服務保安工作總結
- 【正版授權】 ISO 59040:2025 EN Circular economy - Product circularity data sheet
- 2025-2030全球商業(yè)藥品采購行業(yè)調研及趨勢分析報告
- 2025年全球及中國草酸镥水合物行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025-2030全球農機三角帶行業(yè)調研及趨勢分析報告
- 2025-2030全球工業(yè)級硅酸鉀行業(yè)調研及趨勢分析報告
- 2025年全球及中國航空航天設備零部件用清洗機行業(yè)頭部企業(yè)市場占有率及排名調研報告
- 2025-2030全球直流電流分流器行業(yè)調研及趨勢分析報告
- 2025-2030全球帳篷地面釘行業(yè)調研及趨勢分析報告
- 2025-2030全球500+Ah電芯行業(yè)調研及趨勢分析報告
- 2025-2030年中國電動高爾夫球車市場運行狀況及未來發(fā)展趨勢分析報告
- 河南省濮陽市2024-2025學年高一上學期1月期末考試語文試題(含答案)
- 長沙市2025屆中考生物押題試卷含解析
- 2024年08月北京中信銀行北京分行社會招考(826)筆試歷年參考題庫附帶答案詳解
- 蘇教版二年級數(shù)學下冊全冊教學設計
- 職業(yè)技術學院教學質量監(jiān)控與評估處2025年教學質量監(jiān)控督導工作計劃
- 2024年湖南高速鐵路職業(yè)技術學院單招職業(yè)適應性測試題庫及答案解析
- 中國古代文學史 馬工程課件(中)24第六編 遼西夏金元文學 緒論
- 2022版義務教育(勞動)課程標準(含2022年修訂部分)
- 過松源晨炊漆公店(其五)課件
- 最新交管12123學法減分題庫含答案(通用版)
評論
0/150
提交評論