版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、l多序列比較就是把兩條以上可能有系統(tǒng)進(jìn)化關(guān)系的序列進(jìn)行比較的方法。目前對多序列比較的研究還在不斷前進(jìn)中,現(xiàn)有的大多數(shù)算法都基于漸進(jìn)比較的思想,在序列兩兩比較的基礎(chǔ)上逐步優(yōu)化多序列比較的結(jié)果。進(jìn)行多序列比較后可以對比較結(jié)果進(jìn)行進(jìn)一步處理,尤其是在尋找基因和致力于發(fā)現(xiàn)新蛋白的努力中,人們習(xí)慣于把新的序列同已知功能的蛋白序列作比較。 l由于這些比較通常都希望能夠推測新蛋白的功能,不管它們是雙重比較還是多序列比較,都可以回答大量的其它的生物學(xué)問題。例如:在搜集的比較序列中,可以看出隱含于蛋白之中的物種進(jìn)化關(guān)系,以便于更好地理解蛋白的進(jìn)化。研究一個家族中的相關(guān)蛋白的差異,分析進(jìn)化壓力和生物秩序?qū)τ诠δ芟?/p>
2、關(guān)的蛋白進(jìn)化影響。研究完多序列比較中的高度保守區(qū)域,我們可以對蛋白質(zhì)的整個結(jié)構(gòu)進(jìn)行預(yù)測,并且猜測這些保守區(qū)域?qū)τ诰S持三維結(jié)構(gòu)的重要性。 l分析一群相關(guān)蛋白質(zhì)時,很有必要了解比較正確的構(gòu)成。發(fā)展用于多序列比較的程序是一個很有活力的研究領(lǐng)域,絕大多數(shù)方法都是基于漸進(jìn)比較(progressive alignment)的概念。漸進(jìn)比較的思想依賴于使用者用作比較的序列之間確實存在的生物學(xué)上的或者更準(zhǔn)確地說是系統(tǒng)發(fā)生學(xué)上的相互關(guān)聯(lián)。 l1、對數(shù)據(jù)庫比較,比較結(jié)果未知;l2、比較后尋找到一組相似序列;l3、構(gòu)建進(jìn)化樹。l1. CLUSTAL WlCLUSTAL W算法是一個最廣泛使用的多序列比較程序,在任何
3、主要的計算機(jī)平臺上都可以免費(fèi)使用。這個程序基于漸進(jìn)比較的思想,將得到的一系列序列輸入,對于每兩個序列進(jìn)行雙重比較并且計算結(jié)果?;谶@些比較,計算得到一個距離矩陣,反映了每對序列的關(guān)系,然后,基于鄰近加入方法,這個矩陣被用來計算出一個系統(tǒng)發(fā)生輔助樹。 l這個輔助樹,加權(quán)后可以證實極相近的序列,然后以雙重比較極相近的序列開始,為組建比較提供基礎(chǔ),重新比較下一個加入的比較序列,依次類推。如果加入的序列較多,那么毫無疑問,必須加入空位以適應(yīng)序列的差異,但是加入空位必須接受空位開放罰分和空位擴(kuò)展罰分。 l在絕大多數(shù)情況下,使用者不會在比較時加入結(jié)構(gòu)信息,但是空位開放補(bǔ)償利用了可以出現(xiàn)在-螺旋或-折疊末端
4、的特殊殘基以及空位罰分所偏好的殘基。已經(jīng)存在的空位的擴(kuò)展原則很簡單,只是要在那些極有可能在結(jié)構(gòu)中形成彎曲的位點擴(kuò)展空位,這些空位擴(kuò)展罰分計算是由位置決定的。 l為了介紹CLUSTAL W的使用,考察一下從四種不同物種來源的matrix metalloproteinase 9 preproprotein蛋白(Homo sapiens,Paralichthys olivaceus,Rattus norvegicus,Bos taurus)。將下列蛋白序列放入一個獨立的文件中。 lgi|14786152|ref|XP_029934.1| matrix metalloproteinase 9 prep
5、roprotein Homo sapienslMSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLY
6、TQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPFTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSK
7、KLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYDILQCPEDlgi|15718389|dbj|BAB68366.1| gelatinase Paralichthys olivaceuslMRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLDKSTLEAMKQPRCGVPDVAN
8、YQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADHGDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTADYSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCHFPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHAL
9、GLDHSNIREALMYPMYTYVEDFSLHKDDIEGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLSERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGYPKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSYlgi|13591993|ref|NP_112317.1| matr
10、ix metalloproteinase 9 (gelatinase B, 92-kDa type IV collagenase) Rattus norvegicuslMNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELDSETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKG
11、AVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYDTDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVFPFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDIKGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVD
12、NPCNVDVFDAIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVTLVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCPlgi|467621|emb|CAA55127.1| matrix metalloproteinase 9 Bos tauruslMSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNR
13、QLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDSTTLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDGYPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDADRQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNA
14、AGELCVFPFTFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQGIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIFDAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEVAQVTGALPRPEGKVLLFSGQSFWRFDV
15、KTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYVTFDLLKCPED l這四種輸入序列放在一個單獨的文件中,作成7種可以接受的格式中的一種,lClustalW currently supports 7 multiple sequence formats. These are:lNBRF/PIR lEMBL / UniProtKB/Swiss-Prot lPearson (Fasta) lGDE lALN/ClustalW lGCG/MSF lRSF l然后進(jìn)入http:/www.ebi.ac.uk/Tools/msa/cl
16、ustalw2/站點,將需要比較的序列輸入工具程序中 ,在圖4.1中的“序列輸入窗口”輸入或粘貼需要比較的序列,也可以在“文件輸入窗口”將含有需要比較序列的文件名輸入Clustalw運(yùn)行程序中,進(jìn)行多序列比較。 結(jié)果輸出可以在網(wǎng)頁中獲得,也可以通過電子郵件發(fā)到用戶的信箱。通過改變輸出結(jié)果下拉菜單,用戶可以根據(jù)需要獲得多種形式的輸出結(jié)果。用戶在執(zhí)行多序列比較時有很多選擇的自由,用戶可以設(shè)定空位開放和擴(kuò)展的罰分,指出在組建輔助樹時分歧到什么程度證明可以跳過一個序列,選擇一個分值矩陣(BLOSUM或PAM),并且可以選擇當(dāng)一個親水殘基出現(xiàn)(或缺失)在一個特異位點時,是否要執(zhí)行特異性罰分,如果需要,要
17、罰多少分。程序會在屏幕上顯示構(gòu)建輔助樹的過程,然后開始真正的多序列比較。 G 7 P -2 9 D -1 -1 7 E -2 0 2 6 N 0 -2 2 0 6 H -2 -2 0 0 1 10 Q -2 -1 0 2 0 1 6 K -2 -1 0 1 0 -1 1 5 R -2 -2 -1 0 0 0 1 3 7 S 0 -1 0 0 1 -1 0 -1 -1 4 T -2 -1 -1 -1 0 -2 -1 -1 -1 2 5 A 0 -1 -2 -1 -1 -2 -1 -1 -2 1 0 5 M -2 -2 -3 -2 -2 0 0 -1 -1 -2 -1 -1 6 V -3 -3 -
18、3 -3 -3 -3 -3 -2 -2 -1 0 0 1 5 I -4 -2 -4 -3 -2 -3 -2 -3 -3 -2 -1 -1 2 3 5 L -3 -3 -3 -2 -3 -2 -2 -3 -2 -3 -1 -1 2 1 2 5 F -3 -3 -4 -3 -2 -2 -4 -3 -2 -2 -1 -2 0 0 0 1 8 Y -3 -3 -2 -2 -2 2 -1 -1 -1 -2 -1 -2 0 -1 0 0 3 8 W -2 -3 -4 -3 -4 -3 -2 -2 -2 -4 -3 -2 -2 -3 -2 -2 1 3 15 C -3 -4 -3 -3 -2 -3 -3 -
19、3 -3 -1 -1 -1 -2 -1 -3 -2 -2 -3 -5 12 G P D E N H Q K R S T A M V I L F Y W C Blosum 45 Matrix lCLUSTA W結(jié)束時,會顯示最終的比較結(jié)果,上述的例子的結(jié)果顯示在圖4.3中。在比較下方,一些位點被標(biāo)記為星號或圓點,這些標(biāo)記分別顯示這些殘基在序列中是絕對或是高度保守的。結(jié)果輸出的最后部分是進(jìn)化樹,可以看出,比較的四種源自不同種屬的蛋白進(jìn)化關(guān)系。如果返回的比較出現(xiàn)太多的空位或是不考慮這些蛋白的任何已知信息,用戶就可以再修正參數(shù),然后返回程序,看它是否影響最終的比較。 l2.MultAlin2.Mult
20、AlinlMultAlin方法也是基于用一系列雙重比較開始的思想,然后基于雙重比較的打分值進(jìn)行一個分層次的聚類。當(dāng)序列都分成類后,開始進(jìn)行多序列比較,計算出多序列比較中的兩個序列比較的新值,基于這些新值,重新構(gòu)建一棵樹。這個過程不斷進(jìn)行,直到分值不再上升,此時所有序列比較也就結(jié)束了。 lMultAlin(http:/multalin.toulouse.inra.fr/multalin/multalin.html)可以在INRA Toulouse的一個環(huán)球網(wǎng)點上很容易地執(zhí)行,要比較的序列按照FASTA的格式被粘貼到序列輸入框內(nèi),也可以在文件輸入窗口輸入文件名, 將序列提交給服務(wù)器。在提交序列之前
21、,用主界面的一系列下拉菜單,用戶定義適當(dāng)?shù)膮?shù),比如輸出格式,可選的輸入格式,引用的分值矩陣以及空位開放和擴(kuò)展罰分的分值。大多數(shù)用戶只會根據(jù)輸入序列的遠(yuǎn)近關(guān)系,選擇不同的分值矩陣。 l然后,序列被提交到服務(wù)器上,當(dāng)多序列比較返回時,會計算一個一致序列并顯示在比較的下方。舉例來說,如圖4.4所示的用CLUSTAL W比較的同樣的序列被提交給MultAlin服務(wù)器,接受缺省的比較參數(shù)。 l其結(jié)果如圖4.5所示,在一致序列中,所有序列都匹配的殘基相應(yīng)的位置用此殘基的大寫字母表示,大多數(shù)都匹配的用小寫字母表示,同樣地,符號!、$、%和#分別表示保守取代, Homo sapiensMSLWQPLVLVL
22、LVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGY
23、RWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPFTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVA
24、QVTGALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYDILQCPEDParalichthys olivaceusMRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLDKSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADHGDPYPF
25、DGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTADYSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCHFPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDIEGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRD
26、ACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLSERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGYPKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSYRattus norvegicusMNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELDSETL
27、KAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYDTDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVFPFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQ
28、GYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDIKGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFDAIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVTLVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRV
29、NQVDHVAYVTYDLLQCPBos taurusMSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDSTTLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDGYPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDADRQFGFCPS
30、ERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNAAGELCVFPFTFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQGIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIFDAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLD
31、SAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEVAQVTGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYVTFDLLKCPED很明顯,用兩種方法分別得到的比較結(jié)果并不完全一樣。這并不意味這一種方法比另外一種方法優(yōu)越,根據(jù)實際情況,從輸入序列的性質(zhì)出發(fā),應(yīng)用不同的方法會得到不同程度的成功。用戶應(yīng)該選擇若干個工具同時使用,并且對最終的比較結(jié)果作手工修正以期達(dá)到最佳效果。 l上述的方法對于多序列比較是非常有用的,缺點是用戶必須事先搜集好需要比較的輸入
32、序列,要么通過一系列的BLAST或其它的數(shù)據(jù)庫搜索,要么在實驗室里直接作出決定。但是,在實際工作中我們常??梢垣@取一個單獨的序列,并且基于此序列中的任何基序或模式,針對所有的蛋白質(zhì)家族,完成某個特異方法所定義的最佳比較。很多時候,這些方法所揭示的距離關(guān)系并不能從標(biāo)準(zhǔn)的數(shù)據(jù)庫搜索中輕易獲取。在這一部分,我們討論兩種方法,都是搜索特殊數(shù)據(jù)庫以獲取序列的基序和模式的,當(dāng)然也是兩種從最少的序列信息中進(jìn)行蛋白質(zhì)家族分類的強(qiáng)有力的方法。 l1 1、ProfileScanProfileScanl基于經(jīng)典的模式分析的Gribskov方法,ProfileScan使用一種稱為pfscan的方法尋找一個蛋白質(zhì)或核酸
33、的查詢序列同一個模式庫的相似性,因此,在搜索中需要有模式庫 l第一個是PROSITE(http:/www.expasy.ch/prosite/),一個ExPASy(http:/www.E)數(shù)據(jù)庫,通過使用基序和序列模式(諸如指紋)將生物學(xué)意義重大的位點收集分類;l第二個是Pfam(http:/www.sanger.ac.uk/Software/Pfam/search.shtml) ,收集了蛋白質(zhì)結(jié)構(gòu)域家族,與其它收集方法有很大不同的是,最初的蛋白質(zhì)結(jié)構(gòu)域的比較完全是用手工完成的,而不是依靠自動化的處理方法,正因為這樣,Pfam幾年前,只擁有500多條款目,但這些款目的質(zhì)量極好
34、。現(xiàn)在擁有 8957條條目目. l基于PROSITE和Pfam的搜索可以通過訪問ProfileScan的主頁完成,它只需要一條簡單的輸入序列(用文本格式),或者一個標(biāo)號,比如一個SWISS-PROT ID。用戶可以選擇搜索的敏感度,選擇返回顯著的匹配或者所有匹配,甚至包括邊界的情況。 l為了說明輸出的格式,我們現(xiàn)在向PROSITE系統(tǒng)提交人類matrix metalloproteinase 9 preproprotein Homo sapiens蛋白序列。返回的PROSITE條目顯示蛋白的功能區(qū),數(shù)字“Start”和“End”是顯示出查詢序列和匹配的模式重疊的位點, Bits是序列比較可靠性評
35、分,Evalue是序列比較錯誤概率。 gi|74272287|ref|NP_004985.2| matrix metalloproteinase-9 preproprotein Homo sapiens MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPA LLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDA FARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELW SLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTDDRFGFCPSERLYTQD GNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFP FTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMY PMYRFTEGPPLHKDDVN
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年生態(tài)環(huán)境治理保護(hù)合同
- 2024年版項目監(jiān)工聘用合同
- 特崗英語課程設(shè)計
- 現(xiàn)代詩課程設(shè)計分享
- 電子表課程設(shè)計c語言
- 測繪工程課程設(shè)計選題
- 社交軟件銷售工作總結(jié)
- 航空航天顧問工作總結(jié)
- 保健品行業(yè)營銷策略總結(jié)
- 餐飲團(tuán)購前臺工作總結(jié)
- 患者轉(zhuǎn)診記錄單
- 美好生活“油”此而來-暨南大學(xué)中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
- 買賣合同糾紛案民事判決書
- 神經(jīng)內(nèi)科應(yīng)急預(yù)案完整版
- 2023零售藥店醫(yī)保培訓(xùn)試題及答案篇
- UCC3895芯片內(nèi)部原理解析
- 混凝土設(shè)計的各種表格
- 保安員培訓(xùn)教學(xué)大綱
- 廣東省高等學(xué)?!扒О偈こ獭钡诹^續(xù)培養(yǎng)對象和第
- 【企業(yè)杜邦分析國內(nèi)外文獻(xiàn)綜述6000字】
- taft波完整版可編輯
評論
0/150
提交評論