核酸數(shù)據(jù)庫(kù)的應(yīng)用_第1頁(yè)
核酸數(shù)據(jù)庫(kù)的應(yīng)用_第2頁(yè)
核酸數(shù)據(jù)庫(kù)的應(yīng)用_第3頁(yè)
核酸數(shù)據(jù)庫(kù)的應(yīng)用_第4頁(yè)
核酸數(shù)據(jù)庫(kù)的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩72頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于核酸數(shù)據(jù)庫(kù)的應(yīng)用第1頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五

數(shù)據(jù)庫(kù)查詢和數(shù)據(jù)庫(kù)搜索是分子生物信息學(xué)中兩個(gè)常用序語(yǔ)。數(shù)據(jù)庫(kù)查詢是指對(duì)序列、結(jié)構(gòu)以及各種二級(jí)數(shù)據(jù)庫(kù)中的注釋信息進(jìn)行關(guān)鍵詞匹配查找。數(shù)據(jù)庫(kù)搜索是指通過(guò)特定的序列相似性比對(duì)算法,找出核酸或蛋白質(zhì)序列數(shù)據(jù)庫(kù)中與檢測(cè)序列具有一定程度相似性的序列。第2頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第一節(jié)常用的核酸數(shù)據(jù)庫(kù)

一、GenBank-NCBI核酸序列數(shù)據(jù)庫(kù)1、GenBank核酸序列數(shù)據(jù)庫(kù)的檢索GenBank數(shù)據(jù)庫(kù)的簡(jiǎn)單查詢是在NCBI首頁(yè)上的Search中直接查詢檢索窗口第3頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五利用著者進(jìn)行查詢時(shí),輸入格式應(yīng)為作者的姓加上名的縮寫。如:Thomas點(diǎn)擊第4頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五點(diǎn)擊第5頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第6頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五也可以用序列登記號(hào)(accessionnumber)進(jìn)行一般查詢,如:AF477385點(diǎn)擊第7頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第8頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五

高級(jí)檢索是通過(guò)NCBI的Entrez檢索系統(tǒng)實(shí)現(xiàn)。Entrez是NCBI的數(shù)據(jù)庫(kù)檢索查詢系統(tǒng)的核心。利用Entrez系統(tǒng),可以檢索GenBank和其他數(shù)據(jù)庫(kù)的蛋白質(zhì)序列數(shù)據(jù)、基因組圖譜數(shù)據(jù)、來(lái)自分子模型數(shù)據(jù)庫(kù)(MMDB)的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)、種群序列數(shù)據(jù)集,以及有Pubmed獲得Medline的生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)。第9頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第10頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五Entrez提供方便實(shí)用的檢索服務(wù),所有操作都可以在網(wǎng)絡(luò)瀏覽器上完成。利用Entrez界面提供的限制條件(Limit鍵)、索引(Index鍵)、檢索歷史(History鍵)和剪貼板(Clipboard鍵)等功能實(shí)現(xiàn)復(fù)雜的檢索查詢工作。

第11頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五

進(jìn)入NCBI的Entrez主頁(yè),用戶可以選擇組成Entrez系統(tǒng)的五個(gè)數(shù)據(jù)庫(kù)之一作為查詢起點(diǎn)。如以Nucleotide開始。選擇Nucleotide即進(jìn)入EntrezNucleotidesearch界面,點(diǎn)擊Limits進(jìn)入限定檢索界面。如上圖。完成各限制條件后,點(diǎn)擊Go即進(jìn)行檢索。第12頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第13頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、NCBI中的GenBank數(shù)據(jù)的格式LOCUSDEFINITION序列名稱基因定義ACCESSION序列編號(hào)序列接受號(hào)或登記號(hào)VERSION序列版本號(hào)DATE序列提交、創(chuàng)建和更新日期DISCRIPTION序列簡(jiǎn)要描述KEYWORDS與序列相關(guān)的關(guān)鍵詞SOURCE序列的來(lái)源種屬ORGANISM序列的來(lái)源分類REFERENCE參考文獻(xiàn)編號(hào)或遞交序列信息REMARK參考文獻(xiàn)評(píng)述MEDLINE參考文獻(xiàn)交叉索引或遞交序列在Medline

中的存取號(hào)TITLEAUTHER參考文獻(xiàn)作者或遞交序列作者TITLE參考文獻(xiàn)題目JOURNAL參考文獻(xiàn)出處FEATURES序列特征表起始COMMENT序列注釋信息BASECOUNT序列起始標(biāo)志ORIGEN序列數(shù)據(jù)第14頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第15頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五·

LOCUSTG29EDGP839bpDNAlinearINV18-APR-1998DEFINITIONToxoplasmagondiiDNAencodinga29kDGRA.ACCESSION

Y13863VERSION

Y13863.1GI:2231107KEYWORDS29kDaprotein;densegranuleprotein;p29gene.SOURCE

ToxoplasmagondiiORGANISM

ToxoplasmagondiiEukaryota;Alveolata;Apicomplexa;Coccidia;Eimeriida;Sarcocystidae;Toxoplasma.REFERENCE1(bases1to839)AUTHORSFischer,H.G.,Stachelhaus,S.,Sahm,M.,etal.TITLEGRA7,JOURNAL

Mol.Biochem.Parasitol.91(2),251-262(1998)PUBMED9566518

1:Y13863.ReportsToxoplasmagondii...[gi:2231107]

第16頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五REFERENCE2(bases1to839)AUTHORSFischer,H.G.TITLEDirectSubmissionJOURNALSubmitted(16-JUN-997)FischerH.G.,InstituteforMedicalMicrobiologyandVirology,Heinrich-Heine-UniversitaetDuesseldorf,Universitaetsstr.1,D-40225Duesseldorf40225GERMANYFEATURES

Location/QualifiersCDS

79..789第17頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五Entrez

用途檢索大分子生物學(xué)數(shù)據(jù)獲取GenBank,EMBL等數(shù)據(jù)庫(kù)的核酸序列;獲取Swiss-prot,PIR,PRF,PDB等蛋白質(zhì)序列;從核酸序列翻譯到蛋白質(zhì)的序列;獲取基因和染色體圖譜;蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)及大分子模式(MMDB)等其他生物信息數(shù)據(jù)庫(kù)檢索。PubMed書目文獻(xiàn)數(shù)據(jù)。第18頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五Entrez生命科學(xué)搜索引擎第19頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五Entrez跨庫(kù)檢索第20頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五檢索字段限制分子類型選擇基因位置限定序列片段限定數(shù)據(jù)更新日期限定功能欄核酸序列檢索第21頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五序列存取號(hào)基因定義數(shù)據(jù)庫(kù)標(biāo)識(shí)符第22頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五代碼物種來(lái)源參考文獻(xiàn)特性專業(yè)評(píng)論第23頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五堿基數(shù)原序列復(fù)制后,可到BLAST中進(jìn)行相似性對(duì)比第24頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五二、EMBL-歐洲核酸數(shù)據(jù)庫(kù)EMBL數(shù)據(jù)庫(kù)共有Genomes、Simplesequenceretrieval和SRS(序列提取系統(tǒng))三種檢索方式。1、Genomes提供已完成測(cè)序的基因組數(shù)據(jù),用戶可以通過(guò)生物分類名稱以分層點(diǎn)擊瀏覽的方式獲取相關(guān)信息,通過(guò)相關(guān)鏈接,用戶可獲得大量已完成測(cè)序的基因組數(shù)據(jù)。第25頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五網(wǎng)址為:http://www.ebi.ac.uk/genomes第26頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、Simplesequenceretrieval

:直接輸入序列接受號(hào)檢索核酸序列。網(wǎng)址:http://www.ebi.ac.uk/cgi-bin/emblfetch第27頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五3、SRS(序列提取系統(tǒng)):是目前生物信息界應(yīng)用最為廣泛的數(shù)據(jù)庫(kù)系統(tǒng)。網(wǎng)址:http://srs.ebi.ac.uk/檢索序列時(shí)只需用鼠標(biāo)點(diǎn)擊“Search”,在輸入框中輸入擬檢索的信息即可。SRS的詳細(xì)信息參見:http://www.sanger.ac.uk/srs/srsman.html第28頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第29頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五三、DDBJ-日本DNA數(shù)據(jù)庫(kù)包括Getentry、SRS、Afgate&TAIS、Homology等幾種方法。前四種用于檢索DDBJ數(shù)據(jù)庫(kù)中原始數(shù)據(jù),Homology采用FASTA/BLAST檢索對(duì)用戶提供的序列或片段做同源性分析。1、Getentry:通過(guò)登錄號(hào)檢索DDBJ核酸數(shù)據(jù)庫(kù),最多可同時(shí)輸入10個(gè)號(hào)碼進(jìn)行檢索,各號(hào)碼之間用空格或“,”分隔,連續(xù)號(hào)碼可用“-”表示。還可用Locusname、Genename、Productname、P-ID、Clonenumber和Patent號(hào)等檢索。第30頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、SRS:有快速檢索和高級(jí)檢索兩種途徑??焖贆z索可同時(shí)選擇多個(gè)數(shù)據(jù)庫(kù)進(jìn)行檢索,并且它只對(duì)來(lái)自“ID”、“Molecule”、“Discription”、“AccNumber”、“Keywords”、“Source”“Organism”、“Authors”、“Title”及“Comment”等10個(gè)默認(rèn)字段的信息進(jìn)行檢索。3、Afgate&TAIS:比較簡(jiǎn)單的關(guān)鍵詞檢索途徑,在檢索框內(nèi)輸入檢索策略,點(diǎn)擊startsearch按鈕即可完成。第31頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第32頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第二節(jié)常用的RNA數(shù)據(jù)庫(kù)及軟件一、Transterm---mRNA序列和翻譯調(diào)控元件數(shù)據(jù)庫(kù)1、Transterm數(shù)據(jù)庫(kù)簡(jiǎn)介Transterm數(shù)據(jù)庫(kù)由新西蘭Otago大學(xué)生物化學(xué)系構(gòu)建并維護(hù),是一個(gè)mRNA序列和翻譯調(diào)控元件數(shù)據(jù)庫(kù)。

Transterm設(shè)計(jì)的目的是研究mRNA的構(gòu)成以及翻譯過(guò)程中的調(diào)控信號(hào)。Transterm中收錄的mRNA序列包括多種功能成分,既可以對(duì)一種物種進(jìn)行分析,也可以借此進(jìn)行信息查詢。第33頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五每一個(gè)從GenBank內(nèi)提取的mRNA被分成以下部分:功能成分,起始編碼區(qū),終止編碼區(qū),即5’-UTR、3’-UTR和翻譯信號(hào)的側(cè)翼序列。網(wǎng)址:http://www.uther.otago.ac.nz/Transterm.html第34頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、Transterm數(shù)據(jù)檢索Transterm提供每一物種密碼子使用表格,還提供描述mRNA中已知的基序或特征的模式的總結(jié)。通過(guò)Transterm來(lái)源于GenBank的編碼區(qū)可被分割為5’側(cè)翼、起始區(qū)、全編碼區(qū)、終止區(qū)、3’側(cè)翼。在Transterm的WWW界面使用與數(shù)據(jù)庫(kù)文件和有關(guān)數(shù)據(jù)庫(kù)相關(guān)聯(lián)的圖表,可以搜索所有或部分?jǐn)?shù)據(jù)庫(kù)內(nèi)容,找尋任一條符合條件的模式或用戶自定義的模式。第35頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五二、RDP-11-------核糖體數(shù)據(jù)庫(kù)由Maidak等人創(chuàng)建,提供一切與核糖體有關(guān)的數(shù)據(jù)、程序及相關(guān)服務(wù)計(jì)算機(jī)程序,包括rRNA在線數(shù)據(jù)分析、進(jìn)化分類系統(tǒng)樹、rRNA相似序列的排列、序列注釋、rRNA二級(jí)結(jié)構(gòu)圖以及各種相似序列比較分析和顯示軟件。網(wǎng)址:http://www.1、簡(jiǎn)介第36頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、RDP-Ⅱ數(shù)據(jù)庫(kù)提供的分析工具(1)ProbeMatch:分析特異探針在數(shù)據(jù)庫(kù)中出現(xiàn)的頻率(2)SequenceMatch:通過(guò)nearestneighbors算法確定與用戶序列最相近的RDP-Ⅱ序列。(3)SequenceAlign:對(duì)使用者的數(shù)據(jù)進(jìn)行排列,找到與使用者序列最相近的RDP-Ⅱ序列。(4)SimilarityMatrix:計(jì)算RDP-Ⅱ和/或使用者序列的相似性/不相似性矩陣。(5)ChimeraCheck:檢查用戶序列是否為嵌合型。第37頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五(6)AlignmentSlices:從RDP-Ⅱ全排列數(shù)據(jù)庫(kù)中抽取興趣部分,與相鄰序列精簡(jiǎn)壓縮為一個(gè)序列,突出鄰近序列的差異性.(7)SequenceSelection:從動(dòng)態(tài)展示的等級(jí)分類中選取序列,選出的序列可被下載并進(jìn)行RDP-Ⅱ其他軟件分析。(8)T-RFLP:以ABI測(cè)序系統(tǒng)格式使用數(shù)據(jù),建立一個(gè)相似性矩陣。第38頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五(9)TAPT-RFLP:在RDP數(shù)據(jù)庫(kù)中進(jìn)行“T-RFLP實(shí)驗(yàn)”,利于設(shè)計(jì)與分析。(10)(Sub)Trees:一種Javaapplet,可以用來(lái)展示、操縱種屬進(jìn)化系統(tǒng)樹,產(chǎn)生新分支,或選取序列進(jìn)行其他的RDP-Ⅱ分析。(11)PCA(principalComponentanalysis):對(duì)那些較大的序列系統(tǒng)進(jìn)行圖象化處理,PCA可通過(guò)網(wǎng)頁(yè)上的“SopplementaryMateriallinks”找到。第39頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五三、RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)借助計(jì)算機(jī)生物學(xué)可以很好地利用已知的RNA序列進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)乃至三級(jí)結(jié)構(gòu)建模。目前較成熟并實(shí)現(xiàn)自動(dòng)化的軟件主要在二級(jí)結(jié)構(gòu)預(yù)測(cè)的水平上。1、ViennaRNA軟件包綜合了兩種算法來(lái)預(yù)測(cè)RNA二級(jí)結(jié)構(gòu):一種是最小自由能的動(dòng)態(tài)規(guī)劃算法,另一種是McCaskill的分割函數(shù)算法。除RNA折疊外,還可計(jì)算給定二級(jí)結(jié)構(gòu)的RNA能量、RNA比熱及采用字符串聯(lián)配或編輯計(jì)算二級(jí)結(jié)構(gòu)間距離,還為反折疊提供一種算法,搜索給定二級(jí)結(jié)構(gòu)的RNA序列。第40頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、MFOLDZuker的主頁(yè)含眾多RNA結(jié)構(gòu)站點(diǎn)的超鏈接,作為RNA相關(guān)網(wǎng)站的導(dǎo)航站點(diǎn)。該站點(diǎn)可以下載最新mfold軟件,也可以將序列提交給Zuker的mfold服務(wù)器完成。其中RNAstructure是Zuker預(yù)測(cè)RNA二級(jí)結(jié)構(gòu)的Windows9X/WindowsNT版本,可以免費(fèi)下載。3、RNAdraw

其主頁(yè)詳細(xì)介紹了程序的安裝、原理、使用和前景。大多數(shù)RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)均可在大型計(jì)算機(jī)上完成,一般實(shí)驗(yàn)室不具備這些條件。第41頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五4、RNA世界可能是最全面的RNA站點(diǎn),其超鏈接包括各種數(shù)據(jù)庫(kù)站點(diǎn)、網(wǎng)絡(luò)工具、序列、二級(jí)結(jié)構(gòu)以及相關(guān)軟件??梢院芊奖愕馗鶕?jù)PDB(proteindatabank)代碼或者NDB(nucleicaciddatabase)代碼來(lái)查找所需要RNA的結(jié)構(gòu)信息,同時(shí)提供包括研究方法、參考文獻(xiàn)、可視化圖象軟件及相關(guān)數(shù)據(jù)庫(kù)等信息。5、其他核酸數(shù)據(jù)庫(kù)

HIVDatabaseHIV序列數(shù)據(jù)庫(kù)、IMGTImMunoGeneTics數(shù)據(jù)庫(kù);dbEST表達(dá)序列標(biāo)簽數(shù)據(jù)庫(kù)、BERLIN5SrRNA數(shù)據(jù)庫(kù);EPD真核啟動(dòng)子數(shù)據(jù)庫(kù)。第42頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第三節(jié)核酸同源性序列比對(duì)的策略和方法序列比較的根本任務(wù)是:發(fā)現(xiàn)序列之間的相似性辨別序列之間的差異目的: 相似序列相似的結(jié)構(gòu),相似的功能 判別序列之間的同源性 推測(cè)序列之間的進(jìn)化關(guān)系數(shù)據(jù)庫(kù)搜索就是一種基于兩兩比較的序列比對(duì),因?yàn)樗鼮閮蓚€(gè)序列的功能片段之間的相互關(guān)系提供一個(gè)非常明確的圖譜。較多序列的比對(duì)是序列比對(duì)的一個(gè)重點(diǎn)方向,本節(jié)只介紹兩亮序列比對(duì)。第43頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五一、數(shù)據(jù)庫(kù)的相似性搜索

對(duì)于一個(gè)新序列的分析首要任務(wù)就是將其與各種數(shù)據(jù)庫(kù)進(jìn)行比較搜索,發(fā)現(xiàn)是否存在同源序列。

數(shù)據(jù)庫(kù)相似性搜索能夠從數(shù)據(jù)庫(kù)海量中挑選出相關(guān)聯(lián)的序列。

最佳方式是搜索幾個(gè)不同的數(shù)據(jù)庫(kù)以發(fā)現(xiàn)最大可能多的同源序列。

第44頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五二、BLAST簡(jiǎn)介

BLAST和FASTA是當(dāng)前應(yīng)用最廣泛的程序,最新版的BLAST和FASTA中已消除原有各自局限性。綜合程序速度和敏感性,本節(jié)介紹NCBI中的BLAST程序。

BLAST(basiclocalalignmentsearchtool,局部序列相似性對(duì)比工具)集速度、敏感性、彈性與統(tǒng)計(jì)處理的最佳組合于一身,能迅速找到非空位的相似片段。在報(bào)告相似性的同時(shí),也報(bào)告這個(gè)相似性片段出現(xiàn)的可能性。

BLAST集成了一系列程序進(jìn)行核酸和氨基酸序列不同類型的搜索,采用卡林氏統(tǒng)計(jì)描述結(jié)果的顯著性。第45頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第46頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五BLAST是NCBI提供的用于核酸或蛋白質(zhì)序列相似性對(duì)比分析的一個(gè)軟件,已發(fā)展到包括BLASTP,BLASTN,BLASTX,TBLASTN,TBLASTX,MEGABLAST,PSI-BLAST,PHI-BLAST,RPS-BLAST等多個(gè)軟件和應(yīng)用工具的多功能序列分析程序。1、BLASTN:最早的BLAST程序,用于鑒定測(cè)序所得序列和查找與之相似的序列。系最常用BLAST軟件。第47頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五程序

數(shù)據(jù)庫(kù)

簡(jiǎn)

blastpblastnblastxtblastntblastx蛋白質(zhì)核酸蛋白質(zhì)核苷酸(翻譯)核酸(翻譯)蛋白質(zhì)核苷酸核酸(翻譯)蛋白質(zhì)核酸(翻譯)可能找到具有遠(yuǎn)源進(jìn)化關(guān)系的匹配序列適合尋找分值較高的匹配,不適合遠(yuǎn)源關(guān)系適合新DNA序列和EST序列的分析適合尋找數(shù)據(jù)庫(kù)中尚未標(biāo)注的編碼區(qū)適合分析EST序列

第48頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、MEGABLAST:用于鑒定一個(gè)未知的核酸序列。若要了解測(cè)得一個(gè)未知核酸序列是否已發(fā)表在公開的核酸數(shù)據(jù)庫(kù)中,以及其相關(guān)的生物研究文獻(xiàn)時(shí),這是一個(gè)最好的工具。它可有效地找到與序列相近的其他序列。3、Discontiguous

MEGABLAST:與MEGABLAST相似,主要用于相近的序列段比較短、并且相鄰的序列段不連續(xù)的搜索。相近序列不易查找時(shí),該工具可以提高查詢靈敏度和查詢效果。第49頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五4、BLASTP:為查詢蛋白質(zhì)序列設(shè)計(jì)的軟件,主要用于鑒定蛋白質(zhì)的氨基酸序列和在數(shù)據(jù)庫(kù)中查找相似的序列。既可通過(guò)找到相似的已知蛋白質(zhì)的功能來(lái)鑒定一個(gè)未知的蛋白質(zhì)序列的功能,也可用于兩個(gè)或多個(gè)蛋白質(zhì)序列的比較。5、PSI-BLAST(點(diǎn)位重心BLAST):最靈敏的BLAST程序,通過(guò)它可以找到一個(gè)蛋白質(zhì)的遠(yuǎn)親序列。第50頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五6、PHI-BLAST(特異片段重心BLAST):可以指定某一個(gè)蛋白質(zhì)序列片段,并以這個(gè)片段為重心查詢相關(guān)蛋白質(zhì)序列。7、BLASTX:把所需查詢的核酸序列翻譯成氨基酸序列,再在蛋白質(zhì)數(shù)據(jù)庫(kù)中查找。LBASTX可以將核酸序列翻譯成有6種可能的氨基酸序列后在進(jìn)行查尋,對(duì)編碼區(qū)所有三聯(lián)密碼的組合所翻譯的氨基酸序列都查尋,提高了查尋靈敏度。第51頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五8、TBLASTN:與BLASTX相反,TBLASTN蛋白質(zhì)序列翻譯成可能的6種三聯(lián)密碼核酸序列,對(duì)尋找相似功能的核酸序列特別有用。多用于EST和大規(guī)模測(cè)序所做的序列分析,對(duì)三聯(lián)密碼的錯(cuò)位有很高的容錯(cuò)度。9、TBLASTX:把要查尋的核酸序列和進(jìn)行比較的核酸序列都翻譯成6種可能的氨基酸序列后進(jìn)行比較。10、RPS-BLAST:用于鑒定某些進(jìn)化上比較穩(wěn)定的蛋白質(zhì)功能片段。數(shù)據(jù)來(lái)源于NCBI的CDD數(shù)據(jù)庫(kù)。11、CDART(conserveddomainarchitetureretrievaltool):用于篩選特定蛋白質(zhì)數(shù)據(jù)庫(kù)中所有的蛋白質(zhì)功能片段和功能片段結(jié)構(gòu),并得到含有某一個(gè)或多個(gè)功能片段結(jié)構(gòu)的所有蛋白質(zhì)序列。第52頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五三、BLAST應(yīng)用舉例順序:①建立BLAST搜索,確定查詢序列;

②選擇適當(dāng)?shù)乃阉鞒绦蚝拖鄳?yīng)的數(shù)據(jù)庫(kù),以及參數(shù);

③發(fā)送查詢序列;

④讀取BLAST結(jié)果。1、具體步驟(1)確定查詢序列;(2)選擇數(shù)據(jù)庫(kù)和搜索程序:數(shù)據(jù)庫(kù)為核酸數(shù)據(jù)庫(kù),程序?yàn)锽LASTN;第53頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五(3)選擇默認(rèn)的允許非空位的搜索;(4)E值限制,默認(rèn)為10;(5)用默認(rèn)矩陣BLOSUM62;(6)最后確認(rèn)結(jié)果輸出格式。確認(rèn)以上參數(shù)無(wú)誤后,點(diǎn)擊“BLAST”按鈕,同時(shí)也可以選擇E-mail回復(fù)結(jié)果。2、結(jié)果分析BLAST結(jié)果分兩部分,即圖形化結(jié)果和文字結(jié)果,后者又分為有意義的序列排列、兩兩對(duì)比結(jié)果、統(tǒng)計(jì)結(jié)果三部分。第54頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五選擇對(duì)比程序基因組對(duì)比特殊對(duì)比第55頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第56頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五將序列數(shù)據(jù)庫(kù)中的復(fù)制序列在此粘貼第57頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五點(diǎn)擊第58頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五(1)圖形結(jié)果得分高低以不同顏色表示:≥200紅色,80-200分紅色,50-80綠色,40-50藍(lán)色,<40黑色,也表示同源性由高到低。第59頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五2、文字結(jié)果第60頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五第61頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五搜索的分值高低排列,即同源性從高到低。排列第一的是查詢序列本身。右側(cè)分別為隨機(jī)分值(score,S值)和期望值(expect,E值)。E值是特定匹配中基本的隨機(jī)噪聲。S值增加,E值呈指數(shù)性減少,即隨機(jī)噪聲降低,表明序列同源性較高。經(jīng)驗(yàn)提示,DNA序列具有75%以上的同源性才具有潛在的生物學(xué)意義,但這種結(jié)果很難把握,必須實(shí)驗(yàn)驗(yàn)證,或要求研究者具有豐富的序列分析經(jīng)驗(yàn)。第62頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五序列對(duì)比報(bào)告對(duì)比資源類似性圖譜第63頁(yè),共77頁(yè),2022年,5月20日,3點(diǎn)37分,星期五對(duì)比圖譜報(bào)告數(shù)據(jù)庫(kù)標(biāo)識(shí)符基因定義類似性積分E值為匹配期望值。說(shuō)明可以找到與搜索序列相匹配的其它序列的幾率。E值越接近零,越不可能找到其它的匹配序列,其背后的含義

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論