版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
生物信息學(xué)的應(yīng)用
1精選ppt
生物信息學(xué)的應(yīng)用
1精選ppt生物信息學(xué)(Bioinformatics)生物分子數(shù)據(jù)計算機計算+2精選ppt生物信息學(xué)(Bioinformatics)生物分子計算機+概念(廣義)生物體系和過程中信息的存貯、傳遞和表達(dá)細(xì)胞、組織、器官的生理、病理藥理過程的中各種生物信息信息科學(xué)生命科學(xué)中的信息科學(xué)
3精選ppt概念(廣義)生物體系和過程中信息細(xì)胞、組織、器官的生理、病理概念(狹義)生物分子數(shù)據(jù)深層次生物學(xué)知識分子生物信息學(xué)MolecularBioinformatics挖掘獲取生物分子信息的獲取、存貯、分析和利用4精選ppt概念(狹義)生物深層次分子生物信息學(xué)挖掘獲取生物分子信息的獲生物信息學(xué)主要研究兩種信息載體DNA分子蛋白質(zhì)分子5精選ppt5精選ppt生物分子至少攜帶著三種信息遺傳信息與功能相關(guān)的結(jié)構(gòu)信息進化信息6精選ppt生物分子至少攜帶著三種信息6精選ppt
第一節(jié)生物信息學(xué)與基因組學(xué)一、生物信息學(xué)概述(一)生物信息學(xué)發(fā)展簡史生物信息學(xué)發(fā)展的3個階段:前基因組時代基因組時代后基因組時代生物信息學(xué)的發(fā)展脈絡(luò):
1956年,在美國田納西州蓋特林堡(Gatlinburg)召開的首次“生物學(xué)中的信息理論研討會”上,孕育了生物信息學(xué)的概念.1987年,佛羅里達(dá)州立大學(xué)32歲的林華安(Wa.A.Lim)博士首創(chuàng)“Bioinformatics”一詞,被譽為“世界生物信息之父”。7精選ppt
第一節(jié)生物信息學(xué)與基因組學(xué)一、生物信息學(xué)概述1987年1990年,林華安博士發(fā)起第一屆國際Bioinformatics學(xué)術(shù)會議。1990年10月,被譽為生命科學(xué)“阿波羅登月計劃”的國際人類基因組計劃(HGP)啟動。1995年,美國人類基因組計劃第一個五年總結(jié)報告中給出生物信息學(xué)一個較為完整的定義。2000年6月26日,美、英、日、德、法、中等六國科學(xué)家共同努力,完成人類基因組工作草圖,這是人類科學(xué)史上又一個里程碑式的事件。
2003年4月14日,國際人類基因組測序組隆重宣布:美、英、日、德、法和中國科學(xué)家歷經(jīng)13年共同努力,人類基因組序列圖(“完成圖”)提前繪制成功。人類邁入“后基因組時代”(Post-genomicEra)。8精選ppt1990年,林華安博士發(fā)起第一屆國際Bioinfor(二)生物信息學(xué)的主要研究內(nèi)容1.生物信息的收集、存儲、管理與提供2.基因組序列信息的提取和分析3.功能基因組相關(guān)信息分析4.基因表達(dá)數(shù)據(jù)的分析與處理5.蛋白質(zhì)結(jié)構(gòu)預(yù)測9精選ppt(二)生物信息學(xué)的主要研究內(nèi)容1.生物信息的收集、存儲、管理基因組數(shù)據(jù)庫
蛋白質(zhì)序列數(shù)據(jù)庫
蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫
DDBJEMBLGenBankSWISS-PROTPDBPIR1、生物分子數(shù)據(jù)的收集與管理10精選ppt基因組蛋白質(zhì)蛋白質(zhì)DDBJEMBLGenBankSWISS-2、數(shù)據(jù)庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。11精選ppt2、數(shù)據(jù)庫搜索及序列比較搜索同源序列在一定程度上就是通過發(fā)現(xiàn)同源分子12精選ppt發(fā)現(xiàn)同源分子12精選ppt3、基因組序列分析遺傳語言分析——天書基因組結(jié)構(gòu)分析基因識別基因功能注釋基因調(diào)控信息分析基因組比較13精選ppt3、基因組序列分析遺傳語言分析——天書13精選ppt4、基因表達(dá)數(shù)據(jù)的分析與處理基因表達(dá)數(shù)據(jù)分析是目前生物信息學(xué)研究的熱點和重點目前對基因表達(dá)數(shù)據(jù)的處理主要是進行聚類分析,將表達(dá)模式相似的基因聚為一類,在此基礎(chǔ)上尋找相關(guān)基因,分析基因的功能
14精選ppt4、基因表達(dá)數(shù)據(jù)的分析與處理基因表達(dá)數(shù)據(jù)分析是目前生物信息學(xué)基因芯片15精選ppt基因芯片15精選ppt二維電泳圖16精選ppt二維電泳圖16精選ppt5、蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定,蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑蛋白質(zhì)結(jié)構(gòu)預(yù)測分為:二級結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測蛋白質(zhì)折疊17精選ppt5、蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定,二級結(jié)構(gòu)預(yù)測在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題
在二級結(jié)構(gòu)預(yù)測方面主要方法有:立體化學(xué)方法圖論方法統(tǒng)計方法最鄰近決策方法基于規(guī)則的專家系統(tǒng)方法分子動力學(xué)方法人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測準(zhǔn)確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的PHD系統(tǒng)18精選ppt二級結(jié)構(gòu)預(yù)測18精選ppt空間結(jié)構(gòu)預(yù)測在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型法該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu)運用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測工作19精選ppt空間結(jié)構(gòu)預(yù)測在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型(三)生物信息學(xué)研究現(xiàn)狀與展望
1.國外生物信息學(xué)研究現(xiàn)狀2.我國生物信息學(xué)研究現(xiàn)狀3.我國生物信息學(xué)研究目標(biāo)
實現(xiàn)基因組數(shù)據(jù)、蛋白質(zhì)組和結(jié)構(gòu)基因組數(shù)據(jù)、天然及合成化合物數(shù)據(jù)的計算機處理、分析和可視化,以及生物實驗和生物分子的模擬設(shè)計,解析蛋白質(zhì)三維結(jié)構(gòu)和蛋白質(zhì)組的時空表達(dá)關(guān)系等20精選ppt(三)生物信息學(xué)研究現(xiàn)狀與展望1.國外生物信息學(xué)研究現(xiàn)狀2蛋白質(zhì)研究為生物信息學(xué)提供了極為豐富的研究數(shù)據(jù),極大地推動了生物信息學(xué)的發(fā)展。生物信息學(xué)在蛋白質(zhì)的序列分析、結(jié)構(gòu)預(yù)測、功能預(yù)測、分子設(shè)計等方面具有重要應(yīng)用。二、生物信息學(xué)與蛋白質(zhì)
21精選ppt二、生物信息學(xué)與蛋白質(zhì)
21精選ppt
序列比對是生物信息學(xué)的基礎(chǔ),通過比較兩個或多個蛋白質(zhì)序列的相似區(qū)域和保守性位點,確定相互間具有共同功能的序列模式和分子進化關(guān)系,進一步分析其結(jié)構(gòu)和功能。把未知結(jié)構(gòu)的蛋白質(zhì)序列與已知具有三維結(jié)構(gòu)的蛋白質(zhì)序列進行序列比對,有助于進一步了解該未知結(jié)構(gòu)蛋白質(zhì)的空間折疊信息(一)蛋白質(zhì)序列分析22精選ppt
序列比對是生物信息學(xué)的基礎(chǔ),通過比較兩個或多個蛋白質(zhì)序列的(二)蛋白質(zhì)結(jié)構(gòu)預(yù)測
蛋白質(zhì)結(jié)構(gòu)預(yù)測內(nèi)容二級結(jié)構(gòu)預(yù)測三維結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測方法
理論分析方法:是在理論計算的基礎(chǔ)上進行結(jié)構(gòu)預(yù)測。統(tǒng)計分析方法:是在對已知結(jié)構(gòu)的蛋白質(zhì)進行統(tǒng)計分析的基礎(chǔ)上,建立由序列到結(jié)構(gòu)的映射模型,對未知結(jié)構(gòu)的蛋白質(zhì)直接從氨基酸序列預(yù)測其結(jié)構(gòu)。23精選ppt(二)蛋白質(zhì)結(jié)構(gòu)預(yù)測
蛋白質(zhì)結(jié)構(gòu)預(yù)測內(nèi)容23精選ppt
是否未知蛋白序列與已知功能的蛋白質(zhì)相似確定跨膜螺旋、卷曲螺旋和前導(dǎo)序列未知序列是否包含保守序列模體查對PROSITE數(shù)據(jù)庫庫查對BLOCKS和PRINTS數(shù)據(jù)庫整理所有肯定的結(jié)果并核對一致性預(yù)測蛋白質(zhì)功能蛋白質(zhì)功能預(yù)測流程圖(三)蛋白質(zhì)功能預(yù)測(引自HPDB蛋白質(zhì)數(shù)據(jù)庫(/prediction/subprediction/functionalflowchat.asp)24精選ppt
是否未知蛋白序列與已知功能的蛋白質(zhì)相似確定跨膜螺旋、卷曲螺(四)蛋白質(zhì)分子設(shè)計蛋白質(zhì)分子設(shè)計類型:按照被改造部位的多少可以分為“小改”、“中改”和“大改”三種。
“小改”:即通過對目標(biāo)蛋白質(zhì)進行定位突變或化學(xué)修飾改變其結(jié)構(gòu)和功能?!爸懈摹保杭赐ㄟ^對來源于不同蛋白質(zhì)的結(jié)構(gòu)域進行拼接和組裝,從而較大程度的改變其結(jié)構(gòu)和功能?!按蟾摹保杭赐耆珡念^設(shè)計出一種具有特異結(jié)構(gòu)與功能的全新蛋白質(zhì)。25精選ppt(四)蛋白質(zhì)分子設(shè)計蛋白質(zhì)分子設(shè)計類型:按照被改造部位的多少常用的數(shù)據(jù)庫有:核酸序列數(shù)據(jù)庫(NucleotideSequenceDatabases)RNA序列數(shù)據(jù)庫(RNAsequencedatabases)蛋白質(zhì)序列數(shù)據(jù)庫(Proteinsequencedatabases)結(jié)構(gòu)數(shù)據(jù)庫(StructureDatabases)基因組數(shù)據(jù)庫(GenomicsDatabases(non-vertebrate))代謝酶相關(guān)產(chǎn)物(MetabolicandSignalingPathways)人類和其他脊椎動物基因組(HumanandotherVertebrateGenomes)人類基因和疾?。℉umanGenesandDiseases)芯片和其他基因表達(dá)數(shù)據(jù)庫(MicroarrayDataandotherGeneExpressionDatabases);蛋白組資源(ProteomicsResources);其他分子生物學(xué)數(shù)據(jù)庫(OtherMolecularBiologyDatabases)細(xì)胞器官數(shù)據(jù)庫(Organelledatabases);植物數(shù)據(jù)庫(Plantdatabases);免疫學(xué)數(shù)據(jù)庫(Immunologicaldatabases)第二節(jié)常用數(shù)據(jù)庫26精選ppt常用的數(shù)據(jù)庫有:第二節(jié)常用數(shù)據(jù)庫26精選ppt生物信息學(xué)數(shù)據(jù)庫類型一次數(shù)據(jù)庫:數(shù)據(jù)直接來源于實驗獲得的原始數(shù)據(jù),僅對原始數(shù)據(jù)進行簡單的歸類整理和注釋。如Genbank、EMBL和DDBJ等核酸序列數(shù)據(jù)庫;SWISS-PROT、PIR等蛋白質(zhì)序列數(shù)據(jù)庫;PDB等蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫。二次數(shù)據(jù)庫:針對不同的研究內(nèi)容和需要在一次數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上對相關(guān)生物學(xué)知識和信息進行進一步分析和整理。如人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點庫TRANSFAC、蛋白質(zhì)結(jié)構(gòu)家族分類庫SCOP等。27精選ppt生物信息學(xué)數(shù)據(jù)庫類型27精選ppt圖6-2生物信息學(xué)數(shù)據(jù)庫相互關(guān)系生物信息學(xué)數(shù)據(jù)庫相互關(guān)系28精選ppt圖6-2生物信息學(xué)數(shù)據(jù)庫相互關(guān)系生物信息學(xué)數(shù)據(jù)庫常用數(shù)據(jù)庫類型名稱網(wǎng)址核酸序列一次數(shù)據(jù)庫Genebank/Genbank/EMBLhttp://www.ebi.ac.uk/embl/DDBJhttp://www.ddbj.nig.ac.jp/Welcome.html.ja/基因組一次數(shù)據(jù)庫GDB/蛋白質(zhì)序列一次數(shù)據(jù)庫SWISS-PROT/sprot/PIR/TrEMBLhttp://www.ebi.ac.uk/trembl/UniProt/index.shtml/MIPShttp://mips.gsf.de/GenPept/pub/genpept/NRL-3D/general/software/packages/nrl_3d/nrl_3d.html/復(fù)合數(shù)據(jù)庫NRDBhttp://www.nrdb.co.uk/OWLhttp://www.bioinf.manchester.ac.uk/dbbrowser/OWL/SWISS-PROT+TrEMBLhttp://www.ebi.ac.uk/clustr/
二次數(shù)據(jù)庫PROSITE/prosite/PRINTShttp://www.bioinf.man.ac.uk/dbbrowser/PRINTS/BLOCKS/Pfamhttp://pfam.sanger.ac.uk/IDENTIFY/identify/COGs/COG/ProDomhttp://www.toulouse.inra.fr/prodom.html/29精選ppt常用數(shù)據(jù)庫類型名稱網(wǎng)結(jié)構(gòu)一次數(shù)據(jù)庫PDB/pdb/home/home.doMMDB/Structure/MMDB/mmdb.shtml/
二次數(shù)據(jù)庫DSSPhttp://www.sander.embl-heidelberg.de/dssp/HSSPhttp://www.sander.embl-heidelberg.de/hssp/FSSPhttp://www.ebi.ac.uk/dali/fssp/PSdb/~geigel/PSdb/PSdb.html/
結(jié)構(gòu)分類SCOPhttp://scop.mrc-lmb.cam.ac.uk/scop/CATH/latest/index.html/PDBsumhttp://www.ebi.ac.uk/thornton-srv/databases/pdbsum/分類二次數(shù)據(jù)庫ProtoMap蛋白質(zhì)組
蛋白質(zhì)組
氨基酸索引AAindexhttp://www.genome.ad.jp/dbget/蛋白質(zhì)間功能關(guān)系Predictome/蛋白質(zhì)組分析ProteomeAnalysishttp://www.ebi.ac.uk/integr8/EBI-Integr8-HomePage.do/二維凝膠電泳GELBANK/SWISS-2DPAGE/ch2d/酵母蛋白質(zhì)定位YPL.dbhttp://ypl.tugraz.at/模式生物蛋白質(zhì)組BioknowledgeLibrnary/pages/index.php?id=home/30精選ppt結(jié)構(gòu)一次數(shù)據(jù)庫PDB
一、核酸數(shù)據(jù)庫
(一)核酸序列數(shù)據(jù)庫目前,國際上主要有Genbank、EMBL、DDBJ三大核酸序列數(shù)據(jù)庫,三大核酸數(shù)據(jù)庫之間每天相互交換數(shù)據(jù),保持?jǐn)?shù)據(jù)同步更新。31精選ppt
一、核酸數(shù)據(jù)庫
(一)核酸序列數(shù)據(jù)庫31精選ppt1.Genbank
Genbank由美國國立生物技術(shù)信息中心(NCBI)建立維護,其主頁如圖6-3所示。32精選ppt1.Genbank
Genbank由美國國立生物技術(shù)信息中Genbank數(shù)據(jù)直接來源測序工作者提交的序列、測序中心提交的大量EST序列、其它測序數(shù)據(jù)以及與其它數(shù)據(jù)機構(gòu)協(xié)作交換的數(shù)據(jù)。Genbank內(nèi)容所有已知的核酸序列和蛋白質(zhì)序列,還包括對序列的簡要描述、科學(xué)命名、物種分類名稱、參考文獻(xiàn)、序列特征表等輔助信息。Genbank對數(shù)據(jù)記錄的處理劃分為細(xì)菌類、病毒類、靈長類、嚙齒類,EST數(shù)據(jù)、基因組測序數(shù)據(jù)、大規(guī)?;蚪M序列數(shù)據(jù)等16類。33精選pptGenbank數(shù)據(jù)直接來源33精選ppt(1)Genbank數(shù)據(jù)檢索
通過NCBI首頁“Search”選項中的“gene”或“Nucleotide”等選項,在檢索窗口輸入檢索詞進行直接檢索;利用NCBI網(wǎng)站的綜合生物信息數(shù)據(jù)庫檢索系統(tǒng)Entrez提供的限制條件(Limits)、索引(Index)、檢索歷史(History)和剪貼板(Clipboard)等功能進行精細(xì)檢索圖6-4NCBI-Entrzgene檢索界面34精選ppt(1)Genbank數(shù)據(jù)檢索
通過NCBI首頁“Searc35精選ppt35精選pptEntrez綜合生物信息數(shù)據(jù)庫檢索系統(tǒng)將核酸序列、蛋白質(zhì)序列、基因圖譜、蛋白質(zhì)結(jié)構(gòu)等數(shù)據(jù)庫整合在一起。而且可以通過其生物醫(yī)學(xué)文獻(xiàn)摘要數(shù)據(jù)庫(MEDLINE),獲取序列相關(guān)的文獻(xiàn)信息??梢岳肊ntrezcross-database數(shù)據(jù)庫進行綜合信息檢索(圖6-5)。圖6-5NCBI-Entrezcross-database檢索界面36精選pptEntrez綜合生物信息數(shù)據(jù)庫檢索系統(tǒng)將美國國家生物技術(shù)信息中心(NCBI)EntrezEntrez,TheLifeSciencesSearchEngine37精選ppt美國國家生物技術(shù)信息中心(NCBI)EntrezEntrPubMed:
biomedicalliteraturecitationsandabstracts
是一個醫(yī)學(xué)文獻(xiàn)網(wǎng)絡(luò)搜索界面
BLAST(BasicLocalAlignmentsearchTool)
是DNA或氨基酸序列比對分析的重要軟件38精選pptPubMed:biomedicalliterature
OMIM:
onlineMendelianInheritanceinMan人類孟德爾遺傳數(shù)據(jù)庫在線
Books:
onlinebooks39精選ppt
OMIM:onlineMendelianInher
TaxBrowser:Taxonomybrowser分類瀏覽器Structure:該目錄下最重要的資源是分子模型數(shù)據(jù)庫MMDB及Cn3D生物大分子三維模型查看軟件
40精選pptTaxBrowser:TaxonomybrowserStEMBL和GenBank數(shù)據(jù)庫識別標(biāo)志EMBL識別標(biāo)志GenBank識別標(biāo)志含義IDLOCUS標(biāo)識字符串及短描述字XX為閱讀清晰而加的空行ACACCESSION唯一的提取號SVVERSION序列版本號DTDATE建立日期DEDEFINITION簡單的描述KWKEYWORDS關(guān)鍵字OSSOURCE來源生物體OCORGANISM生物體分類譜系RNREFERENCE引文編號RCREMARK引文注釋RP其他注釋RXMEDLINEMEDLINE引文代碼41精選pptEMBL和GenBank數(shù)據(jù)庫識別標(biāo)志GenBank識別標(biāo)志RAAUTHORS引文作者RTTITLE引文題目RLJOURNAL引文出處CCCOMMENT評注DR相關(guān)數(shù)據(jù)庫交叉引用號FHFEATURES特性表頭FT特征表SQEMBL序列開始,后跟長度、字母數(shù)BASECOUNTGeneBank堿基數(shù)ORIGINGeneBank序列開始標(biāo)志,為空行////序列結(jié)束標(biāo)志42精選pptRAAUTHORS引文作者RTTITLE引文題目RLJOURGenBank核酸數(shù)據(jù)庫實例
以人畜共患的病源菌鼠傷寒沙門氏菌(Salmonellatyphimurium)H1相抗原基因H-1-i為例,簡要說明GenBank核酸數(shù)據(jù)庫的數(shù)據(jù)格式。LOCUSSTYFLGH1I1485bpDNAlinearBCT26-APR-1993DEFINITIONSalmonellatyphimuriumH-1-igeneencodingphase1flagellarfilamentprotein(flagellin),completecds.ACCESSIONM11332VERSIONM11332.1GI:153978KEYWORDSflagellin.SOURCESalmonellatyphimuriumORGANISMSalmonellatyphimuriumBacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;Enterobacteriaceae;Salmonella.REFERENCE1(bases1to1485)AUTHORSJoys,T.M.TITLEThecovalentstructureofthephase-1flagellarfilamentproteinof
Salmonella
typhimuriumanditscomparisonwithotherflagellinsJOURNALJ.Biol.Chem.260(29),15758-15761(1985)PUBMED2999134序列標(biāo)識簡單描述序列編號版本號關(guān)鍵詞物種來源物種分類引文編號引文作者引文標(biāo)題引文出處43精選pptGenBank核酸數(shù)據(jù)庫實例以人畜COMMENTOriginalsourcetext:S.typhimuriumSL877DNA.Draftentryandcleancopysequencefor[1]kindlyprovidedbyT.M.Joyce,18-FEB-1986.IndividualSalmonellaserotypesusuallyalternatebetweentheproductionoftwoantigenicformsofflagella,termedphase-1andphase-2,eachspecifiedbyseparatestructuralgenes.Bothendsoftheflagellingeneactintheregulationofflagellinsynthesis.FEATURESLocation/Qualifierssource1..1485/organism="Salmonella
typhimurium"/mol_type="genomicDNA"/db_xref="taxon:602"CDS13..1485/note="phase-1flagellarfilamentprotein"/codon_start=1/transl_table=11/protein_id="AAA27072.1"/db_xref="GI:153979"評注特征表編碼區(qū)44精選pptCOMMENTOriginalsourcete/translation="MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVNGQTQFSGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQQKYKVSDTAATVTGYADTTIALDNSTFKASATGLGGTDEKIDGDLKFDDTTGKYYAKVTVTGGTGKDGYYEVSVDKTNGEVTLAAVTPATVTTATALSGKMYSANPDSDIAKAALTAAGVTGTASVVKMSYTDNNGKTIDGGLAVKVGDDYYSATQDKDGSISIDTTKYTADNGTSKTALNKLGGADGKTEVVTIDGKTYNASKAAGHDFKAEPELAEQAAKTTENPLQKIDAALAQVDTLRSDLGAVQNRFNSAITNLGNTVNNLSSARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR"ORIGIN98bpupstreamofTaqIsite.1aaggaaaagatcatggcacaagtcattaatacaaacagcctgtcgctgttgacccagaat61aacctgaacaaatcccagtccgctctgggcaccgctatcgagcgtctgtcttccggtctg121cgtatcaacagcgcgaaagacgatgcggcaggtcaggcgattgctaaccgttttaccgcg181aacatcaaaggtctgactcaggcttcccgtaacgctaacgacggtatctccattgcgcag241accactgaaggcgcgctgaacgaaatcaacaacaacctgcagcgtgtgcgtgaactggcg301gttcagtctgctaacagcaccaactcccagtctgacctcgactccatccaggctgaaatc蛋白序列基因序列45精選ppt/translation="MAQVINTNSLSL361acccagcgtctgaacgaaatcgaccgtgtaaatggccagactcagttcagcggcgtgaaa421gtcctggcgcaggacaacaccctgaccatccaggttggtgccaacgacggtgaaactatc481gatatcgatctgaagcagatcaactctcagaccctgggtctggatacgctgaatgtgcaa541caaaaatataaggtcagcgatacggctgcaactgttacaggatatgccgatactacgatt601gctttagacaatagtacttttaaagcctcggctactggtcttggtggtactgacgagaaa661attgatggcgatttaaaatttgatgatacgactggaaaatattacgccaaagttaccgtt721acggggggaactggtaaagatggctattatgaagtttccgttgataagacgaacggtgag781gtgactcttgctgcggtcactcccgctacagtgactactgcgacagcactgagtggaaaa841atgtacagtgcaaatcctgattctgacatagctaaagccgcattgacagcagcaggtgtt901accggcacagcatctgttgttaagatgtcttatactgataataacggtaaaactattgat961ggtggtttagcagttaaggtaggcgatgattactattctgcaactcaagataaagatggt1021tccataagtattgatactacgaaatacactgcagataacggtacatccaaaactgcacta1081aacaaactgggtggcgcagacggcaaaaccgaagtcgttactatcgacggtaaaacctac1141aatgccagcaaagccgctggtcatgatttcaaagcagaaccagagctggcggaacaagcc1201gctaaaaccaccgaaaacccgctgcagaaaattgatgctgctttggcacaggttgacacg1261ttacgttctgacctgggtgcggtacagaaccgtttcaactccgctattaccaacctgggc1321aacaccgtaaacaacctgtcttctgcccgtagccgtatcgaagattccgactacgcgacc1381gaagtctccaacatgtctcgcgcgcagattctgcagcaggccggtacctccgttctggcg1441caggcgaaccaggttccgcaaaacgtcctctctttactgcgttaa//
記錄結(jié)束46精選ppt361acccagcgtctgaacgaaatcgac
少量序列利用BankIt提交,大量序列利用Sequin程序進行提交。NCBI網(wǎng)站提供數(shù)據(jù)查詢、序列相似性搜索等服務(wù),從其FTP服務(wù)器上可免費下載Genbank數(shù)據(jù)。NCBI網(wǎng)址:/BankIt網(wǎng)址:/BankIt/Sequin網(wǎng)址:/Sequin/Genebank網(wǎng)址:/Genbank/Entrezgene網(wǎng)址:/sites/entrez?db=geneEntrezcross-database網(wǎng)址:/sites/gquery/(2)向Genbank提交序列數(shù)據(jù)47精選ppt
少量序列利用BankIt提交,大量序列利用Sequin程EMBL核酸序列數(shù)據(jù)庫創(chuàng)建于1982年,由歐洲生物信息學(xué)研究所(EBI)管理維護。使用序列提取系統(tǒng)(SRS)進行查詢檢索,利用基于網(wǎng)絡(luò)的WEBIN工具,或利用Sequin軟件向EMBL核酸序列數(shù)據(jù)庫提交序列。
EMBL網(wǎng)址:http://www.ebi.ac.uk/embl/SRS的網(wǎng)址:http://srs.ebi.ac.uk/WEBIN網(wǎng)址:http://www.ebi.ac.uk/webin-align/webinalign_help.html/Sequin網(wǎng)址:http://www.ebi.ac.uk/Sequin/2.EMBL核酸序列數(shù)據(jù)庫
48精選pptEMBL核酸序列數(shù)據(jù)庫創(chuàng)建于1982年,由歐洲生物信息學(xué)研究DDBJ核酸序列數(shù)據(jù)庫創(chuàng)建于1986年,由日本國家遺傳學(xué)研究所負(fù)責(zé)維護和管理。使用SRS工具進行數(shù)據(jù)檢索和序列分析,利用Sequin軟件向該數(shù)據(jù)庫提交序列。為方便檢索DDBJ主頁可進行日文和英文互換。DDBJ的日文版網(wǎng)址:http://www.ddbj.nig.ac.jp/index-j.html/DDBJ的英文版網(wǎng)址:http://www.ddbj.nig.ac.jp/index-e.html/3.DDBJ數(shù)據(jù)庫49精選pptDDBJ核酸序列數(shù)據(jù)庫創(chuàng)建于1986年,由日本國家遺傳學(xué)研究
(二)基因組數(shù)據(jù)庫GDB
基因組數(shù)據(jù)庫(GDB)創(chuàng)建于1990年,是一個專門匯集人類基因組數(shù)據(jù)的數(shù)據(jù)庫,以對象模型來保存數(shù)據(jù),提供基于網(wǎng)絡(luò)的數(shù)據(jù)對象檢索服務(wù),可搜索各種類型的對象,并以圖形方式觀看基因組圖譜。GDB的網(wǎng)址是:/50精選ppt
(二)基因組數(shù)據(jù)庫GDB
基因組數(shù)據(jù)庫(GDB)創(chuàng)建于19(一)蛋白質(zhì)序列數(shù)據(jù)庫常用的蛋白質(zhì)序列數(shù)據(jù)庫有SWISS-PROT、PIR、TrEMBL、UniProt、GenPept等,分述如下。
1.SWISS-PROTSWISS-PROT數(shù)據(jù)庫提供蛋白質(zhì)序列查詢及相似蛋白質(zhì)序列搜索等服務(wù)。
二、蛋白質(zhì)數(shù)據(jù)庫51精選ppt(一)蛋白質(zhì)序列數(shù)據(jù)庫二、蛋白質(zhì)數(shù)據(jù)庫51精選ppt圖6-6Swiss-Prot數(shù)據(jù)庫網(wǎng)站主頁52精選ppt圖6-6Swiss-Prot數(shù)據(jù)庫網(wǎng)站主頁52精選pptSWISS-PROT數(shù)據(jù)庫內(nèi)容
核心數(shù)據(jù):包括蛋白質(zhì)序列、引用文獻(xiàn)、分類信息等。注釋:包括結(jié)構(gòu)域、功能位點、跨膜區(qū)域、二硫鍵位置、翻譯后修飾、與其它蛋白質(zhì)的相似性等。SWISS-PROT將廣泛收集的相關(guān)數(shù)據(jù)進行合并,且與蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫(PDB)等其他數(shù)據(jù)庫交互索引。通過SWISS-PROT數(shù)據(jù)庫可以得到某蛋白質(zhì)的序列,再通過交互引用從PDB數(shù)據(jù)庫得到其結(jié)構(gòu)。SWISS-PROT數(shù)據(jù)由數(shù)據(jù)行排列組成,數(shù)據(jù)格式與EMBL數(shù)據(jù)庫數(shù)據(jù)格式基本相同(見表6-3)。53精選pptSWISS-PROT數(shù)據(jù)庫內(nèi)容53精選ppt表6-3SWISS-PORT數(shù)據(jù)庫的行識別標(biāo)志及含義中止符號Terminationline//序列標(biāo)頭SequenceheaderSQ特征表FeaturetabledataFT關(guān)鍵詞KeywordsKW交叉引用數(shù)據(jù)庫Databasecross-referenceDR評注或注釋CommentsornotesCC引文出處ReferencelocationRL引文標(biāo)題ReferencetileRT引文作者ReferenceauthorsRA交叉引用Cross-referenceRX相關(guān)內(nèi)容ReferencecommentsRC引文位置ReferencepositionRP引文序號ReferencenumberRN物種分類OrganismclassificationOC來源細(xì)胞器OrganelleOG來源物種OrganismspeciesOS基因名稱Genename(s)GN描述DescriptionDE登錄日期或最后更新日期DateDT序列編號AccessionNumberAC標(biāo)識號IdentificationID含義全稱縮寫54精選ppt表6-3SWISS-PORT數(shù)據(jù)庫的行識別標(biāo)志及含義中以鼠傷寒沙門氏菌SalmonellatyphimuriumH1-i基因編碼的鞭毛蛋白FLIC_SALTY為例介紹SWISS-PORT數(shù)據(jù)庫的數(shù)據(jù)格式。55精選ppt以鼠傷寒沙門氏菌SalmonellatyphimuIDFLIC_SALTYReviewed;495AA.ACP06179;P97160;Q02871;Q56088;DT01-JAN-1988,integratedintoUniProtKB/Swiss-Prot.DT23-JAN-2007,sequenceversion4.DT24-JUL-2007,entryversion69.DEFlagellin(Phase1-Iflagellin).GNName=fliC;Synonyms=flaF,hag;OrderedLocusNames=STM1959;OSSalmonellatyphimurium.OCBacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;Enterobacteriaceae;Salmonella.OXNCBI_TaxID=602;RN[1]RPNUCLEOTIDESEQUENCE[GENOMICDNA].RXMEDLINE=86059460;PubMed=2999134;RAJoysT.M.;RT"Thecovalentstructureofthephase-1flagellarfilamentproteinofSalmonellatyphimuriumanditscomparisonwithotherflagellins.";RLJ.Biol.Chem.260:15758-15761(1985).序列標(biāo)識序列編號登錄日期描述基因名稱來源物種物種分類物種分類號引文序號引文位置交叉引用引文作者引文標(biāo)題引文出處SWISS-PROT數(shù)據(jù)庫條目實例56精選pptIDFLIC_SALTYRRN[9]RPNUCLEOTIDESEQUENCE[GENOMICDNA]OF476-495.RCSTRAIN=LT2/ATCC23564;……CC-!-FUNCTION:Flagellinisthesubunitproteinwhichpolymerizestoformthefilamentsofbacterialflagella.CC-!-MISCELLANEOUS:IndividualSalmonellaserotypesusuallyalternatebetweentheproductionof2antigenicformsofflagella,termedphase1andphase2,eachspecifiedbyseparatestructuralgenes,fliCandfljB.CC-!-SIMILARITY:Belongstothebacterialflagellinfamily.CCDREMBL;M11332;AAA27072.1;-;Genomic_DNA.DREMBL;D13689;BAA02846.1;-;Genomic_DNA.DREMBL;AE008787;AAL20871.1;-;Genomic_DNA.DREMBL;X51740;CAA36029.1;-;Genomic_DNA.DREMBL;J01801;AAA27074.1;-;Genomic_DNA.DRPIR;A24262;A24262.DRPIR;S16121;S16121.DRPDB;1IO1;X-ray;A=54-451.DRPDB;1P95;Model;A=57-451.DRPDB;1UCU;EM;A=1-495.相關(guān)內(nèi)容評注功能其他特性
相似性交叉引用數(shù)據(jù)庫EMBL核酸序列數(shù)據(jù)庫PIR蛋白序列數(shù)據(jù)庫
PDB蛋白結(jié)構(gòu)數(shù)據(jù)庫57精選pptRN[9]相關(guān)內(nèi)容57精選pptPE1:Evidenceatproteinlevel;KW3D-structure;Completeproteome;Flagellum.FTINIT_MET11Removed(Bysimilarity).FTCHAIN2495Flagellin.FT/FTId=PRO_0000182578.FTCONFLICT127127S->N(inRef.1).FTCONFLICT133133N->S(inRef.1).……FTHELIX332FTTURN3739FTHELIX4498關(guān)鍵詞特征表不同來源數(shù)據(jù)庫的沖突位點二級結(jié)構(gòu)信息58精選pptPE1:EvidenceatproteinleSQSEQUENCE495AA;51612MW;4BD7849FA3B936BACRC64;MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQQKYKVSDTAATVTGYADTTIALDNSTFKASATGLGGTDQKIDGDLKFDDTTGKYYAKVTVTGGTGKDGYYEVSVDKTNGEVTLAGGATSPLTGGLPATATEDVKNVQVANADLTEAKAALTAAGVTGTASVVKMSYTDNNGKTIDGGLAVKVGDDYYSATQNKDGSISINTTKYTADDGTSKTALNKLGGADGKTEVVSIGGKTYAASKAEGHNFKAQPDLAEAAATTTENPLQKIDAALAQVDTLRSDLGAVQNRFNSAITNLGNTVNNLTSARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR//序列標(biāo)頭蛋白質(zhì)序列記錄結(jié)束59精選pptSQSEQUENCE495AA;516122.PIR
PIR的子數(shù)據(jù)庫:蛋白質(zhì)序列數(shù)據(jù)庫(PIR-PSD)蛋白質(zhì)分類數(shù)據(jù)庫(iProClass)非冗余的蛋白質(zhì)參考資料數(shù)據(jù)庫(PIR-NREF)PIR數(shù)據(jù)庫按照數(shù)據(jù)性質(zhì)和注釋層次分四個部分:PIR1序列已經(jīng)驗證,注釋最為詳盡;PIR2為尚未確定的冗余序列;PIR3序列既未檢驗,也未注釋;PIR4序列來自其它渠道,既未驗證,也無注釋。美國國家生物醫(yī)學(xué)研究基金會與國際蛋白質(zhì)信息中心(PIR-International)共同維護。PIR是第一個蛋白質(zhì)分類和功能注釋數(shù)據(jù)庫60精選ppt2.PIRPIR的子數(shù)據(jù)庫:美國國家生物醫(yī)學(xué)研究基金會
PIR作用:提供基于文本的交互式檢索、序列相似性搜索以及結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級檢索。PIR網(wǎng)址:/61精選pptPIR作用:61精選ppt3.TrEMBL是一個經(jīng)計算機注釋的蛋白質(zhì)數(shù)據(jù)庫,采用SWISS-PROT數(shù)據(jù)庫格式。主要包含從EMBL/Genbank/DDBJ三大核酸數(shù)據(jù)庫中根據(jù)編碼序列翻譯的、尚未集成到SWISS-PROT數(shù)據(jù)庫中的蛋白質(zhì)序列。TrEMBL為SWISS-PROT數(shù)據(jù)庫及時提供補充。TrEMBL網(wǎng)址:http://www.ebi.ac.uk/trembl/62精選ppt3.TrEMBL是一個經(jīng)計算機注釋的蛋白質(zhì)數(shù)據(jù)庫,采用SWI4.UniProtUniProt將SWISS-PROT、PIR、TrEMBL三個數(shù)據(jù)庫合并。通過文本檢索、序列相似檢索以及UniProtFtp網(wǎng)站可獲得蛋白質(zhì)序列。如圖6-7所示圖6-7UniProt網(wǎng)站主頁63精選ppt4.UniProtUniProt將SWISS-PUniProt包含UniProtKB、UniRef和UniParc3個部分:(1)UniProtKB數(shù)據(jù)庫(UniProtKnowledgebase):蛋白質(zhì)序列、功能、分類、交叉引用等信息存取中心;(2)UniRef數(shù)據(jù)庫(UniProtReferenceClusters):為提高檢索的速度,將緊密相關(guān)的蛋白質(zhì)序列合并到同一條記錄中。目前,根據(jù)序列相似程度可將UniRef數(shù)據(jù)庫分為UniRef100、UniRef90和UniRef503個子庫(3)UniParc(UniProtArchive):儲存大量蛋白質(zhì)研究的歷史信息。64精選pptUniProt包含UniProtKB、UniRef和Uni利用UniProt可方便的進行蛋白質(zhì)序列的交互檢索,SalmonellatyphimuriumH-1項鞭毛蛋白P06176的UniProt檢索截圖如下。UniProt網(wǎng)址:/index.shtml65精選ppt利用UniProt可方便的進行蛋白質(zhì)序列的交互檢索圖6-8核心數(shù)據(jù)66精選ppt圖6-8核心數(shù)據(jù)66精選ppt圖6-9核心數(shù)據(jù)(續(xù))、引用文獻(xiàn)與評注67精選ppt圖6-9核心數(shù)據(jù)(續(xù))、引用文獻(xiàn)與評注67精選ppt圖6-10交互檢索與關(guān)鍵詞68精選ppt圖6-10交互檢索與關(guān)鍵詞68精選ppt圖6-11特征表與序列信息69精選ppt圖6-11特征表與序列信息69精選ppt5.GenPept數(shù)據(jù)庫GenPept數(shù)據(jù)庫特點由Genebank數(shù)據(jù)庫的核酸序列經(jīng)翻譯后產(chǎn)生。GenPept數(shù)據(jù)量大,隨核酸數(shù)據(jù)庫的更新而更新,但未經(jīng)實驗證實,也未有詳細(xì)注釋。
GenPept蛋白質(zhì)數(shù)據(jù)庫實例以鼠傷寒沙門氏菌S.typhimuriumH-1-i基因編碼的鞭毛蛋白為例進行GenPept數(shù)據(jù)庫檢索。70精選ppt5.GenPept數(shù)據(jù)庫GenPept數(shù)據(jù)庫特點70精選pGenPept蛋白質(zhì)數(shù)據(jù)庫實例LOCUSAAA27072490aalinearBCT26-APR-1993DEFINITIONphase-1flagellarfilamentprotein.ACCESSIONAAA27072VERSIONAAA27072.1GI:153979DBSOURCElocusSTYFLGH1IaccessionM11332.1KEYWORDS.SOURCESalmonellatyphimuriumORGANISMSalmonellatyphimuriumBacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;Enterobacteriaceae;Salmonella.REFERENCE1(residues1to490)AUTHORSJoys,T.M.TITLEThecovalentstructureofthephase-1flagellarfilamentproteinof
SalmonellatyphimuriumanditscomparisonwithotherflagellinsJOURNALJ.Biol.Chem.260(29),15758-15761(1985)PUBMED2999134COMMENTDraftentryandcleancopysequencefor[1]kindlyprovidedbyT.M.Joyce,18-FEB-1986.IndividualSalmonellaserotypesusuallyalternatebetweentheproductionoftwoantigenicformsofflagella,termedphase-1andphase-2,eachspecifiedbyseparatestructuralgenes.……序列標(biāo)識簡單描述序列編號版本號關(guān)鍵詞物種來源物種分類引文編號引文作者引文標(biāo)題引文出處評注71精選pptGenPept蛋白質(zhì)數(shù)據(jù)庫實例LOCUSAAAFEATURESLocation/Qualifierssource1..490/organism="Salmonellatyphimurium"/db_xref="taxon:602"
Protein1..490/name="phase-1flagellarfilamentprotein"Region1..490/region_name="PRK08026"/note="flagellin;PRK08026"/db_xref="CDD:76379"Region29..163/region_name="Flagellin_N"/note="BacterialflagellinN-terminus.Flagellinspolymerisetoformbacterialflagella.Thisfamilyincludesflagellinsandhookassociatedprotein3;pfam00669"/db_xref="CDD:64529"Region191..>256/region_name="Flagellin_D3"/note="FlagellinD3domain.ThisdomainisfoundinthecentralportionbacterialflagellinFliC.Thedomaincontainsastructuralmotifcalledabeta-foliumfold;pfam08884"/db_xref="CDD:72304"特征表72精選pptFEATURESLocation/
Region397..468/region_name="Flagellin_C"……/db_xref="CDD:64558"CDS1..490/coded_by="M11332.1:13..1485"/transl_table=11ORIGIN1maqvintnslslltqnnlnksqsalgtaierlssglrinsakddaagqaianrftanikg61ltqasrnandgisiaqttegalneinnnlqrvrelavqsanstnsqsdldsiqaeitqrl121neidrvngqtqfsgvkvlaqdntltiqvgandgetididlkqinsqtlgldtlnvqqkyk181vsdtaatvtgyadttialdnstfkasatglggtdekidgdlkfddttgkyyakvtvtggt241gkdgyyevsvdktngevtlaavtpatvttatalsgkmysanpdsdiakaaltaagvtgta301svvkmsytdnngktidgglavkvgddyysatqdkdgsisidttkytadngtsktalnklg361gadgktevvtidgktynaskaaghdfkaepelaeqaakttenplqkidaalaqvdtlrsd421lgavqnrfnsaitnlgntvnnlssarsriedsdyatevsnmsraqilqqagtsvlaqanq481vpqnvlsllr//蛋白質(zhì)序列記錄結(jié)束GenPept的網(wǎng)址是:/pub/genpept/73精選pptRegion397..468GenP國際上主要的蛋白質(zhì)序列數(shù)據(jù)庫的種類和特點
名稱維護單位注釋冗余度數(shù)據(jù)量更新PIRNCBI、JIPID、MIPS部分完善較大較大較慢SWISSPROTEBI、SIB完善小不大較慢NRL-3DNCBI完善小小較慢TrEMBLEBI、SIB不完善大大快GenPeptNCBI不完善大大快NRDBEBI一般小大較快OWLHGMP一般小大較慢(引自《生物信息學(xué)》,趙國屏等編著,科學(xué)出版社,2002)74精選ppt國際上主要的蛋白質(zhì)序列數(shù)據(jù)庫的種類和特點名稱維護單位注釋冗(二)蛋白質(zhì)序列二次數(shù)據(jù)庫
1.PROSITEPROSITE是蛋白質(zhì)家族保守區(qū)域和功能位點數(shù)據(jù)庫,也是第一個蛋白質(zhì)序列二次數(shù)據(jù)庫,收錄蛋白質(zhì)家族中同源序列多重比對所確定的保守性區(qū)域:如酶活性位點、配體結(jié)合位點、金屬離子結(jié)合位點、其它蛋白質(zhì)結(jié)合位點等已知具有重要生物學(xué)功能蛋白質(zhì)位點和序列模式。PROSITE數(shù)據(jù)庫組成包含Prosite(數(shù)據(jù)文件)和PrositeDoc(說明文件)兩個文件數(shù)據(jù)庫。PROSITE數(shù)據(jù)庫主頁如圖6-12所示。75精選ppt(二)蛋白質(zhì)序列二次數(shù)據(jù)庫1.PROSITE75精選ppt圖6-12PROSITE數(shù)據(jù)庫主頁76精選ppt圖6-12PROSITE數(shù)據(jù)庫主頁76精選pptPROSITE數(shù)據(jù)庫作用:可確定一段新蛋白質(zhì)序列中包含的功能位點以及其歸屬的蛋白質(zhì)家族。PROSITE的網(wǎng)址:http://www.expasy.ch/prosite/或/prosite/PROSITE的中國鏡像網(wǎng)址是:/prosite/77精選pptPROSITE數(shù)據(jù)庫作用:可確定一段新蛋白質(zhì)序列中包含的功能2.PRINTSPRINTS蛋白質(zhì)指紋圖譜數(shù)據(jù)庫將多個保守的序列模式作為識別蛋白質(zhì)家族的特征,與PROSITE數(shù)據(jù)庫的單個序列模式相比,PRINTS具有更好的識別率。PRINTS網(wǎng)址:http://www.bioinf.man.ac.uk/dbbrowser/PRINTS/78精選ppt2.PRINTS78精選ppt3.BLOCKS序列模塊(block):是通過序列比對得到的若干蛋白質(zhì)序列中具有較高相似性的序列片段。BLOCKS由通過自動檢測PROSITE數(shù)據(jù)庫和PRINTS蛋白質(zhì)指紋圖譜數(shù)據(jù)庫中蛋白質(zhì)家族高度保守區(qū)域產(chǎn)生的序列模塊組成。BLOCKS的網(wǎng)址:/79精選ppt3.BLOCKS79精選ppt(三)蛋白結(jié)構(gòu)數(shù)據(jù)庫
1.PDBPDB(ProteinDataBank)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫是國際上最完整的蛋白質(zhì)、核酸、糖類、蛋白質(zhì)-核酸復(fù)合物及病毒等生物大分子三維結(jié)構(gòu)數(shù)據(jù)庫。PDB主頁,如圖6-13所示。其數(shù)據(jù)庫增長曲線,如圖6-14所示。80精選ppt(三)蛋白結(jié)構(gòu)數(shù)據(jù)庫
1.PDB80精選ppt圖6-13PDB數(shù)據(jù)庫主頁81精選ppt圖6-13PDB數(shù)據(jù)庫主頁81精選ppt圖6-14結(jié)構(gòu)數(shù)據(jù)庫增長曲線截圖紅色圖:總結(jié)構(gòu)數(shù)藍(lán)色圖:新增結(jié)構(gòu)數(shù)(引自/pdb/statistics/contentGrowthChart.do?content=molType-protein&seqid=100)82精選ppt圖6-14結(jié)構(gòu)數(shù)據(jù)庫增長曲線截圖82精選pptPDB數(shù)據(jù)庫作用提供序列詳細(xì)信息、原子坐標(biāo)、三維結(jié)構(gòu)、交叉檢索等與結(jié)構(gòu)相關(guān)的信息。PDB數(shù)據(jù)庫實例以鼠傷寒沙門氏菌SalmonellatyphimuriumH1-i鞭毛蛋白(P06176)F41片段晶體結(jié)構(gòu)為例,圖示PDB數(shù)據(jù)庫格式(框6-4)和網(wǎng)頁格式(圖6-15)。三維結(jié)構(gòu)的動態(tài)展示(如圖6-16所示)。PDB的地址:/pdb/home/home.do83精選pptPDB數(shù)據(jù)庫作用83精選ppt框6-4PDB格式實例HEADERSTRUCTURALPROTEIN28-DEC-001IO1TITLECRYSTALSTRUCTUREOFF41FRAGMENTOFFLAGELLINCOMPNDMOL_ID:1;COMPND2MOLECULE:PHASE1FLAGELLIN;……SOURCEMOL_ID:1;SOURCE2ORGANISM_SCIENTIFIC:SALMONELLATYPHIMURIUM;……KEYWDSBETA-FOLIUM,FLAGELLINEXPDTAX-RAYDIFFRACTIONAUTHORF.A.SAMATEY,K.IMADA,S.NAGASHIMA,F.VONDERVISZ,T.KUMASAKA,AUTHOR2M.YAMAMOTO,K.NAMBAREVDAT215-APR-031IO11SOURCEDBREFSEQADVREVDAT104-APR-011IO10JRNLAUTHF.A.SAMATEY,K.IMADA,S.NAGASHIMA,F.VONDERVISZ,JRNLAUTH2T.KUMASAKA,M.YAMAMOTO,K.NAMBA……REMARK1REMARK2REMARK2RESOLUTION.2.00ANGSTROMS.
……標(biāo)頭題目化合物名稱來源關(guān)鍵詞作者發(fā)布日期相關(guān)文獻(xiàn)注釋84精選ppt框6-4PDB格式實例HEADERSTRUCTUSEQADV1IO1ALAA426UNPP06179GLY426CONFLICTSEQRES1A398PHETHRALAASNILELYSGLYLEUTHRGLNALASERARGSEQRES2A398ASNALAASNASPGLY
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鋁合金門窗承包合同
- 企業(yè)并購綠色環(huán)保技術(shù)交易合同
- 安全防范系統(tǒng)設(shè)計安裝及維護服務(wù)合同
- 美容店員工聘用合同
- 人工智能圖像識別系統(tǒng)開發(fā)合同
- 2025年住宅用地聯(lián)合競買合同3篇
- 2025年度事業(yè)單位合同管理信息化系統(tǒng)運維與支持服務(wù)3篇
- 2025年度木制家具產(chǎn)業(yè)投資與清包工合同范本3篇
- 2025年小時工網(wǎng)絡(luò)服務(wù)平臺服務(wù)合同2篇
- 施工合同范本解讀
- 建筑工地塔吊智能化發(fā)展趨勢分析
- 電梯年終工作總結(jié)2篇
- 導(dǎo)醫(yī)接待工作的常見問題與應(yīng)對策略
- 《客戶的分級》課件
- 信息技術(shù)與小學(xué)語文閱讀教學(xué)深度融合的策略研究
- 大連市船舶運輸與經(jīng)濟發(fā)展的市場研究報告
- GB/T 2881-2023工業(yè)硅
- DB3302T 1156-2023 水利水務(wù)設(shè)施基礎(chǔ)感知點位設(shè)置規(guī)范
- 內(nèi)科醫(yī)生的醫(yī)患關(guān)系與患者滿意度
- 小學(xué)生低年級語文閱讀能力評價標(biāo)準(zhǔn)及評價辦法
- 案例:伊通河中段水環(huán)境綜合整治工程
評論
0/150
提交評論