




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
獲取和蛋白質(zhì)序列信息第一頁(yè),共34頁(yè)。生物信息學(xué)(Bioinformatics)在生命科學(xué)研究中發(fā)展起來(lái)的一門由分子生物學(xué)和計(jì)算機(jī)信息處理技術(shù)相結(jié)合,以計(jì)算機(jī)為工具對(duì)生物信息進(jìn)行儲(chǔ)存、檢索、傳播、模擬和分析的交叉學(xué)科,它利用數(shù)據(jù)庫(kù)技術(shù)和軟件技術(shù)對(duì)大量積累的生物大分子序列數(shù)據(jù)和實(shí)驗(yàn)測(cè)定的序列進(jìn)行比較和分析,揭示出生物大分子的分子結(jié)構(gòu)、功能和進(jìn)化關(guān)系以及基因組構(gòu)成與基因表達(dá)等生物學(xué)事件對(duì)生命活動(dòng)的影響。第二頁(yè),共34頁(yè)。生物信息數(shù)據(jù)庫(kù)種類:基因組數(shù)據(jù)庫(kù)、核酸和蛋白質(zhì)一級(jí)結(jié)構(gòu)序列數(shù)據(jù)庫(kù)、生物大分子(主要是蛋白質(zhì))三維空間結(jié)構(gòu)數(shù)據(jù)庫(kù)、以上述三類一次數(shù)據(jù)庫(kù)和文獻(xiàn)資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫(kù)。第三頁(yè),共34頁(yè)。一次、二次數(shù)據(jù)庫(kù)特點(diǎn)一次數(shù)據(jù)庫(kù)的數(shù)據(jù)量大、更新速度快、用戶面廣,存在過(guò)多的甬余數(shù)據(jù)。而二次數(shù)據(jù)庫(kù)的容量比較小,更新速度也沒有一次數(shù)據(jù)庫(kù)那樣快,經(jīng)過(guò)篩選后,避免了過(guò)多的甬余數(shù)據(jù)。第四頁(yè),共34頁(yè)。根據(jù)數(shù)據(jù)庫(kù)存儲(chǔ)的內(nèi)容可將生物信息學(xué)數(shù)據(jù)庫(kù)分為:核酸、蛋白質(zhì)、基因圖譜、結(jié)構(gòu)、文獻(xiàn)等數(shù)據(jù)庫(kù)第五頁(yè),共34頁(yè)。第二節(jié)核酸序列數(shù)據(jù)庫(kù)
一、GenBank數(shù)據(jù)庫(kù)
GenBank是一個(gè)綜合數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)中包含了已經(jīng)公開的260000余種不同物種生物的核酸序列,這些數(shù)據(jù)主要是由全世界不同實(shí)驗(yàn)室和大規(guī)模測(cè)序計(jì)劃提交給GenBank的。第六頁(yè),共34頁(yè)。GenBank是具有目錄和生物學(xué)注釋的核酸序列綜合數(shù)據(jù)庫(kù),由國(guó)家醫(yī)學(xué)圖書館(NLM)的國(guó)家生物技術(shù)信息中心(NCBI)構(gòu)建、維護(hù)和管理。該中心位于馬里蘭國(guó)家健康研究所(NIH)。NCBI構(gòu)建GenBank數(shù)據(jù)庫(kù)的序列數(shù)據(jù)來(lái)至序列發(fā)現(xiàn)者提交的序列、批量提交的表達(dá)序列標(biāo)簽(EST)、基因組測(cè)序序列(GSS)和其它測(cè)序中心的高通量數(shù)據(jù),以及專利商標(biāo)局提供的已發(fā)表專利的序列數(shù)據(jù)。第七頁(yè),共34頁(yè)。GenBank、EMBL、DDBJ組成國(guó)際核酸序列數(shù)據(jù)庫(kù)合作組織(INSDC),該組織成員遠(yuǎn)程合作,每天相互交換數(shù)據(jù)以保證序列信息的一致性和完整性。第八頁(yè),共34頁(yè)。檢索GenBank數(shù)據(jù)
Entrez檢索系統(tǒng)
BLAST序列相似性搜索程序用FTP獲取GenBank
數(shù)據(jù)庫(kù)第九頁(yè),共34頁(yè)。Entrez系統(tǒng)使用Entrez()可以訪問GenBank中的序列記錄,Entrez是一個(gè)靈活的數(shù)據(jù)庫(kù)檢索系統(tǒng),可以檢索35個(gè)數(shù)據(jù)庫(kù)。Entrez數(shù)據(jù)庫(kù)包含來(lái)源于GenBank和其它資源的DNA和蛋白序列,還包括基因組圖譜、種群、進(jìn)化和環(huán)境序列序列數(shù)據(jù)集、基因表達(dá)數(shù)據(jù)、NCBI分類學(xué)、蛋白結(jié)構(gòu)域信息和來(lái)源于MolecularModelingDatabase(MMDB)的蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù),每個(gè)數(shù)據(jù)庫(kù)經(jīng)由PubMed和PubMedCentral與學(xué)術(shù)文獻(xiàn)關(guān)聯(lián)。第十頁(yè),共34頁(yè)。BLAST序列相似性搜索序列相似性搜索是GenBank數(shù)據(jù)最基本和使用最多的分析方式。NCBI提供BLAST()系列程序檢測(cè)一條查詢序列與數(shù)據(jù)庫(kù)所有序列的相似性。BLAST搜索可以在NCBI網(wǎng)站上運(yùn)行,也可以在FTP站點(diǎn)下載獨(dú)立的程序集運(yùn)行。第十一頁(yè),共34頁(yè)。用FTP獲取GenBankNCBI以傳統(tǒng)的純文本文件格式發(fā)布GenBank,還以格式用以內(nèi)部維護(hù)。通過(guò)NCBI匿名FTP()站點(diǎn)可以獲得每?jī)蓚€(gè)月的全文公告和每天與EMBL和DDBJ數(shù)據(jù)更新內(nèi)容,還可以從印第安納大學(xué)的鏡像站點(diǎn)()下載。在“genbank”目錄中的“daily-nc”文件夾中可以獲得純文本的更新數(shù)據(jù)壓縮文件。在GenBankFTP站點(diǎn)的“tools”目錄中提供轉(zhuǎn)換每日更新數(shù)據(jù)集的腳本。第十二頁(yè),共34頁(yè)。EMBL數(shù)據(jù)庫(kù)
EMBL核苷序列數(shù)據(jù)庫(kù)()是歐洲主要的核苷序列收集單位。這個(gè)數(shù)據(jù)庫(kù)是由歐洲生物信息中心EBI(歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)在德國(guó)海德堡的站點(diǎn))維護(hù)的。第十三頁(yè),共34頁(yè)。EBI核苷數(shù)據(jù)來(lái)自基因組測(cè)序中心、個(gè)別科學(xué)家、歐洲專利局、以及與合作伙伴DDBJ(Japan)和GenBank(USA)交換的數(shù)據(jù)。為了達(dá)到最佳的同步性,每天DDBJ/EMBL/GenBank之間都要交換最新的數(shù)據(jù)。用戶只要進(jìn)入三者中任意一個(gè)數(shù)據(jù)庫(kù)都能得到最新數(shù)據(jù)。這三個(gè)數(shù)據(jù)庫(kù)之間堅(jiān)持統(tǒng)一的文件指導(dǎo)方針,規(guī)范了數(shù)據(jù)庫(kù)登錄的內(nèi)容和語(yǔ)法。這種指導(dǎo)方針確保了這些數(shù)據(jù)庫(kù)的信息以一種便捷的格式進(jìn)行交換,它與當(dāng)今的生物信息學(xué)軟件兼容,反映了分子生物學(xué)領(lǐng)域的發(fā)展。第十四頁(yè),共34頁(yè)。DDBJ數(shù)據(jù)庫(kù)
DNA數(shù)據(jù)庫(kù)(DDBJ)是在亞洲唯一的核酸序列數(shù)據(jù)庫(kù),是公認(rèn)搜集研究者獲得的核酸序列數(shù)據(jù)庫(kù),并且,發(fā)放給數(shù)據(jù)提交者國(guó)際認(rèn)證的核酸序列編號(hào)。由于DDBJ每天將搜集的數(shù)據(jù)與EML-Bank/EBI和GenBank/NCBI進(jìn)行交換,使得三個(gè)核酸數(shù)據(jù)庫(kù)幾乎在任何時(shí)候都享有相同數(shù)據(jù)。這種幾乎統(tǒng)一的數(shù)據(jù)庫(kù)被稱作“國(guó)際核酸序列數(shù)據(jù)庫(kù)(INSD)”。DDBJ主要收集來(lái)自研究者獲得的序列數(shù)據(jù),但也收集數(shù)據(jù)和發(fā)放編號(hào)給任何其它國(guó)家的研究者。第十五頁(yè),共34頁(yè)。其他重要的核酸序列數(shù)據(jù)庫(kù):dbESTncRNAdbmiRBase第十六頁(yè),共34頁(yè)。dbEST是GenBank中的一個(gè)子數(shù)據(jù)庫(kù),包含來(lái)源于不同物種的表達(dá)序列數(shù)據(jù)和表達(dá)序列標(biāo)簽序列的其它信息。非編碼RNA(ncRNA)數(shù)據(jù)庫(kù)旨在提供非編碼RNA的序列和功能信息。非編碼轉(zhuǎn)錄物不編碼蛋白質(zhì),但在細(xì)胞中起調(diào)節(jié)作用。目前,該數(shù)據(jù)庫(kù)包含來(lái)源于99種細(xì)菌、古生菌和真核生物的30000多條單個(gè)序列。
miRBase序列數(shù)據(jù)庫(kù)是主要存放已發(fā)表的microRNA(miRNA)序列和注釋的數(shù)據(jù)庫(kù)。第十七頁(yè),共34頁(yè)。第二節(jié)蛋白質(zhì)序列數(shù)據(jù)庫(kù)
PIR數(shù)據(jù)庫(kù)MIPS數(shù)據(jù)庫(kù)其他重要的蛋白質(zhì)序列數(shù)據(jù)庫(kù):PRINTS、Pfam
第十八頁(yè),共34頁(yè)。PIR數(shù)據(jù)庫(kù)蛋白質(zhì)信息庫(kù)(PIR)是一個(gè)支持基因組學(xué)、蛋白質(zhì)組學(xué)和系統(tǒng)生物學(xué)檢索和科學(xué)研究的綜合公共生物信息學(xué)資源。PIR是由國(guó)家生物醫(yī)學(xué)會(huì)(NBRF)于1984年建立,幫助研究者確認(rèn)和解釋蛋白序列信息的數(shù)據(jù)庫(kù)。第十九頁(yè),共34頁(yè)。MIPS數(shù)據(jù)庫(kù)
生物信息學(xué)和系統(tǒng)生物學(xué)研究所(IBIS)是慕尼黑亥姆霍茲中心-德國(guó)環(huán)境衛(wèi)生研究中心的一部分,主辦慕尼黑蛋白序列信息中心(MIPS),它的重點(diǎn)工作是基因組生物信息學(xué),特別注重基因組信息系統(tǒng)分析,包括應(yīng)用生物信息學(xué)方法注釋基因組、表達(dá)分析和蛋白質(zhì)組學(xué)方面研究。MIPS支持和維護(hù)一系列基因組數(shù)據(jù)庫(kù)以及系統(tǒng),可以提供比較分析細(xì)菌、真菌和植物基因組服務(wù)。在該站點(diǎn)提供基因組分析工具、數(shù)據(jù)庫(kù)檢索系統(tǒng)、表達(dá)分析、蛋白相互作用等網(wǎng)絡(luò)服務(wù)。第二十頁(yè),共34頁(yè)。PRINTS是蛋白基序指紋圖綜合數(shù)據(jù)庫(kù),每個(gè)指紋圖都是使用數(shù)據(jù)掃描程序ADSP或VISTAS序列分析軟件包反復(fù)優(yōu)化后定義的。數(shù)據(jù)庫(kù)中有兩種類型指紋圖,根據(jù)指紋圖的復(fù)雜性分為簡(jiǎn)單和復(fù)合指紋圖:簡(jiǎn)單指紋圖基本上是單一的基序,而復(fù)合指紋圖包含多個(gè)基序。第二十一頁(yè),共34頁(yè)。Pfam數(shù)據(jù)庫(kù)是一個(gè)大的蛋白質(zhì)域家族集合;Pfam家族有兩個(gè)質(zhì)量等級(jí):Pfam-A和Pfam-B。第二十二頁(yè),共34頁(yè)。第三節(jié)NCBI與EBINCBI的簡(jiǎn)介
NCBI的使命是開發(fā)新的信息技術(shù),幫助理解控制健康和疾病的基本分子和遺傳過(guò)程。特別是,NCBI肩負(fù)建立存儲(chǔ)和分析分子生物學(xué)、生物化學(xué)和遺傳學(xué)知識(shí)的自動(dòng)系統(tǒng);提供研究和醫(yī)學(xué)界方便使用的數(shù)據(jù)庫(kù)和軟件;努力協(xié)調(diào)搜集國(guó)內(nèi)外生物技術(shù)信息;執(zhí)行分析生物學(xué)重要分子結(jié)構(gòu)和功能的先進(jìn)方法研究。第二十三頁(yè),共34頁(yè)。EBI簡(jiǎn)介
EMBL-EBI研究團(tuán)隊(duì)旨在通過(guò)開發(fā)新方法解釋生物學(xué)數(shù)據(jù),了解生物學(xué)。研究領(lǐng)域包括:進(jìn)化途徑的基因組分析(PaulBertone);序列數(shù)據(jù)進(jìn)化分析(NickGoldman);神經(jīng)信號(hào)計(jì)算系統(tǒng)生物學(xué)(NicolasLeNovere);蛋白質(zhì)組學(xué):結(jié)構(gòu)、功能和進(jìn)化(JanetThorton);基因組規(guī)模調(diào)節(jié)系統(tǒng)分析(NickLuscombe)和功能基因組學(xué)(WolfgangHubert)。第二十四頁(yè),共34頁(yè)。第四節(jié)通過(guò)EntrezGene從NCBI獲取序列信息Entrez是用于NCBI主要數(shù)據(jù)庫(kù)的綜合的、基于文本的搜索和檢索系統(tǒng)。Entrez綜合了科學(xué)文獻(xiàn)、DNA和蛋白序列數(shù)據(jù)庫(kù)、3D蛋白質(zhì)結(jié)構(gòu)和蛋白質(zhì)域數(shù)據(jù)、種群研究數(shù)據(jù)集、表達(dá)數(shù)據(jù)、完整基因組組裝和分類學(xué)信息形成一個(gè)緊密鏈接的系統(tǒng)。它是被設(shè)計(jì)用于搜索NCBI的鏈接數(shù)據(jù)庫(kù)的檢索系統(tǒng)??梢詧?zhí)行單個(gè)子數(shù)據(jù)庫(kù)檢索,還可以進(jìn)行跨庫(kù)檢索。第二十五頁(yè),共34頁(yè)。EntrezGene檢索
EntrezGene檢索到的記錄提供關(guān)鍵鏈接,將圖譜、序列、表達(dá)、結(jié)構(gòu)、功能、索引文獻(xiàn)和同源數(shù)據(jù)鏈接在一起構(gòu)成關(guān)鍵鏈接。檢索EntrezGene最簡(jiǎn)捷的方法是登錄到NCBI()的首頁(yè)。第二十六頁(yè),共34頁(yè)。第二十七頁(yè),共34頁(yè)。第二十八頁(yè),共34頁(yè)。第二十九頁(yè),共34頁(yè)。第三十頁(yè),共34頁(yè)。第三十一頁(yè),共34頁(yè)。第五節(jié)通過(guò)SRS從EBI中獲取蛋白序列信息SRS是世界上主要的生物信息學(xué)、基因組和相關(guān)數(shù)據(jù)綜
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國(guó)血清學(xué)移植診斷行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)薄層澄清池行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)蒸氣控制層行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)船用排氣消聲器行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 班主任教育教學(xué)培訓(xùn)總結(jié)
- 兼職人員勞務(wù)合同
- 2025-2030中國(guó)聚苯醚(PPE)行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)米飯零食行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)移動(dòng)洗車行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025-2030中國(guó)磁缺陷檢測(cè)儀行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 防化的相關(guān)知識(shí)
- 青少年科技創(chuàng)新知識(shí)講座
- 2025山東司法警官職業(yè)學(xué)院教師招聘考試試題及答案
- 風(fēng)電項(xiàng)目合作框架協(xié)議
- 中國(guó)糖尿病防治指南(2024版)解讀
- DB34∕T 1948-2013 建設(shè)工程造價(jià)咨詢檔案立卷標(biāo)準(zhǔn)
- 通用門座機(jī)安裝工藝2
- 企業(yè)集團(tuán)財(cái)務(wù)管理綜合練習(xí)計(jì)算
- 養(yǎng)老機(jī)構(gòu)服務(wù)高質(zhì)量115項(xiàng)明細(xì)
- 船舶首制船設(shè)計(jì)任務(wù)書doc
- 電氣專業(yè)迎峰度夏措施及預(yù)案
評(píng)論
0/150
提交評(píng)論