生物分子數(shù)據(jù)庫_第1頁
生物分子數(shù)據(jù)庫_第2頁
生物分子數(shù)據(jù)庫_第3頁
生物分子數(shù)據(jù)庫_第4頁
生物分子數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物信息學(xué)數(shù)據(jù)庫

Bioinformaticsdatabase一、概述

生物信息學(xué)的定義生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、處置、存儲(chǔ)、分發(fā)、分析和解釋等在內(nèi)的一切方面,綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和了解大量數(shù)據(jù)所包含的生物學(xué)意義?!裁绹祟惢蚪M方案實(shí)施五年后的總結(jié)報(bào)告〕

二、生物信息學(xué)數(shù)據(jù)庫種類<NucleicAcidsResearch>雜志每年的第一期中詳細(xì)引見最新版本的各種數(shù)據(jù)庫。在2000年1月1日出版的28卷第一期115種通用和公用數(shù)據(jù)庫。至2021年,生物信息學(xué)數(shù)據(jù)庫總數(shù)已達(dá)1078個(gè)。比2007年添加110個(gè)。NucleicAcidsResearch雜志NucleicAcidsResearch雜志相關(guān)數(shù)據(jù)庫及其主要分類1.核酸序列數(shù)據(jù)庫2.RNA序列數(shù)據(jù)庫3.蛋白質(zhì)序列數(shù)據(jù)庫4.構(gòu)造數(shù)據(jù)庫5.基因組數(shù)據(jù)庫6.代謝酶相關(guān)產(chǎn)物7.人類和其他脊椎動(dòng)物基因組8.人類基因和疾病9.其他數(shù)據(jù)和其他基因表達(dá)數(shù)據(jù)庫10.蛋白組資源11.其他分子生物學(xué)數(shù)據(jù)庫12.細(xì)胞器官數(shù)據(jù)庫13.植物數(shù)據(jù)庫14.免疫學(xué)數(shù)據(jù)庫核酸序列數(shù)據(jù)庫內(nèi)容包括世界上一切已公布的核酸序列及其翻譯產(chǎn)物序列報(bào)告和相關(guān)注釋國際核酸序列委員會(huì)協(xié)作組:GenBank美國基因數(shù)據(jù)銀行/Embl歐洲分子生物實(shí)驗(yàn)室ebi.ac.uk/embl.htmlDDBJ日本核酸數(shù)據(jù)庫ddbj.nig.ac.jp

整合平臺(tái):Entrez綜合數(shù)據(jù)庫序列經(jīng)過正式遞交進(jìn)入數(shù)據(jù)庫未正式發(fā)表文獻(xiàn)以前,數(shù)據(jù)庫予以嚴(yán)密蛋白質(zhì)序列數(shù)據(jù)庫SWISS-PROT〔瑞士日內(nèi)瓦大學(xué)〕蛋白質(zhì)序列數(shù)據(jù)庫Expasy.ch內(nèi)容包括序列及功能信息、蛋白識(shí)別、蛋白質(zhì)構(gòu)造預(yù)測(cè)及其他功能NCBI蛋白質(zhì)數(shù)據(jù)庫包括一切蛋白質(zhì)序列,及其翻譯產(chǎn)物序列/entrezPIR蛋白質(zhì)序列信息資源庫〔美、德〕

蛋白質(zhì)構(gòu)造數(shù)據(jù)庫PDBProteinDataBank,美國Brookhaven國家實(shí)驗(yàn)室管理生物大分子三維空間構(gòu)造原子坐標(biāo)數(shù)據(jù)庫/pdb/NCBISTRUCTUREMMDB〔MolecularModellingDataBase〕,包含了從PDB獲取的實(shí)驗(yàn)確定的生物高聚物構(gòu)造分子模型數(shù)據(jù)庫SCOP〔Structuralclassificationofproteins〕英國醫(yī)學(xué)研討會(huì)〔MRC〕劍橋分子生物學(xué)實(shí)驗(yàn)室開發(fā)的蛋白質(zhì)構(gòu)造分類數(shù)據(jù)庫。包含描畫蛋白質(zhì)域的家族、超家族、折疊、等級(jí)等信息。scop.mrc-lmb.cam.ac.uk/scop基因組數(shù)據(jù)庫圖譜和顯示器主要內(nèi)容:有基因組構(gòu)造、基因單位、基因組圖譜等〔遺傳圖、疊連群圖、放射雜交圖等〕分布:由各國基因組研討中心組建,分布在世界各地的信息中心、研討機(jī)構(gòu)。代表性的有:美國人類基因組數(shù)據(jù)庫GDB

美國NCBI基因組數(shù)據(jù)庫Genome英國人類基因圖譜數(shù)據(jù)庫HGMPGenomeWebhgmp.mrc.ac.uk/genomeWeb/美國人類基因組資源整合體系/genome/guide/human/人類疾病與基因數(shù)據(jù)庫OMIM孟德爾遺傳信息數(shù)據(jù)庫

CGAPTheCancerGenomeAnatomyProject腫瘤基因組圖譜知識(shí)庫/ncicgap美國國立癌癥研討所為解剖腫瘤細(xì)胞分子而建立。生物信息分析工具BLAST序列類似性對(duì)比PRIMER引物設(shè)計(jì)蛋白質(zhì)構(gòu)造預(yù)測(cè)數(shù)據(jù)庫〔EMBL〕根據(jù)知蛋白質(zhì)序列,預(yù)測(cè)同族二級(jí)、三維等構(gòu)造蛋白質(zhì)功能預(yù)測(cè)數(shù)據(jù)庫〔EMBL〕根據(jù)知蛋白質(zhì)序列,預(yù)測(cè)蛋白質(zhì)功能我國生物信息相關(guān)網(wǎng)站中國生物信息網(wǎng)

北京大學(xué)生物信息中心

中國生物技術(shù)信息網(wǎng)/中國科學(xué)院〔上海文獻(xiàn)中心〕cshq.ac/tushug/

三、生物信息數(shù)據(jù)庫檢索集成檢索系統(tǒng):Entrez系統(tǒng)〔整合庫〕美國生物技術(shù)信息中心研制SRS系統(tǒng)(SequenceRetrievalSystem)歐洲分子生物學(xué)實(shí)驗(yàn)室開發(fā)httpsrs.ebi.ac.uk/可開放式安裝100多個(gè)數(shù)據(jù)庫,北京大學(xué)安裝了78個(gè)數(shù)據(jù)庫1.Entrez

NCBI綜合數(shù)據(jù)庫是1991年由美國生物信息技術(shù)中心〔NationalCenterforBiotechnologyInformation,NCBI〕〔〕Entrez用途檢索大分子生物學(xué)數(shù)據(jù)獲取GenBank,EMBL等數(shù)據(jù)庫的核酸序列獲取Swiss-port,PIR,PRF,PDB等蛋白質(zhì)序列;從核酸序列翻譯到蛋白質(zhì)的序列獲取基因和染色體圖譜;蛋白質(zhì)三維構(gòu)造數(shù)據(jù)及大分子方式〔MMDB〕等其他生物信息數(shù)據(jù)庫檢索PubMed書目文獻(xiàn)數(shù)據(jù)Entrez生命科學(xué)搜索引擎Entrez跨庫檢索檢索字段限制分子類型選擇基因位置限定序列片段限定數(shù)據(jù)更新日期限定功能欄核酸序列檢索序列存取號(hào)基因定義數(shù)據(jù)庫標(biāo)識(shí)符代碼物種來源參考文獻(xiàn)特性專業(yè)評(píng)論堿基數(shù)原序列復(fù)制后,可到BLAST中進(jìn)展類似性對(duì)本

2.BLAST

序列類似性檢索BasicLocalAlignmentSearchTool是核酸和蛋白質(zhì)序列的部分對(duì)準(zhǔn)類似性檢索工具序列類似性檢索Blast是為從一樣和不同的有機(jī)體中,提供對(duì)比核酸或蛋白質(zhì)序列,尋覓類似性序列片斷的工具。從經(jīng)過尋覓不同基因的一樣序列片段,可以推斷最新測(cè)定的基因功能、預(yù)測(cè)基因家族的新成員、探求基因的進(jìn)化關(guān)系。在基因組測(cè)序的任務(wù)中,序列類似性檢索可以預(yù)測(cè)蛋白質(zhì)代碼和翻譯產(chǎn)物的功能和定位。選擇對(duì)比程序基因組對(duì)比特殊對(duì)比將序列數(shù)據(jù)庫中的復(fù)制序列在此粘貼序列對(duì)比報(bào)告對(duì)比資源類似性圖譜對(duì)比圖譜報(bào)告數(shù)據(jù)庫標(biāo)識(shí)符基因定義類似性積分E值為匹配期望值。闡明可以找到與搜索序列相匹配的其它序列的幾率。E值越接近零,越不能夠找到其它的匹配序列,其背后的含義就是E值越少,匹配度越好點(diǎn)擊可得待檢序列與庫存序列對(duì)排基因表達(dá)庫鏈接單基因庫基因信息庫人類染色體上的抗腫瘤基因序列對(duì)排表相關(guān)文獻(xiàn)鏈接對(duì)排序列不一致處序列對(duì)排報(bào)告3.NCBIstructure提供為研討蛋白質(zhì)三維(3D)構(gòu)造集成的二個(gè)數(shù)據(jù)庫:分子模型數(shù)據(jù)庫(MMDB),提供關(guān)于各種蛋白質(zhì)的構(gòu)造信息;蛋白質(zhì)域數(shù)據(jù)庫(CDD),提供在proteins(CDs)內(nèi)保管的功能領(lǐng)域序列和構(gòu)造對(duì)準(zhǔn)表達(dá)目錄。這兩個(gè)數(shù)據(jù)庫讓科學(xué)家檢索和觀看構(gòu)造,從構(gòu)造上查找特定蛋白質(zhì)的類似蛋白質(zhì),并且識(shí)別功能位點(diǎn)。Structure檢索步驟第一步:在Entrezsturcture檢索欄中直接輸入的檢索詞包括:PDB代碼,蛋白質(zhì)名字,作者,或期刊名。第二步:經(jīng)過Entrez列陣搜索,得出檢索初步結(jié)果。也許出現(xiàn)多個(gè)指定的蛋白質(zhì)存在的記錄,它們反映了不同的實(shí)驗(yàn)性技術(shù)情況,并且出現(xiàn)或缺乏各種各樣的配合基或金屬離子。記錄也許包含全長(zhǎng)分子的不同片段。另外,還有許多突變體蛋白質(zhì)構(gòu)造,用戶要留意挑選。檢索結(jié)果同時(shí)包含了PDB記錄,包括實(shí)驗(yàn)性描畫,PDB代碼。第三步:顯示構(gòu)造概略頁察看次要構(gòu)造SecondaryStructure按鈕對(duì)觀看3D分子的構(gòu)造是有用的前奏第四步:觀看完好蛋白質(zhì)構(gòu)造按鈕FullProteinStructures〔須下載Cn3D軟件〕Viewing3DStructures檢索MMDB例:查找鐵氧化復(fù)原蛋白的三維構(gòu)造蛋白質(zhì)代碼:1doi鐵氧化復(fù)原蛋白:ferredoxinfe進(jìn)入NCBISTRUCTURE1doi執(zhí)行檢索輸入檢索提問Structure記錄蛋白質(zhì)代碼蛋白質(zhì)描畫:來自死海古菌的鐵氧化復(fù)原蛋白StructureSummary蛋白質(zhì)描畫作者生物體分類稱號(hào)參考文獻(xiàn)顯示3D構(gòu)造下載顯示軟件蛋白質(zhì)鏈欄。鼠標(biāo)放在欄上,顯示殘基數(shù)。點(diǎn)擊顯示分子各條鏈、鄰族構(gòu)造。顯示序列報(bào)告顯示存儲(chǔ)域蛋白質(zhì)鏈欄點(diǎn)擊鏈接鼠標(biāo)放在鏈欄上,界面顯示殘基號(hào)死海高鹽環(huán)境下,生物體蛋白的順應(yīng)結(jié)果,外周構(gòu)造中有許多親水鍵,更容易結(jié)合鉀離子,中間紅色部分為鐵離子,他們的結(jié)合位點(diǎn)明晰可見。透視圖選擇旋轉(zhuǎn)放映4.NCBI基因組數(shù)據(jù)庫

GENOME美國國家生物技術(shù)信息中心NCBI整合。Genome數(shù)據(jù)庫借助EntrezMapViewer〔圖形顯示器軟件〕,讓用戶觀看數(shù)據(jù)庫內(nèi)帶有綜合遺傳和自然圖的各種有機(jī)體基因組、全部染色體、序列集成數(shù)據(jù)。序列顯示蛋白質(zhì)庫生物學(xué)證據(jù)Viewer模型制造同源基因基因命名數(shù)據(jù)庫`

5.OMIM

OnlineMendelianInheritanceinMan

孟德爾遺傳數(shù)據(jù)庫由美國JohnsHopkins大學(xué)建立?,F(xiàn)也屬NCBI集成系統(tǒng)中的一個(gè)庫。它主要報(bào)道人類基因和遺傳缺陷相關(guān)疾病的文字信息、圖片和參考文獻(xiàn),被稱為人類基因及其相關(guān)疾病與遺傳特征的百科全書例:查找與疾病相關(guān)的基因經(jīng)過OMIM尋覓疾病基因信息,經(jīng)過染色體定位找到疾病基因。如:查找角化過度癥〔營養(yǎng)不良性神經(jīng)病〕Keratoderma,palmoplantarOMIM檢索

Keratodermapalmoplantar

染色體位點(diǎn)OMIM檢出結(jié)果OMIM基因圖譜6.引物設(shè)計(jì)所謂引物是指在聚合反響中作為底物引發(fā)聚合產(chǎn)物的短的序列統(tǒng)稱為引物。PCR反響中擴(kuò)增一個(gè)知序列DNA,對(duì)其引物須有一定的滿足條件,才干有效地?cái)U(kuò)增模板序列,這些條件有:〔1〕引物長(zhǎng)度為20個(gè)堿基;〔2〕引物序列與被擴(kuò)增的序列不具有同源性;〔3〕引物中G+C堿基的含量以40%~60%為宜等。設(shè)計(jì)滿足PCR擴(kuò)增條件的引物稱為最正確引物設(shè)計(jì)。根據(jù)引物設(shè)計(jì)的條件,進(jìn)展計(jì)算機(jī)的程序處置,便可以方便地進(jìn)展自動(dòng)引物設(shè)計(jì)。目前國際上有許多設(shè)計(jì)最正確引物的軟件,有網(wǎng)上Web界面,也有單位發(fā)行的軟件包,它們的功能各有特征,優(yōu)點(diǎn)各異。探針和引物設(shè)計(jì)相關(guān)網(wǎng)站Primer

Premier

5.0premierbiosoft/primerdesign/primerdesign.html

primer3WHITEHEADINSTITUTE

/cgi-bin/primer3/primer3_cgiWHITEHEADINSTITUTE

primer3輸入序列設(shè)定參數(shù)輸出結(jié)果引物長(zhǎng)度熔點(diǎn)起始序列數(shù)引物中堿基+c的比例引物起始處與寡合苷酸恣意區(qū)域的互補(bǔ)指數(shù)引物與寡合苷酸3’端的互補(bǔ)指數(shù)引物序列7.蛋白質(zhì)構(gòu)造預(yù)測(cè)蛋白質(zhì)預(yù)測(cè)的常用途徑1.從氨基酸組成辨識(shí)蛋白質(zhì)2.預(yù)測(cè)蛋白質(zhì)的物理性質(zhì)3.蛋白質(zhì)二級(jí)構(gòu)造預(yù)測(cè)4.其他特殊部分構(gòu)造5.蛋白質(zhì)的三維構(gòu)造蛋白質(zhì)的三維構(gòu)造7.5.1SWISS-MODEL:expasy.ch/swissmod/SWISS-MODEL.html7.5.2CPHmodels:cbs.dtu.dk/services/CPHmodels/蛋白質(zhì)預(yù)測(cè)的勝利范例色氨酸籠trp-cagenlyiqwlkdggpssgrppps由20個(gè)氨基酸構(gòu)成,是華盛頓大學(xué)的JonathanNeidigh制造的人造蛋白。大部分小分子短鏈構(gòu)造比較松散,這種蛋白質(zhì)卻像大分子蛋白質(zhì)一樣,具有緊湊、明確的構(gòu)造。Simmerlin

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論