




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 簡介 2013/6/6產(chǎn)生的背景 如何借助計算機全面地展示細胞和生物所包含的生物學信息是后基因組時代的重大挑戰(zhàn)之一??茖W家期望能夠根據(jù)基因組中的信息,用計算機計算或者預測出比較復雜的細胞中的通路或者生物的復雜行為。出于這個目的,日本京都大學生物信息學中心的Kanehisa實驗室于1995年建立了生物信息學數(shù)據(jù)庫KEGG。特點 KEGG是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫。把從已經(jīng)完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來是KEGG數(shù)據(jù)庫的特色之一。 人工創(chuàng)建了一個知識庫,這個知識庫是基于使用一種可計算的形式捕捉和組織實驗得到的知識而形成的
2、系統(tǒng)功能知識庫。它是一個生物系統(tǒng)的計算機模擬。 與其他數(shù)據(jù)庫相比,KEGG 的一個顯著特點就是具有強大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關(guān)系,這樣可以使研究者能夠?qū)ζ渌芯康拇x途徑有一個直觀全面的了解。用途 各個數(shù)據(jù)庫中包含了大量的有用信息?;蚪M信息存儲在GENES數(shù)據(jù)庫里,包括完整和部分測序的基因組序列;更高級的功能信息存儲在PATHWAY數(shù)據(jù)庫里,包括圖解的細胞生化過程如代謝、膜轉(zhuǎn)運、信號傳遞、細胞周期,還包括同系保守的子通路等信息;KEGG的另一個數(shù)據(jù)庫LIGAND,包含關(guān)于化學物質(zhì)、酶分子、酶反應(yīng)等信息。 通過與世界上其它一些大型生物信息學
3、數(shù)據(jù)庫的連接,KEGG可以為研究者提供更為豐富的生物學信息(LinkDB)。 KEGG提供了Java的圖形工具來訪問基因組圖譜,比較基因組圖譜和操作表達圖譜,以及其它序列比較、圖形比較和通路計算的工具,可以免費獲取。影響及發(fā)展 KEGG建立了KEGG直系同源系統(tǒng)(the KEGG Orthology (KO) system),這個系統(tǒng)通過把分子網(wǎng)絡(luò)的相關(guān)信息連接到基因組中,從而發(fā)展和促進了跨物種注釋流程。 結(jié)果表明,KEGG被當做一個參考知識庫,被廣泛的用于基因組測序和其他高通量實驗技術(shù)得到的大規(guī)模數(shù)據(jù)集的整合和解釋中。除了保持對基礎(chǔ)研究的支持,隨著KEGG分子網(wǎng)絡(luò)的一些小變化,KEGG正在朝
4、著更加偏向于實際應(yīng)用的方向發(fā)展,這些應(yīng)用主要集中在整合人類疾病、藥物和其他與健康相關(guān)的物質(zhì)。KEGG數(shù)據(jù)庫 KEGG是一個綜合數(shù)據(jù)庫,它們大致分為系統(tǒng)信息、基因組信息和化學信息三大類。進一步可細分為16個主要的數(shù)據(jù)庫??梢酝ㄟ^不同的顏色編碼來區(qū)分。分類分類數(shù)據(jù)庫數(shù)據(jù)庫目錄目錄顏色顏色系統(tǒng)信息KEGG PATHWAYKEGG通路圖KEGG BRITEBRITE功能層次KEGG MODULEKEGG功能單元的模塊KEGG DISEASE人類疾病KEGG DRUG藥物KEGG ENVIRON天然藥物和與健康相關(guān)的物質(zhì)基因組信息KEGG ORTHOLOGYKEGG直系同源(KO)組KEGG GENOM
5、EKEGG中帶有完整基因組的物種KEGG GENES在完整基因組中的基因目錄KEGG SSDB與基因有關(guān)的序列相似性數(shù)據(jù)庫化學信息KEGG COMPOUND代謝物及其他小分子化合物KEGG GLYCAN多糖KEGG REACTION生化反應(yīng)KEGG RPAIR化學反應(yīng)中的反應(yīng)物對KEGG RCLASSRPAIR定義的反應(yīng)級別KEGG ENZYME酶命名法三類數(shù)據(jù)庫的關(guān)系KEGG對象標識符DatabaseObjectPrefixExampleKEGG PATHWAYPathway mapmap, ko, ec, rn, (org)hsa04930KEGG BRITEFunctional hier
6、archybr, jp, ko, (org)ko01003KEGG MODULEKEGG moduleM, (org)_MM00010KEGG DISEASEHuman diseaseHH00004KEGG DRUGDrugDD01441KEGG ENVIRONCrude drug, etc.EE00048KEGG ORTHOLOGYKO groupKK04527KEGG GENOMEKEGG organismTT01001 (hsa)KEGG GENESGene / proteinhsa:3643KEGG COMPOUNDSmall moleculeCC00031KEGG GLYCANGly
7、canGG00109KEGG REACTIONReactionRR00259KEGG RPAIRReactant pairRPRP04458KEGG RCLASSReaction classRCRC00046KEGG ENZYMEEnzymeec:2.7.10.1數(shù)據(jù)庫中包含各種各樣的數(shù)據(jù)對象,這些數(shù)據(jù)對象是為了用來對生物系統(tǒng)進行計算機模擬的。因此,各個數(shù)據(jù)庫中的數(shù)據(jù)記錄都被稱為KEGG對象。這些對象可以通過KEGG對象標識符來識別,標識符由一個與數(shù)據(jù)庫相關(guān)的前綴加五個數(shù)字構(gòu)成。(org) represents three-, four-, or five-letter organism co
8、de當前數(shù)據(jù)庫中的記錄KEGG Database as of 2013/6/5KEGG PATHWAYPathway maps, reference (total)0 (246,368)KEGG BRITEFunctional hierarchies, reference (total)140 (78,848)KEGG MODULEKEGG modules, reference (total)566 (185,274)KEGG DISEASEHuman diseases1,301KEGG DRUGDrugs9,910KEGG ENVIRONCrude drugs and health-rela
9、ted substances845KEGG ORTHOLOGY KEGG Orthology (KO) groups16,748KEGG GENOMEKEGG Organisms2,697KEGG GENESGenes in high-quality genomes(190 eukaryotes, 2336 bacteria, 153 archaea)10,821,739KEGG SSDBBest hit relations within GENESBi-directional best hit relations within GENES130,947,959,9572,996,848,54
10、6KEGG DGENESGenes in draft genomes (18 eukaryotes)432,488KEGG EGENESGenes as EST contigs (99 eukaryotes)3,792,883KEGG MGENESGenes in metagenomes (716 samples)90,754,418KEGG COMPOUND Metabolites and other small molecules17,012KEGG GLYCANGlycans10,985KEGG REACTIONBiochemical reactions9,320KEGG RPAIRRe
11、actant pair chemical transformations14,092KEGG RCLASSReaction class2,807KEGG ENZYMEEnzyme nomenclature5,973KEGG PATHWAY DatabaseKEGG PATHWAY數(shù)據(jù)庫是一個手工畫的代謝通路的集合,包含以下幾方面的分子間相互作用和反應(yīng)網(wǎng)絡(luò):1.新陳代謝2.遺傳信息加工3.環(huán)境信息加工4.細胞過程5.生物體系統(tǒng)6.人類疾病7.藥物開發(fā)PATHWAY的五種類型僅僅第一種參考通路(reference pathway)圖是手動畫出來的,其他的通路圖都是通過計算產(chǎn)生的。 pathway中
12、的每一個框(或線)都對應(yīng)一個或多個K編號、EC編號及R編號。map - Reference pathway 對于代謝相關(guān)的通路,在reference pathway中,一個點同時表示一個基因、這個基因編碼的酶及這個酶參加的反應(yīng)ko - Reference pathway (KO) ko通路中的點只表示基因ec - Reference pathway (EC) ec通路中的點只表示相關(guān)的酶rn - Reference pathway (Reaction) Reaction通路中的點只表示改點參與的某個反應(yīng)、反應(yīng)物對及反應(yīng)類型org - Organism-specific pathway map
13、對于所有的代謝和非代謝通路,K編號都被認為是基因的標識符,這個標識符在每一個物種中對應(yīng)該物種中的某個基因,從而得到物種特異性的pathway。 map00010ko00010ec00010rn00010hsa00010KEGG BRITE DatabaseKEGG BRITE是一個層級分類的數(shù)據(jù)庫,包含生物系統(tǒng)各個方面的知識。相對于KEGG PATHWAY僅限于分子間相互作用和反應(yīng),KEGG BRITE包含了許多不同的關(guān)系類型。例如,可以查詢酶和底物之間的關(guān)系,也可以查詢某種酶的同源基因。tp53在BRITE中的查詢結(jié)果KEGG MODULE DatabaseKEGG MODULE是一個人工定
14、義的功能單元的集合。被用于已測序基因組的注釋和生物學上的解釋。各個模塊使用M開頭的編號及與其對應(yīng)的一系列K開頭的編號來表示。四種主要的KEGG模塊1.通路模塊:代表在KEGG代謝通路圖中的復雜功能單元,例如M00002(糖酵解,與三碳化合物相關(guān)的核心模塊)2.結(jié)構(gòu)復合物:通常形成分子機械,例如M00072(寡糖轉(zhuǎn)移酶)3.功能集:基本單元的其他形式,例如M00360(氨?;?tRNA 合酶,原核生物)4.特征模塊:作為某種表型的標記,例如M00363(腸出血性大腸桿菌致病性特征,志賀毒素)KEGG ORTHOLOGY (KO) DatabaseKEGG參考通路圖,BRITE功能層次以及KEGG
15、模塊都是以一種廣泛的方式來表示,都可以用于所有物種。而KEGG直系同源系統(tǒng)(KO System)是這一表示方式的基礎(chǔ)。包含手動定義的直系同源組,這些直系同源組就相當于KEGG通路中的點,BRITE層級中的點以及KEGG模塊中的點。(這些點并不是某個具體物種的某一個基因,而是在許多物種中都存在的直系同源的某一個基因)。一旦基因被分配了KO標識或K編號,通過基因組注釋流程,物種特異性的通路圖、BRITE功能層次和KEGG模塊就可以自動產(chǎn)生了。直系同源與旁系同源l 直系同源(orthology)是比較基因組學中最重要的定義。直系同源的定義是: (1).在進化上起源于一個始祖基因并垂直傳遞的同源基因;
16、 (2).分布于兩種或兩種以上物種的基因組; (3).功能高度保守乃至于近乎相同,甚至于其在近緣物種可以相互替換; (4).結(jié)構(gòu)相似; (5).組織特異性與亞細胞分布相似。 l 旁系同源(paralogy)基因是指同一基因組(或同系物種的基因組)中,由于始祖基因的加倍而橫向產(chǎn)生的幾個同源基因。直系與旁系的共性是同源,都源于各自的始祖基因。其區(qū)別在于:在進化起源上,直系同源是強調(diào)在不同基因組中的垂直傳遞,旁系同源則是在同一基因組中的橫向加倍;在功能上,直系同源要求功能高度相似,而旁系同源在定義上對功能上沒有嚴格要求,可能相似,但也可能并不相似(盡管結(jié)構(gòu)上具一定程度的相似),甚至于沒有功能(如基因
17、家族中的假基因)。Image depicts concepts of Orthology and paralogy. from Protein Kinase C OrthologsNeurotrophin(神經(jīng)營養(yǎng)因子神經(jīng)營養(yǎng)因子) signaling pathway(ko04722)從這個圖上可以看到基因之間的相互作用。ko編號表示一個通路,這個通路是不分物種的,相當于所有物種的這一通路的并集。Ortholog table(ko04722) K編號表示一個基因,是ko通路中的基本單位,某一K編號代表的不是某一具體物種的基因,而是所有物種的某一同源基因的統(tǒng)稱。KEGG GENOME Datab
18、ase該數(shù)據(jù)庫中收集了2679中物種(190 eukaryotes, 2336 bacteria, 153 archaea)的基因組信息,這些物種都已經(jīng)具有完整的基因組序列,并根據(jù)大量的EST數(shù)據(jù)集進行了增補。KEGG GENES Database KEGG GENES 是所有已知全基因組序列的基因目錄的集合。這些全基因組信息主要參考可得到的公共數(shù)據(jù)庫,尤其是NCBI RefSeq數(shù)據(jù)庫。這些基因從屬于SSDB (Sequence Similarity Database)并通過KOALA工具進行計算和KO編號的分配(基因注釋)。 KEGG DGENES中包括一些真核生物的基因組草圖, KEGG EGENES是一個包含大部分植物的EST數(shù)據(jù)集的補充基因目錄,以上數(shù)據(jù)都隨著GENES被當做一個參考數(shù)據(jù)集的使用被KAAS自動分配上KO編號。 MGENES表示通過自動注釋的宏基因組。 VGENES表示病毒基因目錄,還沒有全部整合到KEGG系統(tǒng)中。KEGG SSDB D
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 氫能裝備施工方案
- 惠州市匯科源科技有限公司電源適配器的生產(chǎn)建設(shè)項目環(huán)評報告表
- 昌江縣公益性公墓及殯儀館建設(shè)工程(一期)項目環(huán)評報告表
- 甘肅巨化新材料有限公司股東全部權(quán)益價值項目資產(chǎn)評估報告
- 玻璃更換施工方案施工方案
- 2024-2025學年下學期高一語文第一單元A卷
- 東江大壩隧道施工方案
- 《雷雨》教案-高一下學期語文統(tǒng)編版
- 2025年中國碑石行業(yè)供需態(tài)勢、市場現(xiàn)狀及發(fā)展前景預測報告
- 提高女性、老年人及殘疾人就業(yè)率的策略及實施路徑
- 《基礎(chǔ)和聲學》試習題庫(6套答案)
- 馬克思主義政治經(jīng)濟學課程講義
- 四年級道德與法治從中國制造到中國創(chuàng)造
- SolidWorks、CAD三維建模練習習題圖
- HONEYWELLDCS操作手冊
- 2021-2022新教科版四年級科學下冊全一冊全部課件(共24課)
- 方正飛騰使用教程詳解
- 3 棄渣場施工方案
- 國外客戶來訪行程安排表
- 八路搶答器PLC控制系統(tǒng)設(shè)計
- 《車輛解壓委托書 》
評論
0/150
提交評論