生物信息數(shù)據(jù)庫(kù)挖掘-kegg和david-生物學(xué)_第1頁(yè)
生物信息數(shù)據(jù)庫(kù)挖掘-kegg和david-生物學(xué)_第2頁(yè)
生物信息數(shù)據(jù)庫(kù)挖掘-kegg和david-生物學(xué)_第3頁(yè)
生物信息數(shù)據(jù)庫(kù)挖掘-kegg和david-生物學(xué)_第4頁(yè)
生物信息數(shù)據(jù)庫(kù)挖掘-kegg和david-生物學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

內(nèi)容提要KEGG數(shù)據(jù)庫(kù)簡(jiǎn)介KEGG-pathway查詢KEGG-Brite查詢KEGG-module

查詢KEGG-disease

查詢數(shù)據(jù)庫(kù)產(chǎn)生背景如何借助計(jì)算機(jī)全面地展示細(xì)胞和生物所包含的生物學(xué)信息是后的重要組時(shí)代科學(xué)家期望能夠根據(jù)

組中的信息,用計(jì)算機(jī)計(jì)算或者

出比較復(fù)雜的細(xì)胞中的通路或者生物的復(fù)雜行為出于上述目的,

大學(xué)生物信息學(xué)中心的Kanahisa

于1995年建立了生物信息學(xué)數(shù)據(jù)庫(kù)KEGGKEGG

數(shù)據(jù)庫(kù)簡(jiǎn)介全稱Kyoto

Encyclopedia

of

Genes

and

Genomes與

組百科全書:FTP:

ftp://ftp.genome.jp/pub/kegg/數(shù)據(jù)庫(kù)首頁(yè)特點(diǎn)KEGG是一個(gè)整合了組、化學(xué)和系統(tǒng)功能信息的數(shù)據(jù)庫(kù)。把從已經(jīng)完整的組中得到的與更高級(jí)別的細(xì)胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來(lái)是KEGG數(shù)據(jù)庫(kù)的特色之一。人工創(chuàng)建了一個(gè)知識(shí)庫(kù),這個(gè)知識(shí)庫(kù)是基于使用一種可計(jì)算的形式捕捉和組織實(shí)驗(yàn)得到的知識(shí)而形成的系統(tǒng)功能知識(shí)庫(kù)。它是一個(gè)生物系統(tǒng)的計(jì)算機(jī)模擬。與其他數(shù)據(jù)庫(kù)相比,KEGG的一個(gè)顯著特點(diǎn)就是具有強(qiáng)大的圖形功能,它利用圖形而不是繁縟的文字來(lái)介紹眾多的代謝途徑以及各途徑之間的關(guān)系,這樣可以使研究者能夠?qū)ζ渌芯康拇x途徑有一個(gè)直觀全面的了解。用途各個(gè)數(shù)據(jù)庫(kù)中包含了大量的有用信息。組信息

在GENES數(shù)據(jù)庫(kù)里,包括完整和部分

組序列;更高級(jí)的功能信息

在PATHWAY數(shù)據(jù)庫(kù)里,包括圖解的細(xì)胞生化過(guò)程如代謝、膜轉(zhuǎn)運(yùn)、信號(hào)傳遞、細(xì)胞周期,還包括同系保守的子通路等信息;KEGG的另一個(gè)數(shù)據(jù)庫(kù)LIGAND,包含關(guān)于化學(xué)物質(zhì)、酶分子、酶反應(yīng)等信息。通過(guò)與世界上其它一些大型生物信息學(xué)數(shù)據(jù)庫(kù)的連接,KEGG可以為研究者提供更為豐富的生物學(xué)信息(LinkDB)。組圖譜和操作表達(dá)圖譜,以及其它序列比KEGG提供了Java的圖形工具來(lái)

組圖譜,比較較、圖形比較和通路計(jì)算的工具,可以免費(fèi)獲取。影響及發(fā)展KEGG建立了KEGG直系同源系統(tǒng)(theKEGGOrthologySystem,KO),這個(gè)系統(tǒng)通過(guò)把分子網(wǎng)絡(luò)的相關(guān)信息連接到 組中,從而發(fā)展和促進(jìn)了跨物種注釋流程。結(jié)果表明,KEGG被當(dāng)做一個(gè)參考知識(shí)庫(kù),被廣泛的用于

組和其他高通量實(shí)驗(yàn)技術(shù)得到的大規(guī)模數(shù)據(jù)集的整合和解釋中。除了保持對(duì)基礎(chǔ)研究的支持,隨著KEGG分子網(wǎng)絡(luò)的一些小變化,KEGG正在朝著更加偏向于實(shí)際應(yīng)用的方向發(fā)展,這些應(yīng)用主要集中在整合人類疾病、藥物和其他與健康相關(guān)的物質(zhì)。KEGG數(shù)據(jù)庫(kù)組成KEGG是一個(gè)綜合數(shù)據(jù)庫(kù),它們大致分為系統(tǒng)信息、

組信息和化學(xué)信息三大類。進(jìn)一步可細(xì)分為17個(gè)主要的數(shù)據(jù)庫(kù)??梢酝ㄟ^(guò)不同的顏色編碼來(lái)區(qū)分。KEGG-LIGANDKEGG-MEDICUS三類數(shù)據(jù)庫(kù)的關(guān)系KEGerview:數(shù)據(jù)庫(kù)容量KEGG對(duì)象標(biāo)識(shí)符DatabaseObjectPrefixExampleKEGG

PATHWAYPathway

mapmap,ko,

ec,

rn,(org)hsa04930KEGG

BRITEFunctional

hierarchybr,

jp,

ko,

(org)ko01003KEGG

MODULEKEGG

moduleM,

(org)_MM00010KEGG

DISEASEHuman

diseaseHH00004KEGG

DRUGDrugDD01441KEGG

ENVIRONCrude

drug,

etc.EE00048KEGG

ORTHOLOGYKO

groupKK04527KEGG

GENOMEKEGG

organismTT01001

(hsa)KEGG

GENESGene

/

proteinhsa:3643KEGG

COMPOUNDSmall

moleculeCC00031KEGG

GLYCANGlycanGG00109KEGG

REACTIONReactionRR00259KEGG

RPAIRReactant

pairRPRP04458KEGG

RCLASSReaction

classRCRC00046KEGG

ENZYMEEnzymeec:數(shù)據(jù)庫(kù)中包含各種各樣的數(shù)據(jù)對(duì)象,這些數(shù)據(jù)對(duì)象是為了用來(lái)對(duì)生物系統(tǒng)進(jìn)行計(jì)算機(jī)模擬的。因此,各個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)記錄都被稱為KEGG對(duì)象。這些對(duì)象可以通過(guò)KEGG對(duì)象標(biāo)識(shí)符來(lái)識(shí)別,標(biāo)識(shí)符由一個(gè)與數(shù)據(jù)庫(kù)相關(guān)的前綴加五個(gè)數(shù)字構(gòu)成。(org)

represents

three-,

four-,

or

five-letter

organism

code內(nèi)容提要KEGG數(shù)據(jù)庫(kù)簡(jiǎn)介KEGG-pathway查詢KEGG-Brite查詢KEGG-module

查詢KEGG-disease

查詢KEGG

PATHWAY

DatabaseKEGG

PATHWAY數(shù)據(jù)庫(kù)是一個(gè)手工畫的代謝通路的集合,包含以下幾方面的分子間相互作用和反應(yīng)網(wǎng)絡(luò):1.新陳代謝:碳水化合物,能量,脂類,核酸,氨基酸,多聚糖,維生素,萜類化合物….2.遺傳信息加工3.環(huán)境信息加工4.細(xì)胞內(nèi)過(guò)程5.生物體系統(tǒng)6.人類疾病7.藥物開發(fā)PATHWAY的類型(Map

number

Prefix)pathway中的每一個(gè)框(或線)都對(duì)應(yīng)一個(gè)或多個(gè)K

、EC

及R

。map-Reference

pathway(唯一人工畫的圖)對(duì)于代謝相關(guān)的通路,在reference

pathway中,一個(gè)點(diǎn)同時(shí)表示一個(gè)

、這個(gè)

編碼的酶及這個(gè)酶參加的反應(yīng)ko

-

Reference

pathway

(KO)ko通路中的點(diǎn)只表示

.

KO:

KEGG

ortholog

groupec

-

Reference

pathway

(EC)ec通路中的點(diǎn)只表示相關(guān)的酶.EnzymePATHWAY的五種類型rn

-

Reference

pathway

(Reaction)Reaction通路中的點(diǎn)只表示該點(diǎn)參與的某個(gè)反應(yīng)、反應(yīng)物對(duì)及反應(yīng)類型org

-

Organism-specific

pathway

map對(duì)于所有的代謝和非代謝通路,K

都被認(rèn)為是

的標(biāo)識(shí)符,這個(gè)標(biāo)識(shí)符在每一個(gè)物種中對(duì)應(yīng)該物種中的某個(gè)

,從而得到物種特異性的pathway。map00010(

)ko00010ec00010點(diǎn):反應(yīng)rn00010hsa00010點(diǎn):點(diǎn):酶點(diǎn):人類特異性coloringindicates

thatmap

objectsexist

and

arelinked

tocorrespondingentriesPathway

的檢索-以三為例Pathway

的檢索-以三為例Pathway

的檢索-以三為例Pathway

的檢索-以三為例Pathway

的檢索-以三為例Pathway

的檢索-以三為例Pathway

的檢索-以三為例簡(jiǎn)介網(wǎng)絡(luò)通路圖相關(guān)信息為例Pathway

的檢索-以三通路名稱酶化合物其他代謝通路化學(xué)反應(yīng)與其他通路的關(guān)系在圖中可以搜索是否存在特定的或者酶同時(shí)可以顯示該通路相關(guān)的疾病及疾病相關(guān)藥物信息內(nèi)容提要KEGG數(shù)據(jù)庫(kù)簡(jiǎn)介KEGG-pathway查詢KEGG-Brite查詢KEGG-module

查詢KEGG-disease

查詢KEGG

BRITE

Functional

HierarchiesKEGG

BRITE是一個(gè)層級(jí)分類的數(shù)據(jù)庫(kù),包含生物系統(tǒng)各個(gè)方面的知識(shí)。相對(duì)于KEGG

PATHWAY僅限于分子間相互作用和反應(yīng),KEGGBRITE包含了許多不同的關(guān)系類型。例如,可以查詢酶和底物之間的關(guān)系,也可以查詢某種酶的同源

。BRITE

hierarchy

files的來(lái)源:是通過(guò)計(jì)算分析擴(kuò)展出來(lái)的。人工添加的KEGG

BRITE

Database查詢-TP53為例KEGG

BRITE

Database查詢-TP53為例KEGG

BRITE

Database查詢-TP53為例獲得該的K所有相關(guān)信息KEGG

BRITE

Database查詢-TP53為例重新精準(zhǔn)查詢?cè)?的層次信息KEGG

BRITE

Database查詢-TP53為例內(nèi)容提要KEGG數(shù)據(jù)庫(kù)簡(jiǎn)介KEGG-pathway查詢KEGG-Brite查詢KEGG-module

查詢KEGG-disease

查詢KEGG

MODULE

Database組和對(duì)這KEGGMODULE是一個(gè)人工定義的功能單元的集合。用于注釋已些 組進(jìn)行生物學(xué)上的解釋。各個(gè)模塊使用M開頭的 及與其對(duì)應(yīng)的一系列K開頭的 來(lái)表示。四種主要的KEGG模塊1.通路模塊

(pathway

module):代表在KEGG代謝通路圖中的復(fù)雜功能單元,例如M00002(糖酵解,與三碳化合物相關(guān)的 模塊)2.結(jié)構(gòu)復(fù)合物(structural

complexes):通常形成分子機(jī)械,例如M00072(寡糖轉(zhuǎn)移酶)3.功能集(functionalsets):基本單元的其他形式,例如M00360(氨酰基-tRNA

合酶,原核生物)4.特征模塊

(signature

modules):作為某種表型的標(biāo)記,例如M00363(腸

性大腸桿菌致病性特征,

毒素)KEGG

MODULE查詢特定模塊:通過(guò)點(diǎn)擊下拉列表可查看已有模塊;可以 所有模塊列表內(nèi)容提要KEGG數(shù)據(jù)庫(kù)簡(jiǎn)介KEGG-pathway查詢KEGG-Brite查詢KEGG-module

查詢KEGG-disease

查詢KEGG

DISEASE

Database在DISEASE數(shù)據(jù)庫(kù)中,

對(duì)疾病的認(rèn)知體現(xiàn)在疾病相關(guān)的信號(hào)通路中(KEGG-PATHWAY

MAP,前面有提到)。DISEASE數(shù)據(jù)庫(kù)就是對(duì)和疾病相關(guān)的

、環(huán)境擾動(dòng)信息的收集。每項(xiàng)疾病記錄:

以H+數(shù)字

。記錄包含:疾病相關(guān)

,環(huán)境因素,分子

標(biāo)記,治療藥物等。KEGG

REACTION

Database谷胱甘肽:insulin

氧化還原酶KEGG

ORTHOLOGY

(KO)

DatabaseKEGG參考通路圖,BRITE功能層次以及KEGG模塊都是以一種廣泛的方式來(lái)表示,都可以用于所有物種。而KEGG直系同源系統(tǒng)(KO

System)是這一表示方式的基礎(chǔ)。包含手動(dòng)定義的直系同源組,這些直系同源組就相當(dāng)于KEGG通路中的點(diǎn),BRITE層級(jí)中的點(diǎn)以及KEGG模塊中的點(diǎn)。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論