蛋白質(zhì)組學(xué)數(shù)據(jù)分析集錦_第1頁(yè)
蛋白質(zhì)組學(xué)數(shù)據(jù)分析集錦_第2頁(yè)
蛋白質(zhì)組學(xué)數(shù)據(jù)分析集錦_第3頁(yè)
蛋白質(zhì)組學(xué)數(shù)據(jù)分析集錦_第4頁(yè)
蛋白質(zhì)組學(xué)數(shù)據(jù)分析集錦_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、今天我們就來(lái)說(shuō)一說(shuō)蛋白質(zhì)組學(xué)涉及到的生信分析。1認(rèn)識(shí)你的樣本 數(shù)據(jù)到手之后,我們第一步就是希望能夠?qū)?shù)據(jù)有個(gè)大體的了解,包括組內(nèi)樣品均一性、組間樣品差異性以及變化趨勢(shì)情況,有哪些分析可以快速的將這些數(shù)據(jù)進(jìn)行可視化呢?請(qǐng)往下看:PCA分析,是一種非監(jiān)督性的多元統(tǒng)計(jì)分析,將高維復(fù)雜的數(shù)據(jù)進(jìn)行“簡(jiǎn)化和降維”,建立可靠的數(shù)學(xué)模型對(duì)研究對(duì)象的蛋白表達(dá)譜特點(diǎn)進(jìn)行歸納和總結(jié)。從總體上反映各組樣本之間的蛋白差異和組內(nèi)樣本之間的變異度大小。相關(guān)性分析,是指對(duì)兩個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析,從而衡量?jī)蓚€(gè)變量因素的相關(guān)密切程度。相關(guān)性的元素之間需要存在一定的聯(lián)系或者概率才可以進(jìn)行相關(guān)性分析?;谄柹嚓P(guān)系

2、數(shù),可以度量組內(nèi)樣品之間的關(guān)聯(lián)程度,從而分析組內(nèi)樣品間的平行性?;鹕綀D,將所有檢測(cè)到的蛋白的差異顯著性進(jìn)行可視化展示,圖中橫坐標(biāo)為蛋白在兩個(gè)樣本間差異的倍數(shù)變化值,即樣本2的表達(dá)量除以樣本1的表達(dá)量得到的數(shù)值,對(duì)此數(shù)值做了對(duì)數(shù)化處理;縱坐標(biāo)為蛋白表達(dá)量變化差異的統(tǒng)計(jì)學(xué)t檢驗(yàn)p值,p值越小則表達(dá)差異越顯著。紫色點(diǎn)為顯著差異的蛋白,黑色點(diǎn)為非顯著差異蛋白;將所有蛋白映射上去之后,可以獲知,在左邊的點(diǎn)為表達(dá)差異下調(diào)的蛋白,右邊的點(diǎn)為表達(dá)差異上調(diào)的蛋白,越靠左/右邊和上邊的點(diǎn)表達(dá)差異越顯著。 韋恩圖,通過(guò)差異蛋白Venn 圖可觀察出差異蛋白在各對(duì)比組間的數(shù)量分布狀況。每個(gè)顏色代表一組對(duì)比分析篩選出的差

3、異代謝物。 Heatmap,可以將蛋白在各樣品中的表達(dá)趨勢(shì)進(jìn)行可視化展示,并根據(jù)表達(dá)趨勢(shì)進(jìn)行聚類(lèi)分析。圖中每列表示一個(gè)樣本,每行表示一個(gè)蛋白,圖中的顏色表示蛋白在該組樣本中相對(duì)表達(dá)量的大小,紅色代表該蛋白在該樣本中表達(dá)量較高,綠色代表表達(dá)量較低。左側(cè)為蛋白聚類(lèi)的樹(shù)狀圖,兩個(gè)蛋白分支離得越近,說(shuō)明它們的表達(dá)量越接近;上方為樣本聚類(lèi)的樹(shù)狀圖,兩個(gè)樣本分支離的越近,說(shuō)明這兩個(gè)樣本所有蛋白的表達(dá)模式越接近,即蛋白表達(dá)量變化趨勢(shì)越接近。 Cluster聚類(lèi),圖中每一條線表示一個(gè)蛋白;每張圖展示一種類(lèi)型的表達(dá)模式,即體現(xiàn)這組蛋白表達(dá)量變化的趨勢(shì)。 2走進(jìn)你的樣品 經(jīng)過(guò)以上這些分析我們可以很直觀的看出樣本間

4、的平行性,以及組間差異性,并且能夠快速找到一些差異極其顯著或者變化規(guī)律符合我們預(yù)期的蛋白。接下來(lái)的問(wèn)題就是,我們?cè)趺粗肋@些蛋白是否與我們的研究相關(guān),或者說(shuō)這些蛋白都執(zhí)行哪些功能、怎樣發(fā)揮作用的呢? 這就要用到接下來(lái)的分析:GO功能注釋、KEGG注釋以及KOG注釋。GO (Gene Ontology, /) ,是基因本體論聯(lián)合會(huì)建立的將全世界所有與基因有關(guān)的研究結(jié)果進(jìn)行分類(lèi)匯總的綜合數(shù)據(jù)庫(kù),其目的在于標(biāo)準(zhǔn)化不同數(shù)據(jù)庫(kù)中關(guān)于基因和基因產(chǎn)物的生物學(xué)術(shù)語(yǔ),對(duì)基因和蛋白功能進(jìn)行統(tǒng)一的限定和描述。利用 GO 數(shù)據(jù)庫(kù),可以將基因按照其參與的生物過(guò)程(Bi

5、ological Process, BP)、細(xì)胞組分(Cellular Component, CC),分子功能(Molecular Function, MF)三個(gè)方面進(jìn)行分類(lèi)注釋。因此,GO注釋有助于了解蛋白所參與的生物學(xué)功能。 KEGG Pathway注釋?zhuān)谏矬w內(nèi),基因產(chǎn)物并不是孤立存在發(fā)揮作用的,不同基因產(chǎn)物之間通過(guò)有序的相互協(xié)調(diào)來(lái)行使其具體的生物學(xué)功能。因此,KEGG數(shù)據(jù)庫(kù)中豐富的通路信息將有助于我們從系統(tǒng)水平去了解蛋白的生物學(xué)功能,例如代謝途徑、遺傳信息傳遞以及細(xì)胞過(guò)程等一些復(fù)雜的生物功能。 COG注釋?zhuān)Q(chēng)是Cluster of Orthologous Groups of pro

6、teins,由NCBI創(chuàng)建并維護(hù)的蛋白數(shù)據(jù)庫(kù),根據(jù)細(xì)菌、藻類(lèi)和真核生物完整基因組的編碼蛋白系統(tǒng)進(jìn)化關(guān)系分類(lèi)構(gòu)建而成。通過(guò)比對(duì)可以將某個(gè)蛋白序列注釋到某一個(gè)COG中,每一簇COG由直系同源序列構(gòu)成,從而可以推測(cè)該序列的功能。COG分為兩類(lèi),一類(lèi)是原核生物的,另一類(lèi)是真核生物。原核生物的一般稱(chēng)為COG數(shù)據(jù)庫(kù);真核生物的一般稱(chēng)為KOG數(shù)據(jù)庫(kù)。 3終極大招大放送 我們可以通過(guò)蛋白所發(fā)揮的作用或者參與的通路,進(jìn)一步篩選與我們的研究較為相關(guān)的蛋白進(jìn)行后續(xù)的驗(yàn)證。如果無(wú)法根據(jù)這些結(jié)果確定研究方向,那我們還有大招,就是富集分析。富集分析方法通常是分析一組蛋白在某個(gè)功能節(jié)點(diǎn)上是否出現(xiàn)過(guò),原理是由單個(gè)蛋白的注釋分析發(fā)展為蛋白集合的注釋分析。富集分析提高了研究的可靠性,能夠識(shí)別出與生物現(xiàn)象最相關(guān)的生物學(xué)過(guò)程。GO富集,可以找到與生物現(xiàn)象最相關(guān)的生物功能,繪制成柱形圖、網(wǎng)絡(luò)圖。挑選數(shù)目最多,富集最為顯著的通路進(jìn)行后續(xù)的驗(yàn)證及深入研究。 KEGG富集,可以找到與生物現(xiàn)象最相

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論