![差異表達基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/14/e286fe78-663c-40cb-b3d8-e65e036cf0a2/e286fe78-663c-40cb-b3d8-e65e036cf0a21.gif)
![差異表達基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第2頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/14/e286fe78-663c-40cb-b3d8-e65e036cf0a2/e286fe78-663c-40cb-b3d8-e65e036cf0a22.gif)
![差異表達基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第3頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/14/e286fe78-663c-40cb-b3d8-e65e036cf0a2/e286fe78-663c-40cb-b3d8-e65e036cf0a23.gif)
![差異表達基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第4頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/14/e286fe78-663c-40cb-b3d8-e65e036cf0a2/e286fe78-663c-40cb-b3d8-e65e036cf0a24.gif)
![差異表達基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第5頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/14/e286fe78-663c-40cb-b3d8-e65e036cf0a2/e286fe78-663c-40cb-b3d8-e65e036cf0a25.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 1.轉(zhuǎn)錄組轉(zhuǎn)錄組 2.高通量測序高通量測序 3.轉(zhuǎn)錄組數(shù)據(jù)分析轉(zhuǎn)錄組數(shù)據(jù)分析 4.差異表達基因分析差異表達基因分析 5.趨勢性上調(diào)和下調(diào)基因分析趨勢性上調(diào)和下調(diào)基因分析 6.基因集功能富集分析基因集功能富集分析1.1transcriptome 轉(zhuǎn)錄組(transcriptome)是指特定生物體在某種狀態(tài)或某一生理條件下,細胞內(nèi)所有基因轉(zhuǎn)錄產(chǎn)物的總和,包括信使RNA、核糖體RNA、轉(zhuǎn)運RNA及非編碼RNA;狹義上指所有mRNA的集合。 從RNA層次研究基因表達的情況,即為轉(zhuǎn)錄組學(xué)(transcriptomics),是研究細胞表型和功能的一個重要手段。1.2轉(zhuǎn)錄組研究的重要性轉(zhuǎn)錄組研究的重要性
2、轉(zhuǎn)錄組是連接基因組遺傳信息與生物功能的蛋白質(zhì)組的紐帶,轉(zhuǎn)錄水平的調(diào)控是最重要也是目前研究最廣泛的生物體調(diào)控方式。 轉(zhuǎn)錄組的研究比基因組的研究能給出更高效的有用信息。 與基因組不同,轉(zhuǎn)錄組更有時間空間性。除了異常的mRNA降解現(xiàn)象(如轉(zhuǎn)錄衰減)以外,轉(zhuǎn)錄組反映的是特定條件下活躍表達的基因 轉(zhuǎn)錄組的研究可以提供什么條件下什么基因表達什么信息,從而推斷相應(yīng)未知基因的功能,揭示特定調(diào)節(jié)基因的作用機制 對轉(zhuǎn)錄本的定量可以了解特定基因的活性和表達量,用于疾病的診斷和治療 通過對轉(zhuǎn)錄組的研究,也讓個性化醫(yī)療的目標,從共性轉(zhuǎn)移到個性,成為可能1.3轉(zhuǎn)錄組研究的技術(shù)主要包括如下三種:主要包括如下三種:1)基于雜
3、交技術(shù)的微陣列技術(shù);2)基于Sanger測序法的SAGE (serial analysis of gene expression) 和 MPSS(multiple parallel signature sequencing);3)基于新一代高通量測序技術(shù)的轉(zhuǎn)錄組測序。幾種轉(zhuǎn)錄組研究所用技術(shù)的比較轉(zhuǎn)錄組所用技術(shù)轉(zhuǎn)錄組所用技術(shù) MicroarraySAGE和和MPSS RNA-seq原理寡核苷酸雜交Sanger測序 高通量測序信號熒光信號數(shù)字化信號數(shù)字化信號分辨率數(shù)個-上百個單堿基單堿基分辨率高低高背景高低低成本高高相對較低起始RNA用量多多少 DNA芯片技術(shù):只適用于檢測已知序列,卻無法捕獲新的
4、mRNA。雜交技術(shù)靈敏度有限,對于低豐度的mRNA,微陣列技術(shù)難以檢測,也無法捕獲到目的基因mRNA表達水平的微小變化。 SAGE(基因表達系列分析): 可以全面了解特定組織或細胞類型中基因群體表達狀態(tài),它的顯著特點是能夠大量獲取基因組范圍基因表達的類別與豐度,該技術(shù)成功地應(yīng)用于特異組織或細胞的轉(zhuǎn)錄組研究和mRNA群體間差異表達基因鑒定。 缺點是需要大量的mRNAMPSS(多重性平行定序): 對于功能基因組研究非常有效,能在短時間內(nèi)捕獲細胞或組織內(nèi)全部基因的表達特征;對于鑒定致病基因并揭示該基因在疾病中的作用機制等發(fā)揮了重要作用。 可以偵測到極為罕見的基因表現(xiàn)1.4轉(zhuǎn)錄組測序轉(zhuǎn)錄組測序 (1)
5、RNA聚合酶I和III負責(zé)種類稀少、功能重要的看家非編碼RNA基因的轉(zhuǎn)錄,包括rRNA,tRNA,snoRNA,snRNA等。由這兩類RNA聚合酶轉(zhuǎn)錄的非編碼RNA屬于看家RNA,在各種生理和病理狀態(tài)下都被高水平轉(zhuǎn)錄,轉(zhuǎn)錄產(chǎn)物占細胞內(nèi)RNA總量的95%以上,不是生命科學(xué)研究前沿領(lǐng)域的主要關(guān)注對象 (2)RNA 聚合酶II負責(zé)蛋白質(zhì)編碼基因和調(diào)控非編碼RNA的轉(zhuǎn)錄,在真核生物的不同生理和病理狀態(tài)下表達量被嚴格調(diào)控,一直吸引著各生命科學(xué)研究領(lǐng)域的重點關(guān)注,無比幸運的是,由RNA聚合酶II生成的轉(zhuǎn)錄的末端均含有3端多聚腺苷尾【3poly(A)tail】。 轉(zhuǎn)錄組測序一般是對用多聚胸腺嘧啶(oligo
6、-dT)進行親和純化的RNA聚合酶II轉(zhuǎn)錄生成的成熟mRNA和ncRNA進行高通量測序。這樣的數(shù)據(jù)有效排除了看家非編碼RNA的干擾,可以通過一次測序獲得一種細胞內(nèi)幾乎所有重要基因的表達參數(shù)。轉(zhuǎn)錄組高通量測序的優(yōu)勢?轉(zhuǎn)錄組高通量測序的優(yōu)勢?高通量、更精確的數(shù)字信號、無需已知序列、能夠在單核苷酸水平對任意物種的整體轉(zhuǎn)錄活動進行檢測,在分析轉(zhuǎn)錄本的結(jié)構(gòu)和表達水平的同時,還能夠發(fā)現(xiàn)未知轉(zhuǎn)錄本和稀有轉(zhuǎn)錄本,精確的識別可變剪接位點以及cSNP(編碼序列單核苷酸多態(tài)性),提供最全面的轉(zhuǎn)錄組信息。轉(zhuǎn)錄組前沿研究簡介轉(zhuǎn)錄組前沿研究簡介單細胞轉(zhuǎn)錄組分析轉(zhuǎn)錄組測序確定RNA結(jié)構(gòu)轉(zhuǎn)錄組測序在疾病中的應(yīng)用2.高通量測序
7、高通量測序 測序技術(shù)的發(fā)展 高通量測序技術(shù)(High-throughput sequencing)又稱“第二代”測序技術(shù)(“Next-generation” sequencing technology),高通量測序使得對一個物種的轉(zhuǎn)錄組和基因組進行細致全貌的分析成為可能,所以又被稱為深度測序(deep sequencing)2.1高通量測序優(yōu)勢?高通量測序優(yōu)勢? 價格比第一代大幅度降低 可擴展的高通量 需要樣品量少 新穎的測序化學(xué)技術(shù) 單個或配對末端支持2.2高通量測序技術(shù)的應(yīng)用高通量測序技術(shù)的應(yīng)用 重頭測序(de novo sequencing) 重測序(resequencing) 全轉(zhuǎn)錄組
8、測序(whole transcriptome resequencing) 小分子RNA測序(small RNA sequencing) 染色質(zhì)免疫共沉淀測序(ChIP-seq)2.3三種常見的測序平臺三種常見的測序平臺Illumina Genome Analyzer 專利核心技術(shù)“DNA 簇”和“可逆性末端終結(jié)”,達成自動化樣本制備及基因組數(shù)百萬個堿基大規(guī)模平行測序。具有高準確性,高通量,高靈敏度,和低運行成本等突出優(yōu)勢,可以同時完成傳統(tǒng)基因組學(xué)研究(測序和注釋)以及功能基因組學(xué)(基因表達及調(diào)控,基因功能,蛋白/核酸相互作用)研究。Genome Analyzer IIx測序技術(shù)原理測序技術(shù)原理
9、1)文庫制備:將基因組DNA打成幾百個堿基(或更短)的小片段,并在兩個末端加上接頭(adapter)。2) 橋式PCR產(chǎn)生DNA簇a、Solexa 測序?qū)S玫臏y序芯片(flow cell)表面連接有一層單鏈引物(Primer),單鏈狀態(tài)的 DNA片斷與芯片表面的引物通過堿基互補被一端固定在芯片上;b、通過擴增反應(yīng)使得單鏈 DNA成為雙鏈 DNA;c、雙鏈再次變性后成為單鏈,其一端固定在測序芯片上,另外一端(5或 3)隨機和附近的另外一個引物互補,被固定住,形成“橋“(bridge);d、在測序芯片上同時有上千萬 DNA 單分子發(fā)生以上的反應(yīng);e、c 中形成的單鏈橋,以周圍的引物為擴增引物,在測
10、序芯片表面再次進行擴增,形成雙鏈;f、雙鏈經(jīng)變性成單鏈,再次形成橋,成為下一輪擴增的模板繼續(xù)擴增反應(yīng);g、在反復(fù)進行 30 多輪擴增,每個單分子得到了 1000 倍擴增,成為單克隆“DNA簇群”;h、“DNA簇群”在Genome Analyzer IIx測序儀上進行序列分析;3)測序反應(yīng))測序反應(yīng) Illumina Genome AnalyzerIIx是一種基于單分子簇的邊合成邊測序技術(shù),基于專有的可逆終止化學(xué)反應(yīng)原理。測序時加入帶有4種熒光標記的dNTP,每個堿基末端被保護基團封閉,每個循環(huán)只允許單個堿基合成,經(jīng)過掃描,讀取該次反應(yīng)后的熒光信號結(jié)果,該保護基團被除去,下一個反應(yīng)可繼續(xù)進行,如
11、此反復(fù),得出堿基的精確序列。illumina測序平臺的特點測序平臺的特點1)可控制的高通量:)可控制的高通量:一次實驗可讀取量大于 15 億個堿基/芯片2)上樣需求低:)上樣需求低:上樣量只在pmol級(ng級)3)簡單、快速、自動化)簡單、快速、自動化4)低錯誤測序比例)低錯誤測序比例 利用新穎的可逆熒光標記終止子,可以在DNA鏈延伸的過程中檢測單個堿基摻入。由于四個可逆終止子dNTP在每個測序循環(huán)都存在,自然的競爭減少了摻入的錯配。454/ GS-FLX 系統(tǒng)的測序技術(shù)系統(tǒng)的測序技術(shù)1)技術(shù)原理:)技術(shù)原理:GS FLX System是一種基于焦磷酸測序原理而建立起來的高通量基因組測序系統(tǒng)
12、。焦磷酸測序的原理如下:(1)1個特異性的測序引物和單鏈DNA模板結(jié)合,然后加入酶混合物(包括DNA Polymerase、ATP Sulfurylase、Luciferase和Apyrase)和底物混合物(包括APS和Luciferin)。(2)向反應(yīng)體系中加入1種dNTP,如果它剛好能和DNA模板的下一個堿基配對,則會在DNA 聚合酶的作用下,添加到測序引物的3末端,同時釋放出一個分子的焦磷酸(PPi)。(3)在ATP硫酸化酶的作用下,生成的PPi可以和APS結(jié)合形成ATP;在熒光素酶的催化下,生成的ATP又可以和熒光素結(jié)合形成氧化熒光素,同時產(chǎn)生可見光。通過CCD光學(xué)系統(tǒng)即可獲得一個特異
13、的檢測峰,峰值的高低則和相匹配的堿基數(shù)成正比。(4)反應(yīng)體系中剩余的dNTP和殘留的少量ATP在Apyrase的作用下發(fā)生降解。(5)加入另一種dNTP,使第24步反應(yīng)重復(fù)進行,根據(jù)獲得的峰值圖即可讀取準確的DNA序列信息。2)工作流程:3. GS FLX系統(tǒng)的技術(shù)優(yōu)勢和限制系統(tǒng)的技術(shù)優(yōu)勢和限制1)讀長優(yōu)勢:單個序列的讀長平均可達到450個堿基左右;2)操作簡便高效,不需建庫、克隆挑取、質(zhì)粒提取等工作;3)分析結(jié)果快速、信息高通量,10小時的運行當中可獲得100多萬個讀長,讀取超過4-6億個堿基信息;4)應(yīng)用廣泛且穩(wěn)定,測序結(jié)果一致性較高;5)同聚物的限制,即相同堿基的連續(xù)摻入,如AAA或GG
14、G,由于沒有終止元件來阻止單個循環(huán)的連續(xù)摻入,同聚物的長度就需要從信號強度中推斷出來。此處可能產(chǎn)生誤差。因此,主要錯誤類型是插入-缺失,而不是替換。ABI SOLID3 systemSOLID平臺技術(shù)原理:SOLID是基于寡核苷酸連接和檢測進行測序的技術(shù)。它以4色熒光標記寡核苷酸的連續(xù)連接反應(yīng)為基礎(chǔ),以雙堿基編碼技術(shù)為檢測技術(shù),對單拷貝的DNA片段進行大規(guī)模擴增和高通量測序?;具^程如下:(1)文庫制備:根據(jù)實際情況制備文庫:片段文庫或末端配對文庫(2)乳液PCR(3)磁珠富集技術(shù)制備單分子模板:含有DNA模板的磁珠共價結(jié)合在SOLiD玻片表面。(4)連接測序:上機測序,邊連接邊測序,獲得SO
15、LiD原始顏色序列。SOLiD系統(tǒng)特點系統(tǒng)特點1)高準確度:雙堿基編碼檢測技術(shù)在測序過程中對每個堿基判讀兩遍,從而減少原始數(shù)據(jù)錯誤,提供內(nèi)在的校對功能。2)高通量:單次運行可產(chǎn)生50GB的序列數(shù)據(jù)。3)可擴展性4)靈活性5)運行時間較長,測序片段相對較?。簡未芜\行時間長達7天,最短3.5天。最長2*50bp。測序技術(shù)的比較測序技術(shù)的比較Illumina Genome Analyzer3.轉(zhuǎn)錄組數(shù)據(jù)分析轉(zhuǎn)錄組數(shù)據(jù)分析4.差異表達基因分析差異表達基因分析統(tǒng)計學(xué)分析:1. Fold change, 一般2-fold increase or decrease (平行實驗的樣本較少) 2. p-valu
16、e (平行實驗的樣本較多)under-expressedover-expressed/2/24.1差異倍數(shù)法差異倍數(shù)法 Fold change= log2(A/B)Fold change = log2(A/B)A:sampleA表達值B:sampleB表達值通常以1和-1為作為差異表達的閾值,判斷基因是否差異表達倍數(shù)法是比較常用的一種方法,因為比較簡單和直接。但是,這種方法也是有其重大缺陷的。比如,在某個實驗中,基因表達水平的變化不大,如果選擇判別閾值為2倍,則有可能找不到幾個差異表達的基因,假陰性率比較高。但如果是主觀縮小判斷閾值,又有可能增大假陽性率。這一方法沒有考慮到差異表達的統(tǒng)計顯著性
17、。 4.2卡方檢驗卡方檢驗條件:a.所有單元頻數(shù)都不能等于零,b.要求樣本含量應(yīng)大于40且每個格子中的理論頻數(shù)不應(yīng)小于5。當樣本含量大于40但理論頻數(shù)有小于5的情況時卡方值需要校正,當樣本含量小于40時只能用確切概率法計算概率。 ?2=(ad-bc)2(a+b+c+d)/(a+b)(c+d)(a+c)(b+d)df=1sampleAsampleBGeneiabSum(genei)cd根據(jù)?2求出p值,對于p=0.05或0.01的,拒絕原假設(shè),存在顯著的統(tǒng)計學(xué)意義。統(tǒng)計學(xué)家已證明,當自由度比較大時,誤差較小;自由度等于1時,特別n比較小,或理論頻數(shù)= ?02的那些四格表的P值之和,即為確切概率P
18、值sampleAsampleBGeneiai1bi2Sum(genei)Sum(a1)Sum(b2)假設(shè)檢驗問題假設(shè)檢驗問題型錯誤(假陽性)即在假設(shè)檢驗作推斷結(jié)論時,拒絕了實際上正確的檢驗假設(shè),即將無差異表達的基因判斷為差異表達。型錯誤(假陰性)即不拒絕實際上不正確的,即將有差異表達的基因判斷為無差異表達。在進行差異基因挑選時,整個差異基因篩選過程需要做成千上萬次假設(shè)檢驗,導(dǎo)致假陽性率的累積增大。對于這種多重假設(shè)檢驗帶來的放大的假陽性率,需要進行糾正。常用的糾正策略有Bonferroni效正,控制FDR(False Discovery Rate)值等。False Discovery Rate
19、(FDR)錯誤發(fā)現(xiàn)率是評估檢驗統(tǒng)計顯著性的最有力工具。統(tǒng)計學(xué)家都想用更符合統(tǒng)計學(xué)的手段得到差異基因,具體說來就是想用假設(shè)檢驗后賦予每個基因統(tǒng)計顯著性或者P值,使得每個基因的判別更有統(tǒng)計學(xué)上的意義。為了達到這個目的,統(tǒng)計學(xué)家們常常用控制錯誤發(fā)現(xiàn)率(False Discovery Rate)的方法來判斷差異基因。其他方法其他方法 t檢驗法檢驗法運用t檢驗法可以判斷基因在兩不同條件下的表達差異是否具有顯著性 22212121/nsnsxxt方差分析方差分析方差分析可用于基因在兩種或多種條件間的表達量的比較它將基因在樣本之間的總變異分解為組間變異和組內(nèi)變異兩部分。通過方差分析的假設(shè)檢驗判斷組間變異是否
20、存在,如果存在則表明基因在不同條件下的表達有差異。2)(ijijxxSS總組間組間組間vMSSS2)(xxnSSiii組間組內(nèi)組內(nèi)組內(nèi)vMSSS2)(ijiijxxSS組內(nèi)組內(nèi)組間MSMSF 5.趨勢性上調(diào)或下調(diào)基因分析趨勢性上調(diào)或下調(diào)基因分析1)foldchange值foldchange(CB)foldchange(BA),閾值為1和 -12)相關(guān)系數(shù) cor(c(A,B,C),c(10,20,30),閾值為0.8和-0.8數(shù)據(jù)的聚類分析數(shù)據(jù)的聚類分析聚類的目的:基于物體的相似性將物體分成不同的組系統(tǒng)聚類法:用于對小樣本的樣品間聚類及對指標聚類 。逐步聚類法或稱快速聚類法:用于對大樣本的樣品
21、間聚類 。有序樣品聚類法:用于對有排列次序的樣本的樣品間聚類, 要求必須是次序相鄰的樣品才能聚在一類。 模糊聚類法:建立在模糊數(shù)學(xué)基礎(chǔ)上的對樣品間聚類的方法, 適用于小樣本。 分割聚類法:適用于對指標聚類 定義:在聚類分析中反映樣品或變量間關(guān)系親疏程度的統(tǒng)計量稱為聚類統(tǒng)計量,常用的聚類統(tǒng)計量分為距離和相似系數(shù)兩種。距 離: 用于對樣品的聚類。常用歐氏距離, 在求距離前,需把指標進行標準化 。相似系數(shù): 常用于對變量的聚類。 一般采用相關(guān)系數(shù) 。聚類分析對于預(yù)測基因新功能及調(diào)控網(wǎng)絡(luò)的構(gòu)建具有重要意義。它用于探索未知的數(shù)據(jù)特征,屬于無監(jiān)督的聚類,也稱無監(jiān)督模式識別,這類訓(xùn)練樣本沒有標簽,主要用于確
22、定兩個特征向量間的相似度及合適的測度,并選擇一個算法方案,基于選定的相似性測度對向量進行聚類。Diffuse large B-cell lymphoma (DLBCL)1. 通過聚類發(fā)現(xiàn)各種亞型之間的關(guān)系2. 根據(jù)基因表達模式,能夠預(yù)測新的基因表達樣本6.基因集功能富集分析基因集功能富集分析進行基因集功能富集分析的原因進行基因集功能富集分析的原因:一組基因直接注釋的結(jié)果是得到大量的功能結(jié)點。這些功能具有概念上的交疊現(xiàn)象,導(dǎo)致分析結(jié)果冗余,不利于進一步的精細分析,所以研究人員希望對得到的功能結(jié)點加以過濾和篩選,以便獲得更有意義的功能信息。 GO分析和分析和Pathway分析分析富集分析的算法:富
23、集分析的算法:富集分析方法通常是分析一組基因在某個功能結(jié)點上是否過出現(xiàn)(over-presentation)。這個原理可以由單個基因的注釋分析發(fā)展到大基因集合的成組分析。由于分析的結(jié)論是基于一組相關(guān)的基因,而不是根據(jù)單個基因,所以富集分析方法增加了研究的可靠性,同時也能夠識別出與生物現(xiàn)象最相關(guān)的生物過程。 富集分析中常用的統(tǒng)計方法: 超幾何分布: Fisher精確檢驗mkxNnmNxnmxkxXP)()()()()()(1221111nnnnnnijnPGO(Gene Ontology)富集分析基因本體數(shù)據(jù)庫是GO組織(Gene Ontology Consortium)在2000年構(gòu)建的一個結(jié)
24、構(gòu)化的標準生物學(xué)模型,旨在建立基因及其產(chǎn)物知識的標準詞匯體系,涵蓋了基因的細胞組分(細胞組分(cellular component)、分子功能()、分子功能(molecular function)、生物學(xué)過程(生物學(xué)過程(biological process)。一套本體實際上是一套詞匯表,一套基因本體(Gene Ontology,GO)也就是一套與基因有關(guān)的樹狀詞匯表。GO術(shù)語在多個合作數(shù)據(jù)庫中的統(tǒng)一使用,促進了各類數(shù)據(jù)庫對基因描述的一致性。 GO注釋體系特點注釋體系特點GO通過控制注釋詞匯的層次結(jié)構(gòu)使得研究人員能夠從不同層面查詢和使用基因注釋信息。從整體上來看GO注釋系統(tǒng)是一個有向無環(huán)圖(D
25、irected Acyclic Graphs),包含三個分支,即: 生物學(xué)過程生物學(xué)過程(biological process),分子功,分子功能能(molecular function)和細胞組分細胞組分(cellular component)。注釋系統(tǒng)中每一個結(jié)點(node)都是基因或蛋白的一種描述,結(jié)點之間保持嚴格的關(guān)系,即“is a”或“part of”。差異基因差異基因GO分析分析差異基因GO分析的關(guān)鍵是用統(tǒng)計學(xué)方法進行基因富集,分析這些基因參與了何種生物學(xué)功能、生物進程以及亞細胞定位,目前常用的基因富集分析法是基于超幾何分布,用Fisher精確檢驗或卡方檢驗完成。蛋白質(zhì)或者基因可以
26、通過ID對應(yīng)或者序列注釋的方法找到與之對應(yīng)的GO號,而GO號可對應(yīng)到Term,即功能類別或者細胞定位。功能富集分析: 功能富集需要有一個參考數(shù)據(jù)集,通過該項分析可以找出在統(tǒng)計上顯著富集的GO Term。GO功能分類是在某一功能層次上統(tǒng)計蛋白或者基因的數(shù)目或組成,往往是在GO的第二層次。此外也有研究都挑選一些Term,而后統(tǒng)計直接對應(yīng)到該Term的基因或蛋白數(shù)。結(jié)果一般以柱狀圖或者餅圖表示。以差異基因作為前景基因,全部基因作為背景基因(參考基因),找出差異基因相關(guān)的GO分類,計算這些差異基因同GO 分類中某(幾)個特定的分支的超幾何分布關(guān)系,GO 分析會對每個有差異基因存在的GO 返回一個p-v
27、alue,小的p 值表示差異基因在該GO 中出現(xiàn)了富集。 N:經(jīng)過GO注釋的全部基因數(shù);n:GO分類中某個分支的基因數(shù) m:經(jīng)過GO注釋的差異基因數(shù);x:GO分類中某個分支的差異基因數(shù)一般取n大于3,校正值(corrected p value)0.05的條目作為顯著性結(jié)果GO 分析對實驗結(jié)果有提示的作用,通過差異基因的GO 分析,可以找到富集差異基因的GO分類條目,尋找不同樣品的差異基因可能和哪些基因功能的改變有關(guān)。超幾何分布:Fisher精確檢驗:mkxNnmNxnmxkxXP)()()()()()(1221111nnnnnnijnPP值的生物學(xué)意義決定于所提交的基因列表,例如,如果列表中均
28、為上調(diào)基因而某功能條目顯著,則認為此實驗因素作用可能使這個功能激活;相反如果為下調(diào)基因并且條目顯著,則認為實驗因素作用可能使這個功能抑制。Pathway分析分析目前較為全面的通路數(shù)據(jù)庫包括KEGG,Biocarta等。KEGG(Kyoto encyclopedia of genes and genomes)是日本京都大學(xué)生物信息中心維護的開放的生物通路數(shù)據(jù)庫,以新陳代謝通路為主,biocarta主要是信號轉(zhuǎn)導(dǎo)通路,它的一個主要特點是研究者可以任意提交自行繪制的所涉及的通路,沒有對其準確性分析驗證。京都基因與基因組百科全書京都基因與基因組百科全書(KEGG)KEGG是系統(tǒng)分析基因功能、基因組信息的數(shù)據(jù)庫,它整合了基因組學(xué)、生物化學(xué)以及系統(tǒng)功能組學(xué)的信息,有助于研究者把基因及表達信息作為一個整體網(wǎng)絡(luò)進行研究。KEGG提供的整合代謝途徑查詢十分出色,包括碳水化合物、核苷酸、氨基酸等代謝及有機物的生物降解,不僅提供了所有可能的代謝途徑,還對催化各步反應(yīng)的酶進行了全面的注解,包含其氨基酸序列、到PDB數(shù)據(jù)庫的鏈接等。此外,KEGG還提供基于Java
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 濟南幼兒師范高等??茖W(xué)?!秱鞲衅骷夹g(shù)于應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖北工業(yè)大學(xué)工程技術(shù)學(xué)院《審計實務(wù)實訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025寒假開學(xué)第一課發(fā)言稿(三)
- 食堂就餐優(yōu)惠方案簡單
- 北京大學(xué)a類數(shù)學(xué)試卷
- 山西財經(jīng)大學(xué)華商學(xué)院《中國工藝美術(shù)史》2023-2024學(xué)年第二學(xué)期期末試卷
- 鄂爾多斯職業(yè)學(xué)院《生物醫(yī)學(xué)傳感器實驗》2023-2024學(xué)年第二學(xué)期期末試卷
- 湘教版數(shù)學(xué)七年級下冊《垂線》聽評課記錄
- 【公開課教案】仰臥起坐-八年級全一冊體育與健康教學(xué)設(shè)計
- 部編人教版道德與法治九下6.1《學(xué)無止境》配套聽課評課記錄
- 《化工設(shè)備機械基礎(chǔ)(第8版)》完整全套教學(xué)課件
- 疥瘡病人的護理
- 2024年江西省中考英語試題含解析
- GB/T 23473-2024林業(yè)植物及其產(chǎn)品調(diào)運檢疫規(guī)程
- 公務(wù)員2012年國考《申論》真題卷及答案(地市級)
- 跨學(xué)科實踐活動2 制作模型并展示科學(xué)家探索物質(zhì)組成與結(jié)構(gòu)的歷程(分層作業(yè))-九年級化學(xué)上冊同步高效課堂(人教版2024)(解析版)
- 新員工三級安全教育考試試題參考答案
- 山東省物流工程師職稱考試參考試題及答案(新版)
- 35kV輸變電工程(變電站、輸配電線路建設(shè))技術(shù)方案
- 數(shù)學(xué)史簡介課件可編輯全文
- 化學(xué)廢水水池清理施工方案
評論
0/150
提交評論