差異表達(dá)基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第1頁
差異表達(dá)基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第2頁
差異表達(dá)基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第3頁
差異表達(dá)基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第4頁
差異表達(dá)基因分析5趨勢性上調(diào)和下調(diào)基因分析6基因集功_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1.轉(zhuǎn)錄組2.高通量測序3.轉(zhuǎn)錄組數(shù)據(jù)分析4.差異表達(dá)基因分析5.趨勢性上調(diào)和下調(diào)基因分析6.基因集功能富集分析1.1transcriptome轉(zhuǎn)錄組(transcriptome)是指特定生物體在某種狀態(tài)或某一生理?xiàng)l件下,細(xì)胞內(nèi)所有基因轉(zhuǎn)錄產(chǎn)物的總和,包括信使RNA、核糖體RNA、轉(zhuǎn)運(yùn)RNA及非編碼RNA;狹義上指所有mRNA的集合。從RNA層次研究基因表達(dá)的情況,即為轉(zhuǎn)錄組學(xué)(transcriptomics),是研究細(xì)胞表型和功能的一個(gè)重要手段。1.2轉(zhuǎn)錄組研究的重要性轉(zhuǎn)錄組是連接基因組遺傳信息與生物功能的蛋白質(zhì)組的紐帶,轉(zhuǎn)錄水平的調(diào)控是最重要也是目前研究最廣泛的生物體調(diào)控方式。轉(zhuǎn)錄組的研究比基因組的研究能給出更高效的有用信息。與基因組不同,轉(zhuǎn)錄組更有時(shí)間空間性。除了異常的mRNA降解現(xiàn)象(如轉(zhuǎn)錄衰減)以外,轉(zhuǎn)錄組反映的是特定條件下活躍表達(dá)的基因轉(zhuǎn)錄組的研究可以提供什么條件下什么基因表達(dá)什么信息,從而推斷相應(yīng)未知基因的功能,揭示特定調(diào)節(jié)基因的作用機(jī)制對轉(zhuǎn)錄本的定量可以了解特定基因的活性和表達(dá)量,用于疾病的診斷和治療通過對轉(zhuǎn)錄組的研究,也讓個(gè)性化醫(yī)療的目標(biāo),從共性轉(zhuǎn)移到個(gè)性,成為可能1.3轉(zhuǎn)錄組研究的技術(shù)主要包括如下三種:1)基于雜交技術(shù)的微陣列技術(shù);2)基于Sanger測序法的SAGE(serialanalysisofgeneexpression)和MPSS(multipleparallelsignaturesequencing);3)基于新一代高通量測序技術(shù)的轉(zhuǎn)錄組測序。幾種轉(zhuǎn)錄組研究所用技術(shù)的比較轉(zhuǎn)錄組所用技術(shù)MicroarraySAGE和MPSSRNA-seq原理寡核苷酸雜交Sanger測序高通量測序信號熒光信號數(shù)字化信號數(shù)字化信號分辨率數(shù)個(gè)-上百個(gè)單堿基單堿基分辨率高低高背景高低低成本高高相對較低起始RNA用量多多少DNA芯片技術(shù):只適用于檢測已知序列,卻無法捕獲新的mRNA。雜交技術(shù)靈敏度有限,對于低豐度的mRNA,微陣列技術(shù)難以檢測,也無法捕獲到目的基因mRNA表達(dá)水平的微小變化。

SAGE(基因表達(dá)系列分析):可以全面了解特定組織或細(xì)胞類型中基因群體表達(dá)狀態(tài),它的顯著特點(diǎn)是能夠大量獲取基因組范圍基因表達(dá)的類別與豐度,該技術(shù)成功地應(yīng)用于特異組織或細(xì)胞的轉(zhuǎn)錄組研究和mRNA群體間差異表達(dá)基因鑒定。缺點(diǎn)是需要大量的mRNAMPSS(多重性平行定序):對于功能基因組研究非常有效,能在短時(shí)間內(nèi)捕獲細(xì)胞或組織內(nèi)全部基因的表達(dá)特征;對于鑒定致病基因并揭示該基因在疾病中的作用機(jī)制等發(fā)揮了重要作用。可以偵測到極為罕見的基因表現(xiàn)1.4轉(zhuǎn)錄組測序(1)RNA聚合酶I和III負(fù)責(zé)種類稀少、功能重要的看家非編碼RNA基因的轉(zhuǎn)錄,包括rRNA,tRNA,snoRNA,snRNA等。由這兩類RNA聚合酶轉(zhuǎn)錄的非編碼RNA屬于看家RNA,在各種生理和病理狀態(tài)下都被高水平轉(zhuǎn)錄,轉(zhuǎn)錄產(chǎn)物占細(xì)胞內(nèi)RNA總量的95%以上,不是生命科學(xué)研究前沿領(lǐng)域的主要關(guān)注對象(2)RNA聚合酶II負(fù)責(zé)蛋白質(zhì)編碼基因和調(diào)控非編碼RNA的轉(zhuǎn)錄,在真核生物的不同生理和病理狀態(tài)下表達(dá)量被嚴(yán)格調(diào)控,一直吸引著各生命科學(xué)研究領(lǐng)域的重點(diǎn)關(guān)注,無比幸運(yùn)的是,由RNA聚合酶II生成的轉(zhuǎn)錄的末端均含有3’端多聚腺苷尾【3’poly(A)tail】。轉(zhuǎn)錄組測序一般是對用多聚胸腺嘧啶(oligo-dT)進(jìn)行親和純化的RNA聚合酶II轉(zhuǎn)錄生成的成熟mRNA和ncRNA進(jìn)行高通量測序。這樣的數(shù)據(jù)有效排除了看家非編碼RNA的干擾,可以通過一次測序獲得一種細(xì)胞內(nèi)幾乎所有重要基因的表達(dá)參數(shù)。轉(zhuǎn)錄組高通量測序的優(yōu)勢?高通量、更精確的數(shù)字信號、無需已知序列、能夠在單核苷酸水平對任意物種的整體轉(zhuǎn)錄活動進(jìn)行檢測,在分析轉(zhuǎn)錄本的結(jié)構(gòu)和表達(dá)水平的同時(shí),還能夠發(fā)現(xiàn)未知轉(zhuǎn)錄本和稀有轉(zhuǎn)錄本,精確的識別可變剪接位點(diǎn)以及cSNP(編碼序列單核苷酸多態(tài)性),提供最全面的轉(zhuǎn)錄組信息。轉(zhuǎn)錄組前沿研究簡介單細(xì)胞轉(zhuǎn)錄組分析轉(zhuǎn)錄組測序確定RNA結(jié)構(gòu)轉(zhuǎn)錄組測序在疾病中的應(yīng)用2.高通量測序測序技術(shù)的發(fā)展高通量測序技術(shù)(High-throughputsequencing)又稱“第二代”測序技術(shù)(“Next-generation”sequencingtechnology),高通量測序使得對一個(gè)物種的轉(zhuǎn)錄組和基因組進(jìn)行細(xì)致全貌的分析成為可能,所以又被稱為深度測序(deepsequencing)2.1高通量測序優(yōu)勢?價(jià)格比第一代大幅度降低可擴(kuò)展的高通量需要樣品量少新穎的測序化學(xué)技術(shù)單個(gè)或配對末端支持2.2高通量測序技術(shù)的應(yīng)用重頭測序(denovosequencing)重測序(resequencing)全轉(zhuǎn)錄組測序(wholetranscriptomeresequencing)小分子RNA測序(smallRNAsequencing)染色質(zhì)免疫共沉淀測序(ChIP-seq)2.3三種常見的測序平臺IlluminaGenomeAnalyzer

專利核心技術(shù)“DNA簇”和“可逆性末端終結(jié)”,達(dá)成自動化樣本制備及基因組數(shù)百萬個(gè)堿基大規(guī)模平行測序。具有高準(zhǔn)確性,高通量,高靈敏度,和低運(yùn)行成本等突出優(yōu)勢,可以同時(shí)完成傳統(tǒng)基因組學(xué)研究(測序和注釋)以及功能基因組學(xué)(基因表達(dá)及調(diào)控,基因功能,蛋白/核酸相互作用)研究。GenomeAnalyzerIIx測序技術(shù)原理1)文庫制備:將基因組DNA打成幾百個(gè)堿基(或更短)的小片段,并在兩個(gè)末端加上接頭(adapter)。2)橋式PCR產(chǎn)生DNA簇a、Solexa測序?qū)S玫臏y序芯片(flowcell)表面連接有一層單鏈引物(Primer),單鏈狀態(tài)的

DNA片斷與芯片表面的引物通過堿基互補(bǔ)被一端固定在芯片上;b、通過擴(kuò)增反應(yīng)使得單鏈

DNA成為雙鏈

DNA;c、雙鏈再次變性后成為單鏈,其一端固定在測序芯片上,另外一端(5’或

3’)隨機(jī)和附近的另外一個(gè)引物互補(bǔ),被固定住,形成“橋“(bridge);d、在測序芯片上同時(shí)有上千萬

DNA單分子發(fā)生以上的反應(yīng);e、c中形成的單鏈橋,以周圍的引物為擴(kuò)增引物,在測序芯片表面再次進(jìn)行擴(kuò)增,形成雙鏈;f、雙鏈經(jīng)變性成單鏈,再次形成橋,成為下一輪擴(kuò)增的模板繼續(xù)擴(kuò)增反應(yīng);g、在反復(fù)進(jìn)行30多輪擴(kuò)增,每個(gè)單分子得到了1000倍擴(kuò)增,成為單克隆“DNA簇群”;h、“DNA簇群”在GenomeAnalyzerIIx測序儀上進(jìn)行序列分析;3)測序反應(yīng)IlluminaGenomeAnalyzerIIx是一種基于單分子簇的邊合成邊測序技術(shù),基于專有的可逆終止化學(xué)反應(yīng)原理。測序時(shí)加入帶有4種熒光標(biāo)記的dNTP,每個(gè)堿基末端被保護(hù)基團(tuán)封閉,每個(gè)循環(huán)只允許單個(gè)堿基合成,經(jīng)過掃描,讀取該次反應(yīng)后的熒光信號結(jié)果,該保護(hù)基團(tuán)被除去,下一個(gè)反應(yīng)可繼續(xù)進(jìn)行,如此反復(fù),得出堿基的精確序列。illumina測序平臺的特點(diǎn)

1)可控制的高通量:一次實(shí)驗(yàn)可讀取量大于15億個(gè)堿基/芯片2)上樣需求低:上樣量只在pmol級(ng級)3)簡單、快速、自動化4)低錯(cuò)誤測序比例利用新穎的可逆熒光標(biāo)記終止子,可以在DNA鏈延伸的過程中檢測單個(gè)堿基摻入。由于四個(gè)可逆終止子dNTP在每個(gè)測序循環(huán)都存在,自然的競爭減少了摻入的錯(cuò)配。454/GS-FLX系統(tǒng)的測序技術(shù)1)技術(shù)原理:GSFLXSystem是一種基于焦磷酸測序原理而建立起來的高通量基因組測序系統(tǒng)。焦磷酸測序的原理如下:(1)1個(gè)特異性的測序引物和單鏈DNA模板結(jié)合,然后加入酶混合物(包括DNAPolymerase、ATPSulfurylase、Luciferase和Apyrase)和底物混合物(包括APS和Luciferin)。(2)向反應(yīng)體系中加入1種dNTP,如果它剛好能和DNA模板的下一個(gè)堿基配對,則會在DNA聚合酶的作用下,添加到測序引物的3’末端,同時(shí)釋放出一個(gè)分子的焦磷酸(PPi)。(3)在ATP硫酸化酶的作用下,生成的PPi可以和APS結(jié)合形成ATP;在熒光素酶的催化下,生成的ATP又可以和熒光素結(jié)合形成氧化熒光素,同時(shí)產(chǎn)生可見光。通過CCD光學(xué)系統(tǒng)即可獲得一個(gè)特異的檢測峰,峰值的高低則和相匹配的堿基數(shù)成正比。(4)反應(yīng)體系中剩余的dNTP和殘留的少量ATP在Apyrase的作用下發(fā)生降解。(5)加入另一種dNTP,使第2-4步反應(yīng)重復(fù)進(jìn)行,根據(jù)獲得的峰值圖即可讀取準(zhǔn)確的DNA序列信息。2)工作流程:3.GSFLX系統(tǒng)的技術(shù)優(yōu)勢和限制1)讀長優(yōu)勢:單個(gè)序列的讀長平均可達(dá)到450個(gè)堿基左右;2)操作簡便高效,不需建庫、克隆挑取、質(zhì)粒提取等工作;3)分析結(jié)果快速、信息高通量,10小時(shí)的運(yùn)行當(dāng)中可獲得100多萬個(gè)讀長,讀取超過4-6億個(gè)堿基信息;4)應(yīng)用廣泛且穩(wěn)定,測序結(jié)果一致性較高;5)同聚物的限制,即相同堿基的連續(xù)摻入,如AAA或GGG,由于沒有終止元件來阻止單個(gè)循環(huán)的連續(xù)摻入,同聚物的長度就需要從信號強(qiáng)度中推斷出來。此處可能產(chǎn)生誤差。因此,主要錯(cuò)誤類型是插入-缺失,而不是替換。ABISOLID3systemSOLID平臺技術(shù)原理:SOLID是基于寡核苷酸連接和檢測進(jìn)行測序的技術(shù)。它以4色熒光標(biāo)記寡核苷酸的連續(xù)連接反應(yīng)為基礎(chǔ),以雙堿基編碼技術(shù)為檢測技術(shù),對單拷貝的DNA片段進(jìn)行大規(guī)模擴(kuò)增和高通量測序?;具^程如下:(1)文庫制備:根據(jù)實(shí)際情況制備文庫:片段文庫或末端配對文庫(2)乳液PCR(3)磁珠富集技術(shù)制備單分子模板:含有DNA模板的磁珠共價(jià)結(jié)合在SOLiD玻片表面。(4)連接測序:上機(jī)測序,邊連接邊測序,獲得SOLiD原始顏色序列。SOLiD系統(tǒng)特點(diǎn)1)高準(zhǔn)確度:雙堿基編碼檢測技術(shù)在測序過程中對每個(gè)堿基判讀兩遍,從而減少原始數(shù)據(jù)錯(cuò)誤,提供內(nèi)在的校對功能。2)高通量:單次運(yùn)行可產(chǎn)生50GB的序列數(shù)據(jù)。3)可擴(kuò)展性4)靈活性5)運(yùn)行時(shí)間較長,測序片段相對較?。簡未芜\(yùn)行時(shí)間長達(dá)7天,最短3.5天。最長2*50bp。測序技術(shù)的比較IlluminaGenomeAnalyzer3.轉(zhuǎn)錄組數(shù)據(jù)分析4.差異表達(dá)基因分析統(tǒng)計(jì)學(xué)分析:1.Foldchange,一般2-foldincreaseordecrease(平行實(shí)驗(yàn)的樣本較少)2.p-value(平行實(shí)驗(yàn)的樣本較多)under-expressedover-expressed

/2

/24.1差異倍數(shù)法Foldchange=log2(A/B)Foldchange=log2(A/B)A:sampleA表達(dá)值B:sampleB表達(dá)值通常以1和-1為作為差異表達(dá)的閾值,判斷基因是否差異表達(dá)倍數(shù)法是比較常用的一種方法,因?yàn)楸容^簡單和直接。但是,這種方法也是有其重大缺陷的。比如,在某個(gè)實(shí)驗(yàn)中,基因表達(dá)水平的變化不大,如果選擇判別閾值為2倍,則有可能找不到幾個(gè)差異表達(dá)的基因,假陰性率比較高。但如果是主觀縮小判斷閾值,又有可能增大假陽性率。這一方法沒有考慮到差異表達(dá)的統(tǒng)計(jì)顯著性。4.2卡方檢驗(yàn)條件:a.所有單元頻數(shù)都不能等于零,b.要求樣本含量應(yīng)大于40且每個(gè)格子中的理論頻數(shù)不應(yīng)小于5。當(dāng)樣本含量大于40但理論頻數(shù)有小于5的情況時(shí)卡方值需要校正,當(dāng)樣本含量小于40時(shí)只能用確切概率法計(jì)算概率。?2=[(ad-bc)2(a+b+c+d)]/[(a+b)(c+d)(a+c)(b+d)]df=1sampleAsampleBGeneiabSum(genei)cd根據(jù)?2求出p值,對于p<=0.05或0.01的,拒絕原假設(shè),存在顯著的統(tǒng)計(jì)學(xué)意義。統(tǒng)計(jì)學(xué)家已證明,當(dāng)自由度比較大時(shí),誤差較小;自由度等于1時(shí),特別n比較小,或理論頻數(shù)<5時(shí),誤差較大,使得所得概率值偏小,因此需要校正。4.2.Fisher精確檢驗(yàn)英國統(tǒng)計(jì)學(xué)家Fisher提出的2*2表的確切概率計(jì)算法,它基于四格表的邊際和固定。當(dāng)?2檢驗(yàn)的條件不滿足時(shí),這個(gè)檢驗(yàn)非常有用。在樣本比較小時(shí)(單元的頻數(shù)小于4),需要用Fisher精確檢驗(yàn)來做獨(dú)立檢驗(yàn)。Fisher檢驗(yàn)是建立在超幾何分布的基礎(chǔ)上的,對于單元頻數(shù)小的表來說,特別適合。對于2*2列聯(lián)表,原假設(shè)“兩變量無關(guān)”。計(jì)算步驟:1.確定統(tǒng)計(jì)量,如?2,計(jì)算?2記為?02;2.對于每個(gè)可能的四格表計(jì)算?2和P;3.符合?2>=?02的那些四格表的P值之和,即為確切概率P值sampleAsampleBGeneiai1bi2Sum(genei)Sum(a1)Sum(b2)假設(shè)檢驗(yàn)問題Ⅰ型錯(cuò)誤(假陽性)即在假設(shè)檢驗(yàn)作推斷結(jié)論時(shí),拒絕了實(shí)際上正確的檢驗(yàn)假設(shè),即將無差異表達(dá)的基因判斷為差異表達(dá)。Ⅱ型錯(cuò)誤(假陰性)即不拒絕實(shí)際上不正確的,即將有差異表達(dá)的基因判斷為無差異表達(dá)。在進(jìn)行差異基因挑選時(shí),整個(gè)差異基因篩選過程需要做成千上萬次假設(shè)檢驗(yàn),導(dǎo)致假陽性率的累積增大。對于這種多重假設(shè)檢驗(yàn)帶來的放大的假陽性率,需要進(jìn)行糾正。常用的糾正策略有Bonferroni效正,控制FDR(FalseDiscoveryRate)值等。FalseDiscoveryRate(FDR)錯(cuò)誤發(fā)現(xiàn)率是評估檢驗(yàn)統(tǒng)計(jì)顯著性的最有力工具。統(tǒng)計(jì)學(xué)家都想用更符合統(tǒng)計(jì)學(xué)的手段得到差異基因,具體說來就是想用假設(shè)檢驗(yàn)后賦予每個(gè)基因統(tǒng)計(jì)顯著性或者P值,使得每個(gè)基因的判別更有統(tǒng)計(jì)學(xué)上的意義。為了達(dá)到這個(gè)目的,統(tǒng)計(jì)學(xué)家們常常用控制錯(cuò)誤發(fā)現(xiàn)率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論