![系統(tǒng)生物學-第三講-轉錄組學課件_第1頁](http://file4.renrendoc.com/view/73b02f624cb2d52468bbeddc4b4cb4bd/73b02f624cb2d52468bbeddc4b4cb4bd1.gif)
![系統(tǒng)生物學-第三講-轉錄組學課件_第2頁](http://file4.renrendoc.com/view/73b02f624cb2d52468bbeddc4b4cb4bd/73b02f624cb2d52468bbeddc4b4cb4bd2.gif)
![系統(tǒng)生物學-第三講-轉錄組學課件_第3頁](http://file4.renrendoc.com/view/73b02f624cb2d52468bbeddc4b4cb4bd/73b02f624cb2d52468bbeddc4b4cb4bd3.gif)
![系統(tǒng)生物學-第三講-轉錄組學課件_第4頁](http://file4.renrendoc.com/view/73b02f624cb2d52468bbeddc4b4cb4bd/73b02f624cb2d52468bbeddc4b4cb4bd4.gif)
![系統(tǒng)生物學-第三講-轉錄組學課件_第5頁](http://file4.renrendoc.com/view/73b02f624cb2d52468bbeddc4b4cb4bd/73b02f624cb2d52468bbeddc4b4cb4bd5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第三講轉錄組學1PPT學習交流第三講轉錄組學1PPT學習交流主要內(nèi)容RNA的種類和作用RNA研究方法高通量技術研究轉錄組學的策略轉錄組學研究進展microRNA研究2PPT學習交流主要內(nèi)容RNA的種類和作用2PPT學習交流RNA是解讀基因組的關鍵RNAProteinPhenotypeGenotype
DNA3PPT學習交流RNA是解讀基因組的關鍵RNAProteinPhenotyp轉錄(transcription)
生物體以DNA為模板合成RNA的過程。
轉錄RNADNA
4PPT學習交流轉錄(transcription)轉錄RNADNA轉錄(Transcription):遺傳信息由DNA轉換到RNA的過程。作為蛋白質生物合成的第一步,轉錄是mRNA以及非編碼RNA(tRNA、rRNA等)的合成步驟。以特定的DNA片段作為模板,以DNA依賴的核糖核酸聚合酶(RNA聚合酶或RNA合成酶)作為催化劑而合成前mRNA的過程。mRNA轉錄時,DNA分子雙鏈打開,在RNA聚合酶的作用下,游離的4種核糖核苷酸按照堿基互補配對原則結合到DNA單鏈上,并在RNA聚合酶的作用下形成單鏈mRNA分子。轉錄本:transcript。也稱為剪切體。一條基因通過不同剪接可構成不同的轉錄本。5PPT學習交流轉錄(Transcription):遺傳信息由DNA轉換到R參與轉錄的物質原料:NTP(ATP,UTP,GTP,CTP)模板:DNA酶:RNA聚合酶(RNApolymerase,RNA-pol)其他蛋白質因子6PPT學習交流參與轉錄的物質原料:NTP(ATP,UTP,GTP,一、RNA的種類和作用1.RNA的種類2.各類RNA的作用7PPT學習交流一、RNA的種類和作用7PPT學習交流RNA的常見種類1.核糖體RNA(rRNA)2.轉運RNA(tRNA)3.信使RNA(mRNA)8PPT學習交流RNA的常見種類1.核糖體RNA(rRNA)8PPT學習交流RNA的其他種類1.不均一核RNA(hnRNA)2.小核RNA(snRNA)3.核仁小RNA(snoRNA)4.小胞質RNA(scRNA/7s-RNA)5.microRNA6.轉移-信使RNA(tmRNA)7.端粒酶RNA8.反義RNA……9PPT學習交流RNA的其他種類1.不均一核RNA(hnRNA)9PPT學習核糖體RNA(rRNA)1.rRNA是核糖體的組成成分
rRNA一般與核糖體蛋白質結合在一起,形成核糖體(ribosome)如果把rRNA從核糖體上除掉,核糖體的結構就會發(fā)生塌陷。
2.定位(起始翻譯)
16S的rRNA3’端有一段核苷酸序列與mRNA的前導序列是互補的,這有助于mRNA與核糖體的結合,進而起始翻譯。核糖體RNA,原核生物包括5s,16s,23s,真核生物包括5s,5.8s,18s和28s,而每種rRNA各自有各自的功能。10PPT學習交流核糖體RNA(rRNA)1.rRNA是核糖體的組成成分10轉運RNA(tRNA)
在蛋白質合成中作為氨基酸的載體
合成i蛋白質的原材料——20種氨基酸與mRNA的堿基之間缺乏特殊的親和力。因此,必須用一種特殊的RNA——轉運RNA(tRNA)把氨基酸搬運到核糖體上,tRNA能根據(jù)mRNA的遺傳密碼依次準確地把它攜帶的氨基酸連結起來形成多肽鏈。11PPT學習交流轉運RNA(tRNA)在蛋白質合成中作為氨基酸的載體1信使RNA(mRNA)
作為蛋白質合成時的模板
mRNA是以DNA的一條鏈為模板,以堿基互補配對原則,轉錄而形成的一條單鏈。其功能就是把DNA上的遺傳信息精確無誤地轉錄下來,然后再由mRNA的堿基順序決定蛋白質的氨基酸順序,完成翻譯,合成蛋白質。
12PPT學習交流信使RNA(mRNA)作為蛋白質合成時的模板12PPT不均一核RNA(hnRNA)概念:在真核生物中,轉錄形成的前體RNA中含有大量非編碼序列,大約只有25%序列經(jīng)加工成為mRNA,最后翻譯為蛋白質。而因為未經(jīng)加工的前體mRNA(pre-mRNA)在分子大小上差別很大,所以通常稱為不均一核RNA。hn-RNA在受到加工之后,移至細胞質,作為mRNA而發(fā)揮其功能。而大部分的hnRNA在核內(nèi)與各種特異的蛋白質形成復合體而存在著。13PPT學習交流不均一核RNA(hnRNA)概念:在真核生物中,轉錄形成的前小核RNA(snRNA)概念:小核RNA,也見譯為核內(nèi)小RNA,是含有100到300堿基的RNA,它是真核生物轉錄后加工過程中RNA剪接體的主要成分。功能:它參與真核生物細胞核中RNA的加工。snRNA和許多蛋白質結合在一起成為小核核糖核蛋白,參與信使RNA前體(也就是hnRNA)的剪接,使后者成為成熟mRNA。14PPT學習交流小核RNA(snRNA)概念:小核RNA,也見譯為核內(nèi)小RN核仁小RNA(snoRNA)
概念:核仁小分子RNA是一大類RNA分子,其大小一般在幾十到幾百個核苷酸,它們能與特定的蛋白質(如自身免疫抗原等)相結合生成snoRNP,在細胞中穩(wěn)定存在,并且富集于核仁區(qū),所以被稱為核仁小分子RNA。功能:負責rRNA的加工(切割和修飾),參與核糖體的生物合成。15PPT學習交流核仁小RNA(snoRNA)概念:核仁小分子RNA是小胞質RNA(scRNA/7s-RNA)存在于細胞質中的小RNA分子(如信號識別顆粒組分中含有的7sRNA),是蛋白質內(nèi)質網(wǎng)定位合成的信號識別體的組成。16PPT學習交流小胞質RNA(scRNA/7s-RNA)16PPT學習交流小RNA分子有些小RNA分子能直接調控某些基因的開關從而控制細胞的生長發(fā)育并決定細胞分化的組織類型小RNA分子本身又包含了若干類RNA,根據(jù)小RNA的生成、結構和功能大約可分為以下三類:miRNA(microRNA)siRNA(smallinterferingRNA)其他小RNA17PPT學習交流小RNA分子有些小RNA分子能直接調控某些基因的開關從而控制microRNA概念:
MicroRNAs(miRNAs)是一種大小約21—23個堿基的單鏈小分子RNA是由具有發(fā)夾結構的約70-90個堿基大小的單鏈RNA前體經(jīng)過Dicer酶加工后生成。不同于siRNA,但是和siRNA密切相關。功能:microRNA通過與相應的蛋白結合,形成一個“RNA誘導的轉錄沉默復合體”。該復合體主要有4個作用:1.降解靶mRNA;2.抑制mRNA的翻譯;3.在細胞核內(nèi)募集組蛋白脫乙?;傅纫蜃?,沉默DNA的表達;4.擴增相應的microRNA。
對一部分miRNAs的研究分析提示:miRNAs參與生命過程中一系列的重要進程,包括早期發(fā)育,細胞增殖,細胞凋亡,細胞死亡,脂肪代謝和細胞分化。18PPT學習交流microRNA概念:MicroRNAs(miRNAs)第一個被確認的miRNA——在線蟲中首次發(fā)現(xiàn)的lin-4和let-7,可以通過部分互補結合到目的mRNA靶的3’非編碼區(qū)(3’UTRs),以一種未知方式誘發(fā)蛋白質翻譯抑制,進而抑制蛋白質合成,通過調控一組關鍵mRNAs的翻譯從而調控線蟲發(fā)育進程。繼線蟲之后,隨后多個研究小組在包括人類、果蠅、植物等多種生物物種中鑒別出數(shù)百個miRNAs。
19PPT學習交流第一個被確認的miRNA——在線蟲中首次發(fā)現(xiàn)的lin-4和轉移-信使RNA(tmRNA)tmRNA是一類具有類似tRNA分子和mRNA分子雙重功能的小分子RNA,它在一種特殊的翻譯模式――反式翻譯模式過程中發(fā)揮重要作用。最近又發(fā)現(xiàn)它與基因的表達調控及細胞周期的調控等生命過程密切相關。反式翻譯是細菌體內(nèi)一種修復翻譯水平上受阻的遺傳信息表達過程的機制。20PPT學習交流轉移-信使RNA(tmRNA)tmRNA是一類具有類似tRN端粒酶RNA端粒酶是一種逆轉錄酶,是染色體端粒的RNA序列。
功能:端粒酶是真核生物端粒復制的模板,它可以使用其部分RNA作為模板來合成端粒重復單元。在大多數(shù)真核生物中,染色體末端DNA的逐步丟失會被端粒酶所抑制。在具有端粒酶活性的細胞內(nèi),它的任務是作為反轉錄的模板然后加在端粒的末端以解決染色體因復制而變短的問題。這種酶在大多數(shù)細胞里是沒有活性的,但在某些腫瘤細胞,轉化細胞,干細胞以及生殖細胞里活性較高。21PPT學習交流端粒酶RNA21PPT學習交流反義RNA(antisenseRNA)反義RNA(antisenseRNA),可通過與靶位序列互補而與之結合的RNA,或直接阻止靶序列功能,或改變靶部位構象而影響其功能。22PPT學習交流反義RNA(antisenseRNA)22PPT學習交流RNA分析方法
23PPT學習交流RNA分析方法
23PPT學習交流mRNA檢測技術核酸雜交技術原位雜交逆轉錄PCR(ReversetranscriptionPCR,RT-PCR)RACE24PPT學習交流mRNA檢測技術24PPT學習交流northernblot25PPT學習交流northernblot25PPT學習交流放射性同位素標記物α-32P-dCTP靈敏度達0.01pg非放射性標記物地高辛靈敏度達0.1pgDIG-dUTP-----通過酶促反應摻入到DNA/RNA中去制成探針----雜交----加抗地高辛-酶的復合物—加底物—顯色
探針制備26PPT學習交流放射性同位素標記物探針制備26PPT學習交流探測不同條件下的基因表達變化B.WITEK-ZAWADA,200328SrRNA18SrRNA27PPT學習交流探測不同條件下的基因表達變化B.WITEK-ZAWADA,FISH:FluorescenceInSituHybridization原位雜交28PPT學習交流FISH:FluorescenceInSituHybr原位雜交MorozLL,200629PPT學習交流原位雜交MorozLL,200629PPT學習交流30PPT學習交流30PPT學習交流RT-PCR是將RNA的反轉錄(RT)和cDNA的聚合酶鏈式擴增(PCR)相結合的技術。首先經(jīng)反轉錄酶的作用從RNA合成cDNA,再以cDNA為模板,擴增合成目的片段。RT-PCR31PPT學習交流RT-PCR是將RNA的反轉錄(RT)和cDNA的聚合酶鏈式轉錄本All
transcripts
All
mRNAs32PPT學習交流轉錄本All
transcriptsAll
mRNAsDNARNA蛋白質基因組學RNA組學蛋白質組學33PPT學習交流DNARNA蛋白質基因組學RNA組學蛋白質組學33PPT學習轉錄組轉錄組概念由Velculescu等在1995年首次提出。轉錄組:廣義上指一個細胞內(nèi)基因組DNA轉錄得到的所有轉錄產(chǎn)物以及轉錄物在細胞特定發(fā)育時期或特定生理條件下的表達水平,包括編碼RNA(mRNA)和非編碼RNA(如tRNA、rRNA、snRNA、miRNA等),狹義上指所有mRNA的集合。轉錄組研究是基因功能及結構研究的基礎和出發(fā)點,是解讀基因組功能原件和揭示細胞及組織分子組成所必需的。34PPT學習交流轉錄組轉錄組概念由Velculescu等在1995年首次提出轉錄組的特點:受到內(nèi)外多種因素的調節(jié),因而是動態(tài)可變的。能夠揭示不同物種、不同個體、不同細胞、不同發(fā)育階段及不同生理病理狀態(tài)下的基因差異表達信息。35PPT學習交流35PPT學習交流轉錄組學(Transcriptomics):研究細胞在某一功能狀態(tài)下所含mRNA的類型與拷貝數(shù);比較不同功能狀態(tài)下mRNA表達的變化,搜尋與功能狀態(tài)變化緊密相關的重要基因群。36PPT學習交流轉錄組學(Transcriptomics):研究細胞在某一功轉錄組研究的主要目的發(fā)現(xiàn)所有轉錄本種類確定基因結構確定基因表達發(fā)現(xiàn)差異表達基因37PPT學習交流轉錄組研究的主要目的發(fā)現(xiàn)所有轉錄本種類37PPT學習交流轉錄組測序技術主要包括:表達序列標簽(EST)表達系列分析(SAGE)基因芯片(Chip)高通量測序技術(NGS)38PPT學習交流轉錄組測序技術主要包括:38PPT學習交流轉錄組測序RNA_Seq的重要分支RNA_Seq是指針對轉錄產(chǎn)物RNA的測序技術,主要有以下分支:轉錄組分析表達譜分析小RNA分析降解組測序針對mRNA的測序轉錄組測序是針對特定樣品特定時期的轉錄mRNA的測序技術,重點在對翻譯蛋白的mRNA的測序研究。39PPT學習交流轉錄組測序RNA_Seq的重要分支39PPT學習交流轉錄組測序的特點應用對象靈活廣泛針對不同物種,不同個體,不同時期,都可以在mRNA水平準確的分析性狀或功能差異,結構變異等信息。研究范圍多樣化從未知基因組物種,到研究成熟的人體病變組織,小鼠組織等特異組織,均可通過轉錄組分析進行研究。研究深度多樣化從大規(guī)模功能轉錄本發(fā)掘到特定基因的可變剪接的不同功能分析,都可以定位研究。40PPT學習交流轉錄組測序的特點應用對象靈活廣泛40PPT學習交流表達序列標簽(EST)測定及分析1、什么是EST?2、EST的應用
3、EST序列測定及分析過程41PPT學習交流表達序列標簽(EST)測定及分析41PPT學習交流(2)什么是表達序列標簽?
(expressedsequencetag,EST)
從已建好的cDNA庫中隨機取出一個克隆,從5′末端或3′末端進行一輪單向自動測序,所獲得的約60-500bp的一段cDNA序列?;蚪M表達為RNA的序列:mRNA和功能RNA1、表達序列與表達序列標簽概念(1)什么是表達序列?42PPT學習交流(2)什么是表達序列標簽?
(expresseEST的獲得途徑43PPT學習交流EST的獲得途徑43PPT學習交流cDNA文庫構建非標準化的cDNA文庫的構建。(可用于基因表達量的分析)◆經(jīng)標準化或扣除雜交處理的cDNA文庫。(富集表達豐度較低的基因)◆Oligod(T)cDNA文庫。(非翻譯區(qū)由于不含有編碼序列,與編碼區(qū)保守序列相比所受到的選擇壓力比較小,因而其多態(tài)性程度比較高,便于多態(tài)性位點的選擇以用于遺傳圖譜的構建。)◆隨機引物cDNA文庫。(所獲得的EST在基因功能的鑒定時具有更多的信息含量,并且在構建EST數(shù)據(jù)庫時更有優(yōu)勢,同時有利于利用EST數(shù)據(jù)庫聚類完整的基因和閱讀框的尋找,便于利用更敏感的蛋白質比較來尋找同源基因。)44PPT學習交流cDNA文庫構建非標準化的cDNA文庫的構建。(可用于基因表cDNA文庫構建常見問題RNA得率低mRNA分離效率低cDNA產(chǎn)物少原因:多糖、多酚、內(nèi)源性核酸蛋白酶、miRNA等45PPT學習交流cDNA文庫構建常見問題RNA得率低45PPT學習交流原因多糖-糖蛋白(核酸蛋白酶,植物血凝素等)、多酚類等次生代謝產(chǎn)物在RNA分離時,經(jīng)常與RNA共沉降,導致RNA丟失。或導致分離后的RNA嚴重不純,影響mRNA分離的得率。內(nèi)源性核酸酶存在較多的情況下,可降解雙鏈DNA、RNA或者DNA-RNA雜合體,致使RNA易降解,轉錄后的DNA接頭無法連接,是cDNA得率低的原因之一。miRNA的存在導致mRNA的降解46PPT學習交流原因多糖-糖蛋白(核酸蛋白酶,植物血凝素等)、多酚類等次生代大規(guī)模EST序列測定的開始1983年:Costanzo等提出EST概念的雛形1991年:Adams測定了三種人腦組織共609條EST,宣布
了cDNA大規(guī)模測序的時代的開始代1991年:Okubo等提出大規(guī)模cDNA測序的研究戰(zhàn)略1993年:Venter等創(chuàng)立現(xiàn)在的EST技術1993年:Boguski&Schuler提出以EST為界標的人類基因組轉錄圖譜計劃47PPT學習交流大規(guī)模EST序列測定的開始1983年:Costanzo等提出
●●93年前ESTs數(shù)據(jù)收錄于GenBank,EBI和DDBJ?!?993年NCBI(NationalCenterofBiotechnologyInformation)建立了一個專門的EST數(shù)據(jù)庫dbEST來保存和收集所有的EST數(shù)據(jù)。●95年中期GenBank中EST的數(shù)目超過了非EST的數(shù)目?!瘳F(xiàn)在GenBank中EST的數(shù)目已經(jīng)超過了三千五百萬,約占GenBank中序列數(shù)的60%.48PPT學習交流●●93年前ESTs數(shù)據(jù)收錄于GenBank,EBIEST數(shù)量排名前10的物種Organism ESTsHomosapiens(human) 8,301,471Musmusculus+domesticus(mouse)4,852,146Zeamays(maize) 2,018,798Bostaurus(cattle) 1,620,962Arabidopsisthaliana(thalecress) 1,559,485Daniorerio(zebrafish) 1,527,299Glycinemax(soybean) 1,481,930Xenopustropicalis(westernclawedfrog)1,422,983Oryzasativa(rice) 1,271,375Cionaintestinalis(玻璃海鞘)1,249,11049PPT學習交流EST數(shù)量排名前10的物種Organism EST技術流程體內(nèi):翻譯體外研究:反轉錄連接,轉化轉化效率問題(基因芯片)文庫構建技術已經(jīng)成熟測序采樣問題(SAGE)測序成本已經(jīng)大大降低大數(shù)據(jù)量分析理念已經(jīng)形成50PPT學習交流EST技術流程體內(nèi):翻譯體外研究:反轉錄連接,轉化轉化效率問ESTs的應用ESTs與基因識別
ESTs已經(jīng)被廣泛的應用于基因識別,因為ESTs的數(shù)目比GenBank中其它的核苷酸序列多,研究人員更容易在EST庫中搜尋到新的基因(Boguskietal.,1994).
在同一物種中搜尋基因家族的新成員(paralogs)。
在不同物種間搜尋功能相同的基因(orthologs)。
已知基因的不同剪切模式的搜尋?!咀ⅲ翰贿^很難確定一個新的序列是由于交替剪切產(chǎn)生的或是由于cDNA文庫中污染了基因組DNA序列(Wolfsbergetal.,1997)】51PPT學習交流ESTs的應用ESTs與基因識別51PPT學習交流ESTs與基因圖譜的繪制
EST可以借助于序列標簽位點(sequence-taggedsites)用于基因圖譜的構建.STS本身是從人類基因組中隨機選擇出來的長度在200-300bp左右的經(jīng)PCR檢測的基因組中唯一的一段序列。來自mRNA的3’非翻譯區(qū)的ESTs更適合做為STSs,用于基因圖譜的繪制。其優(yōu)點主要包括:●由于沒有內(nèi)含子的存在,因此在cDNA及基因組模板中其PCR產(chǎn)物的大小相同;●與編碼區(qū)具有很強的保守性不同,3’UTRs序列的保守性較差,因此很容易將單個基因與編碼序列關系非常緊密的相似基因家族成員分開。(JamesSikela等,1991年)52PPT學習交流ESTs與基因圖譜的繪制52PPT學習交流ESTs與基因預測由于EST來源于cDNA,因此每一條EST均代表了文庫建立時所采樣品特定發(fā)育時期和生理狀態(tài)下的一個基因的部分序列。使用合適的比對參數(shù),大于90%的已經(jīng)注釋的基因都能在EST庫中檢測到(Baileyetal.,1998)。ESTs可以做為其它基因預測算法的補充,因為它們對預測基因的交替剪切和3‘非翻譯區(qū)很有效。53PPT學習交流ESTs與基因預測53PPT學習交流ESTs與SNPs
來自不同個體的冗余的ESTs可用于發(fā)現(xiàn)基因組中轉錄區(qū)域存在的SNPs。最近的許多研究都證明對ESTs數(shù)據(jù)的分析可以發(fā)現(xiàn)基因相關的SNPs(Buetowetal.,1999;Gargetal.,1999;Marthetal.,1999;Picoult-Newbergetal.,1999)。應注意區(qū)別真正的SNPs和由于測序錯誤(ESTs為單向測序得來,錯誤率可達2%)而引起的本身不存在的SNPs。解決這一問題可以通過:●提高ESTs分析的準確性。●對所發(fā)現(xiàn)的SNPs進行實驗驗證。54PPT學習交流ESTs與SNPs54PPT學習交流利用ESTs大規(guī)模分析基因表達水平
因為EST序列是從某以特定的組織的cDNA文庫中隨機測序而得到,所以可以用利用未經(jīng)標準化和差減雜交的cDNA文庫EST分析特定組織的基因表達譜。標準化的cDNA文庫和經(jīng)過差減雜交的cDNA文庫則不能反應基因表達的水平。◆
CGAP
為研究癌癥的分子機理,美國國家癌癥研究所NCI的癌癥基因組解析計劃(CancerGenomeAnatomyProject,CGAP)構建了很多正常的或是癌癥前期的和癌癥后期的組織的cDNA文庫,并進行了大規(guī)模的EST測序,其中大部分的文庫未經(jīng)標準化或差減雜交處理?!艋虮磉_系列分析(SerialAnalysisofGeneExpression,SAGE)
基因表達系列分析是一種用于定量,高通量基因表達分析的實驗方法(Velculescuetal.,1995)。SAGE的原理就是分離每個轉錄本的特定位置的較短的單一的序列標簽(約9-21個堿基對),這些短的序列被連接、克隆和測序,特定的序列標簽的出現(xiàn)次數(shù)就反應了對應的基因的表達豐度?!?/p>
DNA微陣列或基因芯片的研究高密度寡核苷酸cDNA芯片或cDNA微陣列是一種新的大規(guī)模檢測基因表達的技術,具有高通量分析的優(yōu)點。在許多情況下,cDNA芯片的探針來源于3'EST(Dugganetal.,1999),所以EST序列的分析有助于芯片探針的設計。55PPT學習交流利用ESTs大規(guī)模分析基因表達水平55PPT學習交流ESTs數(shù)據(jù)的不足ESTs很短,沒有給出完整的表達序列;低豐度表達基因不易獲得。由于只是一輪測序結果,出錯率達2%-5%;有時有載體序列和核外mRNA來源的cDNA污染或是基因組DNA的污染;有時出現(xiàn)鑲嵌克?。恍蛄械娜哂?,導致所需要處理的數(shù)據(jù)量很大。56PPT學習交流ESTs數(shù)據(jù)的不足ESTs很短,沒有給出完整的表達序列;56EST數(shù)據(jù)庫1993年前:EST收錄于GenBank,EBI和DDBJ1993年NCBI建立dbEST57PPT學習交流EST數(shù)據(jù)庫1993年前:EST收錄于GenBank,EB常用的EST數(shù)據(jù)庫數(shù)據(jù)庫名稱網(wǎng)址說明dbEST綜合UniGene綜合GeneIndices綜合58PPT學習交流常用的EST數(shù)據(jù)庫數(shù)據(jù)庫名稱網(wǎng)址說明dbEST綜合UniGe(1)dbEST(databaseofEST)
Genbank數(shù)據(jù)庫的一部分描述:Publication文件:文獻文件,文獻發(fā)表信息Library文件:文庫文件,實驗信息Contact文件:聯(lián)系人文件,聯(lián)系信息EST文件:EST數(shù)據(jù)文件,核心數(shù)據(jù)59PPT學習交流(1)dbEST(databaseofEST)(2)UniGene數(shù)據(jù)庫Genbank數(shù)據(jù)庫的一部分一條紀錄為一個genecluster簡介查詢UniGene通過NCBIFtp下載:使用dbEST數(shù)據(jù)庫檢索60PPT學習交流(2)UniGene數(shù)據(jù)庫Genbank數(shù)據(jù)(3)GeneIndices數(shù)據(jù)庫
TheInstituteofGenomicResearchDatabase(TIGR)中的一個子庫
簡介數(shù)據(jù)構成42類動物47類植物15類原生生物10類真菌61PPT學習交流(3)GeneIndices數(shù)據(jù)庫TheEST數(shù)據(jù)分析方法隨機挑取克隆進行5′或3′端測序序列前處理聚類和拼接基因注釋及功能分類62PPT學習交流EST數(shù)據(jù)分析方法隨機挑取克隆進行5′或3′端測序序列前處理去除低質量的序列(如使用Phred)應用BLAST、RepeatMasker或Crossmatch屏蔽數(shù)據(jù)組中不屬于表達基因的贗象序列(artifactualsequences)
●
載體序列()
●重復序列(RepBase,)
●污染序列(如核糖體RNA、細菌或其他物種的基因組DNA等)去除其中的嵌合克隆最后去除長度小于100bp的序列(1)序列前處理63PPT學習交流去除低質量的序列(如使用Phred)(1)序列前處理63PP聚類目的:將來自同一個基因或同一個轉錄本的具有重疊部分(over-lapping)的ESTs整合至單一的簇(cluster)中聚類作用:
●產(chǎn)生較長的一致性序列(contigs),用于注釋●降低數(shù)據(jù)的冗余,糾正錯誤數(shù)據(jù)。●可以用于檢測選擇性剪切。ESTs聚類的數(shù)據(jù)庫主要有三個:●UniGene()●TIGRGeneIndices()●STACK()(2)ESTs的聚類64PPT學習交流聚類目的:將來自同一個基因或同一個轉錄本的具有重疊部分(ovESTs的聚類和拼接
聚類的目的就是將來自同一個基因或同一個轉錄本的具有重疊部分(over-lapping)的ESTs整合至單一的簇(cluster)中。聚類作用:產(chǎn)生較長的一致性序列(consensussequence),用于注釋。降低數(shù)據(jù)的冗余,糾正錯誤數(shù)據(jù)??梢杂糜跈z測選擇性剪切?;虮磉_譜分析ESTs聚類的數(shù)據(jù)庫主要有三個:
UniGene()TIGRGeneIndices()STACK()
65PPT學習交流ESTs的聚類和拼接65PPT學習交流不嚴格的和嚴格的聚類(looseandstringentclustering)◆looseclustering●產(chǎn)生的一致性序列比較長●表達基因ESTs數(shù)據(jù)的覆蓋率高●含有同一基因不同的轉錄形式,如各種選擇性剪接體●每一類中可能包含旁系同源基因(paralogousexpressedgene)的轉錄本●序列的保真度低◆stringentclustering●產(chǎn)生的一致性序列比較短●表達基因ESTs數(shù)據(jù)的覆蓋率低●因此所含有的同一基因的不同轉錄形式少●序列保真度高
66PPT學習交流不嚴格的和嚴格的聚類(looseandstringen(ESTclusteringtutorial,)有參照的和無參照的聚類(Supervisedandunsupervisedclustering)◆Supervisedclustering
根據(jù)已知的參考序列(如全長mRNA、已拼接好的一致性序列)聚類?!?/p>
Unsupervisedclustering
沒有根據(jù)參考序列進行分類。
67PPT學習交流(ESTclusteringtutorial,)有參照Cluster的連接利用cDNA克隆的信息和5’,3’端Reads的信息,不同的Cluster可以連接在一起。68PPT學習交流Cluster的連接利用cDNA克隆的信息和5’,3’端Re聚類問題錯拼poly(A),Linker-to-linker,GeneFamilies,repeat漏拼Lowquality,Linker-to-linker,repeat選擇性剪切polyAlinker69PPT學習交流聚類問題錯拼polyAlinker69PPT學習交流(3)序列注釋和分析一級序列同源性比對:使用BLAST等工具蛋白質結構域和功能位點搜索基因功能分類:GeneOntology
表達量比較分析:不同組織或發(fā)育階段基因表達量比較通路分析可變剪切分析70PPT學習交流(3)序列注釋和分析一級序列同源性比對:使用BLAST等工具
較好匹配InterproScanNtBlastnESTsequencesNrBlastx完成注釋無理想匹配較好匹配完成注釋無理想匹配較好匹配無理想匹配Newsequences域的注釋后續(xù)分析常用的基因注釋流程71PPT學習交流較好匹配InterproScanNtBlastnESTBLASTBasicLocalAlignmentSearchTool(BLAST)結合了動態(tài)規(guī)劃算法和間接的啟發(fā)式算法的優(yōu)點,同時把數(shù)據(jù)庫檢索建立在嚴格的統(tǒng)計學基礎之上,是目前最常用的同源檢索工具。局部比對軟件比對比較精確細致用來做同源序列比對,進行基因功能注釋耗時較長72PPT學習交流BLASTBasicLocalAlignmentSeaBLAST簡介命令及參數(shù)簡介比對類型,5種不同的比對程序在線比對和本地比對程序名查詢序列類型查詢數(shù)據(jù)庫類型應用blastp蛋白質蛋白質使用取代矩陣尋找較遠
關系blastn核酸核酸尋找較高分值的匹配,
對較遠關系不太適用blastx核酸(翻譯)蛋白質用于分析新的cDNA序列
或ESTtblastn蛋白質核酸(翻譯)用于尋找數(shù)據(jù)庫中沒有
標注的編碼區(qū)tblastx核酸(翻譯)核酸(翻譯)用于更進一步的分析EST73PPT學習交流BLAST簡介命令及參數(shù)簡介程序名查詢序列類型查詢數(shù)據(jù)庫類型BLAST結果簡介BLAST比對結果詳解7474PPT學習交流BLAST結果簡介BLAST比對結果詳解7474PPT學習交nr&ntnr(Non-redundantproteinsequences)包含GenBank所有編碼序列,以及PDB,swissprot,PIR,PRF數(shù)據(jù)庫的所有編碼序列的一個非冗余數(shù)據(jù)庫,數(shù)據(jù)庫完整度高,氨基酸序列數(shù)據(jù)庫。nt(Nucleotidecollection)包含GenBank和PDB中(不包含EST,STS,GSS)的所有核苷酸序列信息,存在冗余的數(shù)據(jù)庫,數(shù)據(jù)庫完整度高。75PPT學習交流nr&ntnr(Non-redundantproteinUniprotUniprot(UniversalProteinResource)UniProt是一個集中收錄蛋白質資源并能與其它資源相互聯(lián)系的數(shù)據(jù)庫,也是目前為止收錄蛋白質序列目錄最廣泛、功能注釋最全面的一個數(shù)據(jù)庫。整合三大數(shù)據(jù)庫:Swissprot、TrEMBL、PIR(ProteinInformationResource)。數(shù)據(jù)庫組成:UniprotKB(知識庫)、Uniprotarc(歸檔)、Uniref(參考資料庫)。76PPT學習交流UniprotUniprot(UniversalProteUniprot簡介UniProtKBProteinknowledgebase,consistsoftwosections:Swiss-Prot,whichismanuallyannotatedandreviewed.TrEMBL,whichisautomaticallyannotatedandisnotreviewed.Includescompleteandreferenceproteomesets.UniRefSequenceclusters,usedtospeedupsequencesimilaritysearches.UniParcSequencearchive,usedtokeeptrackofsequencesandtheiridentifiers.Uniprot數(shù)據(jù)庫的最重要組成部分UniprotKB(Uniprotknowledgebase)77PPT學習交流Uniprot簡介UniProtKBProteinknowUniProtKB/Swiss-ProtUniProtKB/Swiss-Prot主要收錄人工注釋的序列及其相關文獻信息和經(jīng)過計算機輔助分析的序列。這些注釋都是由專業(yè)的生物學家給出的,準確性無需置疑。注釋結果全面翔實,注釋包括對蛋白質功能、酶學特性、剪接異構體、相關疾病信息的注釋等等。注釋結果無冗余。78PPT學習交流UniProtKB/Swiss-ProtUniProtKB/UniprotKB/TrEMBLUniprotKB/TrEMBL主要收錄的則是高質量的經(jīng)計算機分析后進行自動注釋和分類的序列。由于大規(guī)模測序產(chǎn)生的海量數(shù)據(jù)無法通過Swissprot的嚴謹注釋思路來進行注釋。TrEMBL存儲了比較全面完整的物種編碼序列信息。存在冗余。79PPT學習交流UniprotKB/TrEMBLUniprotKB/TrEMUniprot注釋途徑網(wǎng)頁提交序列本地BLAST80PPT學習交流Uniprot注釋途徑網(wǎng)頁提交序列80PPT學習交流COG81PPT學習交流COG81PPT學習交流
82PPT學習交流82PPT學習交流KEGG注釋途徑網(wǎng)絡提交任務blast83PPT學習交流KEGG注釋途徑網(wǎng)絡提交任務83PPT學習交流KEGG注釋結果BLAST比對結果根據(jù)比對結果提取代謝通路圖根據(jù)基因對應的KO號可以從KEGG官網(wǎng)得到對應的PATHWAY圖片84PPT學習交流KEGG注釋結果BLAST比對結果84PPT學習交流KEGG注釋結果85PPT學習交流KEGG注釋結果85PPT學習交流InterproscanInterproscanInterPro是一個關于蛋白家族(proteinfamilies)、功能保守區(qū)域(domains)和功能位點(funtionalsites)的數(shù)據(jù)庫。該數(shù)據(jù)庫包括了PROSITE,PRINTS,Pfam,ProDom等知名蛋白結構和功能位點及保守域的數(shù)據(jù)庫。86PPT學習交流InterproscanInterproscan86PPT學Interproscan87PPT學習交流Interproscan87PPT學習交流
基因注釋數(shù)據(jù)庫注釋上的基因所占比例TIGROGI(ver17)712694.3TIGRPseudoMolecule(ver5)615181.4NCBIUNIGENE(ver62)671488.8NCBInrproteindatabase583177.293-11BGI_Scan585477.5Uniprotproteindatabase362848.0TIGRtoGO456560.4KEGGAutomaticAnnotationServer94512.5一共有7250(95.9%)的unigenes被注釋。
88PPT學習交流基因注釋數(shù)據(jù)庫注釋上所占TIGROGI(ver17)7
技術路線cDNA文庫構建隨機測序得到EST序列讀取與處理序列拼接和注釋表達豐度和功能分析表達譜特征分析表達量在不同文庫中的分布表達譜的比較分析差異表達基因鑒定與分類功能分析作用機理分析Q-PCR驗證89PPT學習交流技術路線cDNA文庫構建隨機測序得到EST序列讀取與處理序
EST軟件平臺EST序列庫/序列的質量檢查測序量監(jiān)控聚類和拼接檢查(借助于基因組信息)全長ORF尋找發(fā)現(xiàn)全長基因研究表達基因概況的主要實驗手段(DNAchip、proteomics的先驅)功能分類表達量分析交替剪接檢測EST特有信息90PPT學習交流EST軟件平臺EST序列庫/序列的質量檢查測序量監(jiān)控聚類Microarray和GeneChip大規(guī)模表達譜或全景式表達譜(globalexpressionprofile):是生物體(組織、細胞)在某一狀態(tài)下基因表達的整體狀況。微陣列或基因芯片(DNAchip):利用光導化學合成、照相平板印刷以及固相表面化學合成等技術,在固相表面合成成千上萬個寡核苷酸探針,并與放射性同位素或熒光物標記的來自不同細胞、組織或整個器官的DNA或mRNA反轉錄生成的第一鏈cDNA進行雜交,然后用特殊的檢測系統(tǒng)對每個雜交點進行定量分析。91PPT學習交流Microarray和GeneChip大規(guī)模表達譜或全景式表SpottedMicroarrayscDNAArraysOligoArrays
InSituOligoSynthesisPhotosynthesisPlanersurfaceMicrofluidicschipE-fieldsynthesisIntegratedChips
IntegrateduF,microarrayanddetectionchipswithPCR,fluorescenceore-detectionMicrofluidicsPlasticsCeramicsSiliconOthermaterials不同的生物芯片技術平臺點樣芯片原位合成芯片微流體芯片整合型芯片92PPT學習交流SpottedMicroarraysInSituOli基因芯片的探針93PPT學習交流基因芯片的探針93PPT學習交流TaggedRNAfragmentsflushedoverarrayLaseractivationoffluorescenttagsOpticalscanningofhybridizationintensities基因芯片的雜交實驗94PPT學習交流TaggedRNAfragmentsflushedoExperimentaloverview:HybridizationWashingScancy5channelScancy3channel“Overlayimages”Quantifypixelintensities.CellpopulationACellpopulationBRNAextractionAABBReversetranscriptionAABBKlenowlabelincorporationSampleBlabelledwithcy3dyeSampleAlabelledwithcy5dye95PPT學習交流Experimentaloverview:Hybridiz圖像掃描Cy5Cy396PPT學習交流圖像掃描Cy5Cy396PPT學習交流LimitofDetection:1in30,000transcripts
~20transcripts/cellRed–increaseofCy5sampletranscriptsGreen–increaseofCy3sampletranscriptsYellow–equalabundance97PPT學習交流LimitofDetection:1in30,00差異表達基因篩選原理:采用cy3/cy5的ratio值對差異基因進行判斷,或采用統(tǒng)計方法對差異基因進行統(tǒng)計推斷。方法:倍數(shù)法:cy3/cy5比值大于2或者小于0.598PPT學習交流差異表達基因篩選原理:采用cy3/cy5的ratio值對差異
基因芯片或微陣列技術流程….….Clone反轉錄(可選)讀取光密度聚類分析(非同源功能注釋)標記雜交反轉錄EST分析………….………….………….GeneChip0.10.060.050.04…000.070.01…表達量矩陣G1,G3,G5G2,G4G6,G9…利用EST,SAGE分析結果制作芯片(研究已發(fā)現(xiàn)的基因)連接,轉化Ricegenome-wideDNAchip(60,000+預測基因)
果蠅基因芯片…原位合成
99PPT學習交流基因芯片或微陣列技術流程….Clone反轉錄(可選高通量測序轉錄組研究策略100PPT學習交流高通量測序轉錄組研究策略100PPT學習交流高通量測序中重要名詞解釋1、測序深度:測序得到的總堿基數(shù)與待測基因組大小的比值。假設一個基因組大小為7M,測序總堿基數(shù)為70M,則測序深度為10×。2、覆蓋度:測序獲得的序列占整個基因組的比例。由于基因組中高GC含量,重復序列等復雜結構的存在,測序最終拼接組裝的序列往往無法覆蓋所有的區(qū)域,這些區(qū)域就叫做Gap。二者的關系:測序深度與基因組覆蓋度之間是一個正相關的關系,測序帶來的錯誤率或假陽性結果會隨著測序深度的提升而下降。當測序深度在10~15X以上時,基因組覆蓋度和測序錯誤率控制均得以保證。101PPT學習交流高通量測序中重要名詞解釋1、測序深度:測序得到的總堿基數(shù)與待RNA-seq技術路線文庫制備測序短序列定位計數(shù)102PPT學習交流RNA-seq技術路線文庫制備測序短序列定位計數(shù)102PPTWorkflowofRNA-Seq樣品檢測文庫制備ClusterStationIlluminaSequencing生物信息分析103PPT學習交流WorkflowofRNA-Seq樣品檢測103PPT學TotalRNA樣品檢測
Agilent2200檢測OD260/280:1.8~2.2RNA28S:18S≥1.0;RIN≥7
新型安捷倫2200TapeStation
系統(tǒng)是新一代測序(NGS)、生物微陣列芯片分析和qPCR工流程以及蛋白質純化和抗體生產(chǎn)過程中對生物樣品進行質量控制(QC)的理想解決方案?!?/p>
可擴展的通量—16聯(lián)或96孔微量滴定板●
快速得到結果—平均每個樣品只需一分鐘便可獲得結果●
使用簡單—可直接使用的ScreenTape預制膠條簡化了工作流程●
樣品用量少—每次運行僅需要不到2ul樣品104PPT學習交流TotalRNA樣品檢測Agilent2200真核mRNA的純化mRNA的純化主要通過的磁珠與生物素吸附原理從而分離純化Oligo(dT)25磁珠純化原理主要是mRNA的3′的polyA與磁珠在bindingbuffer的作用下相結合。磁珠通過MPC(磁分離器)從溶液中分離出來。mRNA與磁珠結合后,再用Tris-HCL在加熱條件下解離洗脫到溶液中。鏈霉親合素包被磁珠+生物素標記Oligo(dT)25+poly(A)105PPT學習交流真核mRNA的純化mRNA的純化主要通過的磁珠與生物素吸附原原核mRNA的純化AmbionMICROExpressKitLNA扣鎖型探針106PPT學習交流原核mRNA的純化AmbionMICROExpressKmRNA反轉錄---fragment+RT純化過的mRNA樣品加入1μl的fragmentbuffer70℃作用1.5min。加入1μl的stopbuffer終止反應。加入沉淀劑(NaAc糖原無水乙醇)沉淀產(chǎn)物。RTdscDNA107PPT學習交流mRNA反轉錄---fragment+RT純化過的mRNA樣末端修復(防止自連)cDNA3′末端加AAdapter連接108PPT學習交流末端修復(防止自連)108PPT學習交流第一天消化DNAmRNA的分離mRNA的打斷cDNA的合成↓↓第二天末端修復↓↓加接頭膠回收3’端加A第三天PCRPCR膠回收↓↓
文庫制備↓↓文庫質量檢測:Aligent2100:片段大小、純度、濃度qPCR:片段大小、濃度手工檢測:跑膠驗證。109PPT學習交流第一天消化DNAmRNA的分離mRNA的打斷cDNA的合成↓ApplicationRNA-Seq(單端測序---Quantification)RNA-Seq
(雙端測序---Transcriptome)Expression-profiling√√AlternativeSplicing-√FusionGene-√SNPdetection-√HiSeq2500ApplicationsofRNA-Seq110110PPT學習交流ApplicationRNA-SeqRNA-SeqExpr轉錄組分析的兩種策略左邊是先比對,再通過表達量和junction信息得到轉錄本,這種方法能夠檢測到低表達量的轉錄本;右邊是對mRNA-seq的reads直接進行denovo組裝,得到轉錄本,但對于低表達量的轉錄本不易發(fā)現(xiàn)。111PPT學習交流轉錄組分析的兩種策略左邊是先比對,再通過表達量和juncti轉錄組分析的兩種策略有Reference的轉錄組分析以比對為基礎,分析有基因組的樣品的可變剪接信息,以及預測可變剪接帶來的功能差異,同時定量不同樣品的mRNA表達豐度進行差異基因的相關分析。無Reference的轉錄組分析通過測序數(shù)據(jù)組裝大規(guī)模發(fā)掘對應物種的轉錄本信息,對組裝得到轉錄本做功能注釋分析,同時定量轉錄本的不同豐度進行差異分析。112PPT學習交流轉錄組分析的兩種策略有Reference的轉錄組分析112P兩種分析思路原始數(shù)據(jù)Reference基因組Gff基因結構注釋差異基因分析及功能注釋分析有參考基因組無參考基因組聚類得到UnigeneUnigene的差異表達及功能注釋分析TopHat+Cufflinks的可變剪接分析測序數(shù)據(jù)組裝113PPT學習交流兩種分析思路原始數(shù)據(jù)Reference基因組差異基因分析及功有參考基因組分析可變剪接根據(jù)軟件對基因可變剪接結果做預測結合相關基因的功能進行深入的研究(性狀相關..)原始數(shù)據(jù)Reference基因組Gff基因結構注釋TopHat+Cufflinks的可變剪接分析114PPT學習交流有參考基因組分析可變剪接原始數(shù)據(jù)Reference基因組To可變剪接簡介一個基因在轉錄過程中經(jīng)過不同的剪接處理得到不同的mRNA從而產(chǎn)生不同的蛋白,是生物性狀多樣化的重要原因。115PPT學習交流可變剪接簡介一個基因在轉錄過程中經(jīng)過不同的剪接處理得到不同的可變剪接類型外顯子跳過內(nèi)含子滯留互斥外顯子可變5’剪接可變3’剪接保守剪接類型116PPT學習交流可變剪接類型外顯子跳過內(nèi)含子滯留互斥外顯子可變5’剪接可變3可變剪接分析軟件TopHat針對高通量RNA_Seq的序列剪接檢測軟件,采用短序列比對軟件Bowtie進行序列比對和剪接檢測。Cufflinks利用Tophat的檢測結果和測序Reads的比對情況組裝構建轉錄本并進行表達豐度分析的軟件。117PPT學習交流可變剪接分析軟件TopHat117PPT學習交流新基因的發(fā)現(xiàn)新的編碼區(qū)域的定位通過比對結果發(fā)現(xiàn)原本無基因注釋的區(qū)域出現(xiàn)了編碼mRNA的序列新基因的功能注釋分析對新基因的序列做功能注釋118PPT學習交流新基因的發(fā)現(xiàn)新的編碼區(qū)域的定位118PPT學習交流無參考基因組分析數(shù)據(jù)的組裝Orf預測SSR分析通過BLAST做基因功能注釋分析原始數(shù)據(jù)聚類得到Unigene測序數(shù)據(jù)組裝119PPT學習交流無參考基因組分析數(shù)據(jù)的組裝原始數(shù)據(jù)聚類得到Unigene測序測序數(shù)據(jù)組裝組裝基本原理基于測序reads之間的overlap進行的序列組裝組裝軟件簡介TrinityTransabyssSOAP-Trans120PPT學習交流測序數(shù)據(jù)組裝組裝基本原理120PPT學習交流Trinity簡介TrinityTrinity是一個組裝構建無Reference全長轉錄本的組裝軟件,專門針對高通量RNA測序設計的,組裝效果較好。121PPT學習交流Trinity簡介Trinity121PPT學習交流基因表達聚類分析轉錄組學方法的應用導致基因表達數(shù)據(jù)爆炸性增長。如何對這些數(shù)據(jù)進行分析,從中提取有意義的生物學信息,已成為轉錄組學的研究熱點和技術瓶頸。聚類分析技術能將待處理的對象分配到相應的聚類中,使得同一聚類中的對象差別較小,不同聚類之間的對象差別較大。聚類分析技術在轉錄組學研究中,非常適合大批量分析基因群的功能。
122PPT學習交流基因表達聚類分析轉錄組學方法的應用導致基因表達數(shù)據(jù)爆炸性增長有參考基因組序列信息分析流程123PPT學習交流有參考基因組序列信息分析流程123PPT學習交流Reads在基因組上的分布124PPT學習交流Reads在基因組上的分布124PPT學習交流基因結構優(yōu)化
通過轉錄組測序鑒定出酵母3’和5’UTR區(qū)域125PPT學習交流基因結構優(yōu)化通過轉錄組測序鑒定出酵母3’和5
鑒定基因可變剪接exon1exon2exon3exon1exon2exon3exon1exon3commonreadsjunctionreadsmRNA126PPT學習交流鑒定基因可變剪接exon1exon2ex鑒定融合基因127PPT學習交流鑒定融合基因127PPT學習交流新轉錄本預測GenomicintergenicregionReadsclusterPairedReadsdistributionPaired-End(PE)Reads128PPT學習交流新轉錄本預測GenomicintergenicregSNP分析129PPT學習交流SNP分析129PPT學習交流DeepRNAsequencingatsinglebase-pairresolution
revealshighcomplexityofthericetranscriptomeRiceTranscriptomeMaterial
callus
rootatseedlingstage(14d)
shootatseedlingstage(14d)
flagleaves(2stages)
panicle(3stages)Methods
RNASeq(paired-end&singleend)
DGE
smallRNA(18-30nt)基因功能注釋基因結構分析鑒定出大量新轉錄本可變剪接鑒定基因融合鑒定130PPT學習交流DeepRNAsequencingatsingle無參考基因組生物信息分析Unigene功能注釋Unigene的GO分類Unigene代謝通路分析預測編碼蛋白框(CDS)Unigene表達差異分析Unigene在樣品間的差異GO分類和Pathway富集性分析131PPT學習交流無參考基因組生物信息分析Unigene功能注釋131PPT學Denovoreads組裝流程132PPT學習交流Denovoreads組裝流程132PPT學習交流UnigeneGO分類133PPT學習交流UnigeneGO分類133PPT學習交流UnigeneCOG功能分類134PPT學習交流UnigeneCOG功能分類134PPT學習交流基因表達差異分析N1:totaltagNumberinsampleAN2:totaltagNumberinsampleBX:GeneexpressionlevelinsampleAy:GeneexpressionlevelinsampleBReference:AudicS.etal.Thesignificanceofdigitalgeneexpressionprofiles.GenomeRes.19977(10):986-995
135PPT學習交流基因表達差異分析N1:totaltagNumberinUnigenepathway富集性分析136PPT學習交流Unigenepathway富集性分析136PPT學習交Pathway富集性分析列表137PPT學習交流Pathway富集性分析列表137PPT學習交流138PPT學習交流138PPT學習交流GenomeRes2010Case
實驗材料收集:
葉片,花序,果實,根時間點:0,4,8,12,16,20和24h將每個時間點采集的樣品均勻混合測序策略:
Illumina測序,1Gdata139PPT學習交流GenomeRes2010Case實驗材料收集:1.Highlight2.Heat3.Cold4.Salt5.Drought抗逆相關可變剪接140PPT學習交流1.Highlight2.Heat3外包膜蛋白16(AT2G28900)Intron-retentionControlLowTemperatureResistance低溫脅迫相關的AS低溫脅迫下這個內(nèi)含子和對照相比被保留了下來,揭示了可變剪接有重要功能。141PPT學習交流外包膜蛋白16(AT2G28900)Intron-reteAS調節(jié)機制CCA1生物鐘相關基因,例如調節(jié)氣孔的開關等142PPT學習交流AS調節(jié)機制CCA1生物鐘相關基因,例如調節(jié)氣孔的開關等14RNA-Seq單端測序(Quantification)生物信息分析內(nèi)容測序數(shù)據(jù)評估篩選差異表達基因表達模式聚類分析GO功能富集分析Pathway富集分析蛋白互作網(wǎng)絡分析143PPT學習交流RNA-Seq單端測序(Quantification)測序數(shù)RNA-Seq單端測序(Quantification)信息分析流程144PPT學習交流RNA-Seq單端測序(Quantification)信息分RNA-Seq與基因芯片優(yōu)缺點比較技術優(yōu)點缺點RNA-seq1)檢測基因數(shù)比基因芯片多25%2)定量準,可重復性高(重復相關系數(shù)≥0.99)3)數(shù)字化信號,無背景噪音,無交叉雜交4)高、低豐度基因均可檢測5)不受研究物種限制,模式生物和非模式生物均可檢測6)數(shù)據(jù)可與時俱進,即隨數(shù)據(jù)庫更新而更新7)具有較好的分析兼容性,數(shù)據(jù)格式與芯片相同,可與芯片的分析軟件兼容1)樣本要求量比基因芯片多2)數(shù)據(jù)量大,需要具備一定的生物信息分析基礎,才能更好的挖掘數(shù)據(jù)蘊含的豐富信息基因芯片1)平臺應用較早2)信息分析軟件較多3)有些平臺要求樣品量少1)檢測靈敏度較低、重復性差、檢測閾值較狹窄2)有背景噪音,假陽性率>1%3)受物種限制,只能檢測部分模式生物4)受基因拷貝數(shù)限制,無法檢測出低豐度基因5)只能檢測已知轉錄本,無法檢測出新轉錄本6)受數(shù)據(jù)庫數(shù)據(jù)所限,因探針依靠現(xiàn)有數(shù)據(jù)庫或比較舊的版本的數(shù)據(jù)庫來設計的,可能出現(xiàn)注釋不準確的情況145PPT學習交流RNA-Seq與基因芯片優(yōu)缺點比較技術優(yōu)點缺點1)檢測基因數(shù)casePlantPhysiology2010取樣:
選取在成熟季節(jié)開花后5,10,和15個星期葡萄分別代表葡萄果實成熟中的三個時期(postsetting,ve′raison和ripening)數(shù)據(jù)量:
超過59Mreads數(shù)據(jù),
長度在36-44bp之間運用RNA-Seq技術對葡萄果實發(fā)育過程中復雜轉錄特征的研究。146PPT學習交流casePlantPhysiology2010取樣:表二reads在基因組上的分布情況表一
測序數(shù)據(jù)葡萄RNA-Seq單端測序147PPT學習交流表二reads在基因組上的分布情況表一測序數(shù)據(jù)葡萄R漿果發(fā)育三個階段共有、特有基因表達分布圖基因表達量分布148PPT學習交流漿果發(fā)育三個階段共有、特有基因表達分布圖基因表達量分布148表達簇的分類分布情況差異表達的基因GO功能注釋---分成了19個功能類群---按照基因在三個不同時期的表達趨勢進行分類,分成8個cluster。將基因的表達和它調控的一個生理功能聯(lián)系在了一起。149PPT學習交流表達簇的分類分布情況差異表達的基因GO功能注釋---分成了1RNA-Seq對漿果標記基因的驗證用RNA-Seq的數(shù)據(jù)去驗證已報到的十個漿果成熟期的mark基因。事實上從其它方法得到的數(shù)據(jù)去驗證了RNA-Seq數(shù)據(jù)的準確性。150PPT學習交流RNA-Seq對漿果標記基因的驗證用RNA-Seq的數(shù)據(jù)去驗RNA-Seq結果與RT-PCR具有高度一致性RT-PCR驗證結果151PPT學習交流RNA-Seq結果與RT-PCR具有高度一致性RT-PCR驗152轉錄組研究技術橫向比較
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學年高中政治課時分層作業(yè)9訂立合同有學問含解析新人教版選修5
- 2024-2025學年高中數(shù)學課時分層作業(yè)4平面的基本性質含解析蘇教版必修2
- 2024年高中政治第一單元生活與消費第1課第1框揭開貨幣的神秘面紗作業(yè)含解析新人教版必修1
- 2024年高考化學精準押題練第13題化學實驗基礎含解析
- 2024-2025學年高中物理第五章6向心力練習含解析新人教版必修2
- 檢驗工作人員年終總結
- 大學暑期社會實踐個人總結
- 外科護士工作計劃報告
- 魯人版道德與法治七年級下冊15.2《生命最寶貴》聽課評課記錄
- 東入合作協(xié)議書
- 江蘇省2023年對口單招英語試卷及答案
- 易制毒化學品安全管理制度匯編
- GB/T 35506-2017三氟乙酸乙酯(ETFA)
- GB/T 25784-20102,4,6-三硝基苯酚(苦味酸)
- 特種設備安全監(jiān)察指令書填寫規(guī)范(特種設備安全法)參考范本
- 硬筆書法全冊教案共20課時
- 《長方形的面積》-完整版課件
- PDCA降低I類切口感染發(fā)生率
- 工業(yè)企業(yè)現(xiàn)場監(jiān)測工況核查表
- 沉淀池及排水溝清理記錄表
- 急診急救信息化課件
評論
0/150
提交評論