



下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
rna-seq技術(shù)在生物轉(zhuǎn)錄組學(xué)中的應(yīng)用
干預(yù)組研究是探索功能基因的重要途徑,是基因功能和結(jié)構(gòu)研究的基礎(chǔ)和出發(fā)點(diǎn)。轉(zhuǎn)錄組學(xué)相對(duì)于基因組學(xué)而言,只研究被轉(zhuǎn)錄的基因,研究范圍縮小,針對(duì)性更強(qiáng)。經(jīng)典的減法雜交(subtractivehybridization)、差示篩選(differentialscreening)、cDNA代表差異分析(representativedifferenceanalysis、RDA)以及mRNA差異顯示(differentialdisplay)、表達(dá)序列標(biāo)簽(EST)等技術(shù)已被廣泛用于鑒定和克隆差異表達(dá)的基因,但是這些技術(shù)不能勝任對(duì)大量的植物基因進(jìn)行全面、系統(tǒng)的分析,也不能對(duì)細(xì)胞內(nèi)基因表達(dá)進(jìn)行準(zhǔn)確的定量研究。于是,cDNA微陣列(cDNAmicroarray)、DNA芯片(DNAchip)、基因表達(dá)的系統(tǒng)分析(serialanalysisofgeneexpression,SAGE)和大規(guī)模平行測(cè)序技術(shù)(MPSS)等能夠大規(guī)模地進(jìn)行基因差異表達(dá)分析的技術(shù)應(yīng)運(yùn)而生。而近年來(lái),基于新一代測(cè)序技術(shù)的轉(zhuǎn)錄組測(cè)序(RNA-seq)成為大規(guī)模研究轉(zhuǎn)錄組的一種新的且更為有效的方法。轉(zhuǎn)錄組測(cè)序(RNA-seq)是利用大規(guī)模測(cè)序技術(shù)直接對(duì)cDNA序列進(jìn)行測(cè)序,產(chǎn)生數(shù)以千萬(wàn)計(jì)的reads數(shù)量,從而使得一段特殊的基因組區(qū)域的轉(zhuǎn)錄水平可以直接通過(guò)比對(duì)到該基因組區(qū)域的reads數(shù)來(lái)衡量。RNA-seq是一個(gè)高度靈活的平臺(tái),與其他轉(zhuǎn)錄組學(xué)技術(shù)比較,具有以下優(yōu)點(diǎn):通量高、成本低、靈敏度高,可以獲得低豐度的表達(dá)基因,不局限于已知的基因組序列信息,適用于未知基因組序列的物種,不需要克隆的步驟,操作簡(jiǎn)單,應(yīng)用領(lǐng)域廣(表1)。轉(zhuǎn)錄組測(cè)序技術(shù)被認(rèn)為是一種在轉(zhuǎn)錄水平上更為精確的測(cè)定分析方法,在轉(zhuǎn)錄組學(xué)的應(yīng)用上具有革命性意義。目前,高通量測(cè)序主要有3種測(cè)序平臺(tái)(表2),測(cè)序原理及序列長(zhǎng)度的差異決定了這3種測(cè)序儀在不同領(lǐng)域的應(yīng)用,這些測(cè)序技術(shù)已經(jīng)在動(dòng)植物研究領(lǐng)域中得到了極為廣泛的應(yīng)用,開(kāi)創(chuàng)了生物學(xué)研究的新時(shí)代。相對(duì)于傳統(tǒng)的sanger測(cè)序,轉(zhuǎn)錄組測(cè)序成本效率高,但其讀長(zhǎng)較短,特異性測(cè)序誤差以及缺乏物理克隆,對(duì)序列的組裝、分析和序列的準(zhǔn)確性提出了相當(dāng)大的挑戰(zhàn),同時(shí)由于高通量的測(cè)序技術(shù),獲得海量的數(shù)據(jù),如何從這些數(shù)據(jù)中找出生物學(xué)信息,尤其是功能基因的發(fā)掘,成為這項(xiàng)技術(shù)能否帶來(lái)新的科學(xué)發(fā)現(xiàn)的關(guān)鍵。目前,這些問(wèn)題已經(jīng)通過(guò)測(cè)序方式結(jié)合的雜交測(cè)序策略,更深度的測(cè)序,以及運(yùn)用新的組裝方法和生物信息學(xué)工具解決。1干預(yù)組研究過(guò)程的主要方法和步驟1.1信息分析評(píng)估數(shù)據(jù)量是否滿足信息分析要求高通量測(cè)序數(shù)據(jù)以FASTQ格式來(lái)記錄所測(cè)的堿基讀段和質(zhì)量分?jǐn)?shù)。數(shù)據(jù)產(chǎn)出后,對(duì)樣品測(cè)序獲得的Reads進(jìn)行統(tǒng)計(jì),通過(guò)統(tǒng)計(jì)各樣品Reads長(zhǎng)度、數(shù)量、堿基數(shù)以及GC含量等指標(biāo),評(píng)估數(shù)據(jù)量是否滿足信息分析要求。之后對(duì)原始數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估,過(guò)濾低質(zhì)量數(shù)據(jù),應(yīng)用BLAST、RepeatMasker、Seqclean或Crossmatch等軟件遮蔽數(shù)據(jù)組中不屬于表達(dá)的基因的贗象序列,去除鑲嵌克隆,最后獲得高質(zhì)量數(shù)據(jù)再進(jìn)行后續(xù)分析。1.2從頭測(cè)序組裝到illumina一般分為有參考基因組的重測(cè)序的讀長(zhǎng)定位和無(wú)參考基因組的從頭測(cè)序組裝。重測(cè)序的讀長(zhǎng)定位:是指針對(duì)有參考序列的數(shù)據(jù)組裝,首先將讀長(zhǎng)進(jìn)行排序,然后將所有測(cè)序讀段通過(guò)序列映射定位(mapping)到參考基因組上,與參考基因組進(jìn)行比對(duì)分析,挑選出匹配好的所有讀長(zhǎng)用于后續(xù)分析,同時(shí)進(jìn)行讀長(zhǎng)的基因定位,用于后續(xù)分析。重組裝在已具有基因組序列的模式植物中得到了廣泛應(yīng)用,目前組裝定位軟件有BWA、SOAP、SAMtools、MAQ、ZOOM等。從頭測(cè)序組裝(Denovosequenceassembly):從頭測(cè)序組裝是將各測(cè)序讀長(zhǎng)按順序拼接成連疊群(contig),再組裝成支架(scaffle),最后將支架中間空隙的部分gap進(jìn)行填洞,最終組裝成連續(xù)的較長(zhǎng)的序列,再通過(guò)與模式植物進(jìn)行比對(duì)分析(BLAST),確定基因序列。從頭組裝對(duì)于無(wú)參考序列以及短序列的組裝提供了一個(gè)有效的方法,能夠快速獲得表達(dá)基因。Roche/454技術(shù)因產(chǎn)生的讀長(zhǎng)較長(zhǎng),相對(duì)容易進(jìn)行從頭組裝,但對(duì)Illumina以及SOLID技術(shù)由于讀長(zhǎng)較短,如何將短讀長(zhǎng)拼接成一個(gè)較長(zhǎng)的序列,在拼接策略上存在相當(dāng)大的難度,近年來(lái)研究者們針對(duì)該問(wèn)題,設(shè)計(jì)了各種適用于Illumina的組裝軟件,取得了較好的拼接效果。自2010年在發(fā)表在Nature雜志上的運(yùn)用denovo測(cè)序(Illumina技術(shù))得到熊貓的全基因組序列,至今已在大量非模式動(dòng)植物中通過(guò)3種測(cè)序平臺(tái)互相結(jié)合的方法,進(jìn)行從頭測(cè)序組裝得到單一序列。目前從頭組裝最常用的軟件有:SOAPdenovo、Velvet、Oases、Abyss、ALLPATH等。1.3數(shù)據(jù)庫(kù)、搜索比對(duì)軟件和基因功能分類基因注釋,是基于假設(shè)“同源等于功能相似”,利用生物信息學(xué)方法,將未知基因序列在公共數(shù)據(jù)庫(kù)進(jìn)行相似性搜索比對(duì),通過(guò)與數(shù)據(jù)庫(kù)中已注釋基因的同源性,來(lái)推測(cè)未知基因的功能。目前已注釋的核酸數(shù)據(jù)庫(kù)主要有:GenBank(NC-BI)、EMBL、DDBJ,蛋白質(zhì)數(shù)據(jù)庫(kù)主要有:SWISS-PROT、TrEMBL。采用的搜索比對(duì)軟件主要有BLAST、FASTA等。目前使用的基因功能分類主要有2種方法:GeneOntology(簡(jiǎn)稱GO)分類和KEGG功能分類。GO是基因功能國(guó)際標(biāo)準(zhǔn)化分類體系,把基因按照其參與生物學(xué)過(guò)程(biologicalprocess)、構(gòu)成細(xì)胞的成分(cellularcomponent)和實(shí)現(xiàn)的分子功能(molecularfunction)3個(gè)部分進(jìn)行分類,適用于各個(gè)物種,能對(duì)基因進(jìn)行限定和描述。KEGG數(shù)據(jù)庫(kù)能夠系統(tǒng)分析基因產(chǎn)物在細(xì)胞中的代謝途徑以及功能,生物體內(nèi),不同基因相互協(xié)調(diào)行使其生物學(xué)功能,基于KEGG(KyotoEncyclopediaofG-enesandGenomes)的分析有助于更進(jìn)一步分析表達(dá)基因中存在哪些顯著性富集的Pathway注釋。2干預(yù)組研究過(guò)程中的基因挖掘2.1轉(zhuǎn)錄組檢測(cè)和基因挖掘通過(guò)測(cè)序所得到的大量的EST序列,進(jìn)行處理拼接后得到Unigene,通過(guò)與多個(gè)公共數(shù)據(jù)庫(kù)的比對(duì)和注釋,運(yùn)用BLAST等軟件,可從中獲得有參考注釋功能的候選基因或進(jìn)行新基因的發(fā)掘。該種方法主要用于已知基因組信息或無(wú)基因組信息但有較為清楚的代謝途徑的物種的基因的發(fā)掘。對(duì)玉米的頂端分生組織(SAM)進(jìn)行激光捕獲顯微切割技術(shù)獲取得到,進(jìn)行454測(cè)序,共獲得261000條EST序列,通過(guò)與公共數(shù)據(jù)庫(kù)的EST的比對(duì)和注釋,最后得到18560條Unigene,通過(guò)RT-PCR方法對(duì)SAM細(xì)胞和其他組織細(xì)胞中進(jìn)行了基因的驗(yàn)證,同時(shí)發(fā)現(xiàn)超過(guò)大量比對(duì)不上的EST中有一些基因在SAM細(xì)胞中是特異的。以水稻的愈傷組織、莖尖、根尖、葉片、稻穗為材料,進(jìn)行轉(zhuǎn)錄組的測(cè)序,共檢測(cè)到7232個(gè)新轉(zhuǎn)錄本,同時(shí)發(fā)現(xiàn)1356個(gè)融合基因,鑒定了234個(gè)候選嵌合轉(zhuǎn)錄本。利用454測(cè)序技術(shù)對(duì)美國(guó)西洋參的根進(jìn)行了轉(zhuǎn)錄組的測(cè)序,共產(chǎn)生了31088單一序列,與公共數(shù)據(jù)庫(kù)NCBI的數(shù)據(jù)進(jìn)行比對(duì)和功能注釋等生物信息學(xué)分析,共發(fā)現(xiàn)了150個(gè)細(xì)胞色素P450和235個(gè)糖基轉(zhuǎn)移酶單一序列,通過(guò)茉莉酸甲酯誘導(dǎo)試驗(yàn)和real-timePCR進(jìn)行組織性特異性表達(dá)分析與驗(yàn)證,最終確定了1個(gè)CYP450和4個(gè)UDP基因作為與人參皂苷合成途徑的最相關(guān)的候選基因。運(yùn)用Ilumina平臺(tái)對(duì)鷹嘴豆的根、芽、葉和花芽的混合池共3個(gè)樣本分別進(jìn)行了轉(zhuǎn)錄組測(cè)序,對(duì)全部測(cè)序數(shù)據(jù)進(jìn)行了從頭組裝,獲得了53409條非冗余轉(zhuǎn)錄本,與公共數(shù)據(jù)庫(kù)比對(duì),有85.5%轉(zhuǎn)錄本能夠進(jìn)行蛋白注釋,且與其它豆科植物的Unigene具有顯著的相似性,這些轉(zhuǎn)錄本為鷹嘴豆在不同生物代謝途徑過(guò)程中基因的發(fā)掘提供了一種有效方法。對(duì)飛蝗的轉(zhuǎn)錄組進(jìn)行Illumina測(cè)序,對(duì)測(cè)序得到的序列進(jìn)行從頭組裝,通過(guò)與其它已測(cè)序昆蟲(chóng)進(jìn)行比較,得到了72977條轉(zhuǎn)錄本,并鑒定了11490個(gè)蝗蟲(chóng)蛋白編碼基因,發(fā)現(xiàn)了18個(gè)與發(fā)育相關(guān)的基因。2.2轉(zhuǎn)錄組測(cè)序與數(shù)字基因表達(dá)譜的結(jié)合對(duì)于無(wú)參考基因組且分子基礎(chǔ)研究較為薄弱的非模式物種,可以利用轉(zhuǎn)錄組測(cè)序比較得到差異表達(dá)基因,對(duì)這些差異表達(dá)基因進(jìn)行聚類分析,將具有相似功能的基因聚到一起,通過(guò)已知功能基因來(lái)確定聚為一類的未知基因的功能。采用Illumina平臺(tái)對(duì)桉樹(shù)的木質(zhì)部和非木質(zhì)部組織分別進(jìn)行轉(zhuǎn)錄組測(cè)序分析,通過(guò)2個(gè)轉(zhuǎn)錄組的BLAST比對(duì)和GO分析,從中區(qū)別了一批快速生長(zhǎng)的木質(zhì)化桉樹(shù)與非木質(zhì)化桉樹(shù)的基因。對(duì)鳳眼蓮屬2種不同授粉方式(自交和雜交),4種不同基因型的花進(jìn)行了Illumina轉(zhuǎn)錄組測(cè)定,通過(guò)對(duì)序列進(jìn)行從頭組裝,與相對(duì)近緣種水稻進(jìn)行BLAST比對(duì)和功能注釋,對(duì)4個(gè)轉(zhuǎn)錄組數(shù)據(jù)的差異比較分析,從而確定了269個(gè)與花發(fā)育相關(guān)的基因。數(shù)字基因表達(dá)譜(digitalgeneexpression,DGE)是指通過(guò)構(gòu)建處于某一特定狀態(tài)下的細(xì)胞或組織的非偏性cDNA文庫(kù),大規(guī)模cDNA測(cè)序,收集cDNA序列片段、定性、定量分析其mRNA群體組成,從而描繪該特定細(xì)胞或組織在特定狀態(tài)下的基因表達(dá)種類和豐度信息。轉(zhuǎn)錄組測(cè)序?qū)τ诮沂巨D(zhuǎn)錄組復(fù)雜性,確定基因,以及轉(zhuǎn)錄本結(jié)構(gòu)、可變剪接、非編碼RNA和新轉(zhuǎn)錄本,作用非常強(qiáng)大。比較而言,DGE是更適合用于比較基因表達(dá)研究,其無(wú)偏性,因此對(duì)于細(xì)胞生物的轉(zhuǎn)錄表達(dá)譜是更為敏感和準(zhǔn)確的方法。將轉(zhuǎn)錄組測(cè)序(RNA-seq)和DGE2種方法結(jié)合,對(duì)于無(wú)參考基因組或基因組較大且復(fù)雜的物種,可以有效地發(fā)掘新的功能基因,已經(jīng)在人類、動(dòng)物和植物中基因的發(fā)掘研究中廣泛應(yīng)用。運(yùn)用Illumina平臺(tái),將各個(gè)發(fā)育階段、表型的雌性和雄性稻飛虱進(jìn)行混合,進(jìn)行轉(zhuǎn)錄組的測(cè)序,獲得大量Unigene,同時(shí)結(jié)合6個(gè)發(fā)育階段的蟲(chóng)體的表達(dá)譜的測(cè)定,對(duì)不同發(fā)育階段表達(dá)基因進(jìn)行定量分析,通過(guò)比較表達(dá)譜的差異基因,獲得了與表型差異相關(guān)以及特異發(fā)育時(shí)期的基因,并從中隨意選擇一些基因進(jìn)行qRT-PCR定量分析,證實(shí)了轉(zhuǎn)錄組與表達(dá)譜結(jié)合所獲得基因以及基因表達(dá)量的可靠性和準(zhǔn)確性。通過(guò)轉(zhuǎn)錄組測(cè)序與數(shù)字基因表達(dá)譜的結(jié)合,對(duì)非模式物種深海魚對(duì)鱸魚的免疫遺傳性進(jìn)行了研究,結(jié)果表明,通過(guò)轉(zhuǎn)錄組測(cè)序可以得到2673個(gè)與免疫相關(guān)的基因,通過(guò)感染細(xì)菌與正常組織的表達(dá)譜的差異基因分析,表明具有顯著上調(diào)和下調(diào)的基因與免疫系統(tǒng)的形成表現(xiàn)是密切相關(guān)的。對(duì)紅豆杉的轉(zhuǎn)錄組進(jìn)行了測(cè)序,有23515個(gè)單一序列被鑒定,同時(shí)使用DGE檢測(cè)了紅豆杉的根、莖、葉3種組織的基因差異表達(dá)情況,進(jìn)行GO和KEGG分析,從而鑒定出了一批組織特異性功能基因和紫杉烷生物合成途徑的相關(guān)基因。利用Illumina技術(shù),對(duì)羅漢果花后50d和70d的果實(shí)組織進(jìn)行轉(zhuǎn)錄組測(cè)序分析,所得數(shù)據(jù)用于從頭組裝和功能注釋,同時(shí)對(duì)果實(shí)發(fā)育不同階段(花后3d、50d和70d)分別進(jìn)行了DEG測(cè)序,以轉(zhuǎn)錄組序列為參考,比較3個(gè)DEG的表達(dá)基因和基因表達(dá)量,在差異基因中找到了與羅漢果三萜物質(zhì)的生物合成的10個(gè)候選基因?;诟咄康霓D(zhuǎn)錄組測(cè)序與DEG的結(jié)合使用,是在轉(zhuǎn)錄組水平上開(kāi)展功能基因組學(xué)研究的強(qiáng)有力的工具,為非模式植物的功能基因的發(fā)掘提供一個(gè)有效的方法。最近,根據(jù)標(biāo)準(zhǔn)化的Cleantag數(shù)據(jù),采用RPKM(ReadsPer
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 新疆烏魯木齊市天山區(qū)2025屆三年級(jí)數(shù)學(xué)第二學(xué)期期末統(tǒng)考試題含解析
- 重慶醫(yī)藥高等??茖W(xué)校《統(tǒng)計(jì)應(yīng)用與實(shí)務(wù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 白銀希望職業(yè)技術(shù)學(xué)院《影視三維光影與質(zhì)感技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 工程竣工驗(yàn)收?qǐng)?bào)告建筑外觀質(zhì)量檢查
- 涵洞墻身鋼筋施工方案
- 車庫(kù)地面施工方案
- 施工方案預(yù)控關(guān)鍵
- 戶外石材地面施工方案
- 河道大開(kāi)挖施工方案
- 網(wǎng)絡(luò)架空地板施工方案
- 高中政治選修一第一單元 各具特色的國(guó)家 知識(shí)提綱(核心知識(shí)點(diǎn))-
- 我心中的小英雄王二小講故事比賽課件
- 中交項(xiàng)目標(biāo)準(zhǔn)化手冊(cè)-第一冊(cè)工地建設(shè)
- 口腔正畸理論知識(shí)考核試題與答案
- 天文小報(bào)(流星與彗星)
- 《影視鑒賞(第二版)》課件2-5故事片文化
- 供應(yīng)商訪問(wèn)Ariba招標(biāo)事件的操作說(shuō)明
- 堅(jiān)持“三三三”工作法 打造安全型班組
- 電氣工程及其自動(dòng)化基礎(chǔ)知識(shí)(培訓(xùn))
- 研發(fā)費(fèi)用明細(xì)表模板
- 變電站綜合自動(dòng)化
評(píng)論
0/150
提交評(píng)論