環(huán)境微生物轉(zhuǎn)錄組學(xué)研究進(jìn)展_第1頁(yè)
環(huán)境微生物轉(zhuǎn)錄組學(xué)研究進(jìn)展_第2頁(yè)
環(huán)境微生物轉(zhuǎn)錄組學(xué)研究進(jìn)展_第3頁(yè)
環(huán)境微生物轉(zhuǎn)錄組學(xué)研究進(jìn)展_第4頁(yè)
環(huán)境微生物轉(zhuǎn)錄組學(xué)研究進(jìn)展_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

環(huán)境微生物轉(zhuǎn)錄組學(xué)研究進(jìn)展

自20世紀(jì)90年代以來(lái),生物技術(shù)的快速發(fā)展極大地促進(jìn)了人們對(duì)自然微生物多樣性的了解。特別是近年來(lái)隨著高流量統(tǒng)計(jì)數(shù)據(jù)的開發(fā),全面微生物完整序列的研究已成為一種傳統(tǒng)的實(shí)驗(yàn)手段。但是基因組序列本身不能提供微生物的基因功能信息,因此開展微生物轉(zhuǎn)錄組學(xué)研究尤為重要。環(huán)境微生物轉(zhuǎn)錄組學(xué)以環(huán)境樣品中微生物的全部轉(zhuǎn)錄本即mRNA為研究對(duì)象,從群體水平上研究環(huán)境微生物功能基因的表達(dá)水平及其在不同環(huán)境條件下的轉(zhuǎn)錄調(diào)控規(guī)律,是一門研究微生物與自然環(huán)境相互關(guān)系的新興學(xué)科。然而,環(huán)境微生物轉(zhuǎn)錄組學(xué)的研究進(jìn)展非常緩慢,主要因?yàn)?(1)mRNA占環(huán)境樣品總RNA中提取量的比例較低,通常僅為1–5%(Neidhardt&Umbarger,1996);(2)mRNA非常不穩(wěn)定,極易被RNases降解,半衰期在幾秒到幾分鐘之間(Deutscher,2006);(3)原核生物mRNA通常無(wú)多聚A尾,無(wú)法像真核生物mRNA那樣可通過(guò)oligo(dT)引物直接選擇(Poretskyetal.,2005);(4)后續(xù)的分析中均涉及到大量的酶促反應(yīng)如PCR擴(kuò)增和測(cè)序,但因環(huán)境樣品組成復(fù)雜,其中的重金屬和腐殖質(zhì)等物質(zhì)都可能降低RNA純度,嚴(yán)重干擾下游分析;(5)測(cè)序技術(shù)是環(huán)境轉(zhuǎn)錄組學(xué)發(fā)展的重要技術(shù)瓶頸,單個(gè)微生物細(xì)胞的基因通常高達(dá)上千個(gè),復(fù)雜環(huán)境中微生物的基因數(shù)量更是難以估算,而傳統(tǒng)的測(cè)序技術(shù)通量較低,每次僅獲得幾百個(gè)mRNA序列,信息量較小,很難獲得令人信服的微生物生理代謝過(guò)程的原位證據(jù);同時(shí)傳統(tǒng)測(cè)序技術(shù)依賴于克隆文庫(kù)構(gòu)建,費(fèi)時(shí)費(fèi)力且成本高昂,無(wú)法應(yīng)對(duì)轉(zhuǎn)錄組研究對(duì)大規(guī)模測(cè)序的需求。自2008年以來(lái),DNA測(cè)序技術(shù)取得了重大突破,基于不同原理的新一代高通量測(cè)序技術(shù)逐漸成為目前的主流平臺(tái)(Shendure&Ji,2008)。與傳統(tǒng)的Sanger測(cè)序法相比,新一代測(cè)序技術(shù)的效率大幅提高,一次測(cè)序可以獲得高達(dá)上百萬(wàn)的通量,單個(gè)堿基的測(cè)序成本也大幅下降。新一代測(cè)序技術(shù)的快速發(fā)展催生了RNA-Seq(High-throughputRNAsequencing)技術(shù)的出現(xiàn)。RNA-Seq是利用新一代高通量測(cè)序技術(shù)對(duì)轉(zhuǎn)錄組進(jìn)行分析的技術(shù)(Wangetal.,2009b),相比其他基于雜交技術(shù)的芯片技術(shù)(microarrays)(Schenaetal.,1998)、基于序列分析的基因表達(dá)系列分析(serialanalysisofgeneexpression,SAGE)(Velculescuetal.,1995)及其改進(jìn)版的大規(guī)模平行信號(hào)測(cè)序系統(tǒng)(massivelyparallelsignaturesequencing,MPSS)(Brenneretal.,2000),RNA-Seq具有明顯的優(yōu)勢(shì),如檢測(cè)范圍廣、無(wú)需特異性探針、高靈敏度等(Qietal.,2011)。RNA-Seq使復(fù)雜環(huán)境樣品中微生物轉(zhuǎn)錄組學(xué)研究變得簡(jiǎn)單易行,近年來(lái)在水體(Frias-Lopezetal.,2008;Gilbertetal.,2008;Hollibaughetal.,2011)、土壤(Leiningeretal.,2006;Urichetal.,2008)、污泥(Yu&Zhang,2012)、沉積物(Millsetal.,2012)、動(dòng)物腸道(Poroykoetal.,2010;Turnbaughetal.,2010)等多種環(huán)境中得到廣泛應(yīng)用,在環(huán)境微生物學(xué)領(lǐng)域受到極大關(guān)注。1環(huán)境中的微生物轉(zhuǎn)移技術(shù)流程環(huán)境微生物轉(zhuǎn)錄組學(xué)的技術(shù)流程可大致分為以下幾個(gè)步驟:1.1采集和保存方法環(huán)境樣品一般分為水樣、土壤和寄主樣品(如人體微生物)三大類,不同樣品類型決定了具體的采集和保存辦法。一般的原則是嚴(yán)格控制樣品采集的時(shí)間,樣品采集后要利用液氮原位快速冷凍,并置于-70℃長(zhǎng)期保存,或者將樣品浸入RNA保存液(如Ambion公司的RNAlater保存液)中,-20℃長(zhǎng)期保存。1.2rna提取試劑盒不同環(huán)境來(lái)源的樣品RNA的提取方法各不相同,但一般都包括細(xì)胞裂解、蛋白抽提、核酸沉淀、DNA酶解等步驟。另外,有多種商業(yè)化的RNA提取試劑盒可供選擇,如RNeasyMiniKit(Qiagen)、mirVanamiRNAIsolationKit(Ambion)、PowerSoil?TotalRNAIsolationKit(MoBioLaboratories)等。1.3非試劑盒測(cè)定由于mRNA在總RNA中含量很低,所以通常情況下需要對(duì)mRNA進(jìn)行富集。由于原核生物的mRNA不含多聚A尾,所以不能用oligo(dT)直接進(jìn)行選擇,只能通過(guò)消減rRNA的方法間接富集mRNA。這一步驟一般采用試劑盒進(jìn)行,如Ambion公司的MICROBExpress?BacterialmRNAEnrichmentKit、EpiCentre公司的mRNA-ONLY?ProkaryoticmRNAIsolationKit等,還有一些非試劑盒的物理化學(xué)方法。通常情況下,mRNA的含量會(huì)提高數(shù)倍到數(shù)十倍,最高可達(dá)95%左右(Giannoukosetal.,2012)。此外,mRNA可以用化學(xué)水解法或酶降解法生成較小的片段以適應(yīng)測(cè)序平臺(tái)的需要,例如,Illumina或SOLiD測(cè)序平臺(tái)適合200–250nt大小的片段(Chu&Corey,2012)。片段化步驟也可以在cDNA合成后進(jìn)行。1.4c有效使用可實(shí)現(xiàn)cd的第二鏈以富集后的mRNA為模板,經(jīng)反轉(zhuǎn)錄酶催化生成cDNA的第一鏈,再經(jīng)DNA聚合酶等多種酶的共同作用生成cDNA的第二鏈。這一步驟的實(shí)現(xiàn)也有多種試劑盒可供選擇,如Invitrogen的SuperScript?Double-StrandedcDNASynthesisKit,Promega公司的UniversalRiboClone?cDNASynthesisSystem等。引物一般選擇隨機(jī)六聚體引物。1.5測(cè)序步驟不同純化后的cDNA經(jīng)過(guò)一系列的前處理后,進(jìn)行高通量測(cè)序。這些步驟隨不同的測(cè)序平臺(tái)而有差異。通常情況下,高通量測(cè)序的數(shù)據(jù)為FASTQ格式,數(shù)據(jù)分析的過(guò)程因樣品類型和研究目的不同而具有明顯的差異,在數(shù)據(jù)處理及分析部分會(huì)詳細(xì)闡述。2目標(biāo)微生物的rna含量和測(cè)序量環(huán)境微生物樣品和純培養(yǎng)菌株樣品在許多方面存在差異,首先是環(huán)境樣品微生物多樣性雖然高,但目標(biāo)微生物的RNA含量非常低,受到樣品量的限制,大多數(shù)情況下不能滿足測(cè)序量的要求;其次是環(huán)境樣品中存在多種雜質(zhì)如腐植酸的干擾,另外物種組成非常復(fù)雜,rRNA消減程度有限,這些都加大了環(huán)境樣品研究的難度。但近年來(lái),這些方面的研究都有不同程度的進(jìn)展。2.1添加樣品量、純化程序及添加量高通量測(cè)序一般需要微克級(jí)的RNA,而RNA的產(chǎn)量受諸多因素的影響。以土壤樣品為例,土壤中活性微生物的多少、RNA提取方法的選擇以及樣品的純化步驟在很大程度上都可能影響RNA的產(chǎn)量。不同類型的土壤中活性微生物含量差別巨大,每克土壤RNA的提取量多則幾微克,少時(shí)僅幾十納克(Wangetal.,2012),因此增加樣品量是提高RNA產(chǎn)量的方法之一。RNA提取的方法有很多種,目前似乎沒(méi)有一種方法可適合于所有的樣品類型,即使同樣的樣品,用不同的方法提取,RNA產(chǎn)量也會(huì)有顯著差異。因此,需要根據(jù)樣品類型及研究目的選擇適當(dāng)?shù)姆椒ɑ蚋倪M(jìn)相應(yīng)的技術(shù)。環(huán)境微生物轉(zhuǎn)錄組學(xué)研究一般包含多次RNA純化步驟,每次純化過(guò)程都會(huì)造成一定量的RNA損失,因此選擇質(zhì)量好的純化試劑盒能夠最大程度地減少這一損失。除了在提取和純化過(guò)程中對(duì)流程進(jìn)行優(yōu)化,在cDNA合成之前也可對(duì)mRNA進(jìn)行擴(kuò)增,Ambion公司的MessageAmp?BacteriaIIRNAAmplificationKit試劑盒可使RNA數(shù)量增加200–1,500倍,已在多個(gè)研究中得到應(yīng)用(Frias-Lopezetal.,2008;Hewsonetal.,2010;deMenezesetal.,2012)。2.2rna的提取獲取高質(zhì)量的RNA是轉(zhuǎn)錄組學(xué)研究的基礎(chǔ)。RNA純化試劑盒并不能除掉所有的雜質(zhì)。以土壤樣品RNA提取為例,主要的挑戰(zhàn)是腐植酸的污染,它會(huì)在核酸提取過(guò)程中與核酸共沉淀,并對(duì)后續(xù)的酶反應(yīng)造成不同程度的抑制。近年來(lái)有多種方法被證明能夠有效地去除腐植酸,并可應(yīng)用到RNA提取過(guò)程中的不同階段,如控制裂解的溫度(Wangetal.,2009a)、低pH條件(Metteletal.,2010)、抽提液中加入CTAB(cetyltrimethylammoniumbromide)(Griffithsetal.,2000)或PVPP(polyvinylpolypyrrolidone)(Rajendhran&Gunasekaran,2008)、用PEG來(lái)沉淀RNA(Bürgmannetal.,2003)等。但有時(shí)僅改進(jìn)提取條件仍然不夠,對(duì)于腐植酸含量高的樣品,需要對(duì)提取后的RNA進(jìn)行進(jìn)一步的純化,最近的研究認(rèn)為柱純化方法,如SephacrylS-400凝膠過(guò)濾(Wangetal.,2009a)和Q-SepharoseFastFlow離子交換柱(Metteletal.,2010)是相對(duì)高效的方法。2.3mrna的富集和凈化盡管高通量測(cè)序可以獲得數(shù)量巨大的序列數(shù)據(jù),但由于mRNA在總RNA中的比例很低,為了提高測(cè)序的有效性同時(shí)也為了避免浪費(fèi),需要去除總RNA中的rRNA以便對(duì)mRNA進(jìn)行富集,這也是轉(zhuǎn)錄組學(xué)研究中的一個(gè)重要步驟。目前mRNA的富集方法主要包括:基于消減雜交法的Ambion公司的MICROBExpress?BacterialmRNAEnrichmentKit和EpiCentre公司的Ribo-Zero?rRNARemovalKit,以及基于核酸外切酶法的EpiCentre公司的mRNA-ONLY?ProkaryoticmRNAIsolationKit。MICROB-Express?BacterialmRNAEnrichmentKit較早進(jìn)入市場(chǎng),目前使用非常廣泛,但是對(duì)于不同的環(huán)境樣品的富集效率差異較大(Stewartetal.,2010)。mRNA-ONLY?ProkaryoticmRNAIsolationKit的富集效果一般,相關(guān)研究報(bào)道很少。Ribo-Zero?rRNARemovalKit是由EpiCentre最新開發(fā)的,Giannoukos等(2012)評(píng)價(jià)了該試劑盒的rRNA去除效果,對(duì)于3種GC含量不同的純培養(yǎng)細(xì)菌的實(shí)驗(yàn)結(jié)果,rRNA含量均可降至1%以下。通過(guò)與其他試劑盒的比較,作者認(rèn)為Ribo-Zero?rRNARemovalKit效率最高。此外,該試劑盒對(duì)人糞便樣品來(lái)源的混合微生物中rRNA的去除效果也較好,rRNA也可降至5%以下,但對(duì)于其他類型的環(huán)境樣品,該試劑盒的處理效果還不清楚。最近,利用“not-so-random”六聚體引物在cDNA合成過(guò)程中選擇性富集mRNA的基本原理(Armouretal.,2009),NuGEN公司開發(fā)了一種Ovation?ProkaryoticRNA-SeqSystem試劑盒,該試劑盒可以單獨(dú)使用或者和已有的rRNA消減方法結(jié)合使用。另外,還有一種基于雙鏈特異性核酸酶(duplex-specificnuclease,DSN)的cDNA文庫(kù)標(biāo)準(zhǔn)化方法(Zhulidovetal.,2004),DSN在cDNA雙鏈變性和復(fù)性的過(guò)程中選擇性地降解數(shù)量較多的cDNA雙鏈,以此減少各種轉(zhuǎn)錄子的含量差異,有利于大量rRNA的去除和稀有轉(zhuǎn)錄子的檢測(cè)(Yietal.,2011)。但由于該方法會(huì)改變不同轉(zhuǎn)錄子的相對(duì)含量,因此不適合轉(zhuǎn)錄子的定量研究。除了以上提到的試劑盒方法,還有一些非試劑盒方法如切膠純化法(McGrathetal.,2008),通過(guò)將瓊脂糖電泳圖中rRNA之間的膠切下來(lái)回收達(dá)到去除rRNA富集mRNA的目的。但這種方法需要的RNA上樣量較大,而且無(wú)法回收和rRNA遷移率一樣的mRNA。另外,還可根據(jù)樣品的物種組成自行設(shè)計(jì)樣品特異性的反義rRNA探針用于消減rRNA(Stewartetal.,2010),但由于步驟繁瑣,尚未得到廣泛使用。3其他典型的測(cè)序平臺(tái)2005年以來(lái),陸續(xù)誕生了多種新一代高通量測(cè)序技術(shù)平臺(tái),如羅氏公司(Roche)的454高通量測(cè)序平臺(tái)、Illumina公司的Solexa平臺(tái)以及ABI公司的SOLiD平臺(tái)。由于這些平臺(tái)基于不同的測(cè)序原理,所以在平均讀長(zhǎng)、數(shù)據(jù)量、錯(cuò)誤類型、運(yùn)行時(shí)間以及測(cè)序費(fèi)用上均有一定差異,可根據(jù)自己的研究需要進(jìn)行選擇(Chu&Corey,2012)。關(guān)于這些平臺(tái)的測(cè)序原理及性能比較的文獻(xiàn)已有很多(Shendure&Ji,2008),因此本文僅對(duì)這些具有代表性的平臺(tái)作簡(jiǎn)要介紹。需要注意的是這些測(cè)序平臺(tái)的名稱在不同的文獻(xiàn)中可能有所不同,如有些文獻(xiàn)以其公司名指代,有些以具體的測(cè)序儀型號(hào)指代,還有的以其核心技術(shù)指代,如Riche454高通量測(cè)序平臺(tái)也稱焦磷酸測(cè)序(pyrosequencing)。3.1基于gsflx的新能源測(cè)序平臺(tái)2007年羅氏公司在454公司原有的GenomeSequencer20(GS20)測(cè)序儀的基礎(chǔ)上,推出第二代高通量測(cè)序儀GSFLX,系統(tǒng)性能有了顯著提高,這就是Riche454高通量測(cè)序平臺(tái),是第一個(gè)商業(yè)化的新一代測(cè)序平臺(tái)。其基礎(chǔ)是焦磷酸測(cè)序技術(shù)。與其他測(cè)序平臺(tái)相比,該技術(shù)平臺(tái)最顯著的優(yōu)勢(shì)是序列有效讀長(zhǎng)可達(dá)800bp,耗時(shí)較短,目前已發(fā)表的環(huán)境微生物轉(zhuǎn)錄組學(xué)相關(guān)研究文獻(xiàn)多數(shù)采用這種測(cè)序平臺(tái)。但缺點(diǎn)是測(cè)序通量較小、測(cè)序費(fèi)用相對(duì)較高、準(zhǔn)確率較低。3.2a測(cè)序平臺(tái)的核心技術(shù)Illumina公司的新一代測(cè)序儀GenomeAnalyzer(GA,通常稱為Solexa儀)最早由Solexa公司研發(fā),后來(lái)包括Solexa公司和Illumina公司在內(nèi)的4個(gè)公司合并后,研發(fā)了目前的Illumina/Solexa測(cè)序平臺(tái),其核心技術(shù)是“DNA簇”和“可逆性末端終結(jié)”(reversibleterminator)。該測(cè)序平臺(tái)具有多項(xiàng)優(yōu)越性能,如測(cè)序通量大、準(zhǔn)確率高、成本低、所需樣品量少,最近逐漸開始在環(huán)境微生物轉(zhuǎn)錄組學(xué)研究中應(yīng)用(Giannoukosetal.,2012;Xiongetal.,2012;Yu&Zhang,2012),具有很好的前景。其缺點(diǎn)是讀長(zhǎng)較短、運(yùn)行時(shí)間較長(zhǎng),但隨著技術(shù)的改進(jìn),這些不足正逐步得到改善。目前已有多種型號(hào)的測(cè)序儀可供選擇,如IlluminaHi-Seq和Mi-Seq高通量測(cè)序系統(tǒng)在序列讀長(zhǎng)方面都有一定的提高,分別達(dá)到了150×2bp和250×2bp。鑒于微生物基因的大小通常為400bp左右,因此250×2bp的測(cè)序讀長(zhǎng)可基本滿足序列分析的要求。3.3solid和其它高通量測(cè)序平臺(tái)SOLiD(supportedoligoligationdetetion)平臺(tái)是ABI公司自主研發(fā)的高通量測(cè)序平臺(tái),與454及Solexa平臺(tái)基于邊合成邊測(cè)序(sequencingbysynthesis,SBS)不同,SOLiD的測(cè)序原理為基于磁珠的大規(guī)模并行克隆連接DNA測(cè)序法,其優(yōu)勢(shì)是測(cè)序通量大、準(zhǔn)確率高、成本低,但同樣存在讀長(zhǎng)短、運(yùn)行時(shí)間長(zhǎng)的缺點(diǎn)。使用該平臺(tái)的研究較少(Liuetal.,2011)。4數(shù)據(jù)分析工具與形式序列數(shù)據(jù)的分析是環(huán)境微生物轉(zhuǎn)錄組學(xué)研究的重點(diǎn)和難點(diǎn)。轉(zhuǎn)錄組數(shù)據(jù)分析涉及到一系列的工具和資源,形式主要有數(shù)據(jù)庫(kù)、門戶網(wǎng)站、網(wǎng)絡(luò)服務(wù)及一些單機(jī)程序(Cardenas&Tiedje,2008)。主要的分析步驟及常用的方法如下。4.1測(cè)序的去除、自適應(yīng)調(diào)整RNA-Seq數(shù)據(jù)通常以FASTQ格式輸出和存儲(chǔ),這個(gè)格式包括每個(gè)讀段(reads)的ID號(hào)、序列和質(zhì)量分?jǐn)?shù)。在進(jìn)行正式的序列分析之前,一般需要對(duì)序列數(shù)據(jù)作一些預(yù)處理,如除掉一些短的、質(zhì)量差的和低復(fù)雜度的序列(low-complexityreads,序列一般為幾個(gè)堿基的簡(jiǎn)單重復(fù)),以及糾正一些測(cè)序錯(cuò)誤。每個(gè)被測(cè)的堿基都有一個(gè)質(zhì)量分?jǐn)?shù)(qualityscore),代表著測(cè)序的精確度,低的質(zhì)量分?jǐn)?shù)預(yù)示著可能的錯(cuò)誤。對(duì)于454和Illumina數(shù)據(jù)來(lái)說(shuō),目前已有相應(yīng)的算法來(lái)完成錯(cuò)誤的檢驗(yàn)、去除或更正(Rougemontetal.,2008;Quinceetal.,2009)。還有一些測(cè)序前人為加上的測(cè)序接頭、標(biāo)簽等也需要去除。另外,也可對(duì)序列的末端進(jìn)行修剪,因?yàn)槟┒说腻e(cuò)誤率通常較高(Balzeretal.,2010)。由于測(cè)序長(zhǎng)度通常局限在500bp以下,所以需要對(duì)這些讀段進(jìn)行組裝以獲得全長(zhǎng)的轉(zhuǎn)錄子序列。對(duì)于不同類型的數(shù)據(jù),有3種序列組裝策略可供選擇:有參考基因組的組裝(reference-based或abinitio裝配)策略、重頭組裝策略(denovostrategy)及上述兩種組裝策略的結(jié)合。每種組裝策略在原理、步驟、相應(yīng)的序列定位及組裝工具及使用優(yōu)缺點(diǎn)上都存在差異,關(guān)于這些組裝策略及相關(guān)軟件的詳細(xì)介紹可參考Martin和Wang(2011)。對(duì)于微生物組成復(fù)雜的環(huán)境樣品來(lái)說(shuō),通常情況下并沒(méi)有可供參考的基因組,所以一般選擇重頭組裝策略,組裝的效果主要受測(cè)序深度的影響。經(jīng)過(guò)序列組裝可以大大減少后續(xù)的比對(duì)工作量,初步組裝后獲得的較長(zhǎng)片段稱為Contig或序列重疊群,將已知的Contig用代表未知序列的N連接,可以進(jìn)一步組裝成更長(zhǎng)的片段,稱為Scaffold,再進(jìn)一步進(jìn)行補(bǔ)洞處理,可以得到含N量最少且兩端不能繼續(xù)延長(zhǎng)的片段,稱為Unigene。組裝后的序列即可進(jìn)行后續(xù)的序列比對(duì)及各種分析。4.2rrna序列的確定4.3基于序列的功能分析進(jìn)行mRNA分析的工具較多,目前環(huán)境轉(zhuǎn)錄組學(xué)研究中最常用到的工具有MG-RAST(MetaGenomeRapidAnnotationusingSubsystemsTechnology)(Meyeretal.,2008)和MEGAN。MG-RAST是一種在線宏基因組和宏轉(zhuǎn)錄組分析工具,MEGAN是單機(jī)版軟件,目前MEGAN4版本的功能已有較大拓展,可同時(shí)對(duì)多個(gè)樣品進(jìn)行基因功能比較分析,在環(huán)境轉(zhuǎn)錄組研究中應(yīng)用非常廣泛。掌握這兩種工具即可完成環(huán)境轉(zhuǎn)錄組學(xué)分析的大部分工作。常見(jiàn)的幾類mRNA分析有分類學(xué)分析(taxonomicanalysis)、基因功能分析(functionalanalysis)、KEGGpathway分析和不同樣品間的基因表達(dá)差異分析。分類學(xué)分析的目的是確定mRNA來(lái)源于哪些物種。用blast軟件中BLASTx程序?qū)⒊RNA后剩下的RNA序列翻譯為6種可能的氨基酸序列,與蛋白數(shù)據(jù)庫(kù)進(jìn)行比對(duì),常用的蛋白數(shù)據(jù)庫(kù)有NCBInr(noredundant)、COG(ClustersofOrthologousGenes)、UniProtKB/Swiss-Prot、PIR(TheProteinInformationResource)、KEGG(KyotoEncyclopediaofGenesandGenomes)等。Bitscores大于設(shè)定值(如30),則認(rèn)為該序列屬于putativemRNA轉(zhuǎn)錄子,結(jié)果輸出后用MEGAN等軟件進(jìn)行后續(xù)的分析。MEGAN軟件使用LCA(LeastCommonAncestor)算法,參照NCBI分類學(xué)方法將序列進(jìn)行分類,分類結(jié)果以樹狀圖的方式呈現(xiàn),樹的節(jié)點(diǎn)代表每個(gè)分類單元,匹配到該分類單元的序列數(shù)量也會(huì)標(biāo)注出來(lái),以方便比較這些分類單元在系統(tǒng)發(fā)育樹上的分布情況。分類結(jié)果由序列和分類單元間的匹配特異性程度決定:特異性程度越低,分類越偏向于分類樹的根部。功能分析指mRNA編碼基因的注釋(annotation)及其功能分類?;蜃⑨尩囊罁?jù)是序列之間的同源性,同源性高意味著功能上的高度相似性。通過(guò)BLASTx在各個(gè)蛋白數(shù)據(jù)庫(kù)中進(jìn)行搜索,查找序列相似性最高的蛋白,從而獲知該mRNA編碼基因的功能注釋信息?;虻淖⑨屖呛罄m(xù)基因功能分類的基礎(chǔ)。利用GO(GeneOntology)、COG(ClustersofOrthologousGroups)及SEED等數(shù)據(jù)庫(kù)可以將已進(jìn)行功能注釋的基因分到不同的基因家族中。GO是基因本體聯(lián)合會(huì)(GeneOnotologyConsortium)所建立的數(shù)據(jù)庫(kù),分為分子功能(MolecularFunction)、細(xì)胞成分(CellularComponent)和生物過(guò)程(BiologicalProcess)三大部分,是應(yīng)用最廣泛的一種基因功能分類體系(Ashburneretal.,2000)。使用Blast2GO軟件(Conesaetal.,2005)可對(duì)功能注釋后的基因進(jìn)行GO功能注釋,然后再用WEGO軟件(Yeetal.,2006)統(tǒng)計(jì)GO功能分類,即可得知某個(gè)樣品中全部轉(zhuǎn)錄子的基因功能分布情況。COG數(shù)據(jù)庫(kù)即直系同源序列聚類數(shù)據(jù)庫(kù),是根據(jù)系統(tǒng)進(jìn)化關(guān)系對(duì)細(xì)菌、藻類和真核生物的數(shù)十個(gè)完整基因組的編碼蛋白分類構(gòu)建而成,用于預(yù)測(cè)蛋白質(zhì)的功能。利用COG下的COGNITOR程序,可以把某個(gè)蛋白質(zhì)與所有COGs中的蛋白質(zhì)進(jìn)行比對(duì),并把它歸入適當(dāng)?shù)腃OG簇?;蚬δ芊诸愡€有一種重要的方法叫做SEEDsubsystem分類(Overbeeketal.,2005),通過(guò)MG-RAST可以對(duì)mRNA編碼基因進(jìn)行SEEDsubsystem分類,SEED數(shù)據(jù)庫(kù)將不同功能的基因劃分到不同的subsystem中。MG-RAST是以RAST服務(wù)器(Azizetal.,2008)為基礎(chǔ)的改進(jìn)版,通過(guò)一個(gè)免費(fèi)注冊(cè)的賬號(hào)就可以自動(dòng)進(jìn)行功能基因的系統(tǒng)發(fā)育及功能分析。其優(yōu)點(diǎn)是能夠快速注釋大量的短片段DNA序列。如果研究人員不想將自己未發(fā)表的數(shù)據(jù)上傳到網(wǎng)上進(jìn)行分析,還可下載單機(jī)版的MEGAN軟件。比較分析表明,在進(jìn)行SEEDsubsystem分類時(shí),對(duì)于同一樣品,MG-RAST和MEGAN匹配到各個(gè)subsystem的序列數(shù)量是非常相似的(Mitraetal.,2011)。KEGGpathway分析雖然本質(zhì)上也是一種基因功能分析,但是相對(duì)于上述的功能分類方法更加系統(tǒng)化。pathway指的就是基因所參與的各種生物學(xué)過(guò)程,KEGG據(jù)此定義了自己的直系同源群,稱為KEGGOrthology(KO),每個(gè)KO都有一個(gè)收錄號(hào),對(duì)應(yīng)一個(gè)特定的pathway。通過(guò)KEGG可查詢包括碳水化合物、各種氨基酸、核酸及其他多種有機(jī)物的生物降解的可能代謝途徑,對(duì)代謝過(guò)程中相關(guān)的酶也進(jìn)行了注釋,是一種生物代謝過(guò)程分析的強(qiáng)大工具。通過(guò)將待分析序列匹配到KO收錄號(hào)已知的參考序列,MG-RAST和MEGAN都可以完成未知樣品序列的KEGGpathway分析。但是在給出的pathway結(jié)果中,MG-RAST僅用一種顏色標(biāo)示出現(xiàn)在pathway中的酶,而MEGAN可以用不同的顏色梯度來(lái)表征這些酶的相對(duì)含量,這非常有助于對(duì)酶動(dòng)力學(xué)調(diào)控的理解(Mitraetal.,2011)。KEGGpathway分析有助于進(jìn)一步了解mRNA編碼的基因產(chǎn)物參與的代謝通路及其行使的生物學(xué)功能(Altermann&Klaenhammer,2005;Kanehisaetal.,2008)。在環(huán)境轉(zhuǎn)錄組學(xué)研究中常常需要比較不同環(huán)境條件下樣品中的基因表達(dá)差異,MG-RAST和MEGAN均可完成這類比較分析。此外,RPKM(readsperkilobasespermillionreads)指數(shù)(Mortazavietal.,2008)在評(píng)估基因的表達(dá)水平時(shí)使用非常廣泛,計(jì)算公式為RPKM=109×(C/NL)。其中C代表匹配到某個(gè)基因的序列數(shù),N代表匹配到所有基因的序列數(shù),L代表該基因的核酸序列長(zhǎng)度。RPKM方法消除了序列長(zhǎng)度及測(cè)序深度對(duì)基因表達(dá)量評(píng)估的可能影響,可直接用于比較不同樣品間的基因表達(dá)水平差異。已有公開發(fā)表的軟件用于計(jì)算RPKM值,如Cufflinks(Trapnelletal.,2010)和DEGseq(Wangetal.,2010)。4.4提交序列提交5環(huán)境中微生物轉(zhuǎn)移的應(yīng)用和前景5.1淡水生態(tài)環(huán)境基于RNA-Seq技術(shù)的環(huán)境微生物轉(zhuǎn)錄組學(xué)研究在近幾年發(fā)展非常迅速,目前已應(yīng)用于水體、土壤、淤泥、沉積物、動(dòng)物腸道等多種環(huán)境類型。水體的研究目前大多集中于海水樣品,以美國(guó)Georgia大學(xué)Moran教授課題組及美國(guó)麻省理工學(xué)院Parsons實(shí)驗(yàn)室的DeLong教授課題組為代表,近年來(lái)對(duì)多個(gè)地區(qū)海水微生物樣品開展了一系列的轉(zhuǎn)錄組學(xué)研究,研究區(qū)域覆蓋太平洋、大西洋等多個(gè)海區(qū),類型涉及到表層海水(Frias-Lopezetal.,2008;Hewsonetal.,2010)、河口(Hollibaughetal.,2011)、人工模擬海洋生態(tài)系統(tǒng)(Gilbertetal.,2008)、海洋生物(水華藻類、海綿等)的附生微生物(Hewsonetal.,2009;Radaxetal.,2012)、海洋不同水層等(Stewartetal.,2011b)。對(duì)于淡水生態(tài)環(huán)境及內(nèi)陸水體的研究目前還很少見(jiàn)(Liuetal.,2011)。關(guān)于土壤、淤泥及沉積物的研究也有一些,涉及到的樣品類型有農(nóng)業(yè)土壤(Leiningeretal.,2006)、貧瘠的沙質(zhì)草地(Urichetal.,2008)、溫帶森林表層土壤(Stewartetal.,2011a)、人工模擬土壤環(huán)境(deMenezesetal.,2012)、污水處理廠活性淤泥(Yu&Zhang,2012)、海底沉積物(Millsetal.,2012)等。此外,關(guān)于人和動(dòng)物的腸道(Poroykoetal.,2010;Turnbaughetal.,2010;Gosalbesetal.,2011;Xiongetal.,2012)以及排泄物(Booijinketal.,2010)的微生物轉(zhuǎn)錄組學(xué)研究也有不少。5.2其他控制變量的研究RNA-Seq技術(shù)最顯著的特點(diǎn)是高通量,借助該技術(shù),每個(gè)樣品可得到數(shù)十萬(wàn)甚至上百萬(wàn)條序列數(shù)據(jù),通過(guò)對(duì)這些海量數(shù)據(jù)的分析可以獲得傳統(tǒng)方法無(wú)法得到的信息。第一,高通量的數(shù)據(jù)促進(jìn)了大量的功能未知的新基因及小RNA的發(fā)現(xiàn)。例如,在對(duì)太平洋表層海水樣品進(jìn)行微生物轉(zhuǎn)錄組學(xué)分析后,發(fā)現(xiàn)高達(dá)50%的基因?yàn)樾禄?Frias-Lopezetal.,2008);Gilbert等(2008)在挪威海岸一個(gè)人工模擬海洋生態(tài)系統(tǒng)(mesocosm)中進(jìn)行的微生物轉(zhuǎn)錄組學(xué)分析顯示,RNA-Seq技術(shù)在環(huán)境微生物新基因的發(fā)現(xiàn)上具有強(qiáng)大的能力,在一些高度表達(dá)的大基因家族中,約91%的基因是新成員。另外,借助RNA-Seq技術(shù),Shi等(2009)發(fā)現(xiàn)在海水中存在獨(dú)特的微生物小RNA群,它們和已知的小RNA不同,位于基因組上的基因間隔區(qū),推測(cè)可能具有基因調(diào)節(jié)功能。第二,通過(guò)比較微生物在不同環(huán)境(自然環(huán)境或人工控制環(huán)境)條件下的高通量轉(zhuǎn)錄組數(shù)據(jù),結(jié)合宏基因組及定量PCR等其他研究手段,有助于發(fā)現(xiàn)環(huán)境條件對(duì)微生物代謝活性的影響以及微生物應(yīng)對(duì)環(huán)境變化而進(jìn)行的轉(zhuǎn)錄調(diào)控,了解微生物的轉(zhuǎn)錄活性對(duì)時(shí)空變化的響應(yīng)模式。這一類應(yīng)用是多方面的,研究對(duì)象可以是樣品中的整個(gè)微生物群落。如Poretsky等(2009)通過(guò)比較北太平洋副熱帶環(huán)流系的微生物轉(zhuǎn)錄組數(shù)據(jù),發(fā)現(xiàn)該區(qū)域的微生物在白天的代謝活動(dòng)主要集中在光合作用、氧化磷酸化及C1化合物的合成,到了夜間以細(xì)胞膜、氨基酸及維生素的合成代謝為主。Hewson等(2010)比較了全球開闊大洋中8個(gè)不同采樣點(diǎn)的微生物轉(zhuǎn)錄組數(shù)據(jù),發(fā)現(xiàn)不同位點(diǎn)的微生物基因表達(dá)差異主要集中在幾個(gè)關(guān)鍵的基因表達(dá)路徑上,包括光系統(tǒng)I、II和氨吸收,原因可能是海洋表層水中的優(yōu)勢(shì)微生物為光能自養(yǎng)的原綠球藻,不同采樣點(diǎn)微生物轉(zhuǎn)錄組的差異主要來(lái)源于這種藍(lán)細(xì)菌光營(yíng)養(yǎng)代謝的差異。通過(guò)控制實(shí)驗(yàn)或者與定量PCR等其他研究手段結(jié)合,也可以對(duì)某類功能菌群進(jìn)行有針對(duì)性的研究。例如,通過(guò)分析加入菲的土壤樣品中的微生物轉(zhuǎn)錄組數(shù)據(jù),發(fā)現(xiàn)涉及芳香族化合物代謝及脅迫應(yīng)答的轉(zhuǎn)錄子顯著增加,可以獲知多環(huán)芳烴(PAH)這類有毒污染物對(duì)土壤微生物活性的影響以及土壤微生物對(duì)PAH脅迫的應(yīng)答模式;另外還第一次發(fā)現(xiàn)了重金屬P型ATP酶和硫氧還蛋白與PAH脅迫相關(guān)聯(lián)(deMenezese

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論