高通量測(cè)序解析總結(jié)計(jì)劃_第1頁(yè)
高通量測(cè)序解析總結(jié)計(jì)劃_第2頁(yè)
高通量測(cè)序解析總結(jié)計(jì)劃_第3頁(yè)
高通量測(cè)序解析總結(jié)計(jì)劃_第4頁(yè)
高通量測(cè)序解析總結(jié)計(jì)劃_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

高通量測(cè)序及解析總結(jié)計(jì)劃高通量測(cè)序及解析總結(jié)計(jì)劃高通量測(cè)序及解析總結(jié)計(jì)劃高通量測(cè)序及解析高通量測(cè)序與功能解析微生物群落測(cè)序是指對(duì)微生物集體進(jìn)行高通量測(cè)序,經(jīng)過(guò)解析測(cè)序序列的構(gòu)成解析特定環(huán)境中微生物集體的構(gòu)成狀況或基因的構(gòu)成以及功能。借助不一樣樣樣環(huán)境下微生物群落的構(gòu)成差異解析我們能夠解析微生物與環(huán)境要素或宿主之間的關(guān)系,找尋標(biāo)記性菌群或特定功能的基因。對(duì)微生物群落進(jìn)行測(cè)序包含兩類(lèi),一類(lèi)是經(jīng)過(guò)16srDNA,18srDNA,ITS地區(qū)進(jìn)行擴(kuò)增測(cè)序解析微生物的集體構(gòu)成和多樣性;還有一類(lèi)是宏基因組測(cè)序,是不經(jīng)過(guò)分別培育微生物,而對(duì)所有微生物DNA進(jìn)行測(cè)序,進(jìn)而解析微生物群落構(gòu)成,基因構(gòu)成,發(fā)掘有應(yīng)用價(jià)值的基因資源。16srDNA擴(kuò)增進(jìn)行測(cè)序解析主要用于微生物群落多樣性和構(gòu)成的解析,當(dāng)前的生物信息學(xué)解析也能夠鑒于16srDNA的測(cè)序?qū)ξ⑸锶郝涞幕驑?gòu)成和代謝門(mén)路進(jìn)行展望解析,大大拓展了我們對(duì)于環(huán)境微生物的微生態(tài)認(rèn)知。當(dāng)前我們依據(jù)16s的測(cè)序數(shù)據(jù)能夠?qū)⑽⑸锶郝浞诸?lèi)到種(

species

)(一般只好對(duì)部分菌進(jìn)行種的判斷),甚至對(duì)亞種級(jí)別進(jìn)行解析,幾個(gè)見(jiàn)解:16SrDNA(或16SrRNA):16SrRNA基因是編碼原核生物核糖體小亞基的基因,長(zhǎng)度約為1542bp,其分子大小適中,突變率小,是細(xì)菌系統(tǒng)分類(lèi)學(xué)研究中最常用和最合用的標(biāo)記。16SrRNA基因序列包含9個(gè)可變區(qū)和10個(gè)守舊區(qū),守舊區(qū)序列反應(yīng)了物種間的親緣關(guān)系,而可變區(qū)序列則能表現(xiàn)物種間的差異。16SrRNA基因測(cè)序以細(xì)菌16SrRNA基因測(cè)序?yàn)橹?核心是研究樣品中的物種分類(lèi)、物種豐度以及系統(tǒng)進(jìn)化。OTU:operationaltaxonomicunits(OTUs)在微生物的免培育解析中常常用到,經(jīng)過(guò)提取樣品的總基因組DNA,利用16SrRNA或ITS的通用引物進(jìn)行PCR擴(kuò)增,經(jīng)過(guò)測(cè)序此后就能夠解析樣品中的微生物多樣性,那怎么區(qū)分這些不一樣樣樣的序列呢,這個(gè)時(shí)候就需要引入operationaltaxonomicunits,一般狀況下,假如序列之間,比方不一樣樣樣的16SrRNA序列的相像性高于97%就能夠把它定義為一個(gè)OTU,每個(gè)OTU對(duì)應(yīng)于一個(gè)不一樣樣樣的16SrRNA序列,也就是每個(gè)OTU對(duì)應(yīng)于一個(gè)不一樣樣樣的細(xì)菌(微生物)種。經(jīng)過(guò)OTU解析,就能夠知道樣品中的微生物多樣性和不一樣樣樣微生物的豐度。測(cè)序區(qū)段:因?yàn)?6srDNA較長(zhǎng)(1.5kb),我們只好對(duì)此中常常變化的地區(qū)也就是可變區(qū)進(jìn)行測(cè)序。16srDNA包含有9個(gè)可變區(qū),分別是v1-v9。一般我們對(duì)v3-v4雙可變地區(qū)進(jìn)行擴(kuò)增和測(cè)序,也有對(duì)v1-v3區(qū)進(jìn)行擴(kuò)增測(cè)序。工具/原料?16srDNA測(cè)序第一需要提取環(huán)境樣品的DNA,這些DNA能夠來(lái)自土壤、糞便、空氣或水體等任何根源。提取DNA后需要經(jīng)過(guò)質(zhì)檢和純化,一般16srDNA測(cè)序擴(kuò)增對(duì)DNA的總量要求其實(shí)不高,總量大于100ng,濃度大于10ng/ul一般都能夠知足要求。假如是來(lái)自和寄主共生的環(huán)境如昆蟲(chóng)的腸道微生物,提取時(shí)可能包含了寄主自己的大批DNA,對(duì)DNA的總量要求會(huì)提升。微生物菌群多樣性測(cè)序受DNA提取和擴(kuò)增影響很大,不一樣樣樣的擴(kuò)增區(qū)段和擴(kuò)增引物甚至PCR循環(huán)數(shù)的差異都會(huì)對(duì)結(jié)果有所影響。因此建議同一項(xiàng)目不一樣樣樣樣品的都采用相同的條件和測(cè)序方法,這樣互相之間才存在可比性。達(dá)成PCR此后的產(chǎn)物一般能夠直接上測(cè)序儀測(cè)序,在上機(jī)測(cè)序前我們需要對(duì)所有樣本進(jìn)行定量和均一化,平常要進(jìn)行熒光定量PCR。達(dá)成定量的樣品混淆后就能夠上機(jī)測(cè)序。16srDNA測(cè)序當(dāng)前能夠采納多種不一樣樣樣的測(cè)序儀進(jìn)行測(cè)序,包含羅氏的454,Illumina的MiSeq,Life的PGM或Pacbio的RSII三代測(cè)序儀。不一樣樣樣的儀器各有優(yōu)弊端,當(dāng)前最主流的是Illumina企業(yè)的MiSeq,因?yàn)槠湓谕?、長(zhǎng)度和價(jià)錢(qián)三者之間最為均衡。MiSeq測(cè)序儀能夠產(chǎn)生2x300bp的測(cè)序讀長(zhǎng),一次能夠產(chǎn)生15Gb的測(cè)序數(shù)據(jù)遠(yuǎn)遠(yuǎn)大于其余測(cè)序儀的測(cè)序通量。方法/步驟116srDNA解析基本流程:2原始數(shù)據(jù)辦理:原始測(cè)序數(shù)據(jù)需要去除接頭序列,并將雙端測(cè)序序列進(jìn)行拼接成單條序列。依據(jù)測(cè)序barcode序列區(qū)分不一樣樣樣的樣本序列。過(guò)濾低質(zhì)量序列和沒(méi)法比對(duì)到16srDNA數(shù)據(jù)庫(kù)的序列。3OTU分類(lèi)和統(tǒng)計(jì):OTU(operationaltaxonomicunits)是在系統(tǒng)發(fā)生學(xué)研究或集體遺傳學(xué)研究中,為了便于進(jìn)行解析,人為給某一個(gè)分類(lèi)單元(品系,種,屬,分組等)設(shè)置的同一標(biāo)記。平常依據(jù)97%的相像性閾值將序列區(qū)分為不一樣樣樣的OTU,每一個(gè)OTU平常被視為一個(gè)微生物物種。相像性小于97%就能夠以為屬于不同的種,相像性小于93%-95%,能夠以為屬于不一樣樣樣的屬。樣品中的微生物多樣性和不一樣樣樣微生物的豐度都是鑒于對(duì)OTU的解析。使用QIIME()工具包進(jìn)行統(tǒng)計(jì)說(shuō)明。使用QIIME()的ucluster方法依據(jù)97%的序列相像度將所有序列進(jìn)行同源比對(duì)并聚類(lèi)成operational

taxonomicunits

(OTUs)。此后與數(shù)據(jù)庫(kù)

GreenGenes(version

)進(jìn)行比對(duì),比對(duì)方法

uclust

,

。此后對(duì)每個(gè)

OTUs進(jìn)行

reads

數(shù)目統(tǒng)計(jì)。下邊的

2個(gè)表,此中一個(gè)表是對(duì)每個(gè)樣本的測(cè)序數(shù)目和

OTU數(shù)目進(jìn)行統(tǒng)計(jì),并且在表栺中列出了測(cè)序覆蓋的圓滿(mǎn)度(顯示前

10個(gè)樣本)。另一個(gè)表是對(duì)每個(gè)樣本在分類(lèi)字水平上的數(shù)目進(jìn)行統(tǒng)計(jì),并且在表栺中列出了在每個(gè)分類(lèi)字水平上的物種數(shù)目(顯示前10個(gè)樣本)。能夠看到絕大部分的OTU都分類(lèi)到了屬(Genus),也有好多分類(lèi)到了種Species)。但是仍舊有好多沒(méi)法圓滿(mǎn)分類(lèi)到種一級(jí),這是因?yàn)榄h(huán)境微生物自己存在特別豐富的多樣性,還有大批的菌仍舊沒(méi)有被測(cè)序和發(fā)現(xiàn)。測(cè)序數(shù)目統(tǒng)計(jì)表主假如對(duì)每個(gè)樣本的測(cè)序數(shù)目和OTU數(shù)目進(jìn)行統(tǒng)計(jì),并且在表格中列出了測(cè)序覆蓋的圓滿(mǎn)度(顯示前10個(gè)樣本,假如樣本超出10個(gè),請(qǐng)查察結(jié)果中文件)此中SampleName表示樣本名稱(chēng);SampleSize表示樣本序列總數(shù);OTUsNumber表示說(shuō)明上的OTU數(shù)目;OTUsSeq表示說(shuō)明上OTU的樣本序列總數(shù)。Coverage是指各種品文庫(kù)的覆蓋率,其數(shù)值越高,則樣本中序列沒(méi)有被測(cè)出的概率越低。該指數(shù)實(shí)質(zhì)反應(yīng)了本次測(cè)序結(jié)果能否代表樣本的真切狀況。計(jì)算公式為:C=1-n1/N此中n1=只含有一條序列的OTU的數(shù)目;N=抽樣中出現(xiàn)的總的序列數(shù)目。分類(lèi)水平統(tǒng)計(jì)表主假如對(duì)每個(gè)樣本在分類(lèi)學(xué)水平上的數(shù)目進(jìn)行統(tǒng)計(jì),并且在表格中列出了在每個(gè)分類(lèi)學(xué)水平上的物種數(shù)目(只顯示前

10個(gè)樣本,如果樣本超出

10個(gè),請(qǐng)查察結(jié)果中

文件)此中SampleName表示樣本名稱(chēng);Phylum表示分類(lèi)到門(mén)的OTU數(shù)目;Class表示分類(lèi)到綱的OTU數(shù)目;Order表示分類(lèi)到目的OTU數(shù)目;Family表示分類(lèi)到科的OTU數(shù)目;Genus表示分類(lèi)到屬的OTU數(shù)目;Species表示分類(lèi)到種OTU數(shù)目。4.4我們還可以夠夠夠?qū)@些種屬的構(gòu)成進(jìn)行柱狀圖顯示:橫坐標(biāo)中每一個(gè)條形圖代表一個(gè)樣本,縱坐標(biāo)代表該分類(lèi)層級(jí)的序列數(shù)目或比率。同一種顏色代表相同的分類(lèi)級(jí)別。圖中的每根柱子中的顏色表示該樣本在不一樣樣樣級(jí)別(門(mén)、綱、目等)的序列數(shù)目,序列數(shù)目只計(jì)算級(jí)別最低的分類(lèi),比方在屬被騙算過(guò)了,則在科中則不重復(fù)計(jì)算。Q:為何要選擇V3-V4區(qū)的測(cè)序長(zhǎng)度?為何有些文件是V6區(qū),有什么差異?16SrRNA總長(zhǎng)約1540bp,包含9個(gè)可變區(qū)。因?yàn)楦咄繙y(cè)序的測(cè)序長(zhǎng)度的限制,不可以夠能將16SrRNA的9個(gè)可變區(qū)所有測(cè)序,因此在PCR擴(kuò)增時(shí)常常只好選擇1-3個(gè)可變區(qū)作為擴(kuò)增片段。Kozich等評(píng)估了Miseq測(cè)序儀解析的不一樣樣樣16SrRNA可變區(qū)的正確性發(fā)現(xiàn),測(cè)定V4區(qū)見(jiàn)效最正確。依據(jù)我們的測(cè)序長(zhǎng)度,v3-v4區(qū)是最正確選擇。5.5我們還需要對(duì)樣本之間或分組之間的OTU進(jìn)行比較獲取韋恩圖:注意,韋恩圖當(dāng)前一般最多只好顯示5個(gè)樣本或分組,過(guò)多的樣本沒(méi)法沒(méi)法進(jìn)行韋恩圖繪制6樣品構(gòu)成豐度:稀釋曲線(xiàn)微生物多樣性解析中需要考證測(cè)序數(shù)據(jù)量能否足以反應(yīng)樣品中的物種多樣性,稀釋曲線(xiàn)(豐富度曲線(xiàn))能夠用來(lái)查驗(yàn)這一指標(biāo)。稀釋曲線(xiàn)是用來(lái)議論測(cè)序量能否足以覆蓋所有類(lèi)群,并間接反應(yīng)樣品中物種的豐富程度。稀釋曲線(xiàn)是利用已測(cè)得16SrDNA序列中已知的各種OTU的比較較例,來(lái)計(jì)算抽取n個(gè)(n小于測(cè)得reads序列總數(shù))reads時(shí)出現(xiàn)OTU數(shù)目的希望值,此后依據(jù)一組n值(一般為一組小于總序列數(shù)的等差數(shù)列)與其相對(duì)應(yīng)的OTU數(shù)目的希望值做出曲線(xiàn)來(lái)。當(dāng)曲線(xiàn)趨于緩和或許達(dá)到平臺(tái)期時(shí)也就能夠以為測(cè)序深度已經(jīng)基本覆蓋到樣品中所有的物種;反之,則表示樣品中物種多樣性較高,還存在好多未被測(cè)序檢測(cè)到的物種。以以下列圖中的稀釋曲線(xiàn)橫坐標(biāo)代表隨機(jī)抽取的序列數(shù)目;縱坐標(biāo)代表察看到的OTU數(shù)目。樣本曲線(xiàn)的延長(zhǎng)終點(diǎn)的橫坐標(biāo)地點(diǎn)為該樣本的測(cè)序數(shù)目,假如曲線(xiàn)趨于平展表示測(cè)序已趨于飽和,增添測(cè)序數(shù)據(jù)沒(méi)法再找到更多的OTU;反之表示不飽和,增添數(shù)據(jù)量能夠發(fā)現(xiàn)更多OTU。7.7Shannon-Winner曲線(xiàn)Shannon-Wiener曲線(xiàn),是利用shannon指數(shù)來(lái)進(jìn)行繪制的,反應(yīng)樣品中微生物多樣性的指數(shù),利用各種品的測(cè)序量在不一樣樣樣測(cè)序深度時(shí)的微生物多樣性指數(shù)建立曲線(xiàn),以此反應(yīng)各種本在不一樣樣樣測(cè)序數(shù)目時(shí)的微生物多樣性。當(dāng)曲線(xiàn)趨勢(shì)平展時(shí),說(shuō)明測(cè)序數(shù)據(jù)量足夠大,能夠反應(yīng)樣品中絕大部分的微生物物種信息。與上圖相同,橫坐標(biāo)代表隨機(jī)抽取的序列數(shù)目;縱坐標(biāo)代表的是反應(yīng)物種多樣性的Shannon指數(shù)。樣本曲線(xiàn)的延長(zhǎng)終點(diǎn)的橫坐標(biāo)地點(diǎn)為該樣本的測(cè)序數(shù)目,假如曲線(xiàn)趨于平展表示測(cè)序已趨于飽和,增添測(cè)序數(shù)據(jù)沒(méi)法再找到更多的OTU;反之表示不飽和,增添數(shù)據(jù)量能夠發(fā)現(xiàn)更多OTU。此中曲線(xiàn)的最高點(diǎn)也就是該樣本的物種多樣性越高。Q:Shannon指數(shù)怎么算的?

Shannon指數(shù),指數(shù)越高表示樣品的A:Shannon指數(shù)公式:此中,Sobs=實(shí)質(zhì)丈量出的OTU數(shù)目;ni=含有i條序列的OTU數(shù)目;N=所有的序列數(shù)。8Rank-Abundance曲線(xiàn)用于同時(shí)解說(shuō)樣品多樣性的兩個(gè)方面,即樣品所含物種的豐富程度和均勻程度。物種的豐富程度由曲線(xiàn)在橫軸上的長(zhǎng)度來(lái)反應(yīng),曲線(xiàn)越寬,表示物種的構(gòu)成越豐富;物種構(gòu)成的平均程度由曲線(xiàn)的形狀來(lái)反應(yīng),曲線(xiàn)越平展,表示物種構(gòu)成的平均程度越高。一般超出20個(gè)樣本圖就會(huì)變得特別復(fù)雜并且不雅觀(guān),因此一般20個(gè)樣本以下會(huì)做該圖,圖片保存為結(jié)果目錄中rank.pdf。橫坐標(biāo)代表物種排序的數(shù)目;縱坐標(biāo)代表察看到的相對(duì)豐度。樣本曲線(xiàn)的延長(zhǎng)終點(diǎn)的橫坐標(biāo)地點(diǎn)為該樣本的物種數(shù)目,假如曲線(xiàn)越圓滑降落表示樣本的物種多樣性越高,而曲線(xiàn)迅速突然降落表示樣本中的優(yōu)勢(shì)菌群所占比率很高,多樣性較低。9Alpha多樣性(樣本內(nèi)多樣性)Alpha多樣性是指一個(gè)特定地區(qū)或許生態(tài)系統(tǒng)內(nèi)的多樣性,常用的胸懷指標(biāo)有

Chao1

豐富度預(yù)計(jì)量(Chao1richnessestimator)、香農(nóng)-威納多樣性指數(shù)(Shannon-wienerdiversity

index)、辛普森多樣性指數(shù)(Simpsondiversityindex

)等。計(jì)算菌群豐度:Chao、ace;計(jì)算菌群多樣性:Shannon、Simpson。Simpson指數(shù)值越大,說(shuō)明群落多樣性越高;Shannon指數(shù)越大,說(shuō)明群落多樣性越高。表中顯示前10個(gè)樣本,假如樣本大于10個(gè),詳見(jiàn)結(jié)果目錄中的alpha_div.txt。Q:能不可以夠夠解說(shuō)下每個(gè)指數(shù)(如chao1、shannon)?Chao1:是用chao1算法預(yù)計(jì)群落中含OTU數(shù)目的指數(shù),chao1在生態(tài)學(xué)中常用來(lái)預(yù)計(jì)物種總數(shù),由Chao(1984)最早提出。Chao1值越大代表物種總數(shù)越多。Schao1=Sobs+n1(n1-1)/2(n2+1)此中Schao1為預(yù)計(jì)的OTU數(shù),Sobs為察看到的OTU數(shù),n1為只有一條序列的OTU數(shù)目,n2為只有兩條序列的OTU數(shù)目。Shannon:用來(lái)預(yù)計(jì)樣品中微生物的多樣性指數(shù)之一。它與Simpson多樣性指數(shù)均為常用的反應(yīng)alpha多樣性的指數(shù)。Shannon值越大,說(shuō)明群落多樣性越高。Ace:用來(lái)預(yù)計(jì)群落中含有OTU數(shù)目的指數(shù),由Chao提出,是生態(tài)學(xué)中預(yù)計(jì)物種總數(shù)的常用指數(shù)之一,與Chao1的算法不一樣樣樣。Simpson:用來(lái)預(yù)計(jì)樣品中微生物的多樣性指數(shù)之一,由EdwardHughSimpson(1949)提出,在生態(tài)學(xué)中常用來(lái)定量的描繪一個(gè)地區(qū)的生物多樣性。Simpson指數(shù)值越大,說(shuō)明群落多樣性越高。辛普森多樣性指數(shù)=隨機(jī)取樣的兩個(gè)個(gè)體屬于不一樣樣樣種的概率=1-隨機(jī)取樣的兩個(gè)個(gè)體屬于同種的概率10.10Beta多樣性解析(樣品間差異解析)Beta多樣性胸懷時(shí)空尺度上物種構(gòu)成的變化,是生物多樣性的重要構(gòu)成部分,與好多生態(tài)學(xué)和進(jìn)化生物學(xué)識(shí)題親密有關(guān),因此在近來(lái)10年間成為生物多樣性研究的熱門(mén)問(wèn)題之一。PCoA解析PCoA(principalco-ordinatesanalysis)是一種研究數(shù)據(jù)相像性或差異性的可視化方法,經(jīng)過(guò)一系列的特點(diǎn)值和特點(diǎn)向量進(jìn)行排序后,選擇主要排在前幾位的特點(diǎn)值,PCoA能夠找到距離矩陣中最主要的坐標(biāo),結(jié)果是數(shù)據(jù)矩陣的一個(gè)旋轉(zhuǎn),它沒(méi)有改變樣品點(diǎn)之間的互相地點(diǎn)關(guān)系,但是改變了坐標(biāo)系統(tǒng)。經(jīng)過(guò)PCoA能夠察看個(gè)體或集體間的差異。每一個(gè)點(diǎn)代表一個(gè)樣本,相同顏色的點(diǎn)來(lái)自同一個(gè)分組,兩點(diǎn)之間距離越近表示二者的群落構(gòu)成差異越小。PCoA有多張圖,分別代表的PCoA1-2,2-3,3-1。11.11NMDS解析(非胸懷多維尺度解析)NMDS(NonmetricMultidimensionalScaling)常用于比對(duì)樣本組之間的差異,能夠鑒于進(jìn)化關(guān)系或數(shù)目距離矩陣。橫軸和縱軸:表示鑒于進(jìn)化或許數(shù)目距離矩陣的數(shù)值在二維表中成圖。PCA解析的主要差異在于考量了進(jìn)化上的信息。每一個(gè)點(diǎn)代表一個(gè)樣本,相同顏色的點(diǎn)來(lái)自同一個(gè)分組,兩點(diǎn)之間距離越近表示二者的群落構(gòu)成差異越小。12.12PCA解析主成分解析PCA(Principalcomponentanalysis)是一種研究數(shù)據(jù)相像性或差異性的可視化方法,經(jīng)過(guò)一系列的特點(diǎn)值和特點(diǎn)向量進(jìn)行排序后,選擇主要的前幾位特點(diǎn)值,采納降維的思想,PCA能夠找到距離矩陣中最主要的坐標(biāo),結(jié)果是數(shù)據(jù)矩陣的一個(gè)旋轉(zhuǎn),它沒(méi)有改變樣品點(diǎn)之間的互相地點(diǎn)關(guān)系,但是改變了坐標(biāo)系統(tǒng)。詳盡對(duì)于主成分解析的解說(shuō)介紹大家看一篇文章,。經(jīng)過(guò)PCA能夠察看個(gè)體或集體間的差異。每一個(gè)點(diǎn)代表一個(gè)樣本,相同顏色的點(diǎn)來(lái)自同一個(gè)分組,兩點(diǎn)之間距離越近表示二者的群落構(gòu)成差異越小。以上三個(gè)圖可能碰到的問(wèn)題:1:PCA,PcoA,NMDS解析分別是鑒于什么數(shù)據(jù)畫(huà)的?回答:PCA,PcoA,NMDS解析均是鑒于OTU分類(lèi)taxon數(shù)據(jù)所畫(huà),用的是R語(yǔ)言Vegan包中的有關(guān)函數(shù)畫(huà)成,此中PcoA與NMDS還要鑒于樣本之間的距離矩陣才能畫(huà)成。2:PCA解析假如圖中大部分點(diǎn)集中在一同,少量點(diǎn)在很遠(yuǎn)的外面,是什么原由造成的?回答:是因?yàn)闃颖綩TU分類(lèi)時(shí)候,少量樣本某些菌含量特別高所造成,致使這些樣本偏離正常范圍,建議獨(dú)自取出這些樣本察看,看是不是實(shí)驗(yàn)錯(cuò)誤。3:PCA解析時(shí),不是有PC1,PC2,PC3三個(gè)坐標(biāo)嗎?是給出三張圖嗎?仍是三維立體圖?回答:PCA作圖時(shí),會(huì)得出PC1,PC2,PC3三個(gè)坐標(biāo),能夠依據(jù)PC12,PC13,PC23分別作圖,一般給出的是PC12的圖,當(dāng)PC12圖質(zhì)量不好,看不出顯然的樣安分類(lèi)見(jiàn)效時(shí),能夠看PC13或PC23的圖分類(lèi)能否清楚,也能夠用R語(yǔ)言rgl包做出PC123三維圖。QIIME自己結(jié)果中有供給PCA的三維圖結(jié)果,能夠經(jīng)過(guò)網(wǎng)頁(yè)翻開(kāi)。13.13LDA差異貢獻(xiàn)解析PCA和LDA的差異在于,PCA,它所作的但是將整組數(shù)據(jù)整體照耀到最方便表示這組數(shù)據(jù)的坐標(biāo)軸上,照耀時(shí)沒(méi)有益用任何數(shù)據(jù)內(nèi)部的分類(lèi)信息,是無(wú)監(jiān)察的,而LDA是由監(jiān)察的,增添了種屬之間的信息關(guān)系后,聯(lián)合顯然性差異標(biāo)準(zhǔn)測(cè)試(克魯斯卡爾-沃利斯查驗(yàn)和兩兩Wilcoxon測(cè)試)和線(xiàn)性鑒別分析的方法進(jìn)行特點(diǎn)選擇。除了能夠檢測(cè)重要特點(diǎn),他還可以夠夠夠依據(jù)效應(yīng)值進(jìn)行功能特點(diǎn)排序,這些功能特點(diǎn)能夠解說(shuō)頂部的大部分生物學(xué)差異。詳盡說(shuō)明能夠參照這篇文章

。不一樣樣樣顏色代表不一樣樣樣樣本或組之間的顯然差異物種。使用

LefSe

軟件解析獲取,此中顯然差其余

logarithmicLDAscore

設(shè)為

2。問(wèn)題:LDA解析有什么用?回答:組間差異顯然物種又能夠稱(chēng)作生物標(biāo)記物(biomarkers),該分析主假如想找到組間在豐度上有顯然差其余物種。物種進(jìn)化樹(shù)的樣本群落散布圖是將不一樣樣樣樣本的群落構(gòu)成及散布以物種分類(lèi)樹(shù)的形式在一個(gè)環(huán)圖中展。數(shù)據(jù)經(jīng)過(guò)解析后,將物種分類(lèi)樹(shù)和分類(lèi)豐度信息經(jīng)過(guò)軟件GraPhlAn(/GraPhlAn)進(jìn)行繪制。其目的是將物種之間的進(jìn)化關(guān)系以及不一樣樣樣樣本的物種散布豐度和最高散布樣本的信息在一個(gè)視覺(jué)集中的環(huán)圖中一次展現(xiàn),其供給的信息量較其余圖最為豐富。中間為物種進(jìn)化分類(lèi)樹(shù),不一樣樣樣顏色的分支代表不一樣樣樣的綱(詳盡的代表顏色見(jiàn)右上角的圖例),此后外圈的灰色標(biāo)示字母的環(huán)表示的是本次研究中比例最高的15個(gè)科(字母代表的科拜見(jiàn)左上角的圖例)。此后的外圈供給的是熱力爭(zhēng),假如樣本數(shù)<=10個(gè)則繪制樣本,假如樣本數(shù)超出10個(gè)則依據(jù)分組繪制,每一環(huán)為一個(gè)樣本,依據(jù)其豐度繪制的熱力爭(zhēng)。最外圈為柱狀圖,繪制的是該屬所占比率最高的樣本的豐度和樣本顏色(樣本顏色見(jiàn)環(huán)最下方的樣本名字的顏色)。此中熱力爭(zhēng)和柱狀圖取值均為原比率值x10000后進(jìn)行l(wèi)og2變換后的值參照文件:1.Vazquez-BaezaY,PirrungM,GonzalezA,KnightR.2013.Emperor:Atoolforvisualizinghigh-throughputmicrobialcommunitydata.Gigascience2(1):16.Legendre,P.andLegendre,L.1998.NumericalEcology.SecondEnglishEdition.DevelopmentsinEnvironmentalModelling20.Elsevier,Amsterdam.SegataN,IzardJ,WaldronL,etal.Metagenomicbiomarkerdiscoveryandexplanation[J].GenomeBiol,2011,12(6):R60.LangilleMGI,ZaneveldJ,CaporasoJG,McDonaldD,KnightsD,ReyesJAetal.(2013).Predictivefunctionalprofilingofmicrobialcommunitiesusing16SrRNAmarkergenesequences.NatBiotechnol31:814–821.物種有關(guān)性解析依據(jù)各個(gè)物種在各個(gè)樣品中的豐度以及變化狀況,計(jì)算物種之間的有關(guān)性,包含正有關(guān)和負(fù)有關(guān)。有關(guān)性解析使用CCREPE算法,第一對(duì)原始16s測(cè)序數(shù)據(jù)的種屬數(shù)目進(jìn)行標(biāo)準(zhǔn)化,此后進(jìn)行Spearman和Pearson秩有關(guān)解析并進(jìn)行統(tǒng)計(jì)查驗(yàn),計(jì)算出各個(gè)物種之間的有關(guān)性,此后在所有物種中依據(jù)simscore絕對(duì)值的大小,挑選出有關(guān)性最高的前100組數(shù)據(jù),鑒于Cytoscap繪制共表達(dá)解析網(wǎng)絡(luò)圖,網(wǎng)絡(luò)圖采納兩種不一樣樣樣的形式表現(xiàn)出來(lái)。物種有關(guān)性網(wǎng)絡(luò)圖A:圖中每一個(gè)點(diǎn)代表一個(gè)物種,存在有關(guān)性的物種用連線(xiàn)連結(jié),此中,紅色的連線(xiàn)代表負(fù)有關(guān),綠色的先代表正有關(guān),連線(xiàn)顏色的深淺代表有關(guān)性的高低。物種有關(guān)性網(wǎng)絡(luò)圖B:圖中每一個(gè)點(diǎn)代表一個(gè)物種,點(diǎn)的大小表示與其他物種的關(guān)系關(guān)系的多少,此中與之有有關(guān)性的物種數(shù)越多,點(diǎn)的半徑和字體越大,連線(xiàn)的粗細(xì)代表兩物種之間有關(guān)性的大小,連線(xiàn)越粗,有關(guān)性越高。參照文件:SchwagerE,WeingartG,BielskiC,etal.CCREPE:CompositionalityCorrectedbyPermutationandRenormalization[J].2014.聚類(lèi)解析依據(jù)OUT數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化辦理(1wlog10)此后,采納數(shù)目最多的前60個(gè)物種,鑒于Rheatmap進(jìn)行作圖,熱圖中的每一個(gè)色塊代表一個(gè)樣品的一個(gè)屬的豐度,樣品橫向擺列,屬縱向擺列,兩個(gè)熱圖,差異是能否對(duì)樣品進(jìn)行聚類(lèi),從聚類(lèi)中能夠認(rèn)識(shí)樣品之間的相像性以及屬水平上的群落構(gòu)成相像性。假如聚類(lèi)結(jié)果中出現(xiàn)大面積的白或黑是因?yàn)榇笈木刻貏e低,致使都沒(méi)有數(shù)值,能夠在繪制以行進(jìn)行標(biāo)準(zhǔn)化操作,對(duì)每一類(lèi)菌單獨(dú)自身進(jìn)行Z標(biāo)準(zhǔn)化。群落功能差異解析經(jīng)過(guò)對(duì)已有測(cè)序微生物基因組的基因功能的構(gòu)成進(jìn)行解析后,我們能夠經(jīng)過(guò)16s測(cè)序獲取的物種構(gòu)成推斷樣本中的功能基因的構(gòu)成,進(jìn)而解析不一樣樣樣樣本和分組之間在功能上的差異(PICRUStNatureBiotechnology,1-10.82013)。經(jīng)過(guò)對(duì)宏基因組測(cè)序數(shù)據(jù)功能解析和對(duì)應(yīng)16s展望功能解析結(jié)果的比較發(fā)現(xiàn),此方法的正確性在84%-95%,對(duì)腸道微生物菌群和土壤菌群的功能解析湊近95%,能特別好的反應(yīng)樣品中的功能基因構(gòu)成。為了能夠經(jīng)過(guò)16s測(cè)序數(shù)據(jù)來(lái)正確的展望出功能構(gòu)成,第一需要對(duì)原始16s測(cè)序數(shù)據(jù)的種屬數(shù)目進(jìn)行標(biāo)準(zhǔn)化,因?yàn)椴灰粯訕訕拥姆N屬菌包含的16s拷貝數(shù)不相同。此后將16s的種屬構(gòu)成信息經(jīng)過(guò)建立好的已測(cè)序基因組的種屬功能基因構(gòu)成表照耀獲取展望的功能結(jié)果。(依據(jù)屬這個(gè)水平,對(duì)不一樣樣樣樣本間的物種豐度進(jìn)行顯然性差異兩兩查驗(yàn),我們這里的查驗(yàn)方法使用STAMP中的two-sample中T-TEST方法,Pvalue值過(guò)濾為0.05,作Extenterrorbar圖。)此處供給COG,KO基因展望以及KEGG代謝門(mén)路展望。用戶(hù)也可自履行用我們供給的文件和軟件(STAMP)對(duì)不一樣樣樣層級(jí)以及不一樣樣樣分組之間進(jìn)行統(tǒng)計(jì)解析和制圖,以及選擇不一樣樣樣的統(tǒng)計(jì)方法和顯然性水平。參照文件:DonovanH.Parks1,GeneW.Tyson,STAMP:statisticalanalysisoftaxonomicandfunctionalprofiles,COG構(gòu)成差異解析圖圖中不一樣樣樣顏色代表不一樣樣樣的分組,列出了COG構(gòu)成在組間存在顯然差其余功能分類(lèi)以及在各組的比率,其余右邊還給出了差其余比率和置信區(qū)間以及P-value。KEGG代謝門(mén)路差異解析圖經(jīng)過(guò)KEGG代謝門(mén)路的展望差異解析,我們能夠認(rèn)識(shí)到不一樣樣樣分組的樣品之間在微生物群落的功能基因在代謝門(mén)路上的差異,以及變化的高低。為我們認(rèn)識(shí)群落樣本的環(huán)境適應(yīng)變化的代謝過(guò)程供給一種簡(jiǎn)單快捷的方法。圖解讀:圖中不一樣樣樣顏色代表不一樣樣樣的分組,列出了在第三層級(jí)的構(gòu)成在組間存在顯然差其余KEGG代謝門(mén)路第三層分類(lèi)以及在各組的比率,其余右邊還給出了差其余比率和置信區(qū)間以及P-value。本例圖所顯示的是第三層級(jí)的KEGG代謝門(mén)路的差異解析,也能夠針對(duì)第二或第一層的分級(jí)進(jìn)行解析?;虻牟町惤馕鰣D除了能對(duì)大的基因功能分類(lèi)和代謝門(mén)路進(jìn)行展望外,我們還可以夠夠供給優(yōu)秀的功能基因的數(shù)目和構(gòu)成的展望,以及進(jìn)行樣本間以及組間的差異解析,并給出擁有統(tǒng)計(jì)意義和置信區(qū)間的解析結(jié)果。這一解析將我們對(duì)于樣本群落的差異進(jìn)一步深入到了每一類(lèi)基因的層面。圖解讀:圖中不一樣樣樣顏色代表不一樣樣樣的分組,列出了在組間/樣本間存在顯然差其余每一個(gè)功能基因(酶)以及在各組的比率,其余右邊還給出了差其余比率和置信區(qū)間以及P-value。在獲取標(biāo)準(zhǔn)報(bào)告后假如希望獨(dú)自改正分組或?qū)δ承┙M之間進(jìn)行顯然性差異解析,能夠使用STAMP軟件在自己的電腦進(jìn)步行數(shù)據(jù)解析。STAMP供給了豐富的統(tǒng)計(jì)查驗(yàn)方法和圖形化結(jié)果的輸出。在使用STAMP以前需要第一準(zhǔn)備需要的spf格式文件和樣品分組信息表。在我們的報(bào)告中已經(jīng)將KEGG和KO以及COG的結(jié)果文件后經(jīng)過(guò)變換生成了適于STAMP軟件翻開(kāi)的spf格式文件,還有對(duì)應(yīng)的分組信息表文件。以下是使用STAMP時(shí)的一些有關(guān)問(wèn)題,詳盡的STAMP使用教程能夠參照我們供給的STAMP使用教程。1、stamp作圖用的原始數(shù)據(jù)的根源?STAMP能夠直接使用來(lái)自QIIME的biom文件和PICUST的KEGG和ko文件,文件的格式為tab-saperatedvalue(tab鍵分開(kāi)的數(shù)據(jù))2、分組問(wèn)題:導(dǎo)入數(shù)據(jù)此后,viewàgrouplegend,在窗口右邊會(huì)出現(xiàn)分組欄,依據(jù)需要進(jìn)行分組。3、Unclassiffied選項(xiàng)中,remainUnclassiffiedreads、removeUnclassiffiedreads、和useonlyforcalculatingfrequencyprofiles方法的差異?remainUnclassiffiedreads和useonlyforcalculatingfrequencyprofiles方法會(huì)保存所有的數(shù)據(jù),而removeUnclassiffiedreads但是保存有確立分組信息的數(shù)據(jù)。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論