![華大結(jié)題報(bào)告1.21轉(zhuǎn)錄組denovo幫助_第1頁](http://file4.renrendoc.com/view/9a58ad79605046cb473b9b81b6437beb/9a58ad79605046cb473b9b81b6437beb1.gif)
![華大結(jié)題報(bào)告1.21轉(zhuǎn)錄組denovo幫助_第2頁](http://file4.renrendoc.com/view/9a58ad79605046cb473b9b81b6437beb/9a58ad79605046cb473b9b81b6437beb2.gif)
![華大結(jié)題報(bào)告1.21轉(zhuǎn)錄組denovo幫助_第3頁](http://file4.renrendoc.com/view/9a58ad79605046cb473b9b81b6437beb/9a58ad79605046cb473b9b81b6437beb3.gif)
![華大結(jié)題報(bào)告1.21轉(zhuǎn)錄組denovo幫助_第4頁](http://file4.renrendoc.com/view/9a58ad79605046cb473b9b81b6437beb/9a58ad79605046cb473b9b81b6437beb4.gif)
![華大結(jié)題報(bào)告1.21轉(zhuǎn)錄組denovo幫助_第5頁](http://file4.renrendoc.com/view/9a58ad79605046cb473b9b81b6437beb/9a58ad79605046cb473b9b81b6437beb5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文產(chǎn)量得到的原始圖像數(shù)據(jù)經(jīng)basecalling轉(zhuǎn)化為序列數(shù)據(jù),我們稱之為rawdata或rawreads,結(jié)果以fastq文件格式 reads的序列以及reads的 質(zhì)量。在fastq格式文件中每個(gè)read由四行描述:+每個(gè)序列共有4行,第1行和第3行是序列名稱(有的fq文件為了節(jié)省 儀產(chǎn)生;第2行是序列;第4行是序列的 對(duì)應(yīng)第2行每個(gè)堿基,第四行每個(gè)字符對(duì)應(yīng)的ASCII值減去64,即為該堿基的 質(zhì)量值,比如c對(duì)應(yīng)的ASCII值為99,那么其對(duì)應(yīng)的堿基質(zhì)量值是35。從IlluminaGAPipelinev1.3開始(目前為v1.6),堿基質(zhì)量值范圍為2到41。表2 錯(cuò)誤率 錯(cuò)誤率用E表示,堿基質(zhì)量值用sQ表示,則有下列關(guān)系sQ=-錯(cuò)誤質(zhì)量對(duì)應(yīng)字MT^h華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文得到的reads,并不都是有效的。里面含有帶接頭的,重復(fù)的, 質(zhì)量很低的reads,這些reads會(huì)影響組裝和后續(xù)分析,我們對(duì)下機(jī)的reads過濾,得到clean reads。去除N的比例大于5%的獲得Cean軟 版 相 參數(shù)設(shè)f內(nèi)f內(nèi)部軟--Clean后續(xù)的分析都基于由原始數(shù)據(jù)過濾后得到的cleanreads華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文組裝結(jié)果分我們使用短reads組裝軟件Trinity。Trinty組裝步驟如下Inchworm 構(gòu)建k-mer庫,K=25。過濾低頻k-mer選擇最高頻度的k-mer作為 (不包括復(fù)雜度和單一的k-mers,一次用完即從k-mer庫中剔除),用來Contig組裝。以k-mer間overlap長(zhǎng)度等于k-1對(duì) 進(jìn)行延伸,直到不能再延伸,形成線性Contig。Chrysalis把可能存在可變剪切及其他平行 ponent,對(duì)每個(gè)Component構(gòu)建deBruijngraphs。拿reads驗(yàn)證,看每個(gè)Component的reads支持情況。Butterfly合并在deBruijn圖中有連續(xù)節(jié)點(diǎn)的線性路徑,以形成更長(zhǎng)的序列。剔除可能由于 錯(cuò)誤(只有極少reads支持)的分叉,使邊均勻。用動(dòng)態(tài)規(guī)劃算法打分,鑒定被reads和readpairs支持的路徑,剔除reads支持少的路徑。Trinty組裝結(jié)果我們稱之稱為Unigene。組裝得到的Unigene,首先使用Tgicl將其去冗余和進(jìn)一步拼接,然后再對(duì)這些序列進(jìn)行同源轉(zhuǎn)錄本聚類,得到最終的Unigene。如果同一種做了多個(gè)樣 ,不同樣品組裝得到的Unigene也需要通過序列聚類軟件做進(jìn)一步序列拼接,去冗余處理,以及同源轉(zhuǎn)錄本聚類,得到盡可能長(zhǎng)的非冗余Unigene在進(jìn)行同源轉(zhuǎn)錄本聚類以后,Unigene分為兩部分。一部分是clusters,同一個(gè)cluster里面有若干條相似度高(大于70%)的Unigene(以CL開頭,CL后面接 其余的是singletons(以Unigene開頭),代表單獨(dú)的Unigene。最后,將Unigene序列與蛋白數(shù)據(jù)庫NR、Swiss-Prot、KEGG和COG做blastx比對(duì)(evalue<0.00001),取比對(duì)結(jié)果最好的蛋白確定Unigene的序列方向。如果不同庫之間的比對(duì)結(jié)果有,則按NR、Swiss-Prot、KEGG和COG的優(yōu)先級(jí)確定Unigene的序列方向,跟以上四個(gè)庫皆比不上的Unigene我們用軟件ESTScan確定序列的方向。對(duì)于能確定序列方向的Unigene我們給出其從5'到3'方向的序列,對(duì)于無法確定序列方向的Unigene我們給出組裝軟件得到的序列。華 轉(zhuǎn)錄
denovo項(xiàng)目幫助文*組裝步驟軟軟 版 相 參數(shù)設(shè)Trn
re
n/fes/tgc
--minglue3--grouppairs -40-c10-v-repeat_strngency0.95-mnmatch35-mnscore參考文獻(xiàn)GrabherrMG,HaasBJ,etal.Full-lengthtranscriptomeassemblyfromRNA-Seqdatawithoutareferencegenome.NatureBiotechnology.2011,29(7):644-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文IseliC,JongeneelCV,etal.ESTScan:aprogramfordetecting,evaluating,andreconstructingpotentialcodingregionsinESTsequences.ProcIntConfIn SystMolBiol.1999:138-48.華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文Unigene功能注釋及COG分NRSwissProt是兩個(gè)著名的蛋白數(shù)據(jù)庫,其中SwissProt是經(jīng)COG是對(duì) 產(chǎn)物進(jìn)行直系同源分類的數(shù)據(jù)庫,每個(gè)COG蛋白都被假定來自祖先蛋白,COG數(shù)據(jù)庫是基于細(xì)菌、藻類、真核生物具有完整 KEGG是系統(tǒng)分 產(chǎn)物的功能的數(shù)據(jù)庫,用KEGG可以進(jìn)一步研 NT是NCBI非冗余核酸軟版相軟版相數(shù)據(jù)版參數(shù)設(shè)reReease63.0reease-reSwss-Prothttp://breReease63.0reease-reSwss-Prothttp://bast.ncb.nm.n /B
v2.2.26+x64-
-FF-e1e-5-pb華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文Unigene功能注釋及COG分描述生物體 產(chǎn)物的屬性。GO總共有三個(gè)ontology,分別描 的分子功能(molecularfunction)、細(xì)胞組分(cellularcomponent)、參與的生物 process)。我們根據(jù)NR注釋信息,使用Blast2GO軟件[1]得到Unigene的GO注釋信息。Blast2GO已被其它文獻(xiàn) 超過150次,是 廣泛認(rèn)可的GO注釋軟件。得到每個(gè)Unigene的GO注釋后,我們用WEGO軟件[2]對(duì)所有Unigene做GO功能分類統(tǒng)計(jì),從宏觀上認(rèn)識(shí)該物種的 軟 版 相 數(shù)據(jù) 版 參數(shù)設(shè)B
reease2012-08-
默認(rèn)參參考文獻(xiàn)ConesaA,G?tzS,etal.Blast2GO:auniversaltoolforannotation,visualizationand ysisinfunctionalgenomicsresearch.Bioinformatics.2005,21(18):3674-6.YeJ,FangL,etal.WEGO:awebtoolforplottingGOannotations.NucleicAcidsRes.2006,34(WebServerissue):W293-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文Unigene代謝通路分KEGG是系統(tǒng)分 產(chǎn)物在細(xì)胞中的代謝途徑以及這 產(chǎn)物的功能的數(shù)據(jù)庫,利用KEGG可以進(jìn)一步研 在生物學(xué)上的復(fù)雜行為。根據(jù)KEGG注釋信息我們能進(jìn)一步到Unigene的Pathway軟 版 相 數(shù)據(jù) 版 參數(shù)設(shè)Path_f
內(nèi)部版
默認(rèn)參考文獻(xiàn)[1]KanehisaM,ArakiM,etal.KEGGforlinkinggenomestolifeandtheenvironment.NucleicAcidsRes.2008,36(Databaseissue):D480-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文預(yù)測(cè)編碼蛋白框首先,我們NRSwiss-Prot、KEGGCOG的優(yōu)先順將Unigene序列以蛋庫做blastx比(evalue<0.00001),如果某Unigene序比對(duì)上優(yōu)級(jí)據(jù)庫中的蛋白,則不進(jìn)入下一輪比對(duì),否則自動(dòng)跟下一個(gè)庫做比對(duì),如此循環(huán)直到跟所有蛋白 對(duì)完。我們blast比對(duì)結(jié)果中rank最高的蛋白確定該Unigene的編碼區(qū)序列,然后根據(jù)標(biāo)準(zhǔn)密碼子表將編碼區(qū)序列翻譯成氨基酸序列,從而得到該Unigene編碼區(qū)的核酸序列(序列方向5'->3')和氨基酸序列。最后,跟以上蛋白庫皆比對(duì)不上的Unigene我們用軟ESTScan預(yù)測(cè)其編碼區(qū),得到其編碼區(qū)的核酸序列(序列方向5'->3')和氨基酸序列。32位版:ftp://ftp.ncb.nm.n 64位版:ftp://ftp.ncb.nm.n 根據(jù)機(jī)器選擇相應(yīng)版 ,我們提供了32位的版本blast-2.2.23-ia32-以32位版雙擊bast-2.2.23-a32-wn32.exe即可解壓,會(huì)在當(dāng)前路徑(假設(shè)當(dāng)前路徑為“C:\bast”)生成bn、data、doc三 將bn路徑加入系統(tǒng)右擊“我的電腦屬性——高級(jí)——環(huán)境變量——雙擊“Path”修改——在最后加入第1步中bin的路徑,用“;”與之前的值隔開,即“;C:\blast\bin”,重啟系統(tǒng)使之生效如果不做第2步,使用時(shí)要輸入完整的路徑參考 格式化數(shù)據(jù)核酸序列,如All-formatdb-iAll-Unigene.blast.cds.fa-p用鼠標(biāo)將-Unigene.blast.cds.faformatN.batifaformatdb-iAll-Utein.fa-p執(zhí)行b待分析序列為核酸序列數(shù)據(jù)庫為核酸序列,如All-Unigene.blast.cds.fablastall-pblastn-iseq.fa-dAll-Unigene.blast.cds.fa-e1e-5-m8-o該命令的意思是,對(duì)seq.fa文件中的核酸序列對(duì)-Unigene.blast.cds.fa數(shù)據(jù)庫執(zhí)行blastn搜索,e值限制是1e-5,輸出的結(jié)果以m8格式保存到文件seq.blastn.m8中。用鼠標(biāo)將seq.fa拖到runBlastn.bat上后,會(huì)自動(dòng)給出當(dāng)前下可用的數(shù)據(jù)庫用于選擇,選擇一個(gè)數(shù)據(jù)庫(或輸入其它數(shù)據(jù)庫的路徑)后將會(huì)自動(dòng)運(yùn)行blastn進(jìn)行比對(duì)。數(shù)據(jù)庫為蛋白序列,如-Utein.fa。華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文blastall-pblastx-iseq.fa-dAll-Utein.fa-e1e-5-m8-o該命令的意思是,對(duì)seq.fa文件中的核酸序列對(duì)All-Utein.fa數(shù)據(jù)庫執(zhí)行blastx搜索,e值限制是1e-5,輸出的結(jié)果以m8格式保存到文件seq.blastx.m8?用鼠標(biāo)將seq.fa拖到runBlastx.bat上后,會(huì)自動(dòng)給出當(dāng) 下可用的數(shù)據(jù)庫用于選擇,選擇一個(gè)數(shù)據(jù)庫(或輸入其它數(shù)據(jù)庫的路徑)后將會(huì)自動(dòng)運(yùn)行blastx進(jìn)行比對(duì)作為數(shù)據(jù)庫使用的序列文件,路徑中可以含有空格,但文件名中不能含有空格(因?yàn)锽LAST不支持)軟 版 相 參數(shù)設(shè)
默認(rèn)參參考文獻(xiàn)[1]IseliC,JongeneelCV,etal.ESTScan:aprogramfordetecting,evaluating,andreconstructingpotentialcodingregionsinESTsequences.ProcIntConfIn SystMolBiol.1999,138-48.華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文Unigene表達(dá)差異分差異表達(dá)分析找出在不同樣本間表達(dá)量不同 做GO功能分析和KEGG Pathway分析Unigene表達(dá)量的計(jì)算使用FPKM法(FragmentsPerkbperMillionfragments)。其計(jì) 設(shè)FPKM(A)為UnigeneA的表達(dá)量,則C為唯一比對(duì)到UnigeneA的fragments數(shù),N為唯一比對(duì)到所有Unigene的總fragments數(shù),L為UnigeneA的堿基數(shù)。FPKM因長(zhǎng)度 FPKM和RPKM算法 reads兩端比對(duì)上gene時(shí),F(xiàn)PKM算法將該reads當(dāng)做1條fragment來計(jì)算,而RPKM則當(dāng)做2條reads來計(jì)算差異表 的篩參照AudicS.等 在GenomeResearch上的基 篩選差異表 H1:某一 假設(shè)觀測(cè) A對(duì)應(yīng)的fragments數(shù)為x,已知在一個(gè)大文庫中,每 表達(dá)量的一小部分,在這種情況下,p(x)的分布服從泊松分布已知,樣本一能比對(duì)到所有Unigene的總fragments數(shù)為N1,樣本二能比對(duì)到所有Unigene的總fragments數(shù)為N2,樣本一中唯一比對(duì)到 A的fragments數(shù)為x,樣本二中唯一 A的fragments數(shù)為y,則該假設(shè)檢驗(yàn)的p-value可由以下 或其華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文當(dāng)我們做多重假設(shè)檢驗(yàn)時(shí),能夠保證單次假設(shè)檢驗(yàn)有比較小的錯(cuò)誤發(fā)生率的p-value已經(jīng)不再能夠保證足夠小的整體錯(cuò)誤發(fā)生率。因此我們要做多重假設(shè)檢驗(yàn)校正,將整體的錯(cuò)誤發(fā)生率控制在一定的水平.FDR(FalseDiscoveryRate)就是多重檢驗(yàn)校正中一種校正p-value的統(tǒng)計(jì)學(xué)方法。在實(shí)際中,F(xiàn)DR是錯(cuò)誤發(fā)現(xiàn)率的期望。假設(shè)挑選了R個(gè)差異表達(dá) ,其中S個(gè)是真正有差異表達(dá)的 ,另外V個(gè)是其實(shí)沒有差異表達(dá)的 ,為假陽性結(jié)果,F(xiàn)DR=E(V/R).假設(shè)我們希望平均錯(cuò)誤比例FDR 過1%時(shí),就在進(jìn)行假設(shè)檢驗(yàn)時(shí)預(yù)先設(shè)定FDR能超過0.01。在得到差異檢驗(yàn)的FDR值同時(shí),我們也根據(jù) 的表達(dá)量(FPKM值)計(jì)算該 在不同樣本間的差異表達(dá)倍數(shù)。FDR值越小,差異倍數(shù)越大,則表明表達(dá)差異越顯著。在我們的分 定義為FDR≤0.001且倍數(shù)差異在2倍以上的 軟 版 相 參數(shù)設(shè)內(nèi)部版內(nèi)部版-默認(rèn)參
/soapa
-m0-x500-s40-35-v5-r參考文獻(xiàn)MortazaviA,WilliamsBA,etal.Map and fying liantranscriptomesbyRNA-Seq.NatureMethods.2008,(5):621-AudicS,ClaverieJM.Claverie.Thesignificanceofdigitalgeneexpressionprofiles.GenomeRes.1997,7(10):986-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文差異Unigene的GO和Pathway分GO功能分析一方面給出差異表 的GO功能分類注釋;另一方面給出差異表 的GO功能顯著性富集分析 向GO數(shù)據(jù)庫( 數(shù),從而得到具有某個(gè)GO功能的 中顯著富集的GO條目,該假設(shè)檢驗(yàn)的p-value計(jì)算 其中,N為所有Unigene中具有GO注釋的 數(shù)目;n為N中差異表達(dá) 的數(shù)目;M為所有Unigene中注釋為某特定GO 數(shù)目;m為注釋為某特定GO 數(shù)目。計(jì)算得到的pvalue通過Bonferroni校正之后,以corrected-pvalue≤0.05為閾值,滿足此條件的GO term定義為在差異表 term。通過GO功能顯性富集分析能確定差異表 我們的GO功能分析同時(shí)整合了表達(dá)模式聚類分析,研究人員能方便地看到具有 response為在差異表 個(gè)GO term。表達(dá)模式聚類圖顯示了參與immuneresponse的差 的表達(dá)模式(其中Ratio表 在兩個(gè)樣本中表達(dá)量FPKM的比值)華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文在差異表 中顯著富集的GO華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文KEGGPathway
參與immuneresponse的差 表達(dá)模式聚類在生物體內(nèi),不 相互協(xié)調(diào)行使其生物學(xué),基于Pathway的分析有助于更進(jìn)一步了 的生物學(xué)功能。KEGG是有關(guān)Pathway的主要公共數(shù)據(jù)庫Pathway顯著性富集分析以KEGG Pathway為單位,應(yīng)用超幾何檢驗(yàn),找出與整 中顯著性富集的Pathway。該假設(shè)檢驗(yàn)的p-value計(jì)同GO功能顯著性富集分析的相似,在這里N為所有Unigene中具有Pathway注釋 數(shù)目;n為N中差異表 的數(shù)目;M為所有Unigene中注釋為某特定Pathway 數(shù)目為注釋為某特定Pathway的差異表 數(shù)目。計(jì) 如下經(jīng)過多重檢驗(yàn)校正后,選擇Qvalue≤0.05的Pathway定義為在差異表 中顯著富集的Pathway。Q-value和FDR類似,都是對(duì)p-value的一種校正。某一個(gè)假設(shè)檢驗(yàn)的Q-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文就是FDR的最小值,在這些FDR下該假設(shè)檢驗(yàn)可以被認(rèn)為是顯著的通過Pathway顯著性富集能確定差異表 pathway華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文各列意義如下 序通路DEGswthpathwayannotaton注釋到該通路的差異表達(dá)的數(shù)AgeneswthpathwayannotatonPva注釋到該通路的所有的數(shù)超幾何檢驗(yàn)的PQvaQ值(Q≤0.05為在差異表達(dá)中顯著富集的KEGG數(shù)據(jù)庫中的Pathway注:Qvalue≤0.05的Pathway在差異表 差異表 的Pathway顯著性富集分析不但得到最有意義的Pathway列表,點(diǎn)擊其中的 還將得到KEGG數(shù)據(jù)庫中Pathway的詳細(xì)信息,如點(diǎn)擊表8第一列第三行的cellreceptorsignalingpathway,可以看到如下圖所示的詳細(xì)信息,上 華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文KEGG數(shù)據(jù)庫中Bcellreceptorsignalingpathway華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文軟 版
數(shù)據(jù) 版 參數(shù)設(shè)GO-TermFnderPath_fnder
內(nèi)部軟
st/GO-TermF-
reease2012-08-
默認(rèn)參參考文獻(xiàn)[1]KanehisaM,ArakiM,etal.KEGGforlinkinggenomestolifeandtheenvironment.NucleicAcidsRes.2008,36(Databaseissue):D480-484.華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文UnigeneSSR分簡(jiǎn)單重復(fù)序列(SimpleSequenceRepeat,SSR)又稱 DNA,指的 組中由1-6個(gè)核苷酸組成的基本單位重復(fù)多次構(gòu)成的一段DNA,廣泛分布 長(zhǎng)度一般在200 bp以下,其兩端的序列高度保守,可設(shè)計(jì)引物進(jìn)行PCR擴(kuò)增,揭示其多態(tài)性基于轉(zhuǎn)錄組的SSR檢測(cè)是以組裝出來Unigene作為參考序列,使用SSR軟件MicroSA lite(MISA),來找出所有的SSR。對(duì)所有SSR重復(fù)單元在Unigene上前后序列的長(zhǎng)度進(jìn)行篩選。只保留前后序列均不小于150bp的SSR,用其設(shè)計(jì)引物?;赟SR重復(fù)單元前后的序列設(shè)計(jì)引物,每條SSR產(chǎn)生5條引物。使用軟件primer3-2.3.4,具體參數(shù)請(qǐng)見配置文件primerin 引物不能存在SSR將獲得的引物比對(duì)到Ungene序列,引物的5端允許有3個(gè)堿基的錯(cuò)配,3端允許有1個(gè)堿基去掉那些比對(duì)到不同Ungene上的引物,篩選那些唯一匹配的引物使用 軟版軟版 相參數(shù)設(shè)McroSAtete(MISA)Prmer3
1-12,2-6,3-5,4-5,5-4,6-eben.de/msa/meben.de/msa/m 華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文SNP分我們使用SOAPsnp(Li,Zhuetal.2009)測(cè)樣品的單核苷酸多態(tài)性(SingleNucleotidePolymorphism,SNP),或稱之為雜合位點(diǎn)SOAPsnp是SOAP 中的一員。它也是一種 工具,可以為基于原 片段在已知序列上的比對(duì)而組裝出 在參考序列上的共有序列。這樣我們就可以通過比較 SNP華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文對(duì)于多個(gè)樣品,使用-Unigene.faSNP。然后對(duì)每個(gè)樣品SNP結(jié)果合并到一起,并進(jìn)行比較,找出它們相同和不同的地方。根據(jù)不同的條件,將SP位點(diǎn)歸到以下的幾種類型:所有樣品在該位點(diǎn)具有相同型式的SNP所有的SNP位點(diǎn)軟軟 版 相 參數(shù)設(shè)
-ut-Q-L參考文獻(xiàn)[1]LiR,YuC,etal.SOAP2:animprovedultrafasttoolforshortreadalignment.Bioinformatics.2009,25(15):1966–1967.華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文主成分分主成分分析(principalcomponents ysis,PCA)是一種簡(jiǎn)化數(shù)據(jù)集的技術(shù),它把原始數(shù)據(jù)變換到一個(gè)新的坐標(biāo)系統(tǒng)中,使得任何數(shù)據(jù)投影的第一大方差在第一個(gè)坐標(biāo)(稱為第一主成分)上,第二大方差在第二個(gè)坐標(biāo)(第二主成分)上,依次類推。主成分分析減少數(shù)據(jù)集的維數(shù),同時(shí)保持?jǐn)?shù)據(jù)集的對(duì)方差貢獻(xiàn)最大的特征。R語言中的 p函數(shù)可以進(jìn)行軟 版 相 參數(shù)設(shè)Rpr 參考文獻(xiàn) VenablesWN,RipleyBD.ModernAppliedStatisticswithS,Springer-Verlag.2YuLJ,LuoYF,LiaoB,etal.Comparative ysisoftransporters,phytohormoneandlipidmetabolismpathwaysinresponsetoarsenicstressin(Oryzasativa).NewPhytol.2012,195(1):97-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文條件特異表達(dá)分令ei(g)為 g在樣品i中的reads數(shù),則 g在所有樣品中的reads數(shù)為E(g)=∑iei(g)。令si為樣品i中所有reads數(shù),則期望的每個(gè) 在樣品i中的reads數(shù)與pi=si/∑isi成 g,如果它在所有組織中均勻地表達(dá),則期望的它在組織i中reads數(shù)為fi=E(g)pi。定義expression ent(EE)EEi(g)=ei(g)/fi(g), g在樣品i中的reads數(shù)觀測(cè)值對(duì)期望值的比例。更大的EEi(g)代表 評(píng)估一個(gè)較大的EEi(g)值是由于偶然因素而不是真實(shí)的偏向性表達(dá)情況,為expression ent值定義一個(gè)P-value,它由如
P(g)=∑ )px(1-pi x=e我們通常定義滿足:EEi(g5和Pi<10
.5 為條件特異表 軟版相參數(shù)設(shè)內(nèi)部軟件--rato3-pvaue參考文獻(xiàn)[1]YuX,LinJ,ZackDJ,Qian putational ysisoftissue-specificcombinatorialgeneregulation:predictingin ctionbetweentranscriptionfactorsinhumantissues.NucleicAcidsRes.2006,34(17):4925-4936.華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文 工作流程概 上圖描述的轉(zhuǎn)錄 的實(shí)驗(yàn)步驟:提取樣品總RNA并使用DNase I消化DNA后,用帶有Oligo(dT)的磁珠富集真核生物mRNA(若為原核生物,則用試劑盒去除rRNA后進(jìn)入一步);加入打斷試劑在Thermomixer中適溫將mRNA打斷成短片段,以打斷后的mRNA為模板合成一鏈cDNA,然后配制二鏈合成反應(yīng)體系合成二鏈cDNA,并使用試劑盒純化回收華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文粘性末端修復(fù)、cDNA的3'末端加上堿基"A"并連接接頭,然后進(jìn)行片段大小選擇,最后進(jìn)行PCR擴(kuò)增;構(gòu)建好的文庫用Agilent2100Bio yzer和ABIStepOnePlusReal-TimePCRSystem質(zhì)檢合格后,使用IlluminaHiSeq?2000或其他 4.1.2信息分析流程簡(jiǎn)對(duì)原始數(shù)據(jù)進(jìn)行去除接頭序列及低質(zhì)量reads的處理:獲得Cean數(shù)據(jù)產(chǎn)出統(tǒng)計(jì) 組裝結(jié)果分析:用短reads組裝軟件Trnty組裝,對(duì)組裝出來的Contg和Ungene做一個(gè)長(zhǎng)度分布統(tǒng)Ungene功能注釋及COG分類:分別將Ungene注釋到NR,NT,Swss-Prot,KEGG,COG,GO庫,并分別對(duì)注釋到每個(gè)庫以及所有注釋上的Ungene數(shù)目進(jìn)行統(tǒng)計(jì),給出NR分類圖和COG分類圖;Ungene的GO分類:根據(jù)NR注釋信息得到GO功能注釋,得到每個(gè)Ungene的GO注釋后,我們用WEGO軟件對(duì)所有Ungene做GO功能分Ungene代謝通路分析:根據(jù)KEGG數(shù)據(jù)庫的注釋信息我們能進(jìn)一步得到Ungene的Pathway預(yù)測(cè)編碼蛋白框(CDS):按NR、Swss-Prot、KEGG和COG的優(yōu)先級(jí)順序?qū)ngene序列與以上蛋白庫做bastx比對(duì),翻譯后得到該Ungene編碼區(qū)的核酸序列(序列方向5)和氨基酸序列。皆比對(duì)不上的Ungene我用軟件ESTScan預(yù)測(cè)其編碼區(qū)Ungene表達(dá)差異分析、樣品間的差異GO分類和Pathway富集性分析:差異表達(dá)分析找出在不同樣本間表達(dá)量不同 做GO功能分析和KEGGPathway分;SNP分析:使用SOAPsnp檢測(cè)樣品的單核苷酸多態(tài)性(SngeNuceotdePoymorphSSR開發(fā)及引物設(shè)計(jì):以組裝出來Ungene作為參考序列,使用SSR軟件M 華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文條件特異表 分析主成分分析(PCA)華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文Q1:轉(zhuǎn)錄組研究A1:基于的有cDNA文庫、EST文庫、SAGEcDNA;表達(dá)聚類。Q2: 相比,轉(zhuǎn)錄組高通量有什么優(yōu)勢(shì) 是用已知序列的探針和樣本mRNA進(jìn)行雜交來獲得mRNA的序列信息的,如果樣本mRNA以前從來沒有過,那么 新的mRNA;另外,核酸雜交的背景噪音很高,存在交叉雜交現(xiàn)象。轉(zhuǎn)錄組是直接對(duì)樣本mRNA進(jìn)序,能夠發(fā)現(xiàn)很多新的mRNA;轉(zhuǎn)錄組對(duì)表達(dá)上調(diào)或下降的檢測(cè)范圍能夠 的百倍左右要靈敏。而且在有參考組的情況下,通過轉(zhuǎn)錄組您還可以分析可變剪切、結(jié)構(gòu)變異、全組水平表達(dá)豐度等情況。Q3:華大與競(jìng)爭(zhēng)對(duì)手的價(jià)格比較如何,有何優(yōu)勢(shì)A3:華大一直致力于為客戶提供高性價(jià)比 :轉(zhuǎn)A4:均可以Q5:是否需要生A5:是的,至少需要兩次生物學(xué)重復(fù),3次以上的生物學(xué)重復(fù)更好。2011年7月Hansen[1] 。如果不設(shè)生物學(xué)重復(fù),高影響因子 Q6酸平臺(tái)是否會(huì)對(duì)客戶樣品進(jìn)行DNase處理A6:華大建議客戶送樣前自行對(duì)樣品進(jìn)行DNase處理,建庫前的DNase處理只能處理痕量DNA模板殘Q7SMARTA7:普通反轉(zhuǎn)錄是直接反轉(zhuǎn)錄,然后對(duì)cDNA打斷,但是對(duì)全長(zhǎng)mRNA進(jìn)行反轉(zhuǎn)錄,片段太長(zhǎng),反轉(zhuǎn)錄酶的效果會(huì)變差,導(dǎo)致末端的片段丟失;而SMART技術(shù)能夠完整保留全長(zhǎng)mRNA的信息。Q8:SMART技術(shù)的A8SMART技術(shù)原理:在合成cDNA的反應(yīng)中事先加入的3'末端帶Oligo(dG的SMART引物,由于逆轉(zhuǎn)錄酶以mRNA為模板合成cDNA,在到達(dá)mRNA的5'末端時(shí)碰到真核mRNA特有的帽子結(jié)構(gòu)",即甲基化的G時(shí)會(huì)連續(xù)在合成的cDNA末端加上幾個(gè)dC,SMART引物的Oligo(dG與合成cDNA末端突出的幾個(gè)C配對(duì)后形成cDNA的延伸模板,逆轉(zhuǎn)錄酶會(huì)自動(dòng)轉(zhuǎn)模板,以SMART引物作為延伸模板繼續(xù)延伸cDNA單鏈直到引物的末端,這樣得到的所有cDNA單鏈的一端有含Oligo(dT)的起始引物序列,另一端有已知的SMART引物序列,合成第二鏈后可以利用通用引物進(jìn)行擴(kuò)增。由于有5'mRNA才能利用這個(gè)反應(yīng)得到能擴(kuò)增的cDNA,因此擴(kuò)增得到的cDNA就是全長(zhǎng)cDNA。Q9:轉(zhuǎn)錄 A9:轉(zhuǎn)錄組 后可通過實(shí)時(shí)熒光定量PCR(qRT-PCR)技術(shù)來驗(yàn)證 [1]HansenMB,VerdurmenWP,etal.Amodularandnoncovalenttransductionsystemforleucine-zipper-taggedproteins.Chembiochem.2011,12(15):2294-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文專GO(GeneOntoogy):是 (GeneOntoogyConsortum)所建立的數(shù)據(jù)庫,旨在建立一個(gè)適用于各種物種的,堆積因何蛋白質(zhì)功能進(jìn)行限定和描述的,并能隨著研 COG:CusterofOrthoogousGroupsofprotens(蛋白相鄰類的聚簇)的縮寫。COG數(shù)據(jù)庫是基于細(xì)菌、藻類、真核生物具有完整 COG是對(duì) 產(chǎn)物進(jìn)行直系同源分類構(gòu)的數(shù)據(jù)庫,每個(gè)COG的蛋白都是被假定為來自于一個(gè)祖先蛋白,為orthoogs或是paraogs。Orthoogs是指來自于不同物種的由垂直家系(物種形成)進(jìn)化而來的蛋白,并且典型的保留與原始蛋白有相同的功能。Paraogs是那些在一定物種中的來源于 數(shù)據(jù)庫進(jìn)行比對(duì),預(yù)測(cè)Ungene可能的功能并對(duì)其做功能分類統(tǒng)計(jì)。Nr:著名的蛋白數(shù)據(jù)庫,根據(jù)nr注釋信息我們能得到GO功能注釋。Gene 表(controedvocabuary)來全面描述生物體中 產(chǎn)物的屬性。GO總共有三個(gè)ontoogy,分別描述 的分子功能(moecuarfuncton)、所處的細(xì)胞位置(ceuarcomponent)、參與的生物過程(boogcaprocess)。KEGG:系統(tǒng)分 產(chǎn)物在細(xì)胞中的代謝途徑以及這 產(chǎn)物的功能的數(shù)據(jù)庫,用KEGG可以進(jìn)一步研 在生物學(xué)上的復(fù)雜行為,根據(jù)KEGG注釋信息我們能進(jìn)一步華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文轉(zhuǎn)錄組參考文我們精心收集了近 的轉(zhuǎn)錄組denovo文章,供合作伙 LiangC,LiuX,YiuS,etal.DenovoassemblyandcharacterizationofCamelinasativatranscriptomebypaired-endsequencing.BMCGenomics.2013,14:146.2WangH,JiangJ,ChenS,etal.Next-generationsequencingoftheChrysanthemumnankingense(As ceae)transcriptomepermitslarge-scaleunigeneassemblyandSSRmarkerdiscovery.PLoSOne.2013,8(4):e62293.3ChenX,ZhuW,AzamS,etal.Deepsequencing ysisofthetranscriptomesofpeanutaerialandsubterraneanyoungpodsidentifiescandidategenesrelatedtoearlyembryoabortion. ntBiotechnolJ.2013,11(1):115-27.4FengC,ChenM,XuCJ,etal.Transcriptomic ysisof bayberry(Myricarubra)fruitdevelopmentandripeningusingRNA-Seq.BMCGenomics.2012,5DuH,BaoZ,HouR,etal.TranscriptomesequencingandcharacterizationfortheseacucumberApostichopusjaponicus(Selenka,1867).PLoSOne.2012,6ZhangJ,LiangS,DuanJ,etal.Denovoassemblyandcharacterisationofthetranscriptomeduringseeddevelopment,andgenerationofgenic-SSRmarkersinpeanut(ArachishypogaeaL.).BMCGenomics.2012,13:90.7LiD,DengZ,QinB,etal.DenovoassemblyandcharacterizationofbarktranscriptomeusingIlluminasequencinganddevelopmentofEST-SSRmarkersinrubbertree(HeveabrasiliensisMuell.Arg.).BMCGenomics.2012,13:192.8LiuG,LiW,ZhengP,etal.Transcriptomic ysisof'Suli'pear(Pyruspyrifoliawhitepeargroup)budsduringthedormancybyRNA-Seq.BMCGenomics.2012,13:700.9LiuB,JiangG,etal. ysisoftranscriptomedifferencesbetweenresistantandsusceptiblestrainsofthecitrusredmitePanonychuscitri(Acari:Tetranychidae).PLoSONE.2011,6(12):e28516.10WeiW,QiX,WangL,ZhangY,etal.Characterizationofthesesame(SesamumindicumL.)globaltranscriptomeusingIlluminapaired-endsequencinganddevelopmentofEST-SSRmarkers.BMCGenomics.2011,12:451.11 ShenGM,DouW,NiuJZ,etal. ysisoftheorientalfruitfly(Bactroceradorsalis).PLoSOne.2011,6(12):e29127.12WangZY,ChenJY,ZhangXJ,etal.DenovoassemblyandcharacterizationofroottranscriptomeusingIlluminapaired-endsequencinganddevelopmentofcSSRmarkersinsweetpotato(Ipomoeabatatas).BMCGenomics.2010,11:726.13ChenS,YangP,JiangF,etal.Denovo ysisoftranscriptomedynamicsinthemigratorylocustduringthedevelopmentofphasetraits.PLoSONE.2010,5(12):14XiangLX,HeD,etal.Deepsequencing-basedtranscriptomeprofiling ysisofbacteria-challengedLateolabraxjaponicasrevealsinsightintotheimmune-relevantgenesinmarinefish.BMCGenomics.2010,11:472-480.15GrahamIA,BesserK,BlumerS,etal.ThegeneticmapofArtemisiaannuaL.identifieslociaffectingyieldoftheantimalarialdrugartemisinin.Science.2010,327(5963):328-華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文信息挖掘推 挖掘多樣品間差異表 及功 novo ,組裝出unigene,篩選出多樣品間的差異表達(dá) 進(jìn)行聚類、GO和Pathway顯著性富集分析。華大參與完成的轉(zhuǎn)錄組denovo文章:LiuB,JiangG,et ysisoftranscriptomedifferencesbetweenresistantandsusceptiblestrainsofthecitrusredmitePanonychuscitriTetranychidae).PLoSONE.2011,6(12):e28516. 單位中國農(nóng)業(yè) 影響因子案例描*轉(zhuǎn)錄組denovo挖掘多樣品間差異表 華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文 組序列的物種,通過轉(zhuǎn)錄組denovo 表達(dá)情況,深入研究目標(biāo)性狀形成的分子機(jī)制,并可開發(fā)cDNASSRs(cSSRs)標(biāo)記,可廣泛用華大參與完成的轉(zhuǎn)錄組denovoWangZ,FangB,ChenJ,etal.DenovoassemblyandcharacterizationofroottranscriptomeusingIlluminapaired-endsequencinganddevelopmentofcSSRmarkersinsweetpotato(Ipomoeabatatas).BMCGenomics. ,建立了第一個(gè)甘薯轉(zhuǎn)錄組數(shù)據(jù)庫,開發(fā)了cSSRs標(biāo)記,用于甘薯育種。(華大參與完成) 影響因子案例描*轉(zhuǎn)錄組denovo開發(fā)SSR標(biāo)記研究流華 轉(zhuǎn)錄 denovo項(xiàng)目幫助文對(duì)于無參 組,通常比對(duì)率很低,而使用轉(zhuǎn)錄組denovounigene組裝結(jié)果則能提供良好結(jié) 多篇運(yùn)用轉(zhuǎn)錄組denovo技術(shù)的文章。華大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 虛擬演播室制作設(shè)備項(xiàng)目籌資方案
- 文山2024年云南文山市緊密型醫(yī)療衛(wèi)生共同體總醫(yī)院招聘54人筆試歷年參考題庫附帶答案詳解
- 2025年中國減脂儀市場(chǎng)調(diào)查研究報(bào)告
- 2025至2031年中國高效低噪音節(jié)能離心通風(fēng)機(jī)行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年紅瑪瑙情侶吊墜項(xiàng)目可行性研究報(bào)告
- 2025至2031年中國短袖迷彩服行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年洗衣車項(xiàng)目可行性研究報(bào)告
- 2025年有色打字機(jī)項(xiàng)目可行性研究報(bào)告
- 2025至2031年中國小麥胚芽油軟膠囊行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025年實(shí)木復(fù)合拼花門項(xiàng)目可行性研究報(bào)告
- 化學(xué)選修4《化學(xué)反應(yīng)原理》(人教版)全部完整PP課件
- 《煤礦安全規(guī)程》專家解讀(詳細(xì)版)
- 招聘面試流程sop
- 建筑公司工程財(cái)務(wù)報(bào)銷制度(精選7篇)
- 工程設(shè)計(jì)方案定案表
- 最新2022年減肥食品市場(chǎng)現(xiàn)狀與發(fā)展趨勢(shì)預(yù)測(cè)
- 第一章-天氣圖基本分析方法課件
- 暖氣管道安裝施工計(jì)劃
- 體育實(shí)習(xí)周記20篇
- 初二物理彈力知識(shí)要點(diǎn)及練習(xí)
- 復(fù)合材料成型工藝及特點(diǎn)
評(píng)論
0/150
提交評(píng)論