轉(zhuǎn)錄組分析流程salmon瑞客_第1頁
轉(zhuǎn)錄組分析流程salmon瑞客_第2頁
轉(zhuǎn)錄組分析流程salmon瑞客_第3頁
轉(zhuǎn)錄組分析流程salmon瑞客_第4頁
轉(zhuǎn)錄組分析流程salmon瑞客_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

(d)不基于比對,

&易om生信e,b畢io生lo緣g;y.培b訓io版m權(quán)e所d有c xx

(.fastq

(.fafile)

(.gtffile)(可選)

A FASTQxx

CDNA (.fa (.gtf (.fastq

FASTQqualityscores=ASCIIqualityscore-either33or Illumina e=estimatedprobabilityofthebasecallbeingwrongQ40:1errorin10,000basecalls;Q30:1errorin1,000;Q28:1.6errorin1000;Q25:3errorin1000;Q20:1errorin信,畢生緣;培訓 FASTQ CDNA (.fa (.gtf xx 信,畢生緣;培訓 公共數(shù)據(jù)從NCBISRA使用NCBI提供的SRA-toolkit中的工具fastq-dump直接SRR文件,并轉(zhuǎn)換雙端就自動拆分,如果是單端不受的數(shù)據(jù)集一般比較大,放入 (nohupcmd&)。nohupfastq-dump-v--split-3--nohup&fastq-dump-v--split-3--& 77 fastqc x-axis:Positionin y-axis:Quality信,畢生緣;培訓 (箱線圖通過最大值、上四分位示質(zhì)量得分。將所有reads的第一位堿基質(zhì)量得分進行箱線 信,畢生緣;培訓 信,畢生緣;培訓 每個readGC含量的分布圖。橫坐標表示平均GC含量,縱坐標表示reads數(shù)。左圖顯示每個read的GC分布(紅線)與理論分布(藍線)相契合,GC含量均一。右圖出現(xiàn)了GC含量雙峰,表示樣品可能存在特定的序列污染如混入了引物二聚體,當這一信,畢生緣;培訓 ../FastQC/Configuration/adapter_list.txtFastQC工具會與這兩個文件里的序列進行比信,畢生緣;培訓 信,畢生緣;培訓 直方圖展示有 量異常高或低的樣本 橫軸是GC含量的判斷,縱軸是堿基橫軸表 reads數(shù),縱軸表示給定 數(shù)區(qū)間內(nèi)樣本數(shù)目,即給 深度有多 樣本 reads數(shù)低于20M的樣品沒有, 高于40M

信,畢生緣;培訓 接頭和低質(zhì)量readsmCommondjava-jartrimmomatic-0.30.jarPE--phred33input_forward.fqinput_reverse.fqoutput_forward_paired.fqoutput_forward_unpaired.fqoutput_reverse_paired.fqoutput_reverse_unpaired.fqILLUMINACLIP:adaptor-PE.fa:2:30:10LEADING:20TRAILING:20MINLEN:36TwoinputfilesandfouroutputRemoveadapters:( um2mismatchesinthe'seed'(16bases)oftheadaptor;palindromeclipthreshold30;simpleclipthreshold10)Removeleadinglowqualitybases(belowquality20);Removetrailinglowqualitybases(belowquality20);Dropreadsbelowthe36base易s生信lo,n畢 (2x(2x150(.fastq

(.fafile)

(.gtf 信,畢生緣;培訓 Ensembl(信,畢生緣;培訓E。nsemblcDNA指編 的 RNA- GTF(GeneTransferFormat, RNA- CDNA(.faCDNA(.fa(2x150(.fastq 易s生c信.,e畢d生u緣/F;A培Q訓版/F權(quán)A所Q有 m1-seqname-nameofthechromosomeorscaffold;chromosomenamescanbegivenwithorwithoutthe'chr'prefix.Importantnote:theseqnamemustbeoneusedwithinEnsembl,i.e.astandardchromosomenameoranEnsemblidentifiersuchasascaffoldID,withoutanyadditionalcontentsuchasspeciesorassembly.SeetheexampleGFFoutputbelow.m2-source-nameoftheprogramthatgeneratedthisfeature,orthedatasource(databaseorprojectname)m3-feature-featuretypename,e.g.Gene,Variation, 4-start-Startpositionofthefeature,withsequencenumberingstartingat1. 5-end-Endpositionofthefeature,withsequencenumberingstartingat1. 6-score-Afloatingpointvalue. 7-strand-definedas+(forward)or- 8-frame-Oneof'0','1'or'2'.'0'indicatesthatthefirstbaseofthefeatureisthefirstbaseofacodon,'1'thatthesecondbaseisthefirstbaseofacodon,andsoon.. 9-attribute-Asemicolon-separatedlistoftag-valuepairs,providingadditional6612信,畢生緣;培訓 bed–至少3列,另外9列可選,0-start信,畢生緣;培訓 信,畢生緣;培訓

- (.gtffile)(.gtffile)(.fafile)(.fastqx RNA- A transcripts_index--typequasi-k <LIBTYPE>-1reads1.fq-2reads2.fqo2 定量時考慮到不同樣品 長度的改變(比如不同 g易n生e信t,te畢s生/緣D;E培訓S版e權(quán)q所2有/。 (.fafile)(.fastqx(.fafile)(.fastqx RNA- (.gtf 信,畢生緣;培訓 (.fafile)(.fafile)(.fas

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論