版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二代測(cè)序數(shù)據(jù)分析原理詳解演示文稿現(xiàn)在是1頁(yè)\一共有65頁(yè)\編輯于星期五優(yōu)選第二代測(cè)序數(shù)據(jù)分析原理現(xiàn)在是2頁(yè)\一共有65頁(yè)\編輯于星期五三代DNA測(cè)序技術(shù)之比較第一代測(cè)序技術(shù):Sanger測(cè)序法第二代測(cè)序技術(shù):454測(cè)序……
第三代測(cè)序技術(shù):?直接測(cè)序法:?4/3/20233現(xiàn)在是3頁(yè)\一共有65頁(yè)\編輯于星期五第一代測(cè)序技術(shù):
Sanger測(cè)序法
——簡(jiǎn)便、快速4/3/20234現(xiàn)在是4頁(yè)\一共有65頁(yè)\編輯于星期五逐漸被遺忘的測(cè)序技術(shù):
Maxam-Gilbert的DNA化學(xué)降解法
4/3/20235現(xiàn)在是5頁(yè)\一共有65頁(yè)\編輯于星期五Sanger測(cè)序的局限通過(guò)幾十年的改進(jìn),第1代測(cè)序儀的讀長(zhǎng)可以超過(guò)1000bp,原始數(shù)據(jù)的準(zhǔn)確率可以高達(dá)99.999%,測(cè)定每千堿基序列的成本是0.5美元,每天的數(shù)據(jù)通量可以達(dá)到60萬(wàn)堿基。但是,不管怎么改進(jìn),第1代測(cè)序技術(shù)在速度和成本方面都已達(dá)到了極限(因?yàn)閷?duì)電泳分離技術(shù)的依賴(lài),使其難以進(jìn)一步提升分析的速度和提高并行化程度,并且難以通過(guò)微型化降低測(cè)序成本)。在此種情況下,第二代測(cè)序技術(shù)(Next-generationsequencing)應(yīng)運(yùn)而生。4/3/20236現(xiàn)在是6頁(yè)\一共有65頁(yè)\編輯于星期五概要主要的測(cè)序平臺(tái)基因組分析原理轉(zhuǎn)錄組分析原理分析策略的選擇現(xiàn)在是7頁(yè)\一共有65頁(yè)\編輯于星期五第二代測(cè)序技術(shù)454測(cè)序IlluminaSOLIDPolonatorCompleteGenomics……4/3/20238現(xiàn)在是8頁(yè)\一共有65頁(yè)\編輯于星期五4544/3/20239現(xiàn)在是9頁(yè)\一共有65頁(yè)\編輯于星期五SOLID4/3/202310現(xiàn)在是10頁(yè)\一共有65頁(yè)\編輯于星期五Illumina4/3/202311現(xiàn)在是11頁(yè)\一共有65頁(yè)\編輯于星期五其他PolonatorCompleteGenomics……4/3/202312現(xiàn)在是12頁(yè)\一共有65頁(yè)\編輯于星期五4/3/202313現(xiàn)在是13頁(yè)\一共有65頁(yè)\編輯于星期五第二代測(cè)序技術(shù)的共同點(diǎn)1將目標(biāo)DNA剪切為小片段2單個(gè)小片段DNA分子結(jié)合到固相表面3單分子獨(dú)立擴(kuò)增4每次只復(fù)制一個(gè)堿基(A,C,T,G)并檢測(cè)信號(hào)5高分辨率的成像系統(tǒng)。4/3/202314現(xiàn)在是14頁(yè)\一共有65頁(yè)\編輯于星期五第二代測(cè)序技術(shù)的局限與第一代測(cè)序儀相比,以合成測(cè)序?yàn)榛A(chǔ)的下一代測(cè)序平臺(tái)速度顯著提高,成本明顯降低。每臺(tái)設(shè)備每天產(chǎn)出千兆堿基的序列不足為奇。但是,除了羅氏的454平臺(tái)之外,讀長(zhǎng)短成了下一代測(cè)序平臺(tái)的致命傷,這主要是由于DNA簇中存在的光學(xué)信號(hào)移相造成的。而應(yīng)運(yùn)而生的單分子測(cè)序技術(shù)是解決這一問(wèn)題的一種方法。4/3/202315現(xiàn)在是15頁(yè)\一共有65頁(yè)\編輯于星期五第三代測(cè)序技術(shù):?jiǎn)畏肿訙y(cè)序HelicosBiosciencesVisiGenPacificBiosciencesMobiousNexusI……4/3/202316現(xiàn)在是16頁(yè)\一共有65頁(yè)\編輯于星期五4/3/202317現(xiàn)在是17頁(yè)\一共有65頁(yè)\編輯于星期五直接測(cè)序法在所有上述三代測(cè)序技術(shù)中,序列都是在熒光或者化學(xué)發(fā)光物質(zhì)的協(xié)助下,通過(guò)讀取DNA聚合酶或DNA連接酶將堿基連接到DNA鏈上過(guò)程中釋放出的光學(xué)信號(hào)而間接確定的。除了需要昂貴的光學(xué)監(jiān)測(cè)系統(tǒng),還要記錄、存儲(chǔ)并分析大量的光學(xué)圖像,這都使儀器的復(fù)雜性和成本增加。依賴(lài)生物化學(xué)反應(yīng)讀取堿基序列更增加了試劑、耗材的使用,在目前測(cè)序成本中比例相當(dāng)大。直接讀取序列信息,不使用化學(xué)試劑,對(duì)于進(jìn)一步降低測(cè)序成本是非常可取的。為了實(shí)現(xiàn)這樣的目標(biāo),目前就有很多人在研究納米物理技術(shù)。在全球,許多公司和組織,如Agilent,DNAElectronics,IBM,NabSys,OxfordNanoporeTechnologies,Sequenom等都在進(jìn)行納米孔測(cè)序的開(kāi)發(fā),不同的只是采用的方法或策略。4/3/202318現(xiàn)在是18頁(yè)\一共有65頁(yè)\編輯于星期五4/3/202319現(xiàn)在是19頁(yè)\一共有65頁(yè)\編輯于星期五4/3/202320現(xiàn)在是20頁(yè)\一共有65頁(yè)\編輯于星期五SecondgenerationsequenceRoche454MetagenomicsDenovosequencingRNA-seqillumiaSolexaDenovosequencingRe-sequencingRNA-seq(ChromatinImmunoprecipitation,ChIP)Meth-seqABISOLiDRe-sequencingChIP-seq
RNA-seq現(xiàn)在是21頁(yè)\一共有65頁(yè)\編輯于星期五ExperimentsDNA-seq:denovo,resequencingRNA-seq:mRNA,ncRNA,smRNA...ChIP-seq:ChromatinImmunoPrecipitationMethyl-seq:methylatedDNA(epigenome)現(xiàn)在是22頁(yè)\一共有65頁(yè)\編輯于星期五主要的測(cè)序平臺(tái)基因組分析原理轉(zhuǎn)錄組分析原理分析策略的選擇現(xiàn)在是23頁(yè)\一共有65頁(yè)\編輯于星期五SequencingGlossaryReads.Acollectionofclonesthatover-samplethetargetgenome.Pair-endreads.Sequencereadsderivedfrombothendsofasequencing-libraryclone.Mate-pairreads.Sequencereadsderivedfrombothendsofamate-pairlibraryclonewhichinsertsizeisusually>1kb.Insertsize.Thesizeoftheclone-insertfromwhichaclone-endpairistaken.Contig.Theresultofjoininganoverlappingcollectionofsequencereads.Scaffold.Theresultofconnectiingnon-overlappingcontigesbyusingpir-endreads.N50size.Asappliedtocontigsorscaffolds,thatsizeabovewhich50%odtheassembled現(xiàn)在是24頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是25頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是26頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是27頁(yè)\一共有65頁(yè)\編輯于星期五 全基因組denove分析工具PlatformCorrectionAssemblySolexaSOAPdenovoSOAPdenovoVelvet,AbyssSolidSAETVelvet454newbler現(xiàn)在是28頁(yè)\一共有65頁(yè)\編輯于星期五分析所需工具BowtiesoftwareSAMtoolsTopHatsoftareCufflinkssoftwareCummeRbundsoftware現(xiàn)在是29頁(yè)\一共有65頁(yè)\編輯于星期五外顯子組分析工具PlatformAlignmentFindVariationsSolexaSOAP,bwaSOAPsnpsamtoolsSolidBioscope,BFASTBioscope,BFAST454BLAST,NEWBLERnewbler現(xiàn)在是30頁(yè)\一共有65頁(yè)\編輯于星期五主要的測(cè)序平臺(tái)基因組分析原理轉(zhuǎn)錄組分析原理分析策略的選擇現(xiàn)在是31頁(yè)\一共有65頁(yè)\編輯于星期五常規(guī)分析TranscriptsquantificationSplicingsitesdiscoveryandquantificationGenediscoverySNP/INDELdetectionAllelespecificexpression現(xiàn)在是32頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是33頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是34頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是35頁(yè)\一共有65頁(yè)\編輯于星期五UniGene拼接目的:將預(yù)處理后reads進(jìn)行拼接,得到拼接結(jié)果。
原理:應(yīng)用deBruijngraphpath算法對(duì)reads進(jìn)行denovo拼接;對(duì)上一步的拼接結(jié)果,再用HamiltonPath算法拼接。
結(jié)果:UniGene序列,UniGene統(tǒng)計(jì)信息,序列長(zhǎng)度分布圖現(xiàn)在是36頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是37頁(yè)\一共有65頁(yè)\編輯于星期五3.數(shù)據(jù)庫(kù)注釋目的:對(duì)拼接得到的UniGene進(jìn)行功能注釋
原理:通過(guò)blast+算法將拼接得到的UniGene序列與數(shù)據(jù)庫(kù)進(jìn)行比對(duì)
結(jié)果:比對(duì)結(jié)果表格,物種分布統(tǒng)計(jì)和Evalue分布統(tǒng)計(jì)
現(xiàn)在是38頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是39頁(yè)\一共有65頁(yè)\編輯于星期五UniGene表達(dá)分析目的:UniGene定量分析。
原理:以UniGene為reference,分別將每個(gè)樣本的reads進(jìn)行referencemapping,從而得到每個(gè)樣本在每個(gè)UniGenes中的一個(gè)reads覆蓋度,然后應(yīng)用RPKM/FPKM標(biāo)準(zhǔn)化公式對(duì)富集片段的數(shù)量進(jìn)行歸一化。
RPKM:ReadsPerKilobaseofexonmodelperMillionmappedreads,公式下:現(xiàn)在是40頁(yè)\一共有65頁(yè)\編輯于星期五UniGene表達(dá)分布圖,1X,5X分別為FPKM=1,F(xiàn)PKM=5分界點(diǎn),可以大體觀察到低表達(dá),中表達(dá)以及高表達(dá)的比例關(guān)系現(xiàn)在是41頁(yè)\一共有65頁(yè)\編輯于星期五UniGene樣本間表達(dá)相關(guān)性散點(diǎn)圖現(xiàn)在是42頁(yè)\一共有65頁(yè)\編輯于星期五樣本間表達(dá)差異程度的MA圖,可以體現(xiàn)差異表達(dá)總體偏差現(xiàn)在是43頁(yè)\一共有65頁(yè)\編輯于星期五UniGene表達(dá)差異分析目的:對(duì)定量結(jié)果進(jìn)行統(tǒng)計(jì)檢驗(yàn)分析,找出差異表達(dá)UniGene
原理:雙層過(guò)濾篩選差異基因
FC值篩選:采用Fold-change(FC),表達(dá)差異倍數(shù)進(jìn)行第一層此的差異基因篩選
FDR檢驗(yàn):一般采用卡方檢驗(yàn)中的fisher精確檢驗(yàn)進(jìn)行p值檢驗(yàn),采用BenjaminiFDR(Falsediscoveryratio)校驗(yàn)方法對(duì)p值進(jìn)行假陽(yáng)性檢驗(yàn),即,通過(guò)FDR顯著性參數(shù)進(jìn)行第二層次的差異基因篩選。
現(xiàn)在是44頁(yè)\一共有65頁(yè)\編輯于星期五組間差異基因上調(diào)與下調(diào)個(gè)數(shù)統(tǒng)計(jì),可以通過(guò)此圖觀察上調(diào)與下調(diào)的一個(gè)總體趨勢(shì)現(xiàn)在是45頁(yè)\一共有65頁(yè)\編輯于星期五差異基因火山圖,可以觀察到差異基因總體分布現(xiàn)在是46頁(yè)\一共有65頁(yè)\編輯于星期五GO功能分類(lèi)
目的:利用數(shù)據(jù)庫(kù)注釋信息將UniGene進(jìn)行GO功能分類(lèi)。
原理:利用數(shù)據(jù)庫(kù)的注釋結(jié)果,應(yīng)用blast2GO算法進(jìn)行GO功能分類(lèi),得到所有序列在GeneOntology的三大類(lèi):molecularfunction,cellularcomponent,biologicalprocess的各個(gè)層次所占數(shù)目,一般取到14層。
結(jié)果:MF,BP,CC三大分類(lèi)結(jié)果文件以及UniGene2GO關(guān)系列表,三大類(lèi)別中第二層次上的柱狀分布圖和餅圖,GO功能的層次分布圖。
現(xiàn)在是47頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是48頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是49頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是50頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是51頁(yè)\一共有65頁(yè)\編輯于星期五KEGG代謝通路分析目的:對(duì)拼接得到UniGene進(jìn)行KEGGpathway映射。
原理:應(yīng)用KEGGKAAS在線(xiàn)pathway比對(duì)分析工具對(duì)拼接得到的UniGene進(jìn)行KEGG映射分析。
結(jié)果:標(biāo)記的Pathway通路圖?,F(xiàn)在是52頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是53頁(yè)\一共有65頁(yè)\編輯于星期五IPApathwayanalysis
(/)現(xiàn)在是54頁(yè)\一共有65頁(yè)\編輯于星期五COG注釋目的:對(duì)拼接得到UniGene進(jìn)行COG功能分類(lèi)。
原理:利用blast+算法將拼接得到的UniGene與CDD庫(kù)中的COG/KOG庫(kù)進(jìn)行比對(duì),進(jìn)行COG功能分類(lèi)預(yù)測(cè),將其映射到COG分類(lèi)中。
結(jié)果:COG分類(lèi)分布情況圖?,F(xiàn)在是55頁(yè)\一共有65頁(yè)\編輯于星期五現(xiàn)在是56頁(yè)\一共有65頁(yè)\編輯于星期五SSR重復(fù)序列注釋目的:對(duì)拼接得到UniGene進(jìn)行SSR簡(jiǎn)單重復(fù)序列的查找。
原理:篩選標(biāo)準(zhǔn):?jiǎn)魏塑账嶂貜?fù)的次數(shù)在10次或10次以上,二核苷酸重復(fù)的次數(shù)在6次或6次以上,三至六核苷酸重復(fù)的次數(shù)在5次或5次以上。同時(shí),也篩選中間被少數(shù)堿基(間隔小于100或等于100)打斷的不完全重復(fù)的SSR。
結(jié)果:重復(fù)序列的信息文件以及統(tǒng)計(jì)文件。
現(xiàn)在是57頁(yè)\一共有65頁(yè)\編輯于星期五LncRNA預(yù)測(cè)目的:對(duì)拼接得到的UniGene進(jìn)行LncRNA(LongnoncodingRNA)預(yù)測(cè)。
原理:通過(guò)以下過(guò)程對(duì)UniGene進(jìn)行過(guò)濾,最終得到候選LncRNA序列。
1)Unigenelength>200bp;
2)UnigeneORF(OpenReadingFrame)l
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GH/T 1440-2023黑蒜
- 中考文言文復(fù)習(xí)資料大全課外文言文沖刺課件
- 不等式證明復(fù)習(xí)課課件
- 單位管理制度合并選集職員管理篇十篇
- 單位管理制度分享合集【職員管理篇】
- 《詩(shī)歌鑒賞表達(dá)技巧》課件
- 《企力管理咨詢(xún)》課件
- 單位管理制度呈現(xiàn)大全【職員管理篇】
- 《轉(zhuǎn)基因生物安全性》課件
- 4S店維修安全管理制度
- 軟件定義網(wǎng)絡(luò)(SDN)實(shí)戰(zhàn)教程課件
- 上海市住院醫(yī)師規(guī)范化培訓(xùn)公共科目考試題庫(kù)-重點(diǎn)傳染病防治知識(shí)
- 2024江蘇省鐵路集團(tuán)限公司春季招聘24人高頻考題難、易錯(cuò)點(diǎn)模擬試題(共500題)附帶答案詳解
- 2024智能變電站新一代集控站設(shè)備監(jiān)控系統(tǒng)技術(shù)規(guī)范部分
- 企業(yè)反恐專(zhuān)項(xiàng)經(jīng)費(fèi)保障制度
- 電梯工程師在電梯設(shè)計(jì)中的工作內(nèi)容
- 《概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)》全套教學(xué)課件
- 2024國(guó)家開(kāi)放大學(xué)電大本科《液壓氣動(dòng)技術(shù)》期末試題及答案
- 肥豬銷(xiāo)售合同模板
- 餐飲顧問(wèn)合作協(xié)議
- 兩課 說(shuō)課 單相橋式整流電路分析(獲獎(jiǎng))
評(píng)論
0/150
提交評(píng)論