




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
轉(zhuǎn)錄組測序百邁客生物科技有限公司課程結(jié)構(gòu)轉(zhuǎn)錄組測序簡介基因功能注釋及注釋庫簡介轉(zhuǎn)錄組測序分析流程第一部分轉(zhuǎn)錄組測序簡介基因功能注釋及注釋庫簡介轉(zhuǎn)錄組測序分析流程轉(zhuǎn)錄組測序簡介什么是轉(zhuǎn)錄組測序轉(zhuǎn)錄組測序興起的背景轉(zhuǎn)錄組測序的特點(diǎn)高通量轉(zhuǎn)錄組測序的優(yōu)勢什么是轉(zhuǎn)錄組測序RNA_Seq的重要分支RNA_Seq是指針對轉(zhuǎn)錄產(chǎn)物RNA的測序技術(shù),主要有以下分支:轉(zhuǎn)錄組分析表達(dá)譜分析小RNA分析降解組測序針對mRNA的測序轉(zhuǎn)錄組測序是針對特定樣品特定時(shí)期的轉(zhuǎn)錄mRNA的測序技術(shù),重點(diǎn)在對翻譯蛋白的mRNA的測序研究。TheCentralDogmaofMolecularBiologyThegenomeisonlyasourceofinformation.Inordertofunction,itmustbeexpressed.ThetranscriptionofgenestoproduceRNAisthefirststageof
geneexpression
.ThetranscriptomeisthecompletesetofRNAtranscriptsproducedbythegenomeatanyonetime.DNA-seqRNA-seq轉(zhuǎn)錄組測序興起的背景生物信息學(xué)的大發(fā)展自從人類基因組測序完成,宣布后基因組時(shí)代的研究到來,基于測序的生物信息學(xué)發(fā)展空前爆發(fā)。新一代測序技術(shù)(NextGenerationSequencing)測序通量高(測序數(shù)據(jù)產(chǎn)出量);測序成本低(時(shí)間和價(jià)格);代表有454,Solexa,Hiseq2000等;轉(zhuǎn)錄組測序的特點(diǎn)應(yīng)用對象靈活廣泛針對不同物種,不同個(gè)體,不同時(shí)期,都可以在mRNA水平準(zhǔn)確的分析性狀或功能差異,結(jié)構(gòu)變異等信息。研究范圍多樣化從未知基因組物種,到研究成熟的人體病變組織,小鼠組織等特異組織,均可通過轉(zhuǎn)錄組分析進(jìn)行研究。研究深度多樣化從大規(guī)模功能轉(zhuǎn)錄本發(fā)掘到特定基因的可變剪接的不同功能分析,都可以定位研究。高通量轉(zhuǎn)錄組測序的優(yōu)勢高通量轉(zhuǎn)錄組測序優(yōu)勢測序通量高;測序成本低;主要的測序類型454轉(zhuǎn)錄組測序(讀長較長,通量低,成本高);IlluminaSolexa高通量測序(讀長短,通量高,覆蓋度更高,定量更準(zhǔn)確,測序成本低);第二部分轉(zhuǎn)錄組測序簡介基因功能注釋及注釋庫簡介轉(zhuǎn)錄組測序分析流程基因功能注釋簡介同源序列比對探尋基因功能比對工具blast基因功能注釋數(shù)據(jù)庫nr、nt、UniprotCOG、Kegg、interproscan、GOBLASTBasicLocalAlignmentSearchTool(BLAST)結(jié)合了動(dòng)態(tài)規(guī)劃算法和間接的啟發(fā)式算法的優(yōu)點(diǎn),同時(shí)把數(shù)據(jù)庫檢索建立在嚴(yán)格的統(tǒng)計(jì)學(xué)基礎(chǔ)之上,是目前最常用的同源檢索工具。局部比對軟件比對比較精確細(xì)致用來做同源序列比對,進(jìn)行基因功能注釋耗時(shí)較長BLAST簡介命令及參數(shù)簡介建庫命令(formatdb)比對類型,5種不同的比對程序程序名查詢序列類型查詢數(shù)據(jù)庫類型應(yīng)用blastp蛋白質(zhì)蛋白質(zhì)使用取代矩陣尋找較遠(yuǎn)
關(guān)系blastn核酸核酸尋找較高分值的匹配,
對較遠(yuǎn)關(guān)系不太適用blastx核酸(翻譯)蛋白質(zhì)用于分析新的cDNA序列
或ESTtblastn蛋白質(zhì)核酸(翻譯)用于尋找數(shù)據(jù)庫中沒有
標(biāo)注的編碼區(qū)tblastx核酸(翻譯)核酸(翻譯)用于更進(jìn)一步的分析ESTBLAST結(jié)果簡介BLAST比對結(jié)果詳解nr&ntnr(Non-redundantproteinsequences)包含GenBank所有編碼序列,以及PDB,swissprot,PIR,PRF數(shù)據(jù)庫的所有編碼序列的一個(gè)非冗余數(shù)據(jù)庫,數(shù)據(jù)庫完整度高,氨基酸序列數(shù)據(jù)庫。nt(Nucleotidecollection)包含GenBank和PDB中(不包含EST,STS,GSS)的所有核苷酸序列信息,存在冗余的數(shù)據(jù)庫,數(shù)據(jù)庫完整度高。nr&nt比對結(jié)果nr&nt注釋結(jié)果UniprotUniprot(UniversalProteinResource)UniProt是一個(gè)集中收錄蛋白質(zhì)資源并能與其它資源相互聯(lián)系的數(shù)據(jù)庫,也是目前為止收錄蛋白質(zhì)序列目錄最廣泛、功能注釋最全面的一個(gè)數(shù)據(jù)庫。整合三大數(shù)據(jù)庫:Swissprot、TrEMBL、PIR(ProteinInformationResource)。數(shù)據(jù)庫組成:UniprotKB(知識庫)、Uniprotarc(歸檔)、Uniref(參考資料庫)。Uniprot簡介UniProtKBProteinknowledgebase,consistsoftwosections:Swiss-Prot,whichismanuallyannotatedandreviewed.TrEMBL,whichisautomaticallyannotatedandisnotreviewed.Includescompleteandreferenceproteomesets.UniRefSequenceclusters,usedtospeedupsequencesimilaritysearches.UniParcSequencearchive,usedtokeeptrackofsequencesandtheiridentifiers.Uniprot數(shù)據(jù)庫的最重要組成部分UniprotKB(Uniprotknowledgebase)UniProtKB/Swiss-ProtUniProtKB/Swiss-Prot主要收錄人工注釋的序列及其相關(guān)文獻(xiàn)信息和經(jīng)過計(jì)算機(jī)輔助分析的序列。這些注釋都是由專業(yè)的生物學(xué)家給出的,準(zhǔn)確性無需置疑。注釋結(jié)果全面翔實(shí),注釋包括對蛋白質(zhì)功能、酶學(xué)特性、剪接異構(gòu)體、相關(guān)疾病信息的注釋等等。注釋結(jié)果無冗余。
UniprotKB/TrEMBLUniprotKB/TrEMBL主要收錄的則是高質(zhì)量的經(jīng)計(jì)算機(jī)分析后進(jìn)行自動(dòng)注釋和分類的序列。由于大規(guī)模測序產(chǎn)生的海量數(shù)據(jù)無法通過Swissprot的嚴(yán)謹(jǐn)注釋思路來進(jìn)行注釋。TrEMBL存儲(chǔ)了比較全面完整的物種編碼序列信息。存在冗余。
Uniprot注釋途徑網(wǎng)頁提交序列本地BLAST
COGClustersofOrthologousGroupsofproteins(COGs)蛋白質(zhì)直系同源數(shù)據(jù)庫。通過對菌類,藻類和真核生物等66個(gè)完整基因組的編碼蛋白,根據(jù)系統(tǒng)進(jìn)化關(guān)系構(gòu)建而成。對于預(yù)測單個(gè)蛋白的功能和整個(gè)基因組中蛋白質(zhì)的功能具有重要的作用。
COGKEGGKyotoEncyclopediaofGenesandGenomes京都基因與基因組百科全書數(shù)據(jù)庫簡介系統(tǒng)分析基因功能,聯(lián)系基因組信息和功能信息的知識庫。
KEGG簡介KEGG結(jié)合17個(gè)數(shù)據(jù)庫,三個(gè)大的框架:Systemsinformation,Genomicinformation,Chemicalinformation。KEGG的GENES/SSDB/KO數(shù)據(jù)庫提供關(guān)于在基因組計(jì)劃中發(fā)現(xiàn)的基因和蛋白質(zhì)的相關(guān)知識。KEGGPATHWAY數(shù)據(jù)庫整合當(dāng)前在分子互動(dòng)網(wǎng)絡(luò)(比如通道,聯(lián)合體)的知識。KEGG的COMPOUND/GLYCAN/REACTION數(shù)據(jù)庫提供生化復(fù)合物及反應(yīng)方面的知識。KEGG簡介基因功能聯(lián)系到生物功能的橋梁PATHWAYGENE1GENE2GENE3..生化復(fù)合物反應(yīng)….生物多樣性狀差異……KEGG注釋途徑網(wǎng)絡(luò)提交任務(wù)KAAS(KEGGAutomaticAnnotationServer)
KEGG注釋途徑KEGG注釋結(jié)果BLAST比對結(jié)果根據(jù)比對結(jié)果提取代謝通路圖根據(jù)基因?qū)?yīng)的KO號可以從KEGG官網(wǎng)得到對應(yīng)的PATHWAY圖片KEGG注釋結(jié)果InterproscanInterproscanInterPro是一個(gè)關(guān)于蛋白家族(proteinfamilies),功能保守區(qū)域(domains)和功能位點(diǎn)(funtionalsites)的數(shù)據(jù)庫。該數(shù)據(jù)庫包括了PROSITE,PRINTS,Pfam,ProDom等知名蛋白結(jié)構(gòu)和功能位點(diǎn)及保守域的數(shù)據(jù)庫。Interproscan
GeneOntologyGeneOnotologyConsortium基因本體聯(lián)合會(huì)所建立的數(shù)據(jù)庫。數(shù)據(jù)庫簡介旨在建立一套適用于各種物種的,對基因和蛋白質(zhì)功能進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語義(terms)詞匯標(biāo)準(zhǔn)。GeneOntologyGeneOntology解決生物學(xué)定義混亂的現(xiàn)象,使各種數(shù)據(jù)庫中基因產(chǎn)物功能描述相一致。使得在不同生物數(shù)據(jù)庫中的查詢具有極高的一致性。允許在各種水平查詢基因產(chǎn)物的特性。35GO的分類分子功能(MolecularFunction)描述在個(gè)體分子生物學(xué)上的活性,如催化活性或結(jié)合活性。生物學(xué)過程(BiologicalProcess)由分子功能有序地組成的,具有多個(gè)步驟的一個(gè)過程。細(xì)胞組件(CellularComponent)指基因產(chǎn)物位于何種細(xì)胞器或基因產(chǎn)物組中(如糙面內(nèi)質(zhì)網(wǎng),核糖體,蛋白酶體等),即基因產(chǎn)物在什么地方起作用。GeneOntologyGO注釋功能富集分析第三部分轉(zhuǎn)錄組測序簡介基因功能注釋及注釋庫簡介轉(zhuǎn)錄組測序分析流程轉(zhuǎn)錄組測序分析流程轉(zhuǎn)錄組測序的實(shí)驗(yàn)與測序原理轉(zhuǎn)錄組數(shù)據(jù)分析流程及軟件轉(zhuǎn)錄組實(shí)驗(yàn)與測序原理mRNA的提取通過成熟mRNA的polyA結(jié)構(gòu)提取組織樣品的表達(dá)mRNA。反轉(zhuǎn)錄為cDNA通過利用反轉(zhuǎn)錄酶合成對應(yīng)mRNA的cDNA雙端測序?qū)DNA片段隨機(jī)打碎,采用高通量測序儀進(jìn)行Pair-End測序。雙端測序cDNA片段化Solexa雙端測序產(chǎn)生數(shù)據(jù)類型成對Reads轉(zhuǎn)錄組數(shù)據(jù)分析流程Solexa原始數(shù)據(jù)轉(zhuǎn)錄組分析流程分析結(jié)果轉(zhuǎn)錄組分析的兩種策略左邊是先比對,再通過表達(dá)量和junction信息得到轉(zhuǎn)錄本,這種方法能夠檢測到低表達(dá)量的轉(zhuǎn)錄本;右邊是對mRNA-seq的reads直接進(jìn)行denovo組裝,得到轉(zhuǎn)錄本,但對于低表達(dá)量的轉(zhuǎn)錄本不易發(fā)現(xiàn)。轉(zhuǎn)錄組分析的兩種策略有Reference的轉(zhuǎn)錄組分析以比對為基礎(chǔ),分析有基因組的樣品的可變剪接信息,以及預(yù)測可變剪接帶來的功能差異,同時(shí)定量不同樣品的mRNA表達(dá)豐度進(jìn)行差異基因的相關(guān)分析。無Reference的轉(zhuǎn)錄組分析通過測序數(shù)據(jù)組裝大規(guī)模發(fā)掘?qū)?yīng)物種的轉(zhuǎn)錄本信息,對組裝得到轉(zhuǎn)錄本做功能注釋分析,同時(shí)定量轉(zhuǎn)錄本的不同豐度進(jìn)行差異分析。兩種分析思路原始數(shù)據(jù)Reference基因組Gff基因結(jié)構(gòu)注釋差異基因分析及功能注釋分析有參考基因組無參考基因組聚類得到UnigeneUnigene的差異表達(dá)及功能注釋分析可變剪接結(jié)果可變剪接作圖TopHat+Cufflinks的可變剪接分析測序數(shù)據(jù)組裝差異基因聚類分析差異基因功能注釋結(jié)構(gòu)預(yù)測分析差異基因聚類分析差異基因功能注釋有參考基因組分析可變剪接根據(jù)軟件對基因可變剪接結(jié)果做預(yù)測結(jié)合相關(guān)基因的功能進(jìn)行深入的研究(性狀相關(guān)..)原始數(shù)據(jù)Reference基因組Gff基因結(jié)構(gòu)注釋TopHat+Cufflinks的可變剪接分析可變剪接簡介一個(gè)基因在轉(zhuǎn)錄過程中經(jīng)過不同的剪接處理得到不同的mRNA從而產(chǎn)生不同的蛋白,是生物性狀多樣化的重要原因??勺兗艚宇愋屯怙@子跳過內(nèi)含子滯留互斥外顯子可變5’剪接可變3’剪接保守剪接類型可變剪接分析軟件TopHat針對高通量RNA_Seq的序列剪接檢測軟件,采用短序列比對軟件Bowtie進(jìn)行序列比對和剪接檢測。IGVIntegrativeGenomicsViewer,圖形化瀏覽結(jié)果。Cufflinks利用Tophat的檢測結(jié)果和測序Reads的比對情況組裝構(gòu)建轉(zhuǎn)錄本并進(jìn)行表達(dá)分度分析的軟件??勺兗艚臃治鲕浖opHatTopHat使用Bowtie軟件比對,速度快;輸出結(jié)果為sam格式,便于查看瀏覽(IGV)以及后續(xù)分析。官方網(wǎng)站參考文獻(xiàn)TopHat簡介命令及參數(shù)比對建庫命令bowtie-buildRef.faRef.faTopHat命令tophat-r0-GRef.gff-oSam1_tophatRef.faSam1_1.fqSam1_2.fqTopHat結(jié)果結(jié)果目錄accepted_hits.bam比對結(jié)果文件samtoolsviewaccepted_hits.bam|less-Sjunctions.bed剪接結(jié)果列表insertions.bed插入結(jié)果列表deletions.bed缺失結(jié)果列表IGV基因組綜合瀏覽器IGV
CufflinksCufflinks用來組裝轉(zhuǎn)錄本,估計(jì)它們的豐度,并且檢測RNA-Seq樣品中的差異表達(dá)和調(diào)控。官方網(wǎng)站參考文獻(xiàn)Cufflinks簡介Cufflinks命令及參數(shù)cufflinks-GRef.gffaccepted_hits.bam輸出結(jié)果transcripts.gtf組裝轉(zhuǎn)錄本的gtf格式結(jié)果genes.fpkm_tracking基因表達(dá)豐度的評估isoforms.fpkm_tracking轉(zhuǎn)錄本表達(dá)豐度的評估新基因的發(fā)現(xiàn)新的編碼區(qū)域的定位通過比對結(jié)果發(fā)現(xiàn)原本無基因注釋的區(qū)域出現(xiàn)了編碼mRNA的序列新基因的功能注釋分析對新基因的序列做功能注釋無參考基因組分析數(shù)據(jù)的組裝Orf預(yù)測SSR分析通過BLAST做基因功能注釋分析原始數(shù)據(jù)聚類得到Unigene測序數(shù)據(jù)組裝結(jié)構(gòu)預(yù)測分析(SSR、Orf及編碼序列)測序數(shù)據(jù)組裝組裝基本原理基于測序reads之間的overlap進(jìn)行的序列組裝組裝軟件簡介TrinityTransabyssSOAP-TransTrinity簡介TrinityTrinity是一個(gè)組裝構(gòu)建無Reference全長轉(zhuǎn)錄本的組裝軟件,專門針對高通量RNA測序設(shè)計(jì)的,組裝效果較好。官方網(wǎng)站及引用文獻(xiàn)
Trinity原理介紹Trinity右圖是Trinity軟件組裝的簡單原理。a組裝Contigb構(gòu)建
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 存儲(chǔ)場地租賃服務(wù)合同
- 校園保安合同的補(bǔ)充協(xié)議
- 網(wǎng)約租車合同協(xié)議書
- 和合同解協(xié)議
- 光伏項(xiàng)目協(xié)議書合同模板
- 婚前彩禮合同協(xié)議
- 房地產(chǎn)中介合同協(xié)議
- 智慧旅游合同協(xié)議
- 股東投資協(xié)議合同
- 合同出借協(xié)議
- 腎上腺占位的教學(xué)查房課件
- 護(hù)理人員緊急調(diào)配方案課件
- 機(jī)房搬遷服務(wù)投標(biāo)方案(技術(shù)標(biāo))
- 供應(yīng)商選擇細(xì)則:挑選優(yōu)質(zhì)供應(yīng)商的指南
- 銀行跨境人民幣結(jié)算業(yè)務(wù)創(chuàng)新與營銷策略
- 中建人防機(jī)電安裝施工方案
- GB/T 10346-2023白酒檢驗(yàn)規(guī)則和標(biāo)志、包裝、運(yùn)輸、貯存
- 政工師主要工作業(yè)績總結(jié)(二篇)
- 心血管內(nèi)科護(hù)理交接班制度
- 態(tài)度改變與社會(huì)影響(中譯本修正版)
- 常見先心病的超聲診斷演示文稿
評論
0/150
提交評論