華大基因講座_第1頁(yè)
華大基因講座_第2頁(yè)
華大基因講座_第3頁(yè)
華大基因講座_第4頁(yè)
華大基因講座_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于新一代測(cè)序技術(shù)的基于新一代測(cè)序技術(shù)的基因組學(xué)研究和系統(tǒng)基因組學(xué)研究和系統(tǒng)育種策略育種策略許姣卉 博士華大基因研究院 科研合作總監(jiān)技術(shù)是科學(xué)發(fā)現(xiàn)與產(chǎn)業(yè)發(fā)展的源動(dòng)力技術(shù)是科學(xué)發(fā)現(xiàn)與產(chǎn)業(yè)發(fā)展的源動(dòng)力1950196019701980199020002010測(cè)序技術(shù)的跨躍式發(fā)展進(jìn)程測(cè)序技術(shù)的跨躍式發(fā)展進(jìn)程 Discovery of DNA structure(1953)Development of Sanger Sequencing(1977)Invention of Automated FluorescentSequencer(1985)Invention of CapillarySequence

2、r(1996)Invention of Applied BiosystemsSolid System(2007)Invention of Illumina Genome Analyzer System(2006)Invention of 454 GS 20 Sequencer(2005)Illumina Solexa FlowcellFlowcellA flowcell contains eight lanes Lane 1Lane 8Each lane contains multiple tiles total 100Each tile is imaged four times per cy

3、cle one image per baseImage from 1 tile焦磷酸測(cè)序焦磷酸測(cè)序邊合成邊測(cè)序邊合成邊測(cè)序邊連接邊測(cè)序邊連接邊測(cè)序1999200020012001200220082010CPU速度(每秒)十億次百億次千億次千億次七千億次十萬(wàn)億次存儲(chǔ)能力8G1T3T10T30T670T1P百萬(wàn)億次日新月異的生物信息日新月異的生物信息技術(shù)技術(shù) 堿基產(chǎn)量和測(cè)序成本反向曲線堿基產(chǎn)量和測(cè)序成本反向曲線項(xiàng)目項(xiàng)目基因組大小基因組大小 花費(fèi)時(shí)間花費(fèi)時(shí)間 總體費(fèi)用總體費(fèi)用 單堿基費(fèi)用單堿基費(fèi)用 測(cè)序策略測(cè)序策略測(cè)序技術(shù)測(cè)序技術(shù)人類基因組3G10年30億美元1美元BTBSanger水稻基因組400

4、M2年4000萬(wàn)RMB0.1元RMBWGSSanger家蠶基因組400M2年4000萬(wàn)RMB0.1元RMBWGSSanger黃瓜基因組360M18個(gè)月1500萬(wàn)RMB 0.04元RMBWGSSolexa+Sanger藻苔基因組900M6個(gè)月1800萬(wàn)RMB 0.02元RMBWGSSolexa+Sanger測(cè)序時(shí)間、費(fèi)用的變化測(cè)序時(shí)間、費(fèi)用的變化NCBI數(shù)據(jù)的變化新一代測(cè)序技術(shù)正在形成新的產(chǎn)業(yè)革命新一代測(cè)序技術(shù)正在形成新的產(chǎn)業(yè)革命傳統(tǒng)分子育種的兩條思路傳統(tǒng)分子育種的兩條思路種質(zhì)資源基因工程育種分子標(biāo)記輔助育種尋找分子標(biāo)記尋找功能基因新的系統(tǒng)育種策略新的系統(tǒng)育種策略種質(zhì)資源重測(cè)序種質(zhì)資源重測(cè)序數(shù)字

5、表達(dá)譜數(shù)字表達(dá)譜比較基因組學(xué)比較基因組學(xué)連鎖不平衡做圖連鎖不平衡做圖連鎖分析連鎖分析突變體庫(kù)突變體庫(kù)遺傳轉(zhuǎn)化遺傳轉(zhuǎn)化核心核心gene set100-1000基因組測(cè)序基因組測(cè)序新品種新品種種質(zhì)資源種質(zhì)資源Gene Test Kits選擇效率 1000 x育種時(shí)間 1/2-1/3 Traditional finding method The method on re-sequencing部分案例中國(guó)農(nóng)業(yè)科學(xué)院蔬菜花卉研究所 Institute of Vegetables and FlowersChinese Academy of Agricultural SciencesWork Plan151

6、 全基因組從頭測(cè)序的應(yīng)用全基因組從頭測(cè)序的應(yīng)用How? BAC to BAC WGS組裝質(zhì)量組裝質(zhì)量? 測(cè)序序列長(zhǎng)度測(cè)序序列長(zhǎng)度 構(gòu)建片段長(zhǎng)度構(gòu)建片段長(zhǎng)度 測(cè)序深度測(cè)序深度三個(gè)階段三個(gè)階段 基因組調(diào)查基因組調(diào)查 (repeats, GC%, gene distributions) 框架圖框架圖 (contig 5kb, scaffold 20Kb, single base error rate 20Kb, scaffold 300Kb,single base error rate 1 Kb)De NovoRNA-seq 快速獲得參考基因庫(kù)快速獲得參考基因庫(kù)Example IIInsect Ge

7、nome Size 16G or 6G without ReferenceSequence Data: 10G raw dataAssembly Results:More than 15,000 Scaffolds (L1k) ( more than 15,000 genes identified)De Novo更多深層次的應(yīng)用領(lǐng)域更多深層次的應(yīng)用領(lǐng)域轉(zhuǎn)錄本結(jié)構(gòu)研究轉(zhuǎn)錄本結(jié)構(gòu)研究 UTR鑒定;Intron邊界鑒定;可變剪接研究;Start codon鑒定;RNA編輯研究;基因融合的發(fā)現(xiàn)等;非編碼區(qū)域研究非編碼區(qū)域研究基因轉(zhuǎn)錄水平研究基因轉(zhuǎn)錄水平研究 基因表達(dá)差異;進(jìn)化分析等全新轉(zhuǎn)錄區(qū)域研究全新

8、轉(zhuǎn)錄區(qū)域研究In referenceExample IRice TranscriptomeGenome Size 400 Mb with ReferenceData:10Gb/sample(two samples)Result:For 27,655 high covered genes, 8923 genes re-defined , include 11,208 new exons,9,784 introns and 3,186 exon skipping events.A schematic representation of cancer-specific alternative gen

9、e splicing. PLoS ONE. 2009; 4(3): e4732. 應(yīng)用舉例應(yīng)用舉例Transcriptome size estimation on rice4 數(shù)字表達(dá)譜(數(shù)字表達(dá)譜(DGE)用測(cè)序取代芯片的技術(shù)革命用測(cè)序取代芯片的技術(shù)革命基因表達(dá)研究進(jìn)入數(shù)字時(shí)代基因表達(dá)研究進(jìn)入數(shù)字時(shí)代mRNA產(chǎn)生標(biāo)簽產(chǎn)生標(biāo)簽CATGGCTGAAGTCAAGGATGTCATGGAAGGCAATCCCACATACATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGGTTGAATCTGAAACCCTCATGGTTGAATCTGAAACCCTCATGGCTGAA

10、TCTGAGGCTCTCATGGCTGAATCTGAGGCTCTCATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGCTGAAGTCAAGGATGTCATGGCTGAAGTCAAGGATGT測(cè)序測(cè)序CATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGGTTGAATCTGAAACCCT CATGGTTGAATCTGAAACCCTCATGGAAGGCA

11、ATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATA表達(dá)量檢測(cè)表達(dá)量檢測(cè)geneAgeneBgeneCgeneD4280geneAgeneBgeneCgeneD比對(duì)比對(duì)DGE的基本原理的基本原理通量高通量高1 1次實(shí)驗(yàn)即可得到足夠數(shù)據(jù)次實(shí)驗(yàn)即可得到足夠數(shù)據(jù)Total Tag Number% of genes identified2M4M

12、6M8M0100604080020基本特點(diǎn)數(shù)字信號(hào)數(shù)字信號(hào)CATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGCTAGAAAACATTTAATACATGGTTGAATCTGAAACCCT CATGGTTGAATCTGAAACCCTCATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCACATACATGGAAGGCAATCCCAC

13、ATACATGGAAGGCAATCCCACATA428Tags表達(dá)量表達(dá)量可重復(fù)性高可重復(fù)性高Gene Expression (vec_2)020000400006000080000600004000080000200000Gene Expression (vec_1)Spearman r=0.99 pearson r=1100000100000基本特點(diǎn)測(cè)量準(zhǔn)確度高測(cè)量準(zhǔn)確度高Solexa analysisReal time qPCR analysis獨(dú)特優(yōu)勢(shì)檢測(cè)低豐度基因檢測(cè)低豐度基因t Hoen, P.A.C. et al. Nucl. Acids Res. 2008.36:e141Med

14、ian expression levelOnly detectedby DGEDetected byDGE and array低豐度基因具有重要生物學(xué)功能低豐度基因具有重要生物學(xué)功能獨(dú)特優(yōu)勢(shì)檢測(cè)新轉(zhuǎn)錄本檢測(cè)新轉(zhuǎn)錄本100K200K300K400K500K600K700KChromosome 9獨(dú)特優(yōu)勢(shì)檢測(cè)反義鏈轉(zhuǎn)錄本檢測(cè)反義鏈轉(zhuǎn)錄本人人小鼠小鼠sense-antisenseonly sensesense-antisenseonly sense獨(dú)特優(yōu)勢(shì) 特特 點(diǎn)點(diǎn)數(shù)字表達(dá)數(shù)字表達(dá)譜譜芯芯 片片數(shù)字化信號(hào)數(shù)字化信號(hào)高通量高通量可重復(fù)性可重復(fù)性檢測(cè)檢測(cè)低豐度基因低豐度基因檢測(cè)檢測(cè)新新轉(zhuǎn)錄轉(zhuǎn)錄本本檢測(cè)

15、檢測(cè)反反義鏈轉(zhuǎn)錄義鏈轉(zhuǎn)錄本本實(shí)時(shí)實(shí)時(shí)更新性更新性數(shù)字表達(dá)譜與芯片的比較數(shù)字表達(dá)譜與芯片的比較分析內(nèi)容分析內(nèi)容差異表達(dá)基因篩選差異表達(dá)基因篩選PathwayPathway顯著性富集分析顯著性富集分析Clean TagClean Tag數(shù)據(jù)數(shù)據(jù)GOGO功能顯著性富集分析功能顯著性富集分析測(cè)序飽和度分析測(cè)序飽和度分析表達(dá)模式聚類分析表達(dá)模式聚類分析基因注釋、標(biāo)準(zhǔn)化基因注釋、標(biāo)準(zhǔn)化反義鏈的轉(zhuǎn)錄分析反義鏈的轉(zhuǎn)錄分析原始序列數(shù)據(jù)原始序列數(shù)據(jù)共有、特有共有、特有TagTag分析分析表達(dá)量及分布分析表達(dá)量及分布分析實(shí)驗(yàn)重復(fù)性分析實(shí)驗(yàn)重復(fù)性分析新轉(zhuǎn)錄本檢測(cè)新轉(zhuǎn)錄本檢測(cè)蛋白互作網(wǎng)絡(luò)分析蛋白互作網(wǎng)絡(luò)分析表達(dá)模式聚類

16、分析表達(dá)模式聚類分析相互作用網(wǎng)絡(luò)分析相互作用網(wǎng)絡(luò)分析Pathway分析分析GO功能分析功能分析應(yīng)用DGE發(fā)表的部分文章l The digital generation. Nature, 2009, March, Vol 458: 239-240. l Morrissy AS, et al. Next-generation tag sequencing for cancer gene expression profiling. Genome Res. 2009 July, Vol.19, No. 8.l Hegeds Z, et al. Deep sequencing of the zebraf

17、ish transcriptome response to mycobacterium infection. Mol Immunol, 2009 September, Vol.46, No. 15: 2918-30.l Peter A. C. t Hoen et al. Deep sequencing-based expression analysis shows major advances in robustness, resolution and inter-lab portability over five microarray platforms. Nucleic Acids Res

18、earch, 2008, October, Vol. 36, No. 21.我們已完成的DGE項(xiàng)目5 小RNA測(cè)序分析三種主要的小分子RNASmall RNA: a hotpotPublication: ( 1991 May 1st, 2008)siRNA : 15,842 miRNA: 2,641技術(shù)路線De Novo In reference分析內(nèi)容sRNA 與參考序列比與參考序列比對(duì)對(duì)sRNA 與與rRNAetc 的比的比對(duì)對(duì) 包括rRNA,tRNA,snRNA,snoRNA 等non-coding RNAsRNA 與與repeat 的比的比較較 sRNA 與與mRNA/exon/intron 的比的比較較預(yù)測(cè)預(yù)測(cè)新的新的miRNAmiRNA差異表達(dá)分析差異表達(dá)分析 靶基因靶基因預(yù)測(cè)預(yù)測(cè)成功案例Analyze expression profile of paralleled samplesIdentify miRNA marker in the diagnosis of some diseaseSample 1(case)Sample 2(control)Sample Solexa SequencingmiRNA expression profile in different samples元基因組研究(元基因組研究(Metagenomics)www.icugi.o

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論