




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics基礎(chǔ)分子生物學(xué)期末安排考試時(shí)間:
2009年
1月
12日下午
2:00-4:00考試地點(diǎn):三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)
基因組計(jì)劃基因組(genome)是生物體內(nèi)遺傳信息的集合,是某個(gè)特定物種細(xì)胞內(nèi)全部DNA分子的總和?;蚪M學(xué)(genomics)是指研究并解析生物體整個(gè)基因組的所有遺傳信息的學(xué)科?;蚪M計(jì)劃(GenomeProject)是指對(duì)人類以及其它生物體全基因組的測(cè)序工作(sequencing)。人類基因組計(jì)劃(HumanGenomeProject,HGP):90年代提出并已基本完成,同40年代原子彈爆炸,60年代人類登月一起被認(rèn)為是二十世紀(jì)科技發(fā)展史上的三大創(chuàng)舉。Publiceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:
基因組DNA大片段文庫的構(gòu)建
YAC(yeastartificialchromosome,酵母人工染色體):含有三種必需成分:著絲粒、端粒和復(fù)制起點(diǎn)。是迄今容量最大的克隆載體,插入片段平均長度為200-1000Kbp,最大的可以達(dá)到2Mbp。BAC(Bacterialartificialchromosome),用細(xì)菌的F質(zhì)粒及其調(diào)控基因構(gòu)建了細(xì)菌染色體克隆載體,其克隆能力在125~150Kbp左右。以BAC為基礎(chǔ)的克隆載體形成嵌合體的頻率較低,轉(zhuǎn)化效率高,而且以環(huán)狀結(jié)構(gòu)存在于細(xì)菌體內(nèi),易于分辨和分離純化,已被科學(xué)界廣泛接受。BAC的構(gòu)建pBAC108L來自細(xì)菌的一個(gè)小型F質(zhì)粒,其中oriS和repE控制了質(zhì)粒的復(fù)制起始,parB和parA控制了拷貝數(shù)。100-150KbpinsertionDNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)記是RFLP(RestrictionFragmentLengthPolymorphism)。DNA序列上的微小變化,甚至1個(gè)核苷酸的變化,也能引起限制性內(nèi)切酶切點(diǎn)的丟失或產(chǎn)生,導(dǎo)致酶切片段長度的變化。第二代DNA遺傳標(biāo)記SSLP(SimpleSeqeuceLengthPolymorphism)利用了存在于人類基因組中的大量重復(fù)序列,包括重復(fù)單位長度在15-65個(gè)核苷酸左右的小衛(wèi)星DNA(minisatelliteDNA),重復(fù)單位長度在2-6個(gè)核苷酸之間的微衛(wèi)星DNA(microsatelliteDNA)。第三代DNA遺傳標(biāo)記SNP
(singlenucleotidepolymorphism),也是最廣泛的遺傳標(biāo)記,是分散于基因組中的單個(gè)堿基的差異。這種差異包括單個(gè)堿基的缺失和插入,但更常見的是單個(gè)核苷酸的替換,即單核苷酸的多態(tài)性。到目前為止已經(jīng)在人類基因組發(fā)現(xiàn)了超過1000萬個(gè)SNP位點(diǎn),平均每300bp中就有一個(gè)SNP!RFLPmarkerSSLPmarkersWTmutSNPmarker鳥槍法序列測(cè)定技術(shù)全基因組鳥槍法測(cè)序(shotgunsequencing)技術(shù):隨機(jī)挑選帶有基因組DNA的質(zhì)粒進(jìn)行末端序列測(cè)定,然后用計(jì)算機(jī)程序進(jìn)行序列拼接。鳥槍法測(cè)序的主要缺點(diǎn)是,隨著所測(cè)基因組總量增大,所需測(cè)序的片段大量增加;其次,高等真核生物(如人類)基因組中有大量重復(fù)序列,導(dǎo)致判斷失誤DNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencing大規(guī)模DNA序列拼接
DNA序列拼接問題與組合數(shù)學(xué)中的最短超串問題相似。最短超串問題即給定一個(gè)字符串的集合,找出一最短的字符串稱為超串,并將集合中的任何一元素作為其子串。PopularAssemblersTIGRAssembler(TIGR)Phrap(WashU)CeleraAssembler(Celera,TIGR)Arachne(MITBroad)Phusion(Sanger–usesPhrap)Atlas(BaylorHGSC)AssemblyoftheIndividualSequencesKeepaddingindividualsequencingreadstobuildlargerandfewercontigsAssemblyoftheIndividualSequencesEventuallyallsequencingreads
mergetoasingleconsensussequence(alargecontig)foreachchromosome.鳥槍法測(cè)序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列
高通量DNA序列分析技術(shù)
人類基因組計(jì)劃的成功很大程度上得益于有效減少DNA測(cè)序成本的技術(shù)更新。通過改良測(cè)序方法,不斷提升其自動(dòng)化程度,DNA測(cè)序的成本降低了100倍,從20世紀(jì)70-80年代$10/bp降低到本世紀(jì)初$0.1/bp!如果一個(gè)熟練的DNA序列分析人員采取早期80年代方法每天測(cè)定1000bp計(jì)算,人類基因組(約3×109bp)的全序列分析,至少也得需要100名這樣的工人花上100年的時(shí)間才能完成。而2000年代的高通量測(cè)序儀可達(dá)到月測(cè)序1-6Mbp!目前???$2/1Mbp3Gbp/machine/dayDNAsequencingtechnologies
?“Classical” –Sangerdideoxysequencing?“NextGeneration”,commercialized
–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation?Singlemolecule(tetheredDNApolymerase)
–Heliscope(cyclicalbaseaddition) –VisiGen(realtime,FRET-based)Illumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runRoche/454:GenomeSequencerFLXRealTimeSequencingbySynthesisChemiluminescencedetectioninpicotiterplatesAmplification:emulsionPCRPyrosequencingupto400,000reads/runonaverage250bases/readupto100Mb/runRoche/454GenomeSequencerFLX100Mb/runPyrosequencing---454SequencingGenomesequencinginmicrofabricatedhigh-densitypicolitrereactorsMargulies,M.Eghold,M.etal.Nature.2005Sep15;437(7057):326-7AsectionofPyrosequencingreadsIllumina/Solexa:GeneticAnalyzerRealTimeSequencingbySynthesisClonalSingleMoleculeArrayAmplification:bridgingPCR60millionreads/runupto50bases/read2Gb/run8channels,app.5mioreads/channelFluorescentlabelsReversible3‘OHblockingIllumina/SolexaGeneticAnalyzer2000Mb/runReversibleterminator-basedsequencing(Solexa)FragmentDNAandligateadaptorsComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencingreversibleterminatorsCost$$$$to$$$$$$$$$$$AccuracyConsensus99.99%Singleread>99.5%;Consensus>99.99%?AssemblyBestBetterBadGapClosureandFinishingToughTougherPossible?RealTimeSequencingbyLigationEmulsionPCRandBeadsonslides85millionreads/runUpto35bases/read3Gb/rundualfluorescentlabels8individualchannels/flowcell2flowcells/runAppliedBiosystemsSOLiD3000Mb/runOligonucleotide
Ligation&Detection(SOLiD)SOLiD:Substrateattachment;dibaseprobesMakesequencinglibrarybyshearingandadapterligationAttachDNAfragmentstobeadsandamplifypoloniesinemulsionAttachbeadstoslideSOLiD:SequencingligationcyclesSOLiD:DataCollectionandImageAnalysisSOLiD:DecodingthesequenceMardis2008Comparisonof“NextGeneration”SequencingTechnologiesApplicationsGeneticAnalyzerSingleMolecule
SequencingTechnologies:onthehorizon
?ArrayoftetheredDNApolymerasemolecules?Boundtotemplatestrand+primer?Heliscope –Cyclicalbaseaddition(similartoSolexa)?VisiGen –Realtime,imagingFRETflashes –Hopefulprediction:1Mb/sec“NextGeneration”Sequencing
Technologies:RateLimitingFactors
?Frontend:Makingthesequencinglibrary?Backend:Bioinformaticstomakesenseof
the“sequencetsunami”---essemblyWhatdowesequence?denovogenomesequencinggenomeresequencing(SNPidentification)metagenomesorcomplexsamplestranscriptomeprofilingsmallRNAidentification(applications)ExamplesofApplicationsof“NextGeneration”SequencingTechnologiesBestfor“re-sequencing”,i.e.,aligninggeneratedsequencetoareferencegenomeNextgenerationDNAtechnologiesmayreplacemicroarraysforsomeapplicationsShendure&Ji2008The“$10,000humangenomesequencing”prize?Tothefirstteamthatcanbuildadeviceanduseittosequence:–100humangenomeswithin10daysorless,–Accuracy:atmost1errorper100,000bases,–Accuratecoverageofatleast98%ofthegenome,–Recurringcostofnomorethan$10,000(US)pergenome.?Prize:$10million?Deadline:12:01AMPST,October4,2013.?Donors:XFoundation,J.CraigVenterFoundationHumanHapMapProjectHapMap的構(gòu)建分為三個(gè)步驟:(a)在多個(gè)個(gè)體的DNA樣品中鑒定單核苷酸多態(tài)性(SNPs);(b)將群體中頻率大于1%的那些共同遺傳的相鄰SNPs組合成單體型;(c)在單體型中找出用于識(shí)別這些單體型的標(biāo)簽SNPs。通過對(duì)圖中的三個(gè)標(biāo)簽SNPs進(jìn)行基因分型,可以確定每個(gè)個(gè)體擁有哪一個(gè)單體型。SCIENCE315:1781(30MARCH2007)Metagenomesor
complexsamples轉(zhuǎn)錄圖(transcriptprofiling)
基因轉(zhuǎn)錄圖(cDNA圖),或者基因的cDNA片段圖,即表達(dá)序列標(biāo)簽圖(EST,expressedsequencetag),是基因組圖的重要組成部分。大規(guī)模生產(chǎn)EST的主要程序如下:分離特定組織在某一發(fā)展階段或某種生理?xiàng)l件下的總mRNA,合成雙鏈cDNA,克隆到plasmid中并進(jìn)行兩端測(cè)序。PyrosequencingProvidesEvidenceforNovelTranscriptsandTranscriptArchitecture
smallRNAidentification
(i.e.microRNA)到2006年底已完成的基因組項(xiàng)目()
根據(jù)2007年1月的數(shù)據(jù),全球已啟動(dòng)2296個(gè)基因組項(xiàng)目,其中607個(gè)項(xiàng)目已經(jīng)完成,已經(jīng)公開發(fā)表481個(gè)基因組序列,包括403個(gè)細(xì)菌基因組,33個(gè)古細(xì)菌基因組和45個(gè)真核生物基因組。其它基因組計(jì)劃到2006年12月全世界主要基因組計(jì)劃的進(jìn)展情況
Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocomparethegenecontentofoneorganismtoanotherorganism.Tostudygene/genomeevolution.Tostudyorganismalevolution.Asafoundationforfutureexperimentation.不同模式生物基因組的比較物種基因組大小估計(jì)基因數(shù)尿殖道支原體
Mycoplasmagenitalium580Kb467肺炎支原體
Mycoplasmapneumoniae816Kb677流感嗜血桿菌
Haemophilusinfluenzae1.8Mb1709枯草芽孢桿菌
Bacillussubtilis4.2Mb4100大腸桿菌
Escherichiacoli4.6Mb4288釀酒酵母
Saccharomycescerevisiae13Mb6275線蟲
Caenorhabditiselegans100Mb18891擬南芥
Arabidopsisthaliana125Mb25498果蠅
Drosophilamelanogaster165Mb14113人類
Homosapiens3Gb約2.5萬比較基因組學(xué)(Comparativegenomics)比較基因組學(xué)的威力在于它能根據(jù)對(duì)一種生物相關(guān)基因的認(rèn)識(shí)來理解、詮釋甚至克隆分離另一種生物的基因。遠(yuǎn)緣基因組間的比較為認(rèn)識(shí)生物學(xué)機(jī)制的普遍性,尋找研究復(fù)雜生理和病理過程所需的實(shí)驗(yàn)?zāi)P吞峁┝死碚撘罁?jù),而近緣基因組間的比較則為認(rèn)識(shí)基因結(jié)構(gòu)與功能等細(xì)節(jié)提供了參數(shù)。物種名基因數(shù)目轉(zhuǎn)錄因子數(shù)量比例擬南芥約2938815335.9酵母約58852093.5線蟲約188916693.5果蠅約133796354.5FunctionalCategoriesinEukaryoticProteomesApplicationstoMedicineAkeyapplicationofhumangenomeresearchistofinddiseasegenesbypositionalcloningThismethodinvolvesmappingthechromosomalregioncontainingthegenebylinkageanalysisinaffectedfamiliesThehumangenomicse
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 業(yè)務(wù)打包合同標(biāo)準(zhǔn)文本
- 使用責(zé)任安全合同標(biāo)準(zhǔn)文本
- 債勸轉(zhuǎn)讓合同標(biāo)準(zhǔn)文本
- 代租車協(xié)議合同樣本
- 光伏售后合同標(biāo)準(zhǔn)文本
- 供購合同標(biāo)準(zhǔn)文本
- 產(chǎn)品長期采購合同標(biāo)準(zhǔn)文本
- led買賣合同范例
- 停產(chǎn)香水購買合同標(biāo)準(zhǔn)文本
- 公司授信合同標(biāo)準(zhǔn)文本
- 2024-2025學(xué)年高中化學(xué) 主題5 生物資源 農(nóng)產(chǎn)品的化學(xué)加工 課題1 由大豆能制得什么教學(xué)實(shí)錄 魯科版選修2
- 2025年浙江義烏中國小商品城進(jìn)出口有限公司招聘筆試參考題庫附帶答案詳解
- 蘇軾詩文整合復(fù)習(xí)
- 新形勢(shì)下耕地保護(hù)的新挑戰(zhàn)與對(duì)策
- 2025年國家核安保技術(shù)中心招考聘用24人自考難、易點(diǎn)模擬試卷(共500題附帶答案詳解)
- 人要有自信+課件-+2024-2025學(xué)年統(tǒng)編版道德與法治七年級(jí)下冊(cè)
- 標(biāo)準(zhǔn)工時(shí)統(tǒng)一表格(模板)
- (二調(diào))武漢市2025屆高中畢業(yè)生二月調(diào)研考試 歷史試卷
- 二年級(jí)口算題庫大全100道
- 2024年河北互通高速公路發(fā)展集團(tuán)有限公司招聘考試真題
- 銀行品牌塑造策略
評(píng)論
0/150
提交評(píng)論