版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、大規(guī)?;蚪M測序的原理與方法大規(guī)?;蚪M測序的原理與方法胡松年 元素周期表的發(fā)現(xiàn)奠定了二十世紀物理、化學研究和發(fā)展的基礎元素周期表“基因組序列圖”將奠定二十一世紀生命科學研究和生物產(chǎn)業(yè)發(fā)展的基礎! “基因組”-生命科學的“元素周期表”人體解剖圖奠定了現(xiàn)代醫(yī)學發(fā)展的基礎生命的奧秘蘊藏于 “四字天書”之中GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCA TCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCT CCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTC GCTTTCTTGCCGCCACCAT
2、GCCGCCACCGCTTCTTCCtTCTCT基因組學的基礎理論研究基因組學的基礎理論研究基因組學是要揭示下述四種整合體系的相互關系基因組學是要揭示下述四種整合體系的相互關系: 基因組作為信息載體基因組作為信息載體 (堿基對、重復序列的整(堿基對、重復序列的整體守恒與局部不平衡的關系)體守恒與局部不平衡的關系) 基因組作為遺傳物質的整合體基因組作為遺傳物質的整合體 (基因作為功能和基因作為功能和結構單位與遺傳學機制的關系結構單位與遺傳學機制的關系) 基因組作為生物化學分子的整合體基因組作為生物化學分子的整合體 (基因產(chǎn)物作基因產(chǎn)物作為功能分子與分子、細胞機制的關系)為功能分子與分子、細胞機制
3、的關系) 物種進化的整合體物種進化的整合體 (物種在地理與大氣環(huán)境中的物種在地理與大氣環(huán)境中的自然選擇)自然選擇)測序設備的壟斷和高速度換代8199020052020Year2015201020001995Mb1000Mb4000ABI373ABI377ABI3130ABI3730ABI3730 xlGA-I GA-IILess Than 5 yrsHiSeq1000/2000Mb4500ABI3700ABI3700 xlSOLiDSOLiD2SOLiD35500 xl SOLiDABI3130 xlGA-IIx5500 SOLiD測序設備發(fā)展現(xiàn)狀9第一代(穩(wěn)定需求)第一代(穩(wěn)定需求)ABi3
4、130 xL3730 xL3500 xL第三代(即將面市)第三代(即將面市)Helicos BiosciencesHelicos Genetic Analysis System Pacific BiosciencesRSSystem 第二代(高速發(fā)展)第二代(高速發(fā)展)RocheGenome Sequencer FLX System GS Junior System IlluminaGenome Analyzer IIxMiSeqHiSeq 1000HiSeq 2000Life Technologies (ABi)5500 SOLiD System5500 xL SOLiD SystemIon
5、 Torrent PGMDanaherMotionPolonator G.007Complete Genomics無錫艾吉因生物信息技術有限公司無錫艾吉因生物信息技術有限公司AG-100深圳華因康基因科技有限公司深圳華因康基因科技有限公司Pstar-1中科院北京基因組所中科院北京基因組所/ /半導體所半導體所BIGIS-1BIGIS-4反應所需物質:反應所需物質:DNA模板、引物、模板、引物、DNA聚合聚合 酶、酶、dNTP、緩沖液、緩沖液每個循環(huán)包括:每個循環(huán)包括:變性(變性(90)、退火()、退火(54 )、延伸()、延伸(72 )ATGCCGTAGGCCTAGC TAGGCCTAGCTC
6、GGA ATGCCGTAGGCCTAGCTCGGA基因組基因組DNABAC文庫文庫根據(jù)物理圖譜根據(jù)物理圖譜正確定位的正確定位的BAC 或或contig用于霰彈法測用于霰彈法測序的候選克隆序的候選克隆用于霰彈法測序用于霰彈法測序的亞克隆的亞克隆測序并組裝測序并組裝完整的基因完整的基因組序列組序列逐步克隆法(逐步克隆法(Clone by Clone) 全基因組霰彈法全基因組霰彈法 (Whole Genome Shot-gun)基因組基因組DNA 霰彈法克隆霰彈法克隆測序并進行測序并進行全基因組序全基因組序列組裝列組裝完整的基因完整的基因組序列組序列 BAC by BACWhole Genome S
7、hotgun the sequencing of the human genome is likely to be the only large sequencing project carried to completion by the methods described in this issue. Maynard V. Olson , The maps: Clone by clone by clone , Nature 409, 816 - 818 (2001) “WorkingDraft”(90%; 4X)FinishedGenome(99.99%; 8X)Gap1Gap2Chrom
8、osome工作草稿(框架圖)與完成圖BAC by BAC The sequence of the human genomeC. Venter et al.Science 16 Feb. 291: 1304 1351, 2001人類基因組計劃研究的主要成果和進展表現(xiàn)在這人類基因組計劃研究的主要成果和進展表現(xiàn)在這“四張圖四張圖”上上 遺傳圖譜遺傳圖譜 又稱為連鎖圖譜(又稱為連鎖圖譜(linkage maplinkage map),指),指基因或基因或DNADNA標志在染色體上的相對位置標志在染色體上的相對位置與遺傳距離與遺傳距離物理圖譜物理圖譜 以定位的以定位的DNADNA標記序列如標記序列如ST
9、SSTS作為路標,作為路標,以以DNADNA實際長度即實際長度即bp、kb、Mb為圖距的為圖距的基因組圖譜?;蚪M圖譜。轉錄圖譜轉錄圖譜 利用利用EST(expressed sequence tags 表達表達序列標簽)作為標記所構建的分子遺傳序列標簽)作為標記所構建的分子遺傳圖譜圖譜序列圖譜序列圖譜 通過基因組測序得到的,以通過基因組測序得到的,以A A、T T、G G、C C為標記單位的基因組為標記單位的基因組DNADNA序列序列 物理圖譜的構建物理圖譜的構建大片段克隆的篩選大片段克隆的篩選霰彈法測序與霰彈法測序與“工作框架圖工作框架圖”的構建的構建序列的全組裝與序列的全組裝與“完成圖完成
10、圖”構建構建物理圖譜的制作物理圖譜的制作 物理圖譜物理圖譜是以特異的是以特異的DNADNA序列為標志所展示的染色體圖。序列為標志所展示的染色體圖。標志之間的距離或圖距以物理距離如堿基對(標志之間的距離或圖距以物理距離如堿基對(base pairbase pair;bpbp,Kb , Mb)Kb , Mb)表示。最精細的物理圖是核苷酸順序圖,最粗略的物表示。最精細的物理圖是核苷酸順序圖,最粗略的物理圖是染色體組型圖。理圖是染色體組型圖。 STSSTS圖譜圖譜是最基本和最為有用的染色體物理圖譜之一,是最基本和最為有用的染色體物理圖譜之一,STSSTS(Sequence Tagged Site)Se
11、quence Tagged Site)本身是隨機地從人類基因組上選擇本身是隨機地從人類基因組上選擇出來的長度在出來的長度在200200300bp300bp左右的特異性短序列(每個左右的特異性短序列(每個STSSTS在基在基因組中是唯一的,因組中是唯一的,STSSTS圖譜就是以圖譜就是以STSSTS為路標(平均每為路標(平均每100Kb100Kb一一個),將個),將DNADNA克隆片段有序地定位到基因組上??寺∑斡行虻囟ㄎ坏交蚪M上。 STS的來源的來源隨機基因組序列隨機基因組序列表達基因序列,如表達基因序列,如EST遺傳標記序列,如微衛(wèi)星標記遺傳標記序列,如微衛(wèi)星標記有關有關STSSTS的信
12、息可在基因組數(shù)據(jù)庫的信息可在基因組數(shù)據(jù)庫GDBGDB中找到中找到 http:/gdbwww. gdb. orgq確定各確定各STS序列及其序列及其在基因組中的位置在基因組中的位置q大插入片段基因組文大插入片段基因組文庫的構建(庫的構建(BAC文庫文庫)q 以特定以特定STS為標記為標記篩篩 選選并定位克隆并定位克隆q含有含有STS的克隆在基的克隆在基因組中排序因組中排序基因組數(shù)據(jù)庫(GDB)中至少含有24568 個STS路標信息 作為載體的基本要求 能在宿主細胞中進行獨立的復制能在宿主細胞中進行獨立的復制 具有多克隆位點,可插入外源具有多克隆位點,可插入外源 DNADNA片段片段 有合適的篩選
13、標記,如抗藥性有合適的篩選標記,如抗藥性 大小合適,易于分離純化大小合適,易于分離純化 拷貝數(shù)多拷貝數(shù)多 文庫的概念文庫的概念 含有某種生物體全部基因的隨機片段的重組含有某種生物體全部基因的隨機片段的重組DNADNA克隆群體克隆群體 載體:載體:能攜帶外源能攜帶外源DNADNA進入宿主細胞進入宿主細胞的工具,常用的載體有質粒載體、噬的工具,常用的載體有質粒載體、噬菌體載體、細菌人工染色體等菌體載體、細菌人工染色體等宿主:宿主:能容納外源能容納外源DNADNA片段的生物體,片段的生物體,常用的有大腸桿菌、酵母等常用的有大腸桿菌、酵母等NotI、SacI脈沖場凝膠電泳得200Kb左右的大片段DNA
14、 純化后與載體連接 電轉化,將連接產(chǎn)物導入大腸桿菌感受態(tài)細胞插有外源DNA片段的BAC載體在含有氯霉素的固體培養(yǎng)基中培養(yǎng)每一個菌落為帶有相同外源DNA片段的單克隆BAC克隆的篩選克隆的篩選“STS-PCR反反應池應池”方案方案篩篩選種子克隆選種子克隆特定的特定的STS標標記記 相互間具有重疊片段的BAC克隆根據(jù)STS信息組裝成contig,并定位于基因組上Contig每一個菌落為帶有相同外源DNA片段的單克隆Regional mappingRegional mappingMinimal tiling path selected for sequencing.Regional mappingst
15、SG50796stSG50796WI-21858WI-21858WI-20982WI-20982SGC-34652SGC-34652EST325005EST325005Bda37h09Bda37h09sts-N34454sts-N34454stSG-22642stSG-22642stSG22463stSG22463IB262IB262SGC-100057SGC-100057SGC-11218SGC-11218SGC-77734SGC-77734 SGC-12613SGC-12613SGC-79997SGC-79997D3S4170D3S4170WI-13469WI-13469SGC-10474
16、4SGC-104744WI-7400WI-7400SGC-82788SGC-82788sts-N30615sts-N30615SGC-106678SGC-106678WI-3006WI-3006D3S4125D3S4125 stSG31571stSG31571SGC-86097SGC-86097SGC-104738SGC-104738 sts-T03421sts-T03421 stSG81116stSG81116DM1-2b11sDM1-2b11sA004Q43A004Q43WI-10858WI-10858SGC-15279SGC-15279stSG3143stSG3143WI-8499WI-
17、8499 D3S3525D3S3525D3S3630D3S3630 SGC-11976 SGC-11976 WI-6116WI-6116WI-2053WI-2053SGC-84074SGC-84074SGC-77858SGC-77858D3S3706D3S3706SGC-102094SGC-102094 WI-13611WI-13611NRU18-13sNRU18-13sWI-21921WI-21921CHLC.GATA44a05CHLC.GATA44a05D3S1304D3S1304sts-T58150sts-T58150SGC-82964SGC-82964 WI-1341WI-1341D3
18、S3591D3S3591605m01229 e21279b12299n03198p1741l18233p0137i04324k11163m22Beijing CenterMapped on 3p by sequence from other center114k09204c23728k15429p24499n06399k19106b10129j10113l1013f06600o17322f0976o22263j0830m15320c08250a15294h24140b10137g22South centerMapped on 3p by fingerprint from other cente
19、r265o10717m12762o12156h01324k15283k15572b0261i09534j21166f03497i24497i24121d03121d03211k13161d20274o146i21116k05255k15812i02North centerMapped not on 3p by fish1120h22566o1463o01757o1626f1026f10 453a03586c02483g20507d0625c11344o05Mapped not on 3p by fish260k16263p03341o12560g03772p01344l093d22489o22
20、794g03Beijing and South 306h05621c18438g1582o03181f22622p03320k0124b1657d0657d06470 e10STS markers 385a18416n08785a0797c1625f0125f01167p17167p17277d17669 e03194c09Beijing and North210b1795 e11101a04101a0499d1099d10487j12590a20156b21End certified 710 e0410h06508a20508a20173f11173f117m247m24211b19291p
21、2144l1444l14481o07Phase 3Phase 3731 e12731 e12811m11811m11372k09194d21245a0616k1516k15318i14318i14529b1753 e12542k24Mapped not on 3p by sequence from NCBI392m07319i18 454f24238a09238a09264h03157 e16350a17Mapped on 3p by fish673f20453f03489d19194i05? ?Sequenced BACs without mapping information93a0193
22、a01360 e14244g03329a02611h22611h2270b0570b05135 e1674 e04124l0821j2321j23IB1403IB1403SGC-12699SGC-12699sts-F21241sts-F21241WI- 6061WI- 6061stSG16459stSG16459WI-6949WI-6949 stSG15038stSG15038sts-M91858sts-M91858WI-17502WI-17502 WI-7625WI-7625WI-7071WI-7071AB000410AB000410sts-F21841sts-F21841sts-L1540
23、9sts-L15409A004Z22A004Z22stSG31652stSG31652WI-16427WI-16427stSG43815stSG43815A007593A007593WI-11598WI-11598A008O42A008O42D3S4194D3S4194stSG4279stSG4279WI-14394WI-14394sts-N95054sts-N95054stSG32055stSG32055stSG15465stSG15465WI-11041WI-11041stSG47554stSG47554stSG3350stSG3350D3S3589D3S3589SGC-12045SGC-
24、12045D3S1263D3S1263stSG47397stSG47397 SGC-84455SGC-84455 D3S3610D3S3610SGC-10790SGC-10790D3S3691D3S3691A002R42A002R42stSG50845stSG50845stSG2582stSG2582WI-31307WI-31307A004X28A004X28D3S3601D3S3601A001T39A001T39stSG62586stSG62586WI-15608WI-15608sts-H83694sts-H83694stSG47347stSG47347WI-5650WI-5650WI-20
25、823WI-20823202a21 105k13334l221087o20593j10169k17309m10813n2383m12 19 e08 203c04481h17356a0713b04449 e2125o17715i04642 e22298m15224p21267l16407i02488o087f24481b18128a05380o24474f16327h1716m03470i10 398j1558i13424h06325l061016h17134k10299h13220d10220d10126l04900o2218f0358b17 1022p15193k15586c12588p09
26、173m24572m141082a181082a18266 e23275j11270i10270i10333a0234l0634l06ctb-159n23ctb-159n23168l03ctc-237n12ctc-237n12382a21ctc-371o18ctc-371o18126l09163d23AC055767AC055767767c01502k05502k05326o24ctb-140o19ctb-140o19415k13224m20167k17167k17219m19219m19266j06438j01627c01659g04659g04AC007791AC007791263i012
27、63i01596j09996c06338p06338p06606c06606c06ctc-243a06ctc-243a06ctc-371o18ctc-371o18357l2494a1494a14380a2270i1170i11citb-243a06citb-243a06af176815ctb-177n07ctb-177n07115g03115g03109j15781a02412a07412a07429f161020a11ctb-187p01ctb-187p01622i12402p1145b16439f04105h193pterBeijing MapBAC Pooling Protocol 1,
28、152 (plates) X 384 (wells/plate) X 1 (BAC/well) = 442,368 BAC 48X8 (板) X 384 ( 孔/板 ) X 1 ( BAC/孔 ) = 147,456 BAC Each BAC clone contain 150 Kbp human insert 147,456 BAC clones 對全基因組的覆蓋率: 147,456 BAC clones X 150 Kbp = 7.3728 The genome DNA 3,000,000 Kbp 共共48個個每組每組 8 個個每每8個個96孔板組成孔板組成1個個superpool,384
29、個個96孔板組成孔板組成48個個superpools 48 superpools Column poolsColumn pools Row poolsRow pools 1 2 3 4 5 6 7 8 9 10 11 12第八板第八板第二板第二板Plate poolsPlate pools第一板第一板 plate pools,row pools,column pools的構成的構成 1 2 3 4 5 6 7 8 9 10 11 12超級池(超級池(8個個96孔板,孔板,共共768個克?。﹤€克?。┌宄兀ò宄兀?6個克?。﹤€克?。┬谐兀?2個克隆)列池(列池(8個克?。﹤€克隆)大大減少篩選的工作
30、量,降低成本,所得篩選結果準確可靠大大減少篩選的工作量,降低成本,所得篩選結果準確可靠 28 VS 768sheet of superpools, plate pools, row pools, column pools 一一 BAC Screening前前48個樣品為引物個樣品為引物OGG1.51對對superpool(sp)的篩選結果的篩選結果后后48個樣品為引物個樣品為引物OGG1.52對對superpool(sp)的篩選結果的篩選結果 引物引物OGG1.52對應對應sp#27,34,45的的plate,row,column pools的篩選結果的篩選結果BAC clone 確定確定 (
31、+為陽性克隆為陽性克隆) 引物引物OGG1.52的的Colony-PCR STSSTS的密度尚未達到繪制高精度物理圖譜的要求,且在基因組中的分的密度尚未達到繪制高精度物理圖譜的要求,且在基因組中的分布不均勻,造成很多區(qū)域沒有陽性克隆覆蓋布不均勻,造成很多區(qū)域沒有陽性克隆覆蓋, ,形成空洞。因此需用指紋圖形成空洞。因此需用指紋圖譜(譜(FPCFPC法)或末端序列(法)或末端序列(Walking by End Sequence)Walking by End Sequence)步移等手段對種子步移等手段對種子克隆進行延伸,形成連續(xù)克隆群。利用延伸方法篩選得到的克隆稱為延克隆進行延伸,形成連續(xù)克隆群。
32、利用延伸方法篩選得到的克隆稱為延伸克隆。伸克隆。 Contig 1Contig 2重疊序列重疊序列重疊序列重疊序列延伸引物延伸引物篩選到的延伸克隆篩選到的延伸克隆20 kb300 bpMolecular weightmarker every 5th lane- BAC clones 在96深孔 板中培養(yǎng)- Hind III 完全酶切- 1% 瓊脂糖凝膠電泳 指指 紋紋 圖圖 譜譜 法法 (Walking by Fingerprinting database) 挑取靠近空洞的種子克隆,酶切構建其指紋圖譜,在FPC數(shù)據(jù)庫中進行比對,搜索含有此克隆的重疊克隆群信息,從中確定覆蓋空洞區(qū)域的克隆,達到延
33、伸目的。Hind III 完全酶切Hind III 完全酶切FPC數(shù)據(jù)庫數(shù)據(jù)庫中比對中比對Clone AClone BClone CCABcontig搭建中克隆的錯位搭建中克隆的錯位 末端序列步行法末端序列步行法 (Walking by End Sequence) 挑取靠近空洞的種子克隆進行末端測序,然后在基因組數(shù)據(jù)庫中進行比對,確定專一性的序列片段作為新的STS路標。最后設計新路標的PCR引物,按照STSPCR“反應池”方案篩選新的克隆,達到延伸的目的 ??寺】寺?50A18350A18序列輸入序列輸入 end sequence databaseend sequence database的查
34、詢結果的查詢結果四、四、Clone Identification 1、STS-PCR 2、BAC end sequencing 3、Fingerprinting 4、FISH CK2CK1CK2CK113f06267l16481o07250a15204c23340j13對對1515個克隆進行個克隆進行HindIIIHindIII酶切后電泳結果酶切后電泳結果 “工作框架圖工作框架圖”繪制繪制根據(jù)序列與STS database進行blastn比較結果,將克隆定位末端序的比較,判定延伸在contig外的一端序列。并可及時進行walking,篩選新的克隆 霰彈法測序組裝與Finishing工作流程圖工
35、作流程圖 Shotgun Sequencing I :RANDOM PHASEShotgun Sequencing II:ASSEMBLYShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGConsed軟件顯示序列組裝結果界面軟件顯示序列組裝結果界面 1、Filling “intraclone gaps”BAC-453F
36、3s finishingSp6Sp6Sp61kb.Insert size. The size of the clone-insert from which a clone-end pair is taken.Contig. The result of joining an overlapping collection of sequence reads.Scaffold. The result of connecting non-overlapping contigs by using pair-end reads.N50 size. As applied to contigs or scaf
37、folds, that size above which 50% of the assembled sequence can be found.Genome assembly strategyContig assemblyScafffoldingInternal gap closinghttp:/ whole genome sequencing projects Flowchart of the WGS de novo assemblyGenomic DNADNA fragmentation, construct fragmented librariesGenerate sequencing
38、reads using 454 technologySequencing error correctionOutput contigsFill in intra-scaffold gaps and get the final scaffoldsGenomic DNADNA fragmentation, construct paired-end libraries with variant insert sizesGenerate sequencing reads using Illumina GA technologySequencing pre-processOutput contigs a
39、nd mini scaffoldsSolexa part454 partHybrid assembly and scffolding 454 reads processRaw readsKmer evaluationQ20, remove adaptor,trim Sequencing pre-processNewbler assemblyAssembled readsUnassembled readsUnigene coverageKmer evaluationSolexa mappingNr/Nt blastContig statusAssemblyHybrid scaffolding S
40、olexa reads processRaw readsKmer evaluationSequencing pre-processSoap assemblyAssembled readsUnassembled readsUnigene coverageKmer evaluationSolexa mappingNr/Nt blastContig statusAssemblyMapping to 454 contigHybrid scaffoldingCov /Complong readsassemblycontigsshort readsA +C B scaffoldingA +B C scaf
41、foldsFix gapHybrid assemblyESTUnigeneScaf AScaf CScaf BScaf DNew ScafABCDEST based Assembly in short reads of NGS: Constructe BIGer Scaffording Raw sequencing reads pre-processing I Significance and purposeuSequencing library quality controluSequencing bias analysisInherited prosperities on certain
42、second generation sequencerGenome sequencing black hole effectTranscriptome sampling and quantification biasuReady for mapping uReady for de novo assembly Raw sequencing reads pre-processing IISequencing reads numbersDuplicates detection, regional distribution analysis and trimmingAdapter detection
43、and trimmingReads quality analysis and low quality reads filter Average quality density distribution Average quality positional distribution regional distribution F-R correlation GC content-quality correlationInsert length distribution Pipelineraw data pre-processImage analysis and basecallingGOAT p
44、ipeline (OLB1.6), CASAVAQuality Control GERALD Summary.htmFastq and QualitySolexa reads of the Fastq formats_1_1_sequence.txtHWI-EAS724_0001:8:32:374:374#0/1GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG+HWI-EAS724_0001:8:32:374:374#0/1fcfcfggdfggggfggggcggggggggfggg
45、ggcgggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggds_1_2_sequence.txt HWI-EAS724_0001:8:32:374:374#0/2TACCGTTAATAGCAGTAATATCATAATAGTAATAGCATCATAACGGTAGTCCCATAAAAGTGTGTCAGTAGTAGTAGTA+HWI-EAS724_0001:8:32:374:374#0/2ggggfgggggd_adcggggeggfggeggegfgeececdegggggfegcfegggegggfgacacedbd_cYbIllumina 1.3 format
46、encodes a Phred quality score from 0 to 40 using ASCII 64 to 104error probability (p):# for solexa: p = 0.01, Q = 19; p = 0,05, Q = 12.8, p = 0.10, Q = 9.5;# for phred: p = 0.01, Q = 20; p = 0,05, Q = 13, p = 0.10, Q = 10;Data assessment I Read quality distributionLow Quality High Quality Trim: 3 en
47、d trim if QN 30) 60 Assessment: Distance Distrubition between two Low quality (Q20 ? Lane data usage in different solexa library- Fiter duplication readsAverage Reads per StartPointRead CorrectionCorrect Illumina GA short reads Kmer = 17Genome Size Prediction: M = N * ( L-K+1)/L N = Total Length (bp
48、) /Genome sizeL= Average Rads Length (bp)MGenome size estimation using KmerBefore estimating the genome size, we set a hypothesis: the k-mer we picked out from the genome can ergodic the whole genome sequence.According to the Lander waterman algorithm, the algorithm should be represented as: G= Knum / KdepthHere, G is the genome size, Knum is the total number of k-mer and Kdepth is the expected depth of the k-mer.If we obtain the expected depth of k-mer, we can calculate the genome size. Because th
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞務分包合同在建筑行業(yè)的應用
- 初中體育 健美操提高班第2次課教案
- 2024年二年級品生下冊《機智勇敢保安全》教案 山東版
- 2024年學年八年級語文上冊 第四單元 地球我們的家園 第15課《大樹和我們的生活》教案2 滬教版五四制
- 2023三年級數(shù)學上冊 七 慶元旦-時、分、秒的認識 信息窗2 有關時間的計算第1課時教案 青島版六三制
- 2024-2025學年八年級語文下冊 第六單元 22《禮記》二則教案 新人教版
- 2024-2025學年高中數(shù)學 第三章 函數(shù)的概念與性質 3.2.2 奇偶性教案 新人教A版必修第一冊
- 最高額保證合同(2篇)
- 租船合同模版(2篇)
- 運輸項目合同(2篇)
- 商務星球版七年級上冊地理知識點歸納總結
- 四川創(chuàng)聯(lián)專業(yè)技術人員學習-2023數(shù)字經(jīng)濟驅動與發(fā)展公需科目答
- 【環(huán)氧樹脂復合材料研究進展文獻綜述6000字】
- 催審稿郵件怎么寫范文
- 2023《中華人民共和國合同法》
- 悅納自我向陽而生心理健康教育主題班會課件
- DIN-EN-ISO-2409-CN國際標準文檔
- 數(shù)字經(jīng)濟時代“95后”新生代員工管理挑戰(zhàn)、成因及對策分析
- 職業(yè)衛(wèi)生檢測考試真題十五
- Unit+3+Celebrations+Topic+Talk 高中英語北師大版(2019)必修第一冊
- 2023建設工程智慧消防系統(tǒng)技術規(guī)程
評論
0/150
提交評論