第十章基因組與比較基因組學(xué)_第1頁
第十章基因組與比較基因組學(xué)_第2頁
第十章基因組與比較基因組學(xué)_第3頁
第十章基因組與比較基因組學(xué)_第4頁
第十章基因組與比較基因組學(xué)_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十章基因組與比較基因組學(xué)第一頁,共五十二頁,編輯于2023年,星期五目錄第一節(jié)

人類基因組計劃第二節(jié)DNA的鳥槍法序列分析技術(shù)第三節(jié)比較基因組學(xué)(Comparativegenomics)及功能基因組學(xué)研究第二頁,共五十二頁,編輯于2023年,星期五20世紀(jì)人類科技發(fā)展史上的三大創(chuàng)舉1940年代第一顆原子彈爆炸;1960年代人類首次登上月球;1990年代提出并基本完成的人類基因組計劃(HumanGenomeProject,HGP)

3DNA雙螺旋結(jié)構(gòu)的發(fā)現(xiàn)者之一、美國國家衛(wèi)生研究院(NIH)人類基因組研究所第一任所長J.D.Watson1990年在《Science》上撰文指出,與人類登月計劃相比,HGP的資金投入少,但它對人類生活的影響卻可能更深遠(yuǎn)。第三頁,共五十二頁,編輯于2023年,星期五4

隨著這個計劃的完成,DNA分子中儲藏的有關(guān)人類生存和繁衍的全部遺傳信息將被破譯,它將不僅幫助我們理解人類如何作為健康人發(fā)揮正常生理功能,還將最終揭開基因在癌癥、早老性癡呆癥、精神分裂癥等嚴(yán)重危害人類健康的疾病中的作用。事實上,對人類自身更深入的了解是人類活動最重要的組成部分,因為任何自然科學(xué)研究,都沒有比人類盡快找出解決自身所面臨的人口膨脹、糧食短缺、環(huán)境污染、疾病危害、能源資源匱乏、生態(tài)平衡破壞、生物物種消亡等一系列難題更為重要、更為迫切。第四頁,共五十二頁,編輯于2023年,星期五51860至1870年奧地利科學(xué)家孟德爾根據(jù)豌豆雜交實驗提出遺傳因子概念,并總結(jié)出孟德爾遺傳定律。1909年丹麥植物學(xué)家和遺傳學(xué)家約翰遜首次提出“基因”這一名詞,用以表達(dá)孟德爾的遺傳因子概念。1944年3位美國科學(xué)家分離出細(xì)菌的DNA(脫氧核糖核酸),并發(fā)現(xiàn)DNA是攜帶生命遺傳物質(zhì)的分子。1953年美國人沃森(Watson)和英國人克里克(Crick)通過實驗提出了DNA分子的雙螺旋模型。1969年科學(xué)家成功分離了第一個基因?;蚣盎蚪M研究大事記:第五頁,共五十二頁,編輯于2023年,星期五61990年10月被譽(yù)為生命科學(xué)“阿波羅登月計劃”的國際人類基因組計劃啟動。1998年一批科學(xué)家在美國羅克威爾(Rockville)組建塞萊拉遺傳公司,與國際人類基因組計劃展開競爭。1998年12月一種小線蟲完整基因組序列的測定工作宣告完成,這是科學(xué)家第一次繪出多細(xì)胞動物的基因組圖譜。1999年9月中國獲準(zhǔn)加入人類基因組計劃,負(fù)責(zé)測定人類基因組全部序列的1%。中國是繼美、英、日、德、法之后第6個國際人類基因組計劃參與過,也是參與這一計劃的唯一發(fā)展中國家。1999年12月1日國際人類基因組計劃聯(lián)合研究小組宣告,完整破譯出人體第22對染色體的遺傳密碼,這是人類首次成功地完成人體染色體完整基因序列的測定。

第六頁,共五十二頁,編輯于2023年,星期五2000年4月6日美國塞萊拉公司宣布破譯出一名實驗者的完整密碼,但遭到不少科學(xué)家的質(zhì)疑。2000年4月底中國科學(xué)家按照國際人類基因組計劃的部署,完成了1%人類基因組的工作框架圖。2000年5月8日德、日等國科學(xué)家宣布,已基本完成了人體第21對染色體的測序工作。2000年6月26日科學(xué)家公布人類基因組工作草圖,標(biāo)志著人類在解讀自身“生命之書”的路上邁出了重要一步。2000年12月14日美英等國科學(xué)家宣布繪出擬南芥基因組的完整圖譜。這是人類首次全部破譯出一種植物的基因序列。2001年2月12日中、美、日、德、法、英6國科學(xué)家和美國塞萊拉公司聯(lián)合公布人類基因組圖譜及初步分析結(jié)果??茖W(xué)家首次公布人類基因組草圖“基本信息”。第七頁,共五十二頁,編輯于2023年,星期五8第八頁,共五十二頁,編輯于2023年,星期五第一節(jié)

人類基因組計劃9第九頁,共五十二頁,編輯于2023年,星期五一、人類基因組計劃的科學(xué)意義二、遺傳圖的繪制三、物理圖(PhysicalMap)四、轉(zhuǎn)錄圖(ExpressionProfiling)五、人類基因組的序列圖(HumanGenomeSequence)第十頁,共五十二頁,編輯于2023年,星期五11第十一頁,共五十二頁,編輯于2023年,星期五基因控制著細(xì)胞中的蛋白質(zhì)合成,控制著生物的各種遺傳性狀?;蚪M是生物體內(nèi)遺傳信息的集合,是某個特定物種細(xì)胞內(nèi)全部DNA分子的總和。人體是一個多細(xì)胞體系,每個細(xì)胞中都包含46條兩兩配對的染色體,每23條染色體構(gòu)成一個染色體組。大約有30億對核苷酸,編碼了5-6萬個基因,人類基因組中攜帶了有關(guān)人類個體生長發(fā)育、生老病死的全部遺傳信息。從整體上看,不同人類個體的基因是相同的,因此,我們說“人類只有一個基因組”,人生來是平等的。當(dāng)然,不同的人可能擁有不同的等位基因,這一點(diǎn)決定了人與人之間個體上的差異。第十二頁,共五十二頁,編輯于2023年,星期五各種遺傳病的發(fā)生,都源于基因的突變。突變是基因在分子結(jié)構(gòu)上的改變,這種DNA分子結(jié)構(gòu)的改變會導(dǎo)致基因功能的異常,從而導(dǎo)致遺傳病。例如人類2號染色體長臂某段DNA分子的改變,就會導(dǎo)致并指畸形的產(chǎn)生。至于一些復(fù)雜的疾病,如高血壓、冠心病、糖尿病、癌等,則可能涉及多個基因的突變。第十三頁,共五十二頁,編輯于2023年,星期五一、人類基因組計劃的科學(xué)意義(1)確定人類基因組中約5萬個編碼基因的序列及其在基因組中的物理位置,研究基因的產(chǎn)物及其功能。

(2)了解轉(zhuǎn)錄和剪接調(diào)控元件的結(jié)構(gòu)與位置,從整個基因組結(jié)構(gòu)的宏觀水平上理解基因轉(zhuǎn)錄與轉(zhuǎn)錄后調(diào)節(jié)。

(3)從整體上了解染色體結(jié)構(gòu),包括各種重復(fù)序列以及非轉(zhuǎn)錄“框架序列”的大小和組織,了解各種不同序列在形成染色體結(jié)構(gòu)、DNA復(fù)制、基因轉(zhuǎn)錄及表達(dá)調(diào)控中的影響與作用。

14第十四頁,共五十二頁,編輯于2023年,星期五15(4)研究空間結(jié)構(gòu)對基因調(diào)節(jié)的作用。有些基因的表達(dá)調(diào)控序列與被調(diào)節(jié)基因從直線距離上看,似乎相距甚遠(yuǎn),但若從整個染色體的空間結(jié)構(gòu)上看則恰恰處于最佳的調(diào)節(jié)位置,因此,有必要從三維空間的角度來研究真核基因的表達(dá)調(diào)控規(guī)律。(5)發(fā)現(xiàn)與DNA復(fù)制、重組等有關(guān)的序列。DNA的忠實復(fù)制保障了遺傳的穩(wěn)定性,正常的重組提供了變異與進(jìn)化的分子基礎(chǔ)。局部DNA的推遲復(fù)制、異常重組等現(xiàn)象則導(dǎo)致疾病或者胚胎不能正常發(fā)育,因此,了解與人類DNA正常復(fù)制和重組有關(guān)的序列及其變化,將對研究人類基因組的遺傳與進(jìn)化提供重要的結(jié)構(gòu)上的依據(jù)。

第十五頁,共五十二頁,編輯于2023年,星期五(6)研究DNA突變、重排和染色體斷裂等,了解疾病的分子機(jī)制,包括遺傳性疾病、易感性疾病、放射性疾病甚至感染性疾病引發(fā)的分子病理學(xué)改變及其進(jìn)程,為這些疾病的診斷、預(yù)防和治療提供理論依據(jù)。(7)確定人類基因組中轉(zhuǎn)座子、逆轉(zhuǎn)座子和病毒殘余序列,研究其周圍序列的性質(zhì)。了解有關(guān)病毒基因組侵染人類基因組后的影響,可能指導(dǎo)人類有效地利用病毒載體進(jìn)行基因治療。

(8)研究染色體和個體之間的多態(tài)性。這些知識可被廣泛用于基因診斷、個體識別、親子鑒定、組織配型、發(fā)育進(jìn)化等許多醫(yī)療、司法和人類學(xué)的研究。此外,這些遺傳信息還有助于研究人類歷史進(jìn)程、人類在地球上的分布與遷移以及人類與其他物種之間的比較。第十六頁,共五十二頁,編輯于2023年,星期五17

此外,工業(yè)基因組學(xué)、環(huán)境基因組學(xué)、藥物基因組學(xué)、疾病基因組學(xué)等分支學(xué)科也在不斷發(fā)展。人類基因組研究包括遺傳圖(GeneticMap)繪制、物理圖(PhysicalMap)構(gòu)建、測序、轉(zhuǎn)錄圖(ExpressionProfiling)繪制和人類基因組的序列圖及基因鑒定等方面的工作。通過多年來的發(fā)展,基因組學(xué)(genomics)作為一門專門學(xué)科,已應(yīng)運(yùn)而生。它涵蓋以下幾個方面:結(jié)構(gòu)基因組學(xué),著重遺傳圖、物理圖、測序等研究功能基因組學(xué),包括以轉(zhuǎn)錄圖為基礎(chǔ)的功能制圖(基因組表達(dá)圖)比較基因組學(xué),包括對不同進(jìn)化階段生物基因組的比較研究,也包括不同人種、族群和群體基因組的比較研究第十七頁,共五十二頁,編輯于2023年,星期五18遺傳圖也稱連鎖圖,是指基因或DNA標(biāo)志在染色體上的相對位置與遺傳距離,后者通常以基因或DNA片段在染色體交換過程中的分離頻率厘摩(cM)來表示。遺傳圖的繪制是人類基因組研究的第一步,即以染色體上某一點(diǎn)為遺傳標(biāo)記,以與之相伴遺傳的特征為對象,經(jīng)連鎖分析,將編碼該特征的基因定位于染色體特定位置。cM值越大,兩者之間距離越遠(yuǎn)。二、遺傳圖的繪制第十八頁,共五十二頁,編輯于2023年,星期五通過遺傳圖分析,我們可以大致了解各個基因或DNA片段之間的相對距離與方向,了解哪個基因更靠近著絲粒,哪個更靠近端粒等。遺傳距離是通過遺傳連鎖分析獲得的,研究中所使用的DNA標(biāo)志越多,越密集,所得到的遺傳連鎖圖的分辨率就越高。經(jīng)典的遺傳標(biāo)記是可被電泳或免疫技術(shù)檢出的蛋白質(zhì)標(biāo)記,如紅細(xì)胞ABO血型位點(diǎn)標(biāo)記,白細(xì)胞HLA位點(diǎn)標(biāo)記等。例如,在ABO血型基因中,位于9號染色體長臂3區(qū)4帶(9q34)的基因IA,決定抗原A的存在,表現(xiàn)A型血性狀。由于ABO血型的廣泛存在,所以可用它作遺傳標(biāo)記。第十九頁,共五十二頁,編輯于2023年,星期五當(dāng)在某一家庭中,觀察到了指甲髕骨綜合征與A型血相伴遺傳時,科學(xué)家就認(rèn)為,這種病的致病基因NP與IA基因相連鎖,也位于9q34區(qū)段。進(jìn)一步的觀察發(fā)現(xiàn),這個家庭的后代中,有1/10為A型血而無指甲髕骨綜合征,這表明基因IA和NP發(fā)生了交換,交換率(重組率)為1/10。這時就可說,基因IA和NP相距較近,連鎖圖上的距離為10厘摩(重組率1%即為1厘摩)。第二十頁,共五十二頁,編輯于2023年,星期五21酵母遺傳分析中最常用的生物化學(xué)標(biāo)簽標(biāo)

簽表

現(xiàn)

型篩

法ADE2培養(yǎng)基中需加入腺苷酸只能在加入腺苷酸的培養(yǎng)基上生長CAN1對刀豆氨酸有抗性能在含有刀豆氨酸的培養(yǎng)基上生長CUP1對銅離子有抗性能在含有銅離子的培養(yǎng)基上生長CYH1對環(huán)己酰亞胺有抗性能在含有環(huán)己酰亞胺的培養(yǎng)基上生長LEU2培養(yǎng)基中需加入亮氨酸只能在加入亮氨酸的培養(yǎng)基上生長SUC2能進(jìn)行蔗糖發(fā)酵能在以蔗糖作為唯一碳源的培養(yǎng)基上生長URA3培養(yǎng)基中需加入尿嘧啶只能在加入尿嘧啶的培養(yǎng)基上生長第二十一頁,共五十二頁,編輯于2023年,星期五22如果只用已知定位的少數(shù)幾個基因作遺傳標(biāo)記,由于遺傳標(biāo)記的數(shù)目太少,很難繪制完整的連鎖圖。DNA技術(shù)的建立為人類提供了大量新的遺傳標(biāo)記。第一代DNA遺傳標(biāo)記是RFLP(RestrictionFragmentLengthPolymorphism,限制性片段長度多態(tài)性)。DNA序列上的微小變化,甚至1個核苷酸的變化,也能引起限制性內(nèi)切酶切點(diǎn)的丟失或產(chǎn)生,導(dǎo)致酶切片段長度的變化。由于核苷酸序列的改變遍及整個基因組,特別是進(jìn)化中選擇壓力不是很大的非編碼序列之中,RFLP的出現(xiàn)頻率遠(yuǎn)遠(yuǎn)超過了經(jīng)典的蛋白質(zhì)多態(tài)性。而且,只要選擇得當(dāng),生物體內(nèi)出現(xiàn)共顯性RFLP及RAPD分子標(biāo)記的頻率較高。第二十二頁,共五十二頁,編輯于2023年,星期五第二代DNA遺傳標(biāo)記利用了存在于人類基因組中的大量重復(fù)序列,包括重復(fù)單位長度在15-65個核苷酸左右的小衛(wèi)星DNA(minisatelliteDNA),重復(fù)單位長度在2-6個核苷酸之間的微衛(wèi)星DNA(microsatelliteDNA),后者又稱為簡短串聯(lián)重復(fù)(STR、STRP或SSLP,shorttandemrepeatpolymorphism或者simplesequencelengthpolymorphism)。STRP有兩個最突出的優(yōu)點(diǎn),即作為遺傳標(biāo)記的“多態(tài)性”與“高頻率”。STR的存在,為遺傳圖的繪制提供了大量可用的遺傳標(biāo)記。采用聚合酶鏈反應(yīng)(PCR)技術(shù),以STR兩側(cè)的基因作定點(diǎn)標(biāo)記的完整連鎖圖,已于1996年繪成,相鄰標(biāo)記間的平均距離僅0.7厘摩。23第二十三頁,共五十二頁,編輯于2023年,星期五第三代DNA遺傳標(biāo)記,可能也是最好的遺傳標(biāo)記,是分散于基因組中的單個堿基的差異。這種差異包括單個堿基的缺失和插入,但更常見的是單個核苷酸的替換,即單核苷酸的多態(tài)性(SNP,singlenucleotidepolymorphism)。

第二十四頁,共五十二頁,編輯于2023年,星期五

“遺傳圖”的建立為人類疾病相關(guān)基因的分離克隆奠定了基礎(chǔ)。擁有5000多個遺傳學(xué)位點(diǎn),相當(dāng)于把整個人類基因組劃分為5000多個小區(qū),并分別設(shè)置了“標(biāo)牌”。這些標(biāo)牌將在搜索功能基因的過程中發(fā)揮獨(dú)特的作用。把多態(tài)性的疾病基因位點(diǎn)(該位點(diǎn)至少包括“正?!奔啊爸虏 眱蓚€等位基因)與上述遺傳標(biāo)記進(jìn)行分析比較時,如果在家系中證實該基因與某個標(biāo)記不連鎖(重組率為50%),表明該基因不在這一標(biāo)記附近;如果發(fā)現(xiàn)該基因與某個標(biāo)記有一定程度的“連鎖”(重組率小于50%但大于0),表明它可能位于這個標(biāo)記附近;如果該基因與某標(biāo)記間不發(fā)生重組(重組率等于0),我們就推測該標(biāo)記與所研究的疾病基因可能非常接近。25第二十五頁,共五十二頁,編輯于2023年,星期五26遺傳圖所表現(xiàn)的,是通過連鎖分析確定的各基因間的相對位置;物理圖則表現(xiàn)染色體上每個DNA片段的實際順序。物理圖是指以已知核苷酸序列的DNA片段(序列標(biāo)簽位點(diǎn),sequence-taggedsite,STS)為“路標(biāo)”,以堿基對(bp,kb,Mb)作為基本測量單位(圖距)的基因組圖。

三、物理圖(PhysicalMap)第二十六頁,共五十二頁,編輯于2023年,星期五現(xiàn)在的測序技術(shù)還不能對整個DNA分子進(jìn)行序列測定,因此須先將它切成一個個大小不同的片段,然后將這些片段連起來,構(gòu)成連續(xù)的序列。切割的工具,是一類限制性內(nèi)切核酸酶,它能識別DNA中的特定序列,并在該位點(diǎn)對DNA鏈進(jìn)行切割。有一類稀有的限制性內(nèi)切核酸酶,由于DNA中這樣的序列比較少,所以用它可將DNA分子切割成約100萬堿基大小的大片斷。這樣的片段有利于排序,不過必須用脈沖場凝膠電泳法,才能將它們分開。第二十七頁,共五十二頁,編輯于2023年,星期五28這些大片段在進(jìn)行DNA分子克隆時,也不能通過細(xì)菌質(zhì)粒或噬菌體的運(yùn)載而在大腸桿菌中進(jìn)行克隆,因為它們太大,而必須用一種特殊的載體--酵母人工染色體(YAC),將片段導(dǎo)入酵母,在酵母細(xì)胞中克隆。YAC中的DNA大片段是靠序列標(biāo)記位標(biāo)(STS)來識別的。STS是一段200~500堿基對的已知序列,在染色體上有一定的位置,所以用STS作位標(biāo)可將不同YAC克隆排列成鄰接克隆群(contig)。

其他載體還有BAC(細(xì)菌人工染色體)、P1(噬菌體人工染色體)、粘粒(cosmid)、細(xì)菌質(zhì)粒等?,F(xiàn)在,人類基因組24條染色體的YAC、BAC、P1鄰接克隆群均已建立,精度約100堿基對的物理圖也基本繪成,并已開始進(jìn)行大規(guī)模測序。第二十八頁,共五十二頁,編輯于2023年,星期五29第二十九頁,共五十二頁,編輯于2023年,星期五30生物的性狀,包括疾病,都由蛋白質(zhì)決定。所有蛋白質(zhì)都是由mRNA(信使核糖核酸)編碼的,而mRNA又由DNA轉(zhuǎn)錄而來。人類基因組中僅1%~5%的DNA是編碼序列(基因);成人各種組織中又只有約10%的基因表達(dá)為蛋白質(zhì)。所以,建立轉(zhuǎn)錄圖,或從mRNA逆轉(zhuǎn)錄而來的cDNA圖,是分離、定位和克隆基因的關(guān)鍵。這里,表達(dá)序列位標(biāo)(EST)具有重要意義。四、轉(zhuǎn)錄圖(ExpressionProfiling)第三十頁,共五十二頁,編輯于2023年,星期五EST是長約100~300堿基對的cDNA片段,是表達(dá)基因的一部分。EST由于序列較短,很難定位,只有篩到較長的基因片段(超過1000堿基對),才能用熒光原位雜交(FISH)法在染色體上定位。

EST可用工業(yè)化的程序生產(chǎn),只要分離到某一發(fā)育階段某一組織的mRNA,就可用逆轉(zhuǎn)錄法,從mRNA合成相應(yīng)的cDNA片段,即EST。用它作探針,就可從基因組文庫中篩到全長的基因序列。截止到1998年2月,已發(fā)現(xiàn)約92萬條EST,轉(zhuǎn)錄圖的制作有了良好的開端,但這已屬后基因組計劃的工作。第三十一頁,共五十二頁,編輯于2023年,星期五32人類基因組的核苷酸序列圖其實是分子水平上最高層次的、最詳盡的物理圖。測定總長約1米、由30億個核苷酸組成的全序列當(dāng)然是人類基因組計劃中最明確、最艱巨的任務(wù)(圖10-10)。因為人類所擁有的基因位點(diǎn)都是相同的,不同種族、不同個體的基因差異(人類基因組的多樣性)以及“正常”與“疾病”基因的差異,只是同一位點(diǎn)上的等位基因的差異,所以,現(xiàn)在的人類基因組全序列來自一個“代表性人類個體”(其所有權(quán)在法律上不屬于任何供體)。

五、

人類基因組的序列圖

(HumanGenomeSequence)第三十二頁,共五十二頁,編輯于2023年,星期五該序列在理論上代表了全人類的基因組信息,事實上也可被用于任何族群、任何個體的基因分析和診斷。人類基因組計劃所提供的這四張圖,特別是人類核酸序列圖,蘊(yùn)藏了決定我們生、老、病、死的所有遺傳信息,必將成為人類認(rèn)識自我、改造自我的用之不絕的知識源泉,為21世紀(jì)現(xiàn)代生物學(xué)和醫(yī)學(xué)的迅速發(fā)展奠定基礎(chǔ)。第三十三頁,共五十二頁,編輯于2023年,星期五DNA的鳥槍法序列分析技術(shù)

第二節(jié)

34第三十四頁,共五十二頁,編輯于2023年,星期五一、基因組DNA大片段文庫的構(gòu)建二、鳥槍法基因組序列分析技術(shù)及其改良第三十五頁,共五十二頁,編輯于2023年,星期五一、基因組DNA大片段文庫的構(gòu)建以YAC克隆為基礎(chǔ)建立的鄰接克隆群,由于DNA片段太大,不適于測序,需另外幾種載體克隆的配合。BAC可運(yùn)載約30萬堿基對的片段,P1可運(yùn)載約10萬堿基對的片段,粘粒可運(yùn)載約4萬~5萬堿基對的片段,細(xì)菌質(zhì)粒則可運(yùn)載約1萬堿基對的DNA片段。這幾類載體的運(yùn)用,使YAC克隆的DNA大片段可先分解成相應(yīng)克隆的小片段,便于測序。第三十六頁,共五十二頁,編輯于2023年,星期五一次測序一般只能測定1000堿基對,然后用已知序列的下游部分合成引物,進(jìn)行另一次測序,如此一步步地“步行”,逐步完成較大片段的測序。因此,需先用質(zhì)粒建立許多克隆,構(gòu)成質(zhì)粒文庫,再對這些質(zhì)??寺∵M(jìn)行測序,然后用電腦搭配成鄰接克隆群。

由于自動化和電腦的應(yīng)用,現(xiàn)在一天已可進(jìn)行10萬個測序反應(yīng)?,F(xiàn)已完成的1.8億堿基對的測序,約占人類基因組的5%~6%。華盛頓大學(xué)、貝勒醫(yī)學(xué)院等機(jī)構(gòu),均已完成幾百萬到幾千萬堿基對的測序,錯誤率僅萬分之一,測序速度和準(zhǔn)確性已大大提高。第三十七頁,共五十二頁,編輯于2023年,星期五38第三十八頁,共五十二頁,編輯于2023年,星期五二、鳥槍法基因組序列分析技術(shù)及其改良第一,建立高度隨機(jī)、插入片段大小為2kb左右的基因組文庫??寺?shù)要達(dá)到一定數(shù)量,即經(jīng)末端測序的克隆片段的堿基總數(shù)應(yīng)達(dá)到基因組5倍以上。第二,高效、大規(guī)模的末端測序。對文庫中每一個克隆,進(jìn)行兩端測序,TIGR在完成流感嗜血桿菌的基因組時,使用了14臺測序儀,用三個月時間完成了必需的28,463個測序反應(yīng),測序總長度達(dá)6倍基因組。

全基因組鳥槍法測序的主要步驟是:第三十九頁,共五十二頁,編輯于2023年,星期五第三,序列集合。TIGR發(fā)展了新的軟件,修改了序列集合規(guī)則以最大限度地排除錯誤的連鎖匹配。第四,填補(bǔ)缺口。有兩種待填補(bǔ)的缺口,一是沒有相應(yīng)模板DNA的物理缺口,二是有模板DNA但未測序的序列缺口。他們建立了插入片段為15-20kb的λ文庫以備缺口填補(bǔ)。第四十頁,共五十二頁,編輯于2023年,星期五41第四十一頁,共五十二頁,編輯于2023年,星期五42

隨著所測基因組總量增大,所需測序的片段大量增加,各個片段重疊或一個連續(xù)體的概率是2n2-2高等真核生物(如人類)基因組中有大量重復(fù)序列,導(dǎo)致判斷失誤。鳥槍法測序的缺點(diǎn)第四十二頁,共五十二頁,編輯于2023年,星期五43第四十三頁,共五十二頁,編輯于2023年,星期五(1)Clonecontig法。首先用稀有內(nèi)切酶把待測基因組降解為數(shù)百kb以上的片段,再分別測序。(2)靶標(biāo)鳥槍法(diretedshotgun)。首先根據(jù)染色體上已知基因和標(biāo)記的位置來確定部分DNA片段的相對位置,再逐步縮小各片段之間的缺口。對鳥槍法的改進(jìn)第四十四頁,共五十二頁,編輯于2023年,星期五45比較基因組學(xué)(Comparativegenomics)及功能基因組學(xué)研究第三節(jié)第四十五頁,共五十二頁,編輯于2023年,星期五一、通過基因組數(shù)據(jù)進(jìn)行全局性分析二、通過基因組數(shù)據(jù)進(jìn)行比較基因組學(xué)研究三、功能基因組學(xué)研究第四十六頁,共五十二頁,編輯于2023年,星期五基因組的序列主要可被分為三類:由于生物在進(jìn)化上是相互關(guān)聯(lián)的,對一種生物的研究可以為其它生物提供有價值的信息。(一)通過比較確知其生理功能的;(二)在數(shù)據(jù)庫中有相匹配的蛋白質(zhì)序列,但并不知道其功能的;(三)在現(xiàn)有數(shù)據(jù)庫中找不到任何相匹配的蛋白質(zhì)序列的新基因。第四十七頁,共五十二頁,編輯于2023年,星期五48

比較基因組學(xué)的威力就在于它能根據(jù)對一種生物相關(guān)基因的認(rèn)識來理解、詮釋甚至克隆分離另一種生物的基因。遠(yuǎn)緣基因組間的比較為認(rèn)識生物學(xué)機(jī)制的普遍性,尋找研究復(fù)雜生理和病理過程所需的實驗?zāi)P吞峁┝死碚撘罁?jù),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論