




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二節(jié)基因組基因組(genome)
(1922年出現(xiàn)在遺傳學(xué)的文獻中):
一個細胞或病毒所包含的全部基因。通常在真核生物中指一個物種的單倍體染色體組所含有的一整套基因,所以,genome被譯作染色體組,指的是單倍體細胞中所含的整套染色體,但現(xiàn)在基因組這個名詞逐漸替代了染色體組。原核生物一般只有一個環(huán)狀的DNA分子,其上所含有的基因為一個基因組。真核生物細胞中的細胞器如葉綠體、線粒體中的DNA一般也為環(huán)狀,構(gòu)成葉綠體基因組和線粒體基因組
基因組DNA測序的結(jié)果表明基因組中不僅包含著整套基因的編碼序列,同時還包含著大量非編碼序列,即基因之間的序列。這些序列同樣包含著遺傳指令(geneticinstruction)。因此,基因組(應(yīng)該)是整套染色體所包含的DNA分子以及DNA分子所攜帶的全部遺傳指令。Genome:Thetotalcomplementofgenescontainedinacellorvirus;commonlyusedtorefertoallgenespresentinonecompletehaploidsetofchromosomesineukaryotes.
1、基因組的大小與C值悖理基因組的大小一般用堿基對(bp)的數(shù)量來表示。千堿基對表示103個堿基對,英文簡寫1kb.百萬堿基對表示106個堿基對,英文簡寫Mb。大多數(shù)真核生物的基因組都比原核生物的基因組大,比原核生物的基因組復(fù)雜,對病毒、細菌、低等真核生物和高等真核生物的基因組DNA含量的進行測定后,使我們得到這樣一個概念:基因組的大小大致上與進化的復(fù)雜性有關(guān)(見表2—1)基因大小和內(nèi)含子——外顯子結(jié)構(gòu)
細菌基因較小平均lkbp大小上變化不大高等真核生物基因較大平均16kbp且大小變化很大哺乳動物中最小的基因,如人類的—干擾素基因<lkbp與細菌基因相當(dāng),但很多超過100kbpDNA目前發(fā)現(xiàn)的最大基因:人類的肌營養(yǎng)不良蛋白基因,有2500kbp長。高等真核生物基因一般比細菌基因大得多,但從它們中得到的mRNA并不比細菌mRNA大。差異是由內(nèi)含子(introns)引起的:內(nèi)含子是打斷轉(zhuǎn)錄單位的間插序列,必須在RNA水平上去除。轉(zhuǎn)錄單位余下部分通過剪接結(jié)合起來并表達稱為外顯子(exons)?;虼笮∨c基因中外顯子比例成反比。細菌基因一般缺乏內(nèi)含子,100%是外顯子。內(nèi)含子在很多真核微生物中也很少返回表8-3不同真核生物中內(nèi)含子—外顯子的組織。釀酒酵母很少有被打斷的基因,基因長度與mRNA長度一致。高度真核生物基因大小逐步加大,但mRNA大小保持恒定。
一般基因大小與內(nèi)含子數(shù)量成正比例與外顯子含量成反比物種基因平均長度(kbp)平均內(nèi)含子/基因平均mRNA長度%外顯子釀酒酵母1.5>95%不被打斷1.5100線蟲43--4377果蠅113--4325人類166--72.513注:線蟲與果蠅有類似的內(nèi)含子數(shù)量,但內(nèi)含子更小,使基因平均大小要小一些?;驍?shù)目和密度幾種微生物基因組測序計劃已完成。細菌基因數(shù)目變化有一個數(shù)量級:枝原體473個基因粘液球菌大約8000大腸桿菌大約有4400個基因在基因數(shù)目上:最大的細菌基因組與低等真核生物相差不多釀酒酵母有6340個基因果蠅和線蟲:預(yù)計有釀酒酵母兩倍的基因數(shù)量脊椎動物:預(yù)計有大約70000個基因
維持一個獨立生命有機體所需的最小基因數(shù)目是多少?細菌基因組比較發(fā)現(xiàn)了一系列必需生化途徑,并有256個基因編碼其中的成分。真核生物細胞建立復(fù)雜的細胞內(nèi)結(jié)構(gòu)似乎需要更多的途徑多細胞生物調(diào)節(jié)發(fā)育和分化細胞的功能就需要更多。然而關(guān)鍵生化途徑的數(shù)目在所有后生動物中類似,因為脊椎動物中大量基因被認為是通過整個基因組的兩輪重復(fù),加上不同染色體區(qū)域和單個基因的重復(fù)產(chǎn)生的。起初過剩的基因被用于特殊的功能,經(jīng)常是因為表達模式的分化,但途徑是高度保守的。
生物體的單倍體基因組所含DNA總量稱為C值
每種生物各有其特定的C值
不同物種的C值之間有很大差別能營獨立生活的最小的生物——枝原體(Mycoplasma)的C值不到106bp一些顯花植物和兩棲類動物的C值則可多達1011bp,
相差10萬倍。
C值同生物的進化有什么關(guān)系?生物的C值,即基因組的DNA總量是不是隨著生物的進化而相應(yīng)地增加?
圖2—1概括地回答了這兩個問題。2、序列復(fù)雜性(sequencecomplexity)同一類生物中基因組大小相差懸殊,其主要差別在于“多余”(excess)DNA的量的差別?!岸嘤唷盌NA量多,則基因組大;反之,則小。所謂“多余”DNA主要是重復(fù)序列,即這種DNA序列在基因組中可以有不止一個拷貝。不同序列的總長度稱為序列復(fù)雜性或者說:DNA分子中不重復(fù)堿基的總量(用bp來表示)或者說:最長的沒有重復(fù)序列的核苷酸對的數(shù)值例()其總長為160bp,但不重復(fù)的堿基:AT
所以序列復(fù)雜性x=2(bp)
而()序列復(fù)雜性x=4(bp)若一個DNA分子長度為106bp,完全不含重復(fù)順序,則x=106(bp)ATATTATA40ATCGTAGC40由此可見,序列復(fù)雜性的高低反映了序列包括的遺傳信息量的多少。此外,生物體基因組的復(fù)雜程度還表現(xiàn)在基因的外顯子數(shù)目的多寡(見圖5—3)。哺乳動物基因的外顯子數(shù)目遠遠多于其他生物,原核生物的基因基本上沒有外顯子和內(nèi)含子之分。外顯子數(shù)目多表現(xiàn)在RNA剪接時可以有更多種剪接方式,一個基因可以產(chǎn)生更多種的RNA,編碼更多種蛋白質(zhì)分子,也就是一個基因可以不止有一種功能。從進化角度看,更多的外顯子有助于形成更多的外顯子組合,生成新的基因,對生物在多種環(huán)境下生存是有利的。
因此C值悖理可以用很多真核生物基因組中主要是非編碼DNA來解釋。非編碼DNA可能是重復(fù)DNA或單一順序DNA?;蚪M的復(fù)雜性(complexity)由單一順序DNA的總和來定義,可以用物理單位(參見堿基對、皮克)或更經(jīng)常是總基因組的百分比來表示。重復(fù)DNA的存在最早是通過復(fù)性動力學(xué)被發(fā)現(xiàn)并部分解釋了C—值悖理。同一門類中C—值的差異主要反映了對基因組復(fù)雜性沒有貢獻的重復(fù)順序DNA的含量的差異。當(dāng)將重復(fù)順序DNA考慮在內(nèi)時,在有類似生物復(fù)雜性的物種間仍存在基因組大小的不一致性,特別是在一群單細胞有機體中間進行比較時。
例如:釀酒酵母:C—值大約為13.5Mb裂殖酵母:C—值接近20Mb這兩種酵母有類似的結(jié)構(gòu)復(fù)雜性和較少的重復(fù)序列DNA。差異反映了非編碼的單一順序DNA之間的不同如基因間DNA片段和內(nèi)含子:
裂殖酵母40%的基因有內(nèi)含子而釀酒酵母只有4%基因有內(nèi)含子在更高等的真核生物中,基因間區(qū)域和內(nèi)含子更大,內(nèi)含子數(shù)量更多,使基因的平均大小和基因間距離增加。3、DNA復(fù)性動力學(xué)
基因組內(nèi)單一序列和重復(fù)序列的組成情況,可通過DNA復(fù)性動力學(xué)研究來確定。DNA復(fù)性:當(dāng)變性DNA的兩條互補鏈在除去變性因素后,可以重新或部分恢復(fù)成雙螺旋結(jié)構(gòu)。復(fù)性的必要條件:足夠的鹽濃度;溫度適中(低于Tm20-25℃)復(fù)性過程緩慢:成核作用→拉鏈作用當(dāng)兩條單鏈DNA接觸時,如果某個區(qū)段可以互補配對,就先形成一個雙鏈核心區(qū),然后擴展其互補配對區(qū)段而復(fù)性形成雙鏈。復(fù)性過程很復(fù)雜,但基本符合二級反應(yīng)動力學(xué)dSDNA2SSDNA復(fù)性的速率可用下列公式表示:dC/dt=-kC2
k1k2這里,C是在t時單鏈DNA的濃度,k是二級反應(yīng)常數(shù)。上述公式可以重排為-dC/C2=kdt對上式積分整理得:C/C0=1/(1+kC0t)這里C0是t=0時DNA的初始濃度這個公式表明反應(yīng)中單鏈DNA所占百分數(shù)(C/C0)是DNA濃度(C0)同反應(yīng)時間(t)乘積的函數(shù),通常用C0t來表示。在一個特定的實驗中,C0是已知的,C是可以測定的,如C/C0對C0t作圖可以得到下圖的曲線,稱為Cot曲線(見圖5—4)。當(dāng)C/C0=0.5即復(fù)性反應(yīng)完成一半時(t1/2)的Cot值定義為C0t1/2
(2)在不存在重復(fù)序列的情況下,C0t?值與基因組的大小成正比,也即與反應(yīng)體系中的復(fù)雜度成正比:X=K’C0t?A.在一般標(biāo)準(zhǔn)條件下(陽離子濃度為0.18mol/L,片段大小為400bp)K’=5x105
則有:X=5x105C0t?B.在非標(biāo)準(zhǔn)條件下,通常用大腸桿菌DNA作為標(biāo)準(zhǔn)測定未知DNA的復(fù)雜度:
C0t?
(欲測基因組DNA)復(fù)雜度(欲測基因組DNA)C0t?(大腸桿菌DNA)4.2x106bp(3).在有重復(fù)順序的復(fù)性中,在同一個復(fù)性曲線上的各動力學(xué)組分的C0t1/2并不因基因組的大小而增減,而是與DNA序列的重復(fù)頻率成反比:C0t?(1):C0t?(2)=f(2):f(1)式中(1)和(2)代表兩個不同的動力學(xué)組分,f代表其重組頻率(拷貝數(shù))復(fù)性動力學(xué)研究表明
=原核生物基因組的C0t曲線是單一的S形曲線真核生物基因組的C0t曲線是多S形曲線,由若干個(一般2-3個)S形加合成的曲線。求每一S’的動力學(xué)復(fù)雜性:C0t(C)’1/2=630x45%=283CDNA復(fù)雜性=4.2x106
x283/4.0=3.0x108(bp)C0t(B)’1/2=1.9x30%=0.57BDNA復(fù)雜性=4.2x106x0.57/4.0=6x105(bp)C0t(A)’1/2=0.0013x25%=0.000325ADNA復(fù)雜性=4.2x106x0.000325/4.0=340(bp)S’(A)S’(B)S’(C)根據(jù)化學(xué)長度和復(fù)雜性求重復(fù)頻率:B化學(xué)長度=7.0x108x30%=2.1x108(bp)B動力學(xué)長度=6x105(bp)f(B)=2.1x108/6x105=350A化學(xué)長度=7.0x108x25%A動力學(xué)長度=340f(A)=7.0x108x25%/340=5x105由此可見,在真核生物中復(fù)性反應(yīng)最快的組分是一些高度重復(fù)序列,復(fù)性反應(yīng)次之的是中度重復(fù)序列,復(fù)性反應(yīng)最慢的組成則是單一序列以及在基因組中出現(xiàn)2-3份拷貝的一些序列。4、基因組DNA序列的分類基因組DNA分子可以根據(jù)其結(jié)構(gòu)和功能從不同角度分成不同的類別。(1)基因序列和非基因序列
基因序列指基因組里決定蛋白質(zhì)(或RNA產(chǎn)物)的DNA序列,一端為ATG起始密碼子,另一端則是終止密碼子。在分析基因組序列時,當(dāng)一個DNA序列以ATG起始密碼子開始,隨后是一個個密碼子,但還未發(fā)現(xiàn)與這個序列對應(yīng)的蛋白質(zhì)產(chǎn)物,此時,這種DNA序列稱為可讀框(openreadingframe,ORF)。一般說,一個ORF相當(dāng)于一個基因,只是其產(chǎn)物還有待發(fā)現(xiàn)和證實。非基因序列則是基因組中除基因以外的所有DNA序列,主要是兩個基因之間的間插序列(interveningsequence)。
(2)編碼序列(Codingsequence)和(Non-codingsequence)非編碼序列
編碼序列指編碼RNA和蛋白質(zhì)的DNA序列。由于基因是由內(nèi)含子和外顯子組成,內(nèi)含子是基因內(nèi)的非蛋白質(zhì)編碼序列。所以基因的內(nèi)含子序列以及居間序列的總和統(tǒng)稱為非蛋白質(zhì)編碼序列。(3)單一(unique)序列和重復(fù)(repetitive)序列
單一序列是基因組里只出現(xiàn)一次的DNA序列?;蛐蛄卸喟胧菃我恍蛄校膊蝗菃我恍蛄?,因為有些基因在基因組內(nèi)的拷貝數(shù)不止一個。同時,非基因序列中也有單一序列。比如用作遺傳標(biāo)記或作圖界標(biāo)的短串聯(lián)重復(fù)序列(shorttandemrepeat,STR)和序列標(biāo)定位點(sequencetaggedsite,STS)等。重復(fù)序列:是指在基因組中重復(fù)出現(xiàn)的DNA序列基因組內(nèi)的重復(fù)序列有的是散在分布,有的是成簇存在。以人類基因組為例,單一序列約占基因組的50%左右;兩棲類和顯花植物基因組中單一序列所占比例要低得多,主要是一些重復(fù)序列。根據(jù)DNA序列在基因組中的重復(fù)頻率,可將其分為:
輕度重復(fù)序列、中度重復(fù)序列和高度重復(fù)序列。
①輕度重復(fù)序列一般指一個基因組內(nèi)有2—10份拷貝,但有時2—3份拷貝的DNA序列也被視作非重復(fù)序列。組蛋白基因和酵母tRNA基因?qū)儆谳p度重復(fù)序列。②中度重復(fù)序列一般指10份到幾百份拷貝的DNA序列,通常是非編碼序列。這類重復(fù)序列平均長度約300bp,往往構(gòu)成序列家族,同單一序列相隔排列,分散在基因組中??赡茉诨蚧钚缘恼{(diào)控中起作用。高度重復(fù)序列一個基因組中有幾百份甚至幾百萬份拷貝的高度重復(fù)序列。既有重復(fù)幾百份拷貝的基因,如rRNA基因和某些tRNA基因,更多的則是很短的非編碼序列的重復(fù)。這些序列往往是許多份拷貝呈頭尾銜接的串聯(lián)形式,也就是串聯(lián)重復(fù)序列(tandemrepeat)。不同生物基因組中重復(fù)序列所占比例有很大差別。原核生物基因組中基本上不含有重復(fù)序列;低等真核生物基因組中,重復(fù)的組成不超過20%,且多半是中度重復(fù)序列;動物細胞的基因組中,中度和高度重復(fù)序列約占50%;在一些顯花植物和兩棲類基因組中,中度和高度重復(fù)序列幾乎可以高達80%。
真核生物基因組成分根據(jù)含量和功能分類
DNA類型定義
根據(jù)含量單一順序(單拷貝,低拷貝,非重復(fù)順序DNA):
每個基因組中順序出現(xiàn)一次或很少次。包括大部分基因和內(nèi)含子,節(jié)順序和其他未知功能的DNA。中等重復(fù)順序DNA
:每個基因組中出現(xiàn)10~10000個拷貝。一般是代表高度保守的多基因家族的分散重復(fù)順序(功能假基因)和轉(zhuǎn)座因子。偶爾成簇排列。高度重復(fù)順序:每個基因組中出現(xiàn)10000~1000000個拷貝的序列。一般作為隨機重復(fù)順序被發(fā)現(xiàn),一些超豐度的(彌散的)轉(zhuǎn)座因子也屬于這類(如Alu元件)。根據(jù)功能
基因DNA:
基因,即可以表達的DNA。基因DNA可以進一步分為mDNA(編碼蛋白)、rDNA、tDNA、snDNA等,代表了不同的基因產(chǎn)物。
調(diào)節(jié)DNA
:DNA的功能是調(diào)節(jié)基因表達(如啟動子、增強子)或調(diào)節(jié)DNA功能(如復(fù)制起始區(qū),核基質(zhì)結(jié)合區(qū)域)
基因內(nèi)DNA,間隔DNA
:
內(nèi)含子和分隔基因的DNA。衛(wèi)星DNA
:靠近著絲粒、端粒和其他位置的高度重復(fù)DNA,有些衛(wèi)星DNA在染色體功能中發(fā)揮作用。自在DNA
:功能是介導(dǎo)自身在基因組中的復(fù)制和生存,如一些衛(wèi)星DNA和轉(zhuǎn)座因子。無用DNA:沒有確定功能的DNA5、重復(fù)順序DNA
⑴基因家族(genefamily):由同一個祖先基因經(jīng)過重復(fù)(duplication)與變異進化而形成結(jié)構(gòu)與功能相似的一組基因,組成了一個基因家族?;蚣易逯械母鱾€成員可以聚集成簇也可以分散在不同染色體上,或者兩種情況兼而有之。結(jié)構(gòu)基因家族中各個成員通常具有相關(guān)的甚至相同的功能。(2)基因族(genecluster):由相同或相關(guān)的鄰近基因組成的一個基因群或一組基因
(3)多基因家族
(multigenefamily)
多基因家族是一個基因組中功能相似、進化上同源的一組基因。在這些基因中,拷貝數(shù)、順序保守性、構(gòu)成、分布狀態(tài)和功能相關(guān)性有很大差異。例如:在一些子中,家族成員可能非常相似或完全一樣(如rRNA基因)。在其他一些例子中,保守性非常差,即使通過序列比較也不能發(fā)現(xiàn)。經(jīng)典的多基因家族是結(jié)構(gòu)相似,在整個編碼順序中保守。它們可以在特殊座位上成簇排列(如人類—珠蛋白基因)、分散的(如人類肌動蛋白基因)或者兩者都有(玉米醇溶蛋白基因)。成簇的多基因家族的偶爾分散的成員稱為孤獨基因(orphon)。注(孤獨基因與孤兒基因(orphan)不同,孤兒基因是在基因組測序計劃中發(fā)現(xiàn)的,在其他有機體中沒有對應(yīng)的基因,已確定它沒有功能)。其他多基因家族只在特殊的對應(yīng)保守的蛋白結(jié)構(gòu)域的亞基因區(qū)域相同(如同源異形基因在編碼DNA結(jié)合的結(jié)構(gòu)域的180bp同源盒相關(guān))。更有其他一些只在一個非常短的氨基酸基序相關(guān)(如MADS盒和DEAD盒RNA螺旋酶基序)。更為復(fù)雜的是,很多基因呈現(xiàn)為對應(yīng)不同蛋白結(jié)構(gòu)域的相對獨立功能單位的嵌合分子,使它們能夠同時成為幾個不同家族的成員。這樣的基因被認為是通過祖先基因間的重組產(chǎn)生的(參見外顯子改組),可以包含重復(fù)的編碼信息(參見外顯子重復(fù))。Figure3.16showsthattheproportionofuniquegenesdropssharplywithgenomesize.Whengenesarepresentinfamilies,thenumberofmembersinafamilyissmallinbacteriaandlowereukaryotes,butislargeinhighereukaryotes.MuchoftheextragenomesizeofArabidopsisisaccountedforbyfamilieswith>4members(1403).(4)超基因家族(supergenefamily)DNA序列相似,但功能不一定相關(guān)的若干基因家族或單拷貝基因總稱。(5)假基因(pseudogene)
多基因家族經(jīng)常包含結(jié)構(gòu)保守的基因,它們是通過積累突變產(chǎn)生,來滿足不同的功能需要。在一些例子中,突變使基因功能完全喪失,這樣的無功能的基因拷貝稱為假基因,經(jīng)常用希臘字母表示。根據(jù)起源和結(jié)構(gòu)的不同,假基因分為兩類:未加工的假基因加工的假基因
Figure3.20Themousegenomehas~30,000protein-codinggenes,whichhave~4000pseudogenes.Thereare~800RNA-codinggenes.ThedataforRNA-codinggenesarereplottedontheright,atanexpandedscaletoshowthatthereare~350tRNAgenesand150pseudogenes,and~450othernoncodingRNAgenes,includingsnRNAsandmiRNAs.①未加工的假基因(nonprocesspseudogenes)也稱為常規(guī)假基因(conventionalpseudo—genes),是通過基因組DNA復(fù)制產(chǎn)生,經(jīng)常位于相同基因有功能拷貝的附近。它們與有功能的同源基因有類似的結(jié)構(gòu),可以包括內(nèi)含子和調(diào)節(jié)元件。這樣的假基因在細菌和真核生物中都有發(fā)現(xiàn),因為它們是積累突變,包括使轉(zhuǎn)錄消失的調(diào)節(jié)突變和產(chǎn)生截短編碼產(chǎn)物的無義突變,所以能夠被識別。偶爾未加工的假基因可以通過一個有利的突變重新激活。產(chǎn)生未加工假基因的過程也可能產(chǎn)生部分基因或截短的拷貝。②加工的假基因(processedpseudogenes)也稱為反轉(zhuǎn)錄假基因(retropseudogenes),是通過對mRNA的反轉(zhuǎn)錄和獲得的cDNA的隨機整合而產(chǎn)生;它們經(jīng)常是分散的。加工假基因是由反轉(zhuǎn)錄因子(參閱)編碼的反轉(zhuǎn)錄酶和整合酶的外來活性而產(chǎn)生的,只在真核生物中被發(fā)現(xiàn)。加工的假基因結(jié)構(gòu)對應(yīng)于起源基因的轉(zhuǎn)錄單位,缺乏內(nèi)含子和側(cè)翼順序。因為缺乏側(cè)翼順序,加工假基因一般不表達,盡管它們偶爾整合在內(nèi)源性啟動子附近,并受它的控制(人類編碼丙酮酸氫化酶的基因被認為是這種方式產(chǎn)生的)。RNA聚合酶有Ⅲ內(nèi)在的啟動子,所以它的加工的假基因可以表達。人類高度重復(fù)Alu元件是表達的RNA聚合酶Ⅲ加工的假基因的例子。⑷、結(jié)構(gòu)和功能的冗余性
冗余(redumdant)序列是在基因組中出現(xiàn)超過一次的序列,也就是增加基因組大小,并不增加復(fù)雜性的序列。冗余基因并不必定是功能冗余。一些基因被發(fā)現(xiàn)有冗余拷貝,以產(chǎn)生足夠基因產(chǎn)物(rRNA基因?qū)儆谶@一類),另一些進化以實現(xiàn)不同功能。功能冗余可以通過當(dāng)特定基因或元件缺失造成表型缺失來建立。完全或部分功能基因冗余在多細胞有機體的很多定向突變中可以看到,即使同樣的基因在異位表達時表現(xiàn)出顯著的功能效應(yīng)的增加。另一個例子是轉(zhuǎn)錄因子MyoD,它可以通過激活生肌途徑使很多不同的細胞類型轉(zhuǎn)變成肌肉。當(dāng)小鼠myoD基因刪除(參見基因敲除),同源基因無效的個體是正常的。這是因為另一個轉(zhuǎn)錄因子,Myf-5能夠?qū)yoD缺失進行補償。功能冗余經(jīng)常反映了結(jié)構(gòu)冗余(祖先基因通過復(fù)制產(chǎn)生的兩份拷貝,如同上述例子1),它們可以補償相互的功能缺失)。在其他的情況中,不同的基因在相同的功能上匯集,例如幾種不相關(guān)的蛋白從兩棲動物織原中分泌——腱蛋白,成頭蛋白,囊泡抑制素;它們的共同功能是阻斷TGF-p信號。功能冗余在有重要發(fā)育作用的基因中是普遍存在的,而在看家基因中較少。(5)、重復(fù)DNA順序的結(jié)構(gòu)
重復(fù)DNA順序由特定大小序列(重復(fù)位,repeatunit),以特定拷貝數(shù)目在空間上以特殊的方式組成。重復(fù)單位可以以三種方式被組織:
串聯(lián)重復(fù)(tandemrepeats)在單個重復(fù)單位間沒有間隔;
不完善的重復(fù)(hyphenatedrepeats)被小間隔分離,但還是成群排列;
分散重復(fù)(dispersedrepeats)散布在整個基因組中。單個重復(fù)順序間可以是相同方向(正向重復(fù))或者是相反方向(反向重復(fù))排列(圖12.1)。作為分散重復(fù)DNA的轉(zhuǎn)座因子
如上文所討論的,一些基因組范圍分散的重復(fù)DNA對應(yīng)于多基因家族的成員,包含功能基因和假基因。另外它可以代表在DNA水平上起作用的基序。大多數(shù)分散重復(fù)DNA對應(yīng)于有功能的轉(zhuǎn)座因子或它們的“空殼”形式(通過突變失活的因子)。這種序列類型的優(yōu)勢在不同生物體中變化很大。在細菌基因組中,轉(zhuǎn)座因子的拷貝數(shù)經(jīng)常<10,而脊椎動物一般分布廣泛(盡管在河豚魚基因組中不存在)。
在哺乳動物中,兩類特殊的逆轉(zhuǎn)錄因子是不同類型的分散重復(fù)。SINEs是短散布核元件(shortinterspersednuclearelement),對應(yīng)于加工的7SLRNA假基因的拷貝,它在人類中稱為Alu元件,在小鼠中是B1元件。Alu元件大約300bp長度,像其他轉(zhuǎn)座因子一樣兩側(cè)是正向重復(fù),反映了其整合機制(參見移動遺傳因子)。它主要位于GC豐富的DNA區(qū)域,估計有106的拷貝數(shù),平均每4kbp有一個元件。LINEs是長散布核元件(longinterspersednuclearelements)
對應(yīng)于稱為LINE—1(L1)的豐富反轉(zhuǎn)錄轉(zhuǎn)座子的拷貝。L1元件最大長度為6kbp,拷貝數(shù)105(盡管全長的元件只占一小部分,<5000拷貝)。L1和Alu元件都是與基因相聯(lián)系的,但它們的分布是相關(guān)的,與基因組的等容線結(jié)構(gòu)有關(guān)(參閱),可能是因為整合靶位點的傾向性。這些元件都不在基因的編碼區(qū)——它們經(jīng)常出現(xiàn)在內(nèi)含子和兩側(cè)區(qū)域,Alu元件偶爾出現(xiàn)在基因的3’非翻譯區(qū)域,可以被RNA聚合酶Ⅱ作為基因的一部分轉(zhuǎn)錄。
等容線模型(isochoremodel)將哺乳動物基因組分成不同的區(qū)域,長度>300kbp,以相對均一的堿基組成為特征。哺乳動物基因組平均的GC含量是約40%,但不同區(qū)域間在37%和55%之間變化。片段化DNA可以通過浮力密度梯度分為五個等容線類型:L1和L2(AT豐富)和H1、H2、H3(GC豐富)。所有的哺乳動物顯示了類似的等容線表現(xiàn)。通過確定克隆基因的GC含量和將YACs分成等容線類型,可以研究等容線類型中基因分布。AT豐富的等容線組成了人類基因組的65%,但只包含30%的基因。在H2和H3等容線中基因密度最大。在H3等容線類型中,預(yù)計密度是每10kbp一個基因6)衛(wèi)星DNA
是高等真核生物基因組重復(fù)程度最高的成分,由非常短的串聯(lián)多次重復(fù)DNA序列組成。高度重復(fù)DNA在物種間變化,但一般占了基因組的10%~30%。因為它的低復(fù)雜性,有時稱為簡單序列DNA,又因為其不尋常的核苷酸組成,它經(jīng)常在浮力密度梯度離心中從整個基因組DNA中分離成一個或多個“衛(wèi)星”條帶,也稱為衛(wèi)星DNA。衛(wèi)星DNA由重復(fù)單位5-10bp組成,有的長達100bp,成串排列,重復(fù)次數(shù)105-107一般位于染色體的異染色區(qū)。①衛(wèi)星DNA(SatelliteDNA):
大多數(shù)位于著絲粒區(qū)或核仁組織者
②小衛(wèi)星DNA(MinisatelliteDNA):
一般位于端粒處,由幾百個核苷酸對的單元重復(fù)組成。
③微衛(wèi)星DNA(MicrosatelliteDNA):由2-20個左右的核苷酸對的單元重復(fù)成百上千次組成衛(wèi)星DNA
④
隱蔽衛(wèi)星DNA(crypticsatelliteDNA):有與大多數(shù)基因組DNA相當(dāng)?shù)母×γ芏?,離心時并不象衛(wèi)星DNA那樣被分開,它不形成衛(wèi)星條帶,但它的屬性卻類似衛(wèi)星DNA,其組成包含了多種串聯(lián)重復(fù)序列的DNA分子;它通過其他方法被鑒定,如限制性作圖。衛(wèi)星DNA以大的基因簇(100~3000kb)分布,經(jīng)常位于異染色質(zhì)的著絲粒,可能在染色體功能中起作用。大多數(shù)人類染色體的中心粒DNA包含了隱蔽衛(wèi)星DNA,稱為阿爾法DNA(-衛(wèi)星DNA:靈長類特有的單元為171bp的高度重復(fù)序列,分布在人染色體的著絲粒區(qū)),盡管另一種成分—衛(wèi)星DNA在至少人類8條染色體的中心粒也很豐富?!汀l(wèi)星DNA家族中染色體特異性序列存在差異。
在昆蟲中,衛(wèi)星DNA由很多非常短的顯著鏈不對稱序列(5—15bp)組成。哺乳動物衛(wèi)星DNA的組織方式更復(fù)雜。簡單重復(fù)序列表現(xiàn)出一些可變性,經(jīng)常形成些串聯(lián)重復(fù)的一定程度可變的區(qū)域。衛(wèi)星DNA因此是由分層結(jié)構(gòu)的簡單序列塊組成,被認為通過持續(xù)突變和擴增的循環(huán)產(chǎn)生,可能涉及不對稱交換和基因轉(zhuǎn)換。不等交換小衛(wèi)星DNA和微衛(wèi)星DNA
大多數(shù)衛(wèi)星DNA是以染色體著絲粒區(qū)域或核仁組織者的重復(fù)序列組成的大基因簇存在,但也經(jīng)常出現(xiàn)在稱為小衛(wèi)星DNA的小基因簇(100bp~10kbp)中,一般位于端粒處。有兩種形式的小衛(wèi)星DNA。在每個染色體臂的末端是端粒DNA。在大多數(shù)真核生物中,它由特征性的幾千堿基的串聯(lián)五核苷酸或六核苷酸DNA重復(fù)組成(見表5.2),它的功能是在隨后的DNA復(fù)制周期中阻止染色體缺損(參見端粒、端粒酶)。第二類高度可變的小衛(wèi)星DNA位于亞端粒區(qū)域。高度可變DNA的重復(fù)單位在不同的位置不同,但都包含了共同的GC豐富的核心共有序列。每個位置的拷貝數(shù)是高度多態(tài)性的,因此又稱為VNTR序列(variablenumberoftandemrepeats,同向重復(fù)序列可變數(shù))。高度可變小衛(wèi)星DNA的功能(VNTRDNA)還不清楚,但它可能可以促進重組(在染色體的亞端粒區(qū)域交換趨向于成簇)。端粒位置的傾向性意味著小衛(wèi)星DNA不僅對基因組范圍的遺傳作圖有用,它還可被廣泛用于DNA印記的診斷標(biāo)記。VNTRs呈孟德爾遺傳,也可用作遺傳作圖。
DNA分型(DNAtyping)或DNA分布圖(DNAprofiling)涉及用小衛(wèi)星DNA(VNTR)產(chǎn)生DNA片段組,以電泳分離時,提供任何個體的獨特模式(有時稱為DNA指紋,DNAfingerprints)。小衛(wèi)星DNA是高度多態(tài)性的(每個位置重復(fù)單位的數(shù)目),而在基因組中有很多小衛(wèi)星DNA,傾向于分布在亞端粒區(qū)域。如果足夠的位點被同時分型,不相關(guān)的個體極不可能產(chǎn)生相同的分布圖,但因為小衛(wèi)星是以盂德爾性狀傳遞的,相關(guān)個體會有類似分布圖,并且相匹配的DNA片段數(shù)目與對應(yīng)于它們親緣關(guān)系的緊密程度呈正相關(guān)。應(yīng)用可應(yīng)用在犯罪研究中。DNA可以從犯罪現(xiàn)場的組織和體液中提取(經(jīng)常是血液、精液或毛發(fā)),然后與懷疑對象取得的對照樣品比較。同樣的,DNA也可以從動物和植物中獲得,與保存的參照比較確定它們的起源。幫助確立親子關(guān)系,證實家譜或顯示個體的相關(guān)性)。DNA分型方法學(xué)原先的DNA分型方法涉及用限制性酶剪切DNA,通過基因座特異性探針進行Southern雜交分型。PCR分型方法類似于分布圖,但可以應(yīng)用于微量樣品(如干了的一滴血,一根毛發(fā)),并可容忍一定程度的DNA降解。微衛(wèi)星DNA
出現(xiàn)在更小的基因簇(<200bp)中,以非常短的重復(fù)單位(1~4bp)為特征。它們有高度的多態(tài)性,分布在整個基因組中,所以它們是理想的遺傳標(biāo)記。在兩種可能的同源多聚體,ploy(A)/poly(T)遠比ploy(C)/poly(G)普遍,且二核苷酸微衛(wèi)星ploy(CG)/poly(GC)因為CpG基序的損耗而稀少。三和四核苷酸微衛(wèi)星DNA相對稀少,但作為標(biāo)記比通常出現(xiàn)的二核苷酸微衛(wèi)星更有用,因為在PCR基因型印記中鏈的跳格較少。MicrosatellitesDNAelementscomposedof15-100tandemrepeatsofone-,two-,orthree-basesequencesareknownasmierosatellites.ExamplesareAAAAAAAAAAAAAAAorCACACACACACACACA-CACACACACACACACACACACACA.Alsoknownassimplesequencerepeats(SSRs),microsatellitesarisespontaneouslyfromrandomeventsthatduplicateamono-,di-,or(lessoften)trimericsequenceonetoafewtimes.Atsomeloci,theseinitialtandemduplicationsincreaseinnumberthrougherrorsinreplication.Inthemammalian
genome,forexample,theCA-repeatmicrosatelliteoccursonceinevery30,000bp.Researchershavedeterminedthisfrequencybyprobinggenomiclibrariesandcalculatingthenumberofpositiveclones.Althoughthetandemrepeatsofmicrosatelliteshavenoknownfunction,theyarefoundthroughoutthegenomesofallvertebrates;thehumangenomecontainsroughly100,000microsatelliteloci.Microsatellitestendtobehighlypolymorphicinthenumberofrepeatstheycarry,withmanyallelesdistinguishableateachmicrosatellitelocus.ResearchshowsthatfaultyDNAreplicationisthemajormechanismgeneratingthemanyalleles(Fig.9.3).Becausethesameshorthomologousunit(CA,forexample)isrepeatedoverandoveragain,DNApolymerasemaydevelopastutterduringreplication,thatis,itmayslipandmakeasecondcopyofthesamedinucleotide,orskipoveradinucleotide.(7)NoncodingFunctionalsequences—端粒DNA:
Telomeres端粒:是真核生物染色體上的末端結(jié)構(gòu),能將染色體末端封住,使之不能與其它染色體片段相連接,而保持各染色體的相對完整性和獨立性,是真核生物染色體復(fù)制和穩(wěn)定性的必需結(jié)構(gòu)。TelomereshavetandemarraysofsimpleDNAsequencesthatdonotcodeanRNAoraproteinproduct,butneverthelesshaveadefinitefunction.在這里端粒的重復(fù)序列解決了線狀DNA分子復(fù)制中遺傳的功能問題端粒酶:是一個核糖核蛋白,既含有蛋白質(zhì)成分也含有RNA分子,
在RNA上含有復(fù)制端粒亞單位所需要的關(guān)鍵核苷酸模板。因此端粒酶可以看作一種特殊的DNA聚合酶,即自身攜帶RNA模板的反轉(zhuǎn)錄酶。(8)、超基因(supergene)操縱子是細菌中與同一種生化功能有關(guān)的幾個基因(如控制色氨酸合成的有關(guān)基因)在基因組內(nèi)聚成一簇而緊密連鎖,并受一個基因調(diào)控。操縱子只在細菌中發(fā)現(xiàn)。在真核生物基因組內(nèi)很少發(fā)現(xiàn),真核生物的結(jié)構(gòu)基因一般是單獨調(diào)控的,但真核生物中也有稱為超基因的結(jié)構(gòu)。超基因是指作用于一種性狀或作用于一系列相關(guān)性狀的幾個緊密連鎖的基因。人類基因組的超基因如血紅蛋白基因簇。在個體發(fā)育的不同時期,基因簇中的不同基因進行表達。一個祖先基因經(jīng)過重復(fù)(duplication)和變異而產(chǎn)生的一組基因,組成了一個基因家族(genefamily)?;蚣易逯械母鱾€成員可以聚集成簇也可以分散在不同染色體上,或者兩種情況兼而有之。結(jié)構(gòu)基因家族中各個成員通常具有相關(guān)的甚至相同的功能。
一個共同的祖先基因通過各種各樣的變異,產(chǎn)生了結(jié)構(gòu)大致相同但功能卻不盡相似的一大批基因。這一大批基因分屬于不同的基因家族,但可以總稱為一個基因超家族(superfamily)。
原核生物基因組的結(jié)構(gòu)特點E.coli2.4×109Da,42000Kb(1300微米),閉合環(huán)狀,約編碼4000個基因。類核(nucleoid)。支架(scafford)100個DNA環(huán)組成,每個環(huán)長40Kb,13微米。每200bp就有一個負超螺旋(=0.05),即基因組中含
5%的負超螺旋。超螺旋以兩種狀態(tài)存在:(1)自由狀態(tài)的超螺旋,可在環(huán)內(nèi)傳遞張力。(2)超螺旋受到束縛,不能傳遞張力。一.類核的結(jié)構(gòu)返回表10-1
E.coli含有的各種DNA結(jié)合蛋白蛋白結(jié)構(gòu)功能含量/每細胞相當(dāng)于其核蛋白基因HUα和β亞基,每個9KD使DNA壓縮、類核凝聚,刺激復(fù)制,和1HF有關(guān)4萬個二聚體H2BhupA.BH兩個相同亞基,各28KD促使雙鏈的互補、復(fù)性3萬個二聚體H2A?IHFα:10.5KD;β:9.5KD有助于att位點配對重組??himA.D.H1(H-NS)15KD亞基和DNA結(jié)合,與DNA拓撲結(jié)構(gòu)有關(guān)1萬?osZbglYpilGHLP117KD單體?2萬?firAP3KD亞基??魚精蛋白(DNA結(jié)合蛋白)?
1977年Sanger首先發(fā)現(xiàn)重疊基因他對單鏈環(huán)狀的噬菌體X174進行了測序。5386Nt11基因,3個轉(zhuǎn)錄單位,由3個啟動子(pA,pB,pD)啟動。X174含有的5386Nt最多能編碼1795個氨基酸,若每個氨基酸的平均分子量為110,則總的蛋白質(zhì)分子量為197,000Da,但實際蛋白質(zhì)總分子量卻為262,000D。將全部DNA順序和蛋白質(zhì)的氨基酸順序進行比較,發(fā)現(xiàn)了重疊基因二重疊基因(overlappinggene)重疊基因OverlappingGenes三.質(zhì)粒(plasmid)1.抗性質(zhì)粒(Resistance(R)plasmids):2.
致育因子(Fertility(F)plasmids)3.
Col質(zhì)粒:有編碼大腸桿菌素(colicins)基因。4.
降解質(zhì)粒(degradativeplasmids)。這種質(zhì)粒編碼一種特殊蛋白,可使宿主菌代謝特殊的分子,如甲苯或水楊酸。5.
侵入性質(zhì)粒(virulenceplasmids)。這些質(zhì)。如Ti
質(zhì)粒,此是在根癌農(nóng)桿菌(Agrobacterium
tumefaciens)中發(fā)現(xiàn)的
真核基因組的復(fù)雜性
分子量約為3×1012道爾頓長度為2×106Kb,形態(tài)為線狀,約編碼10萬個以下的基因。人類細胞在二倍體的核中DNA長約30億個堿基對估計編碼3萬個基因,每條染色體含堿基8千萬至3億不等?,F(xiàn)已有5千個基因被編目,1900個基因已進行了染色體定位,600個已被克隆分離出來。若將一個細胞中每條染色體的DNA首尾彼此相接,全長約200cm。RenatoDulbecco于1986年首先提出了“人類基因組計劃”,原計劃約10-15年完成,耗資30億美元,其宏偉的程度堪與Manhatto原子彈計劃和Appolo登月計劃相提并論。
1990年開始實施1999
破譯出人類第22號染色體的遺傳密碼。2000
完成了人類第21號染色體的測序。預(yù)計從原定的2003年6月提前到2001年6月完成。2000年6月26日美,英,日,德,法,中六國共同宣布人類基因組工作草圖繪制成功。2000年3月塞萊拉公司宣布完成了果蠅的基因組測序。12月14日英美等國科學(xué)家宣布繪出擬南芥基因組的完整圖譜。這是人類首次全部破譯一種植物的基因序列。2001年:1、2月,HGP和美國塞萊拉(Sequencing)公司將各自測定的人類基因組工作框架圖分別發(fā)表在Nature和Science上,這表明人類基因組計劃(HGP)進入了一個展新的階段。2000,4,5:以楊煥明為首的中國科學(xué)家在Science發(fā)表了水稻全基因組框架序列圖?;蚩倲?shù):46022~55615,約為人類的2倍;其中10000個基因的功能已確定;水稻的“垃圾”序列多位于基因外,人類的“垃圾”序列多位于基因內(nèi);水稻的基因平均長度為4500bp,人類基因平均長度為72000bp,擬南芥約有25000個基因,80%在水稻中都存在,二者之間有關(guān)信號傳導(dǎo)的基因差別最大一.
組蛋白組蛋白類型堿性氨基酸氨基酸數(shù)分子量(Da)LysArgH129%1%21523,000H2A11%9%12913,960H2B16%6%12513,775H310%13%13515,340H411%14%10211,280表12-2小牛胸腺DNA的組蛋白的特點二.
核小體(nucliesome)1956年Wilkins和VittorioLuzzati對染色質(zhì)進行了X衍射研究,發(fā)現(xiàn)染色質(zhì)具有間隔為100埃的重復(fù)性結(jié)構(gòu)。這意味著甚麼?Clark和Felsenfeld于1971年首先用葡萄球菌核酸酶(Staphylococcalnuclease)來作用染色質(zhì),不敏感的區(qū)域比較均一。這暗示甚麼?接著Hewish和Burgoyun(1973年)用內(nèi)源核酸酶消化細胞核,再從核中分離出DNA,結(jié)果發(fā)現(xiàn)一系列DNA片段,它們相當(dāng)于長約200bp的一種基本單位的多聚體。表明甚麼?M.Noll(1974年)用外源核酸酶處理染色質(zhì),然后進行電泳,測得前三個片段的長度分別為205,405,605bp長,表明甚麼?Olins夫婦(1974)和PierreChambon等(1975)在電鏡下觀察到染色質(zhì)的“繩珠”狀結(jié)構(gòu),小球的直徑為100埃,Olins并把這種小球稱為小體。X衍射圖表明組蛋白的多聚體是緊密相聯(lián),并無可容納像DNA分子那樣大小的孔洞,表明甚麼?1974年Kornberg和Thomas
先用小球菌核酸酶稍稍消化一下染色質(zhì),切斷一部分200核苷酸對單位之間的DNA,使其中含有單體、二聚體、三聚體和四聚體等。然后經(jīng)離心將它們分開。每一組再通過凝膠電泳證明其分子大小及純度。然后分別用電鏡來觀察各組的材料;結(jié)果單體均為一個100埃的小體,二聚體則是兩個相聯(lián)的小體,同樣三聚體和四聚體分別由三個小體和四個小體組成,表明甚麼?1984年Klug和Butler進行了修正核小體模型。核小體的
梯度離心
和電泳6、原核生物基因組與真核生物基因組的特點原核生物基因組:(1)不具備明顯的核結(jié)構(gòu),只有DNA的集中區(qū),形成擬核Nucleoid(2)基因組小,例E.coli4639Kb,多數(shù)基因都包括在單一個環(huán)狀DNA分子上,單一DNA復(fù)制起點,一個復(fù)制子。(3)重復(fù)序列和不編碼序列很少。DNA的絕大部分是用來編碼蛋白質(zhì)的,只有非常小的部分不轉(zhuǎn)錄。一般無內(nèi)含子和重復(fù)基因,即原核生物基因是連續(xù)的基因。(4)功能上密切相關(guān)的基因構(gòu)成操縱子或高度集中,常轉(zhuǎn)錄成多基因mRNA(多順反子mRNA)(5)有重疊基因(6)結(jié)構(gòu)基因通常是單一的DNA序列,除rRNA和tRNA基因外,原核生物結(jié)構(gòu)基因都是單拷貝。真核生物基因組:(1)真核生物基因組數(shù)目龐大,結(jié)構(gòu)復(fù)雜,基因組大部分位于細胞核中,一般由多條染色體組成,每條染色體又是由DNA分子與蛋白質(zhì)穩(wěn)定的結(jié)合成染色質(zhì)的多級結(jié)構(gòu)(2)每條染色體的DNA分子具有多個復(fù)制起點,基因內(nèi)存在著不表達的插入序列,即內(nèi)含子。真核基因多為斷裂基因(3)編碼序列僅占基
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度教育產(chǎn)業(yè)借款協(xié)議
- 2025年度書畫家簽約經(jīng)紀(jì)代理服務(wù)合同
- 2025年度住宅小區(qū)公共設(shè)施保潔服務(wù)合同
- 游泳館裝飾設(shè)計合同
- 2025年全球能源安全情景報告(英文版)-殼牌
- 2025年度抖音平臺用戶增長與活躍度提升合同
- 2025年度企業(yè)社保代繳與人才引進激勵協(xié)議
- 二零二五年度退定金協(xié)議:高端酒店預(yù)訂管理服務(wù)合同
- 2025年度多功能手摩托車購銷合同范本
- 倉儲用地租賃合同
- 四年級上冊數(shù)學(xué)計算題練習(xí)300題及答案
- 滬教版二年級下冊計算題100道及答案
- 2023新課標(biāo)魯教版九年級化學(xué)下冊全教案
- 《開學(xué)第一課:一年級新生入學(xué)班會》課件
- 右側(cè)腹股溝疝教學(xué)查房
- 《趣味經(jīng)濟學(xué)》課件
- 人工智能與自動駕駛技術(shù)
- 醫(yī)院放射診療中的輻射防護常識學(xué)習(xí)培訓(xùn)
- 城市排水系統(tǒng)雨污分流改造
- 法學(xué)涉外法治方向課程設(shè)計
- 廣州市2023年中考:《道德法治》考試真題與參考答案
評論
0/150
提交評論