第三章 基因與基因組_第1頁
第三章 基因與基因組_第2頁
第三章 基因與基因組_第3頁
第三章 基因與基因組_第4頁
第三章 基因與基因組_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章基因與基因組第一節(jié)基因的概念第二節(jié)基因的結(jié)構(gòu)第三節(jié)基因組第四節(jié)基因組大小與復(fù)雜度第五節(jié)真核生物基因組的包裝第一節(jié)基因的概念一基因概念的發(fā)展:1孟德爾遺傳因子孟德爾1965年提出的遺傳因子(hereditaryfactor)的概念。1900年對遺傳因子有了認(rèn)識.1909年約翰生提出基因(gene)一詞代替遺傳因子。摩爾根基因概念1910年摩爾根證明基因位于染色體上,并以線性排列;證明位于同源染色體同一位置的相對基因間可發(fā)生交換產(chǎn)生新類型,提出連鎖互換規(guī)律。在1926年《基因論》中,對基因的認(rèn)識是:基因是攜帶遺傳信息的一個完整結(jié)構(gòu)單位;是一個控制形狀的功能單位,突變單位和交換單位。即是一個不可區(qū)分的“三位一體”的結(jié)構(gòu)單位?;虻墓δ芷胃拍?941年比德爾對粗糙鏈孢菌的研究,提出“一個基因一個酶”的理論。人們對鐮刀貧血癥研究,提出“一個基因一條多肽鏈”。1944年阿委瑞、1952年Hershey和Chase證明DNA是遺傳物質(zhì),認(rèn)識到基因是染色體上一個特定的DNA片段。1953年瓦特生和克里克提出雙螺旋結(jié)構(gòu),解釋了遺傳信息的儲存和傳遞過程,進(jìn)一步明確基因是含有特定遺傳信息的DNA片段。順反子概念1957年Benze研究T4噬菌體rⅡ突變型發(fā)現(xiàn)基因內(nèi)部可以突變和重組。首次在DNA分子結(jié)構(gòu)水平上分析了基因內(nèi)部的精細(xì)結(jié)構(gòu),提出了順反子(cister)學(xué)說,打破了“三位一體”的基因概念,把基因具體化為DNA分子上一個決定一條多態(tài)鏈的完整的功能單位,其內(nèi)部可分,包含許多突變和重組單位。轉(zhuǎn)座子與跳躍基因概念20世紀(jì)50年代認(rèn)為基因組(genome)中基因的數(shù)目、位置和功能都是固定的,基因的位置與其位置無關(guān)。1951年美國MeClintock在玉米染色體研究中,提出轉(zhuǎn)座(transposition)概念,認(rèn)為某些基因的位置不是固定的,可以在染色體上移動。1967年Shapino在大腸桿菌中也發(fā)現(xiàn)可以轉(zhuǎn)移位置的插入序列(insertsequence)。這些可移動的成分成為跳躍基因(junpinggene)或轉(zhuǎn)座因子(transposableelement).操縱子模型1961年法國Jacob和Monod在大腸桿菌乳糖代謝突變體的研究中,提出了操縱子(operon)模型,闡明功能相關(guān)的結(jié)構(gòu)基因在染色體上往往緊密排列在一起。斷裂基因概念1977年美國Sharp和Roberts發(fā)現(xiàn)斷裂基因(splitegene),使人們認(rèn)識到絕大部分真核基因的編碼序列是不連續(xù)的,被一些非編碼的DNA序列間隔開。但原核生物基因的編碼序列是連續(xù)的。1978年Tonagana把斷裂基因中的編碼序列叫做外顯子(exon),把非編碼的間隔序列叫做內(nèi)含子(intron)。1978年英國Sanger在ΦX174噬菌體中發(fā)現(xiàn)重疊基因(overlappinggene),即兩個或兩個以上的基因共有一段DNA序列。重疊基因(overlappinggene),現(xiàn)代基因概念基因是有功能的DNA片段,含有合成有功能的蛋白質(zhì)多肽鏈或RNA所必須的全部核苷酸序列。(或一段有功能的DNA片段)。第二節(jié)基因的一般結(jié)構(gòu)一外顯子和內(nèi)含子:外顯子:在成熟的RNA中出現(xiàn)的序列。內(nèi)含子:是一些插入序列,在原初轉(zhuǎn)錄本加工時被刪除。原核生物基因是連續(xù)編碼的DNA鏈,真核生物基因是斷裂基因,由內(nèi)含子和外顯子組成,內(nèi)含子在轉(zhuǎn)錄后加工時被切除。在每個外顯子和內(nèi)含子的接頭區(qū),有一段高度保守的共有序列(consensussequence),稱為GT-AG法則,是RNA間接的信號。珠蛋白基因二氫葉酸還原酶DHFR基因外顯子長度變化不顯著內(nèi)含子長度變化顯著二開放閱讀框原始轉(zhuǎn)錄產(chǎn)物經(jīng)剪接后形成成熟mRNA,經(jīng)翻譯成多肽鏈。結(jié)構(gòu)基因從起始密碼子開始至終止密碼子的一段核苷酸區(qū)域,其間不存在其他任何終止密碼,可編碼完整的多肽鏈,這段區(qū)域被稱為開放閱讀框(openreadingframe,ORF)。三信號肽序列在分泌蛋白基因的編碼序列中,起始密碼子之后,有一段編碼富含疏水氨基酸多肽的序列,被稱為信號肽序列(signalpeptidesequence)。它所編碼的信號肽行使運(yùn)輸?shù)鞍踪|(zhì)的功能。信號肽在核糖體合成后,與細(xì)胞膜或細(xì)胞器的膜上特定的受體相互作用,產(chǎn)生通道,使分泌蛋白穿過細(xì)胞的膜結(jié)構(gòu),到達(dá)相應(yīng)的位置。信號肽在完成分泌過程后被切除。四側(cè)翼序列和調(diào)控序列每個結(jié)構(gòu)基因在第一個和最后一個外顯子的外側(cè)都有一段不被轉(zhuǎn)錄和翻譯的非編碼區(qū)稱為側(cè)翼序列(flankingsequence)。從轉(zhuǎn)錄起始點(diǎn)至起始密碼子的非翻譯序列稱為5`非翻譯區(qū)(5`untranslatedregion,5`-UTR)。從終止密碼子至轉(zhuǎn)錄終止子的非翻譯序列稱為3`非翻譯區(qū)(3`untranslatedregion,3`-UTR)。側(cè)翼序列不被轉(zhuǎn)錄和翻譯,但對基因的轉(zhuǎn)錄、翻譯和表達(dá)有影響。這些對基因的有效表達(dá)起調(diào)控作用的特殊序列統(tǒng)稱為調(diào)控序列(regulatorsequence)。1啟動子準(zhǔn)確而有效啟動基因轉(zhuǎn)錄所許的一段特異的核苷酸序列稱為啟動子(promoter)。典型的啟動子含有識別(R)、結(jié)合(B)和轉(zhuǎn)錄起始(I)三個位點(diǎn)。轉(zhuǎn)錄起始位點(diǎn)(Startpoint):轉(zhuǎn)錄開始時,模板上合成的第一個堿基的位點(diǎn),定為+1位點(diǎn)。其3`下游區(qū)域?yàn)檎齾^(qū),5`上游區(qū)域?yàn)樨?fù)區(qū)。原核生物啟動有兩段保守序列:-10序列:又叫TATA框(Pribnow框),位于-10bp左右,保守序列為TATAAT,是聚合酶結(jié)合位點(diǎn)。-35序列:又稱Sextama框,位于-35bp左右,保守序列為TTGACA,是聚合酶(σ)識別位點(diǎn)。真核生物啟動子真核生物不同RNA聚合酶識別的啟動子是不同的。主要有三種不同序列。TATA框又稱Hogness,Goldberg—Hogness框,俗稱金磚(goldbrick)。位于-25bp區(qū),保守序列為TATA(A/T)A(A/T)。相當(dāng)于原核生物的-10區(qū)。CAATbox保守序列GGC(C/T)CAATCA,位于-75bp,控制轉(zhuǎn)錄起始頻率,GCbox(GGGCGG),位于-90bp(-40~-110bp),以多拷貝形式存在,在不同基因的啟動子中位置不同,具激活轉(zhuǎn)錄的功能。2增強(qiáng)子增強(qiáng)子(enhancer):DNA分子中一種遠(yuǎn)端調(diào)控序列,能增強(qiáng)啟動子的轉(zhuǎn)錄能力,提高轉(zhuǎn)錄效率。它可能遠(yuǎn)離轉(zhuǎn)錄起始位點(diǎn),在轉(zhuǎn)錄位點(diǎn)的上游或下游,又稱遠(yuǎn)上游序列(farupstreamsequence)。其核心序列(G)TTGA/TA/TA/T(G)。增強(qiáng)子的作用他所處的位置、方向及與基因的距離無關(guān)。具有遠(yuǎn)距離效應(yīng),能增強(qiáng)遠(yuǎn)處啟動子的轉(zhuǎn)錄。無方向性,在靶基因的上游、下游或內(nèi)部都可發(fā)揮增強(qiáng)轉(zhuǎn)錄作用。具有組織特異性,在不同細(xì)胞內(nèi)增強(qiáng)作用不同。3沉默子與終止子沉默子(silencer)是與基因表達(dá)調(diào)控有關(guān)的遠(yuǎn)端調(diào)控序列。通過與有關(guān)蛋白質(zhì)結(jié)合,對轉(zhuǎn)錄起抑制作用。對基因的阻遏作用沒有方向限制,可遠(yuǎn)距離作用于啟動子。終止子(terminator)是一段位于基因3`端非翻譯區(qū)與終止轉(zhuǎn)錄過程有關(guān)的序列,由富含GC的顛倒重復(fù)序列及寡聚T組成,是RNA聚合酶停止工作信號。當(dāng)轉(zhuǎn)錄到達(dá)終止子時,此區(qū)域自身形成發(fā)夾結(jié)構(gòu),阻礙RNA聚合酶的移動,導(dǎo)致轉(zhuǎn)錄終止。4加尾信號真核生物基因3`端非翻譯區(qū)有一段高度保守的DNA序列,此序列轉(zhuǎn)錄后能指導(dǎo)核酸內(nèi)切酶使其下游15~30堿基處的mRNA被切除,然后通過多聚腺苷酸聚合酶加入一段多聚A尾巴(polyAtail),此保守序列稱為加尾信號。真核生物mRNA的3`端polyAtail不是由基因編碼的,而是在轉(zhuǎn)錄后加到mRNA上。動物基因的加尾信號序列為AATAAA,轉(zhuǎn)錄后加入100~300個A。5核糖體結(jié)合位點(diǎn)SD(Shine-dalgarnosequence)序列,是原核生物基因翻譯起始位點(diǎn)周圍的一組特殊的序列,控制著基因的翻譯過程。SD序列位于mRNA的5`非翻譯區(qū),起始密碼子之前10個堿基內(nèi),包含一個嘌呤六聚體AGGAGG的一部分或全部。SD序列可與16SrRNA3`端CCUCCU結(jié)合,是mRNA與核糖體結(jié)合的序列,與翻譯復(fù)合物的形成和翻譯的起始有關(guān)。真核生物基因結(jié)構(gòu)

外顯子內(nèi)含子3`非編碼區(qū)加polyA區(qū)終止密碼子內(nèi)含子邊界3`AG內(nèi)含子邊界5`GT信號肽序列起始密碼子5`非編碼區(qū)5`加冒位點(diǎn)TATA盒GC盒CAAT盒第三節(jié)真核生物基因組一基因組與C值一個物種單倍體染色體所攜帶的一套基因稱為該物種的基因組(genome)。每一種生物的單倍體基因組的DNA總量稱為C值。不同的物種的C值差異極大,一般來講,隨物種生物結(jié)構(gòu)和功能的復(fù)雜程度增加,需要的基因數(shù)目和基因產(chǎn)物的種類越多,C值應(yīng)越大。C值矛盾C值的大小與物種的結(jié)構(gòu)組成和功能復(fù)雜性沒有嚴(yán)格的對應(yīng)關(guān)系,這種現(xiàn)象成為C值矛盾(C-valueparadox)形態(tài)學(xué)上的復(fù)雜程度與C-值不一致的現(xiàn)象又稱為C-值悖理。每門類中DNA最小量

PhylumSpeciesGenome(bp)

藻類Pyrenomassalina6.6×105支原體M.pneumoniae1.0×106

細(xì)菌E.coli4.2×106

酵母S.cerevisiae1.3×107霉菌D.discoideum5.4×107線蟲C.elegans8.0×107昆蟲D.melanogaster1.4×108兩棲動物X.laevis3.1×109哺乳動物H.sapiens3.3×109以每門類中DNA最小量作圖二單一序列基因組中只有一個或幾個拷貝的DNA序列稱為單一序列(uniquesequence)又稱非重復(fù)序列(nonrepetitivesequence)。原核生物基因組中除了短片段反向重復(fù)序列及16S、23S、5SrRNA和tRNA外,借為單一序列。真核生物的單一序列所占比例為40~70%。不是所有單一序列都編碼多肽鏈的結(jié)構(gòu)基因,真核生物基因組只有很少的單一序列編碼多肽鏈,大部分為非編碼的間隔序列,但大多數(shù)結(jié)構(gòu)基因是單一序列。三重復(fù)序列真核生物基因組存在許多重復(fù)序列(repetitivesequence)。這些重復(fù)序列成簇或分散分布于基因組中?;蚪M中,不止一個拷貝的序列稱為重復(fù)序列。包括高度重復(fù)序列、中度重復(fù)序列和低度重復(fù)序列。1.中度重復(fù)序列:占基因組的25-40%,分散于基因組。短分散重復(fù)序列和長分散重復(fù)序列。短分散重復(fù)序列短分散重復(fù)序列(shortinterspersedrepeatedsequence,SINEs)重復(fù)單位長度為300~500bp,拷貝數(shù)105以上。人類和哺乳動物的短分散重復(fù)序列Alu家族(Alufamily)序列長300bp,有2個130bp的重復(fù)序列,中間有31bp的間隔序列。每個Alu序列含有一個限制性內(nèi)切酶AluⅠ的識別序列AGCT,可被AluⅠ切割為170bp和130bp兩段。Alu家族占人類基因組的3-6%,單倍體基因組中約有30~50萬個拷貝。是人類基因組最豐富的中度重復(fù)序列。中度重復(fù)序列長分散重復(fù)序列(longinterspersedrepeatedsequence)重復(fù)單位長度5000~7000bp,重復(fù)次數(shù)102~105。人的KpnⅠ家族占基因組3~6%,300~4800個拷貝,重復(fù)單位用限制性內(nèi)切酶KpnⅠ酶切,得到1.2、1.5、1.8和1.9kb的DNA片段。哺乳動物L(fēng)INE1家族,有RNA聚合酶Ⅱ轉(zhuǎn)錄,基因組中約有66萬個拷貝,重復(fù)單位長讀6500bp,屬一種轉(zhuǎn)座因子。2高度重復(fù)序列在基因組中的重復(fù)次數(shù)106~108,重復(fù)單位的堿基組成2~200bp。有些高度重復(fù)序列含有異常高或低的GC,當(dāng)基因組DNA被切成數(shù)百個堿基對的片段進(jìn)行氯化銫密度梯度離心時,由于重復(fù)序列片段的GC與主體DNA不同,在主要DNA帶的前或后形成一個次要的DNA區(qū)帶,這些小區(qū)帶像衛(wèi)星一樣圍繞DNA主帶,因此,稱這些高度重復(fù)序列為衛(wèi)星DNA(satelliteDNA)衛(wèi)星DNA有些高度重復(fù)序列的GC含量與主體DNA沒有區(qū)別,利用氯化銫密度梯度離心分不出衛(wèi)星帶,這種高度重復(fù)序列稱為隱蔽衛(wèi)星DNA(crypticsatellite)。衛(wèi)星DNA主要分布于端粒和著絲粒附近的異染色質(zhì)區(qū)。衛(wèi)星DNA可變數(shù)目串聯(lián)重復(fù)序列(variablenumbertandemrepeats,VNTR)是指衛(wèi)星DNA中以少數(shù)核苷酸為單位多次串聯(lián)重復(fù)的DNA序列。以6~25個核苷酸為核心序列的串聯(lián)的串聯(lián)重復(fù)序列稱為小衛(wèi)星(minisatellite)DNA。以2~6核苷酸為核心序列的串聯(lián)重復(fù)序列稱為微衛(wèi)星(microsatellite)DNA。小衛(wèi)星DNA和微衛(wèi)星DNA序列作為DNA多態(tài)的標(biāo)記,運(yùn)用遺傳圖譜的構(gòu)件、目的基因的標(biāo)定,種質(zhì)資源研究、親子鑒定及遺傳病的診斷。節(jié)肢動物的衛(wèi)星DNA嚙齒動物的衛(wèi)星DNA(1)

嚙齒動物的衛(wèi)星DNA(2)嚙齒動物

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論