基因組、ORF、CDS、CDNA_第1頁
基因組、ORF、CDS、CDNA_第2頁
基因組、ORF、CDS、CDNA_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、開放閱讀框(或開放讀碼框架,openreadingframe,ORF)是DNA上的一段堿基序列,由于擁有特殊的起始密碼子和直到可以從該段堿基序列產(chǎn)生合適大小蛋白才出現(xiàn)的終止密碼子,該段堿基序列編碼一個蛋白。當(dāng)一個新基因被識別,其DNA序列被解讀,人們?nèi)耘f無法搞清相應(yīng)的蛋白序列是什么。這是因?yàn)樵跊]有其它信息的前提下,DNA序列可以按六種框架閱讀和翻譯(每條鏈三種,對應(yīng)三種不同的起始密碼子)。ORF識別包括檢測這六個閱讀框架并決定哪一個包含以啟動子和終止子為界限的DNA序列而其內(nèi)部不包含啟動子或終止子,符合這些條件的序列有可能對應(yīng)一個真正的單一的基因產(chǎn)物。ORF的識別是證明一個新的DNA序列為特定

2、的蛋白質(zhì)編碼基因的部分或全部的先決條件。Anopenreadingframe(ORF)isaportionofagenessequencethatcontainsasequenceofbases,uninterruptedbystopsequences,thatcouldpotentiallyencodeaprotein.WhenanewgeneisidentifiedanditsDNAsequencedeciphered,itisstillunclearwhatitscorrespondingproteinsequenceis.Thisisbecause,intheabsenceofanyo

3、therknowledge,theDNAsequencecanbetranslatedorreadinsixpossiblereadingframes(threeforeachstrand,correspondingtothreedifferentstartpositionsforthefirstcodon).ORFidentificationinvolvesscanningeachofthesixreadingframesanddeterminingwhichone(s)containsastretchofDNAsequenceboundedbyastartandstopcodon,yetc

4、ontainingnostartorstopcodonswithinit;asequencemeetingtheseconditionscouldcorrespondtotheactualsingleproductofthegene.TheidentificationofanORFprovidesthefirstevidencethatanewsequenceofDNAispartorallofageneencodingforaparticularprotein.基因組:在生物學(xué)中,一個生物體的基因組是指包含在該生物的DNA(部分病毒是RNA)中的全部遺傳信息,又稱基因體(genome)?;?/p>

5、組包括基因和非編碼DNA。1920年,德國漢堡大學(xué)植物學(xué)教授漢斯.溫克勒(HansWinkler)首次使用基因組這一名詞。更精確地講,一個生物體的基因組是指一套染色體中的完整的DNA序列。例如,生物個體體細(xì)胞中的二倍體由兩套染色體組成,其中一套DNA序列就是一個基因組。基因組一詞可以特指整套核DNA(例如,核基因組),也可以用于包含自己DNA序列的細(xì)胞器基因組,如粒線體基因組或葉綠體基因組。當(dāng)人們說一個有性生殖物種的基因組正在測序時,通常是指測定一套常染色體和兩種性染色體的序列,這樣來代表可能的兩種性別。即使在只有一種性別的物種中,“一套基因組序列”可能也綜合了來自不同個體的染色體。通常使用中

6、,“遺傳組成”一詞有時在交流中即指某特定個體或物種的基因組。對相關(guān)物種全部基因組性質(zhì)的研究通常被稱為基因組學(xué),該學(xué)科與遺傳學(xué)不同,后者一般研究單個或一組基因的性質(zhì)。CDS是Codingsequenee的縮寫,是編碼一段蛋白產(chǎn)物的序列,是結(jié)構(gòu)基因組學(xué)術(shù)語ORF開放閱讀框是基因序列的一部分,包含一段可以編碼蛋白的堿基序列,不能被終止子打斷。當(dāng)一個新基因被識別,其DNA序列被解讀,人們?nèi)耘f無法搞清相應(yīng)的蛋白序列是什么CDS與開放讀碼框ORF的區(qū)別(1)開放讀碼框是從一個起始密碼子開始到一個終止密碼子結(jié)束的一段序列;不是所有讀碼框都能被表達(dá)出蛋白產(chǎn)物,或者能表達(dá)出占有優(yōu)勢或者能產(chǎn)生生物學(xué)功能的蛋白。C

7、DS,是編碼一段蛋白產(chǎn)物的序列。eds必定是一個orf。但也可能包括很多orf。反之,每個orf不一定都是cds。Openreadingframe(ORF)-areadingframethatdoesnoteontainanueleotidetripletwhiehstopstranslationbeforeformationofaeompletepolypeptide.Codingsequenee(CDS)-TheportionofDNAthateodesfortranseriptionofmessengerRNAORFtranslation,CDStranseriptiontranslat

8、ion是理論上的,而transeription則顯然是事實(shí)存在的。eDNA為具有與某RNA鏈呈互補(bǔ)的堿基序列的單鏈DNA即eomplementaryDNA之縮寫,或此DNA鏈與具有與之互補(bǔ)的堿基序列的DNA鏈所形成的DNA雙鏈EST(ExpressedSequeneeTag)表達(dá)序列標(biāo)簽一是從一個隨機(jī)選擇的eDNA克隆,進(jìn)行5端和3端單一次測序挑選出來獲得的短的eDNA部分序列,代表一個完整基因的一小部分,在數(shù)據(jù)庫中其長度一般從20到7000bp不等,平均長度為360120bp。由于eDNA文庫的復(fù)雜性和測序的隨機(jī)性,有時多個EST代表同一基因或基因組,將其歸類形成EST簇(ESTeluste

9、F)mRNA攜帶遺傳信息,在蛋白質(zhì)合成時充當(dāng)模板的RNA。ORF序列:即為Openreadingframe,表明這個DNA序列可能是一個基因,但具體的基因編碼序列需要其他的內(nèi)容來補(bǔ)充,因?yàn)檫@一段DNA序列按三聯(lián)體密碼子讀可以有六種讀法。如果明確這段DNA序列的啟動子和終止子序列就可以明確這段序列的氨基酸信息。cDNA序列:互補(bǔ)DNA序列,指的是mRNA為在逆轉(zhuǎn)錄酶的作用下將形成DNA的過程。這個DNA即為cDNA序列,它沒有內(nèi)含子和外顯子的區(qū)別,在原核生物中可以作為一個多肽的編碼基因序列,但在真核生物內(nèi)由于沒有內(nèi)含子,所以它不能完全作為一個多肽的編碼基因序列。CDS序列:編碼序列,從起始密碼子到終止密碼子的所有序列。EST序列:表達(dá)序列標(biāo)簽。一個多肽鏈編碼基因的短的cDNA序列,平均長度為360120bp,一般可以作為分子標(biāo)記使用;當(dāng)出現(xiàn)EST序列的時候,很可能也就是一個編碼基因所在的部位。轉(zhuǎn)錄起始位點(diǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論