版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第五章第五章 基因組序列注釋基因組序列注釋n完成基因組測(cè)序僅僅是基因組計(jì)劃的第一步,更完成基因組測(cè)序僅僅是基因組計(jì)劃的第一步,更大的挑戰(zhàn)在于弄清:大的挑戰(zhàn)在于弄清:n基因組序列中所包含的全部遺傳信息是什么;基因組序列中所包含的全部遺傳信息是什么;n基因組作為一個(gè)整體如何行使其功能?;蚪M作為一個(gè)整體如何行使其功能。這兩項(xiàng)任務(wù)都必須依賴于對(duì)基因組序列的正確這兩項(xiàng)任務(wù)都必須依賴于對(duì)基因組序列的正確注注釋釋(annotation)。)?;蚪M注釋方法:基因組注釋方法: 自動(dòng)注釋自動(dòng)注釋:依據(jù)某些規(guī)則進(jìn)行數(shù)據(jù)分析得出:依據(jù)某些規(guī)則進(jìn)行數(shù)據(jù)分析得出是否為基因的結(jié)論。是否為基因的結(jié)論。 人工注釋人工注釋:
2、人為檢測(cè)評(píng)價(jià)自動(dòng)注釋的結(jié)果并:人為檢測(cè)評(píng)價(jià)自動(dòng)注釋的結(jié)果并根據(jù)其他數(shù)據(jù)進(jìn)行分析與校正。根據(jù)其他數(shù)據(jù)進(jìn)行分析與校正。 實(shí)驗(yàn)注釋實(shí)驗(yàn)注釋:根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行檢測(cè),如:根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行檢測(cè),如EST或全長(zhǎng)或全長(zhǎng)cDNA。自動(dòng)注釋自動(dòng)注釋的內(nèi)容的內(nèi)容:n依據(jù)基因結(jié)構(gòu)的特點(diǎn)采用軟件預(yù)依據(jù)基因結(jié)構(gòu)的特點(diǎn)采用軟件預(yù)測(cè),不依賴已有的表達(dá)序列;測(cè),不依賴已有的表達(dá)序列;n同源性比較,在同一物種或不同同源性比較,在同一物種或不同物種中查找已有的基因序列;物種中查找已有的基因序列;n功能域(功能域(domain)或基序)或基序(motif)分析。)分析?;蛐蛄凶⑨尰蛐蛄凶⑨尰蚬δ茏⑨尰蚬δ茏⑨?非翻譯區(qū)非翻譯
3、區(qū)3非翻譯區(qū)非翻譯區(qū)5.1 搜尋基因搜尋基因5.1.1 根據(jù)基因結(jié)構(gòu)特征搜尋基因根據(jù)基因結(jié)構(gòu)特征搜尋基因基因(基因(gene). 開放讀碼框開放讀碼框 在在DNA鏈上,由蛋白質(zhì)合成的起始密碼子開始,鏈上,由蛋白質(zhì)合成的起始密碼子開始,到終止密碼子為止的一個(gè)連續(xù)編碼序列稱為一到終止密碼子為止的一個(gè)連續(xù)編碼序列稱為一個(gè)個(gè)開放讀碼框開放讀碼框(open reading frame, ORF)。)。讀碼框(讀碼框(reading frame)n任意一段任意一段DNA序列都有序列都有6種可能種可能的讀碼框。的讀碼框。n終止密碼子終止密碼子: TAA, TAG, TGA GC% = 50%,終止密碼子每終
4、止密碼子每 64 bp出現(xiàn)一出現(xiàn)一次;次; GC% 50%,終止密碼子每,終止密碼子每100200 bp 出現(xiàn)一次;出現(xiàn)一次;n由于多數(shù)基因由于多數(shù)基因 ORF 均多于均多于50個(gè)密碼子,因個(gè)密碼子,因此最可能的選擇應(yīng)該是此最可能的選擇應(yīng)該是 ORF 不少于不少于100 個(gè)個(gè)密碼子。密碼子。 ORF的長(zhǎng)度:最長(zhǎng)最長(zhǎng)ORF法法n在細(xì)菌基因組中在細(xì)菌基因組中,蛋白質(zhì)編碼基因從起始密,蛋白質(zhì)編碼基因從起始密碼子碼子ATG到終止密碼子平均有到終止密碼子平均有100 bp,而,而300 bp長(zhǎng)度以上的長(zhǎng)度以上的ORF平均每平均每36 Kb才出現(xiàn)才出現(xiàn)一次,所以只要找出序列中最長(zhǎng)的一次,所以只要找出序列中
5、最長(zhǎng)的ORF(300 bp)就能相當(dāng)準(zhǔn)確地預(yù)測(cè)出基因。)就能相當(dāng)準(zhǔn)確地預(yù)測(cè)出基因。n在在真核生物真核生物中,存在大量非編碼序列和內(nèi)含中,存在大量非編碼序列和內(nèi)含子,子,ORF閱讀比較復(fù)雜。閱讀比較復(fù)雜。n全長(zhǎng)全長(zhǎng)cDNA的編碼區(qū)一般也可以用最長(zhǎng)的編碼區(qū)一般也可以用最長(zhǎng)ORF法,如水稻的法,如水稻的3萬多條的全長(zhǎng)萬多條的全長(zhǎng)cDNA的編碼的編碼區(qū)預(yù)測(cè),有時(shí)例外。區(qū)預(yù)測(cè),有時(shí)例外。全長(zhǎng)全長(zhǎng)cDNA的編碼蛋白序列應(yīng)為的編碼蛋白序列應(yīng)為4-029B,而非最,而非最長(zhǎng)的長(zhǎng)的4-029A。 起始密碼子起始密碼子 ATGn第一個(gè)第一個(gè)ATG的確定依據(jù)的確定依據(jù)Kozak規(guī)則規(guī)則。nKozak是一個(gè)女科學(xué)家,
6、她研究過起始密碼子是一個(gè)女科學(xué)家,她研究過起始密碼子ATG周邊堿基定點(diǎn)突變后對(duì)轉(zhuǎn)錄和翻譯所造成的影響,周邊堿基定點(diǎn)突變后對(duì)轉(zhuǎn)錄和翻譯所造成的影響,并總結(jié)出在并總結(jié)出在真核生物真核生物中,起始密碼子兩端序列中,起始密碼子兩端序列為:為:G/N-C/N-C/N-ANNATGG,如,如GCCACCATGG、GCCATGATGG時(shí),轉(zhuǎn)錄和翻譯效時(shí),轉(zhuǎn)錄和翻譯效率最高,特別是率最高,特別是-3位的位的A對(duì)翻譯效率非常重要。對(duì)翻譯效率非常重要。n該序列被后人稱為該序列被后人稱為Kozak序列序列,并被應(yīng)用于表達(dá)載,并被應(yīng)用于表達(dá)載體的構(gòu)建中。體的構(gòu)建中。 n若將第一個(gè)若將第一個(gè)ATG中的堿基中的堿基A、T
7、、G分別標(biāo)為分別標(biāo)為1、2、3位,則位,則Kozak規(guī)則規(guī)則可描述如下:可描述如下:(1) 第第4位的偏好堿基為位的偏好堿基為G;(2) ATG的的5端約端約15bp范圍的側(cè)翼序列內(nèi)不含堿基范圍的側(cè)翼序列內(nèi)不含堿基T;(3) 在在-3,-6和和-9位置,位置,G是偏好堿基;是偏好堿基;(4) 除除-3,-6和和-9位,在整個(gè)側(cè)翼序列區(qū),位,在整個(gè)側(cè)翼序列區(qū),C是偏好堿是偏好堿基?;?。Kozak規(guī)則是基于已知數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,不見得必須規(guī)則是基于已知數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,不見得必須全部滿足,一般來說,滿足前兩項(xiàng)即可。全部滿足,一般來說,滿足前兩項(xiàng)即可。 Kozak規(guī)則的內(nèi)容:規(guī)則的內(nèi)容: 密碼子偏愛性(
8、密碼子偏愛性(codon bias)n編碼同一氨基酸的不同密碼子稱為同義密碼,編碼同一氨基酸的不同密碼子稱為同義密碼,其差別僅在密碼子的第其差別僅在密碼子的第3位堿基不同。不同位堿基不同。不同種屬間使用同義密碼的頻率有很大差異:種屬間使用同義密碼的頻率有很大差異:n如人類基因中,丙氨酸(如人類基因中,丙氨酸(Ale)密碼子多為)密碼子多為GCA、GCC或或GCT,而,而GCG很少使用。很少使用。n幾乎所有基因(或操縱子)都有幾乎所有基因(或操縱子)都有上游調(diào)控序列上游調(diào)控序列,它,它們可與們可與DNA結(jié)合蛋白作用,控制基因表達(dá),如啟動(dòng)結(jié)合蛋白作用,控制基因表達(dá),如啟動(dòng)子序列。子序列。n生物的生
9、物的基因組特有組成基因組特有組成也可作為判別依據(jù),如幾乎也可作為判別依據(jù),如幾乎所有的管家基因(所有的管家基因(House-Keeping gene)及約占)及約占40%的組織特異性基因的的組織特異性基因的5末端含有末端含有CpG島。在大島。在大規(guī)模規(guī)模DNA測(cè)序計(jì)劃中,每發(fā)現(xiàn)一個(gè)測(cè)序計(jì)劃中,每發(fā)現(xiàn)一個(gè)CpG島,則預(yù)示島,則預(yù)示可能在此存在基因。可能在此存在基因。 上游控制順序上游控制順序nChambon等發(fā)現(xiàn)等發(fā)現(xiàn)內(nèi)含子內(nèi)含子特點(diǎn):特點(diǎn):(1)內(nèi)含子連接點(diǎn)具有很短的保守序列,稱為)內(nèi)含子連接點(diǎn)具有很短的保守序列,稱為邊界順序邊界順序。其。其規(guī)律稱為規(guī)律稱為GT-AG法則(法則(GT-AG r
10、ule) 或或Chambon法則。法則。 。 外顯子與內(nèi)含子邊界外顯子與內(nèi)含子邊界 左左(5(5 ) )位點(diǎn)位點(diǎn) 右右(3(3 ) )位點(diǎn)位點(diǎn) 外顯子外顯子 A A6464G G73 73 G G100 100 T T100100A A6262A AG8G8G G8484T T6363 12PyNC 12PyNC6565A A100100G G100100 N N 外顯子外顯子內(nèi)含子內(nèi)含子 內(nèi)含子和外顯子的交界順序內(nèi)含子和外顯子的交界順序 GT-AG 法則法則 ( (仿仿 B.Lewin: GENES,1997,F(xiàn)ig30.3) P314OH G A G外顯子外顯子1 外顯子外顯子2OH 外顯
11、子外顯子1 UGO AG外顯子外顯子1 外顯子外顯子2核核 RNA 的剪接反應(yīng)的剪接反應(yīng)( (仿仿 B.Lewin:GENES,1997,F(xiàn)ig30.5)(2)分枝點(diǎn)順序分枝點(diǎn)順序:為:為Py80NPy87Pu75APy95 ,其,其中中A為百分之百的保守,為百分之百的保守,且具有且具有2-OH。(3)內(nèi)含子內(nèi)含子5端端有一保有一保守序列可以和守序列可以和U1 snRNA的的5 端的保守順序互補(bǔ)。端的保守順序互補(bǔ)。n3端的確認(rèn)主要根據(jù)端的確認(rèn)主要根據(jù)Poly(A)尾序列,若測(cè)尾序列,若測(cè)試序列不含試序列不含Poly(A),則根據(jù),則根據(jù)加尾信號(hào)序列加尾信號(hào)序列“AATAAA”和和BLAST同源
12、性比較結(jié)果共同源性比較結(jié)果共同判斷。同判斷。 3端的確認(rèn)端的確認(rèn) 轉(zhuǎn)錄起始轉(zhuǎn)錄起始 延伸延伸 5 帽子帽子 AAUAAA 剪切剪切 Poly (A) 聚合酶聚合酶 5帽子帽子 AAUAAA An mRNA 3端加端加 Poly(A)尾巴尾巴 n由于內(nèi)含子的進(jìn)化沒有外顯子受到的選擇壓由于內(nèi)含子的進(jìn)化沒有外顯子受到的選擇壓力大,內(nèi)含子的序列比外顯子的序列更隨機(jī)。力大,內(nèi)含子的序列比外顯子的序列更隨機(jī)。n這是目前各種預(yù)測(cè)程序中被廣泛應(yīng)用的一種這是目前各種預(yù)測(cè)程序中被廣泛應(yīng)用的一種方法,如方法,如GCG的的TestCode、美國(guó)波士頓大學(xué)、美國(guó)波士頓大學(xué)GeneID和和Baylor Medcine C
13、ollege的的BCM Gene Finder等程序。等程序。 編碼區(qū)與非編碼區(qū)編碼區(qū)與非編碼區(qū)5.1.2 同源基因查詢同源基因查詢n物種之間存在著廣泛的同源基因,包括編碼和非編碼序列。物種之間存在著廣泛的同源基因,包括編碼和非編碼序列。生生 物物基因組相似性基因組相似性%資資 料料 來來 源源人類人類99.9Human Genome Project100孿生子孿生子黑猩猩黑猩猩98.4Americans for Medical Progress98.7Celera Genomics大猩猩大猩猩98.38Am J Hum Genet 2001, 682: 444 456.小鼠小鼠98Ameri
14、cans for Medical Progress85NHGRI狗狗95Jon Entine, in the San Francisco Examiner線蟲線蟲74Jon Entine, in the San Francisco Examiner注:以人類基因組注:以人類基因組DNA序列為基準(zhǔn),與其他生物基因組序列為基準(zhǔn),與其他生物基因組DNA序列對(duì)比。序列對(duì)比。 同源查詢同源查詢(homology search)n利用已存入數(shù)據(jù)庫(kù)中的基因序列與待查利用已存入數(shù)據(jù)庫(kù)中的基因序列與待查的基因組序列進(jìn)行比較,從中查找可與的基因組序列進(jìn)行比較,從中查找可與之匹配的之匹配的堿基序列堿基序列或或蛋白質(zhì)
15、序列蛋白質(zhì)序列及其及其比比例例,這種識(shí)別基因的方法稱為,這種識(shí)別基因的方法稱為。同源查詢同源查詢相似性相似性的表現(xiàn):的表現(xiàn):n存在某些完全相同的序列;存在某些完全相同的序列;nORF的排列類似,如等長(zhǎng)的外顯子;的排列類似,如等長(zhǎng)的外顯子;nORF的氨基酸序列相同;的氨基酸序列相同;n模擬的多肽高級(jí)結(jié)構(gòu)相似。模擬的多肽高級(jí)結(jié)構(gòu)相似。n以上標(biāo)準(zhǔn)可以上標(biāo)準(zhǔn)可單獨(dú)單獨(dú)使用,亦可使用,亦可綜合綜合考察;考察;n一般認(rèn)為氨基酸的一致性或相似性在一般認(rèn)為氨基酸的一致性或相似性在25%以以上可視為同源基因。上可視為同源基因。 區(qū)分概念:區(qū)分概念:同源性、一致性和相似性同源性、一致性和相似性n同源性同源性(ho
16、mology):起源于同一祖先但序列已):起源于同一祖先但序列已經(jīng)發(fā)生變異的序列之間的關(guān)聯(lián)性。經(jīng)發(fā)生變異的序列之間的關(guān)聯(lián)性。 同源性只有同源性只有“是是”和和“非非”的區(qū)別,無所謂百分比。的區(qū)別,無所謂百分比。n一致性一致性(identity):同源):同源DNA序列的同一堿基位序列的同一堿基位置上相同的堿基成員,或者蛋白質(zhì)中同一氨基酸置上相同的堿基成員,或者蛋白質(zhì)中同一氨基酸位置上相同的氨基酸成員的比例。位置上相同的氨基酸成員的比例。n相似性相似性(similarity):同源蛋白質(zhì)的氨基酸序列中):同源蛋白質(zhì)的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。一致性氨基酸和可取代氨基酸所占
17、的比例。 一致性和相似性可用百分比表示,相似性往往高于一致性。一致性和相似性可用百分比表示,相似性往往高于一致性。同源基因有關(guān)概念:同源基因有關(guān)概念:n直向同源基因直向同源基因(orthologous gene):指分布在):指分布在不不同物種同物種之間的同源基因,它們來自物種分隔之前的之間的同源基因,它們來自物種分隔之前的同一祖先。同一祖先。n共生同源基因共生同源基因(paralogous gene):指):指同一物種同一物種因因基因倍增產(chǎn)生的同源基因。(旁系同源基因)基因倍增產(chǎn)生的同源基因。(旁系同源基因)n倍增基因倍增基因(ohnologous gene):因全基因組加倍):因全基因組加
18、倍產(chǎn)生的同源基因稱產(chǎn)生的同源基因稱。n異向同源基因異向同源基因(xenologous gene):):不同物種不同物種之之間因水平轉(zhuǎn)移產(chǎn)生的同源基因稱間因水平轉(zhuǎn)移產(chǎn)生的同源基因稱。物種種化物種種化(speciation event)而產(chǎn)生了直系同源而產(chǎn)生了直系同源(orthology)的基因序列的基因序列,基因重復(fù)基因重復(fù)(duplication event)而產(chǎn)生了旁系同源而產(chǎn)生了旁系同源(paralogy) 的基因序列的基因序列。globin 基因的直系同源基因的直系同源、旁系同源關(guān)系圖旁系同源關(guān)系圖 n在基因分類時(shí),缺少同源序列的在基因分類時(shí),缺少同源序列的ORF被稱為被稱為孤孤獨(dú)基因獨(dú)
19、基因(orphan gene)。)。n當(dāng)某一序列從數(shù)據(jù)庫(kù)中無法找到同源序列,又當(dāng)某一序列從數(shù)據(jù)庫(kù)中無法找到同源序列,又無法排除其是不是基因的可能性時(shí),必須依靠無法排除其是不是基因的可能性時(shí),必須依靠實(shí)驗(yàn)實(shí)驗(yàn)來進(jìn)一步確認(rèn)。來進(jìn)一步確認(rèn)。兩點(diǎn)說明:n在在DNA水平上區(qū)分同源基因的難度要大于氨水平上區(qū)分同源基因的難度要大于氨基酸水平?;崴?。 原因:密碼子的搖擺性,相似氨基酸的取代。原因:密碼子的搖擺性,相似氨基酸的取代。n確定兩個(gè)基因是否同源,氨基酸序列的比較確定兩個(gè)基因是否同源,氨基酸序列的比較以及蛋白質(zhì)高級(jí)結(jié)構(gòu)的模擬給出的結(jié)果更為以及蛋白質(zhì)高級(jí)結(jié)構(gòu)的模擬給出的結(jié)果更為可靠??煽?。 原因:同源
20、基因功能相似,關(guān)鍵位置氨基酸相同。原因:同源基因功能相似,關(guān)鍵位置氨基酸相同。 基因注釋軟件基因注釋軟件n信號(hào)指令信號(hào)指令(signal term):如起始密碼、終止密碼、內(nèi)含子分支點(diǎn)保守序列等;n內(nèi)容指令內(nèi)容指令(content term):如密碼子使用偏好等。 基因注釋水平的分類基因注釋水平的分類n已知基因已知基因(known gene):與已知cDNA和蛋白質(zhì)序列同源的基因。n新基因新基因(novel gene):與其他物種cDNA或蛋白質(zhì)序列同源的基因。n新轉(zhuǎn)錄物新轉(zhuǎn)錄物(novel transcript):與新基因相似,但缺少明確的ORF。n可能的基因可能的基因(putative g
21、ene):有同源EST支持,但缺少cDNA或ORF。n預(yù)測(cè)基因預(yù)測(cè)基因(predicted gene):數(shù)據(jù)庫(kù)中至少有一個(gè)外顯子支持,但缺少cDNA或明確的ORF。n假基因假基因(pseudogene):與已知蛋白質(zhì)有50%的一致性,但cDNA殘缺,在其他位點(diǎn)存在正常的同源基因的序列。(Dunham I 等,2001)5.1.3 實(shí)驗(yàn)確認(rèn)基因?qū)嶒?yàn)確認(rèn)基因n依據(jù):依據(jù):任何基因都可轉(zhuǎn)錄為任何基因都可轉(zhuǎn)錄為RNA拷貝。拷貝。n分子雜交分子雜交可確定DNA片段是否含表達(dá)序列Northern印跡(Northern boltting)。由由EST和和cDNA指認(rèn)基因指認(rèn)基因搜集盡可能多的EST和cDNA
22、成員是基因組注釋最簡(jiǎn)單最可靠的方法。5.2 基因功能預(yù)測(cè)基因功能預(yù)測(cè)n根據(jù)基因結(jié)構(gòu)、功能與進(jìn)化的內(nèi)在聯(lián)系,根據(jù)基因結(jié)構(gòu)、功能與進(jìn)化的內(nèi)在聯(lián)系,采用生物信息學(xué)方法進(jìn)行基因功能的預(yù)采用生物信息學(xué)方法進(jìn)行基因功能的預(yù)測(cè)已成為基因功能測(cè)已成為基因功能前期研究前期研究的的主流內(nèi)容主流內(nèi)容。5.2.1 計(jì)算機(jī)預(yù)測(cè)基因功能計(jì)算機(jī)預(yù)測(cè)基因功能n采用軟件分析方法,根據(jù)已有的基因功能推測(cè)采用軟件分析方法,根據(jù)已有的基因功能推測(cè)基因組中具有相似結(jié)構(gòu)的基因的功能?;蚪M中具有相似結(jié)構(gòu)的基因的功能。n依據(jù)依據(jù):同源性比較同源性比較 直向同源基因,共生同源基因直向同源基因,共生同源基因蛋蛋白白質(zhì)質(zhì)結(jié)結(jié)構(gòu)構(gòu)預(yù)預(yù)測(cè)測(cè)5.2.
23、2 蛋白質(zhì)結(jié)構(gòu)域在功能預(yù)蛋白質(zhì)結(jié)構(gòu)域在功能預(yù)測(cè)中的意義測(cè)中的意義n結(jié)構(gòu)域結(jié)構(gòu)域(domain)()(功能域功能域):蛋白質(zhì)高):蛋白質(zhì)高級(jí)結(jié)構(gòu)中具有相對(duì)獨(dú)立的亞結(jié)構(gòu)區(qū),通常它級(jí)結(jié)構(gòu)中具有相對(duì)獨(dú)立的亞結(jié)構(gòu)區(qū),通常它們含有數(shù)個(gè)二級(jí)結(jié)構(gòu)們含有數(shù)個(gè)二級(jí)結(jié)構(gòu)(motif),具有相),具有相對(duì)獨(dú)立的功能。對(duì)獨(dú)立的功能。n真核生物中大約真核生物中大約80%的蛋白質(zhì),原核生物中的蛋白質(zhì),原核生物中大約大約66%的蛋白質(zhì)均含有多個(gè)結(jié)構(gòu)域(的蛋白質(zhì)均含有多個(gè)結(jié)構(gòu)域(Apic G等,等,2001)。)。蛋白質(zhì)的域結(jié)構(gòu)蛋白質(zhì)的域結(jié)構(gòu)(domain architecture)n又稱為又稱為蛋白質(zhì)指紋蛋白質(zhì)指紋(prot
24、ein fingerprint):): 用來特指蛋白質(zhì)中結(jié)構(gòu)域的組合形式及其排用來特指蛋白質(zhì)中結(jié)構(gòu)域的組合形式及其排列次序。列次序。n蛋白質(zhì)的整體功能是通過各個(gè)蛋白質(zhì)的整體功能是通過各個(gè)結(jié)構(gòu)域之間的結(jié)構(gòu)域之間的協(xié)同作用協(xié)同作用實(shí)現(xiàn)的,結(jié)構(gòu)域的組成提供了蛋白實(shí)現(xiàn)的,結(jié)構(gòu)域的組成提供了蛋白質(zhì)功能解讀的關(guān)鍵信息。質(zhì)功能解讀的關(guān)鍵信息。舉例:舉例:細(xì)胞跨膜信號(hào)傳導(dǎo)蛋白的結(jié)構(gòu)域細(xì)胞跨膜信號(hào)傳導(dǎo)蛋白的結(jié)構(gòu)域n接受外界信號(hào)的接受外界信號(hào)的受體功受體功能域能域;n傳達(dá)信號(hào)的胞內(nèi)傳達(dá)信號(hào)的胞內(nèi)激酶域激酶域;n蛋白質(zhì)定位在細(xì)胞膜上蛋白質(zhì)定位在細(xì)胞膜上的的跨膜域跨膜域。n蛋白質(zhì)結(jié)構(gòu)域蛋白質(zhì)結(jié)構(gòu)域在基因的功能預(yù)測(cè)中起
25、著極其在基因的功能預(yù)測(cè)中起著極其重要的作用,是預(yù)測(cè)基因功能的重要的作用,是預(yù)測(cè)基因功能的主要依據(jù)之一主要依據(jù)之一。同一物種或不同物種中具有同一物種或不同物種中具有相同結(jié)構(gòu)域相同結(jié)構(gòu)域的蛋白的蛋白質(zhì)可將其劃歸在同一蛋白質(zhì)家族(質(zhì)可將其劃歸在同一蛋白質(zhì)家族(protein family),當(dāng)其他物種相關(guān)蛋白質(zhì)家族成員的),當(dāng)其他物種相關(guān)蛋白質(zhì)家族成員的功能已知時(shí),根據(jù)同源性可以推知另一物種相功能已知時(shí),根據(jù)同源性可以推知另一物種相同結(jié)構(gòu)域蛋白質(zhì)的功能。同結(jié)構(gòu)域蛋白質(zhì)的功能。n有時(shí)有時(shí)2個(gè)無明顯親緣關(guān)系的蛋白質(zhì)含有個(gè)無明顯親緣關(guān)系的蛋白質(zhì)含有個(gè)別相同的結(jié)構(gòu)域:個(gè)別相同的結(jié)構(gòu)域:分析:分析:n可能具有
26、相似的生物學(xué)功能,相似的結(jié)構(gòu)域可能具有相似的生物學(xué)功能,相似的結(jié)構(gòu)域是蛋白質(zhì)功能的核心區(qū)域。是蛋白質(zhì)功能的核心區(qū)域。n基因本身無共同的祖先,但其結(jié)構(gòu)域卻有共基因本身無共同的祖先,但其結(jié)構(gòu)域卻有共同的起源。同的起源。舉例:舉例:涉及涉及mRNA加工的蛋白質(zhì)加工的蛋白質(zhì)n共有結(jié)構(gòu)域:共有結(jié)構(gòu)域:RNA結(jié)合域結(jié)合域承擔(dān)功能:承擔(dān)功能:nmRNA的轉(zhuǎn)運(yùn);的轉(zhuǎn)運(yùn);nmRNA前體的剪接加工;前體的剪接加工;nmRNA的翻譯;的翻譯;A.mRNA的編輯等。的編輯等。轉(zhuǎn)錄因子的共同特點(diǎn)是可與轉(zhuǎn)錄因子的共同特點(diǎn)是可與DNA結(jié)合,即具有結(jié)合,即具有DNA結(jié)合域。結(jié)合域。TIRG生物技術(shù)公司利用生物技術(shù)公司利用Pf
27、am和和InterPro蛋白質(zhì)域軟件包搜尋蛋白質(zhì)域軟件包搜尋與注釋水稻基因組序列,鑒別出與注釋水稻基因組序列,鑒別出2462個(gè)轉(zhuǎn)錄因子基因。個(gè)轉(zhuǎn)錄因子基因。5.2.3 根據(jù)根據(jù)協(xié)同進(jìn)化協(xié)同進(jìn)化(co-evolved)注釋基因功能)注釋基因功能n為了加快基因功能的注釋與分類,根據(jù)為了加快基因功能的注釋與分類,根據(jù)相關(guān)相關(guān)功能基因功能基因具有具有協(xié)同進(jìn)化協(xié)同進(jìn)化的特點(diǎn),的特點(diǎn),Zheng L等等(2002)提出了一種)提出了一種協(xié)同進(jìn)化基因功能注協(xié)同進(jìn)化基因功能注釋策略釋策略,用以解決部分沒有任何已知背景的,用以解決部分沒有任何已知背景的基因的注釋?;虻淖⑨尅f(xié)同進(jìn)化基因功能注釋方法協(xié)同進(jìn)化基因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025陜西省建筑安全員《A證》考試題庫(kù)
- 2025青海建筑安全員A證考試題庫(kù)附答案
- 團(tuán)隊(duì)管理經(jīng)驗(yàn)分享培訓(xùn)課件
- 世界觀與方法論的關(guān)系
- JJF(桂)-稱重容罐校準(zhǔn)規(guī)范試驗(yàn)報(bào)告
- 三角形王國(guó) 小班數(shù)學(xué)
- 《惡性青光眼》課件
- 解題方法突破 分類討論課件-名師微課堂
- 《基因變異疾病》課件
- 江蘇省蘇州市姑蘇區(qū)2024-2025學(xué)年八年級(jí)上學(xué)期期末質(zhì)量監(jiān)測(cè)歷史卷(含答案)
- 閘門及啟閉機(jī)安裝專項(xiàng)施工方案
- 應(yīng)征公民體格檢查表(征兵)
- 鋼筋位置及保護(hù)層厚度檢測(cè)ppt課件
- 巖石堅(jiān)固性和穩(wěn)定性分級(jí)表
- 張可填充顏色的中國(guó)地圖與世界地圖課件
- CNC程序控制管理辦法
- 案例思念休閑吧
- 北京石油機(jī)械廠螺桿鉆具使用說明書-最新
- (完整版)虛擬語氣練習(xí)題(含答案)
- 六年級(jí)語文(部編)上冊(cè)詞語表拼音
- 模板2-課堂學(xué)習(xí)任務(wù)單
評(píng)論
0/150
提交評(píng)論