生物學第9章 基因組學1_第1頁
生物學第9章 基因組學1_第2頁
生物學第9章 基因組學1_第3頁
生物學第9章 基因組學1_第4頁
生物學第9章 基因組學1_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第9章

基因組學

●基因組學是研究生物基因組的結(jié)構(gòu)和功能的科學。1990年,啟動人類基因組計劃;1995年,完成第一個原核生物(細菌)基因組的測序;1996年,完成第一個真核生物(酵母)基因組的測序;結(jié)構(gòu)基因組學的最終目的,是要揭示基因組的分子組成,在分子水平上描繪基因組的結(jié)構(gòu),即基因組序列(genomicsequence)。1998年,完成第一個多細胞生物(線蟲)基因組的序列;2000年,完成果蠅和擬南芥的基因組測序以及人類的基因組草圖;2002年完成水稻的基因組草圖;2003年完成人類全基因組測序;2005年完成了水稻基因組全序列測定。生命的奧秘蘊藏于“四字天書”之中…GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCATCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCTCCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTCGCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT…第9章基因組學§9.1基因組的結(jié)構(gòu)特征

§9.2基因組圖譜的構(gòu)建及應(yīng)用

§9.3后基因組學第9章基因組學§9.1基因組的結(jié)構(gòu)特征

§9.2基因組圖譜的構(gòu)建及應(yīng)用

§9.3后基因組學1、原核生物基因組的結(jié)構(gòu)特征●大多數(shù)原核生物的基因組小于5Mb,比真核生物的基因組小得多。●染色體是由一個核酸分子(DNA或RNA)組成的,DNA(RNA)呈環(huán)狀或線性?!?/p>

原核生物還可能含有更小的質(zhì)粒(plasmid)的DNA分子。●蛋白質(zhì)基因通常以單拷貝的形式存在。●存在轉(zhuǎn)座因子?!?/p>

功能相關(guān)的基因大多以操縱子形式出現(xiàn),如大腸桿菌的乳糖操縱子等。

2、真核生物細胞核基因組的結(jié)構(gòu)特征1)真核生物細胞核基因組的大小從小于10Mb到大于100,000Mb?;蚪M的大小一般與生物的復雜性相一致,高等真核生物的基因組一般大于低等真核生物的基因組。

生物 基因組大?。∕b)

原核生物

Mycoplasmagenitalium 0.58

Escherichiacoli4.64

Bacillusmegaterium 30真核生物 真菌 Saccharomycescerevisiae(酵母) 12.1

Aspergillusnidulans25.4 原生動物 Tetrahymenapyriformis 190 無脊椎動物 Drosophilamelanogaster(果蠅)100

Bombyxmori(蠶) 490

Locustamigratoria(蝗蟲)5,000 脊椎動物 Fugurubripes(河豚) 400

Homosapiens(人類) 3,000

Musmusculus(鼠) 3,300 植物 Arabidopsisthaliana(擬南芥) 100

Oryzasativa(水稻) 565

Zeamays(玉米) 5,000

Triticumaestivum(小麥) 17,000

Fritillariaassyriaca(貝母)120,000不同生物類型基因組的大小資料來源:BrownT.A.,1999。2)真核生物具有復雜的染色體結(jié)構(gòu),染色體在細胞間期為染色質(zhì),由DNA、組蛋白、非組蛋白以及RNA組成的,基本結(jié)構(gòu)物質(zhì)是DNA和組蛋白。真核生物的細胞核基因組由一組線性DNA分子組成,而每一DNA分子包含在一條染色體中。3)非編碼序列比例大大增加

真核生物基因組復雜程度的增加,主要表現(xiàn)在非編碼序列比例的增加。例如,大腸桿菌基因組中非編碼序列僅占11%,而人類基因組中編碼序列只有1.1%-1.5%。真核生物基因組存在著各種類型的非編碼序列,使基因組的DNA序列變得十分復雜。人類基因組(3000Mb)基因及基因相關(guān)序列(900Mb)基因外DNA(2100Mb)編碼DNA(90Mb)非編碼DNA(810Mb)重復DNA(420Mb)單一和低拷貝DNA(1680Mb)假基因內(nèi)含子前導序列隨尾序列基因斷片分散重復DNA串聯(lián)重復DNA微衛(wèi)星DNA小衛(wèi)星DNA衛(wèi)星DNADNA轉(zhuǎn)座子LINESINELTR因子人類基因組的序列組成(資料來源:BrownT.A.,1999)重復DNA(repetitiveDNA)是由特定大小序列(重復單位),具有特定拷貝數(shù),以特殊的方式組成的DNA序列。原核生物:含有完全不重復的DNA;低等真核生物:大部分DNA也是非重復的;動物:接近50%的DNA是中度或高度重復的;植物和兩棲動物:中度或高度重復序列占基因組的80%。4)重復DNA的含量增加5)編碼基因數(shù)量與復雜程度的增加隨著基因組的增大,基因數(shù)目也相應(yīng)增加。但這種增加并不是按比例的。隨著生物的進化,基因組中基因數(shù)目增加同時,基因的復雜程度也在增加?;蚪M 大?。╞p)基因數(shù) 基因密度(1/kb) 年份生殖道支原體 5.8105 470 1 1995流感嗜血桿菌 1.8106 1,743 1 1995詹氏甲烷球菌 1.7106 1,682 1 1996大腸桿菌 4.6106 4,288 1 1997酵母 1.2107 5,885 2 1997線蟲 9.7107 19,099 5 1998擬南芥 1.2108 25,000 5 2001果蠅 1.3108 13,000 10 2000水稻 4.2108 50,000 8 2002人類 3.0109 32,000 95 2000

部分已測序基因組的基因數(shù)目6)大量基因以基因家族的形式存在?;蚣易澹╣enefamily):基因組中來源相同、結(jié)構(gòu)相似、功能相關(guān)的一組基因。成簇的基因家族(clusteredgenefamily):一個基因家族成員在特殊的染色體區(qū)域上成簇存在,中間常以中等重復序列間隔。散布的基因家族(interspersedgenefamily):同一基因家族的成員在整個染色體上廣泛分布,甚至存在于不同的染色體上。第9章基因組學

§9.1基因組的結(jié)構(gòu)特征

§9.2基因組圖譜的構(gòu)建及應(yīng)用

§9.3后基因組學物理作圖:就是要把基因組分解成為許多較小的DNA片段,然后再把這些DNA片段連接起來,構(gòu)建一個由DNA片段重疊群組成的物理圖(physicalmap)。從分子水平上看,基因組是一個巨大的物體,例如,擬南芥基因組大小為1.2108bp(basepair,堿基對),而人類基因組為3.0109bp。要完成基因組測序的巨大工程,通常首先需要把基因組分解成為許多較小的DNA片段,然后分別測序,再綜合組裝。物理圖譜:以特定DNA序列為界標直線排列在基因組DNA分子上,圖上界標之間的距離以物理長度,即核苷酸對(bp)的數(shù)目來表示。1、作圖文庫

一個基因組分解產(chǎn)生的用于物理作圖的DNA片段,在數(shù)量上通常是很大的。對這些DNA片段進行有效的管理,以便開展物理作圖,需要構(gòu)建這些DNA片段的文庫,這就是作圖文庫。作圖文庫的構(gòu)建通常包括DNA片段的分離、克隆和分析等環(huán)節(jié)。

(1)DNA片段的分離

用于物理作圖的DNA片段通常較大,一般為100-300kb。獲得途徑:

利用限制性內(nèi)切酶的部分酶切(不完全酶切),或選用稀有切點的限制酶酶切;

片段的大小可以通過酶切的時間來掌握。分離方法:

通過降低凝膠的濃度來分離較高分子量的DNA片段;應(yīng)用脈沖場凝膠電泳技術(shù)(pulsedfieldgelelectrophoresis,縮寫成PFGE),可成功分離到分子量高達107bp(1000kb)的DNA大分子。

將一個方向不斷變換的電場取代單向電場,使電泳中受阻的DNA分子在電場改變時扭轉(zhuǎn)遷移方向,小分子DNA比大分子DNA更易在凝膠中重新定向,因而遷移速度更快,達到分離大分子DNA的目的。脈沖場凝膠電泳的原理(2)DNA片段的克隆載體

所有的克隆載體都包括三種共同的組成部分,即復制基因(replicator)、選擇性標記和克隆位點(酶切位點)。

載體的類型:

質(zhì)粒(plasmid):5kb噬菌體(phase):2-25kb粘粒(cosmid):35-45kb細菌人工染色體(bacterialartificialchromosome,縮寫成BAC):100-200kb酵母人工染色體(yeastartificialchromosome,縮寫成YAC):200-700kb。

選擇載體時,主要考慮克隆DNA片段的大小。對于物理作圖,由于DNA片段較大,常用的克隆載體為BAC和YAC等。用BAC載體構(gòu)建的作圖文庫稱為BAC文庫,而用YAC載體構(gòu)建的作圖文庫稱為YAC文庫BAC文庫的構(gòu)建NotI、SacI脈沖場凝膠電泳得200kb左右的大片段DNA純化后與載體連接

電轉(zhuǎn)化,將連接產(chǎn)物導入大腸桿菌感受態(tài)細胞插有外源DNA片段的BAC載體在含有氯霉素的固體培養(yǎng)基中培養(yǎng)每一個菌落為帶有相同外源DNA片段的單克隆2、物理圖的構(gòu)建

物理作圖的下一個目標是要確定作圖文庫中克隆片段的排列順序,建立克隆的重疊群。(1)重疊群(contig):彼此可以通過末端的重疊序列相互連接成連續(xù)的DNA長片段的一組克隆。

組裝物理圖有多種方法,如染色體步移、指紋作圖等。(2)染色體步移(chromosomewalking):

選擇已知位置的克隆作為探針,尋找基因組文庫中與其部分重疊的克隆。通過多次重復這一步驟,就可以找出一個彼此重疊的、連續(xù)不斷的克隆片段重疊群。AAB1B2AC1B1C2B2(a)以起始克隆A為探針,從基因組文庫中篩選到克隆B1和B2(b)以克隆B1和B2為探針,從基因組文庫中篩選到克隆C1和C2基因組文庫重疊群的構(gòu)建染色體步移DNA指紋:確定DNA樣品所具有的特定DNA片段組成。一個克隆的指紋表示了該克隆所具有的限定的序列特征,可與其它克隆產(chǎn)生的同類指紋相比較。如果指紋重疊,表明兩個克隆具有共同區(qū)段。(3)指紋作圖(clonefingerprinting)克隆指紋法可分為限制性片段指紋法和PCR擴增產(chǎn)物指紋法兩大類?!飨拗菩云沃讣y法:利用限制酶處理DNA克隆,經(jīng)凝膠電泳分離限制性片段,獲得一組克隆的限制性指紋。

△PCR擴增產(chǎn)物指紋法:通過PCR擴增方法,比較克隆間PCR擴增條帶的相似性,獲得一組克隆的擴增產(chǎn)物指紋。

指紋作圖A.限制性片段指紋,E表示限制性位點;B.PCR擴增片段指紋,箭頭表示擴增片段。EEEEEE克隆X克隆Y克隆X克隆YA.限制性片段指紋B.PCR擴增片段指紋

無論是限制性片段指紋還是PCR擴增產(chǎn)物指紋,根據(jù)重疊區(qū)指紋相同的原理,可以找出相互重疊的克隆,從而構(gòu)建重疊群。由于指紋分析涉及大量的試驗數(shù)據(jù),因此通常通過計算機來進行分析。

3、確定重疊群的長度

從重疊群中選擇核心克隆,酶切后標記做探針,與整個重疊群雜交以確定重疊部分大??;將所有克隆長度總和減去相互重疊部分,即整個克隆重疊群的總跨度??寺≈丿B群之間存在的空隙的實際物理距離可以通過步移法找出搭橋克隆加以推算和確定。

這一工作必須由計算機來完成。遺傳圖是通過遺傳標記的排列順序和相對距離,來反映基因組的結(jié)構(gòu),圖距單位是以重組率為基礎(chǔ)的遺傳距離,即厘摩(cM)。物理圖是通過來源于基因組本身的DNA片段的重疊關(guān)系,對克隆的DNA片段進行排序,復原染色體全長的DNA分子,圖距單位是以堿基數(shù)為單位的物理距離(kb)。通過遺傳圖與物理圖的整合,構(gòu)成了更能反映基因組本質(zhì)的基因組圖。4、物理圖與遺傳圖的整合(1)以遺傳圖為基礎(chǔ)構(gòu)建物理圖

利用遺傳圖中的分子標記,從作圖文庫中篩選出相應(yīng)的克隆,并以錨定的克隆片段為基礎(chǔ)構(gòu)建重疊群。

ABCDEF6009002208501100染色體遺傳距離(cM)遺傳圖錨定標記物理圖物理距離(kb)DNA分子35146(2)遺傳距離與物理距離的關(guān)系

不同生物基因組中每厘摩的物理距離存在很大的差異。遺傳距離與物理距離的這種關(guān)系,反映了通過遺傳作圖對基因物理定位的精度。該比率越小,基因物理定位的精度越高。如酵母基因組中每cM約為3kb,在水稻基因組中約250kb,在玉米基因組中約1700kb。

三、基因組圖譜的應(yīng)用(1)基因組序列測定。(2)基因定位。精細定位,如抗病基因等(3)基因組比較分析:了解物種種間的同源性(4)分子標記輔助選擇(Marker-assistedselection,MAS)。利用與基因緊密連鎖的分子標記進行間接選擇。(5)基因的克隆與分離。染色體步行法(Chromosomewalking)或稱圖位克隆法(map-basedcloning)。1、基因組測序

●鏈終止法測序ddNTP●DNA自動測序用不同顏色的熒光染料ddNTP●基因組全序列測定●鏈終止法測序

基本原理:在DNA聚合酶的酶促反應(yīng)中,復制被測序的DNA分子。在復制的過程中,雙脫氧核苷酸隨機摻入到新合成的DNA鏈中,并引起DNA合成的終止。由于雙脫氧核苷酸包含4種不同的堿基,結(jié)果在合成的DNA產(chǎn)物中,包括了一系列依次相差一個核苷酸的DNA分子。通過電泳,這些DNA分子可按大小分開,根據(jù)末端堿基可讀出模板的DNA序列。雙脫氧核苷三磷酸(dideoxynucleotide,縮寫成ddNTP)是DNA合成的阻斷劑。雙脫氧核苷三磷酸有4種,分別對應(yīng)4種脫氧核苷三磷酸(dNTP),前者與后者的區(qū)別在于核糖的3'碳處缺乏一個羥基基團?!半p脫氧末端終止”的含義鏈終止法測序測定一個DNA分子序列,需要4個獨立的酶促反應(yīng):在每一反應(yīng)試管中,除模板DNA、DNA聚合酶、引物外,還分別加入一種互不相同的ddNTP和全部4種dNTP(其中有一種帶有32P同位素標記)。在DNA合成的任意位置,聚合酶可摻入一個dNTP到正在延伸的DNA鏈中,此時DNA的合成繼續(xù)進行;若聚合酶摻入的是ddNTP,則鏈的延伸將被阻斷,DNA的合成在該位置終止??偟慕Y(jié)果是,在4個反應(yīng)中,每個都產(chǎn)生一系列不同長度的DNA分子,每個DNA分子都以ddNTP為終點。

反應(yīng)混合物樣品加在聚丙烯酰胺凝膠上電泳分離片段大小。譜帶的判讀是從膠的底部開始,所得的核苷酸堿基順序,與模板鏈為互補鏈。鏈終止法測序(b)電泳及放射自顯影,顯示測序結(jié)果CTCACTCACCACTCACCAGTACTCACCAGTATGACTCACCAGTATGACACTCTCACCAGTCTCACCAGTATCTCACCAGTATGACATCTCACCAGCTCACCAGTATGCCTCCTCACCTCACCCTCACCAGTATGACGAGTGGTCATACTGTA5’3’模板DNA(單鏈)反應(yīng)1,加ddATP反應(yīng)3,加ddGTP反應(yīng)2,加ddTTP反應(yīng)4,加ddCTP各反應(yīng)中加入:DNA聚合酶引物dNTPCTCACCAGTATGACATCTCACCAGTATGACACTCACCAGTATGACCTCACCAGTATGACTCACCAGTATG

CTCACCAGTATCTCACCAGTACTCACCAGTCTCACCAGCTCACCACTCACCCTCACCTCACTCCTC

ATGCDNA序列(a)PCR,利用ddNTP終止DNA鏈的合成最大的困難:找到合適的引物每種ddNTP攜帶不同的32P同位素標記●DNA自動測序熒光化合物標記鏈終止法以熒光顏色為標記信號,每種ddNTP各有1種代表顏色;整個反應(yīng)在一個試管中進行;當新合成的終止單鏈通過熒光監(jiān)測儀時,可由光信號讀出末端核苷酸并由電腦記錄。以熒光化合物標記雙脫氧核苷酸的自動測序(a)PCR,利用ddNTP終止反應(yīng)(b)信號檢測(c)顯示結(jié)果測序反應(yīng),產(chǎn)物分離每種ddNTP攜帶不同的熒光標記ddAddC(紅)(藍)ddTddG(綠)(黃)檢測系統(tǒng)ddAddTddGddCddAddAddAddAddGddGddGddGddCddCddCddCddTddTddTAG

C

GTA

CCGTT

ACC

GGTAA顯示系統(tǒng)自動測序方法的優(yōu)勢:

●免除了同位素標記必須同時進行4組反應(yīng)的麻煩?!裼?個泳道同時判讀4種堿基,為自動化加樣及計算機閱讀提供了技術(shù)基礎(chǔ)?!癖苊饬巳庋鄯直娴恼`差,閱讀信號與計算機相連后,可直接對數(shù)據(jù)進行電腦處理,加快了基因組測序的進程?!窕蚪M全序列測定

1995年,用鳥槍法(shotgunapproach)完成了流感嗜血桿菌基因組的全序列測定,為基因組全序列測定提供了新的方法。

(a)DNA分子被打斷,產(chǎn)生小片段DNA(b)小片段DNA分別測序(c)根據(jù)DNA序列的重疊關(guān)系,構(gòu)建重疊群AGCCAATGCATTAGC…………ATGCAGCCAATGCAT重疊群DNA序列小片段DNADNA分子瓊脂糖凝膠電泳大小不同的DNA片段超聲波打斷DNA構(gòu)建序列的重疊群制備克隆文庫1.6-2.0kb的DNA片段從凝膠中提純DNA泳道1:超聲波處理的樣品DNA泳道2:DNA分子量標記末端序列流感嗜血桿菌提取DNA插入子兩端測序12

流感嗜血桿菌基因組鳥槍法測序流程(仿BrownT.A.,1999)

鳥槍法的主要優(yōu)點:速度快;無須提供相關(guān)遺傳圖和物理圖的資料。

鳥槍法的局限性:如果基因組太大,結(jié)構(gòu)過于復雜,序列組裝的起始階段工作量非常大,而且數(shù)據(jù)分析中出現(xiàn)錯誤的機率較大。對一些缺少重復順序的小基因組而言,鳥槍法仍是最佳的選擇。高等生物的基因組測序:

物理作圖與鳥槍法測序相結(jié)合

●物理作圖:

把基因組分解為眾多的具有一定長度的DNA片段,并對DNA片段進行克隆,構(gòu)建YAC或BAC等文庫,并構(gòu)建基因組的物理圖。

●亞克隆:

將大片段DNA分解為小片段DNA,然后再對小片段DNA進行克隆。直接用于DNA測序的DNA片段其長度通常為2-5kb。

●鳥槍法:

分別對各DNA片段進行測序。

●序列組裝:

鳥槍法測序后,再通過序列組裝、間隙填充和校正,構(gòu)建成全基因組序列。大規(guī)模測序平臺的構(gòu)成

文庫組培養(yǎng)組模板組電泳組反應(yīng)組

MegaBACE

上機組數(shù)據(jù)處理組基因組隨機文庫的構(gòu)建測序模板的制備測序反應(yīng)與純化反應(yīng)產(chǎn)物上機測序序列數(shù)據(jù)的接收、質(zhì)量評估、組裝等含有質(zhì)粒載體的大腸桿菌培養(yǎng)檢測模板質(zhì)量與測序定量自動測序儀服務(wù)器2、基因組的序列分析完成基因組測序是基因組計劃的第一步,下一步弄清基因組順序中所包含的全部遺傳信息。(1)搜尋基因

由于編碼基因中的堿基序列不是隨機排列的,存在著某些可以辨別的特征,因此可以利用這些特征來辨別DNA序列中的基因?!窨勺x框(openreadingframe,ORF)

所有編碼蛋白質(zhì)的基因都含有可讀框,由一系列指令氨基酸的密碼子(codon)組成。可讀框有一個起點,又稱起始密碼子(initiationcodon),一般為ATG,還有一個終點,又稱終止密碼子(terminationcodon),分別為TAA,TAG和TGA,三者含義相同。

一個ORF可能就是一個基因外顯子內(nèi)含子外顯子下游上游起始密碼子終止密碼子可讀框基因開放閱讀框/基因結(jié)構(gòu)分析識別工具Getorfhttp://bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlWeb/LinuxPlotorfhttp://bioweb.pasteur.fr/seqanal/interfaces/plotorf.htmlWeb/LinuxORFFinder/gorf/gorf.htmlWebBestORF/all.htmWebGENSCAN/GENSCAN.htmlWeb/LinuxGeneMarkhttp://www.ebi.ac.uk/genemark//GeneMark/WebGeneFinder/tools/genefinder/(Dr.MichaelZhang)WebFGENESH/all.htmWeb/LinuxGlimmerM/tdb/glimmerm/glmr_form.htmlLinuxFgeneSB/FgeneSV/all.htmWebGeneration/generation/WebGeneBuilderr.it/~webgene/genebuilder.htmlWebFGENESH+/++/all.htmWeb/LinuxGenomeScan/genomescan.htmlWebGeneWisehttp://www.sanger.ac.uk/Software/Wise2/WebGRAIL/grailexp/Web/Linux/WindowsBCMGeneFinder/seq-search/gene-search.htmlWeb核苷酸序列分析——ORF●同源查詢

利用數(shù)據(jù)庫中的基因序列與待查的基因組序列進行比較,從中查找出可與之匹配的堿基序列及其比例以便界定基因的方法,稱為同源查詢(homologysearch)。

原理:如果來自于不同生物體的兩個基因在功能上相似,那么在序列上也會相似(直系基因成員、平行基因或稱基因家族成員)。相似性有以下表現(xiàn):(1)存在某些完全相同的序列;(2)ORF讀框的排列類似,如等長的外顯子;(3)ORF指令的氨基酸序列相同;(4)模擬的多肽高級結(jié)構(gòu)相似。

同源查詢已成為界定基因的主要工具之一。

(2)基因功能預(yù)測

●任務(wù):

在確認DNA序列中的基因序列后,對其功能進行探知。

●手段:

計算機預(yù)測,其依據(jù)是同源性比較。當一個新基因序列被確定后,根據(jù)同源性可從數(shù)據(jù)庫中查找已知序列的同源基因。根據(jù)進化的相關(guān)性,可從已知的同源基因推測新基因的功能。

●同源基因類型:

直系基因(orthologousgene):又稱種間同源基因,是指不同物種之間的同源基因,它們來自物種分隔之前的同一祖先。

平行基因(paralogousgene):又稱種內(nèi)同源基因,是指同一種生物的同源基因,它們常常是多基因家族的成員,其共同的祖先基因可能存在于物種形成之后,也可能出現(xiàn)于物種形成之前。

第9章基因組學

§9.1基因組的結(jié)構(gòu)特征

§9.2基因組圖譜的構(gòu)建及應(yīng)用

§9.3后基因組學在基因組學的發(fā)展過程中,通常是先研究基因組的結(jié)構(gòu),然后再研究基因組的功能。功能基因組學是在結(jié)構(gòu)基因組學豐富信息資源的基礎(chǔ)上,應(yīng)用先進的基因表達技術(shù)、生物功能檢測技術(shù)和生物信息學技術(shù)分析研究基因的表達、調(diào)控和功能;探討生物的生長、發(fā)育規(guī)律的新型交叉學科。目前功能基因?qū)W的研究才剛開始,因此一般意義上的基因組學主要是指結(jié)構(gòu)基因組學,而把功能基因組學的研究時期又稱為后基因組學(post-genomics)時代。后基因組學的研究方法:生物信息學、DNA微列陣、蛋白質(zhì)組學等后基因組學研究領(lǐng)域:基因表達譜的研究蛋白質(zhì)組的研究基因組分析和基因功能研究基因組進化與生物進化的研究1、生物信息學(Bioinformatics)基本概念:

生物信息學(Bioinformatics)是多學科交叉的產(chǎn)物;是以計算機為工具對生物信息進行儲存、檢索和分析。具體說是從核酸和蛋白質(zhì)序列出發(fā),分析序列中與表達有關(guān)的結(jié)構(gòu)和功能的生物信息。

它是伴隨著DNA序列資料以驚人的速度增長而發(fā)展起來的,是21世紀自然科學的核心領(lǐng)域之一。

基因組信息學一方面為基因組全序列測定等研究計劃提供信息處理技術(shù),以加快全基因組測序的進程;另一方面建立和完善數(shù)據(jù)庫,對不斷增長的序列數(shù)據(jù)進行組織和管理,并為數(shù)據(jù)庫的有效利用提供新的信息技術(shù)。

cDNA序列基因組序列蛋白質(zhì)序列翻譯CodonbiasGCContent酶切位點引物設(shè)計編碼區(qū)預(yù)測基因結(jié)構(gòu)分析選擇性剪切SNP序列比對功能注釋KEGGGO系統(tǒng)發(fā)育樹蛋白質(zhì)理化性質(zhì)二級結(jié)構(gòu)預(yù)測結(jié)構(gòu)域分析重要信號位點分析三級結(jié)構(gòu)預(yù)測生物學信息學的內(nèi)容(基本問題)○序列的比對(Alignment)DNA序列的對比BLAST和ASTA○基因識別與DNA序列分析編碼區(qū)GRAIL,GenParser和GeneID○蛋白質(zhì)結(jié)構(gòu)預(yù)測二級、三級結(jié)構(gòu)的預(yù)測(第2套生物學密碼)○分子進化DNA結(jié)構(gòu),蛋白質(zhì)結(jié)構(gòu)生物信息學數(shù)據(jù)庫

生物信息學數(shù)據(jù)庫(database或databank)主要分為兩大類:

基本數(shù)據(jù)庫:包括原始數(shù)據(jù),如DNA序列、蛋白質(zhì)序列和蛋白質(zhì)結(jié)構(gòu)等信息。

二級數(shù)據(jù)庫:對基本數(shù)據(jù)庫進行分析、提煉加工后形成的,旨在使得基本數(shù)據(jù)庫更便于生物學家使用。如蛋白質(zhì)序列中的共同結(jié)構(gòu)和功能基序數(shù)據(jù)庫(PROSITEdatabase)等。

一些重要生物信息學數(shù)據(jù)庫數(shù)據(jù)庫類別數(shù)據(jù)內(nèi)容 數(shù)據(jù)庫 組織網(wǎng)址基本數(shù)據(jù)庫

核酸序列 GenBank(1982)美國國家生物技術(shù)信息中心 EMBL(1982)歐洲生物信息學研究所 http://www.ebi.ac.uk DDBJ(1984)日本國立遺傳學研究所 http://www.ddbj.nig.ac.jp 氨基酸序列PIR(1968)美國國家生物醫(yī)學研究基金會 PRF(1979)日本蛋白質(zhì)研究基金會 http://www.prf.or.jp SWISS-PROT(1986) 瑞士生物信息研究所 http://www.expasy.ch 三維分子結(jié)構(gòu) PDB(1971)結(jié)構(gòu)生物信息學研究協(xié)作組織 CSD(1965)劍橋

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論