生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用_第1頁
生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用_第2頁
生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用_第3頁
生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用_第4頁
生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用 摘 要:生物信息學(xué)是基因、基因結(jié)構(gòu)、基因產(chǎn)物功能分析必不可少的技術(shù)手段。根據(jù)生物信息數(shù)據(jù)庫的現(xiàn)狀,討論了生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用,如挖掘新的基因、電子克隆及系統(tǒng)進(jìn)化分析等。將生物信息學(xué)與常規(guī)育種技術(shù)相結(jié)合,對提高育種效率,創(chuàng)新遺傳資源,加快作物改良進(jìn)程都有重要意義。關(guān)鍵詞:農(nóng)業(yè);生物信息;數(shù)據(jù)庫;基因;作物育種; Applications of Biological Information in AgricultureStudent:wangpingyongTutor:zhoumeilan(College of Agriculture, Hunan Agricultu

2、ral University, Changsha 410128, China)Abstract :Biological information was the essential technique for agricultural science , which could be used to analyze the gene , the gene structure ,the function of gene product . The present situation of biological information database was introduced. The app

3、lication of agricultural biological information in dredging up new gene , electric cloning and analysis of phylogenetic evolution was discussed. The combination of biological information and conventional breeding technique was important for improving breeding efficiency ,creating new genetic resourc

4、es and boosting crop improvement .Key words: Agriculture ; Biological information ; Database ; Gene ; Crop breeding 1 前言 生物信息學(xué)(Bioinformatics) 是由生物科學(xué)、計算機(jī)科學(xué)、信息科學(xué)、應(yīng)用數(shù)學(xué)、統(tǒng)計學(xué)等多學(xué)科交叉融合而成的一門新興學(xué)科,由包括數(shù)據(jù)庫、計算機(jī)網(wǎng)絡(luò)和應(yīng)用軟件3 大部分構(gòu)成1 。生物信息學(xué)以計算機(jī)為主要工具,開發(fā)各種軟件,對日益增長的核苷酸、蛋白質(zhì)的序列和結(jié)構(gòu)等相關(guān)信息進(jìn)行收集、儲存、提取、分析和研究,同時建立理論模型,指導(dǎo)實驗研究。生物信息學(xué)是進(jìn)

5、行農(nóng)作物基因組學(xué)研究的基礎(chǔ),是基因、基因結(jié)構(gòu)、基因產(chǎn)物功能分析必不可少的技術(shù)手段。隨著遺傳操作技術(shù)特別是動植物細(xì)胞基因轉(zhuǎn)移技術(shù)的不斷創(chuàng)新和完善,如外源基因在轉(zhuǎn)基因禾谷類作物中的表達(dá)、“報告基因”用于植物的轉(zhuǎn)化、優(yōu)良性狀基因的分離等一系列技術(shù)的突破,將生物信息學(xué)與常規(guī)育種技術(shù)相結(jié)合,對提高育種效率,創(chuàng)新遺傳資源,加快作物改良進(jìn)程都有重要意義2 。2 生物信息數(shù)據(jù)庫數(shù)據(jù)庫是信息處理的基礎(chǔ),而生物信息數(shù)據(jù)庫則是生物信息工作的出發(fā)點。全世界的農(nóng)學(xué)家、生物信息學(xué)家已充分認(rèn)識到生物信息學(xué)與農(nóng)業(yè)結(jié)合將推動農(nóng)業(yè)的發(fā)展,高質(zhì)量的完善的農(nóng)作物生物信息數(shù)據(jù)庫的建立將為農(nóng)作物基因組學(xué)的研究奠定基礎(chǔ)3 。2. 1 序列

6、數(shù)據(jù)庫序列數(shù)據(jù)庫主要存放DNA 或蛋白質(zhì)的序列信息, 著名的序列數(shù)據(jù)庫有GENEBANK、DDBJ 、EMBL、SWISS2PORT以及PSD 等。GENEBANK序列數(shù)據(jù)庫由美國國家生物技術(shù)信息中心(NCBI) 維護(hù)(http :/ / www. ncbi . nlm. ) ;EMBL 由歐洲生物信息學(xué)研究所( EBI) 維護(hù)( http :/ /www. ebi . ac. uk) ,SWISS2PORT 也由EBI 維護(hù);DDBJ 由日本國立遺傳學(xué)研究所維護(hù)( http :/ / www. ddbj . nig. ac. jp ) 。GENEBANK、DDBJ 和EMBL

7、共同構(gòu)成“國際合作核酸數(shù)據(jù)庫”,其每天都會交換數(shù)據(jù),使這3 個數(shù)據(jù)庫的數(shù)據(jù)同步。PIR國際蛋白質(zhì)序列數(shù)據(jù)庫( PSD) 是由蛋白質(zhì)信息資源(PIR) 、慕尼黑蛋白質(zhì)序列信息中(MIPS) 和日本國際蛋白質(zhì)數(shù)據(jù)庫(J IPID) 共同維護(hù)的國際上最大的公共蛋白質(zhì)數(shù)據(jù) 庫(http :/ / pir. geogetown. edu) 。2. 2 基因組數(shù)據(jù)庫 基因組數(shù)據(jù)庫描述不同分辨率下的基因組結(jié)構(gòu),以及不同層次上基因組的結(jié)構(gòu),包括基因定位、排列次序、分子之間的距離、克隆組集、探針、物理圖等,表1 列出了部分農(nóng)業(yè)基因組數(shù)據(jù)庫。部分農(nóng)作物的物理圖、遺傳圖、基因組序列、基因及基因組注解的信息可以從NC

8、BI 得到,如水稻、大豆、大麥、小麥、玉米和燕麥等的遺傳圖譜可通過NCBI Map Viewer (http :/ / www. ncbi . nlm. nih. gov/ mapview/ )獲得。2. 3 基因表達(dá)數(shù)據(jù)庫基因表達(dá)數(shù)據(jù)庫收集基因表達(dá)和微陣列雜交數(shù)據(jù)并校對,是在線提供基因的表達(dá)瀏覽、查詢和檢索的有用資源4 。在作物育種中常用的基因表達(dá)數(shù)據(jù)庫是NCBI 的GEO(http :/ / www. ncbi . nlm. nih. gov/ geo/ ) 。3 生物信息學(xué)在農(nóng)業(yè)上的應(yīng)用3. 1 數(shù)據(jù)挖掘與利用農(nóng)業(yè)生物信息數(shù)據(jù)庫可以高效地實現(xiàn)農(nóng)業(yè)數(shù)據(jù)的入、查詢、統(tǒng)計等較低層次的功能,實現(xiàn)

9、數(shù)據(jù)的積累。但從堆積如山的數(shù)據(jù)中提取有用的信息,如尋找數(shù)據(jù)中存在的關(guān)系和規(guī)則、挖掘并識別作物的重要基因、發(fā)現(xiàn)新基因、加快基因克隆的速度等,都需要強(qiáng)有力的生物信息學(xué)工具。利用生物信息學(xué)工具就有可能對現(xiàn)有的農(nóng)作物品種進(jìn)行改造,甚至創(chuàng)造新的物種,豐富種質(zhì)資源,以滿足人類營養(yǎng)健康需要。張業(yè)勤利用EST 數(shù)據(jù)庫(dbEST) 對水稻新基因進(jìn)行了搜索,并對其功能進(jìn)行了預(yù)測5 ;Picoult2Newberg 等在來自19 個不同cDNA 文庫的EST 序列中完成了850 個候選SNP 位點的發(fā)掘6 ;Jin 等搜索公共數(shù)據(jù)庫中與之高度同源的BAC 克隆和EST 序列,并根據(jù)多重比對的結(jié)果設(shè)計引物,所有擴(kuò)增

10、片段經(jīng)再測序后, 發(fā)現(xiàn)一個C/ T 型SNP(RSP04) ,定位在距fgr 基因2 cM處,并認(rèn)為他可用于香米品種的篩選7 。李華盛等利用生物信息學(xué)方法在含有9 470 條棉花EST序列的數(shù)據(jù)庫中進(jìn)行微衛(wèi)星標(biāo)記篩選,共發(fā)現(xiàn)微衛(wèi)星序列4 396 個,占整個EST 數(shù)據(jù)庫的4. 64 %。其中雙堿基重復(fù)序列1 282 個、三堿基序列2 411 個,分別占在EST 數(shù)據(jù)庫中發(fā)現(xiàn)微衛(wèi)星序列總數(shù)的29. 27 %和54. 8 %8 。3. 2 基因組分析農(nóng)業(yè)生物信息學(xué)能夠快速進(jìn)行數(shù)據(jù)分析和研究,因此提供了高效基因組分析平臺。從大規(guī)?;驕y序所提供的關(guān)于DNA 中核苷酸的分布序列中,利用現(xiàn)有的生物學(xué)知識

11、和序列信息,并結(jié)合一些成熟的統(tǒng)計計算方法可。以深入分析基因組序列信息、闡明基因功能。目前該方面的研究主要集中在水稻( Oryza sative)上,2002 年我國的科學(xué)家和Sngenta 公司的科學(xué)家分別發(fā)表了秈稻和粳稻基因組工作框架圖9 ,隨后日本和我國的科學(xué)家又分別公布了粳稻第2號和第4 號染色體的全序列10 - 11 以及秈稻、粳稻基因的精細(xì)結(jié)構(gòu)圖。Yuan 等在水稻數(shù)據(jù)庫中挑選了部分EST 和BAC末端,搜索已發(fā)表的遺傳標(biāo)記,鑒別出418 個遺傳標(biāo)記與BAC末端整合在一起,獲得了一套間隔大于1 Mb 的插入克隆12 ,有利于加速水稻目的基因精細(xì)物理圖譜的構(gòu)建。整合水稻的遺傳圖譜和物理

12、圖譜將會大大加快基因克隆及新基因發(fā)掘的過程。隨著2003 年人類基因組計劃的完成,生命科學(xué)的研究步入后基因組時代。在后基因組時代,研究重心轉(zhuǎn)移到基因功能的解析,即在轉(zhuǎn)錄組和蛋白質(zhì)組水平上系統(tǒng)地分析基因的功能13 。水稻的功能基因組學(xué)研究已經(jīng)開始,我國、美國和日本科學(xué)家都已做了大量的工作。我國科學(xué)家進(jìn)行超級雜交水稻母本“培矮64s”的比較基因組研究,在此基礎(chǔ)上,將全面開展雜交稻雜種優(yōu)勢機(jī)理研究和基因預(yù)測分析;解析和發(fā)現(xiàn)與水稻育性、豐產(chǎn)、優(yōu)質(zhì)、抗病、耐逆、成熟期等有關(guān)的遺傳信息和功能基因;進(jìn)而發(fā)現(xiàn)控制優(yōu)良性狀如米質(zhì)、香味、抗性的因子,為我國的水稻應(yīng)用研究和育種提供全面的生物信息服務(wù)14 。山東省農(nóng)

13、業(yè)科學(xué)院高新技術(shù)研究中心向美國國立生物技術(shù)信息中心的基因數(shù)據(jù)庫一次性注冊4 406 個花生基因表達(dá)序列標(biāo)記EST,并累計注冊了270 個花生基因,標(biāo)志著我國花生功能基因組學(xué)研究取得重要進(jìn)展,已躋身世界先進(jìn)行列15 。其他作物,如玉米、小麥等的功能基因組學(xué)研究也相繼開展。嚴(yán)建兵等基于玉米株高性狀的EST 序列與水稻基因組的比較,在PN < 1e 210 水平上,一共找到7 853 段同源序列,將其中2 729 段序列與水稻的物理圖譜和分子標(biāo)記連鎖圖進(jìn)行比對定位,最終將896 段同源序列整合在水稻分子標(biāo)記連鎖圖上,形成了在序列水平上的玉米和水稻的比較基因組圖譜16 。因此生物信息學(xué)促使生物學(xué)

14、家進(jìn)行世界性的合作,大大促進(jìn)了全世界生物學(xué)家、生物信息學(xué)家之間的交流,他們可以共享已有的數(shù)據(jù)、資源、方法和平臺,極大地推動了生物學(xué)的研究。開展的大規(guī)模作物基因組學(xué)研究,為促進(jìn)作物分子遺傳定向改良、培育高產(chǎn)優(yōu)質(zhì)新品種方面的研究作出了突出貢獻(xiàn)。3. 3 電子克隆基于生物信息學(xué)資源的電子克隆是利用計算機(jī)技術(shù),依托現(xiàn)有的網(wǎng)絡(luò)資源( EST 數(shù)據(jù)庫、核苷酸數(shù)據(jù)庫、蛋白質(zhì)數(shù)據(jù)庫、基因組數(shù)據(jù)庫等) ,采用生物信息學(xué)方法(包括同源性檢索、聚類、序列拼裝等) ,通過EST 或基因組的序列組裝和拼接,利用RT - CR 快速地獲得部分乃至全長cDNA 序列的方法17 - 18 。電子克隆具有: 速度快,同源性比較

15、、序列拼接組裝等工作在計算機(jī)上完成,只有RT - PCR序列驗證需進(jìn)行實驗; 投入低,電子克隆僅需能夠上網(wǎng)的計算機(jī)和PCR 儀等儀器即可進(jìn)行,研究成本較低; 技術(shù)要求低,實驗室工作只涉及到RNA 抽提、反轉(zhuǎn)錄、PCR 擴(kuò)增等分子生物學(xué)的基本實驗,研究人員很容易掌握; 針對性強(qiáng),擬克隆基因的生物學(xué)功能大都比較明確,一旦獲得即可直接用轉(zhuǎn)基因技術(shù)進(jìn)行作物品種改良。目前作物中公布的基因組序列比較多,使得作物基因克隆越來越多的利用已有的序列信息資源。利用生物信息學(xué)技術(shù)進(jìn)行水稻功能基因電子克隆的報道近幾年來逐漸增加。黃驥等以來源于水稻鹽脅迫cDNA 文庫的1 個500 bp 的ESTS121 為信息探針,

16、搜索位于GenBank 的水稻EST庫,發(fā)現(xiàn)有2個EST與S121 部分序列一致,經(jīng)過拼接組裝獲得了1 個886bp 的全長cDNA 序列,同源性比較結(jié)果表明,其可能編碼一個新的水稻鋅指蛋白基因19 。3.4 系統(tǒng)發(fā)育的分析大部分系統(tǒng)發(fā)育研究都是圍繞3個或者更多基因或生物體之間進(jìn)化關(guān)系典型圖示的概念進(jìn)行的。采用分子系統(tǒng)發(fā)生分析法對作物DNA 和蛋白質(zhì)序列分析,一般不存在因為趨同進(jìn)化造成的親緣關(guān)系很遠(yuǎn)的生物體進(jìn)化出相似的表型,以及生物體可能沒有可用來進(jìn)行系統(tǒng)分析的表型特征的問題。DNA 序列數(shù)據(jù)所提供的信息比任何其他形式的分子都要豐富,在序列水平自然選擇的影響一般并不顯著。因此當(dāng)可以獲得其他數(shù)據(jù)

17、(如形態(tài)學(xué)數(shù)據(jù)) 時和得到的分子系統(tǒng)發(fā)生史和形態(tài)系統(tǒng)發(fā)生史有差別時,分子系統(tǒng)發(fā)生分析常常是檢驗自然選擇對形態(tài)差異的好方法。同時還體現(xiàn)了他們的分歧時間和共同祖先的特征,使回答關(guān)于地球上作物的發(fā)展歷史和親緣關(guān)系這種基礎(chǔ)性問題變得簡單了;對種質(zhì)資源的保存和利用也提供了更好的依據(jù)20 。馬軒杜等以EMBL 核酸數(shù)據(jù)庫中收錄的棉花ITS 序列選擇了15 條包括美洲棉、澳洲棉和四倍體棉在內(nèi)的序列構(gòu)建棉屬親緣樹分子親緣樹21與Fryxell 的棉屬系統(tǒng)發(fā)育分枝順序22基本一致。值得關(guān)注的是魯濱遜氏棉( G. robinsonii) 和雷蒙德氏棉( G. raimondii) 在該進(jìn)化樹上的位置與Fryxel

18、l 報道的不太吻合;印麗萍等進(jìn)行了假高粱及其近似種rDNA ITS 序列同源性分析,發(fā)現(xiàn)S . halepense 、S. silk , S. vulgare X S. sudanense, S . vulgare、高粱S . bicolor 等屬于同一聚類組,親緣關(guān)系比較近,同源性為97. 9 %100 %。S. nitidum 和S. versicolor 屬于另一個聚類組,親緣關(guān)系也比較近,同源性為97. 7 %。S .halepense 和S. nitiduarz , S . versicolor ITS 區(qū)序列差異大23 。樊龍江等利用8 個全長mRNA 基因序列比較了竹類植物和水稻

19、等禾本科作物的系統(tǒng)進(jìn)化和序列組成。結(jié)果表明,與水稻、玉米和麥類作物的比較中,竹類植物與水稻有著最近的親緣關(guān)系和更相似的基因序列特征。4 建議與展望目前農(nóng)業(yè)生物信息數(shù)據(jù)發(fā)展迅速,如何利用國際上已有的信息學(xué)研究成果,結(jié)合我國實際服務(wù)于農(nóng)作物基因工程育種研究是當(dāng)務(wù)之急。(1) 農(nóng)作物育種方面的生物信息數(shù)據(jù)庫分布分散且格式不統(tǒng)一,專業(yè)的高質(zhì)量的生物信息數(shù)據(jù)庫數(shù)量較少,在整個生物信息數(shù)據(jù)庫中所占的比例也不高。目前已開發(fā)應(yīng)用的農(nóng)業(yè)生物信息數(shù)據(jù)庫主要集中在英、美等發(fā)達(dá)國家,一些發(fā)展中國家的研究組織由于資金和技術(shù)問題難以建成完善的農(nóng)業(yè)生物信息系統(tǒng)。世界各國應(yīng)協(xié)力合作,創(chuàng)建一個共享的農(nóng)業(yè)生物信息大平臺,為農(nóng)業(yè)生物信息資源的用戶提供高質(zhì)量的服務(wù)。(2) 重視農(nóng)業(yè)生物信息學(xué)與常規(guī)育種,特別是與雜交育種技術(shù)的有機(jī)結(jié)合。避免對生物信息學(xué)的兩個極端認(rèn)識: 認(rèn)為生物信息學(xué)人人都可以做,而且不需要多少成本,不需要做任何試驗等; 將生物信息學(xué)的作用神圣化,認(rèn)為它可以解一切問題。實際上,生物信息學(xué)研究不可能完全代替試驗操

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論