生物信息學進展淺論的論文_第1頁
生物信息學進展淺論的論文_第2頁
生物信息學進展淺論的論文_第3頁
生物信息學進展淺論的論文_第4頁
生物信息學進展淺論的論文_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

-本文為網(wǎng)絡(luò)收集精選范文、公文、論文、和其他應(yīng)用文檔,如需本文,請下載-生物信息學進展淺論的論文本文從網(wǎng)絡(luò)收集而來,上傳到平臺為了幫到更多的人,如果您需要使用本文檔,請點擊下載按鈕下載本文檔(有償下載),另外祝您生活愉快,工作順利,萬事如意! 論文 關(guān)鍵詞生物信息學 生命 科學 論文摘要生物信息學是80年代以來新興的一門邊緣學科,信息在其中具有廣闊的前景。伴隨著人類基因組計劃的勝利完成與生物信息學的 發(fā)展 有著密不可分的聯(lián)系,生物信息學的發(fā)展為生命科學的發(fā)展為生命科學的研究帶來了諸多的便利,對此作了簡單的分析。 一、生物信息學的產(chǎn)生 21世紀是生命科學的世紀,伴隨著人類基因組計劃的勝利完成,與此同時,諸如大腸桿菌、結(jié)核桿菌、啤酒酵母、線蟲、果蠅、小鼠、擬南芥、水稻、玉米等等其它一些模式生物的基因組計劃也都相繼完成或正在順利進行。人類基因組以及其它模式生物基因組計劃的全面實施,使分子生物數(shù)據(jù)以爆炸性速度增長。在 計算 機科學領(lǐng)域,按照摩爾定律飛速前進的計算機硬件,以及逐步受到各國政府重視的信息高速公路計劃的實施,為生物信息資源的研究和應(yīng)用帶來了福音。及時、充分、有效地利用 網(wǎng)絡(luò) 上不斷增長的生物信息數(shù)據(jù)庫資源,已經(jīng)成為生命科學和生物技術(shù)研究開發(fā)的必要手段,從而誕生了生物信息學。 二、生物信息學研究內(nèi)容 (一)序列比對 比較兩個或兩個以上符號序列的相似性或不相似性。序列比對是生物信息學的基礎(chǔ)。兩個序列的比對現(xiàn)在已有較成熟的動態(tài)規(guī)劃算法,以及在此基礎(chǔ)上編寫的比對軟件包balst和fasta,可以免費下載使用。這些軟件在數(shù)據(jù)庫查詢和搜索中有重要的應(yīng)用。有時兩個序列總體并不很相似,但某些局部片斷相似性很高。smith-waterman算法是解決局部比對的好算法,缺點是速度較慢。兩個以上序列的多重序列比對目前還缺乏快速而又十分有效的算法。 (二)結(jié)構(gòu)比對 比較兩個或兩個以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性。 (三)蛋白質(zhì)結(jié)構(gòu)預測 從方法上來看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設(shè)出發(fā)來預測和研究蛋白質(zhì)的結(jié)構(gòu)和折疊過程。分子力學和分子動力學屬這一范疇。后者主要是從觀察和 總結(jié) 已知結(jié)構(gòu)的蛋白質(zhì)結(jié)構(gòu) 規(guī)律 出發(fā)來預測未知蛋白質(zhì)的結(jié)構(gòu)。同源模建和指認(threading)方法屬于這一范疇。雖然經(jīng)過30余年的努力,蛋白結(jié)構(gòu)預測研究現(xiàn)狀遠遠不能滿足實際需要。 (四)計算機輔助基因識別 給定基因組序列后,正確識別基因的范圍和在基因組序列中的精確位置.這是最重要的課題之一,而且越來越重要。經(jīng)過20余年的努力,提出了數(shù)十種算法,有十種左右重要的算法和相應(yīng)軟件上網(wǎng)提供免費服務(wù)。原核生物計算機輔助基因識別相對容易些,結(jié)果好一些。從具有較多內(nèi)含子的真核生物基因組序列中正確識別出起始密碼子、剪切位點和終止密碼子,是個相當困難的問題,研究現(xiàn)狀不能令人滿意,仍有大量的工作要做。 (五)非編碼區(qū)分析和dna語言研究 在人類基因組中,編碼部分進展總序列的35%,其它通常稱為“垃圾”dna,其實一點也不是垃圾,只是我們暫時還不知道其重要的功能。分析非編碼區(qū)dna序列需要大膽的想象和嶄新的研究思路和方法。dna序列作為一種遺傳語言,不僅體現(xiàn)在編碼序列之中,而且隱含在非編碼序列之中。 三、生物信息學的新技術(shù) (一)lipshutz(affymetrix,santa clara,ca,usa) 描述了一種利用dna探針陣列進行基因組研究的方法,其原理是通過更有效有作圖、表達檢測和多態(tài)性篩選方法,可以實現(xiàn)對人類基因組的測序。光介導的化學合成法被應(yīng)用于制造小型化的高密度寡核苷酸探針的陣列,這種通過軟件包件設(shè)計的寡核苷酸探針陣列可用于多態(tài)性篩查、基因分型和表達檢測。然后這些陣列就可以直接用于并行dna雜交分析,以獲得序列、表達和基因分型信息。milosavljevic(curagen, branford, ct, usa)介紹了一種新的基于專用定量表達分析方法的基因表達檢測系統(tǒng),以及一種發(fā)現(xiàn)基因的系統(tǒng)genescape。為了有效地抽樣表達,特意制作片段模式以了解特定基因的子序列的發(fā)生和冗余程度。他在酵母差異基因表達的大規(guī)模研究中對該技術(shù)的性能進行了驗證,并論述了技術(shù)在基因的表達、生物學功能以及疾病的基礎(chǔ)研究中的應(yīng)用。 (二)基因的功能分析 overton(university of pennsylvania school of medicine,philadelphia,pa,usa)論述了人類基因組計劃的下一階段的任務(wù)基因組水平的基因功能分析。這一階段產(chǎn)生的數(shù)據(jù)的分析、管理和可視性將毫無疑問地比第一階段更為復雜。他介紹了一種用于脊椎動物造血系統(tǒng)紅系發(fā)生的功能分析的原型系統(tǒng)e-podb,它包括了用于集成數(shù)據(jù)資源的kleisli系統(tǒng)和建立internet或intranet上視覺化工具的biowidget圖形用戶界面。epodb有可能指導實驗人員發(fā)現(xiàn)不可能用傳統(tǒng)實驗方法得到的紅系發(fā)育的新的藥物靶,制藥業(yè)所感興趣的是全新的藥物靶,epodb提供了這樣一個機會,這可能是它最令人激動的地方。 babbitt(university of california,san francisco,ca,usa)討論了通過數(shù)據(jù)庫搜索來識別遠緣蛋白質(zhì)的方法。對蛋白質(zhì)超家族的結(jié)構(gòu)和功能的相互依賴性的理解,要求了解 自然 所塑造的一個特定結(jié)構(gòu)模板的隱含限制。蛋白質(zhì)結(jié)構(gòu)之間的最有趣的關(guān)系經(jīng)常在分歧的序列中得以表現(xiàn),因而區(qū)分得分低(low-scoring)但生物學關(guān)系顯著的序列與得分高而生物學關(guān)系較不顯著的序列 是重要的。babbit證明了通過使用blast檢索,可以在數(shù)據(jù)庫搜索所得的低得分區(qū)識別遠緣關(guān)系(distant relationship)。levitt(stanford univeersity,palo alto,ca,usa)討論了蛋白質(zhì)結(jié)構(gòu)預測和一種僅從序列數(shù)據(jù)對功能自動模建的方法?;蚬δ苋Q于基因編碼的蛋白質(zhì)的三級結(jié)構(gòu),但數(shù)據(jù)庫中蛋白質(zhì)序列的數(shù)目每18個月翻一番。為了確定這些序列的功能,結(jié)構(gòu)必須確定。同源模建和從頭折疊(ab initio folding)方法是兩種現(xiàn)有的互為補充的蛋白質(zhì)結(jié)構(gòu)預測方法;同源模建是通過片段匹配(segment matching)來完成的, 計算 機程棄segmod就是基于同源模建方法的。 (三)新的數(shù)據(jù)工具 letovsky(johns hopkins university,baltimore,md,usa)介紹了gdb數(shù)據(jù)庫,它由每條人類染色體的許多不同圖譜組成,包括細胞遺傳學、遺傳學、放射雜交和序列標簽位點(sts)的內(nèi)容,以及由不同研究者用同種方法得到的圖譜。就位置查詢而言,如果不論其類型(type)和來源(source),或者是否它們正好包含用以批定感興趣的區(qū)域的標志(markers),能夠搜索所有圖譜是有用的。為此目的,該數(shù)據(jù)庫使用了一種公用坐標系統(tǒng)(common coordinate system)來排列這些圖譜。數(shù)據(jù)庫還提供了一張高分辨率的和與其他圖譜共享許多標志的圖譜作為標準。共享標志的標之間的對應(yīng)性容許同等于所有其它圖譜的標準圖譜的分配。 candlin(pe applied biosystems,foster city,ca,usa)介紹了一種新的存儲直接來自abprism dna測序儀的數(shù)據(jù)的關(guān)系數(shù)據(jù)庫系統(tǒng)biolims。該系統(tǒng)可以與其它測序儀的數(shù)據(jù)集成,并可方便地與其它軟件包自動調(diào)用,為測序儀與序列數(shù)據(jù)的集成提供了一種開放的、可擴展的生物信息學平臺。 參考 文獻 : 1lim

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論