生物信息學課件_第1頁
生物信息學課件_第2頁
生物信息學課件_第3頁
生物信息學課件_第4頁
生物信息學課件_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學Bioinformatics生物信息學緒 論v1. 什么是生物信息學?v2. 生物信息學的產(chǎn)生v3. 生物信息學發(fā)展過程v4. 生物信息學的基本方法v5. 生物信息學的研究內(nèi)容v6. 生物信息學的應用v7. 基因組信息學的首要任務v8. 生物信息學的重要研究課題v9. 生物信息學的商業(yè)價值v10. 通過學習應逐漸掌握的內(nèi)容生物信息學1. 什么是生物信息學?vWhat is bioinformatics ?vWhat do you know about bioinformatics ?v收集、維護、傳播、分析以及利用在分子生物學研究中獲得的大量數(shù)據(jù)。生物信息學(bioinformati

2、cs)是生物學與計算機科學以及應用數(shù)學等學科相互交叉而形成的一門新興學科。它通過對生物學實驗數(shù)據(jù)的獲取、加工、存儲、檢索與分析,進而達到揭示數(shù)據(jù)所蘊含的生物學意義的目的。由于當前生物信息學發(fā)展的主要推動力來自分子生物學,生物信息學的研究主要集中于核苷酸和氨基酸序列的存儲、分類、檢索和分析等方面,所以目前生物信息學可以狹義地定義為:將計算機科學和數(shù)學應用于生物大分子信息的獲取、加工、存儲、分類、檢索與分析,以達到理解這些生物大分子信息的生物學意義的交叉學科。生物信息學1. 什么是生物信息學? 現(xiàn)代分子生物學的發(fā)展,特別是人基因組計劃的實施,使生物學家所面對的數(shù)據(jù)不再是實驗記錄本上或文獻上的幾行簡

3、單數(shù)字,而是公共數(shù)據(jù)庫中數(shù)以千兆計的記錄。v基因組信息是生物信息中最基本的表達形式,并且基因組信息量在生物信息量中占有極大的比重,但是,生物信息并不僅限于基因組信息,生物信息學也不等于是基因組信息學。廣義的說,生物信息不僅包括基因組信息,如基因的DNA序列、染色體定位,也包括基因產(chǎn)物(蛋白質(zhì)或RNA)的結構和功能及各生物種間的進化關系等其他信息資源。生物信息學1. 什么是生物信息學?vWhat is bioinformatics ?vGenome informatics is a scientific discipline that encompasses all aspects of gen

4、ome information acquisition, processing, storage, distribution, analysis, and interpretation. 生物信息學, 它是一個學科領域,包含著基因組信息的獲取、處理、存儲、分配 、分析和解釋的所有方面。 (The U.S. Human Genome Project: The First Five Years FY 1991-1995, by NIH and DOE) ?生物信息學2. 生物信息學的產(chǎn)生v生物信息學(bioinformatics)是80年代末隨著人類基因組計劃(Human genome proje

5、ct)的啟動而興起的一門新的交叉學科。它涉及生物學、數(shù)學、計算機科學和工程學,依賴于計算機科學、工程學和應用數(shù)學的基礎,依賴于生物實驗和衍生數(shù)據(jù)的大量儲存。生物信息學不只是一門為了建立、更新生物數(shù)據(jù)庫及獲取生物數(shù)據(jù)而聯(lián)合使用多項計算機科學技術的應用性學科,也不僅僅是只限于生物信息學這一概念的理論性學科。事實上,它是一門理論概念與實踐應用并重的學科。v生物信息學的產(chǎn)生發(fā)展僅有10年左右的時間 bioinformatics這一名詞在1991年左右才在文獻中出現(xiàn),還只是出現(xiàn)在電子出版物的文本中。事實上,生物信息學的存在已有30多年,只不過最初常被稱為基因組信息學。生物信息學3. 生物信息學發(fā)展過程v

6、20世紀50年代末 數(shù)學模型、統(tǒng)計學方法和計算機處理宏觀生物學數(shù)據(jù)。數(shù)量分類學、數(shù)學生態(tài)。v應用于分子生物學:分子生物學數(shù)據(jù)庫、蛋白質(zhì)結構分析與預測。v人類基因組計劃(human genome project, HGP):1990年啟動,10年時間完成草圖(3x10e9個堿基對,2.91x10e9并對30,000多個基因進行了注釋)。v越來越多的微生物和其他模式生物也完成了全基因組測序工作。生物信息學3. 生物信息學的發(fā)展過程大致經(jīng)歷了3個階段:v前基因組時代生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)、DNA和蛋白質(zhì)序列分析、全局和局部的序列對位排列;v基因組時代基因?qū)ふ液妥R別、網(wǎng)絡數(shù)據(jù)庫系統(tǒng)的建立、交

7、互界面的開發(fā);v后基因組時代大規(guī)?;蚪M分析、蛋白質(zhì)組分析。生物信息學3. 生物信息學的發(fā)展過程v世紀后期,生物科學技術迅猛發(fā)展,無論從數(shù)量上還是從質(zhì)量上都極大地豐富了生物科學的數(shù)據(jù)資源。數(shù)據(jù)資源的急劇膨脹迫使人們尋求一種強有力的工具去組織這些數(shù)據(jù),以利于儲存、加工和進一步利用。而海量的生物學數(shù)據(jù)中必然蘊含著重要的生物學規(guī)律,這些規(guī)律將是解釋生命之謎的關鍵,人們同樣需要一種強有力的工具來協(xié)助人腦完成對這些數(shù)據(jù)的分析工作。另一方面,以數(shù)據(jù)分析、處理為本質(zhì)的計算機科學技術和網(wǎng)絡技術迅猛發(fā)展,并日益滲透到生物科學的各個領域。于是,一門嶄新的、擁有巨大發(fā)展?jié)摿Φ男聦W科生物信息學悄然興起。生物信息學3.

8、 生物信息學的發(fā)展過程生物信息學的生物信息學的誕生誕生及其重要性:及其重要性:v早在1956年,在美國田納西州蓋特林堡(Datlinburg)召開的首次“生物學中的信息理論研討會”上,便產(chǎn)生了生物信息學的概念。但是,就生物信息學的發(fā)展而言,它還是一門相當年輕的學科。直到20世紀8090年代,伴隨著計算機科學技術的進步,生物信息學才獲得突破性進展。v1987年,林華安博士正式把這一學科命名為“生物信息學” (Bioinformatics)。此后,其內(nèi)涵隨著研究的深入和現(xiàn)實需要的變化而幾經(jīng)更迭。1995年,在美國人類基因組計劃第一個五年總結報告中,給出了一個較為完整的生物信息學定義:生物信息學是一

9、門交叉科學,它包含了生物信息的獲取、加工、存儲、分配、分析、解釋等在內(nèi)的所有方面,它綜合運用數(shù)學、計算機科學和生物學的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學意義。生物信息學3. 生物信息學的發(fā)展過程生物信息學的生物信息學的誕生誕生及其重要性:及其重要性:v生物信息學不僅是一門新學科,更是一種重要的研究開發(fā)工具。從科學的角度來講,生物信息學是一門研究生物和生物相關系統(tǒng)中信息內(nèi)容與信息流向的綜合系統(tǒng)科學。只有通過生物信息學的計算處理,人們才能從眾多分散的生物學觀測數(shù)據(jù)中獲得對生命運行機制的系統(tǒng)理解。從工具的角度來講,生物信息學幾乎是今后所有生物(醫(yī)藥)研究開發(fā)所必需的工具。只有根據(jù)生物信息學

10、對大量數(shù)據(jù)資料進行分析后,人們才能選擇該領域正確的研發(fā)方向。v生物信息學不僅具有重大的科學意義,而且具有巨大的經(jīng)濟效益。它的許多研究成果可以較快地產(chǎn)業(yè)化,成為價值很高的產(chǎn)品。生物信息學4. 生物信息學的基本方法v建立生物數(shù)據(jù)庫:核苷酸順序數(shù)據(jù)庫(GENBANK)、Protein Data Bank(PDB)、氨基酸順序數(shù)據(jù)庫(SWISS-PRO)、酵母基因組數(shù)據(jù)庫(YEASTS)、美國種質(zhì)保藏中心(ATCC)、美國專利局數(shù)據(jù)庫(USPO)。v數(shù)據(jù)庫檢索:Blastv序列分析:序列對位排列、同源比較、進化分析。v統(tǒng)計模型:如隱馬爾可夫模型(hidden Markov model, HMM) 基因

11、識別、藥物設計。最大似然模型(maximun likelihood model, ML)、 最大簡約法(Maximum Parsimony, MP) 分子進化分析。v算法:如自動序列拼接、外顯子預測和同源比較、遺傳算法、人工神經(jīng)網(wǎng)絡(artificial neural network)。生物信息學5. 生物信息學的研究內(nèi)容v生物信息學的研究內(nèi)容是伴隨著基因組研究而發(fā)展的。廣義地說,生物信息學從事對基因組研究相關生物信息的獲取、加工、存儲、分配、分析和解釋。這個定義的含義是雙重的:一是對海量數(shù)據(jù)的收集、整理與服務,即管理好這些數(shù)據(jù);二是從中發(fā)現(xiàn)新的規(guī)律,也就是使用好這些數(shù)據(jù)。v具體地說,生物信息

12、學是把基因組DNA(脫氧核糖核酸)序列信息分析作為源頭,找到基因組序列中代表蛋白質(zhì)和RNA (核糖核酸)基因的編碼區(qū)。同時,闡明基因組中大量存在的非編碼區(qū)的信息實質(zhì),破譯隱藏在DNA序列中的遺傳語言規(guī)律。在此基礎上,歸納、整理與基因組遺傳信息釋放及其調(diào)控相關的轉錄譜和蛋白質(zhì)譜的數(shù)據(jù),從而認識代謝、發(fā)育、分化、進化的規(guī)律。生物信息學5. 生物信息學的研究內(nèi)容v獲取人和各種生物的完整基因組v發(fā)現(xiàn)新基因和新的單核苷酸多態(tài)性(1)基因的電腦克隆(2)從基因組 DNA序列中預測新基因(3)發(fā)現(xiàn)單核苷酸多態(tài)(SNP)v基因組中非編碼區(qū)信息結構分析v在基因組水平研究生物進化v完整基因組的比較研究v從功能基因

13、組到系統(tǒng)生物學v蛋白質(zhì)結構模擬與藥物設計生物信息學6. 生物信息學的應用v基因組分析v基因芯片v藥物開發(fā)v其他生物信息學生物信息學的應用: 6.1. 基因組分析 將已知的序列與功能聯(lián)系在一起、從基于常規(guī)克隆的基因分類轉向基于序列及功能的分析的基因分類、 從單個基因致病機制的研究轉向多個基因致病機制的研究、從組織與組織之間的比較來研究功能基因組和蛋白質(zhì)組、 從基因組和蛋白質(zhì)組的結構與功能關系來預測三級結構和功能,并從三級結構和功能反推可能的序列、通過比較不同生物物種的基因組來進行分子進化研究。生物信息學生物信息學的應用: 6.1.基因組分析 基因組:v基因組研究的首要目標是獲得人的整套遺傳密碼。

14、人的遺傳密碼有億個堿基,而現(xiàn)在的測序儀每個反應只能讀取幾百到上千個堿基。這樣,要得到人的全部遺傳密碼,首先要把人的基因組打碎,測完一個個小段的序列后再把它們重新拼接起來。而基因組大規(guī)模測序的每一個環(huán)節(jié),都同信息分析緊密相關,每一步都緊密依賴于生物信息學的軟件和數(shù)據(jù)庫。生物信息學生物信息學的應用: 1.基因組分析 蛋白質(zhì)組:蛋白質(zhì)組:v基因組對生命體的整體控制必須通過它所表達的全部蛋白質(zhì)來執(zhí)行。由于基因芯片技術只能反映從基因組到RNA的轉錄水平上的表達情況,而從RNA到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,這樣,僅憑基因芯片技術人們還不能最終掌握生物功能的具體執(zhí)行者蛋白質(zhì)的整體表達狀況。因此,近年在發(fā)展

15、基因芯片的同時,人們還發(fā)展了一套研究基因組所有蛋白質(zhì)產(chǎn)物表達情況的技術蛋白質(zhì)組研究技術,包括二維凝膠電泳技術和質(zhì)譜測序技術。然而,最重要的是如何運用生物信息學的方法去分析獲得的海量數(shù)據(jù),從中還原出生命運轉和調(diào)控的整體系統(tǒng)的分子機制。生物信息學生物信息學的應用 6.1.基因組分析 人類基因組計劃人類基因組計劃(HGP):v人類基因組計劃(Human Genome Project簡稱HGP)是美國科學家在1985年率先提出的,其目的在于闡明人類基因組DNA 3109核苷酸序列,破譯人類全部遺傳信息,HGP于1990年正式啟動。隨著HGP產(chǎn)生的數(shù)據(jù)爆炸,一門新興學科生物信息學應運而生。生物信息學是以

16、計算機為主要工具,開發(fā)各種軟件,對日益增長的DNA和蛋白質(zhì)的序列和結構等相關信息進行收集、儲存、發(fā)行、提取、加工、分析和研究,同時建立理論模型,指導實驗研究,它由數(shù)據(jù)庫、計算機網(wǎng)絡和應用軟件三大部分構成,在基因組計劃中發(fā)揮不可替代的作用。生物信息學生物信息學的應用 6.1.基因組分析人類基因組計劃人類基因組計劃(HGP):vHGP目的之一,就是找到人類基因組中的所有基因。除功能克隆和定位克隆策略之外,生物信息學為分子生物學家提供了一條尋找和研究新基因的新思路,即從高度自動化的實驗出發(fā),經(jīng)過數(shù)據(jù)的獲取與處理、序列片段的拼接、可能基因的尋找、基因功能的預測一直到基因的分子進化研究。這個過程的每一個

17、環(huán)節(jié),都是生物信息學研究的重要內(nèi)容。生物信息學生物信息學的應用 6.1.基因組分析 人類基因組計劃人類基因組計劃(HGP)HGP的目標大致如下:v(1)建立一高分辨力的人體基因組圖譜。(2) 建立某 些選擇性模型機體(如大腸桿菌、線蟲等)的DNA和人體染色體的基因物理圖譜。(3)測定這些人體和選擇性機體的DNA序列,以便更好了解正?;蛘{(diào)控、基因遺傳性疾病及其演化過程。(4)建立軟件和數(shù)據(jù)庫以提高應用和判斷這些基因信息的效能。(5)發(fā)明有關的創(chuàng)新技術。(6)建立HGP的倫理學、法律和社會參與的程序。生物信息學生物信息學的應用 6.1.基因組分析人類基因組計劃人類基因組計劃(HGP):v高度自動

18、化的實驗數(shù)據(jù)的獲得、加工和整理如何將實驗室中得到的生物學信息轉化為計算機能夠處理的數(shù)字信息,是生物信息學的一個重要課題。這種轉化大量地體現(xiàn)在各種自動化分子生物學儀器應用上,如DNA測序儀,PCR儀等。這類儀器將實驗所得的物理化學信號轉化為數(shù)字信息,并對其作簡單分析,再將分析結果用于實驗條件的控制,完成高度自動化的實驗過程。從事大規(guī)模EST測序和DNA物理圖譜構建的實驗室都已建立起高度自動化的機器人系統(tǒng)來完成大部分的實驗工作。生物信息學生物信息學的應用生物信息學的應用 6.1.基因組分析基因組分析人類基因組計劃人類基因組計劃(HGP):v伴隨著實驗過程的高度自動化甚至工廠化,從事大規(guī)模分子生物學

19、項目的實驗室,每天需要存儲的數(shù)據(jù)可以輕易地超過幾千兆字節(jié)。這樣大的數(shù)據(jù)量必須用專門的實驗室數(shù)據(jù)管理系統(tǒng)進行處理,以自動完成包括實驗進程和數(shù)據(jù)的記錄,常規(guī)數(shù)據(jù)分析,數(shù)據(jù)質(zhì)量檢測和問題的自動查找,常規(guī)的數(shù)據(jù)說明和數(shù)據(jù)輸人數(shù)據(jù)庫在內(nèi)的各項工作。由于不同實驗室需處理的數(shù)據(jù)類型各不相同,目前各個實驗室都是各自開發(fā)自己的系統(tǒng),還沒有成熟的可用于不同實驗室的分子生物學數(shù)據(jù)管理系統(tǒng)。但隨著測序逐漸成為實驗室的常規(guī)工作,對這種系統(tǒng)的需求會越來越大,此類系統(tǒng)的發(fā)展將成為大勢所趨。生物信息學生物信息學的應用 6.1.基因組分析基因組分析人類基因組計劃人類基因組計劃(HGP):v序列片段的拼接 目前DNA自動測序儀每

20、個反應只能測序500bP左右。如何將這些序列片段拼接成完整的DNA順序就成為接下來的一個重要工作。傳統(tǒng)的測序技術通常將克隆進行亞克隆并對亞克隆進行排序。這些工作需要大量的人力物力?,F(xiàn)在生物信息學提供了自動而高速地拼接序列的算法,即根據(jù)Lander-Waterman模型利用鳥槍法進行測序,再將大量隨機測序的片段用計算機進行自動拼接。這種技術不僅避免了亞克隆排序所需的大量繁瑣的工作,還使序列具有一定的冗余性以保證序列中每個堿基的準確性。序列拼接算法的進一步發(fā)展,需要在以下方面進行改進:1將已知的基因組知識應用與拼接算法,以進一步提高拼接真核基因組的有效性。2自動處理自動測序造成的差錯,特別是對差錯

21、傾向的EST順序更是如此。生物信息學生物信息學的應用 6.1.基因組分析基因組分析人類基因組計劃人類基因組計劃(HGP):基因區(qū)域的預測 v在完成序列的拼接后,我們得到的是很長的DNA序列,甚至可能是整個基因組的序列。這些序列中包含著許多未知的基因,下一步就是將基因區(qū)域從這些長序列中找出來。 v所謂基因區(qū)域的預測,一般是指預測DNA順序中編碼蛋白質(zhì)的部分,即外顯子部分。不過目前基因區(qū)域的預測已從單純外顯子預測發(fā)展到整個基因結構的預測。這些預測綜合各種外顯子預測的算法和人們對基因結構信號(如TATA box和加尾信號)的認識,預測出可能的完整基因。生物信息學生物信息學的應用 6.1.基因組分析基

22、因組分析人類基因組計劃人類基因組計劃(HGP):基因功能預測 v序列同源比較;v尋找蛋白質(zhì)家族保守順序;v蛋白質(zhì)結構的預測。生物信息學生物信息學生物信息學的應用 6.1.基因組分析基因組分析分子進化的研究:分子進化的研究: v通過上述種種方法我們可以預測出一個新基因的可能具有的功能。然而預測新基因只是生物信息學研究的一個方面,這門學科的根本目標是探究隱藏在生物數(shù)據(jù)后面的生物學知識。對于基因組研究來說,一個重要的研究方向就是分子序列的進化。通過比較不同生物基因組中各種結構成分的異同,可以大大加深我們對生物進化的認識。這種研究已逐步形成一個稱為比較基因組學的新學科。從各種基因結構與成分的進化,密碼

23、子使用的進化,到進化樹的構建,各種理論上和實驗上的課題都等待生物信息學家的研究。生物信息學生物信息學的應用 6.1.基因組分析基因組分析分子進化的研究:分子進化的研究:v科學家們對處于不同進化階段物種的基因組結構和功能進行比較分析,企圖最終弄清人類10 萬個基因的起源和進化、結構和功能的演變,發(fā)現(xiàn)其間的親緣關系,像元素周期表那樣把基 因和蛋白質(zhì)分類、排序,得到生物學的周期表,根據(jù)基因在進化樹上的位置,或一小段核苷 酸序列,或蛋白質(zhì)的基序、模塊、折疊等,即可預測其來源、結構、功能等。這項浩大的工 程顯然需要大量生物信息學家長期不懈努力才能完成。生物信息學生物信息學的應用 6.2.基因芯片 基因芯

24、片基因微陣列或DNA芯片(gene microarray 或DNA chips)的原理是將幾萬個寡核苷酸或DNA作為探針,密集排列于硅片等固相支持物上,將研究樣品標記后與微點陣雜交并進行檢測。根據(jù)雜交信號強弱及探針位置和序列,可以確定靶DNA的表達情況以及突變和多態(tài)性存在與否。生物信息學生物信息學的應用 6.3.藥物開發(fā)藥物開發(fā) 藥物開發(fā)藥物開發(fā)v基因組和蛋白質(zhì)組研究的迅猛發(fā)展,使許多新蛋白序列涌現(xiàn)出來。要了解它們的功能,只有氨基酸序列是遠遠不夠的。得到這些新蛋白的完整、精確和動態(tài)的三維結構,是擺在人們面前的緊迫任務。生物信息學 藥物開發(fā)藥物開發(fā)v近年,隨著結構生物學的發(fā)展,相當數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結構獲得了精確的測定。根據(jù)生物大分子結構的知識,有針對性地設計藥物成為熱點。生物信息學的應用 6.3.藥物開發(fā)藥物開發(fā)生物信息學生物信息學的應用 6.4. 其他:v疾病相關的基因信息及相關算法和軟件開發(fā)v建立與動、植物良種繁育相關的基因組數(shù)據(jù)庫,發(fā)展分子標記輔助育種技術v研究與發(fā)展藥物設計軟件和基于生物信息的分子生物學技術v寄生蟲與流行病學研究、v農(nóng)作物基因組分析、v神經(jīng)科學。生物信息學7.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論