版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
生物信息學
Bioinformatics
第2講生物信息學研究內(nèi)容主講教師:劉吉平liujiping@年3月第1頁生物信息學主要介紹內(nèi)容:什么是生物信息學?國內(nèi)外生物信息學研究歷史和現(xiàn)實狀況。生物信息學研究內(nèi)容和科學目標。分別解讀生物分子三大關鍵數(shù)據(jù)庫:GenBank核酸序列數(shù)據(jù)庫、SWISS-PORT蛋白質序列數(shù)據(jù)庫、 PDF生物大分子結構數(shù)據(jù)庫。介紹國內(nèi)外相關生物信息學網(wǎng)站和網(wǎng)址。第2頁生物信息學在上找相關生物信息學網(wǎng)站或網(wǎng)頁第3頁BiologyProteinPhenotypeDNA(Genotype)第4頁基因結構第5頁The4basescNNCCCCCCCCCNNNNNHooHHHHHHHHAdenineThyminecNNCCCCCCCCNNNNHoHHoNNHHHHHGuanineCytosineA-TG-CNote:thisisflat!UracilreplacesTinRNAPurineringPyrimidinering第6頁三研究內(nèi)容生物信息學與計算生物學或生物計算有著親密關系,但又不盡相同.當前歸入生物信息學研究領域大致有以下七個方面:第7頁Bioinfomatics七個方面研究內(nèi)容建立和管理各種生物數(shù)據(jù)庫生物信息數(shù)據(jù)庫使用生物信息學中數(shù)學模式和算法研究數(shù)據(jù)庫接口和檢索工具研制HGP實施,對信息采集和處理提出要求生物信息學最主要任務,是從大量數(shù)據(jù)中提取新知識DNA芯片和微陣列發(fā)展第8頁1建立和管理各種生物數(shù)據(jù)庫各種生物數(shù)據(jù)庫建立和管理。如核酸序列數(shù)據(jù)庫、蛋白質數(shù)據(jù)庫、各種專業(yè)數(shù)據(jù)庫等。這是一切生物信息學工作基礎,通常要有計算機科學背景專業(yè)人員與生物學家親密合作。第9頁2、生物信息數(shù)據(jù)庫使用
近些年來伴隨快速序列測定、基因重組、多維核磁共振等技術應用,基因組與蛋白質試驗數(shù)據(jù)呈爆炸性趨勢增加;建立數(shù)據(jù)庫再結合相關分析軟件使大規(guī)模數(shù)據(jù)貯存、處理和分析成為可能,并已發(fā)展成為包含基因組信息與蛋白質結構模擬在內(nèi)生物信息學研究主要基礎。第10頁核酸序列數(shù)據(jù)庫
Genbank,美國國家生物技術信息中心數(shù)據(jù)庫()。
EMBL,建立在歐洲分子生物試驗室數(shù)據(jù)庫(http://www.embl-heidelberg.de)。DDBJ,是DNADataBankofJapan簡稱,又叫日本DNA數(shù)據(jù)庫銀行(availableathttp://www.nig.ac.jp)。第11頁Genbank美國國家生物技術信息中心數(shù)據(jù)庫原中山醫(yī)科大學網(wǎng)頁有鏈接:http:///該數(shù)據(jù)庫提供Entrez檢索工具、BLAST序列搜索、生物信息學學習等服務內(nèi)容第12頁其它主要數(shù)據(jù)庫真菌如釀酒酵母基因組數(shù)據(jù)庫(SGD)/Saccharomyces/擬南芥數(shù)據(jù)庫(AtDB)(/Arabidopsis/)線蟲綜合數(shù)據(jù)庫(ACEDB)ftp://sanger.ac.uk(/pub/acedb)(自由下載,建立二次數(shù)據(jù)庫)在線人類孟德爾遺傳數(shù)據(jù)庫(OnlineMendelian
InheritanceinMan,OMIM)
/omim/第13頁其它主要生物數(shù)據(jù)庫魚類斑馬魚/昆蟲類果蠅(Drosophilamelanogaster,fruitfly)/脊椎動物如小鼠(Musmusculus)/genome/guide/mouse/細菌如大腸桿菌(/pub/sequence/)原生動物如人類一個寄生性原蟲(Plasmodiumfalciparum):http://PlasmoDB.org/第14頁三維結構數(shù)據(jù)庫PDB(ProteinDataBank,/npdb)等。與蛋白質結構相關數(shù)據(jù)庫還有:SCOP(availableat/scop/)等。第15頁80-99年ProteinDataBank/pdb/index.html
第16頁Helix-turn-helixmotifofproteinbindingtoDNA
結合DNA蛋白質螺旋結構基序
Motif數(shù)據(jù)庫----PROSITEPROSITE(/prosite/)第17頁蛋白質結構數(shù)據(jù)第18頁生物信息數(shù)據(jù)庫主要服務借助特定算法模型提供同源性分析是當前各種生物信息數(shù)據(jù)庫最主要內(nèi)容之一。第19頁分子生物學中心法則DNAmRNA結構翻譯轉錄復制蛋白質/酶cDNADNA功效反轉錄相互作用折疊第20頁3、生物信息學中數(shù)學模式和主要算法研究
迄今已經(jīng)有相當多數(shù)學方法應用于生物信息學研究。而且一個算法本身就是一門學問,比如:
機器學習法
人工神經(jīng)網(wǎng)絡
分形理論
密碼學
全息論
高維分布統(tǒng)計方法第21頁生物信息學中主要算法---聚類分析生物信息學問題許多可歸為聚類問題。聚類分析:聚類是宏觀與微觀生物學研究中最慣用一個數(shù)學方法,它基本目標是將n個樣本劃分為m個類,從而使同類樣本較為相同而不一樣類間樣本差異較大。其中支撐矢量機算法可從網(wǎng)上學習:/尋找轉錄因子結合位點
第22頁生物信息學中主要算法遺傳算法:遺傳算法提出,本身就是借鑒生物界中適者生存、優(yōu)勝劣汰遺傳機制所提出來隨機化搜索方法,其最主要特點就是面向結構對象、不受求導和函數(shù)連續(xù)性限定、含有內(nèi)在隱并行性和良好全局尋優(yōu)能力。第23頁生物信息學中主要算法
-----遺傳算法過去20多年發(fā)展,已使得遺傳算法成為當代智能計算中關鍵技術之一,并已應用于生物信息學研究:基于蛋白質主鏈結構側鏈構象計算蛋白質折疊算法模型與模擬圖像匹配中遺傳算法結構圖同態(tài)研究第24頁當前較流行數(shù)學方法和算法(1)神經(jīng)網(wǎng)絡(NeuralNetworks)1982年,神經(jīng)網(wǎng)絡首次被應用到生物學研究中來,接著Stormo等人應用類似算法在預測大腸桿菌體內(nèi)一些蛋白質翻譯起始部位取得了成功。1988年,伴隨QianandSejnowski發(fā)表一篇關于蛋白質二級結構預測文章,神經(jīng)網(wǎng)絡算法已成為蛋白質二級結構分析預測主流算法。另外,神經(jīng)網(wǎng)絡在預測信號肽,研究遺傳密碼結構和起源等方面也有較多應用。第25頁當前較流行數(shù)學方法和算法(2)Threading方法Threading方法或稱折疊類型識別方法?;舅枷胧牵侯A測蛋白折疊類型與某一已知結構蛋白折疊類型相同,這么蛋白質結構預測問題就轉變?yōu)樵谝阎臻g結構蛋白質中,選取一個最有可能折疊類型,從而大大減小預測蛋白質結構難度。第26頁4數(shù)據(jù)庫接口和檢索工具研制數(shù)據(jù)庫內(nèi)容來自萬千生物學者日積月累,最終又為生物學者們所用。但不能要求普通生物學工作者含有高深計算機和網(wǎng)絡知識,所以,必須發(fā)展查詢數(shù)據(jù)庫和向庫里提供數(shù)據(jù)方便接口。這是專業(yè)人員才能勝任工作,通常在生物信息中心里進行。第27頁5HGP實施,對信息采集和處理提出要求人類基因組計劃(HGP)實施,配合大規(guī)模DNA自動測序,對信息采集和處理提出了空前要求。從各種圖譜分析,大量序列片段拼接組裝,尋找基因和預測結構與功效,到數(shù)據(jù)和研究結果視像化,無不需要高效率算法和程序。所以,研究新算法、發(fā)展方便適用程序,是生物信息學日常任務。第28頁與HGP相關研究幾個方面表現(xiàn):因為當前生物信息學發(fā)展主要推進力來自HGP,所以生物信息學與HGP關系就顯得更為親密,其與HGP相關研究主要表現(xiàn)在以下幾個方面:第29頁1)高度自動化試驗數(shù)據(jù)取得、加工和整理怎樣將試驗室中得到生物學信息轉化為計算機能夠處理數(shù)字信息,是生物學一個主要課題。表達在各種自動化分子生物學儀器應用上,如DNA測序儀,PCR儀等。這類儀器將試驗所得物理化學信號轉化為數(shù)字信息,并對其作簡單分析,再將分析結果用于試驗條件控制,完成高度自動化試驗過程。第30頁2)序列片段拼接當前DNA自動測序儀每個反應只能測序500bp左右。怎樣將這些序列片段拼接成完整DNA次序就成為接下來一個主要工作。傳統(tǒng)測序技術通常將克隆進行亞克隆并對亞克隆進行排序。這些工作需要大量人力物力?,F(xiàn)在生物信息學提供了自動而高速地拼接序列算法,不但防止了亞克隆排序所需大量繁瑣工作,還能使序列含有一定冗余性(redundancy,即一定數(shù)量重復)以確保序列中每個堿基準確性。第31頁3)基因區(qū)域預測在完成序列拼接后,我們得到是很長DNA序列,甚至可能是整個基因組序列。這些序列中包含著許多未知基因,下一步就是將基因區(qū)域從這些長序列中找出來。所謂基因區(qū)域預測,普通是指預測DNA次序中編碼蛋白質部分,即外顯子部分。不過當前基因區(qū)域預測已從單純外顯子預測發(fā)展到整個基因結構預測。這些預測綜合各種外顯子預測算法和人們對基因結構信號(如TATAbox和加尾信號)認識,預測出可能完整基因。第32頁(4)基因或蛋白質功效預測用試驗伎倆證實一個預測新基因后,下一步要做就是尋找這個基因功效。----即功效基因組學蛋白質功效預測分析,主要是分析目標蛋白質是否與含有功效信息已知蛋白質相同。策略有二:同源序列分析功效區(qū)相關保守序列特點分析。第33頁(5)分子進化研究經(jīng)過上述種種方法我們能夠預測出一個新基因可能含有功效。然而預測新基因只是生物信息學研究一個方面,這門學科根本目標是探究隱藏在生物數(shù)據(jù)后面生物學知識。對于基因組研究來說,一個主要研究方向就是分子序列進化。經(jīng)過比較不一樣生物基因組中各種結組成份異同,能夠大大加深我們對生物進化認識。這方面研究已逐步形成一個稱為比較基因組學(ComparativeGenomics)新學科。第34頁Humangenomeshares223geneswithbacteria-genesthatdonotexistintheworm,fly,oryeast.
Areticulatedtree,ornet,whichmightmoreappropriatelyrepresentlife'shistory.
第35頁6生物信息學最主要任務,是從大量數(shù)據(jù)中提取新知識生物信息學最主要任務,是從海量數(shù)據(jù)中提取新知識。這首先是從DNA序列中識別編碼蛋白質基因,以及調(diào)控基因表示各種信號。其次,從基因組編碼序列翻譯出蛋白質序列數(shù)目急劇增加,根本不可能用試驗方法一一確定它們結構和功效。從已經(jīng)積累數(shù)據(jù)和知識出發(fā),預測蛋白質結構和功效,成為常規(guī)研究任務。第36頁7DNA芯片和微陣列發(fā)展DNA芯片和微陣列發(fā)展,把一定組織或生物體內(nèi)萬千基因時空表示研究提上日程.研究基因表示過程中聚群關系,從中提取調(diào)控網(wǎng)絡和代謝路徑知識,進而從整體上模擬細胞內(nèi)全部相互輔合生化反應,在亞細胞層次了解生命活動。第37頁基因芯片檢測系統(tǒng)
第38頁Bioinfomatics七個方面研究內(nèi)容建立和管理各種生物數(shù)據(jù)庫生物信息數(shù)據(jù)庫使用生物信息學中數(shù)學模式和方法研究數(shù)據(jù)庫接口和檢索工具研制HGP實施,對信息采集和處理提出要求生物信息學最主要任務,是從大量數(shù)據(jù)中提取新知識DNA芯片和微陣列發(fā)展另外,專業(yè)人材培養(yǎng),也是一個主要內(nèi)容。第39頁四、展望作為計算機科學和數(shù)學應用于分子生物學而形成交叉學科,生物信息學已經(jīng)成為基因組研究中必不可少有力研究伎倆。為了能夠更加好地服務于基因組研究,生物信息學在未來發(fā)展中需要做以下幾方面努力:第40頁(1)理論研究任何學科發(fā)展都離不開基礎理論研究,生物信息學也不例外。它對許多學科都提出了巨大挑戰(zhàn)。這些學科包含分子進化遺傳學、群體遺傳學、統(tǒng)計生物學、基因組學以及計算機科學和應用數(shù)學相關學科。假如基礎理論研究得不到應有發(fā)展,生物信息學發(fā)展將受到嚴重妨礙。第41頁(2)生物數(shù)據(jù)質量監(jiān)控監(jiān)控已經(jīng)有生物數(shù)據(jù)終究含有多大可信度,對于物理圖譜構建工作將有十分重大意義。第42頁(3)加強生物學家和計算機科學家以及數(shù)學家之間溝通長久以來,這三類科學家都是埋頭于各自研究領域,而不關心其它學科發(fā)展和要求。這種情況在我國尤為突出。生物信息學發(fā)展要求三者之間加強溝通。其意義不但在于推進生物信息學本身發(fā)展,而且將形成促進整個生物學發(fā)展強大動力。生物信息學作為基因組研究有力武器,被廣泛地用來加緊新基因尋找過程,以到達將"有用"新基因搶先注冊專利目標。在這場世界范圍內(nèi)競爭中,中國科學家以及科研資金投向決議部門怎樣結合我國科研水平現(xiàn)實狀況、優(yōu)勢領域等客觀情況,將有限投資投入以求取得最大可能科學研究以及商業(yè)回報,是一個無法回避新課題。第43頁我國科學家展望我國科學家認為,在克隆新基因思路方面,我國不應該照搬國外克隆新基因所用方法,而應該走生物信息學和定位克隆相結合道路。具體地說就是一方面進行各種遺傳疾病家系采集,從家系分析入手,尋找致病基因在染色體上位置,然后對這個區(qū)域進行測序,再利用生物信息學伎倆預測候選基因和它功能并用實驗加以證實;其次直接從現(xiàn)有公共數(shù)據(jù)庫中EST出發(fā),用生物信息學方法尋找可能有研究價值新基因,并用實驗方法來研究證實。這種雙管齊下克隆新基因方法可能更適合我國人類基因組研究在財力、物力和研究人才資源等方面客觀條件。第44頁在生物信息學學科建設方面在生物信息學學科建設方面,政府應注意加強生物信息學學科建設延續(xù)性,克服青年科技人員流動性大等困難,有重點地把工作長久地開展起來,盡快設置相關學位,以利于對后繼人才培養(yǎng);適當?shù)刂С謸碛形覈灾髦R產(chǎn)權算法、軟件后繼開發(fā)、包裝工作,這不但僅因為其潛在商業(yè)利潤,更要逐步確立中國在世界生物信息學領域地位。第45頁在生物信息系統(tǒng)構建方面國家應該集中創(chuàng)建一兩個含有一定規(guī)模生物信息中心,建立面向全國生物學數(shù)據(jù)庫檢索和數(shù)據(jù)分析系統(tǒng)。這個系統(tǒng)建立能夠分兩步走。第一步我們要將國外公共數(shù)據(jù)庫中內(nèi)容和相關軟件搜集和集中起來,提供檢索和下載。第二步是將這些資源有機地組合,建立一個統(tǒng)一生物信息平臺。經(jīng)過這個平臺用戶能夠將各種格式數(shù)據(jù)提交給設在生物信息中心服務器,在服務器上進行一系列檢索和數(shù)據(jù)分析。用戶無須關心各種數(shù)據(jù)庫和軟件輸入輸出格式,只需一個簡單客戶端軟件甚至只需一個WWW瀏覽器就能完成全部工作。整個生物信息平臺不但是一個集成數(shù)據(jù)庫,而且是一個集成軟件工具。第46頁在生物信息學理論研究方面發(fā)揮國人聰明才智,加強數(shù)學算法研究應用系統(tǒng)論、信息論,開展生物信息學理論研究開展生物信息學倫理道德研究。。。。。。第47頁結語相信在HGP和即將開始中國人類基因組研究計劃中,生物信息學將發(fā)揮越來越大作用,并推進生物學進入一個全新境界。第48頁5、相關資源:EuropeanBioinformaticsInstituteEBI)
SBDS(SouthamptonBioinformaticsDataServer)
U.S.DepartmentofEnergy-BioinformaticsInfrastructure
TheNASAAmesCenterforBioinformatics
TheNationalCenterforBiotechnologyInformation
ProteinDataBank(PDB)MirrorSite北京大學生物信息學中心
生物信息學專業(yè)網(wǎng)BioSino中國生物信息
第49頁6.參考鏈接:生物信息學——生物技術關鍵(2000-04-03)西安成立生物信息研究中心(2000-05-16)海峽兩岸理論生命科學交流逐步深入(2000-05-17
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 保安公司月度會議總結范文(3篇)
- 2024年度企業(yè)廣告發(fā)布與媒體推廣合同
- 線上地推社會實踐報告5篇
- 小學語文教研組總結
- 2024年三人股東競業(yè)禁止協(xié)議
- 銷售下月工作計劃范文(7篇)
- 年終采購工作總結收藏(3篇)
- 2024年數(shù)據(jù)中心清潔保養(yǎng)承包合同
- 2024年度建筑裝飾工程設計合同
- 考點01運動的描述(核心考點)-2024年高考物理一輪復習(新高考專用)
- 優(yōu)質護理服務PPT
- (完整版)銀行賬戶共管協(xié)議最新(精華版)
- 第三章 閘板防噴器
- 實驗五魚體測量及描述
- 市值管理十大經(jīng)典案例
- 馬克思主義基本原理概論課程論文
- Thebestjobintheworld
- 最終版加氣機使用說明書
- 水庫移民工作存在的問題及對策水庫建設移民問題
- 班級文化建設的實踐與研究課題方案doc
- 有色金屬選礦廠工藝設計規(guī)范
評論
0/150
提交評論