生物信息學概述_第1頁
生物信息學概述_第2頁
生物信息學概述_第3頁
生物信息學概述_第4頁
生物信息學概述_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

生物信息學概述演示文稿本文檔共57頁;當前第1頁;編輯于星期二\3點6分(優(yōu)選)生物信息學概述本文檔共57頁;當前第2頁;編輯于星期二\3點6分生物分子信息生物分子至少攜帶著三種信息遺傳信息與功能相關的結構信息進化信息生物分子信息的特征生物分子信息數(shù)據量大生物分子信息復雜生物分子信息之間存在著密切的聯(lián)系本文檔共57頁;當前第3頁;編輯于星期二\3點6分遺傳信息的載體——DNA

遺傳信息的載體主要是DNA

控制生物體性狀的基因是一系列DNA片段生物體生長發(fā)育的本質就是遺傳信息的傳遞和表達DNA通過自我復制,在生物體的繁衍過程中傳遞遺傳信息基因通過轉錄和翻譯,使遺傳信息在生物個體中得以表達,并使后代表現(xiàn)出與親代相似的生物性狀2023/6/274蛋白質RNA轉錄DNA翻譯本文檔共57頁;當前第4頁;編輯于星期二\3點6分DNA前體RNAmRNA多肽鏈2023/6/27本文檔共57頁;當前第5頁;編輯于星期二\3點6分生命機器的執(zhí)行者--蛋白質蛋白質功能取決于蛋白質的空間結構

蛋白質結構決定于蛋白質的序列(這是目前基本共認的假設),蛋白質結構的信息隱含在蛋白質序列之中。2023/6/27本文檔共57頁;當前第6頁;編輯于星期二\3點6分DNA分子和蛋白質分子都含有進化信息通過比較相似的蛋白質序列,如肌紅蛋白和血紅蛋白,可以發(fā)現(xiàn)由于基因復制而產生的分子進化證據。通過比較來自于不同種屬的同源蛋白質,即直系同源蛋白質,可以分析蛋白質甚至種屬之間的系統(tǒng)發(fā)生關系,推測它們共同的祖先蛋白質。2023/6/277本文檔共57頁;當前第7頁;編輯于星期二\3點6分生物分子信息DNA序列數(shù)據

蛋白質序列數(shù)據

生物分子結構數(shù)據

生物分子功能數(shù)據

最基本直觀復雜生物信息數(shù)據類型2023/6/27本文檔共57頁;當前第8頁;編輯于星期二\3點6分

DNA核酸序列蛋白質氨基酸序列蛋白質結構蛋白質功能最基本的生物信息維持生命活動的機器第一部遺傳密碼第二部遺傳密碼?生命體系千姿百態(tài)的變化生物分子數(shù)據及其關系2023/6/279本文檔共57頁;當前第9頁;編輯于星期二\3點6分第一部遺傳密碼已被破譯,但對密碼的轉錄過程還不清楚,對大多數(shù)DNA非編碼區(qū)域的功能還知之甚少對于第二部密碼,目前則只能用統(tǒng)計學的方法進行分析。破譯“第二遺傳密碼”:即折疊密碼(foldingcode),從蛋白質的一級結構得到立體結構,即可直接從基因推測其編碼蛋白質所對應的生物學功能。破解折疊密碼被列為“21世紀的生物學”的重要課題。生物分子數(shù)據是寶藏,生物信息數(shù)據庫是金礦,等待我們去挖掘和利用2023/6/27本文檔共57頁;當前第10頁;編輯于星期二\3點6分Bioinformatics,生物

+信息

+學--新興的交叉學科ComputersciencesMathematicalsciencesLifesciences二、生物信息學的概念本文檔共57頁;當前第11頁;編輯于星期二\3點6分定義一:生物信息學是一門收集、分析遺傳數(shù)據以及分發(fā)給研究機構的新學科(1987)定義二:生物信息學特指數(shù)據庫類的工作,包括持久穩(wěn)固的在一個穩(wěn)定的地方提供對數(shù)據的支持(1994)定義三:采用信息科學技術,對各種生物信息(包括核酸、蛋白質等)的收集、加工、儲存、分析、解釋的一門學科。收集、加工、儲存:計算機科學家分析、解釋:生物學家本文檔共57頁;當前第12頁;編輯于星期二\3點6分三、生物信息學發(fā)展簡史(一)前基因組時代的生物信息學

起源于20世紀70-80年代。這一階段的主要成就包括核酸和蛋白質序列的初步分析、生物學數(shù)據庫的建立以及檢索工具的開發(fā)。例如Dayhoff的替換矩陣、Neelleman和Wunsch的序列比對及GenBank(由美國國立生物技術信息中心建立和維護的核酸與蛋白質序列數(shù)據庫)等大型數(shù)據庫的建立,形成了生物信息學的雛形。本文檔共57頁;當前第13頁;編輯于星期二\3點6分1967:Dayhoff研制出蛋白質序列圖集,即后來著名的蛋白質信息源PIR;1970:Needleman和Wunsch提出了著名的序列比對算法,是生物信息學發(fā)展中最重要的貢獻;1978:Gingeras等人研制了核酸序列中酶切位點識別程序;1981:Doolittle提出了關于序列模式的概念;1986:日本核酸序列數(shù)據庫DDBJ誕生;1986:蛋白質數(shù)據庫SWISS-PROT誕生;1988:美國國家生物技術信息中心NCBI誕生;1988:成立歐洲分子生物學網絡(EMBNet),EMBL數(shù)據庫誕生本文檔共57頁;當前第14頁;編輯于星期二\3點6分(二)基因組時代的生物信息學以基因組計劃的實施為標志的基因組時代(1990年至2001年)是生物信息學成為一個較完整的新興學科并得到高速發(fā)展的時期。這一時期生物信息學確立了自身的研究領域和學科特征,成為生命科學的熱點學科和重要前沿領域之一。這一階段的主要成就包括大分子序列以及表達序列標簽(expressedsequencetag,EST)數(shù)據庫的高速發(fā)展、BLAST(basiclocalalignmentsearchtool)和FASTA(fastalignment)等工具軟件的研制和相應新算法的提出、基因的尋找與識別、電子克?。╥nsilicocloning)技術等,大大提高了管理和利用海量數(shù)據的能力。本文檔共57頁;當前第15頁;編輯于星期二\3點6分人類基因組計劃開始(HumanGenomeProject,HGP)人類基因組計劃帶來了

生物信息學20世紀90年代本文檔共57頁;當前第16頁;編輯于星期二\3點6分人類基因組計劃(HGP,HumanGenomeProject)目標:整體上破解人類遺傳信息的奧秘由美國NIH和能源部提出和帶頭,美、英、德、法、日、中共同參與的國際合作項目。完成人全部24(22+X+Y)條染色體中3.2×109個堿基對的序列測定,主要任務包括做圖(遺傳圖譜、物理圖譜以及轉錄圖譜的繪制)、測序和基因識別,其根本任務是解讀和破譯生物體的生老病死以及與疾病相關的遺傳信息。本文檔共57頁;當前第17頁;編輯于星期二\3點6分18基因組(Genome):包含細胞或生物體全套的遺傳信息的全部遺傳物質

包括:細胞核基因組DNA細胞質(線粒體、葉綠體)基因組DNA

人類基因組:3.2×109bp本文檔共57頁;當前第18頁;編輯于星期二\3點6分本文檔共57頁;當前第19頁;編輯于星期二\3點6分曼哈頓原子彈計劃阿波羅登月計劃人類基因組計劃人類自然科學史上的3大計劃本文檔共57頁;當前第20頁;編輯于星期二\3點6分21AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.本文檔共57頁;當前第21頁;編輯于星期二\3點6分222001年2月15日《Nature》封面2001年2月16日《Science》封面本文檔共57頁;當前第22頁;編輯于星期二\3點6分我國對人類基因組計劃的貢獻本文檔共57頁;當前第23頁;編輯于星期二\3點6分24本文檔共57頁;當前第24頁;編輯于星期二\3點6分本文檔共57頁;當前第25頁;編輯于星期二\3點6分humanArabidopsis擬南芥ThermotogamaritimaEscherichiacoli大腸桿菌Buchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis本文檔共57頁;當前第26頁;編輯于星期二\3點6分本文檔共57頁;當前第27頁;編輯于星期二\3點6分數(shù)據庫中的蛋白質序列Swiss-prot:≈550,000條蛋白質序列本文檔共57頁;當前第28頁;編輯于星期二\3點6分29結構與功能信號網絡代謝途徑細胞重建系統(tǒng)重建基因組基因(三)后基因組時代的生物信息學本文檔共57頁;當前第29頁;編輯于星期二\3點6分四、生物信息學的研究領域基因組序列裝配基因識別基因功能預報基因多態(tài)性分析基因進化mRNA結構預測基因芯片設計基因芯片數(shù)據分析疾病相關基因分析蛋白質序列分析蛋白質家族分類蛋白質結構預測蛋白質折疊研究代謝途徑分析轉錄調控機制蛋白質芯片設計蛋白質芯片數(shù)據分析藥物設計本文檔共57頁;當前第30頁;編輯于星期二\3點6分大規(guī)模核酸測序及拼接基因識別與定位基因相關的SNP研究非編碼區(qū)信息結構分析比較基因組學

(一)核酸及基因組信息本文檔共57頁;當前第31頁;編輯于星期二\3點6分大規(guī)?;蚪M測序本文檔共57頁;當前第32頁;編輯于星期二\3點6分33本文檔共57頁;當前第33頁;編輯于星期二\3點6分運用計算機軟件進行序列拼接本文檔共57頁;當前第34頁;編輯于星期二\3點6分基因識別與定位

本文檔共57頁;當前第35頁;編輯于星期二\3點6分基因相關的SNP研究:

單核苷酸多態(tài)性(SingleNucleotidePolymorphisms,SNP):主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種。占所有已知多態(tài)性的90%以上。SNP在人類基因組中廣泛存在,平均每500~1000個堿基對中就有1個,估計其總數(shù)可達300萬個甚至更多。本文檔共57頁;當前第36頁;編輯于星期二\3點6分37SNP的研究意義尋找疾病相關的突變位點法醫(yī)學研究器官移植中供體/受體配對分析

本文檔共57頁;當前第37頁;編輯于星期二\3點6分

全基因組關聯(lián)分析(Genome-wideassociationstudy,GWAS):是指在人類全基因組范圍內找出存在的序列變異,即單核苷酸多態(tài)性(SNP),從中篩選出與疾病相關的SNPs

本文檔共57頁;當前第38頁;編輯于星期二\3點6分非編碼區(qū)信息結構分析:基因表達調控分析在微生物中,非編碼區(qū)只占整個基因組序列的10%-20%;但在高等生物和人類基因組中,非編碼序列則占了基因組序列的絕大部分。在人的基因組中,非編碼序列超過95%。非編碼區(qū)有調控作用的核苷酸序列,包括位于編碼區(qū)上游的RNA聚合酶結合位點。本文檔共57頁;當前第39頁;編輯于星期二\3點6分比較基因組學(ComparativeGenomics)是基于基因組圖譜和測序基礎上,對已知的基因和基因組結構進行比較,來了解基因的功能、表達機理和物種進化的學科本文檔共57頁;當前第40頁;編輯于星期二\3點6分(二)蛋白質及蛋白質組信息蛋白質結構預測蛋白質功能預測基因表達及蛋白質組信息學本文檔共57頁;當前第41頁;編輯于星期二\3點6分蛋白質三維結構測定主要方法:X射線晶體結構分析、多維核磁共振(NMR)波譜分析和電子顯微鏡二維晶體三維重構(電子晶體學,EC)等物理方法Difficult!Expensive!TooMuchTime!蛋白質結構及功能預測本文檔共57頁;當前第42頁;編輯于星期二\3點6分本文檔共57頁;當前第43頁;編輯于星期二\3點6分蛋白質組研究

蛋白質組(proteome):即包括一種細胞乃至一種生物所表達的全部蛋白質。蛋白質組本質上指的是在大規(guī)模水平上研究蛋白質的特征,包括蛋白質的表達水平,翻譯后的修飾,蛋白與蛋白相互作用等,由此獲得蛋白質水平上的關于疾病發(fā)生,細胞代謝等過程的整體而全面的認識。

本文檔共57頁;當前第44頁;編輯于星期二\3點6分基因組數(shù)據庫蛋白質序列數(shù)據庫蛋白質結構數(shù)據庫DDBJEMBLGenBankSWISS-PROTPDBPIR(三)生物分子數(shù)據的收集與管理2023/6/27本文檔共57頁;當前第45頁;編輯于星期二\3點6分(四)數(shù)據庫搜索及序列比較

搜索同源序列在一定程度上就是通過序列比較尋找相似序列序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應等同或者置換關系進行對比排列,其結果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質之間的進化關系。

2023/6/2746本文檔共57頁;當前第46頁;編輯于星期二\3點6分發(fā)現(xiàn)同源分子2023/6/2747本文檔共57頁;當前第47頁;編輯于星期二\3點6分48生物信息學和人類基因組計劃為藥物靶標的發(fā)現(xiàn)和新藥的研制開創(chuàng)了新天地,未來的藥物設計將是基于生物信息學的知識挖掘的過程通過數(shù)據分析首先確立靶標分子預測蛋白質分子結構設計藥物分子與靶標分子相互作用(五)

在藥學領域應用本文檔共57頁;當前第48頁;編輯于星期二\3點6分

所謂基因組藥物(Genomicdrug)是指利用基因序列數(shù)據,經生物信息學分析、高通量基因表達、高通量功能篩選和體內外藥效研究開發(fā)得到的新藥候選物.

基于機理的藥物發(fā)現(xiàn):基因組藥物實際上利用了反向生物學的原理.沿著從基因序列一蛋白質一功能一藥物的途徑研制新藥,其優(yōu)勢是取自龐大的人類基因資源及其編碼蛋白質做為原材料,具有巨大的開發(fā)潛力。基因組藥物本文檔共57頁;當前第49頁;編輯于星期二\3點6分人類基因組約有10萬左右的基因.編碼10萬以上的蛋白質,其中至少5%即5000以上的基因編碼蛋白質可能具有藥物開發(fā)前景。大量基因特別是疾病相關基因申請專利,如肥胖。本文檔共57頁;當前第50頁;編輯于星期二\3點6分

理想的抗生素靶標應為微生物細胞存活所必須,在病原體中高度保守,且在人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論