生物信息學(xué)市公開(kāi)課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第1頁(yè)
生物信息學(xué)市公開(kāi)課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第2頁(yè)
生物信息學(xué)市公開(kāi)課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第3頁(yè)
生物信息學(xué)市公開(kāi)課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第4頁(yè)
生物信息學(xué)市公開(kāi)課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件_第5頁(yè)
已閱讀5頁(yè),還剩113頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、生物信息學(xué)主講教師: 高雪峰E-mail:gaoxf吉林大學(xué)生命科學(xué)學(xué)院10/10/1第1頁(yè)課程安排1、時(shí)間:每七天一下午58節(jié) 教室:第三教學(xué)樓第二階梯教室 課時(shí):每七天4課時(shí)(總計(jì)44=16課時(shí))2、學(xué)分:2學(xué)分3、成績(jī)考評(píng)方式(筆試)4、E-mail: gaoxf (辦公室地址:理三341室)10/10/2第2頁(yè)參考文件1、生物信息學(xué)概論 羅靜初 北京大學(xué) 北京大學(xué)出版社2、生物信息學(xué) D.R. Westhead 科學(xué)出版社3、生物信息學(xué)基因和蛋白質(zhì)分析使用指南 李衍達(dá) 清華大學(xué) 清華大學(xué)出版社4、生物信息學(xué)中計(jì)算機(jī)技術(shù) 孫超 中國(guó)電力出版社5、生物信息學(xué)手冊(cè) 郝柏林 中科院物理所 上海

2、科學(xué)技術(shù)出版社6、簡(jiǎn)明生物信息學(xué) 鐘揚(yáng) 復(fù)旦大學(xué) 高等教育出版社10/10/3第3頁(yè)第一章生物信息學(xué)引論10/10/4第4頁(yè)介紹 引言 生物信息學(xué)發(fā)展歷史 人類基因組計(jì)劃和基因組信息學(xué) 蛋白質(zhì)結(jié)構(gòu)與功效關(guān)系研究當(dāng)前生物信息學(xué)主要研究?jī)?nèi)容 生物信息學(xué)所用方法和技術(shù)10/10/5第5頁(yè) 第一節(jié) 引言生命信息組織、傳遞、表示物理化學(xué)分子生物學(xué)遺傳學(xué)信息技術(shù)10/10/6第6頁(yè)1、 生物信息學(xué)概念 HGP生物數(shù)據(jù)激增(每15個(gè)月翻一番)生物學(xué)家數(shù)學(xué)家計(jì)算機(jī)科學(xué)家生物信息學(xué)(bioinfomatics)誕生10/10/7第7頁(yè)概念(廣義)生物體系和過(guò)程中信息存貯、傳遞和表示細(xì)胞、組織、器官生理、病理、藥

3、理過(guò)程中各種生物信息信息科學(xué)生命科學(xué)中信息科 學(xué) 10/10/8第8頁(yè)概念(狹義)深層次生物學(xué)知識(shí)分子生物信息學(xué) Molecular Bioinformatics挖掘獲取生物分子信息獲取、存貯、分析和利用生物分子數(shù)據(jù)10/10/9第9頁(yè)Bioinformatics生物分子數(shù) 據(jù) 計(jì)算機(jī)計(jì) 算 + 10/10/10第10頁(yè) 高性能計(jì)算服務(wù)器,圖形工作站10/10/11第11頁(yè) 高端計(jì)算集群10/10/12第12頁(yè)高度靈活可擴(kuò)展計(jì)算集群10/10/13第13頁(yè)10/10/14第14頁(yè)2、生物分子信息 細(xì)胞分子存貯、復(fù)制、傳遞和表示遺傳信息系統(tǒng)生物信息載體10/10/15第15頁(yè)生物信息學(xué)主要研究?jī)?/p>

4、種信息載體DNA分子蛋白質(zhì)分子10/10/16第16頁(yè)10/10/17第17頁(yè)P(yáng)rotein Machines 10/10/18第18頁(yè)From the Cell to Protein Machines 10/10/19第19頁(yè)生物分子最少攜帶著三種信息遺傳信息與功效相關(guān)結(jié)構(gòu)信息進(jìn)化信息10/10/20第20頁(yè)(1)遺傳信息載體DNA 遺傳信息載體主要是DNA 控制生物體性狀基因是一系列DNA片段 生物體生長(zhǎng)發(fā)育本質(zhì)就是遺傳信息傳遞和表示 10/10/21第21頁(yè)DNA經(jīng)過(guò)自我復(fù)制,在生物體繁衍過(guò)程中傳遞遺傳信息 基因經(jīng)過(guò)轉(zhuǎn)錄和翻譯,使遺傳信息在生物個(gè)體中得以表示,并使后代表現(xiàn)出與親代相同生物

5、性狀。 基因控制著蛋白質(zhì)合成 DNARNA蛋白質(zhì)轉(zhuǎn)錄翻譯10/10/22第22頁(yè)基因DNA序列DNA前體RNAmRNA多肽鏈蛋白質(zhì)序列對(duì)應(yīng)關(guān)系遺傳密碼10/10/23第23頁(yè)(2)蛋白質(zhì)結(jié)構(gòu)決定其功效蛋白質(zhì)功效取決于蛋白質(zhì)空間結(jié)構(gòu) 蛋白質(zhì)結(jié)構(gòu)決定于蛋白質(zhì)序列(這是當(dāng)前基本共認(rèn)假設(shè)),蛋白質(zhì)結(jié)構(gòu)信息隱含在蛋白質(zhì)序列之中。10/10/24第24頁(yè)(3) DNA分子和蛋白質(zhì)分子都含有進(jìn)化信息經(jīng)過(guò)比較相同蛋白質(zhì)序列,如肌紅蛋白和血紅蛋白,能夠發(fā)覺(jué)因?yàn)榛驈?fù)制而產(chǎn)生分子進(jìn)化證據(jù)。經(jīng)過(guò)比較來(lái)自于不一樣種屬同源蛋白質(zhì),即直系同源蛋白質(zhì),能夠分析蛋白質(zhì)甚至種屬之間系統(tǒng)發(fā)生關(guān)系,推測(cè)它們共同祖先蛋白質(zhì)。10/1

6、0/25第25頁(yè)生物分子信息DNA序列數(shù)據(jù) 蛋白質(zhì)序列數(shù)據(jù) 生物分子結(jié)構(gòu)數(shù)據(jù) 生物分子功效數(shù)據(jù) 最基本直觀復(fù)雜生物分子數(shù)據(jù)類型10/10/26第26頁(yè) DNA核酸序列蛋白質(zhì)氨基酸序列蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)功效最基本生物信息維持生命活動(dòng)機(jī)器遺傳密碼生命體系千姿百態(tài)改變生物分子數(shù)據(jù)及其關(guān)系10/10/27第27頁(yè)第一部遺傳密碼已被破譯,但對(duì)密碼轉(zhuǎn)錄過(guò)程還不清楚,對(duì)大多數(shù)DNA非編碼區(qū)域功效還知之甚少 對(duì)于第二部密碼,當(dāng)前則只能用統(tǒng)計(jì)學(xué)方法進(jìn)行分析不論是第一部遺傳密碼,還是第二部遺傳密碼,都隱藏在大量生物分子數(shù)據(jù)之中。生物分子數(shù)據(jù)是寶藏,生物信息數(shù)據(jù)庫(kù)是金礦,等候我們?nèi)ネ诰蚝屠谩?0/10/28第28頁(yè)

7、生物分子信息特征生物分子信息數(shù)據(jù)量大 生物分子信息復(fù)雜 生物分子信息之間存在著親密聯(lián)絡(luò)10/10/29第29頁(yè)3、生物信息學(xué)目標(biāo)和任務(wù) 搜集和管理生物分子數(shù)據(jù)數(shù)據(jù)分析和挖掘開(kāi)發(fā)分析工具和實(shí)用軟件生物分子序列比較工具基因識(shí)別工具生物分子結(jié)構(gòu)預(yù)測(cè)工具基因表示數(shù)據(jù)分析工具 10/10/30第30頁(yè) 試驗(yàn) 數(shù)據(jù) 信息 知識(shí) 搜集 表示 分析 建模 刻畫(huà)特征 比較 推理 應(yīng) 用基因工程蛋白質(zhì)設(shè)計(jì)疾病診療疾病治療開(kāi)發(fā)新藥生物分子信息處理流程10/10/31第31頁(yè)分子生物學(xué)三大關(guān)鍵數(shù)據(jù)庫(kù) GenBank核酸序列數(shù)據(jù)庫(kù) SWISS-PROT蛋白質(zhì)序列數(shù)據(jù)庫(kù) PDB生物大分子結(jié)構(gòu)數(shù)據(jù)庫(kù) 10/10/32第32

8、頁(yè)數(shù)據(jù)源數(shù)據(jù)量生物信息學(xué)任務(wù)DNA序列11.5百萬(wàn)條序列125.0 億個(gè)堿基 分離編碼與非編碼區(qū)域識(shí)別內(nèi)含子與外顯子基因產(chǎn)物預(yù)測(cè)基因功效注釋基因調(diào)控信息分析 蛋白質(zhì)序列40.0萬(wàn)條序列(每條序列平都有300氨基酸 )序列比較多重序列比對(duì)識(shí)別保守序列模式進(jìn)化分析 大分子結(jié)構(gòu)1.5 萬(wàn)個(gè)結(jié)構(gòu)(每個(gè)結(jié)構(gòu)平均1000個(gè)原子坐標(biāo)) 二級(jí)結(jié)構(gòu)、空間結(jié)構(gòu)預(yù)測(cè)三維結(jié)構(gòu)比對(duì)蛋白質(zhì)幾何學(xué)度量表面和形態(tài)計(jì)算分子間相互作用分析分子模擬 基因組300個(gè)基因組 標(biāo)重視復(fù)序列基因結(jié)構(gòu)分析系統(tǒng)發(fā)生分析基因與疾病連鎖分析基因組比較遺傳語(yǔ)言分析 基因表示酵母6000個(gè)基因在約20時(shí)間點(diǎn)表示值 達(dá)模式相關(guān)分析基因表基因調(diào)控網(wǎng)絡(luò)分析

9、表示調(diào)控信息分析 表1.1 至初已經(jīng)得到各類數(shù)據(jù)及基本數(shù)據(jù)處理任務(wù)10/10/33第33頁(yè)生物信息學(xué)研究意義認(rèn)識(shí)生物本質(zhì)了解生物分子信息組織和結(jié)構(gòu),破譯基因組信息,說(shuō)明生物信息之間關(guān)系。改變生物學(xué)研究方式 改變傳統(tǒng)研究方式,引進(jìn)當(dāng)代信息學(xué)方法在醫(yī)學(xué)上主要意義為疾病診療和治療提供依據(jù)為設(shè)計(jì)新藥提供依據(jù)生物信息學(xué)將是二十一世紀(jì)生物學(xué)核心 10/10/34第34頁(yè)主要研究?jī)?nèi)容 破譯遺傳語(yǔ)言、識(shí)別基因 預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)和功效 認(rèn)識(shí)生物界信息存貯和傳遞本質(zhì) 研究藥品作用機(jī)制和開(kāi)發(fā)新藥10/10/35第35頁(yè)第二節(jié) 生物信息學(xué)發(fā)展歷史生物信息學(xué)基本思想產(chǎn)生 生物信息學(xué) 快速發(fā)展二十世紀(jì)50年代二十世紀(jì)80-

10、90年代生物科學(xué)和技術(shù)發(fā)展人類基因組計(jì)劃推進(jìn) 10/10/36第36頁(yè)20世紀(jì)50年代,生物信息學(xué)開(kāi)始孕育20世紀(jì)60年代,生物分子信息在概念上將計(jì)算 生物學(xué)和計(jì)算機(jī)科學(xué)聯(lián)絡(luò)起來(lái)20世紀(jì)70年代,生物信息學(xué)真正開(kāi)端20世紀(jì)70年代到80年代早期 ,出現(xiàn)了一系列著 名序列比較方法和生物信息分析方法 20世紀(jì)80年代以后,出現(xiàn)一批生物信息服務(wù)機(jī) 構(gòu)和生物信息數(shù)據(jù)庫(kù)20世紀(jì)90年代后 ,HGP促進(jìn)生物信息學(xué)快速 發(fā)展10/10/37第37頁(yè)關(guān)于生物信息學(xué)發(fā)展歷程中主要大事,請(qǐng)參見(jiàn)下面兩個(gè)網(wǎng)站介紹:/Education/BLASTinfo/milestones.html、/bioinformatics

11、/。10/10/38第38頁(yè)生物信息學(xué)發(fā)展現(xiàn)實(shí)狀況PubMed中與生物信息學(xué)相關(guān)論文統(tǒng)計(jì) 90002%10/10/39第39頁(yè)第三節(jié) 人類基因組計(jì)劃和基因組信息學(xué) 1、人類基因組計(jì)劃介紹 人類基因組計(jì)劃準(zhǔn)備用時(shí)間,投入30億美元,完成人類全部24條染色體3109脫氧核苷酸對(duì)(bp)序列測(cè)定,主要任務(wù)包含作圖(遺傳圖譜、物理圖譜建立及轉(zhuǎn)錄圖譜繪制)、測(cè)序和基因識(shí)別。其中還包含模型生物(如大腸桿菌、酵母、線蟲(chóng)、小鼠等)基因組作圖和測(cè)序,以及信息系統(tǒng)建立。作圖和測(cè)序是基本任務(wù),在此基礎(chǔ)上解讀和破譯生物體生老病死以及和疾病相關(guān)遺傳信息10/10/40第40頁(yè)模式生物酵母大腸桿菌果蠅線蟲(chóng)老鼠10/10/

12、41第41頁(yè)曼哈頓原子彈計(jì)劃(1942-46)阿波羅登月計(jì)劃(1961-69)人類基因組計(jì)劃(1990-)20世紀(jì)三大科學(xué)計(jì)劃10/10/42第42頁(yè)1961年,美國(guó)總統(tǒng)Kennedy提出兩個(gè)科學(xué)計(jì)劃:登月計(jì)劃攻克腫瘤計(jì)劃 人類遺傳信息復(fù)雜性人類基因組計(jì)劃(HGP,Human Genome Project)目標(biāo):整體上破解人類遺傳信息奧秘“我們選擇登月”(1962年Kennedy在Rice大學(xué)演講)為何提出HGP?10/10/43第43頁(yè)生命活動(dòng)三要素:物質(zhì)、能量、信息 DNA: 遺傳物質(zhì)(遺傳信息載體) 雙螺旋結(jié)構(gòu) A, C, G, T四種基本字符復(fù)雜文本 基因(Gene):含有遺傳效應(yīng)DN

13、A分子片段DNA、基因、基因組10/10/44第44頁(yè) 基因組(Genome):包含細(xì)胞或生物體全套遺傳信息全 部遺傳物質(zhì) 原核生物(細(xì)菌、病毒等) 真核生物(真菌、植物、動(dòng)物等)人類基因組: 含有約3萬(wàn)個(gè) 基因10/10/45第45頁(yè)1984.12 猶他州阿爾塔組織會(huì)議,初步研討測(cè)定人類整個(gè)基 因組DNA序列意義1986.3 杜爾貝科(Dulbecco )在Science撰文 “腫瘤研 究轉(zhuǎn)折點(diǎn):人類基因組測(cè)序” 美國(guó)能源部(DOE)提出“人類基因組計(jì)劃”草案1987 美國(guó)能源部和國(guó)家衛(wèi)生研究院(NIH)聯(lián)合為“人類 基因組計(jì)劃”下?lián)荛_(kāi)啟經(jīng)費(fèi)約550萬(wàn)美元1989 美國(guó)成立“國(guó)家人類基因組研

14、究中心”,Watson擔(dān)任 第一任主任1990.10 經(jīng)美國(guó)國(guó)會(huì)同意,人類基因組計(jì)劃正式開(kāi)啟James WatsonWalter GilbertHGP歷史回顧10/10/46第46頁(yè)盡管比之于人類登月,HGP投入資金要少得多,但HGP對(duì)人類生活影響要更為深遠(yuǎn)。因?yàn)榘殡S這個(gè)計(jì)劃完成,DNA分子中編碼遺傳信息將對(duì)人類存在化學(xué)基礎(chǔ)作出最終回答。這將不但幫助我們了解我們是怎樣作為健康人發(fā)揮正常功效,而且也將在化學(xué)水平上解釋遺傳因子在各種疾病,如癌癥、早老癡呆癥、精神分裂癥等一些嚴(yán)重危害人類健康疾病中作用。畢竟對(duì)人類本身更深入了解是人類活動(dòng)中最主要一個(gè)部分。Watson ,1990,Science10/

15、10/47第47頁(yè)HGP最初目標(biāo)經(jīng)過(guò)國(guó)際合作,用時(shí)間(19902005)最少投入30億美元,構(gòu)建詳細(xì)人類基因組遺傳圖和物理圖,確定人類DNA全部核苷酸序列,定位約10萬(wàn)基因,并對(duì)其它生物進(jìn)行類似研究。4張圖:遺傳圖 物理圖 序列圖 基因圖HGP終極目標(biāo)說(shuō)明人類基因組全部DNA序列;識(shí)別基因;建立儲(chǔ)存這些信息數(shù)據(jù)庫(kù);開(kāi)發(fā)數(shù)據(jù)分析工具;研究HGP實(shí)施所帶來(lái)倫理、法律和社會(huì)問(wèn)題。 10/10/48第48頁(yè)1995 第一個(gè)自由生物體流感嗜血菌(H. inf)全基因組測(cè)序完成1996 完成人類基因組計(jì)劃遺傳作圖 開(kāi)啟模型生物基因組計(jì)劃H.Inf 全基因組Saccharomyces cerevisiae釀

16、酒酵母Caenorhabditis elegans秀麗線蟲(chóng)10/10/49第49頁(yè)1997 大腸桿菌(E. coli)全基因組測(cè)序完成1998 完成人類基因組計(jì)劃物理作圖 開(kāi)始人類基因組大規(guī)模測(cè)序 賽立拉(Celera)企業(yè)加入,與公共領(lǐng)域競(jìng)爭(zhēng) 開(kāi)啟水稻基因組計(jì)劃1999.7 第5屆國(guó)際公共領(lǐng)域人類基因組測(cè)序會(huì)議,加緊測(cè)序速度大腸桿菌及其全基因組水稻基因組計(jì)劃10/10/50第50頁(yè) Celera企業(yè)宣告完結(jié)果蠅基因組測(cè)序 國(guó)際公共領(lǐng)域宣告完成第一個(gè)植物基因組擬南芥全基 因組測(cè)序工作.6.26 公共領(lǐng)域和Celera企業(yè)同時(shí)宣告完成人類基因組工作草圖.2.15 Nature刊文發(fā)表國(guó)際公共領(lǐng)域

17、結(jié)果.2.16 Science刊文發(fā)表Celera企業(yè)及其合作者結(jié)果Drosophila melanogaster果蠅Arabidopsis thaliana擬南芥10/10/51第51頁(yè)2月15日Nature封面2月16日Science封面10/10/52第52頁(yè)At the White House on June 26, Francis Collins (r), Director of the National Human Genome Research Institute, President Clinton, and J. Craig Venter, President of Cela

18、ra Genomics, lauded the thousands of scientists who contributed to the genome sequence.10/10/53第53頁(yè)10/10/54第54頁(yè)8月26日 人類基因組“中國(guó)卷”繪制工作宣告完成。年 水稻、小鼠、瘧原蟲(chóng)等基因組測(cè)序完成204月14日 中、美、日、德、法、英等6國(guó)科學(xué)家宣告人類基因組序列圖繪制成功,人類基因組計(jì)劃全部目標(biāo)全部實(shí)現(xiàn)。 2010月人類基因組完成圖公布。 10/10/55第55頁(yè)10/10/56第56頁(yè)10/10/57第57頁(yè)種類數(shù)目備注古細(xì)菌(Archaea)35真細(xì)菌(Bacteria)42

19、1其中有測(cè)定了2個(gè)以上菌株真核生物(Eukaryo)47包含酵母、線蟲(chóng)、果蠅、蚊子、擬南芥、人等病毒(Virus)1,275包含不一樣亞類或不一樣株系類病毒(Viroid)39包含不一樣亞類或不一樣株系噬菌體(Phage)347包含不一樣亞類或不一樣株系細(xì)胞器(Organelle)1,097包含線粒體和葉綠體質(zhì)粒(Plasmid)480(http:/www.ebi.ac.uk/genomes/,2月)已完成測(cè)序3,000多個(gè)基因組10/10/58第58頁(yè)1、大協(xié)作研究: 以學(xué)科為中心, 以問(wèn)題為中心,多學(xué)科合作2、研究計(jì)劃性和有序性: 各方共同參加,制訂更科學(xué)、更全方面研究計(jì)劃4、政府與國(guó)家作

20、用: 美:領(lǐng)導(dǎo)與推進(jìn) 英:始于1989年2月,貢獻(xiàn)為1/3左右 法:始于1990年6月,貢獻(xiàn)為3左右 日:始于1990年,貢獻(xiàn)為7左右 德:始于1995年,貢獻(xiàn)為7左右 中:始于1999年9月,貢獻(xiàn)為1左右3、商業(yè)競(jìng)爭(zhēng)促進(jìn)基礎(chǔ)研究: 1998年Celera企業(yè)加入HGP研究特色10/10/59第59頁(yè)5、可連續(xù)性:太空觀察和基因組計(jì)劃都是科學(xué)上出眾計(jì)劃,每一個(gè)都是科學(xué)上邁出一大步。不過(guò)二者之間存在著一個(gè)刺眼差異:開(kāi)支方面有四十倍差異。開(kāi)支差異是至關(guān)主要,因?yàn)檫@意味著可連續(xù)性。當(dāng)一個(gè)計(jì)劃足夠廉價(jià)到成為一條能夠無(wú)限向未來(lái)延伸系列第一個(gè)時(shí),它是可連續(xù)。而當(dāng)一個(gè)計(jì)劃太昂貴,以至不經(jīng)過(guò)重大政治斗爭(zhēng)就無(wú)法

21、重復(fù)時(shí),它就是不可連續(xù)??蛇B續(xù)計(jì)劃帶來(lái)新計(jì)劃開(kāi)始,不可連續(xù)計(jì)劃則標(biāo)志著老時(shí)代結(jié)束。The Sun, the Genome, and the InternetTools of Scientific RevolutionFreeman Dyson 10/10/60第60頁(yè)各學(xué)科參加、協(xié)作:生命科學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)、計(jì)算機(jī)科學(xué)、材料科學(xué)以及倫理、法律等社會(huì)科學(xué)HGP帶來(lái)科學(xué)挑戰(zhàn)HGP:Pandoras Box 10/10/61第61頁(yè) 首要科學(xué)問(wèn)題 怎樣找到記載在基因組DNA一維結(jié)構(gòu)上控制生命時(shí)間、空間調(diào)控信息編碼方式和調(diào)整規(guī)律。 應(yīng)用數(shù)學(xué)、復(fù)雜系統(tǒng)理論、信息論、非線性科學(xué) 催生生物信息學(xué)、計(jì)算

22、生物學(xué)、系統(tǒng)生物學(xué) DNA芯片技術(shù) 交叉性技術(shù)領(lǐng)域:物理學(xué)、微電子信息技術(shù)、生化技術(shù)、信息技術(shù) 結(jié)構(gòu)生物學(xué) 前沿領(lǐng)域之一:生物物理學(xué)、生物化學(xué)、晶體學(xué)、波譜學(xué)、光譜學(xué)以及X射線晶體衍射技術(shù)、核磁共振技術(shù)10/10/62第62頁(yè)人類基因組計(jì)劃詳細(xì)任務(wù)能夠概括為建立四張圖譜 遺傳圖譜物理圖譜 序列圖譜轉(zhuǎn)錄圖譜10/10/63第63頁(yè)遺傳圖譜(genetic map)又稱連鎖圖譜(linkage map),它是以含有遺傳多態(tài)性(在一個(gè)遺傳位點(diǎn)上含有一個(gè)以上等位基因,在群體中出現(xiàn)頻率皆高于1%)遺傳標(biāo)識(shí)為“路標(biāo)”,以遺傳學(xué)距離(在減數(shù)分裂事件中兩個(gè)位點(diǎn)之間進(jìn)行交換、重組百分率,1%重組率稱為1cM)為

23、圖距基因組圖。遺傳圖譜建立為基因識(shí)別和完成基因定位創(chuàng)造了條件。遺傳圖譜 10/10/64第64頁(yè)遺傳連鎖圖:經(jīng)過(guò)計(jì)算連鎖遺傳標(biāo)志之間重組頻率,確定它們相對(duì)距離,普通用厘摩(cM,即每次減數(shù)分裂重組頻率為1%)表示。10/10/65第65頁(yè)物理圖譜物理圖譜(physical map)是指相關(guān)組成基因組全部基因排列和間距信息,它是經(jīng)過(guò)對(duì)組成基因組DNA分子進(jìn)行測(cè)定而繪制。繪制物理圖譜目標(biāo)是把相關(guān)基因遺傳信息及其在每條染色體上相對(duì)位置線性而系統(tǒng)地排列出來(lái)。10/10/66第66頁(yè)1998 年完成了含有52,000個(gè)序列標(biāo)簽位點(diǎn)(STS),并覆蓋人類基因組大部分區(qū)域連續(xù)克隆系物理圖譜。敲碎基因組,分析

24、研究?jī)?nèi)容所處染色體位置細(xì)菌人工染色體(80300 kb)酵母人工染色體(數(shù)百 kb)中心粒一對(duì)緊密相鄰標(biāo)志一對(duì)相鄰較遠(yuǎn)標(biāo)志染色體圖10/10/67第67頁(yè)序列圖譜伴隨遺傳圖譜和物理圖譜完成,測(cè)序就成為重中之重工作。DNA序列分析技術(shù)是一個(gè)包含制備DNA片段化及堿基分析、DNA信息翻譯多階段過(guò)程。經(jīng)過(guò)測(cè)序得到基因組序列圖譜 10/10/68第68頁(yè)大規(guī)?;蚪M測(cè)序 Megabace 測(cè)序儀3700 測(cè)序儀10/10/69第69頁(yè)大規(guī)模測(cè)序基本策略逐一克隆法:對(duì)連續(xù)克隆系中排定BAC克隆逐一進(jìn)行亞克隆測(cè)序并進(jìn)行組裝(國(guó)際合作測(cè)序計(jì)劃)全基因組鳥(niǎo)槍法:在一定作圖信息基礎(chǔ)上,繞過(guò)大片段連續(xù)克隆系構(gòu)建而

25、直接將基因組分解成小片段隨機(jī)測(cè)序,利用超級(jí)計(jì)算機(jī)進(jìn)行組裝(美國(guó)Celera企業(yè))10/10/70第70頁(yè)利用計(jì)算機(jī)軟件進(jìn)行序列拼接10/10/71第71頁(yè)轉(zhuǎn)錄圖譜 轉(zhuǎn)錄圖譜是在識(shí)別基因組所包含蛋白質(zhì)編碼序列基礎(chǔ)上繪制結(jié)合相關(guān)基因序列、位置及表示模式等信息圖譜。 10/10/72第72頁(yè)10/10/73第73頁(yè)基因識(shí)別 基因識(shí)別(gene identification)是HGP主要內(nèi)容之一,其目標(biāo)是識(shí)別全部人類基因。基因識(shí)別包含:識(shí)別基因組編碼區(qū)識(shí)別基因結(jié)構(gòu)基因識(shí)別當(dāng)前常采取有二種方法:從基因組序列中識(shí)別那些轉(zhuǎn)錄表示DNA片段從cDNA文庫(kù)中挑取并克隆。 10/10/74第74頁(yè)人類基因組計(jì)劃實(shí)

26、現(xiàn)對(duì)醫(yī)學(xué)事 業(yè)影響 對(duì)致病基因克隆也是人類基因組計(jì)劃內(nèi)容。疾病與基因直接或間接相關(guān),經(jīng)過(guò)生物學(xué)、醫(yī)學(xué)等技術(shù)對(duì)相關(guān)基因進(jìn)行抑制或調(diào)控,即可到達(dá)治療某一疾病效果。假如掌握了與某種疾病相關(guān)基因及突變,則能夠?qū)υ摷膊∵M(jìn)行預(yù)測(cè)、診療,甚至治療。 10/10/75第75頁(yè)基因變異與疾病10/10/76第76頁(yè)10/10/77第77頁(yè)人類基因組計(jì)劃實(shí)施意義 人類基因組計(jì)劃為我們碩士物信息組織、結(jié)構(gòu)、遺傳、表示帶來(lái)了極大方便,使人類對(duì)本身有一個(gè)根本了解。人類是最高級(jí)、最復(fù)雜、最主要生物,假如搞清楚人類基因組,那么再研究其它生物就輕易得多。研究各種模式生物基因組將有利于研究地球生物進(jìn)化史。10/10/78第78

27、頁(yè)5、我國(guó)對(duì)人類基因組計(jì)劃貢獻(xiàn)10/10/79第79頁(yè)又一次成功! 水稻基因研究10/10/80第80頁(yè)2、人類基因組計(jì)劃給生物信息學(xué)提出挑戰(zhàn)伴隨試驗(yàn)數(shù)據(jù)和可利用信息急劇增加,信息管理和分析成為HGP一項(xiàng)主要工作 發(fā)覺(jué)生物學(xué)規(guī)律解讀生物遺傳密碼認(rèn)識(shí)生命本質(zhì)研究基因組數(shù)據(jù)之間關(guān)系分析現(xiàn)有基因組數(shù)據(jù)利用數(shù)學(xué)模型和人工智能技術(shù)10/10/81第81頁(yè)10/10/82第82頁(yè)功效基因組學(xué) HGP完成后,我們將進(jìn)入“后基因組學(xué)”(post-genomics)時(shí)代基因組學(xué)研究重心已開(kāi)始從揭示生命全部遺傳信息轉(zhuǎn)移到在分子整體水平對(duì)功效研究上,即功效基因組學(xué)(functional genomics)功效基因組

28、學(xué)任務(wù)是進(jìn)行基因組功效注釋(Genome annotation)認(rèn)識(shí)基因與疾病關(guān)系掌握基因產(chǎn)物及其在生命活動(dòng)中作用10/10/83第83頁(yè)功效基因組學(xué)研究?jī)?nèi)容深入識(shí)別基因,識(shí)別基因轉(zhuǎn)錄調(diào)控信息,分析遺傳語(yǔ)言。注釋全部基因產(chǎn)物功效,這是當(dāng)前基因組功效注釋主要層次。研究基因表示調(diào)控機(jī)制,研究基因在生物體代謝路徑中地位,分析基因、基因產(chǎn)物之間相互作用關(guān)系,繪制基因調(diào)控網(wǎng)絡(luò)圖。比較基因組學(xué)研究,在基因組水平對(duì)各個(gè)生物進(jìn)行對(duì)照比較,能夠揭示生命起源和進(jìn)化、發(fā)覺(jué)蛋白質(zhì)功效。10/10/84第84頁(yè)人類基因組與其它生物基因組比較10/10/85第85頁(yè)例:人與鼠染色體差異10/10/86第86頁(yè)生物信息學(xué)與

29、新藥研制未來(lái)藥品研究過(guò)程將是基于生物信息知識(shí)挖掘過(guò)程數(shù)據(jù)處理和關(guān)聯(lián)分析發(fā)覺(jué)藥品作用對(duì)象確定靶目標(biāo)分子針對(duì)靶目標(biāo)進(jìn)行合理藥品設(shè)計(jì)10/10/87第87頁(yè)生物信息學(xué)與疾病檢測(cè)基因組計(jì)劃產(chǎn)生基因及基因多態(tài)性數(shù)據(jù)與臨床醫(yī)學(xué)檢驗(yàn)結(jié)果之間關(guān)系需要利用生物信息學(xué)方法去分析、去揭示依據(jù)這么分析結(jié)果,科學(xué)家能夠更準(zhǔn)確地了解疾病產(chǎn)生根本原因,更準(zhǔn)確地預(yù)測(cè)某個(gè)人患癌癥、糖尿病或者心臟病可能性,從而徹底改變我們?cè)\療、治療和預(yù)防疾病方式 10/10/88第88頁(yè)第四節(jié) 蛋白質(zhì)結(jié)構(gòu)與功效關(guān)系研究 蛋白質(zhì)結(jié)構(gòu) 蛋白質(zhì)序列 蛋白質(zhì)功效關(guān)系 10/10/89第89頁(yè)基因組計(jì)劃不停推進(jìn),其結(jié)果不但造成DNA序列數(shù)據(jù)快速增加,也造

30、成蛋白質(zhì)序列數(shù)據(jù)快速增加。生物信息學(xué)在蛋白組學(xué)研究中主要任務(wù)是產(chǎn)生和分析蛋白質(zhì)結(jié)構(gòu),并將結(jié)構(gòu)知識(shí)應(yīng)用于生物學(xué)、醫(yī)學(xué)、藥學(xué)等生命科學(xué)領(lǐng)域。蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(cè)。蛋白質(zhì)結(jié)構(gòu)是合理藥品分子設(shè)計(jì)基礎(chǔ)。蛋白質(zhì)結(jié)構(gòu)是蛋白質(zhì)工程基礎(chǔ)。10/10/90第90頁(yè)基于生物信息學(xué)新藥設(shè)計(jì)10/10/91第91頁(yè)第五節(jié) 當(dāng)前生物信息學(xué)主要研究?jī)?nèi)容1、 生物分子數(shù)據(jù)搜集與管理2、 數(shù)據(jù)庫(kù)搜索及序列比較 3、 基因組序列分析 4、基因表示數(shù)據(jù)分析與處理 5、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè) 10/10/92第92頁(yè)基因組數(shù)據(jù)庫(kù) 蛋白質(zhì)序列數(shù)據(jù)庫(kù) 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù) DDBJEMBLGenBankSWISS-PROT PDBPIR1、 生物分子

31、數(shù)據(jù)搜集與管理10/10/93第93頁(yè)2、 數(shù)據(jù)庫(kù)搜索及序列比較 搜索同源序列在一定程度上就是經(jīng)過(guò)序列比較尋找相同序列 序列比較一個(gè)基本操作就是比對(duì)(Alignment),即將兩個(gè)序列各個(gè)字符(代表核苷酸或者氨基酸殘基)按照對(duì)應(yīng)等同或者置換關(guān)系進(jìn)行對(duì)比排列,其結(jié)果是兩個(gè)序列共有排列次序,這是序列相同程度一個(gè)定性描述多重序列比對(duì)研究是多個(gè)序列共性。序列多重比對(duì)可用來(lái)搜索基因組序列功效區(qū)域,也可用于研究一組蛋白質(zhì)之間進(jìn)化關(guān)系。 10/10/94第94頁(yè)發(fā)覺(jué)同源分子10/10/95第95頁(yè)3、 基因組序列分析 遺傳語(yǔ)言分析基因組結(jié)構(gòu)分析基因識(shí)別基因功效注釋基因調(diào)控信息分析基因組比較10/10/96第

32、96頁(yè)4、基因表示數(shù)據(jù)分析與處理基因表示數(shù)據(jù)分析是當(dāng)前生物信息學(xué)研究熱 點(diǎn)和重點(diǎn) 當(dāng)前對(duì)基因表示數(shù)據(jù)處理主要是進(jìn)行聚類分 析,將表示模式相同基因聚為一類,在此基 礎(chǔ)上尋找相關(guān)基因,分析基因功效。 所用方法主要有:相關(guān)分析方法模式識(shí)別技術(shù)中層次式聚類方法人工智能中自組織映射神經(jīng)網(wǎng)絡(luò)主元分析方法 10/10/97第97頁(yè)基因芯片10/10/98第98頁(yè)10/10/99第99頁(yè)10/10/100第100頁(yè)5、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè) 蛋白質(zhì)生物功效由蛋白質(zhì)結(jié)構(gòu)所決定 ,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)成為了解蛋白質(zhì)功效主要路徑。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)分為:二級(jí)結(jié)構(gòu)預(yù)測(cè)空間結(jié)構(gòu)預(yù)測(cè) 蛋白質(zhì)折疊10/10/101第101頁(yè)二級(jí)結(jié)構(gòu)預(yù)測(cè)在一

33、定程度上二級(jí)結(jié)構(gòu)預(yù)測(cè)能夠歸結(jié)為模式識(shí)別問(wèn)題 在二級(jí)結(jié)構(gòu)預(yù)測(cè)方面主要方法有:立體化學(xué)方法圖論方法統(tǒng)計(jì)方法最鄰近決議方法基于規(guī)則教授系統(tǒng)方法分子動(dòng)力學(xué)方法人工神經(jīng)網(wǎng)絡(luò)方法 預(yù)測(cè)準(zhǔn)確率超出70%第一個(gè)軟件是基于神經(jīng)網(wǎng)絡(luò)PHD系統(tǒng)10/10/102第102頁(yè)空間結(jié)構(gòu)預(yù)測(cè)在空間結(jié)構(gòu)預(yù)測(cè)方面,比較成功理論方法是同源模型法 該方法依據(jù)是:相同序列蛋白質(zhì)傾向于折疊成相同三維空間結(jié)構(gòu) 利用同源模型方法能夠完成全部蛋白質(zhì)10-30%空間結(jié)構(gòu)預(yù)測(cè)工作 10/10/103第103頁(yè)第六節(jié) 生物信息學(xué)所用方法和技術(shù) 1、數(shù)學(xué)統(tǒng)計(jì)方法 2、動(dòng)態(tài)規(guī)劃方法 3、機(jī)器學(xué)習(xí)與模式識(shí)別技術(shù) 4、數(shù)據(jù)庫(kù)技術(shù)及數(shù)據(jù)挖掘 5、人工神經(jīng)網(wǎng)

34、絡(luò)技術(shù)6、教授系統(tǒng) 7、分子模型化技術(shù)8、量子力學(xué)和分子力學(xué)計(jì)算 9、生物分子計(jì)算機(jī)模擬10、因特網(wǎng)(Internet)技術(shù) 10/10/104第104頁(yè)1、數(shù)學(xué)統(tǒng)計(jì)方法生物活動(dòng)經(jīng)常以大量、重復(fù)形式出現(xiàn),既受到內(nèi)在原因制約,又受到外界環(huán)境隨機(jī)干擾。所以概率論和數(shù)學(xué)統(tǒng)計(jì)是當(dāng)代生物學(xué)研究中一個(gè)慣用分析方法 數(shù)據(jù)統(tǒng)計(jì)、原因分析、多元回歸分析是生物學(xué)研究必備工具隱馬爾科夫模型(Hidden Markov Models)在序列分析方面有著主要應(yīng)用。與隱馬爾科夫模型相關(guān)技術(shù)是馬爾科夫鏈(Markov Chain) 10/10/105第105頁(yè)2、動(dòng)態(tài)規(guī)劃方法動(dòng)態(tài)規(guī)劃(Dynamic Programming

35、)是一個(gè)處理多階段決議過(guò)程最優(yōu)化方法或復(fù)雜空間優(yōu)化搜索方法 動(dòng)態(tài)規(guī)劃處理問(wèn)題基本過(guò)程是:將一個(gè)問(wèn)題全局解分解為局部解,逆序遞推求出局部最優(yōu)解,伴隨執(zhí)行過(guò)程推進(jìn),“局部”逐步靠近“全局”,最終取得全局最優(yōu)解 10/10/106第106頁(yè)3、機(jī)器學(xué)習(xí)與模式識(shí)別技術(shù)機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)是模擬人類學(xué)習(xí)過(guò)程,以計(jì)算機(jī)為工具獲取知識(shí)、積累經(jīng)驗(yàn) 1、遺傳算法采取隨機(jī)搜索方法,含有自適應(yīng)能力和便于并行計(jì)算 2、神經(jīng)網(wǎng)絡(luò)理論是基于人腦結(jié)構(gòu),其目標(biāo)是揭示一個(gè)系統(tǒng)是怎樣向環(huán)境學(xué)習(xí),這一個(gè)方法被稱為聯(lián)接主義。 模式識(shí)別模式識(shí)別是機(jī)器學(xué)習(xí)一個(gè)主要任務(wù)。模式是對(duì)感興趣客體定量或者結(jié)構(gòu)描述,而模式識(shí)別就是利用計(jì)算機(jī)對(duì)客體進(jìn)行判別,將相同或者相同客體歸入同種類別中模式識(shí)別主要有兩種方法:依據(jù)對(duì)象統(tǒng)計(jì)特征進(jìn)行識(shí)別,依據(jù)對(duì)象結(jié)構(gòu)特征進(jìn)行識(shí)別 10/10/107第107頁(yè)環(huán)境學(xué)習(xí)知識(shí)庫(kù)執(zhí)行機(jī)器學(xué)習(xí)系統(tǒng)基本結(jié)構(gòu) 反 饋10/10/108第108頁(yè)4、數(shù)據(jù)庫(kù)技術(shù)及數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)技術(shù) 數(shù)據(jù)倉(cāng)庫(kù) 虛擬數(shù)據(jù)庫(kù)技術(shù)(Virtual Database,簡(jiǎn)稱 VDB) 數(shù)據(jù)挖掘(data mining) 又稱作數(shù)據(jù)庫(kù)中知識(shí)發(fā)覺(jué) (Knowledge Discovery in Database),它是從數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中發(fā)覺(jué)并提取隱

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論