版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2022-6-101生物信息學(xué)生物信息學(xué)Bioinformatics2022-6-102理論課講授內(nèi)容理論課講授內(nèi)容第一講第一講 生物信息學(xué)概論生物信息學(xué)概論第二講第二講 醫(yī)學(xué)信息學(xué)基礎(chǔ)及信息學(xué)基本技術(shù)醫(yī)學(xué)信息學(xué)基礎(chǔ)及信息學(xué)基本技術(shù)第三講第三講 生物信息中心、核酸和蛋白質(zhì)序列生物信息中心、核酸和蛋白質(zhì)序列 資源資源第四講第四講 生物信息重要數(shù)據(jù)庫生物信息重要數(shù)據(jù)庫2022-6-103第五講第五講 序列比對序列比對第六講第六講 生物醫(yī)學(xué)文獻(xiàn)及生物醫(yī)學(xué)文獻(xiàn)及PCR第七講第七講 序列特征分析序列特征分析第八講第八講 生物信息學(xué)與基因芯片生物信息學(xué)與基因芯片2022-6-104生物生物信息信息學(xué)概論學(xué)
2、概論2022-6-105內(nèi)容內(nèi)容生物信息學(xué)概況生物信息學(xué)概況 生物信息學(xué)簡介生物信息學(xué)簡介 生物信息學(xué)、生物學(xué)基礎(chǔ)生物信息學(xué)、生物學(xué)基礎(chǔ) 歷史、內(nèi)容、任務(wù)、技術(shù)和方法歷史、內(nèi)容、任務(wù)、技術(shù)和方法 發(fā)展趨勢及研究熱點(diǎn)發(fā)展趨勢及研究熱點(diǎn) 生物信息學(xué)簡介生物信息學(xué)簡介2022-6-107三大自然科學(xué)之謎三大自然科學(xué)之謎 宇宙的起源宇宙的起源 生命的誕生生命的誕生 思維的奧秘思維的奧秘2022-6-1082022-6-109What is bioinformatics? from /wiki/Bioinformatics Bioinformatics and
3、 computational biology involve the use of techniques including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems usually on the molecular level. Research in computational biology often overlaps with syste
4、ms biology. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution. 2022-6-1010生物生物信息信息學(xué)學(xué) 說文解字:生物說文解字:生物 +
5、信息信息 + 學(xué)學(xué) (bioinformatics) biology + information + theory 廣義廣義 應(yīng)用信息科學(xué)的方法和技術(shù),研究生物體系應(yīng)用信息科學(xué)的方法和技術(shù),研究生物體系和生物過程中信息的存貯、信息的內(nèi)涵和信息的和生物過程中信息的存貯、信息的內(nèi)涵和信息的傳遞,研究和分析生物體細(xì)胞、組織、器官的生傳遞,研究和分析生物體細(xì)胞、組織、器官的生理、病理、藥理過程中的各種生物信息,或者也理、病理、藥理過程中的各種生物信息,或者也可以說成是可以說成是生命科學(xué)生命科學(xué)中的中的信息科學(xué)信息科學(xué)。 狹義狹義 應(yīng)用應(yīng)用信息科學(xué)信息科學(xué)的理論、方法和技術(shù),管理、的理論、方法和技術(shù),管
6、理、分析和利用分析和利用生物分子生物分子數(shù)據(jù)。數(shù)據(jù)。 2022-6-1011生物學(xué)家生物學(xué)家( (生物學(xué)問題生物學(xué)問題) )數(shù)學(xué)物理學(xué)家數(shù)學(xué)物理學(xué)家計(jì)算機(jī)科學(xué)家計(jì)算機(jī)科學(xué)家( (基礎(chǔ)理論問題基礎(chǔ)理論問題) )工程師工程師(技術(shù)應(yīng)用)(技術(shù)應(yīng)用)計(jì)算生物學(xué)計(jì)算生物學(xué)/ /生物信息學(xué):生物信息學(xué):三種科學(xué)文化的融合三種科學(xué)文化的融合2022-6-1012A marriage of BiologyInformationtechnology2022-6-1013數(shù)據(jù)數(shù)據(jù)算法算法應(yīng)用應(yīng)用(Bioinformatics)美國人類基因組計(jì)劃實(shí)施五年后的總結(jié)美國人類基因組計(jì)劃實(shí)施五年后的總結(jié)報(bào)告中,對生物信息
7、學(xué)作了以下定義報(bào)告中,對生物信息學(xué)作了以下定義: 生物信息學(xué)是一門交叉科學(xué),它包含了生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、處理、存儲、分發(fā)、分析生物信息的獲取、處理、存儲、分發(fā)、分析和解釋等在內(nèi)的所有方面,綜合運(yùn)用數(shù)學(xué)、和解釋等在內(nèi)的所有方面,綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。理解大量數(shù)據(jù)所包含的生物學(xué)意義。2022-6-10152022-6-1016曼哈頓原子彈計(jì)劃曼哈頓原子彈計(jì)劃阿波羅登月計(jì)劃阿波羅登月計(jì)劃人類基因組計(jì)劃人類基因組計(jì)劃(Manhattan Project) 美國陸軍部于美國陸
8、軍部于1942年年6月開始實(shí)施的利月開始實(shí)施的利用核裂變反應(yīng)來研用核裂變反應(yīng)來研制原子彈的計(jì)劃制原子彈的計(jì)劃 阿波羅計(jì)劃(阿波羅計(jì)劃(Projec Apollo),是美國從),是美國從1961年到年到1972年從事的年從事的一系列載人登月飛行任一系列載人登月飛行任務(wù)務(wù) 2022-6-101760年代初,美國總統(tǒng)年代初,美國總統(tǒng)Kennedy提出兩個科學(xué)計(jì)劃:提出兩個科學(xué)計(jì)劃:登月計(jì)劃登月計(jì)劃攻克腫瘤計(jì)劃攻克腫瘤計(jì)劃 人類遺傳信息的復(fù)雜性人類遺傳信息的復(fù)雜性人類基因組計(jì)劃人類基因組計(jì)劃(HGP,Human Genome Project)2022-6-1018生命活動三要素:物質(zhì)、能量、信息生命活
9、動三要素:物質(zhì)、能量、信息 DNA: 遺傳物質(zhì)遺傳物質(zhì)(遺傳信息的載體遺傳信息的載體) 雙螺旋結(jié)構(gòu)雙螺旋結(jié)構(gòu) A, C, G, T四種基本字符的復(fù)雜文本四種基本字符的復(fù)雜文本 基因基因(Gene):具有遺傳效應(yīng)的:具有遺傳效應(yīng)的DNA分子片段分子片段2022-6-1019 基因組基因組(Genome)(Genome):包含包含細(xì)胞或生物體細(xì)胞或生物體全套的遺傳信息的全部全套的遺傳信息的全部 遺傳物質(zhì)。遺傳物質(zhì)。原核生物原核生物( (細(xì)菌、病毒等細(xì)菌、病毒等) ) 真核生物真核生物( (真菌、植物、動物等真菌、植物、動物等) )人類基因組:人類基因組: 3.2109 bp 2022-6-1020
10、盡管比之于人類登月,盡管比之于人類登月,HGP的投入資金的投入資金要少得多,但要少得多,但HGP對人類生活的影響要對人類生活的影響要更為深遠(yuǎn)更為深遠(yuǎn)。因?yàn)殡S著這個計(jì)劃的完成,。因?yàn)殡S著這個計(jì)劃的完成,DNA分子中編碼的分子中編碼的遺傳信息將對人類存遺傳信息將對人類存在的化學(xué)基礎(chǔ)作出最終的回答在的化學(xué)基礎(chǔ)作出最終的回答。這將不。這將不僅幫助我們理解我們是如何作為健康的僅幫助我們理解我們是如何作為健康的人發(fā)揮正常功能的,而且也將在化學(xué)水人發(fā)揮正常功能的,而且也將在化學(xué)水平上解釋遺傳因子在各種疾病,如癌癥、平上解釋遺傳因子在各種疾病,如癌癥、早老癡呆癥、精神分裂癥等一些嚴(yán)重危早老癡呆癥、精神分裂癥等
11、一些嚴(yán)重危害人類健康的疾病中的作用。畢竟害人類健康的疾病中的作用。畢竟對人對人類自身更深入的了解是人類活動中最重類自身更深入的了解是人類活動中最重要的一個部分。要的一個部分。Watson ,1990,Science2022-6-10211984.12 猶他州阿爾塔組織會議,初步研討測定人類整個基猶他州阿爾塔組織會議,初步研討測定人類整個基 因組因組DNA序列的意義序列的意義1985 Dulbecco在在Science撰文撰文 “腫瘤研究的轉(zhuǎn)折點(diǎn)腫瘤研究的轉(zhuǎn)折點(diǎn):人人 類基因組的測序類基因組的測序” 美國能源部美國能源部(DOE)提出提出“人類基因組計(jì)劃人類基因組計(jì)劃”草案草案1987 美國能源
12、部和國家衛(wèi)生研究院(美國能源部和國家衛(wèi)生研究院(NIH)聯(lián)合為)聯(lián)合為“人類人類 基因組計(jì)劃基因組計(jì)劃”下?lián)軉咏?jīng)費(fèi)約下?lián)軉咏?jīng)費(fèi)約550萬美元萬美元1989 美國成立美國成立“國家人類基因組研究中心國家人類基因組研究中心Watson擔(dān)任擔(dān)任 第一任主任第一任主任1990.10 經(jīng)美國國會批準(zhǔn),人類基因組計(jì)劃正式啟動經(jīng)美國國會批準(zhǔn),人類基因組計(jì)劃正式啟動2022-6-1022 第一個自由生物體流感嗜血菌第一個自由生物體流感嗜血菌(H. inf)的全的全基因組測序完成基因組測序完成1996 完成人類基因組計(jì)劃的遺傳作圖完成人類基因組計(jì)劃的遺傳作圖 啟動模式生物基因組計(jì)劃啟動模式生物基因組計(jì)劃H.
13、inf全基因組全基因組Saccharomyces cerevisiae釀酒酵母釀酒酵母Caenorhabditis elegans秀麗線蟲秀麗線蟲2022-6-10231997 大腸桿菌大腸桿菌(E.coli)全基因組測序完成全基因組測序完成1998 完成人類基因組計(jì)劃的物理作圖完成人類基因組計(jì)劃的物理作圖 開始人類基因組的大規(guī)模測序開始人類基因組的大規(guī)模測序 Celera公司加入,與公共領(lǐng)域競爭公司加入,與公共領(lǐng)域競爭 啟動水稻基因組計(jì)劃啟動水稻基因組計(jì)劃1999.7 第第5屆國際公共領(lǐng)域人類基因組測序會議,加快測序速度屆國際公共領(lǐng)域人類基因組測序會議,加快測序速度大腸桿菌及其全基因組大腸桿
14、菌及其全基因組水稻基因組計(jì)劃水稻基因組計(jì)劃2022-6-10242000 Celera公司宣布完成果蠅基因組測序公司宣布完成果蠅基因組測序 國際公共領(lǐng)域宣布完成第一個植物基因組國際公共領(lǐng)域宣布完成第一個植物基因組擬南芥全基擬南芥全基 因組的測序工作因組的測序工作Drosophila melanogaster果蠅果蠅Arabidopsis thaliana擬南芥擬南芥2022-6-10252001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面2000.6.26 公共領(lǐng)域和公共領(lǐng)域和Celera公司同時宣布完成人類基因組工作草圖公司同時宣布完成人類基因組工作
15、草圖2001.2.15 Nature刊文發(fā)表國際公共領(lǐng)域結(jié)果刊文發(fā)表國際公共領(lǐng)域結(jié)果2001.2.16 Science刊文發(fā)表刊文發(fā)表Celera公司及其合作者結(jié)果公司及其合作者結(jié)果2022-6-1026 1999年年12月月1日日,22號染色體測序完成號染色體測序完成 2006年年5月月18日日, 美國和英國科學(xué)家在英國美國和英國科學(xué)家在英國自然自然雜志網(wǎng)絡(luò)版上發(fā)表了人類最后一個雜志網(wǎng)絡(luò)版上發(fā)表了人類最后一個染色體染色體1號染色體的基因測序號染色體的基因測序 全部人類基因組約有全部人類基因組約有2.91Gbp,約有,約有39000多多個基因;個基因; 1號染色體包含基因數(shù)量最多,達(dá)號染色體包
16、含基因數(shù)量最多,達(dá)3141個,是平均水平的兩倍,共有超過個,是平均水平的兩倍,共有超過2.23億個堿基對;億個堿基對; 19號染色體是含基因最豐富的號染色體是含基因最豐富的染色體,而染色體,而13號染色體含基因量最少號染色體含基因量最少2022-6-1027 隨著實(shí)驗(yàn)數(shù)據(jù)和可利用信息急劇增加,信息的管理和隨著實(shí)驗(yàn)數(shù)據(jù)和可利用信息急劇增加,信息的管理和分析成為分析成為HGP的一項(xiàng)重要的工作的一項(xiàng)重要的工作 發(fā)現(xiàn)生物學(xué)發(fā)現(xiàn)生物學(xué)規(guī)律規(guī)律解讀生物解讀生物遺傳密碼遺傳密碼認(rèn)識生命的本質(zhì)認(rèn)識生命的本質(zhì)研究基因組數(shù)據(jù)研究基因組數(shù)據(jù)之間的關(guān)系之間的關(guān)系分析現(xiàn)有的分析現(xiàn)有的基因組數(shù)據(jù)基因組數(shù)據(jù)利用數(shù)學(xué)模型利用
17、數(shù)學(xué)模型和計(jì)算技術(shù)和計(jì)算技術(shù)2022-6-1028 各學(xué)科參與、協(xié)作:生命科學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)、計(jì)算機(jī)各學(xué)科參與、協(xié)作:生命科學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)、計(jì)算機(jī) 科學(xué)、材料科學(xué)以及倫理、法律等社會科學(xué)科學(xué)、材料科學(xué)以及倫理、法律等社會科學(xué) 首要科學(xué)問題首要科學(xué)問題 如何找到記載在基因組如何找到記載在基因組DNA一維結(jié)構(gòu)上控制生命時間、空間一維結(jié)構(gòu)上控制生命時間、空間 的調(diào)控信息的編碼方式和調(diào)節(jié)規(guī)律。的調(diào)控信息的編碼方式和調(diào)節(jié)規(guī)律。 應(yīng)用數(shù)學(xué)、復(fù)雜系統(tǒng)理論、信息論、非線性科學(xué)應(yīng)用數(shù)學(xué)、復(fù)雜系統(tǒng)理論、信息論、非線性科學(xué) 催生催生生物信息學(xué)、計(jì)算生物學(xué)生物信息學(xué)、計(jì)算生物學(xué) 芯片技術(shù)芯片技術(shù) 交叉性
18、技術(shù)領(lǐng)域:物理學(xué)、微電子信息技術(shù)、生化技術(shù)、信交叉性技術(shù)領(lǐng)域:物理學(xué)、微電子信息技術(shù)、生化技術(shù)、信 息技術(shù)、自動化、材料科學(xué)息技術(shù)、自動化、材料科學(xué) 結(jié)構(gòu)生物學(xué)結(jié)構(gòu)生物學(xué) 前沿領(lǐng)域之一:生物物理學(xué)、生物化學(xué)、晶體學(xué)、波譜學(xué)、前沿領(lǐng)域之一:生物物理學(xué)、生物化學(xué)、晶體學(xué)、波譜學(xué)、 光譜學(xué)以及光譜學(xué)以及X射線晶體衍射技術(shù)、核磁共振技術(shù)射線晶體衍射技術(shù)、核磁共振技術(shù)2022-6-1029 生物學(xué)數(shù)據(jù)的收集、存儲、管理與提供生物學(xué)數(shù)據(jù)的收集、存儲、管理與提供 基因組序列信息的提取和分析基因組序列信息的提取和分析 功能基因組相關(guān)信息分析功能基因組相關(guān)信息分析 生物大分子結(jié)構(gòu)模擬和藥物設(shè)計(jì)生物大分子結(jié)構(gòu)模擬
19、和藥物設(shè)計(jì) 生物信息分析的技術(shù)與方法研究生物信息分析的技術(shù)與方法研究 應(yīng)用與發(fā)展研究應(yīng)用與發(fā)展研究生物信息學(xué)的主要研究內(nèi)容生物信息學(xué)的主要研究內(nèi)容2022-6-1030基因組基因組數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)序列序列數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)結(jié)構(gòu)結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)庫 DDBJEMBLGenBankSWISS-PROT PDBPIR2022-6-1031數(shù)據(jù)庫搜索及序列比較數(shù)據(jù)庫搜索及序列比較 搜索同源序列在一定程度上就是通過序列比較尋找相搜索同源序列在一定程度上就是通過序列比較尋找相似序列似序列 序列比較序列比較的一個基本操作就是的一個基本操作就是比對比對(Alignment),即),即將兩個序列的
20、各個字符(代表核苷酸或者氨基酸殘基)將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進(jìn)行對比排列,其結(jié)果是按照對應(yīng)等同或者置換關(guān)系進(jìn)行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種兩個序列共有的排列順序,這是序列相似程度的一種定性描述定性描述 多重序列比對多重序列比對研究的是多個序列的共性。序列的多重研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進(jìn)化關(guān)系。究一組蛋白質(zhì)之間的進(jìn)化關(guān)系。 2022-6-1032基因組序列分析基因組序列分析 遺傳語言分析遺傳語言
21、分析天書天書 基因組結(jié)構(gòu)分析基因組結(jié)構(gòu)分析 基因識別基因識別 基因功能注釋基因功能注釋 基因調(diào)控信息分析基因調(diào)控信息分析 基因組比較基因組比較CTCAGATTGAACGCTGGcGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGCAGCTTGCTGCTTCGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAG
22、TAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCACCCACACTGGAACTGAGACGACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGTGTTGAGGTTAATAACCTCATCGATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCG
23、TTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGT
24、GGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCcGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCAGGCCGGGAACTCA
25、AAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTA2022-6-1034基因表達(dá)數(shù)據(jù)的分析與處理基因表達(dá)數(shù)據(jù)的分析與處理 基因表達(dá)數(shù)據(jù)分析基因表達(dá)數(shù)據(jù)分析是目前生
26、物信息學(xué)研究的熱是目前生物信息學(xué)研究的熱 點(diǎn)和重點(diǎn)點(diǎn)和重點(diǎn) 目前對基因表達(dá)數(shù)據(jù)的處理主要是進(jìn)行目前對基因表達(dá)數(shù)據(jù)的處理主要是進(jìn)行聚類分聚類分 析析,將表達(dá)模式相似的基因聚為一類,在此基將表達(dá)模式相似的基因聚為一類,在此基 礎(chǔ)上尋找相關(guān)基因,分析基因的功能礎(chǔ)上尋找相關(guān)基因,分析基因的功能 所用方法所用方法主要有:相關(guān)分析方法、模式識別技主要有:相關(guān)分析方法、模式識別技術(shù)中的層次式聚類方法、人工智能中的自組織術(shù)中的層次式聚類方法、人工智能中的自組織映射神經(jīng)網(wǎng)絡(luò)、主元分析方法映射神經(jīng)網(wǎng)絡(luò)、主元分析方法 等等 表達(dá)數(shù)據(jù)表達(dá)數(shù)據(jù)缺點(diǎn)缺點(diǎn):僅反映僅反映mRNA豐度,噪聲,豐度,噪聲,2022-6-1035
27、蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測 蛋白質(zhì)的生物蛋白質(zhì)的生物功能功能由蛋白質(zhì)的由蛋白質(zhì)的結(jié)構(gòu)結(jié)構(gòu)所決定,蛋所決定,蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑 蛋白質(zhì)結(jié)構(gòu)預(yù)測分為蛋白質(zhì)結(jié)構(gòu)預(yù)測分為: : 二級結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)預(yù)測 空間結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測 蛋白質(zhì)折疊蛋白質(zhì)折疊2022-6-1036 在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題 在二級結(jié)構(gòu)預(yù)測方面主要方法有:在二級結(jié)構(gòu)預(yù)測方面主要方法有: 立體化學(xué)方法立體化學(xué)方法 圖論方法圖論方法 統(tǒng)計(jì)方法統(tǒng)計(jì)方法 最鄰近決策方法最鄰近決策方法 基于規(guī)則的專家系
28、統(tǒng)方法基于規(guī)則的專家系統(tǒng)方法 分子動力學(xué)方法分子動力學(xué)方法 人工神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)方法 預(yù)測準(zhǔn)確率超過預(yù)測準(zhǔn)確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的PHD系統(tǒng)系統(tǒng)2022-6-1037 在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型法同源模型法 該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu)疊成相似的三維空間結(jié)構(gòu) 運(yùn)用同源模型方法可以完成所有蛋白質(zhì)運(yùn)用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測工作的空間結(jié)構(gòu)預(yù)測工作 發(fā)展趨勢及研究熱點(diǎn)發(fā)展趨勢及研究
29、熱點(diǎn)2022-6-1039系統(tǒng)生物學(xué)系統(tǒng)生物學(xué)(Systems Biology): 由分析為主走向分析與綜合并舉的系統(tǒng)方法由分析為主走向分析與綜合并舉的系統(tǒng)方法 微觀微觀還原論還原論 整體整體系統(tǒng)論系統(tǒng)論統(tǒng)一生物學(xué)統(tǒng)一生物學(xué)(General Biology): 探索生命活動本質(zhì),產(chǎn)生統(tǒng)一的生命觀和統(tǒng)一的生物學(xué)探索生命活動本質(zhì),產(chǎn)生統(tǒng)一的生命觀和統(tǒng)一的生物學(xué)實(shí)驗(yàn)、理論、計(jì)算生物學(xué):實(shí)驗(yàn)、理論、計(jì)算生物學(xué): (Experimental, Theoretical, Computational Biology ) 生命科學(xué)與數(shù)、理、化、計(jì)算機(jī)等學(xué)科的大綜合、大交叉生命科學(xué)與數(shù)、理、化、計(jì)算機(jī)等學(xué)科的大
30、綜合、大交叉生物技術(shù)的產(chǎn)業(yè)化生物技術(shù)的產(chǎn)業(yè)化(Biotechnology): 基礎(chǔ)研究轉(zhuǎn)化為生產(chǎn)力基礎(chǔ)研究轉(zhuǎn)化為生產(chǎn)力 生物工程技術(shù)生物工程技術(shù)農(nóng)、林、醫(yī)藥農(nóng)、林、醫(yī)藥2022-6-1040生物大分子的結(jié)構(gòu)與功能研究生物大分子的結(jié)構(gòu)與功能研究基因組與細(xì)胞的研究基因組與細(xì)胞的研究基因組比較研究基因組比較研究關(guān)于遺傳、發(fā)育、分化、進(jìn)化的綜合理論研究關(guān)于遺傳、發(fā)育、分化、進(jìn)化的綜合理論研究腦科學(xué)和神經(jīng)科學(xué)研究腦科學(xué)和神經(jīng)科學(xué)研究行為科學(xué)研究行為科學(xué)研究生態(tài)學(xué)研究生態(tài)學(xué)研究人體功能研究人體功能研究研究手段:研究手段:實(shí)驗(yàn)、理論、計(jì)算相結(jié)合實(shí)驗(yàn)、理論、計(jì)算相結(jié)合2022-6-1041 當(dāng)今生物信息學(xué)界的
31、大部分人都當(dāng)今生物信息學(xué)界的大部分人都把注意力集中在把注意力集中在基因組、蛋白質(zhì)組、基因組、蛋白質(zhì)組、蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)以及與之相結(jié)合的以及與之相結(jié)合的藥物設(shè)藥物設(shè)計(jì)計(jì)上,隨蛋白組學(xué)、代謝組學(xué)進(jìn)一步上,隨蛋白組學(xué)、代謝組學(xué)進(jìn)一步的發(fā)展,將在的發(fā)展,將在整體整體水平進(jìn)行。水平進(jìn)行。 2022-6-1042基因組基因組 新基因的發(fā)現(xiàn)新基因的發(fā)現(xiàn) 通過計(jì)算分析從通過計(jì)算分析從EST(Expressed Sequence Tags)序列庫中拼接出完整的新基因編碼區(qū),)序列庫中拼接出完整的新基因編碼區(qū),也就是通俗所說的也就是通俗所說的“電子克隆電子克隆”;通過計(jì)算分;通過計(jì)算分析從基因組析從基因組DN
32、A序列中確定新基因編碼區(qū),經(jīng)序列中確定新基因編碼區(qū),經(jīng)過多年的積累,已經(jīng)形成許多分析方法,如根過多年的積累,已經(jīng)形成許多分析方法,如根據(jù)編碼區(qū)具有的獨(dú)特序列特征、根據(jù)編碼區(qū)與據(jù)編碼區(qū)具有的獨(dú)特序列特征、根據(jù)編碼區(qū)與非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布的統(tǒng)計(jì)方法、根據(jù)神經(jīng)網(wǎng)絡(luò)方法、根據(jù)分形方的統(tǒng)計(jì)方法、根據(jù)神經(jīng)網(wǎng)絡(luò)方法、根據(jù)分形方法和根據(jù)密碼學(xué)方法等。法和根據(jù)密碼學(xué)方法等。 2022-6-1043非蛋白編碼區(qū)生物學(xué)意義的分析非蛋白編碼區(qū)生物學(xué)意義的分析 2022-6-1044 非蛋白編碼區(qū)約占人類基因組的非蛋白編碼區(qū)約占人類基因組的95%,其,其生物學(xué)
33、意義目前尚不是很清楚,但從演化觀點(diǎn)生物學(xué)意義目前尚不是很清楚,但從演化觀點(diǎn)來看,其中必然蘊(yùn)含著重要的生物學(xué)功能,由來看,其中必然蘊(yùn)含著重要的生物學(xué)功能,由于它們并不編碼蛋白,一般認(rèn)為,它們的生物于它們并不編碼蛋白,一般認(rèn)為,它們的生物學(xué)功能可能體現(xiàn)在對基因表達(dá)的時空調(diào)控上。學(xué)功能可能體現(xiàn)在對基因表達(dá)的時空調(diào)控上。2022-6-1045研究非蛋白編碼區(qū)生物學(xué)意義的兩種策略:研究非蛋白編碼區(qū)生物學(xué)意義的兩種策略: 一種一種是基于已有的已經(jīng)為實(shí)驗(yàn)證實(shí)的所有功能是基于已有的已經(jīng)為實(shí)驗(yàn)證實(shí)的所有功能已知的已知的DNA元件的序列特征,預(yù)測非蛋白編碼區(qū)元件的序列特征,預(yù)測非蛋白編碼區(qū)中可能含有的功能已知的中
34、可能含有的功能已知的DNA元件,從而預(yù)測其元件,從而預(yù)測其可能的生物學(xué)功能,并通過實(shí)驗(yàn)進(jìn)行驗(yàn)證;可能的生物學(xué)功能,并通過實(shí)驗(yàn)進(jìn)行驗(yàn)證; 另一種另一種則是通過數(shù)理理論直接探索非蛋白編碼則是通過數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預(yù)測其可區(qū)的新的未知的序列特征,并從理論上預(yù)測其可能的信息含義,最后同樣通過實(shí)驗(yàn)驗(yàn)證。能的信息含義,最后同樣通過實(shí)驗(yàn)驗(yàn)證。 2022-6-1046基因組整體功能及其調(diào)節(jié)網(wǎng)絡(luò)的系統(tǒng)把握基因組整體功能及其調(diào)節(jié)網(wǎng)絡(luò)的系統(tǒng)把握 把握生命的本質(zhì),僅僅掌握基因組中部分把握生命的本質(zhì),僅僅掌握基因組中部分基因的表達(dá)調(diào)控是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)樯F(xiàn)象基因的表達(dá)調(diào)控是遠(yuǎn)
35、遠(yuǎn)不夠的,因?yàn)樯F(xiàn)象是基因組中所有功能單元相互作用共同制造出是基因組中所有功能單元相互作用共同制造出來的。來的?;蛐酒蛐酒夹g(shù)由于可以監(jiān)測基因組在各技術(shù)由于可以監(jiān)測基因組在各種時間斷面上的整體轉(zhuǎn)錄表達(dá)狀況,因此成為種時間斷面上的整體轉(zhuǎn)錄表達(dá)狀況,因此成為該領(lǐng)域中一項(xiàng)非常重要和關(guān)鍵的實(shí)驗(yàn)技術(shù),對該領(lǐng)域中一項(xiàng)非常重要和關(guān)鍵的實(shí)驗(yàn)技術(shù),對該技術(shù)所產(chǎn)生的大量實(shí)驗(yàn)數(shù)據(jù)進(jìn)行高效分析,該技術(shù)所產(chǎn)生的大量實(shí)驗(yàn)數(shù)據(jù)進(jìn)行高效分析,從中獲得基因組運(yùn)轉(zhuǎn)以及調(diào)控的整體從中獲得基因組運(yùn)轉(zhuǎn)以及調(diào)控的整體系統(tǒng)的機(jī)系統(tǒng)的機(jī)制制或者是網(wǎng)絡(luò)機(jī)制,便成了生物信息學(xué)在該領(lǐng)或者是網(wǎng)絡(luò)機(jī)制,便成了生物信息學(xué)在該領(lǐng)域中首先要解決的問
36、題。域中首先要解決的問題。 2022-6-1047基因組演化與物種演化基因組演化與物種演化 (生命之樹)2022-6-1048 盡管已經(jīng)在分子演化方面取得了許多重要的成盡管已經(jīng)在分子演化方面取得了許多重要的成就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想闡明物種整體的演化歷史似乎不太可靠。例如,智人闡明物種整體的演化歷史似乎不太可靠。例如,智人與黑猩猩之間有與黑猩猩之間有98%-99%98%-99%的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,然而表型上卻具有如此巨大的差異,這就不能不使我然而表型上卻具有如此巨大的差異,這就不能不使我們聯(lián)
37、想到形形色色千差萬別的建筑樓群,它們的外觀們聯(lián)想到形形色色千差萬別的建筑樓群,它們的外觀如此不同,但基礎(chǔ)的部件組成卻是幾乎一樣的,差別如此不同,但基礎(chǔ)的部件組成卻是幾乎一樣的,差別就在于這些基礎(chǔ)部件的組織方式不同,這就提示我們就在于這些基礎(chǔ)部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個別基因在研究物種基因組整體組織方式而不僅僅是個別基因在研究物種演化歷史中的重要作用。由于基因組是物種所有遺傳演化歷史中的重要作用。由于基因組是物種所有遺傳信息的儲藏庫,從根本上決定著物種個體的發(fā)育和生信息的儲藏庫,從根本上決定著物種個體的發(fā)育和生理,因此,理,因此,從基因組整體結(jié)構(gòu)組織和整體功能調(diào)
38、節(jié)網(wǎng)從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進(jìn)行基因組整體絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進(jìn)行基因組整體的演化研究,將是揭示物種真實(shí)演化歷史的最佳途徑。的演化研究,將是揭示物種真實(shí)演化歷史的最佳途徑。 2022-6-1049 基因組對生命體的整體控制必須通過它所表達(dá)的全部基因組對生命體的整體控制必須通過它所表達(dá)的全部蛋白質(zhì)來執(zhí)行,由于基因芯片技術(shù)只能蛋白質(zhì)來執(zhí)行,由于基因芯片技術(shù)只能反映從基因組到反映從基因組到RNA的轉(zhuǎn)錄水平上的表達(dá)的轉(zhuǎn)錄水平上的表達(dá)情況,由于從情況,由于從RNA到蛋白質(zhì)還到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,因此僅憑基因芯片技術(shù)我們還有許多中間環(huán)節(jié)的影
39、響,因此僅憑基因芯片技術(shù)我們還不能最終掌握生物功能具體執(zhí)行者不能最終掌握生物功能具體執(zhí)行者蛋白質(zhì)的整體表蛋白質(zhì)的整體表達(dá)狀況;達(dá)狀況; 近幾年在發(fā)展基因芯片的同時,人們也發(fā)展了一套研近幾年在發(fā)展基因芯片的同時,人們也發(fā)展了一套研究究基因組所有蛋白質(zhì)產(chǎn)物表達(dá)情況基因組所有蛋白質(zhì)產(chǎn)物表達(dá)情況蛋白質(zhì)組蛋白質(zhì)組研究技研究技術(shù),從技術(shù)上來講包括術(shù),從技術(shù)上來講包括二維凝膠電泳技術(shù)二維凝膠電泳技術(shù)和和質(zhì)譜質(zhì)譜測序技測序技術(shù)。通過二維凝膠電泳技術(shù)可以獲得某一時間截面上蛋術(shù)。通過二維凝膠電泳技術(shù)可以獲得某一時間截面上蛋白質(zhì)組的表達(dá)情況,通過質(zhì)譜測序技術(shù)就可以得到所有白質(zhì)組的表達(dá)情況,通過質(zhì)譜測序技術(shù)就可以得到
40、所有這些蛋白質(zhì)的序列組成。這些都是技術(shù)實(shí)現(xiàn)問題,最重這些蛋白質(zhì)的序列組成。這些都是技術(shù)實(shí)現(xiàn)問題,最重要的就是如何運(yùn)用要的就是如何運(yùn)用生物信息學(xué)理論方法生物信息學(xué)理論方法去分析所得到的去分析所得到的巨量數(shù)據(jù),從中還原出巨量數(shù)據(jù),從中還原出生命運(yùn)轉(zhuǎn)和調(diào)控的整體系統(tǒng)生命運(yùn)轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分的分子機(jī)制。子機(jī)制。 蛋白質(zhì)組蛋白質(zhì)組 2022-6-1050 基因組和蛋白質(zhì)組研究的迅猛發(fā)基因組和蛋白質(zhì)組研究的迅猛發(fā)展,使許多新蛋白序列涌現(xiàn)出來,展,使許多新蛋白序列涌現(xiàn)出來,然而要想了解它們的功能,只有氨然而要想了解它們的功能,只有氨基酸序列是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)榈鞍谆嵝蛄惺沁h(yuǎn)遠(yuǎn)不夠的,因?yàn)榈鞍踪|(zhì)的功能是通
41、過其三維高級結(jié)構(gòu)來質(zhì)的功能是通過其三維高級結(jié)構(gòu)來執(zhí)行的,而且執(zhí)行的,而且蛋白質(zhì)三維結(jié)構(gòu)也不蛋白質(zhì)三維結(jié)構(gòu)也不一定是靜態(tài)的,在行使功能的過程一定是靜態(tài)的,在行使功能的過程中其結(jié)構(gòu)也會相應(yīng)的有所改變中其結(jié)構(gòu)也會相應(yīng)的有所改變。因因此,得到這些新蛋白的完整、精確此,得到這些新蛋白的完整、精確和動態(tài)的和動態(tài)的三維結(jié)構(gòu)三維結(jié)構(gòu)就成為擺在我們就成為擺在我們面前的緊迫任務(wù)。目前除了通過諸面前的緊迫任務(wù)。目前除了通過諸如如X射線晶體結(jié)構(gòu)分析、多維核磁共射線晶體結(jié)構(gòu)分析、多維核磁共振(振(NMR)波譜分析和電子顯微鏡)波譜分析和電子顯微鏡二維晶體三維重構(gòu)(電子晶體學(xué),二維晶體三維重構(gòu)(電子晶體學(xué),EC)等物理方
42、法得到)等物理方法得到蛋白質(zhì)三維結(jié)蛋白質(zhì)三維結(jié)構(gòu)構(gòu)蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu) 2022-6-1051 另外一種廣另外一種廣泛使用的方法就是泛使用的方法就是通過通過計(jì)算機(jī)輔助預(yù)計(jì)算機(jī)輔助預(yù)測測的方法,目前,的方法,目前,一般認(rèn)為蛋白質(zhì)的一般認(rèn)為蛋白質(zhì)的折疊類型只有數(shù)百折疊類型只有數(shù)百到數(shù)千種,遠(yuǎn)遠(yuǎn)小到數(shù)千種,遠(yuǎn)遠(yuǎn)小于蛋白質(zhì)所具有的于蛋白質(zhì)所具有的自由度數(shù)目,而且自由度數(shù)目,而且蛋白質(zhì)的折疊類型蛋白質(zhì)的折疊類型與其氨基酸序列具與其氨基酸序列具有相關(guān)性,這樣就有相關(guān)性,這樣就有可能直接從蛋白有可能直接從蛋白質(zhì)的氨基酸序列通質(zhì)的氨基酸序列通過計(jì)算機(jī)輔助方法過計(jì)算機(jī)輔助方法預(yù)測出蛋白質(zhì)的三預(yù)測出蛋白質(zhì)的三維結(jié)構(gòu)維結(jié)構(gòu) 2022-6-1052新藥設(shè)計(jì)新藥設(shè)計(jì) 2022-6-1053 隨著結(jié)構(gòu)生物學(xué)的發(fā)展,相當(dāng)數(shù)量的蛋白隨著結(jié)構(gòu)生物學(xué)的發(fā)展,相當(dāng)數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得精確測定,質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得精確測定,基于生物大分子結(jié)構(gòu)知識的藥物設(shè)計(jì)成為當(dāng)前的基于生物大分子結(jié)構(gòu)知識的藥物設(shè)計(jì)成為當(dāng)前的熱點(diǎn)。生物信息學(xué)的研究不僅可提供熱點(diǎn)。生物信息學(xué)的研究不僅可提供生物大分子生物大分子空間結(jié)構(gòu)的信息空間結(jié)構(gòu)的信息,還能提供還能提供電子結(jié)構(gòu)電子結(jié)構(gòu)的信息,如的信息,如能級、表面電荷分布、分子軌道相互作用等以及能級、表面電荷分布、分子軌道相互作用等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 塔城市第四中學(xué)2024屆九年級上學(xué)期期中考試數(shù)學(xué)試卷(含答案)
- 5年中考3年模擬試卷初中道德與法治九年級下冊02第2課時謀求互利共贏
- 人教版二年級上冊美術(shù)教案
- 人教版五年級下冊音樂備課
- 巨人的花園課件
- DB11-T 2020-2022 高質(zhì)量團(tuán)體標(biāo)準(zhǔn)評價規(guī)范
- DB11-T 1873-2021 裝配式低層住宅輕鋼框架-組合墻結(jié)構(gòu)技術(shù)標(biāo)準(zhǔn)
- 企業(yè)接待室裝修合同
- 醫(yī)療器械海運(yùn)租船協(xié)議
- 農(nóng)貿(mào)市場改造廢料清運(yùn)合同
- 古琴介紹PPT精選
- 《中醫(yī)臨床路徑》word版參考模板
- 周易與中醫(yī)學(xué)
- 無人機(jī)培訓(xùn)心得體會1
- Q∕GDW 11257.3-2020 熔斷器技術(shù)規(guī)范 第3部分:跌落式熔斷器
- 漢語拼音字母描紅示范(打印版)
- 新視野大學(xué)英語視聽說教程ppt課件
- 攻城掠地?cái)?shù)據(jù)以及sdata文件修改教程
- 醫(yī)療廢物轉(zhuǎn)運(yùn)箱消毒記錄表
- 最新投標(biāo)書密封條
- 看守所崗位職責(zé)
評論
0/150
提交評論