4.生物信息學(xué)的基本概念與應(yīng)用60_第1頁
4.生物信息學(xué)的基本概念與應(yīng)用60_第2頁
4.生物信息學(xué)的基本概念與應(yīng)用60_第3頁
4.生物信息學(xué)的基本概念與應(yīng)用60_第4頁
4.生物信息學(xué)的基本概念與應(yīng)用60_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、生物信息學(xué)在基礎(chǔ)科學(xué)、藥物開發(fā)及臨床中的應(yīng)用醫(yī)藥生物信息學(xué)中心(Medicinal Bioinformatics Center)生物信息學(xué)-Bioinfomatics生物信息學(xué)是現(xiàn)代生物醫(yī)藥技術(shù)發(fā)展的必然需求生物信息學(xué)研究方法數(shù)據(jù)庫網(wǎng)絡(luò)服務(wù)器搜索引擎生物信息學(xué)研究方法來自于數(shù)理信息學(xué)技術(shù)的拓展醫(yī)藥生物信息學(xué)中心上海交通大學(xué)醫(yī)學(xué)院高校/科研單位/醫(yī)院/高科技公司基因/蛋白/相互作用網(wǎng)絡(luò)/小分子轉(zhuǎn)化醫(yī)學(xué)培訓(xùn)服務(wù)生物信息學(xué)重要數(shù)據(jù)庫 NCBI UniProt/SwissProt PDB/SCOP HPRD/DIP KEGG PubChem BindingDB DrugBank/TTD Thomson

2、Reuters Web of Science生物信息學(xué)重要數(shù)據(jù)庫-NCBI生物信息學(xué)重要數(shù)據(jù)庫-NCBI生物信息學(xué)重要數(shù)據(jù)庫-NCBI生物信息學(xué)重要數(shù)據(jù)庫-NCBI生物信息學(xué)重要數(shù)據(jù)庫-UniProt/SwissProt生物信息學(xué)重要數(shù)據(jù)庫-SwissProt生物信息學(xué)重要數(shù)據(jù)庫-PDB生物信息學(xué)重要數(shù)據(jù)庫-PDB生物信息學(xué)重要數(shù)據(jù)庫-HPRD生物信息學(xué)重要數(shù)據(jù)庫-KEGG生物信息學(xué)重要數(shù)據(jù)庫-KEGG生物信息學(xué)重要數(shù)據(jù)庫-PubChem生物信息學(xué)重要數(shù)據(jù)庫-PubChem生物信息學(xué)重要數(shù)據(jù)庫-BindingDB生物信息學(xué)重要數(shù)據(jù)庫-DrugBank生物信息學(xué)重要數(shù)據(jù)庫-Thomson Reu

3、ters生物信息學(xué)重要數(shù)據(jù)庫-Web of Science生物信息學(xué)基礎(chǔ)算法-BLASTTM4TM2TM3TM1TM5TM6TM7TM8生物信息學(xué)基礎(chǔ)算法-BLASTBLASTBy JosephBedell, IanKorf, MarkYandell Publisher: OReillyPub Date: July 2003ISBN: 0-596-00299-8Pages: 360Slots: 1.0為什么要用BLASTBLAST:Basic Local Alignment Search Tools序列局部相似比較,認為有生物意義保守序列,而不一定要全局相似。可以由局部相似得出兩序列可能有相同

4、功能或功能相關(guān)??梢赃M行序列位置定位要比較的是相似性,不是同源性。根據(jù)相似性結(jié)合其他證據(jù)做出判斷。兩條序列匹配比較I種子IACGGTTCACGTTCCAACGGTCACACGGTTCACGTTTCCAACGGTCAC得分:1*5=5ACGGTTCACGTTTCCA ACGGTCAC得分1*33分Word size=3 如果word size=4,5 則第二個結(jié)果就沒有了。(假設(shè)相同就得1分,不同得-3分,出現(xiàn)gap-2分,延伸gap-1分)Word size 就是起始種子兩條序列匹配比較I種子IIACGGTTCACGTTCCAACG 1,8CGG 2GGT 3GTT 4,10TTC 5,11T

5、CA 6CAC 7ACGGTCACACG 1 2*1=2CGG 2 1*1=1GGT 3 1*1=1GTC 4 TCA 5 1*1=1CAC 6 1*1=1 共 6對種子Scoring MatrixBLOSUM:基于有效氨基酸片段之間的相互替代頻率,矩陣構(gòu)建蛋白數(shù)量是PAM的20倍以上, BLOSUM-N中。對于序列相似性越大的比對用較大的N,而序列相似性較小的比對用較小的N。PAM (Point Accepted Matrix):基于進化的點突變模型,如果兩種氨基酸替換頻繁,說明自然界就接受這種替換,得分就高,1個PAM單位代表一個進化變異單位,即1%氨基酸改變(缺點:家族內(nèi)成員整體構(gòu)建,累

6、積誤差)。PAM-N中,對于序列相似性越大的比對用較小的N,而序列相似性較小的比對用較大的N。The neighborhood near RGDBLOSUM62PAM200WordScoreWordScoreRGD17RGD18KGD14RGE17QGD13RGN16RGE13KGD15EGD12RGQ15HGD12KGE14NGD12HGD13RGN12KGN13AGD11RAD13MGD11RGA13RAD11RGG13RGQ11RGH13RGS11RGK13RND11RGS13RSD11RGT13SGD11RSD13TGD11WGD13E兩條序列匹配比較II延伸ACGGTTCACGTTC

7、CAACGGTCACACGGTTCACGTTTCCAACGGTCAC得分:1*5=5ACGGTTCACGTTTCCA ACGGTCAC得分1*33分兩條序列匹配比較III終止y=4 (1,-3,-2,-1)延伸到第7個堿基的時候達到/超過了y的值,這時候延伸停止,返回去找得分最高的比對,結(jié)果就是ACGGT的比對,得分為5兩條序列匹配比較III終止X=4 (1,-3,-2,-1)延伸到第7個堿基的時候達到/超過了X的值,這時候延伸停止,返回去找得分最高的比對,結(jié)果就是ACGGT的比對,得分為5Dynamic Programing動態(tài)規(guī)劃Dynamic Programming允許最適比較,允許插入

8、刪除,全局,局部Dynamic Programming allow Optimal Alignment between two sequencesAllow Insertion and Deletion or Alignment with gapsNeedlman and Wunsh Algorithm (1970) for global alignmentSmith & Waterman Algorithm (1981) for local alignmentImportant StepsCreate DOTPLOT between two sequences散點圖Compute SUM m

9、atrix矩陣求和Trace Optimal Path追蹤最適途徑Steps for Dynamic Programming。Row gapColumn gapSteps for Dynamic ProgrammingSteps for Dynamic ProgrammingSteps for Dynamic ProgrammingBLAST中序列對庫做比較一條查詢序列跟庫中每條序列做兩條序列的比較,把結(jié)果排序,得到了這條查詢序列跟庫中序列局部匹配比較好的結(jié)果多條查詢序列會被分解成單條序列與庫中序列比較,得到一條一條查詢序列結(jié)果的簡單累積BLAST類型核酸核酸 blastn蛋白質(zhì)蛋白質(zhì) bla

10、stp核酸T蛋白質(zhì) blastx蛋白質(zhì)核酸T tblastn核酸T核酸 T tblastxTraditional BLAST programs ProgramDatabaseQueryTypical usesBLASTNNucleotideNucleotideMapping oligonucleotides, cDNAs, and PCR products to a genome; screening repetitive elements; cross-species sequence exploration; annotating genomic DNA; clustering seque

11、ncing reads; vector clipping BLASTPProteinProteinIdentifying common regions between proteins; collecting related proteins for phylogenetic analyses BLASTXProteinNucleotide translated into proteinFinding protein-coding genes in genomic DNA; determining if a cDNA corresponds to a known protein TBLASTN

12、Nucleotide translated into proteinProteinIdentifying transcripts, potentially from multiple organisms, similar to a given protein; mapping a protein to genomic DNA TBLASTXNucleotide translated into proteinNucleotide translated into proteinCross-species gene prediction at the genome or transcript lev

13、el; searching for genes missed by traditional methods or not yet in protein databases 生物信息學(xué)基礎(chǔ)算法-BLAST BLAST主頁 教程 BLAST中的相似性分數(shù)的統(tǒng)計學(xué)意義醫(yī)藥生物信息學(xué)中心上海創(chuàng)新知識中心平臺海量數(shù)據(jù)生物信息學(xué)分析文本挖掘與智能語言分析活性藥物及靶標數(shù)據(jù)分析臨床樣本及生物信息數(shù)據(jù)分析活性化合物篩選及優(yōu)化4組曙光48核胖節(jié)點服務(wù)器2組惠普128核8路高性能服務(wù)器4組艮泰128核12路高性能服務(wù)器4臺GPU 484核工作站12臺惠普12核圖形工作站108臺聯(lián)想生物信息學(xué)4核工作站48臺聯(lián)想計

14、算化學(xué)4核工作站2臺GPU 248核工作站生物醫(yī)藥個性化數(shù)據(jù)庫建設(shè)服務(wù)數(shù)據(jù)庫咨詢及設(shè)計服務(wù)網(wǎng)絡(luò)數(shù)據(jù)庫發(fā)展及數(shù)據(jù)庫整合服務(wù)數(shù)據(jù)庫軟件設(shè)計及服務(wù)基于數(shù)據(jù)庫的數(shù)據(jù)分析及應(yīng)用醫(yī)藥生物信息學(xué)中心頭皮屑易感基因生物信息學(xué)分析及定位2012.10-2013.4醫(yī)藥生物信息學(xué)中心醫(yī)藥信息瀏覽習(xí)慣文本挖掘算法醫(yī)藥信息分類模型骨科婦產(chǎn)科消化科外科內(nèi)科兒科??漆t(yī)生醫(yī)藥信息自動推送引擎2012.3-2012.9醫(yī)藥生物信息學(xué)中心表觀遺傳靶標表觀遺傳候選藥物HEMD數(shù)據(jù)庫活性適應(yīng)癥功能結(jié)構(gòu)分析篩選杭州景杰生物科技有限公司-表觀遺傳藥物開發(fā)及靶標數(shù)據(jù)庫2011.3-2012.12醫(yī)藥生物信息學(xué)中心藥物開發(fā)智能管理系統(tǒng)20

15、10.6-今醫(yī)藥生物信息學(xué)中心醫(yī)院口腔腫瘤樣本庫臨床手術(shù)樣本生物分析數(shù)據(jù)臨床樣本庫易感基因表達譜芯片分析分子診斷2012.12-今醫(yī)藥生物信息學(xué)中心公共服務(wù)面向公共開放的生物醫(yī)藥服務(wù)數(shù)據(jù)庫及分析系統(tǒng)海量數(shù)據(jù)從整合到挖掘與應(yīng)用數(shù)據(jù)整合數(shù)據(jù)挖掘創(chuàng)新應(yīng)用簡明的規(guī)律永遠隱藏在繁雜的數(shù)據(jù)背后ASD的數(shù)據(jù)整合、數(shù)據(jù)挖掘與應(yīng)用ASD的數(shù)據(jù)整合、數(shù)據(jù)挖掘與應(yīng)用ASD V0.1 2009.8 Allosteric Proteins V0.4 2010.3 Allosteric Diseases V1.0 2010.7 Allosteric Interactions V1.5 2011.6 Update Entr

16、ies V2.0 2012.8 DNA&RNAASD的數(shù)據(jù)整合SOP是數(shù)據(jù)收集整理具備可持續(xù)性的唯一保證ASD的數(shù)據(jù)挖掘 (一)-新位點識別Protein Property Analysis基于知識的別構(gòu)口袋識別新方法Site Property AnalysisSite Location AnalysisSite DetectionASD的數(shù)據(jù)挖掘 (二)-新作用機制識別基于知識的別構(gòu)機制識別方法ASD的數(shù)據(jù)挖掘 (三)-新化合物篩選知識為基礎(chǔ)的別構(gòu)小分子篩選規(guī)則數(shù)據(jù)規(guī)律產(chǎn)生新的應(yīng)用(一)Residue NumMutationPositionActivator EfficiencyNone(wide type)43.7%Cys52PheBinding site0%Cys52SerBinding site6%Cys52LeuBinding site19.8%Cys52AlaBinding site39.2%His54TrpBinding site34.3%Arg55AlaBinding site24.8%Arg55TrpBinding site22.6%His70ArgBindin

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論