生物信息學在分子診斷中的應用課件_第1頁
生物信息學在分子診斷中的應用課件_第2頁
生物信息學在分子診斷中的應用課件_第3頁
生物信息學在分子診斷中的應用課件_第4頁
生物信息學在分子診斷中的應用課件_第5頁
已閱讀5頁,還剩69頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學在分子診斷中的應用第一節(jié) 生物信息學概論 生物信息學的定義 生物信息學研究的范疇第一節(jié) 生物信息學概論一、生物信息學的定義生物信息學是結合了生物學和信息技術,利用計算機和互聯(lián)網(wǎng)技術,分析海量的并且還在快速積累的生物數(shù)據(jù),從中獲取生物科學新知識的一門新的交叉科學。人類基因組計劃的意義人類基因研究的意義在于它可以支持和推動生命科學中一系列重要的基礎性研究。如基因組遺傳語言的破譯,基因的結構與功能關系,生命的起源和進化,細胞發(fā)育、生產(chǎn)、分化的分子機理,疾病發(fā)生的機理等。為推動醫(yī)學長足進步帶來前所未有的機遇,基因診斷、基因療法和基因藥物的開發(fā),有可能成為未來醫(yī)學發(fā)展的重要分支。人類基因組計劃

2、的進一步成功將促進生命科學與信息科學、材料科學的融合,從而帶動一批高技術產(chǎn)業(yè)的發(fā)展第一節(jié) 生物信息學概論第一節(jié) 生物信息學概論二、生物信息學研究的范疇第一、各種生物數(shù)據(jù)庫的建立和管理; 第二、研究高效率的統(tǒng)計工具,分析算法, 發(fā)展方便、快捷的分析程序; 第三、從海量的原始生物數(shù)據(jù)中發(fā)掘新知識。第二節(jié) 計算機和互聯(lián)網(wǎng)計算機常識和互聯(lián)網(wǎng)常用搜索引擎文件的壓縮和解壓文件和數(shù)據(jù)的傳送編程和語言第二節(jié) 計算機和互聯(lián)網(wǎng)一、計算機常識:硬件和軟件計算機的主要硬件由中央處理器(CPU)、存儲器、輸入設備和輸出設備組成。 常用的操作系統(tǒng):windows 、UNIX 、Linux 第二節(jié) 計算機和互聯(lián)網(wǎng)二、互聯(lián)網(wǎng)

3、和常用搜索引擎WWW是World Wide Web的縮寫,即通常我們所說的國際互聯(lián)網(wǎng),它的每個節(jié)點在邏輯上都與任何其他節(jié)點保持聯(lián)系,可以相互交換信息。第二節(jié) 計算機和互聯(lián)網(wǎng)二、互聯(lián)網(wǎng)和常用搜索引擎名稱地址特色GoogleGoogle宜于查詢名詞術語和專業(yè)網(wǎng)站Openfindopenfind宜于查詢名詞術語和專業(yè)網(wǎng)站Yahooyahoo可按分類搜索Sohu可按分類搜索Sinasina可按分類搜索可按分類搜索第二節(jié) 計算機和互聯(lián)網(wǎng)三、文件的壓縮和解壓傳輸或保存較大的數(shù)據(jù)時,常對文件進行壓縮,以減少數(shù)據(jù)量。特別是對于圖形文件,壓縮尤其重要。在UNIX或Linux系統(tǒng)中,壓縮命令是compress m

4、yfile,壓縮后的文件自動加上后綴.Z。解壓縮命令是uncompress myfile.Z。 PC機上的Windows操作系統(tǒng)沒有標準的壓縮和解壓軟件,但網(wǎng)上有許多針對Windows的免費或代免費試用期的壓縮軟件,如FreeZip、WinZip等 第二節(jié) 計算機和互聯(lián)網(wǎng)四、文件和數(shù)據(jù)的傳送用戶需要遞交一條或多條核酸或蛋白質(zhì)序列去做數(shù)據(jù)庫查詢或比對。這時常用的方法有:使用視窗系統(tǒng)的剪切、復制和粘貼的功能.對于不太長的序列,這 種方法比較方便;網(wǎng)頁的輸入窗口旁常有一個“瀏覽目錄”按鈕,點擊該按鈕,會彈 出一個對話框,找到需要上傳的序列文件,再按“提交”鈕完成遞 交。用這種方法可以一次遞交較長的序

5、列;有些大型信息中心和研究單位還有遠程文件傳送服務,即遵從文件 傳輸協(xié)議 (file transfer protocol,ftp)的服務器地址,用戶可以無記 名的方式訪問公用的目錄,讀取文件,下載軟件或數(shù)據(jù)。第二節(jié) 計算機和互聯(lián)網(wǎng)五、編程和語言 在眾多的計算機語言中,C語言無疑是最常用的,它具有 代碼精煉,執(zhí)行效率高的特點,網(wǎng)上還有大量的現(xiàn)成模塊 供免費使用。 對于非計算機專業(yè)人員,還可以選擇Visual BASIC(VB) 語言。VB語言具備了高級語言的特點,語句結構類似自然 語言,對于生物背景的專業(yè)人員可能較容易掌握。 如果在研究中大量使用網(wǎng)絡資源,則需要掌握一定的網(wǎng)絡 編程語言,例如:P

6、erl語言、PHP語言和JAVA語言等 第三節(jié) 數(shù)據(jù)的獲得 DNA、RNA、蛋白質(zhì)的測序 蛋白質(zhì)結構的分析 基因和蛋白質(zhì)的表達數(shù)據(jù) 蛋白質(zhì)相互作用第三節(jié) 數(shù)據(jù)的獲得一、DNA、RNA和蛋白質(zhì)的測序基因組DNA直接來源于細胞核基因組,它的組成包括 基因和基因間區(qū)域,基因序列中還包括內(nèi)含子和外顯子。cDNA是由mRNA逆轉(zhuǎn)錄而來,全長cDNA應該包括5端 非編碼區(qū),3 端的多聚腺苷酸序列和編碼序列。重組DNA序列是基因重組到質(zhì)粒、病毒和cosmid等載體 后經(jīng)測序得到的DNA序列。2009-4-282009-4-28第三節(jié) 數(shù)據(jù)的獲得一、DNA、RNA和蛋白質(zhì)的測序2009-4-28第三節(jié) 數(shù)據(jù)的

7、獲得一、DNA、RNA和蛋白質(zhì)的測序2009-4-28第三節(jié) 數(shù)據(jù)的獲得一、DNA、RNA和蛋白質(zhì)的測序 RNA的序列可以從基因組序列或cDNA序列推導出來;直接 的RNA測序涉及修飾核苷酸的識別,可通過質(zhì)譜分析獲得。 蛋白質(zhì)的序列可以通過DNA序列推導而來,但從DNA序列 推導的蛋白質(zhì)序列不能反應真實的蛋白質(zhì)序列情況,蛋白質(zhì) 測序主要依靠質(zhì)譜分析(mass spectrometry, MS)技術,基本原 理是通過準確測定真空中的離子質(zhì)量或電荷量來測算出分 子組成。2009-4-28第三節(jié) 數(shù)據(jù)的獲得二、蛋白結構的分析X射線晶體學技術:通過研究X射線對蛋白質(zhì)晶體的掃描后產(chǎn)生的衍射模式來測定蛋白

8、質(zhì)的結構; 核磁共振譜法(NMR) spectroscopy):該方法常用于較小(25kDa)的,可溶性蛋白質(zhì)結構的測定; 有些蛋白質(zhì)很難結晶,不能用X射線晶體學技術測定,又太大而不能用核磁共振譜技術測定,其它技術方法:X射線纖維衍射技術;電子顯微鏡(electron microscopy);環(huán)形雙色色譜技術(circular dichroism (CD) spectroscopy)2009-4-28第三節(jié) 數(shù)據(jù)的獲得三、基因和蛋白質(zhì)表達數(shù)據(jù) 表達文庫的測序 基因表達連續(xù)分析技術(serial analysis of gene expression, SAGE) DNA芯片 雙向電泳分析技術(

9、2D gel electrophoresis) 2009-4-28基因表達連續(xù)分析技術原理第三節(jié) 數(shù)據(jù)的獲得三、基因和蛋白質(zhì)表達數(shù)據(jù)雙向電泳分析技術原理: 1個方向是SDS-聚丙烯酰胺凝膠 主要是把蛋白質(zhì)按照 分子量分開 ; 1個方向是等點聚焦 把蛋白質(zhì)按照等電點的不同分開 ,這樣就可以把不同的蛋白質(zhì)盡可能的分開 。2009-4-28第三節(jié) 數(shù)據(jù)的獲得四、蛋白質(zhì)相互作用1、遺傳學方法: 2、親和性方法: 親和色譜法(Affinity chromatography) 免疫共沉淀法(coimmunoprecipitation) 免疫共沉淀基本原理: 細胞裂解液中加入抗體,與抗原形成特異免疫復合物,

10、 經(jīng)過洗脫,收集免疫復合物,然后進行SDS及 Western blotting分析。2009-4-283、分子和原子法:X射線晶體法和核磁共振法 4、基于文庫法: 酵母雙雜交系統(tǒng)(yeast two-hybrid (Y2H)system) 第三節(jié) 數(shù)據(jù)的獲得四、蛋白質(zhì)相互作用酵母雙雜交系統(tǒng)的建立得力于對真核細胞調(diào)控轉(zhuǎn)錄起始過程的認識。研究發(fā)現(xiàn),許多真核生物的轉(zhuǎn)錄激活因子都是由兩個可以分開的、功能上相互獨立的結構域(domain)組成的。例如,酵母的轉(zhuǎn)錄激活因子GAL4,在N端有一個由147個氨基酸組成的DNA結合域(DNA binding domain,BD),C端有一個由113個氨基酸組成的

11、轉(zhuǎn)錄激活域(transcription activation domain,AD)。當GAL4分子的DNA結合域和上游激活序列(upstream activating sequence,UAS)結合,轉(zhuǎn)錄激活域則能激活UAS下游的基因進行轉(zhuǎn)錄。但是,單獨的DNA結合域不能激活基因轉(zhuǎn)錄,單獨的轉(zhuǎn)錄激活域也不能激活UAS的下游基因,它們之間只有通過某種方式結合在一起才具有完整的轉(zhuǎn)錄激活因子的功能。 2009-4-28XYX轉(zhuǎn)化到Y文庫中 重要生物信息中心 數(shù)據(jù)庫檢索工具第四節(jié) 生物信息數(shù)據(jù)庫2009-4-28第四節(jié) 生物信息數(shù)據(jù)庫一、重要生物信息中心 美國國家信息中心 (National Cent

12、er of Biotechnology Information, NCBI)的GenBank (http:/ / /web/GenBank/index.html); 歐洲分子生物學室驗室(European Molecular Biology Laboratory-European Bioinformatics Institute, EMBL-EBI) 的EMBL ( ebi.ac.uk/databases/index.html); 日本 DNA數(shù)據(jù)庫 (DNA Data Bank of Japan, DDBJ) (http:/ / ddbj.nig.ac.jp/ ) 2009-4-28第四節(jié)

13、生物信息數(shù)據(jù)庫一、重要生物信息中心 最重要的蛋白質(zhì)氨基酸序列數(shù)據(jù)庫是瑞士的SWISS- PROT (/sprot/); 蛋白質(zhì)數(shù)據(jù)庫PIR(Protein Information Resource),包含 所有序列已知的自然界中野生型蛋 白質(zhì)的信息 (); PDB蛋白質(zhì)結構數(shù)據(jù)庫:收集由X射線衍射和核磁共振 技術測定的蛋白質(zhì)大分子三維結構(/pdb)。第四節(jié) 生物信息數(shù)據(jù)庫二、數(shù)據(jù)庫檢索工具 Entrez檢索工具:Entrez是美國國家生物技術信息中心(NCBI)提供的集成檢索工具 /Entrez/ SRS(Sequence Retrieval System)檢索工具:是歐洲 分子生物學網(wǎng)EM

14、Bnet的主要數(shù)據(jù)庫檢索工具,可以從 EMBnet的主頁進入。 DBGET/LinkDB檢索工具:是日本京都工具大學建立的 GenomeNet數(shù)據(jù)庫,該數(shù)據(jù)庫主要針對代謝途徑。 genome.ad.jp/dbget/dbget_manual.html。第四節(jié) 生物信息數(shù)據(jù)庫二、數(shù)據(jù)庫檢索工具圖16-1: NCBI網(wǎng)頁的Entrez界面第五節(jié) 核酸序列分析 核酸序列的基本分析 核酸序列的比對分析和功能預測 開放閱讀框的分析 引物設計 向數(shù)據(jù)庫提交序列第五節(jié) 核酸序列分析一、核酸序列的基本分析 核酸序列的分子量、堿基組成、堿基分布等基本分析: BioEdit (/BioEdit/bioedit.h

15、tml) DNAMAN (lynnon/) 限制性酶切分析 :限制性酶數(shù)據(jù)庫(Restriction Enzyme DataBase,REBASE) (rebase.neb ; neb/rebase) 測序峰圖的查看、核實與修改 :Chromas,BioEdit,DNAMAN 測序結果需要識別與去除測序時使用的載體序列 : VecScreen ( /VecScreen.html) 第五節(jié) 核酸序列分析一、核酸序列的基本分析EST序列進行電子延伸 : 將待分析的核酸序列(稱為種子序列)采用Blast軟件 搜索GenBank的EST數(shù)據(jù)庫,獲得與種子序列有較高 同源性的EST序列,一般要求在重疊4

16、0個堿基范圍內(nèi) 有95以上的同源性,稱匹配序列; 將匹配序列與種子序列裝配成新序列,即片段重疊 群分析(contig analysis); 再以新產(chǎn)生的序列為種子序列,重復上述過程,直 至沒有新的匹配序列為止。 EST序列進行電子延伸種子序列第五節(jié) 核酸序列分析一、核酸序列的基本分析對核酸序列進行電子基因定位 :利用序列標簽位點(Sequence Tagged Site, STS); 利用UniGene數(shù)據(jù)庫進行基因電子定位; 直接利用基因組序列進行基因電子定位。 NCBI網(wǎng)頁的Map Viewer界面程序名稱查詢序列搜索的數(shù)據(jù)庫BLASTN核酸核酸BLASTP蛋白質(zhì)蛋白質(zhì)BLASTX核酸的六

17、讀框蛋白質(zhì)TBLASTN蛋白質(zhì)核酸的6個讀框TBLASTX核酸的6個讀框核酸的6個讀框第五節(jié) 核酸序列分析二、核酸序列的比對分析和功能預測BLAST (Basic Local Alignment Search Tool)是基本局域聯(lián)配搜索工具;Blast 功能有:NCBI網(wǎng)頁的BLAST界面NCBI網(wǎng)頁的BLAST2 SEQUENCES界面第五節(jié) 核酸序列分析二、核酸序列的比對分析和功能預測 FASTA:根據(jù)用戶提交的單個序列進行 數(shù)據(jù)庫搜索比對的程序。 網(wǎng)上服務器和電子郵件服務: ebi.ac.uk/ mailto: fastaebi.ac.uk fasta.genome.ad.jp mai

18、lto: fastanig.ac.jp第五節(jié) 核酸序列分析二、核酸序列的比對分析和功能預測進行多序列聯(lián)配 :ClustalW: ebi.ac.uk/clustalw/index.html, /soft/molbio/align/clustal/, ftp:/ftp.ebi.ac.uk/pub/software/dos/clustalw。ClustalX: CluastalW程序的UNIX版本,它使用X窗口圖形界面, ftp:/ftp.ebi.ac.uk/pub/software ftp:/ftp-igbmc.u-strassbg.fr/pub/clustalX。對聯(lián)配結果進一步編輯,形成適于發(fā)

19、表的形式,可用的軟件有:SeaView: ftp:/biom3.univ-lyon1.frBOXSHADE: /software/box_form.html)CINEMA: bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html第五節(jié) 核酸序列分析三、開讀框的分析GT-AG法則:外顯子與內(nèi)含子之間的連接區(qū)序列高度保守,如大部分內(nèi)含子5端起始的兩個堿基是GT,3端最后兩個堿基是AG。 基因識別軟件,常用的有:ORF Finder (/gorf/gorf.html )GRAIL (/grainbin/ )GeneFinder (genomic.sa

20、nger.ac.uk )Glimmer (/labs/compbio/glimmer.html/ )GenScan (/genscan.html )GeneLang (/genlang/)用GeneFinde進行開放閱讀框分析用GeneFinde進行開放閱讀框分析第五節(jié) 核酸序列分析四、引物設計Primer Premier軟件:premierbiosoft Primer3軟件:/cgi-bin/primer/primer3Oligo、Vector NT、Omiga等第五節(jié) 核酸序列分析五、向數(shù)據(jù)庫提交核酸序列 向EMBL提交數(shù)據(jù)的網(wǎng)絡表格可參見: ebi.ac.uk/subs/emblsubs

21、.tml 向GenBank數(shù)據(jù)庫提交核酸序列可聯(lián)網(wǎng)進行 /GenBank/index.html 也可用Sequin軟件制作好序列提交文件,向NCBI 發(fā)送E-mail()提交 第六節(jié) 蛋白質(zhì)序列分析 蛋白質(zhì)基本性質(zhì)分析 蛋白質(zhì)功能預測 蛋白質(zhì)結構預測 蛋白質(zhì)分子進化分析第六節(jié) 蛋白質(zhì)序列分析一、蛋白質(zhì)基本性質(zhì)分析 蛋白質(zhì)的氨基酸組成、分子量、等電點等方面的分析 : OMIGA、DNAMAN、BioEdit、MacVector等 蛋白質(zhì)疏水性分析 :ProtScale, /cgi-bin/protscale.pl 預測跨膜區(qū) : genome.cbs.dtu.dk/services/TMHMM-

22、2.0/ /software/TMPRED_form.html emblheidelberg.de/services/sander/predictprotein ftp:/ftp.biochem.ucl.ac.uk。用TMHMM 軟件預測的SARS-CoV 的E蛋白的跨膜區(qū)第六節(jié) 蛋白質(zhì)序列分析一、蛋白質(zhì)基本性質(zhì)分析預測信號肽:genome.cbs.dtu.dk/services/SignalP/ 蛋白質(zhì)亞細胞定位 :predict.sanger.ac.uk/nnpsl/預測信號肽預測信號肽蛋白質(zhì)亞細胞定位蛋白質(zhì)亞細胞定位第六節(jié) 蛋白質(zhì)序列分析二、蛋白質(zhì)功能預測蛋白質(zhì)序列分析和功能預測的一般流程 第六節(jié) 蛋白質(zhì)序列分析二、蛋白質(zhì)功能預測磷酸化位點、糖基化位點,特殊的結構區(qū)(motif)的分析:PROSITE: /prosite/BLOCKS: /blocks/PFAM: sanger.ac.uk/software/pfam/PESCAN: isrec.isb-sib.ch/software/pfscanInter

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論