基因芯片分析的理論與方法課件_第1頁
基因芯片分析的理論與方法課件_第2頁
基因芯片分析的理論與方法課件_第3頁
基因芯片分析的理論與方法課件_第4頁
基因芯片分析的理論與方法課件_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、基因芯片分析的理論與方法ericexist163. comQQ:7049971基因芯片概論基因芯片分析的概念n基因芯片(Gene chip)技術(shù)是指通過微陣列(Microarray)技術(shù)將高密度DNA片段陣列通過高速機器人或原位合成方式以一定的順序或排列方式使其附著在如玻璃片等固相表面,以熒光標記的DNA探針,借助堿基互補雜交原理,進行大量的基因表達及監(jiān)測等方面研究的技術(shù)。基因芯片分析的優(yōu)點n快速n高通量(104 - 106)n自動化n使用的試劑少n低成本基因芯片分析的應(yīng)用范圍nAcademic research of genetic diseasesnCancernPrenatal gene

2、tics(產(chǎn)前遺傳學(xué)研究)nGeneral genetic diseasesnInfectious diseasesnDrug discoverynAnimal farming/veterinary nIndustrial (fermentation)nEnvironmental發(fā)展的方向:從多角度研究揭示生命現(xiàn)象nStages: developmental,transformation, time fter treatment, etc.nTreatments (stimuli, drugs, nutrients, etc.) nPhysiological states (stressed,

3、 fasting, etc.)nTissue distributionn(position, 3D)基因芯片的發(fā)展是推動系統(tǒng)生物學(xué)發(fā)展的動力利用基因芯片研究生命現(xiàn)象的測略nFactors involved = ComponentsnOrder of events = PathwaysnInteractions = Circuit KEGGGO基因芯片的分類E xp ressio n C h ip sG en o m ic C h ip sS eq u en cin g C h ip sD N A C h ip s基因芯片的分類nOligonucleotide arrayn Synthesize

4、d on a chip( Affymetrix)n Spot on a solid matrix( Compugen)ncDNA array( Incyte )一些發(fā)展中的基因芯片技術(shù)平臺n利用生物分子的電物理特性進行基因表達監(jiān)測:監(jiān)測速度很快,適用于基因表大,蛋白質(zhì)組及基因型的研究n利用電場原理進行高密度芯片生產(chǎn):基于適合用于生物學(xué)的集成電路,集成電路包含可以獨立尋址的微電極陣列,結(jié)合特殊的液體流動系統(tǒng),可以使大部分生物分子按照來自于計算機的數(shù)字指令運動。n噴墨點樣技術(shù):以高度定位的形式把合成好的寡核苷酸分子噴點倒玻璃表面。n寡核苷酸包被的微珠芯片n平行信號測序技術(shù):對基因表達進行定量分析基

5、因芯片分析試驗方法基因芯片分析的主要步驟cDNA基因芯片分析的主要步驟cDNA芯片分析的主要步驟nSpot by Array spottercDNA芯片分析的主要步驟Hybridizing by Automatic hybridization processorcDNA芯片分析的主要步驟nLaser scannerOligonucleotide array (GeneChipGeneChip )總總RNA的制備的制備反轉(zhuǎn)錄反轉(zhuǎn)錄體外體外轉(zhuǎn)錄轉(zhuǎn)錄生物素標記的生物素標記的cRNA片段化處理片段化處理帶標記的帶標記的cRNA片斷片斷35-200 bases0.5-2 ug/ul起始用量起始用量5-1

6、0ug(IVT)操作流程操作流程(以真核生物為例)(以真核生物為例)標記的標記的cRNA片斷片斷雜交混合液的制備雜交混合液的制備EukaryoticHyb.ControlControlOligo B2 雜交雜交(16hour) 數(shù)據(jù)分析數(shù)據(jù)分析 掃掃 描描 洗脫洗脫染色染色Oligonucleotide array 的特點1 個平方厘米的面積至少可排個平方厘米的面積至少可排列四十多萬個探針合成區(qū)列四十多萬個探針合成區(qū)(“點點”)基因基因2 2基因基因1cDNA1cDNA基因基因2cDNA2cDNA用于用于cDNAcDNA芯片的探針芯片的探針Oligo probeOligo probe基因基因1

7、 1多個檢測結(jié)果可以參考多個檢測結(jié)果可以參考Oligonucleotide array 的優(yōu)越性 序列準確性高 原位合成 PCR擴增,點樣 起始Total RNA 110ug 50ug 均一的退火溫度 25mer 300bp3Kb 特異性更高 多段探針 單個探針 非特異性雜交 2 30cDNA 芯片芯片Affy 芯片芯片優(yōu)優(yōu) 勢勢芯片分析數(shù)據(jù)的標準化nQuantitation ndata-quality assessmentsn背景處理:圖像上各點的吸光度值包含了樣品和背景信號,在提取數(shù)據(jù)前必須將背景扣除n雜交點質(zhì)量:由于點樣或膜變形等原因目前較多的軟件對雜交點的識別定位仍需要人為的調(diào)整n數(shù)據(jù)

8、的標準化:其目的是避免基因芯片實驗中因系統(tǒng)差異造成芯片間數(shù)據(jù)比較的困難。最常用的是“看家基因”法,它預(yù)先選擇一組表達水平不變的看家基因,計算出這組基因平均ratio 值為1 時的標準化系數(shù),然后將其應(yīng)用于全部的數(shù)據(jù)以達到標準化的目的Scatter plots for a Cy5-liver/Cy3-liver control hubridization A Cy5-ovarian tumor/Cy3-normal ovary hubridization The value of Cy3 and Cy5 hydridization signals from each clone were plo

9、tted directly onto the plot (卵巢癌)Data Analysis - Reveal the Difference基因芯片數(shù)據(jù)分析和信息挖掘方法一. 聚類分析聚類分析n聚類分析是模式識別中一種非常有吸引力聚類分析是模式識別中一種非常有吸引力的方法,特別適用于模式分類數(shù)不知道的的方法,特別適用于模式分類數(shù)不知道的情況。情況。n從機器學(xué)習(xí)的角度來看,有兩種基本的聚從機器學(xué)習(xí)的角度來看,有兩種基本的聚類分析:類分析:n有教師聚類有教師聚類n無教師聚類無教師聚類n基因表達數(shù)據(jù)聚類分析一般包括以下幾個基因表達數(shù)據(jù)聚類分析一般包括以下幾個步驟:步驟:n()確定基因表達的數(shù)據(jù)()確

10、定基因表達的數(shù)據(jù)n()計算相似性矩陣,各個矩陣元素代表兩()計算相似性矩陣,各個矩陣元素代表兩個基因的表達是否相似個基因的表達是否相似n()選擇算法進行聚類分析()選擇算法進行聚類分析n()顯示分析結(jié)果。()顯示分析結(jié)果。n對數(shù)據(jù)進行聚類分析之前,必須將包含在基因表對數(shù)據(jù)進行聚類分析之前,必須將包含在基因表達矩陣中的數(shù)據(jù)進行相似程度分析,并且對分析達矩陣中的數(shù)據(jù)進行相似程度分析,并且對分析結(jié)果進行量化。結(jié)果進行量化。 n通常情況下,相似往往被賦于一個較大的量化的通常情況下,相似往往被賦于一個較大的量化的值,而不相似則由一個較小的量化的值來表示。值,而不相似則由一個較小的量化的值來表示。n在實際

11、計算中,往往在實際計算中,往往以距離代替相似以距離代替相似的概念,相的概念,相似性度量被轉(zhuǎn)化為兩個基因表達模式之間的距離。似性度量被轉(zhuǎn)化為兩個基因表達模式之間的距離。距離越小,表達模式越相近,反之,則表達模式距離越小,表達模式越相近,反之,則表達模式差異大。差異大。兩個表達模式之間的關(guān)系(a) 相似(b) 變化趨勢一致(c) 兩個基因的調(diào)控結(jié)果不一樣或甚至相反聚類分析的目的n可誘導(dǎo)基因是共表達的 n許多構(gòu)成性表達的基因不受調(diào)許多構(gòu)成性表達的基因不受調(diào)節(jié)節(jié)n根據(jù)表達相似形排列基因n功能相似的基因被聚為不同的類n可以揭示細胞的生理狀態(tài)n可以幫助研究未知基因的功能聚類結(jié)果顯示聚類結(jié)果顯示: Clus

12、ter, Cluster viewer二二. 基因調(diào)控網(wǎng)絡(luò)分析基因調(diào)控網(wǎng)絡(luò)分析2.1 基 本 理 論定義n一個基因網(wǎng)絡(luò)一個基因網(wǎng)絡(luò)(pathway)由由一組生物分子(如基一組生物分子(如基因、蛋白質(zhì))以及它們之間的相互作用構(gòu)成因、蛋白質(zhì))以及它們之間的相互作用構(gòu)成,這,這些生物分子共同完成一些特定的細胞功能任務(wù)些生物分子共同完成一些特定的細胞功能任務(wù)n在實際分析過程中,往往以在實際分析過程中,往往以圖圖這種數(shù)據(jù)結(jié)構(gòu)表示這種數(shù)據(jù)結(jié)構(gòu)表示基因網(wǎng)絡(luò),圖中的基因網(wǎng)絡(luò),圖中的節(jié)點代表基因或者蛋白質(zhì),而節(jié)點代表基因或者蛋白質(zhì),而節(jié)點之間的連線代表基因、蛋白質(zhì)之間的相互作節(jié)點之間的連線代表基因、蛋白質(zhì)之間的

13、相互作用用?;蚓W(wǎng)絡(luò)描述了特定細胞或組織中的功能路?;蚓W(wǎng)絡(luò)描述了特定細胞或組織中的功能路徑,如代謝、基因調(diào)控,信號傳導(dǎo)等。徑,如代謝、基因調(diào)控,信號傳導(dǎo)等。原理n基因表達實際上是細胞、組織、器官受遺傳和環(huán)基因表達實際上是細胞、組織、器官受遺傳和環(huán)境影響的結(jié)果。境影響的結(jié)果。n一個基因的轉(zhuǎn)錄和表達由細胞的生化狀態(tài)所決定,一個基因的轉(zhuǎn)錄和表達由細胞的生化狀態(tài)所決定,在一個基因的轉(zhuǎn)錄過程中,一組轉(zhuǎn)錄因子作用于在一個基因的轉(zhuǎn)錄過程中,一組轉(zhuǎn)錄因子作用于該基因的啟動子區(qū)域,控制該基因轉(zhuǎn)錄,而這些該基因的啟動子區(qū)域,控制該基因轉(zhuǎn)錄,而這些轉(zhuǎn)錄因子本身又是其它基因的產(chǎn)物。轉(zhuǎn)錄因子本身又是其它基因的產(chǎn)物。n

14、當一個基因通過轉(zhuǎn)錄、翻譯形成功能基因產(chǎn)物后,當一個基因通過轉(zhuǎn)錄、翻譯形成功能基因產(chǎn)物后,它將改變細胞的生化狀態(tài),從而直接或間接地影它將改變細胞的生化狀態(tài),從而直接或間接地影響其它基因的表達,甚至影響自身的表達。多個響其它基因的表達,甚至影響自身的表達。多個基因的表達不斷變化,使得細胞的生化狀態(tài)不斷基因的表達不斷變化,使得細胞的生化狀態(tài)不斷地變化。地變化。n一個基因的表達受其它基因的影響,而這一個基因的表達受其它基因的影響,而這個基因又會影響其它基因的表達,這種相個基因又會影響其它基因的表達,這種相互影響、相互制約關(guān)系構(gòu)成了復(fù)雜的基因互影響、相互制約關(guān)系構(gòu)成了復(fù)雜的基因表達調(diào)控網(wǎng)絡(luò)。表達調(diào)控網(wǎng)絡(luò)

15、。 n基因表達數(shù)據(jù)之中隱含基因之間的相互作基因表達數(shù)據(jù)之中隱含基因之間的相互作用關(guān)系,因而可以通過分析基因表達數(shù)據(jù),用關(guān)系,因而可以通過分析基因表達數(shù)據(jù),構(gòu)建基因調(diào)控網(wǎng)絡(luò)構(gòu)建基因調(diào)控網(wǎng)絡(luò)應(yīng)用nBetter understand the physiology of the organismnPredict the effect of a drug Predict the weaknesses or side effects of a drugnPredict good or bad drug combinationsnUnderstand disease processesnGene funct

16、ion assignmentnMake a “perfect” simulation of cellularnfunction to use as an experimental modelnMany tools “feed” into this understanding including microarrays2.2 pathway 數(shù)據(jù)庫介紹Pathway 數(shù)據(jù)庫nGOnKEGGnGENMAPPnBIACARTAnGeneNetn細胞因子網(wǎng)絡(luò)數(shù)據(jù)庫n自由基信號數(shù)據(jù)庫關(guān)于GOnGO(gene ontology)是基因本體論聯(lián)合會(Gene Ontology Consortium)所建立的

17、數(shù)據(jù)庫,旨在建立一個適用于各種物種的,對基因和蛋白功能進行限定和描述的,并隨著研究的不斷深入而更新的語言詞匯標準。GO是多種生物學(xué)本體論語言中的一種,提供了三層結(jié)構(gòu)的系統(tǒng)定義方式,用于描述基因產(chǎn)物的功能。nGO可以被用來在小鼠基因組中查詢和信號轉(zhuǎn)導(dǎo)相關(guān)的基因產(chǎn)物nGO發(fā)展了具有三級結(jié)構(gòu)的標準語言(ontologies)。根據(jù)基因產(chǎn)物的相關(guān)分子功能,生物學(xué)途徑,細胞學(xué)組件而給予定義,無物種相關(guān)性。關(guān)于KEGGnKEGG (Kyoto Encyclopedia of Genes and Genomes) (京都大學(xué)基因和基因組百科全(京都大學(xué)基因和基因組百科全書數(shù)據(jù)庫)書數(shù)據(jù)庫)nKEGG 是系統(tǒng)

18、分析基因功能的數(shù)據(jù)庫,將基因組的信息與基因功能聯(lián)系起來,旨在揭示生命現(xiàn)象的遺傳與化學(xué)藍圖數(shù)據(jù)庫KEGG PATHWAY DatabaseKEGG GENES DatabaseKEGG LIGAND Database用途搜尋pathway, 產(chǎn)生可能的反應(yīng)路徑搜尋類似的基因序列搜尋類似的基因組序列搜尋類似的復(fù)合物結(jié)構(gòu),類似的多糖結(jié)構(gòu)及類似的反應(yīng)類別通路信息基因組信息化學(xué)信息nKEGG中的通路分為五大類:1 新陳代謝通路2 遺傳信息處理通路3 環(huán)境信息處理通路4 細胞內(nèi)通路5 人類病癥相關(guān)通路nPATHWAY提供所選定通路的參考資料、涉及的反應(yīng)和在其他生物中的通路情況。由GIF等平板文件類型圖示,

19、方框顯示為涉及的酶EC名稱,圓滑框為反應(yīng)類型,以實線和箭頭連接反應(yīng)物和方向,虛線指向預(yù)測的反應(yīng)類型。關(guān)于GenMappnGemapp (http:/) nGenMAPP 是一個以學(xué)術(shù)研究為基礎(chǔ)的科學(xué)團體,提供100個以上的通路圖. Silicon Genetics公司已經(jīng)和 GenMAPP組織達成了協(xié)議 ,把這些通路整合到了 GeneSpring的通路庫. 利用 GeneSpring分析的基因芯片數(shù)據(jù)可以用 GenMAPP的通路可視化,使研究者研究某些基因在通路中的作用.關(guān)于BioCartanBioCarta:“Carta”中文意思是”地圖”,BioCarta” 即用圖形來描述生物相關(guān)知識,形

20、成生物學(xué)家所熟悉的生化調(diào)控通路(biochemical pathways)。nBioCarta 公司為客戶免費提供通路繪制軟件,讓他們根據(jù)自己的研究領(lǐng)域發(fā)表通路,建成數(shù)據(jù)庫,通路中的蛋白都是按照HUGO的標準建立的.nBioCarta已收集各物種共大約120,000基因及136個調(diào)控通路,數(shù)據(jù)庫載不斷增加,其信號傳導(dǎo)通路(signal transduction pathways)是當前最全的.GeneNetn真核生物生理過程的調(diào)控網(wǎng)絡(luò)(GeneNet)nGeneNet展示了協(xié)調(diào)方式下基因的整體功能,良好的調(diào)控功能和對外界刺激的反應(yīng)。該基因網(wǎng)具有以下基本功能:n(a) 描述執(zhí)行特定生物功能時所涉

21、及到的整體基因交互作用n(b) 描述基因的蛋白質(zhì)編碼n(c) 描述基因?qū)ν饨绱碳さ膫鞲型緩絥(d) 通過一組反饋自動地穩(wěn)定網(wǎng)絡(luò)參數(shù)或者使網(wǎng)絡(luò)轉(zhuǎn)換到新的功能狀態(tài)n(e) 利用外部信號、激素和代謝產(chǎn)物作為生理學(xué)參數(shù)激發(fā)基因網(wǎng)糾正其作用n該基因網(wǎng)描述了四類實體:n (a) 細胞(組織,器官)n (b) 蛋白質(zhì)n (c) 基因n (d) 物質(zhì)n該基因網(wǎng)還描述了實體間兩種關(guān)系:n(a) 反應(yīng)(reaction), 即通過交互作用產(chǎn)生新的實體或過程n(b) 調(diào)控(regulatory)事件, 特定反應(yīng)對實體的作用。 2.3 功能富集分析功能富集分析定義n功能富集分析(Functional Enrichme

22、nt Analysis)又稱功能聚類分析,借助于各種生物學(xué)信息數(shù)據(jù)庫(如GO , KEGG, GENMAPP, BIACARTA, TRANSFAC, OMIM)和分析工具(如MAPPFinder, ArrayXPath)進行統(tǒng)計分析,挖掘同差異表達或共表達這組感興趣基因具有顯 著差異的功能類別。n功能富集分析的統(tǒng)計原理是用超幾何分布型來檢驗一組基 因(共表達或差異表達)中某個功能類的顯著性,并結(jié)合 多重假設(shè)檢驗判斷思想選擇同這組基因顯著相關(guān)功能類別MAPPFindernMAPPFinder is a tool that creates a global gene-expression pro

23、 all areas of biology by integrating the annotations of the Gene Ontology (GO) Project with the free software package nGenMAPP http:/. 可以整合GO定義,產(chǎn)生整體的基因表達譜. 輸出可以搜索的瀏覽器,幫助用戶快速識別代表性的差異表達基因在GO的定義。工作方式Z值得計算GOminernGominer:最初Version在算法上雖亞于GenMAPP, 在再建立可視關(guān)系上(tree-like structure 和directed acyclic graph)有其獨特

24、之處.n今年對Original Version進行較大改進,不僅可以富集significant GO categories, 還可以同時對多套芯片實驗數(shù)據(jù)批量分析,控制假發(fā)現(xiàn)率FDR, 還整合轉(zhuǎn)錄因子結(jié)合位點信息.綜合而言, 尤其適合TIME-COURSE功能富集分析n需要建立當?shù)豈ysql數(shù)據(jù)庫,建立JDB數(shù)據(jù)源 Pathway ExplorernPathwayExplorer:provides comprehensive and easily accessible representations of expression profiles onto major regulatory, m

25、etabolic and cellular pathways. The integrated pathway resources include KEGG, BioCarta and GenMAPP.nLocusLink was again used as root identifier. The LocusLinks are linked with the user-defined gene identifier groups (UniGene, GeneOntology, GenBank and/or RefSeq), which are used then to align the mapped gene IDs.ArrayXPathna web-based service for mapping and visualizing microarray gene-expression data for integrated biological pathway resources nWhen one inputs gene-expression clusters, ArrayXPath produces a list of the best matching pathways for each cluster nap

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論