版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基因芯片分析的理論與方法基因芯片概論基因芯片分析的概念基因芯片分析的優(yōu)點快速高通量(104-106)自動化使用的試劑少低本錢基因芯片分析的應用范圍AcademicresearchofgeneticdiseasesCancerPrenatalgenetics〔產(chǎn)前遺傳學研究〕GeneralgeneticdiseasesInfectiousdiseasesDrugdiscoveryAnimalfarming/veterinaryIndustrial(fermentation)Environmental開展的方向:從多角度研究揭示生命現(xiàn)象Stages:developmental,transformation,timeftertreatment,etc.Treatments(stimuli,drugs,nutrients,etc.)Physiologicalstates(stressed,fasting,etc.)Tissuedistribution(position,3D)基因芯片的開展是推動系統(tǒng)生物學開展的動力利用基因芯片研究生命現(xiàn)象的測略Factorsinvolved=>ComponentsOrderofevents=>PathwaysInteractions=>Circuit
KEGGGO基因芯片的分類根據(jù)用途分類
geneexpressionpatternBiologicalSampleFunctional
Information基因芯片的分類Oligonucleotidearray–Synthesizedonachip〔Affymetrix〕–Spotonasolidmatrix〔Compugen〕cDNAarray〔Incyte〕根據(jù)探針類型分類
expressiongenomicanalysiscDNA-Chip GenomicChip<2,000n>50,000n基因芯片分析試驗方法基因芯片分析的主要步驟cDNA基因芯片分析的主要步驟cDNA芯片分析的主要步驟SpotbyArrayspottercDNA芯片分析的主要步驟HybridizingbyAutomatichybridizationprocessorcDNA芯片分析的主要步驟LaserscannerOligonucleotidearray〔GeneChip〕LLLLLLLLcDNAAAAA總RNA的制備反轉錄體外轉錄生物素標記的cRNA片段化處理帶標記的cRNA片斷35-200bases0.5-2ug/ul起始用量5-10ug(IVT)操作流程〔以真核生物為例〕LLLLL標記的cRNA片斷雜交混合液的制備EukaryoticHyb.ControlControlOligoB2雜交(16hour)數(shù)據(jù)分析掃描洗脫染色Oligonucleotidearray的特點1個平方厘米的面積至少可排列四十多萬個探針合成區(qū)〔“點〞〕基因2基因1cDNA基因2cDNA用于cDNA芯片的探針Oligoprobe基因1多個檢測結果可以參考Oligonucleotidearray的優(yōu)越性cDNA芯片Affy芯片優(yōu)勢芯片分析數(shù)據(jù)的標準化Quantitationdata-qualityassessments背景處理:圖像上各點的吸光度值包含了樣品和背景信號,在提取數(shù)據(jù)前必須將背景扣除雜交點質量:由于點樣或膜變形等原因目前較多的軟件對雜交點的識別定位仍需要人為的調整數(shù)據(jù)的標準化:其目的是防止基因芯片實驗中因系統(tǒng)差異造成芯片間數(shù)據(jù)比較的困難。最常用的是“看家基因〞法,它預先選擇一組表達水平不變的看家基因,計算出這組基因平均ratio值為1時的標準化系數(shù),然后將其應用于全部的數(shù)據(jù)以到達標準化的目的ScatterplotsforaCy5-liver/Cy3-livercontrolhubridizationACy5-ovariantumor/Cy3-normalovaryhubridizationThevalueofCy3andCy5hydridizationsignalsfromeachclonewereplotteddirectlyontotheplot〔卵巢癌〕DataAnalysis-RevealtheDifference基因芯片數(shù)據(jù)分析和信息挖掘方法一.聚類分析聚類分析聚類分析是模式識別中一種非常有吸引力的方法,特別適用于模式分類數(shù)不知道的情況。從機器學習的角度來看,有兩種根本的聚類分析:有教師聚類無教師聚類基因表達數(shù)據(jù)聚類分析一般包括以下幾個步驟:〔1〕確定基因表達的數(shù)據(jù)〔2〕計算相似性矩陣,各個矩陣元素代表兩個基因的表達是否相似〔3〕選擇算法進行聚類分析〔4〕顯示分析結果。對數(shù)據(jù)進行聚類分析之前,必須將包含在基因表達矩陣中的數(shù)據(jù)進行相似程度分析,并且對分析結果進行量化。通常情況下,相似往往被賦于一個較大的量化的值,而不相似那么由一個較小的量化的值來表示。在實際計算中,往往以距離代替相似的概念,相似性度量被轉化為兩個基因表達模式之間的距離。距離越小,表達模式越相近,反之,那么表達模式差異大。兩個表達模式之間的關系(a)相似(b)變化趨勢一致(c)兩個基因的調控結果不一樣或甚至相反聚類分析的目的可誘導基因是共表達的許多構成性表達的基因不受調節(jié)根據(jù)表達相似形排列基因功能相似的基因被聚為不同的類可以揭示細胞的生理狀態(tài)可以幫助研究未知基因的功能聚類結果顯示:
Cluster,Clusterviewer二.基因調控網(wǎng)絡分析2.1基本理論定義一個基因網(wǎng)絡(pathway)由一組生物分子〔如基因、蛋白質〕以及它們之間的相互作用構成,這些生物分子共同完成一些特定的細胞功能任務在實際分析過程中,往往以圖這種數(shù)據(jù)結構表示基因網(wǎng)絡,圖中的節(jié)點代表基因或者蛋白質,而節(jié)點之間的連線代表基因、蛋白質之間的相互作用?;蚓W(wǎng)絡描述了特定細胞或組織中的功能路徑,如代謝、基因調控,信號傳導等。原理基因表達實際上是細胞、組織、器官受遺傳和環(huán)境影響的結果。一個基因的轉錄和表達由細胞的生化狀態(tài)所決定,在一個基因的轉錄過程中,一組轉錄因子作用于該基因的啟動子區(qū)域,控制該基因轉錄,而這些轉錄因子本身又是其它基因的產(chǎn)物。當一個基因通過轉錄、翻譯形成功能基因產(chǎn)物后,它將改變細胞的生化狀態(tài),從而直接或間接地影響其它基因的表達,甚至影響自身的表達。多個基因的表達不斷變化,使得細胞的生化狀態(tài)不斷地變化。一個基因的表達受其它基因的影響,而這個基因又會影響其它基因的表達,這種相互影響、相互制約關系構成了復雜的基因表達調控網(wǎng)絡?;虮磉_數(shù)據(jù)之中隱含基因之間的相互作用關系,因而可以通過分析基因表達數(shù)據(jù),構建基因調控網(wǎng)絡應用BetterunderstandthephysiologyoftheorganismPredicttheeffectofadrug–PredicttheweaknessesorsideeffectsofadrugPredictgoodorbaddrugcombinationsUnderstanddiseaseprocessesGenefunctionassignmentMakea“perfect〞simulationofcellularfunctiontouseasanexperimentalmodelManytools“feed〞intothisunderstandingincludingmicroarrays2.2pathway數(shù)據(jù)庫介紹Pathway數(shù)據(jù)庫GOKEGGGENMAPPBIACARTAGeneNet細胞因子網(wǎng)絡數(shù)據(jù)庫自由基信號數(shù)據(jù)庫關于GOGO(geneontology)是基因本體論聯(lián)合會(GeneOntologyConsortium)所建立的數(shù)據(jù)庫,旨在建立一個適用于各種物種的,對基因和蛋白功能進行限定和描述的,并隨著研究的不斷深入而更新的語言詞匯標準。GO是多種生物學本體論語言中的一種,提供了三層結構的系統(tǒng)定義方式,用于描述基因產(chǎn)物的功能。GO可以被用來在小鼠基因組中查詢和信號轉導相關的基因產(chǎn)物GO開展了具有三級結構的標準語言〔ontologies〕。根據(jù)基因產(chǎn)物的相關分子功能,生物學途徑,細胞學組件而給予定義,無物種相關性。關于KEGGKEGG(KyotoEncyclopediaofGenesandGenomes)〔京都大學基因和基因組百科全書數(shù)據(jù)庫〕KEGG是系統(tǒng)分析基因功能的數(shù)據(jù)庫,將基因組的信息與基因功能聯(lián)系起來,旨在揭示生命現(xiàn)象的遺傳與化學藍圖數(shù)據(jù)庫KEGGPATHWAYDatabaseKEGGGENESDatabaseKEGGLIGANDDatabase用途搜尋pathway,產(chǎn)生可能的反響路徑搜尋類似的基因序列搜尋類似的基因組序列搜尋類似的復合物結構,類似的多糖結構及類似的反響類別通路信息基因組信息化學信息KEGG中的通路分為五大類:
1.新陳代謝通路
2.遺傳信息處理通路
3.環(huán)境信息處理通路
4.細胞內通路
5.人類病癥相關通路PATHWAY提供所選定通路的參考資料、涉及的反響和在其他生物中的通路情況。由GIF等平板文件類型圖示,方框顯示為涉及的酶EC名稱,圓滑框為反響類型,以實線和箭頭連接反響物和方向,虛線指向預測的反響類型。關于GenMapp關于BioCartaBioCarta:“Carta〞中文意思是〞地圖〞,BioCarta〞即用圖形來描述生物相關知識,形成生物學家所熟悉的生化調控通路(biochemicalpathways)。BioCarta公司為客戶免費提供通路繪制軟件,讓他們根據(jù)自己的研究領域發(fā)表通路,建成數(shù)據(jù)庫,通路中的蛋白都是按照HUGO的標準建立的.BioCarta已收集各物種共大約120,000基因及136個調控通路,數(shù)據(jù)庫載不斷增加,其信號傳導通路(signaltransductionpathways)是當前最全的.GeneNet真核生物生理過程的調控網(wǎng)絡(GeneNet)GeneNet展示了協(xié)調方式下基因的整體功能,良好的調控功能和對外界刺激的反響。該基因網(wǎng)具有以下根本功能:(a)描述執(zhí)行特定生物功能時所涉及到的整體基因交互作用(b)描述基因的蛋白質編碼(c)描述基因對外界刺激的傳感途徑(d)通過一組反響自動地穩(wěn)定網(wǎng)絡參數(shù)或者使網(wǎng)絡轉換到新的功能狀態(tài)(e)利用外部信號、激素和代謝產(chǎn)物作為生理學參數(shù)激發(fā)基因網(wǎng)糾正其作用該基因網(wǎng)描述了四類實體:(a)細胞(組織,器官)(b)蛋白質(c)基因(d)物質該基因網(wǎng)還描述了實體間兩種關系:(a)反響〔reaction〕,即通過交互作用產(chǎn)生新的實體或過程(b)調控〔regulatory〕事件,特定反響對實體的作用。2.3功能富集分析功能富集分析定義功能富集分析(FunctionalEnrichmentAnalysis)
又稱功能聚類分析,借助于各種生物學信息數(shù)據(jù)庫〔如GO,KEGG,GENMAPP,BIACARTA,TRANSFAC,OMIM〕和分析工具〔如MAPPFinder,ArrayXPath〕進行統(tǒng)
計分析,挖掘同差異表達或共表達這組感興趣基因具有顯著差異的功能類別。功能富集分析的統(tǒng)計原理是用超幾何分布型來檢驗一組基因〔共表達或差異表達〕中某個功能類的顯著性,并結合多重假設檢驗判斷思想選擇同這組基因顯著相關功能類別
MAPPFinderMAPPFinderisatoolthatcreatesaglobalgene-expressionprofileacrossallareasofbiologybyintegratingtheannotationsoftheGeneOntology(GO)ProjectwiththefreesoftwarepackageGenMAPP://GenMAPP.org.可以整合GO定義,產(chǎn)生整體的基因表達譜.輸出可以搜索的瀏覽器,幫助用戶快速識別代表性的差異表達基因在GO的定義。工作方式Z值得計算GOminerGominer:最初Version在算法上雖亞于GenMAPP,在再建立可視關系上(tree-likestructure和‘directedacyclicgraph)有其獨特之處.今年對OriginalVersion進行較大改進,不僅可以富集significantGOcategories,還可以同時對多套芯片實驗數(shù)據(jù)批量分析,控制假發(fā)現(xiàn)率FDR,還整合轉錄因子結合位點信息.綜合而言,尤其適合TIME-COURSE功能富集分析需要建立當?shù)豈ysql數(shù)據(jù)庫,建立JDB數(shù)據(jù)源PathwayExplorerPathwayExplorer:providescomprehensiveandeasilyaccessiblerepresentationsofexpressionprofilesontomajorregulatory,metabolicandcellularpathways.TheintegratedpathwayresourcesincludeKEGG,BioCartaandGenMAPP.LocusLinkwasagainusedasrootidentifier.TheLocusLinksarelinkedwiththeuser-definedgeneidentifiergroups(UniGene,GeneOntology,GenBankand/orRefSeq),whichareusedthentoalignthemappedgeneIDs.ArrayXPathaweb-basedserviceformappingandvisualizingmicroarraygene-expressiondataforintegratedbiologicalpathwayresourcesWhenoneinputsgene-expressionclusters,ArrayXPathproducesalistofthebestmatchingpathwaysforeachclusterappliedFisher'sexacttestandthefalsediscoveryrate(FDR)toevaluatethestatisticalsignificanceoftheassociationbetweenaclusterandapathwaywhilec
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度第二章國際貨物買賣合同標的檢驗與認證3篇
- 二零二五年度雕塑項目投標采購合同范本3篇
- 2025年度旅游景區(qū)導游旅游紀念品銷售合作合同4篇
- 二零二五版駕校教練員績效考核及激勵合同3篇
- 2025年度餐廳總經(jīng)理數(shù)字化運營管理合同3篇
- 二零二五年度深部礦產(chǎn)資源勘查開采權轉讓合同2篇
- 二零二四事業(yè)單位借調人員臨時工作期間勞動合同解除流程3篇
- 2024-2025學年高中政治第一單元文化與生活第一課第一框體味文化訓練含解析新人教版必修3
- 二零二五版能源效率認證EMC合同能源管理合作協(xié)議3篇
- 二零二四年度專業(yè)演出服務合同-舞臺劇制作合作協(xié)議3篇
- 帶狀皰疹護理查房課件整理
- 年月江西省南昌市某綜合樓工程造價指標及
- 奧氏體型不銹鋼-敏化處理
- 作物栽培學課件棉花
- 交通信號控制系統(tǒng)檢驗批質量驗收記錄表
- 弱電施工驗收表模板
- 絕對成交課件
- 探究基坑PC工法組合鋼管樁關鍵施工技術
- 國名、語言、人民、首都英文-及各地區(qū)國家英文名
- API SPEC 5DP-2020鉆桿規(guī)范
- 組合式塔吊基礎施工專項方案(117頁)
評論
0/150
提交評論