版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生物信息學(xué)面臨的挑戰(zhàn)已經(jīng)有超過1000個(gè)物種的基因組已經(jīng)完成測序——如何進(jìn)行數(shù)據(jù)的分析與整合在多數(shù)的物種中只有大約45%的基因通過同源序列獲得注釋信息那些非同源基因可能與物種特異的表型相關(guān)它們將成為最重要的研究工程之一如何注釋這些基因的功能?1編輯ppt蛋白質(zhì)相互作用研究方法實(shí)驗(yàn)方法計(jì)算方法2編輯ppt實(shí)驗(yàn)方法免疫共沉淀〔Co-immunoprecipitation〕酵母雙雜交(Yeasttwohybrid)噬菌體展示〔Phagedisplay〕親和層析和質(zhì)譜〔Affinitypurification&massspectrometry〕蛋白芯片〔Proteinchip〕3編輯ppt將相互作用蛋白其中的一個(gè)通過抗體連接在固體顆粒上,與之相互作用的蛋白就能通過免疫共沉淀的方法沉淀出來。免疫共沉淀4編輯ppt酵母雙雜交5編輯ppt高通量的酵母雙雜交果蠅:ScienceVol.302,1727-1736,2003GenomeResearchVol.15,376-384,2005線蟲:ScienceVol.303(5657):540-3,2004酵母NatureVol.425,686-691,20036編輯pptPhageDisplay(1)噬菌體是一種僅感染細(xì)菌的病毒。它由兩局部構(gòu)成:遺傳物質(zhì)和蛋白質(zhì)外殼。噬菌體中的基因3能夠利用細(xì)菌的翻譯系統(tǒng)生產(chǎn)噬菌體蛋白質(zhì)外殼一端的組分。Proteincoat7編輯pptPhageDisplay(2)噬菌體展示通過在基因3位點(diǎn)插入新的核酸序列能夠在噬菌體的外表展示新的蛋白或肽段。8編輯pptPhageDisplay(3)這些噬菌體群體能夠展示十億種以上的蛋白或肽段,這個(gè)群體被稱為噬菌體展示文庫,每個(gè)展示的蛋白或肽段都對應(yīng)于一段基因序列。將噬菌體文庫與固定在固定相上的的目標(biāo)蛋白混合,能夠與目標(biāo)蛋白相互作用的展示蛋白或肽段將結(jié)合到這些目標(biāo)蛋白上。洗脫非特異結(jié)合噬菌體,對結(jié)合的噬菌體插入序列進(jìn)行測序,那么能知道該相互作用的蛋白或序列是由哪些核酸編碼。進(jìn)而可以克隆該基因。9編輯ppt親和純化和質(zhì)譜鑒定能夠相互作用形成復(fù)合體的蛋白把一個(gè)配體通過化學(xué)交聯(lián)的方法結(jié)合在固相載體上,讓蛋白混合液流過固相載體,能夠與配體結(jié)合的分子具有較高的親和力,通過適當(dāng)?shù)南疵摋l件將親和力弱的分子洗脫掉,這樣與配體親和力較高的分子就被純化了出來。純化出的分子隨后用凝膠電泳的方法別離,用質(zhì)譜的方法鑒定是什么蛋白。Eur.J.Biochem.270,570-578(2003)10編輯ppt串聯(lián)親和層析純化方法Thetandemaffinitypurificationmethod.
序列標(biāo)簽的結(jié)構(gòu).(B)純化方法.通過兩步的親和純化步驟獲得蛋白復(fù)合體11編輯ppt蛋白質(zhì)芯片目前,多數(shù)的蛋白芯片是將捕獲蛋白固定在芯片上,而待分析的蛋白混合物與芯片進(jìn)行雜交。12編輯ppt酵母蛋白芯片的制作及激酶檢測NatureGenetics
26:283-289,200013編輯ppt蛋白芯片的應(yīng)用蛋白芯片通常分為兩類:分析型蛋白芯片和功能性蛋白芯片分析型芯片通常會(huì)有高密度的親和試劑組成的點(diǎn)〔例如用于檢測混合溶液中的蛋白的抗體或抗原〕功能型芯片那么在芯片的固相基質(zhì)上連接有大量的純化后的蛋白。14編輯pptScienceVol.302,1727-1736,2003PPIofDrosophila(1)4679個(gè)蛋白,4780個(gè)相互作用15編輯pptGenomeResearchVol.15,376-384,2005PPIofDrosophila(2)1727個(gè)蛋白,2300個(gè)相互作用16編輯ppt24pairs17編輯ppt利用不同方法高通量篩選酵母蛋白質(zhì)-蛋白質(zhì)相互作用結(jié)果的比較AloyItoUetzHoGavinAloy4990.2%1.2%5.4%4.6%Ito1447513.8%2.4%2.5%Utez619914476.4%6.7%Ho2710692726908.6%Gavin231139741974875118編輯ppt蛋白質(zhì)相互作用的實(shí)驗(yàn)方法
酵母雙雜交蛋白復(fù)合體純化技術(shù)及質(zhì)譜蛋白芯片雜交技術(shù)
對實(shí)驗(yàn)室條件要求很高,實(shí)驗(yàn)周期長,費(fèi)用高,準(zhǔn)確性低.缺點(diǎn)19編輯ppt利用計(jì)算的方法預(yù)測蛋白-蛋白相互作用基于結(jié)構(gòu)的預(yù)測基于序列的預(yù)測相互作用的直系同源蛋白相互作用的結(jié)構(gòu)域?qū)诨蚪M的預(yù)測基因位點(diǎn)的上下文基因臨近聚集分散基因融合(Rosetta-Stonemethod)電子雙雜交系統(tǒng)發(fā)育上下文系統(tǒng)發(fā)生譜方法系統(tǒng)樹相近(Mirrortree)基因表達(dá):mRNA共表達(dá)20編輯ppt一些重要的概念Ortholog:直系同源,是指不同物種中來自同一個(gè)祖先的基因和蛋白質(zhì)。意義:直系同源在各種物種進(jìn)化中保持相同的功能。informationfromonemembertotheothers.Paralogs:旁系同源,指的是一個(gè)物種內(nèi)通過基因重復(fù)而產(chǎn)生的基因或蛋白質(zhì),意義:旁系同源在進(jìn)化中可以形成新的功能21編輯pptCOGs:直系同源簇,用兩個(gè)物種的蛋白質(zhì)進(jìn)行交互Blast,即利用一個(gè)物種的一個(gè)蛋白質(zhì)對第二個(gè)物種的所有蛋白質(zhì)進(jìn)行Blast,再將在第二個(gè)物種中得到的E值最小的蛋白質(zhì)序列對第一個(gè)物種的所有蛋白質(zhì)進(jìn)行Blast,如在第一個(gè)物種中E值最小的蛋白質(zhì)是原來用來對第二個(gè)物種進(jìn)行Blast的蛋白質(zhì),那么這兩個(gè)蛋白質(zhì)互為直系同源蛋白質(zhì)。在應(yīng)用中,通常利用三個(gè)物種進(jìn)行交互Blast以便更好地確定直系同源蛋白質(zhì)。IleS-MG345-MJ0947sll1362-MG345-MJ1362OrgA,Protein1OrgB,AllproteinsBlastP2withsmallestEvalueOrgB,Protein2OrgA,AllproteinsBlastP1withsmallestEvalue22編輯ppt23編輯ppt24編輯pptPhylogeneticPattern25編輯ppt26編輯ppt27編輯ppt28編輯ppt29編輯ppt基于結(jié)構(gòu)的預(yù)測ProteinXProteinYProteinAProteinBProteinXProteinYProteinAProteinB有相互作用預(yù)測有相互作用結(jié)構(gòu)同源30編輯ppt基于序列的預(yù)測相互作用直系同源蛋白假設(shè)A蛋白與B蛋白相互作用,在在其它物種中A與B的直系同源蛋白可能會(huì)相互作用相互作用的結(jié)構(gòu)域?qū)Y(jié)構(gòu)域是相互作用的蛋白質(zhì)中結(jié)構(gòu)與功能的根本位,每個(gè)蛋白中都是由各種結(jié)構(gòu)域組成的。因此通過相關(guān)結(jié)構(gòu)域的相互作用信息,可以預(yù)測蛋白質(zhì)的相互作用。31編輯ppt假設(shè)兩個(gè)基因在多個(gè)基因組中都處于相鄰位置,那么這兩個(gè)基因編碼的蛋白可能存在相互作用。.基因組臨近/基因臨近(1)32編輯ppt基因組臨近/
基因臨近(2)NatureBiotechVol22(7)912-917,200433編輯ppt基因融合方法34編輯ppt‘電子雙雜交〔InSilicoTwoHybrid〕’方法一些相互作用的蛋白質(zhì)應(yīng)該保持同步進(jìn)化,從而保持其相關(guān)的功能,即一對相互作用的蛋白質(zhì)中一個(gè)蛋白質(zhì)的氨基酸發(fā)生改變,可能會(huì)促使與其相互作用的另一個(gè)蛋白質(zhì)中的相應(yīng)氨基酸位點(diǎn)發(fā)生相適應(yīng)的互補(bǔ)突變,從而保持相互作用的完整性。否那么,在進(jìn)化的過程中,這些蛋白質(zhì)會(huì)由于選擇的壓力而被去除。因此,利用這種關(guān)系來預(yù)測蛋白質(zhì)的相互作用。35編輯pptMirrorTreesMethod該方法的假設(shè)前提是:相互作用的蛋白可能是共進(jìn)化的。方法是:計(jì)算包含不同物種的蛋白質(zhì)家族間的進(jìn)化距離,構(gòu)建各自相應(yīng)的進(jìn)化樹,在進(jìn)化樹之間相似性距離的根底上,構(gòu)建鏡像樹,然后由鏡像樹之間的相似性距離和蛋白質(zhì)在鏡像樹上的位置確定蛋白質(zhì)之間的兩兩相互作用。36編輯ppt系統(tǒng)發(fā)育譜〔phylogeneticprofiles〕的概念
假定有四個(gè)基因組,每個(gè)上面都有幾個(gè)蛋白標(biāo)記為P1,……P7。在該基因組上是否存在其中的一個(gè)蛋白分別用1或0表示。具有相同系統(tǒng)發(fā)育譜的蛋白被放在一個(gè)方框內(nèi),系統(tǒng)發(fā)育譜差一位的用線連接。結(jié)果是具有相同系統(tǒng)發(fā)生譜的P2和P7以及P3和P6具有功能相關(guān)性。利用這種方法分析蛋白的功能相關(guān)性,不需要序列的相似性。37編輯ppt系統(tǒng)發(fā)育譜方法中的兩個(gè)重要因子參考基因組的選擇同源的定義在已發(fā)表的文章中,利用這種方法研究蛋白質(zhì)相互作用還沒有人系統(tǒng)的研究過不同的基因組組合以及E值的閾值對結(jié)果的準(zhǔn)確性以及蛋白覆蓋率的影響。38編輯ppt方法
研究設(shè)計(jì)
1.目標(biāo)基因組和參考基因組(163個(gè)具有全基因組信息的物種)
按照系統(tǒng)發(fā)育關(guān)系分成9組(18個(gè)物種,35個(gè)物種,55個(gè)物種,65個(gè)物種,86個(gè)物種,106個(gè)物種,128個(gè)物種,145個(gè)物種及162個(gè)物種)2.同源性的定義
BlastpEvalue設(shè)定:1×10-1(E01),1×10-2(E02),1×10-3(E03),1×10-4(E04),1×10-5(E05),1×10-6(E07)and1×10-10(E10)3.63種組合
例如:18E01,18E10,…..,162E01,162E1039編輯pptResults
Thereferencegenomessets183555658610612814516240編輯ppt如何選擇基因組子集?
41編輯ppt一些概念精確性〔Precision〕用于描述實(shí)驗(yàn)重復(fù)性,通常用標(biāo)準(zhǔn)差或平均重復(fù)誤差表示。準(zhǔn)確性〔Accuracy〕描述測定值與真實(shí)值之間的差異。特異性〔Specificity〕描述報(bào)告信號(hào)來自預(yù)定目標(biāo)的比例靈敏度〔Sensitivity〕描述能夠獲得可檢測信號(hào)下目標(biāo)的最低量。42編輯pptDiscussionThenumberofreferencegenomes:Pellegrinietal.1999:16genomesDateandMarcotte2003:57
LimitednumberofgenomesZhengetal.2002更多的基因組能夠獲得更多的功能相關(guān)蛋白結(jié)果對于系統(tǒng)發(fā)育方法預(yù)測蛋白功能的準(zhǔn)確性可能有基因組數(shù)量上限。43編輯pptDiscussion參考基因組的數(shù)量確實(shí)能夠影響預(yù)測能力數(shù)量較少的基因組:18or35多一些的基因組:86更多的基因組:16244編輯pptDiscussionExploitingthephylogeneticrelationshipofgenomes系統(tǒng)發(fā)育樹分支異常值參考基因組45編輯pptHowtoapplytherefinedmethod首先,從:///genomes/Complete.html下載Eubacteria的“phyliptree〞文件其次,用TreeView軟件翻開“phyliptree〞文件第三,選擇欲其他所有物種親緣關(guān)系最遠(yuǎn)的一個(gè)物種作為異常值〔outlier〕最后,參加所有Archaea和Eukarytoes物種的基因組。這些選定的參考基因組用于其后的計(jì)算46編輯ppt系統(tǒng)發(fā)育譜的局限僅能預(yù)測擁有全基因組序列的物種.對于一些關(guān)鍵蛋白和共有蛋白中,由于在多數(shù)物種中沒有系統(tǒng)發(fā)育樹差異,而無法判斷蛋白之間的相關(guān)性。47編輯ppt電子預(yù)測蛋白質(zhì)相互作用方法的評估48編輯ppt評估PPI數(shù)據(jù)的重要性假陰性和假陽性蛋白質(zhì)相互作用的動(dòng)力學(xué)本質(zhì).蛋白表達(dá)和相互作用模式在不同生物學(xué)條件下是不同的,而目前所有的實(shí)驗(yàn)方法或計(jì)算方法都不能做到動(dòng)態(tài)檢測或預(yù)測,因此只能對真實(shí)存在的蛋白質(zhì)相互作用,得到一個(gè)粗略的描述實(shí)驗(yàn)方法或計(jì)算方法的局限性.每一種實(shí)驗(yàn)或計(jì)算方法所依據(jù)的生物學(xué)原理不同,因此每一種方法預(yù)測的結(jié)果也只能局部描述真實(shí)的相互作用.在實(shí)驗(yàn)或計(jì)算過程中產(chǎn)生的錯(cuò)誤.這3個(gè)因素使得應(yīng)用不同方法得到的蛋白質(zhì)相互作用網(wǎng)絡(luò)不同,或者不同的實(shí)驗(yàn)室應(yīng)用相同的方法也不能得到相同的蛋白質(zhì)相互作用網(wǎng)絡(luò).49編輯ppt蛋白質(zhì)相互作用數(shù)據(jù)的重疊和相互補(bǔ)充不同技術(shù)得到的蛋白質(zhì)相互作用之間的重復(fù)性很低,由不同實(shí)驗(yàn)室應(yīng)用相同的技術(shù)得到的數(shù)據(jù)差異也很大.50編輯ppt前期的方法利用不同的方法驗(yàn)證同一對相互作用:Uetzetal.2000
文獻(xiàn)閱讀:Jenssenetal.2001
計(jì)算機(jī)計(jì)算Deaneetal.2002表達(dá)譜可靠性指數(shù)平行進(jìn)化同源方法局限:需要復(fù)雜的芯片雜交數(shù)據(jù)51編輯ppt蛋白質(zhì)相互作用與其他生物學(xué)數(shù)據(jù)的關(guān)系亞細(xì)胞定位〔SubcellularLocalization〕功能分類〔FunctionCatalogue〕蛋白質(zhì)復(fù)合體〔Proteincomplexes〕代謝途徑〔Pathway〕基因表達(dá)數(shù)據(jù)〔GeneExpressionData〕的蛋白質(zhì)相互作用數(shù)據(jù)〔Knownprotein-proteininteractionsdata〕52編輯ppt的生物學(xué)數(shù)據(jù)庫蛋白質(zhì)復(fù)合體:EcoCyc代謝途徑:KEGG的蛋白質(zhì)蛋白質(zhì)相互作用數(shù)據(jù):DIPWhichoneisthebestandhow?53編輯pptMethodsandMaterials精確的系統(tǒng)發(fā)育譜方法Score:mutualinformationvalue225genomes’completesequence基因融合Score:phylogeneticdistance101genomes’completesequence101genomes’16sRNAforphylogeneticdistance基因順序Score:phylogeneticdistance101genomes’completesequence101genomes’16sRNAforphylogeneticdistanceAllcomputationandCOGannotationbasedonproteinsequenceofE.coli54編輯pptMaterialsandMethods陽性數(shù)據(jù)Pathwayinformation:KEGGKnownPPI:DIPComplexes:EcoCyc陰性數(shù)據(jù)ProteinsfromthedifferentfirstlevelofKEGGorthology(KO)compiledtobefalsePPIs
55編輯pptResults
Protein-proteininteractionpredictedbyinsilicomethodsMethodsPPINo.ProteinNo.FusionOrderOperonProfileOverlapNo.PPINo.Fusion100851357
----155036Order36723914131
---24307Operon249721301401201--3262Profile4841623183177320474-458All596634206-----59663Numberofoverlapbetweeninvolvedproteins56編輯ppt通過三種方法預(yù)測蛋白相互作用的功能分類Method1Method2COGfunctionalCategoriesTotalCOGfunctionalCategoriesFusionOrderC,E,G,K,L,M,TCat1K2,L2OperonG,K,L,TCat2T2,M1ProfileGCat3G3,E1,C1ProfileFusionC,K,L,M,TCat1K2,L1,OrderKCat2M1,T1OperonD,J,O,UCat3C1,OrderFusionJ,O,UCat1J1,K1OperonKCat2O1,U1,ProfileCat3OperonFusionD,J,UCat1J1OrderC,NCat2D1,N1,U1ProfileLCat3C1Cat1:Informationstorageandprocessing;Cat2:Cellularprocessesandsignaling;Cat3:Metabolism.
57編輯ppt評估PP:系統(tǒng)發(fā)育譜、GN:基因臨近、GF:基因融合58編輯pptConclusion三種方法具有不同的預(yù)測能力,基因臨近具有最高的準(zhǔn)確性與覆蓋率。每種方法都有它的偏差.利用蛋白復(fù)合體信息獲得的蛋白質(zhì)相互作用數(shù)據(jù)相對簡單且準(zhǔn)確。59編輯pptResults
Genome-wideproteinnetworksofE.coliO157H7
60編輯ppt基因表達(dá):相關(guān)mRNA的表達(dá)假設(shè)在不同實(shí)驗(yàn)條件下不同基因按照其表達(dá)水平能夠被聚類到一組,那么這些基因可能具有功能相關(guān)性。這樣預(yù)測的功能相關(guān)性能夠用來預(yù)測蛋白質(zhì)間可能的相互作用。61編輯pptMicroarrays用于大規(guī)模檢測基因表達(dá)Introduction62編輯ppt流程63編輯ppt瘧原蟲〔P.falciparum〕侵入人體紅細(xì)胞后基因的共表達(dá)ForestGreen:earlyPurple:middleGray:lateGreenYellow:early+middleBlue:early+lateBlack:middle+latePink:early+middle+late
64編輯pptGenomeResearchVol14:1060-1067,200465編輯ppt綜合運(yùn)算MarcotteE,etcNatureVol.402:83-86,1999
66編輯ppt67編輯pptblue:membranefusiongray:chromatinstructureGreen:cellstructureyellow:lipidmetabolismred:cytokinesisResults_genome-scaleproteininteractions68編輯pptResults_Crosstalkbetweenandwithinfunctionalgroups69編輯pptResults_Crosstalkbetweenandwithinfunctionalgroups
移動(dòng)性與趨藥性70編輯pptResults_Crosstalkbetweenandwithinsubcellularcompartment71編輯pptPNAS,Vol.104:8685-90,200772編輯ppt73編輯ppt人類疾病網(wǎng)絡(luò)與相似病癥相關(guān)的基因表現(xiàn)出更高的相互作用可能性,它們的轉(zhuǎn)錄本表達(dá)譜也表現(xiàn)出相似性,預(yù)示著存在疾病特異性功能模塊.人類關(guān)鍵基因似乎編碼在多種組織中都表達(dá)的節(jié)點(diǎn)蛋白.這預(yù)示著在人類相互作用組中疾病基因也可能扮演著中心角色。然而,大量的疾病基因并不是關(guān)鍵基因,也并非節(jié)點(diǎn)蛋白,它們的表達(dá)模式說明它們通常位于功能網(wǎng)絡(luò)的邊緣?;谶x擇的模型能夠解釋關(guān)鍵基因與疾病基因之間這種觀測的差異,并預(yù)示由體細(xì)胞突變產(chǎn)生的疾病不應(yīng)在功能網(wǎng)絡(luò)的邊緣。74編輯pptPPI網(wǎng)絡(luò)的特點(diǎn)功能相關(guān)蛋白模塊一起執(zhí)行功能的蛋白質(zhì)群體被定義為一個(gè)模塊(例如一個(gè)代謝途徑或趨藥性控制網(wǎng)絡(luò))在不同生物體內(nèi)蛋白質(zhì)相互作用具有共同的拓?fù)浣Y(jié)構(gòu)-無限網(wǎng)絡(luò)〔ScaleFreeNetwork〕,蛋白質(zhì)之間的聯(lián)系分布符合冪律分布(P(k)≈kγ),既存在許多蛋白之間可能只有少數(shù)的相互作用,而少數(shù)蛋白之間可能存在大量的相互作用.高聯(lián)結(jié)度的蛋白〔hubproteins〕可能比低聯(lián)結(jié)度蛋白更重要.
在PPI網(wǎng)絡(luò)中,頂點(diǎn)之間的路徑傾向于最短且基因組位點(diǎn)臨近的趨向于密集相關(guān)。75編輯ppt蛋白質(zhì)相互作用數(shù)據(jù)庫
BIND-BiomolecularInteractionNetworkDatabase
DIP-DatabaseofInteractingProteinsPIM-HybrigenicsPathCallingYeastInteractionDatabaseMINT-aMolecularInteractionsDatabaseGRID-TheGeneralRepositoryforInteractionDatasetsInterPreTS-proteininteractionpredictionthroughtertiarystructureSTRING-predictedfunctionalassociationsamonggenes/proteinsMammalianprotein-proteininteractiondatabase(PPI)InterDom-databaseofputativeinteractingproteindomainsFusionDB-databaseofbacterialandarchaealgenefusioneventsIntActProjectTheHumanProteinInteractionDatabase(HPID)ADVICE-AutomatedDetectionandValidationofInteractionbyCo-EvolutionInterWeaver-proteininteractionreportswithonlineevidencePathBLAST-alignmentofproteininteractionnetworksClusPro-afullyautomatedalgorithmforprotein-proteindockingHPRD–HumanProteinReferenceDatabase,ManuallycuratedInPrePPI–ThePlatformforPPIformicrobial
76編輯ppt77編輯ppt78編輯ppt79編輯ppt80編輯ppt81編輯ppt82編輯ppt83編輯ppt84編輯ppt://85編輯ppt86編輯pptUniHI:統(tǒng)一的人類相互作用組UnifiedHumanInteractome
UniHI是一個(gè)包含計(jì)算的以及實(shí)驗(yàn)得出的人類蛋白質(zhì)相互作用綜合數(shù)據(jù)庫。建立該數(shù)據(jù)庫的目的是整合多個(gè)功能圖譜,從而為研究人類相互作用組提供靈活而直接的接口。其第一個(gè)版本中包含18500個(gè)人類蛋白和178000個(gè)直接相互作用對.
目前的蛋白總數(shù)已經(jīng)到達(dá)了55,942個(gè),非冗余蛋白數(shù)量為21,275個(gè),包含192,77對相互作用.87編輯ppt構(gòu)建相互作用圖譜的方法酵母雙雜交〔Yeasttwo-hybrid(Y2H)-basedmaps〕:酵母雙雜交的方法利用兩個(gè)融合蛋白進(jìn)行篩選,其中一個(gè)誘餌蛋白與結(jié)合域融合,一個(gè)捕捉蛋白與激活域融合,當(dāng)兩個(gè)蛋白相互作用的時(shí)候能夠啟動(dòng)報(bào)告基因的表達(dá).文獻(xiàn)讀取〔Literature-basedinteractionmaps〕:蛋白質(zhì)相互作用用人工讀取或計(jì)算機(jī)文本挖掘的方法查找文獻(xiàn)中的蛋白質(zhì)相互作用。直系同源〔Orthology-basedinteractionmaps〕:該計(jì)算方法假定相互作用的蛋白共進(jìn)化,利用其它物種中的直系同源蛋白的相互作用來推測人類的蛋白質(zhì)相互作用。88編輯pptUniHI中包含的蛋白質(zhì)相互作用圖譜MDC-Y2Hmap:利用酵母雙雜交方法篩選4456個(gè)誘餌蛋白和5632個(gè)捕獲蛋白.
CCSB-Y2Hmap:利用酵母雙雜交的方法篩選8100個(gè)蛋白中存在的相互作用。
HPRD-COMPmap:利用人類蛋白參考數(shù)據(jù)庫監(jiān)督的文獻(xiàn)搜索構(gòu)建。
HPRD-BINmap:利用監(jiān)督的文獻(xiàn)搜索構(gòu)建.
BioGridmap:利用監(jiān)督的文獻(xiàn)搜索構(gòu)建.
IntActmap:利用監(jiān)督的文獻(xiàn)搜索構(gòu)建.
REACTOMEmap:利用監(jiān)督的文獻(xiàn)搜索構(gòu)建.
BINDmap:利用人工讀取及監(jiān)督的文獻(xiàn)搜索構(gòu)建.89編輯pptCOCITmap:利用計(jì)算機(jī)文本挖掘方法構(gòu)建.依據(jù)是相應(yīng)的蛋白在NCBI的Medline文獻(xiàn)數(shù)據(jù)摘要中頻繁的同時(shí)出現(xiàn).該方法無法界定兩個(gè)蛋白之間是物理相互作用還是功能相互作用
DIPmap:利用人工讀取文獻(xiàn)中的相互作用蛋白。
ORTHOmap:利用酵母、果蠅及線蟲的相互作用推測的人類蛋白質(zhì)相互作用。
HomoMINTmap:利用其它物種以及存儲(chǔ)在MINT數(shù)據(jù)庫中的數(shù)據(jù),應(yīng)用直系同源的方法預(yù)測人類蛋白質(zhì)相互作用。OPHIDmap:利用實(shí)驗(yàn)中得到酵母、果蠅、線蟲及小鼠中的蛋白相互作用預(yù)測人類蛋白相互作用。.
UniHI
中包含的相互作用圖譜90編輯pptUniHI數(shù)據(jù)庫中的網(wǎng)絡(luò)描述91編輯ppt不同網(wǎng)絡(luò)之間共有的相互作用92編輯ppt不同網(wǎng)絡(luò)之間共有的相互作用93編輯pptGraphicalrepresentationofthecombinednetworks
94編輯ppt95編輯ppt96編輯ppt97編輯ppt98編輯ppt99編輯ppt100編輯ppt101編輯ppt102編輯ppt103編輯ppt104編輯ppt包含相互作用、分子復(fù)合體、和代謝途徑等信息利用COG數(shù)據(jù)庫中的直系同源信息最新的基因組和蛋白信息有SwissProt維護(hù)105編輯ppt106編輯ppt107編輯ppt://string.embl.de108編輯ppt109編輯ppt110編輯pptDomine–
蛋白結(jié)構(gòu)域相互作用數(shù)據(jù)庫DOMINE是一個(gè)用于預(yù)測蛋白結(jié)構(gòu)域(domain-domain)相互作用的數(shù)據(jù)庫.其中包含來自PDB中的相互作用信息,還有一些利用8中不同計(jì)算方法預(yù)測的蛋白質(zhì)相互作用信息。DOMINE包含從4349種蛋白中預(yù)測的20,513個(gè)結(jié)構(gòu)域-結(jié)構(gòu)域〔domain-domain〕相互作用信息,其中17,781個(gè)至少來自兩種計(jì)算預(yù)測方法。在17,781個(gè)預(yù)測的蛋白質(zhì)相互作用對中,3,143個(gè)是高可信度的預(yù)測結(jié)果〔預(yù)測采用了多種信息資源〕730個(gè)是中可信度的預(yù)測結(jié)果(兩個(gè)結(jié)構(gòu)域?qū)儆谕粋€(gè)生物學(xué)過程,具有相同的GO分類〕,余下的13,908個(gè)是低可信度的結(jié)果。111編輯pptPF00049112編輯ppt113編輯ppt114編輯ppt115編輯ppt116編輯ppt117編輯pptThemammalianPPIs,resourcesarefromtheirownPPIassays,extractedandprocessedfrompubliclyavailabledatasources,theDIPandBINDdatabasesandMEDLINEabstracts.118編輯ppt119編輯ppt120編輯pptPPI的應(yīng)用
蛋白質(zhì)功能的預(yù)測PPI物理相互作用蛋白質(zhì)相互作用網(wǎng)絡(luò)遺傳互作–
調(diào)控關(guān)系代謝途徑重建調(diào)控網(wǎng)絡(luò)網(wǎng)絡(luò)進(jìn)化蛋白進(jìn)化:不同蛋白具有不同的進(jìn)化速率分子進(jìn)化121編輯ppt多數(shù)規(guī)那么分配〔Majorityruleassignment〕NatBiotechnol18(12):1257-61.(2000)(Guiltbyassociation.)全局最優(yōu)化原那么〔Globaloptimizationprinciples〕NatBiotechnol21(6):697-700(2003)蛋白質(zhì)功能預(yù)測122編輯ppt
多數(shù)規(guī)那么分配MajorityRuleAssignment
Anetworkofprotein–proteininteractionsinyeast
BennoSchwikowskietal.
NatureBiotechnology18,
1257
-
1261(2000)
123編輯ppt
通過直接或間接蛋白質(zhì)相互作用預(yù)測蛋白質(zhì)功能。YHR105W、YPL246C和YGL161C是未知功能蛋白。Akr2是是一個(gè)參與胞吞作用的蛋白,因此預(yù)示YHR105W蛋白可能與此相關(guān)。這種潛在的功能也有非直接相互作用的Ypt1、Vam7、Yip1和Pep12提供輔助證據(jù),這些蛋白都參與囊泡運(yùn)輸和/膜融合。124編輯ppt有哪些功能分類?YPD,MIPS,GO,COG……
在分類組合中使用越強(qiáng)的限定條件,功能預(yù)測的成功率越低。125編輯pptHowtoassignthefunctionstothoseproteins?126編輯ppt全局最優(yōu)化原那么Globalproteinfunctionpredictionfromprotein-proteininteractionnetworks
VazquezAetal.DepartmentofPhysics,UniversityofNotreDame,NotreDame,Indiana46556,USA.avazque1@NatBiotechnol
21(6):697-700.(2003)127編輯pptMajorityruleassignment
在多數(shù)情況下,只有少數(shù)未分類蛋白能與一個(gè)或更多功能蛋白之間存在相互作用。與功能蛋白相互作用的蛋白并不普遍地具有共同功能。為分類的蛋白如果與一個(gè)或多個(gè)未分類蛋白相互作用,那么這個(gè)未分類蛋白進(jìn)行功能分類的時(shí)候,先對其它的未分類蛋白進(jìn)行分類,然后這個(gè)未分類蛋白的分類必須與那些經(jīng)過分類預(yù)測的未分類蛋白功能相一致。
128編輯pptGlobaloptimizationprinciples
具有相同功能分類的相互作用蛋白的數(shù)量的得分與整個(gè)未分類蛋白的功能分類相關(guān)。模擬退火技術(shù)129編輯pptGlobalNetworkMethodYNL127W(2,4),YDR200C(3,4,10),YLR238W(12)細(xì)胞生長出芽、細(xì)胞極性、纖維形成細(xì)胞周期檢查點(diǎn)蛋白細(xì)胞質(zhì)分裂其他轉(zhuǎn)錄活性出芽、細(xì)胞極性、纖維形成信息素相應(yīng)、性別特異性細(xì)胞質(zhì)分裂其他信息素相應(yīng)活性
RNA合成tRNA合成其他信息素響應(yīng)活性
轉(zhuǎn)錄調(diào)控脅迫相應(yīng)其他信息素響應(yīng)活性130編輯ppt全局最優(yōu)化原那么與多數(shù)規(guī)那么成功率的比較。成功率的定義是預(yù)測的功能與實(shí)際功能分類一致的蛋白的百分比。在全局最優(yōu)化原那么中應(yīng)用了兩個(gè)不同的分類級(jí)別,分類級(jí)別1包含了424個(gè)類別,分類2包含20個(gè)類別。k為相互作用蛋白的數(shù)量,nk是有多少蛋白具有k個(gè)相互作用蛋白。131編輯pptResults_PredictionoffunctionsFromPNAS101,2888-2893,2004132編輯pptPPI網(wǎng)絡(luò)的構(gòu)建將實(shí)驗(yàn)數(shù)據(jù)與生物信息學(xué)預(yù)測數(shù)據(jù)整合在一起。133編輯pptFunctionalComplexesoftheHumanNucleolomeMolCell22:285-95,2006134編輯pptHumanExosome135編輯ppt136編輯ppt137編輯ppt138編輯pptNa?veBayesClassifierApproach(1)Thepriorodds:thechanceofchoosingapairofinteractingproteinsfromallproteinpairsThelikelihoodratio:theprobabilityofobservingthevaluesinthepredictivedatasetsgiventhatapairofproteinsinteractsdividedbytheprobabilityofobservingthevaluesgiventhatthepairdoesnotinteract(f2).Inthespecialcaseinwhichthepredictivedatasetsareconditionallyindependentornonredundant,thelikelihoodratiocanbecalculatedastheproductofindividualdata-setlikelihoodratios(f3).
139編輯pptNa?veBayesClassifierApproach(2)140編輯ppt141編輯ppt142編輯pptKnowninteractionsareshowningrayandpredictedinteractionsinred.ZNF207waspredictedandexperimentallyconfirmedtointeractwithBUB3RSU1waspredictedandexperimentallyconfirmedtointeractwithLIMS1,143編輯pptNatureGenetics38,285–293,2006144編輯pptComparisonofanmRNA3'-endprocessingsubnetworkfromwormY2Hstudy(left)andcorrespondinghumansubnetwork(right).
145編輯pptDistributionofPPIsforessentialornonessentialgenes(log10scale)146編輯ppt(a)CorrelationofsubcellularlocalizationofproteinswithPPIs(b)CorrelationofdiseasecategorieswithPPIs147編輯pptGeneRegulatoryNetworkAnalysis
REGULATORYCIRCUITAreactionnetworkthatcaninvolvetranscriptionfactors,promoters,enzymes,structuralgenes,functionalRNAsandmetabolites.Regulatorynetworkscontrolactivationofgenesindevelopment,inthecellcycleandintheactivationofmetabolicpathways.148編輯pptWearesnowedunderbyallthelittleArrows!!!149編輯ppt150編輯pptPNASVol101(16):5934-39,2004151編輯ppt構(gòu)建相互作用網(wǎng)絡(luò)的資源IntegrationoftheavailabledataPubMed蛋白質(zhì)蛋白質(zhì)相互作用代謝和信號(hào)轉(zhuǎn)導(dǎo)途徑來自蛋白質(zhì)組和其他資源的實(shí)驗(yàn)數(shù)據(jù)轉(zhuǎn)錄因子和它們結(jié)合位點(diǎn)信息152編輯ppt表達(dá)數(shù)據(jù)ChIP-chip數(shù)據(jù)轉(zhuǎn)錄因子轉(zhuǎn)錄因子PPI數(shù)據(jù)Howtocombinethesedataefficientlytoimprovethepredictionaccuracy?調(diào)控網(wǎng)絡(luò)基因基因Moremotifinformation?轉(zhuǎn)錄因子<->TARGETS文本挖掘153編輯ppt154編輯pptThreeMethodsTocombinethesedatatoselectsetsofgenesTocombinethesedatatogivetheconfidenceofdifferentgeneregulatorystructureToadjustthenetworkstructureadaptivelyaccordingtotheexperimentaldata155編輯pptHowtoInfer?ExistingmethodsCARRIE(NucleicAcidsRes.2004,32,179-188)GRAM(Nat.Biotechnol.2003,21,1337-1342)Correlatinggenepromotersandexpression(Bioinformatics,18,s172-s180)Selectclustersofcoexpressedgenesandlookintothepromotersequencesaroundthesegenesorgenome-widelocationdatafora“signal〞thatcouldpotentiallyexplaintheircoregulation156編輯pptTec1,Ste12,Sok2,Phd1,Mga1,andFlo8bindtodiscretesitesacrossall16chromosomesofS.cerevisiae
Tec1(red)Ste12(blue)Sok2(yellow)Phd1(pink)Mga1(orange)
Flo8(green)
GENES&DEVELOPMENT20:435-448,2006157編輯pptBindingbyTec1,Ste12,Sok2,Phd1,Mga1,andFlo8correlatewithpseudohyphal-expressedgenes158編輯pptAcomplexnetworkisformedbythepseudohyphalfactorsandtheirdownstreamtargets.159編輯ppt鑒定楊樹和擬南芥中新的調(diào)控模塊GenomeBiol.7:R103160編輯ppt數(shù)據(jù)和方法161編輯ppt162編輯pptDetectionofTFBSusingTwo-wayclustering163編輯pptIdentificationofindividualTFBSsusingco-expressedgenes
ApplytheClusterAffinitySearchTechnique(CAST)algorithmtothedatasetmeasuringtheexpressionof19,173Arabidopsisgenesover489differentexperiments(1,168AffymetrixATH1slides)Yield122clustersofco-regulatedgenescovering5,664genes.RunMotifSampler,applyingthenetwork-levelconservationfilterandremovingredundantmotifs.34motifswithasignificant(pvalue<0.01)Network-levelConservationscore(NCS).25oftheidentifiedTFBSscanbefunctionallyannotatedbasedonoverrepresentedGOBiologicalProcessorMolecularFunctiontermsinthesetofputativetargetgenes.Nearly60%(20/34)ofallmotifscorrespondwithknownplantregulatoryelements.164編輯ppt165編輯ppt166編輯pptCorrelationbetweencis-regulatorymodulesandclustersofco-expressedgenes167編輯ppt代謝途徑重建CellWallBiogenesis168編輯pptExampleofabacterialregulatorycircuit169編輯pptMetabolicNetworksMetabolicnetworksindifferentorganismshavethesametopological--ScaleFreeNetwork,forwhichP(k)followsapower-law,P(k)≈kγ.Newnodesarepreferentiallyattachedtoalreadyestablishednodes.Strongrobustnessagainstrandomerror.Someofthesubstratesexistinalltheorganismsandhavethehighconnectivity.Thenetworkdiameters(theshortestbiochemicalpathwayaveragedoverallpairsofsubstrates)areconservedinallorganisms–efficientlyrespondtoexternalchangesori
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廢水資源化處理-深度研究
- 機(jī)場智能安保監(jiān)控體系構(gòu)建-深度研究
- 可再生能源儲(chǔ)能技術(shù)-深度研究
- 2025年廣州番禺職業(yè)技術(shù)學(xué)院高職單招高職單招英語2016-2024歷年頻考點(diǎn)試題含答案解析
- 三葉蟲化石保護(hù)技術(shù)-深度研究
- 林區(qū)作業(yè)人員安全教育-深度研究
- 2025年廣州華立科技職業(yè)學(xué)院高職單招數(shù)學(xué)歷年(2016-2024)頻考點(diǎn)試題含答案解析
- 2025年廣東女子職業(yè)技術(shù)學(xué)院高職單招數(shù)學(xué)歷年(2016-2024)頻考點(diǎn)試題含答案解析
- 2025年宿州職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025至2030年中國汽車風(fēng)網(wǎng)數(shù)據(jù)監(jiān)測研究報(bào)告
- GB/T 16895.3-2024低壓電氣裝置第5-54部分:電氣設(shè)備的選擇和安裝接地配置和保護(hù)導(dǎo)體
- 計(jì)劃合同部部長述職報(bào)告范文
- 人教版高一地理必修一期末試卷
- 人教版高中物理必修一同步課時(shí)作業(yè)(全冊)
- 食堂油鍋起火演練方案及流程
- 《呼吸衰竭的治療》
- 2024年度醫(yī)患溝通課件
- 2024年中考政治總復(fù)習(xí)初中道德與法治知識(shí)點(diǎn)總結(jié)(重點(diǎn)標(biāo)記版)
- 2024年手術(shù)室的應(yīng)急預(yù)案
- 五年級(jí)上冊小數(shù)除法豎式計(jì)算練習(xí)300題及答案
- 語言規(guī)劃講義
評論
0/150
提交評論