版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
蛋白質(zhì)分析和蛋白質(zhì)組學(xué)proteinRNADNA1蛋白質(zhì)分析和蛋白質(zhì)組學(xué)proteinRNADNA1protein[4]Proteinfunction[3]ProteinlocalizationGeneontology(GO):--cellularcomponent--biologicalprocess--molecularfunction[1]Molecularbiology[2]Proteinfamilies2protein[4]Proteinfunction[3]視角3和4的介紹:
GeneOntology(GO)Consortium3視角3和4的介紹:GeneOntology(GO)CGeneOntology成立的背景Year19822005Numberofrecords60244,202,133GenBankEMBLDDBJPubMed:over15millioncitations4GeneOntology成立的背景Year1982200What’sinaname?GlucosesynthesisGlucosebiosynthesisGlucoseformationGlucoseanabolismGluconeogenesisAllrefertotheprocessofmakingglucosefromsimplercomponents5What’sinaname?GlucosesynthWhat’sinaname?ThesamenamecanbeusedtodescribedifferentconceptsAconceptcanbedescribedusingdifferentnamesComparisonisdifficult–inparticularacrossspeciesoracrossdatabases6What’sinaname?Thesamename本體(ontology)計算機科學(xué)對自然世界認(rèn)知的形式化的表示,既是可被計算機表示,解釋和利用的知識的形式化的研究—即本體。本體是結(jié)構(gòu)化的領(lǐng)域知識,并可以被計算機解釋和利用。實現(xiàn)對生命世界中這些概念理解上的共享,包括從不同的視角,不同的術(shù)語分類,不同的主體(人和機器)共享概念--概念化的規(guī)范GeneOntology(GO)協(xié)會致力于這樣一項工程:編輯一組動態(tài)的而又可控的詞匯來描述基因和基因產(chǎn)物(主要是蛋白質(zhì))不同方面的性質(zhì)。7本體(ontology)計算機科學(xué)對自然世界認(rèn)知的形式化的表Ontologiescanberepresentedasgraphs,wherethenodesareconnectedbyedges
Nodes=conceptsintheontologyEdges=relationshipsbetweentheconceptsnodenodenodeedgeOntologyStructure8Ontologiescanberepresented所有這些蛋白質(zhì)能做什么?“功能”太有局限性。生物學(xué)家想知道:每個蛋白質(zhì)能做什么,屬于哪條細胞回路或者為什么細胞需要這個功能,以及在什么地方發(fā)生了這樣的過程。9所有這些蛋白質(zhì)能做什么?“功能”太有局限性。9GeneOntology的發(fā)起芽殖酵母基因組數(shù)據(jù)庫(SGD)果蠅基因組數(shù)據(jù)庫(drosophilagenomedatabase,簡稱FlyBase)小鼠基因組信息數(shù)據(jù)庫;(mousegenomeinformationdatabase,簡稱MGD/GXD)
GO數(shù)據(jù)庫不是以其自身為中心而是依靠外部數(shù)據(jù)庫,這些外部數(shù)據(jù)庫中收錄的基因及其產(chǎn)物都將用GO定義的詞匯進行注釋。因此GO是與時俱進與相互合作的代表,它致力于統(tǒng)一基因及其產(chǎn)物注釋的方式。YoucanvisitGOat.10GeneOntology的發(fā)起芽殖酵母基因組數(shù)據(jù)庫(SGDGO(GeneOntology)structureGOisn’tjustaflatlistofbiologicaltermstermsarerelatedwithinahierarchy11GO(GeneOntology)structureGOHierarchicalstructure層次性:
isa:上一個概念包括下一個概念,下一個概念是上一個概念的實例。partof:下一個概念是上一個概念的一部分
樹松樹葉子PartofIsa12Hierarchicalstructure層次性:樹松樹TruePathRuleTruePathRule:如果下一代的術(shù)語可以用于描述此基因產(chǎn)物,其上一代術(shù)語也可以適用。已糖代謝和單糖合成己糖合成活性13TruePathRuleTruePathRule:如DAG有向無環(huán)(DAG)Simplehierarchies
(Trees)DirectedAcyclicGraphsOneormoreparentsSingleparent14DAG有向無環(huán)(DAG)SimplehierarchiesHowdoesGOwork?Whatdoesthegeneproductdo?Whereandwhendoesitact?Whydoesitperformtheseactivities?Whatinformationmightwewanttocaptureaboutageneproduct?15HowdoesGOwork?WhatdoestheGO:ThreeontologiesWheredoesitact?Whatprocessesisitinvolvedin?Whatdoesitdo?MolecularFunctionCellularComponentBiologicalProcessgeneproduct16GO:ThreeontologiesWheredoesMolecularFunction分子功能描述在分子生物學(xué)上的活性,如催化活性或結(jié)合活性。Setsoffunctionsmakeupabiologicalprocess.insulinbindinginsulinreceptoractivity17MolecularFunction分子功能描述在分子生物學(xué)CellularComponentwhereageneproductacts(細胞中的位置指基因產(chǎn)物位于何種細胞器或基因產(chǎn)物組中(如糙面內(nèi)質(zhì)網(wǎng),核或核糖體,蛋白酶體等))18CellularComponentwhereageneBiologicalProcess生物學(xué)途徑是由分子功能有序地組成的,具有多個步驟的一個過程。(細胞生長和維持、信號傳導(dǎo)、嘧啶代謝或α-配糖基的運輸)。celldivisiongluconeogenesis19BiologicalProcess生物學(xué)途徑是由分子功能有BiologicalProcess20BiologicalProcess20lipocalin21lipocalin21以樹狀圖形式顯示的GO詞匯之間的關(guān)系22以樹狀圖形式顯示的GO詞匯之間的關(guān)系22Perspective3:Proteinlocalization23Perspective3:23proteinPerspective3:Proteinlocalization24proteinPerspective3:ProteinProteinlocalizationProteinsmaybelocalizedtointracellularcompartments,cytosol,theplasmamembrane,ortheymaybesecreted.Manyproteinsshuttlebetweenmultiplecompartments.Avarietyofalgorithmspredictlocalization,butthisisessentiallyacellbiologicalquestion.很多蛋白質(zhì)不能被單一地確定存在于細胞一個固定位置上。例如膜聯(lián)蛋白和小G蛋白家族就轉(zhuǎn)移于胞質(zhì)和膜之間(有時在胞質(zhì)內(nèi),有時在膜上)。這種轉(zhuǎn)移運動取決于是否有特定的細胞信號存在,例如鈣離子。25ProteinlocalizationProteinsmhttp://psort.nibb.ac.jp26http://psort.nibb.ac.jp26/software/TMPRED.form.html27/softw2828Localizationof2,900yeastproteinsMichaelSnyderandcolleaguesincorporatedepitopetagsintothousandsofS.cerevisiaecDNAs,andsystematicallylocalizedproteins(Kumaretal.,2002).Seeforadatabaseincluding2,900fluorescencemicrographs.29Localizationof2,900yeastprPerspective4:
ProteinfunctionFunctionreferstotheroleofaproteininthecell.Wecanconsiderproteinfunctionfromavarietyofperspectives.30Perspective4:Proteinfunctio1.Biochemicalfunction(molecularfunction)RBPbindsretinol,couldbeacarrier例子:酶結(jié)構(gòu)蛋白轉(zhuǎn)運蛋白細胞中不存在沒有任何功能的蛋白。311.BiochemicalfunctionRBPbin2.FunctionalassignmentbasedonhomologyRBPcouldbeacarriertooOthercarrierproteins增味劑結(jié)合蛋白是lipocalins的一個成員,也被認(rèn)為是一個載體蛋白322.FunctionalassignmentRBPOth3.FunctionbasedonstructureRBPformsacalyxX射線晶體衍射顯示RBP形成一個類似茶杯的結(jié)構(gòu),有一圈疏水氨基酸組成,充當(dāng)一個配體結(jié)合位點333.FunctionRBPformsacalyxX射4.FunctionbasedonligandbindingspecificityRBPbindsvitaminA344.FunctionbasedonRBPbinds5.FunctionbasedoncellularprocessDNARNARBPisabundant,soluble,secreted355.FunctionbasedonDNARNARBP6.FunctionbasedonbiologicalprocessRBPisessentialforvision366.FunctionbasedRBPisessent7.Functionbasedon“proteomics”orhighthroughput“functionalgenomics”Highthroughputanalysesshow...RBPlevelselevatedinrenalfailureRBPlevelsdecreasedinliverdisease377.Functionbasedon“proteomiFunctionalassignmentofenzymes:
theEC(EnzymeCommission)systemEC號類別描述酶的數(shù)目子類的例子1.-.-.-氧化還原酶10031.1.-.-——作用于CH-OH基團1.2.-.-——作用于醛類或氧絡(luò)集團2.-.-.-轉(zhuǎn)移酶10762.1.-.-——轉(zhuǎn)移—碳基團3.-.-.-水解酶11254.-.-.-裂解酶3565.-.-.-異構(gòu)酶1566.-.-.-連接酶12638FunctionalassignmentofenzymFunctionalassignmentofproteins:ClustersofOrthologousGroups(COGs)39FunctionalassignmentofproteProteomics:HighthroughputproteinanalysisProteomicsisthestudyoftheentirecollectionofproteinsencodedbyagenome“Proteomics”referstoalltheproteinsinacelland/oralltheproteinsinanorganism Large-scaleproteinanalysis 2Dproteingels Yeasttwo-hybrid RosettaStoneapproach……40Proteomics:HighthroughputprClassicalbiochemicalapproachIdentifyanactivityDevelopabioassayPerformabiochemicalpurification Strategies:size,charge,hydrophobicityPurifyproteintohomogeneityClonecDNA,expressrecombinantproteinGrowcrystals,solvestructure41Classicalbiochemicalapproach4242Two-dimensionalproteingelsFirstdimension:isoelectricfocusing
Seconddimension:SDS43Two-dimensionalproteingelsFi44444545464647474848Evaluationof2Dgels(IEF/SDS)Advantages: Visualizehundredstothousandsofproteins ImprovedidentificationofproteinspotsDisadvantages: Limitednumberofsamplescanbeprocessed Mostlyabundantproteinsvisualized Technicallydifficult49Evaluationof2Dgels(IEF/SDSAffinitychromatography/massspecBaitproteinGST50Affinitychromatography/masssAffinitychromatography/massspecBaitproteinGSTAddyeastextractProteincomplexesbindMostproteinsdonotbind51Affinitychromatography/masssAffinitychromatography/massspecBaitproteinGSTEluteRungelMALDI-TOFIdentifycomplexes52Affinitychromatography/masssAffinitychromatography/massspecDataoncomplexesdepositedindatabaseshttp://www.bind.ca53Affinitychromatography/masss54545555Theyeasttwo-hybridsystemReportergeneBaitproteinDNABindingPreyproteinDNAactivationIsolateandsequencethecDNAofthebindingpartneryouhavefoundWewilllearnaboutitlaterwhenwestudyproteininteractionnetworks56Theyeasttwo-hybridsystemRepred=cellularrole&subcellularlocalizationofinteractingproteinsareidentical;blue=localiationsareidentical;green=cellularrolesareidentical57red=cellularrole&subcelluTheRosettaStoneapproachMarcotteetal.(1999)andothergroupshypothesizedthatsomepairsofinteractingproteinsareencodedbytwogenesinmanygenomes,butoccasionallytheyarefusedintoasinglegene.Byscanningmanygenomesforexamplesof“fusedgenes,”severalthousandprotein-proteinpredictionshavebeenmade.58TheRosettaStoneapproachMarcYeasttopoisomeraseIIE.coligyraseBE.coligyraseATheRosettaStoneapproach59YeasttopoisomeraseIIE.coliE羅賽塔石碑60羅賽塔石碑60GeneFusion(Rosettastonemethod)G1:G2:E.coliYeasttrpAtrpBTryptophansynthasesubunitsAandB,fusedinyeast.Itisbasedontheobservationthatsomeinteractingproteins/domainshavehomologsinothergenomesthatarefusedintooneproteinchain,aso-calledRosettaStoneprotein.61GeneFusion(RosettastonemetHowmany“genefusions”?3genomes88genefusions179genomes?fusionsMarcotteE.coli:6809Yeast:4550262Howmany“genefusions”?3genoprotein[1]Molecularbiology[4]Proteinfunction[2]Proteinfamilies[3]ProteinlocalizationGeneontology(GO):--cellularcomponent--biologicalprocess--molecularfunction63protein[1]Molecularbiology[4Perspective2:
Proteinfamily,domainsandmotifs為什么關(guān)注蛋白質(zhì)家族?64Perspective2:
Proteinfamil基因重復(fù)65基因重復(fù)65蛋白質(zhì)同源序列和家族在目前所有已知的數(shù)據(jù)庫中均沒有發(fā)現(xiàn)同源序列的蛋白質(zhì)。
它的其他性質(zhì)(如跨膜區(qū)結(jié)構(gòu)域、磷酸化位點、預(yù)測出的二級結(jié)構(gòu)等)也會給我們了解該蛋白質(zhì)的結(jié)構(gòu)或功能提供一些線索。
有直系同源序列或旁系同源序列的蛋白質(zhì)。
這種蛋白質(zhì)至少能找到一條同源序列,且兩條序列存在具有顯著相似性或顯著特征的區(qū)域。這些有顯著序列相似性或顯著結(jié)構(gòu)特征的區(qū)域有很多名稱,如簽名(signature)、結(jié)構(gòu)域(domain)、模塊(module)、模塊元件(modularelement)、折疊子(fold)、模體(motif)、模式(pattern)或重復(fù)(repeat)。66蛋白質(zhì)同源序列和家族在目前所有已知的數(shù)據(jù)庫中均沒有發(fā)現(xiàn)同源序DefinitionsSignature:aproteincategorysuchasadomainormotifDomain:aregionofaproteinthatcanadopta3Dstructureafoldafamilyisagroupofproteinsthatshareadomainexamples: zincfingerdomain immunoglobulindomainMotif(orfingerprint):ashort,conservedregionofaproteintypically10to20contiguousaminoacidresidues67DefinitionsSignature:67簽名(signature)簽名(signatures)的概念很寬廣,它確定一個蛋白質(zhì)分類,可能指結(jié)構(gòu)域(domain)、家族(family)或模體(motif)。僅考慮單獨的一個蛋白質(zhì)時,我們僅能得到很少一部分關(guān)于其結(jié)構(gòu)和功能的信息;但是將它與相關(guān)序列比對找到保守部分后,從保守序列中可以推測出很多信息。簽名主要可以分為兩類,每一類簽名都可以用各自的方法確定。結(jié)構(gòu)域(domain)是蛋白質(zhì)中能折疊成特定三維結(jié)構(gòu)的一段區(qū)域。結(jié)構(gòu)域也能被稱為模塊。一組擁有相同結(jié)構(gòu)域的蛋白被稱為一個蛋白質(zhì)家族。模體(motif,或稱指紋,fingerprint)是蛋白質(zhì)序列中較短的保守區(qū)域。模體的長度一般是10—20個氨基酸殘基,盡管實際中的模體有可能更長或更短。一些簡單而常見的模體在一組蛋白質(zhì)中發(fā)現(xiàn)并不意味著這組蛋白質(zhì)是同源的,例如形成跨膜區(qū)結(jié)構(gòu)域或保守磷酸化位點的模體。而另一些情況中,小的模體則是一個蛋白質(zhì)家族的標(biāo)志(如prosite)。68簽名(signature)簽名(signatures)的概念I(lǐng)nterPro對相關(guān)術(shù)語的定義
家族:InterPro定義一組進化上相關(guān)的共享一個或多個結(jié)構(gòu)域的蛋白質(zhì)為一個家族結(jié)構(gòu)域:InterPro數(shù)據(jù)庫中的結(jié)構(gòu)域是指一個獨立的結(jié)構(gòu)單元,他們可能單獨存在也可能與其他結(jié)構(gòu)域相連。結(jié)構(gòu)域也是進化上相關(guān)的序列。69InterPro對相關(guān)術(shù)語的定義家族:InterPro定義SMART對相關(guān)術(shù)語的定義
結(jié)構(gòu)域:保守的結(jié)構(gòu)單元,包含獨特的二級結(jié)構(gòu)組合和疏水內(nèi)核。具有相同功能的同源結(jié)構(gòu)域往往具有序列上的相似性。模體:序列模體是指短的保守的多肽段。含有相同模體的蛋白質(zhì)并不一定是同源的。70SMART對相關(guān)術(shù)語的定義結(jié)構(gòu)域:保守的結(jié)構(gòu)單元,包含獨特結(jié)構(gòu)域和motif血清蛋白(581氨基酸):3個類似結(jié)構(gòu)域,每個約180個氨基酸膠原蛋白中存在著幾十個有GXY三肽組成的重復(fù)片段RNA聚合酶最大亞基C端結(jié)構(gòu)域中有52個重復(fù)的六肽片段:[T/S]PTSP[N/T].PrP(瘋牛病):有四個連續(xù)對八肽:PHGG[G/S]WGQ許多細胞內(nèi)信號轉(zhuǎn)導(dǎo)的蛋白質(zhì)含有SH2肽段(與磷酸化絲氨酸/蘇氨酸結(jié)合的肽段)71結(jié)構(gòu)域和motif血清蛋白(581氨基酸):3個類似結(jié)構(gòu)域,DefinitionofamotifAmotif(orfingerprint)isashort,conservedregionofaprotein.Itssizeisoften10to20aminoacids.Simplemotifsincludetransmembranedomainsandphosphorylationsites.Thesedonotimplyhomologywhenfoundinagroupofproteins.PROSITE(/prosite)isadictionaryofmotifs.InPROSITE,apatternisaqualitativemotifdescription(aproteineithermatchesapattern,ornot).Incontrast,aprofileisaquantitativemotifdescription.WewillencounterprofilesinPfam,ProDom,SMART,andotherdatabases.72DefinitionofamotifAmotif(蛋白質(zhì)motif~~~~~EIQDVSGTWYAMTVDREFPEMNLESVTPMTLTTL.GGNLEAKVTMlipocalin1LSFTLEEEDITGTWYAMVVDKDFPEDRRRKVSPVKVTALGGGNLEATFTFodorant-bindingprotein2aTKQDLELPKLAGTWHSMAMATNNISLMATLKAPLRVHITSEDNLEIVLHRprogestagen-assoc.endo.VQENFDVNKYLGRWYEIEKIPTTFENGRCIQANYSLMENGNQELRADGTVapolipoproteinDVKENFDKARFSGTWYAMAKDPEGLFLQDNIVAEFSVDETGNWDVCADGTFretinol-bindingproteinLQQNFQDNQFQGKWYVVGLAGNAI.LREDKDPQKMYATIDKSYNVTSVLFneutrophilgelatinase-ass.VQPNFQQDKFLGRWFSAGLASNSSWLREKKAALSMCKSVDGGLNLTSTFLprostaglandinD2synthaseVQENFNISRIYGKWYNLAIGSTCPWMDRMTVSTLVLGEGEAEISMTSTRWalpha-1-microglobulinPKANFDAQQFAGTWLLVAVGSACRFLQRAEATTLHVAPQGSTFRKLD...complementcomponent873蛋白質(zhì)motif~~~~~EIQDVSGTWYAMTVDRE例子在HIV-1pol蛋白的天冬氨酸蛋白酶(aspartylproteases)結(jié)構(gòu)域中,天冬氨酸殘基(asp)對酶的催化活性至關(guān)重要。天冬氨酸蛋白酶模體由12個氨基酸殘基構(gòu)成:
[LIVMFGAC]-[LIVMTADN]-[LIVFSA]-D-[ST]-G-[STAV]-[STAPDENQ]-x-[LIVMFSTNC]-x-[LIVMFGTA]。幾乎所有的lipocalins中都可以找到一個短的模體GxW。PROSITE數(shù)據(jù)庫定義的lipocalins的保守氨基酸模體是:
[DENG]-x-[DENQGSTARK]-x(0,2)-[DENQARK]-[LIVFY]-{CP}-G-{C}-W-[FYWLRH]-x-[LIVMTA]。74例子在HIV-1pol蛋白的天冬氨酸蛋白酶(asparty模體氨基酸殘基修飾的模體蛋白質(zhì)細胞定位的模體與活性有關(guān)的模體其他模體75模體氨基酸殘基修飾的模體75氨基酸殘基修飾的模體糖蛋白中被N糖基化的天冬酰胺(N)一定是處于N{P}[S/T]中的。在一些與凝血過程相關(guān)的蛋白質(zhì)中,被羥化的天冬氨酸或天冬酰胺處于CX[D/N]X4@XCXC的模體中。@為芳香性氨基酸,X4為任意氨基酸構(gòu)成的四肽。被磷酸化的絲氨酸和蘇氨酸在不同蛋白質(zhì)中處于不同的模體中。組蛋白中為SP##(#為帶正電的氨基酸)。蛋白激酶PKA或PKG中的模體是##X[S/T]。76氨基酸殘基修飾的模體糖蛋白中被N糖基化的天冬酰胺(N)一定是當(dāng)C端的4個氨基酸序列為KDEL或HDEL時,蛋白質(zhì)就被局限在細胞的內(nèi)質(zhì)網(wǎng)中能進入細胞核的肽鏈都有特定的序列模體。1.PKKKRKVorKRX10KKKK;2.蛋白激酶中,KRX21RXKXKXK;3.#RX10#XX。蛋白質(zhì)細胞定位的模體77當(dāng)C端的4個氨基酸序列為KDEL或HDEL時,蛋白質(zhì)就被局限Motif與細胞定位78Motif與細胞定位78與活性有關(guān)的模體在許多蛋白水解酶中,與催化有關(guān)的活性中心由D/E-H-S組成。在ATP和GTP結(jié)合蛋白質(zhì)中存在著一種序列為GXXXXGK[T/S]的模體:
Rho家族GDGAXGKTATP合成酶GGAGVGKTV
肌球蛋白重鏈GESGSGKT
胸苷激酶GXXGXGKTT
胸苷酸激酶GXPGXGKGT這個模體可以形成一個特定的結(jié)構(gòu),與核苷酸結(jié)合。79與活性有關(guān)的模體在許多蛋白水解酶中,與催化有關(guān)的活性中心由D其他模體含有半胱氨酸的模體。在一些蛋白質(zhì)中存在著特定的序列模體,其中半胱氨酸的位置是相對固定的(鋅指)。未知功能的模體。如一些細胞因子受體的膜外側(cè)接近膜處有WKS和WSKWS序列模體,但其功能還不清楚。80其他模體含有半胱氨酸的模體。在一些蛋白質(zhì)中存在著特定的序列模模體的意義總結(jié):模體(
motiforfingerprint)
是蛋白質(zhì)序列中較短的保守區(qū)域,是按照一定的模式排列的氨基酸殘基,長度一般在10~20殘基之間。一些簡單而常見的模體在一組蛋白質(zhì)中發(fā)現(xiàn)并不意味著這組蛋白質(zhì)是同源的(跨膜區(qū)結(jié)構(gòu)域或磷酸化位點)。在另一些情況下,模體可以成為一個蛋白質(zhì)家族的標(biāo)志,反映了這個家族的親緣關(guān)系??梢岳眠@個族徽尋找宗親。(載脂蛋白超家族)1986年至今,國際生物化學(xué)學(xué)會主編的《TrendsinBiochemicalScience》一直有專欄刊登不同類型的的序列模體(也同時刊登結(jié)構(gòu)域、模塊等)。81模體的意義總結(jié):模體(motiforfingerpri結(jié)構(gòu)域和模體:蛋白質(zhì)的模塊性質(zhì)82結(jié)構(gòu)域和模體:蛋白質(zhì)的模塊性質(zhì)82結(jié)構(gòu)域的由來從球狀蛋白到晶體衍射實驗。(溶菌酶)免疫球蛋白的例子蛋白質(zhì)的折疊過程20世紀(jì)60~70年代,提出結(jié)構(gòu)域(domain)的概念。從水解實驗,可以看出結(jié)構(gòu)域能組成一個結(jié)構(gòu)單元。結(jié)構(gòu)域常由不同的外顯子編碼。83結(jié)構(gòu)域的由來從球狀蛋白到晶體衍射實驗。(溶菌酶)83DefinitionofadomainAccordingtoInterProatEBI(http://www.ebi.ac.uk/interpro/):Adomainisanindependentstructuralunit,foundaloneorinconjunctionwithotherdomainsorrepeats.Domainsareevolutionarilyrelated.AccordingtoSMART(http://smart.embl-heidelberg.de):Adomainisaconservedstructuralentitywithdistinctivesecondarystructurecontentandahydrophobiccore.Homologousdomainswithcommonfunctionsusuallyshowsequencesimilarities.84DefinitionofadomainAccordin總結(jié)結(jié)構(gòu)域的概念:從最初的一級結(jié)構(gòu)中較長的重復(fù)片段,上升為有特征的立體結(jié)構(gòu),而且他們有一定生物功能,并且對應(yīng)著基因中的某些外顯子,為它們編碼、形成肽鏈后,還能自行折疊成穩(wěn)定的結(jié)構(gòu)??傊Y(jié)構(gòu)域可看作是一個“entity”。一般來說,如果兩個蛋白質(zhì)擁有一個相同的結(jié)構(gòu)域,那么這兩個蛋白質(zhì)有相關(guān)的功能。序列模體是一個序列上經(jīng)概括后“求同存異”的“框架”,是在一段肽段中關(guān)鍵位置上氨基酸殘基的組合模式。二者的區(qū)別在于結(jié)構(gòu)域有“結(jié)構(gòu)”的含義。85總結(jié)結(jié)構(gòu)域的概念:從最初的一級結(jié)構(gòu)中較長的重復(fù)片段,上升為有人類中15個最常見的結(jié)構(gòu)域86人類中15個最常見的結(jié)構(gòu)域86蛋白質(zhì)共享一個結(jié)構(gòu)域ExtendingalongthelengthofaproteinOccupyingasubsetofaproteinsequenceOccurringoneormoretimeslipocalin免疫球蛋白結(jié)構(gòu)域纖連蛋白重復(fù)區(qū)
與甲基化的DNA結(jié)合的轉(zhuǎn)錄因子家族87蛋白質(zhì)共享一個結(jié)構(gòu)域ExtendingalongtheExampleofaproteinwithdomains:MethylCpGbindingprotein2(MeCP2)MBDTRDTheproteinincludesamethylatedDNAbindingdomain(MBD)andatranscriptionalrepressiondomain(TRD).MeCP2isatranscriptionalrepressor.MutationsinthegeneencodingMeCP2causeRettSyndrome,aneurologicaldisorderaffectinggirlsprimarily.88ExampleofaproteinwithdomaResultofanMeCP2blastpsearch:Amethyl-bindingdomainsharedbyseveralproteins89ResultofanMeCP2blastpsear這些蛋白質(zhì)的大小差別很大,并且結(jié)合甲基化DNA的結(jié)構(gòu)域也出現(xiàn)在蛋白質(zhì)的不同位置上。從BLAST的匹配結(jié)果看,這些蛋白質(zhì)除了甲基化DNA結(jié)構(gòu)域以外沒有其他序列上有顯著相似性的區(qū)域了
90這些蛋白質(zhì)的大小差別很大,并且結(jié)合甲基化DNA的結(jié)構(gòu)域也出現(xiàn)多個拷貝的結(jié)構(gòu)域Occurringoneormoretimes很多結(jié)構(gòu)域在蛋白質(zhì)中有多個拷貝,兩個最常見的例子就是免疫球蛋白結(jié)構(gòu)域和纖連蛋白重復(fù)區(qū)。這些結(jié)構(gòu)域在蛋白質(zhì)的胞外區(qū)極其常見91多個拷貝的結(jié)構(gòu)域OccurringoneormoreAreproteinsthatshareonlyadomainhomologous?蛋白質(zhì)家族是怎么定義的呢?是否一組僅共有一個結(jié)構(gòu)域的同源蛋白質(zhì)就可以被稱為一個蛋白質(zhì)家族呢?上面的例子中,5個蛋白中的MBD結(jié)構(gòu)域顯然是同源的(來自于同一祖先);雖然它們除了MBD結(jié)構(gòu)域外沒有顯著相似的區(qū)域,但是這組蛋白仍舊構(gòu)成一個蛋白質(zhì)家族。
92Areproteinsthatshareonlya蛋白質(zhì)家族蛋白質(zhì)家族是根據(jù)蛋白質(zhì)的同源性來定義的;同一個家族內(nèi)的蛋白質(zhì)就是一組進化上相關(guān)的蛋白質(zhì),這些蛋白質(zhì)共享一個或多個結(jié)構(gòu)域。什么邏輯?1.在一級結(jié)構(gòu)比較的基礎(chǔ)上,發(fā)現(xiàn)很多蛋白質(zhì)存在同源性;2.(相似性往往是區(qū)域性的)一些同源性可以簡單的用結(jié)構(gòu)域加以表征;3.為了(計算機分類)方便,由結(jié)構(gòu)域?qū)⑾嚓P(guān)的蛋白質(zhì)歸屬為一個蛋白質(zhì)家族。在蛋白質(zhì)家族分類的過程中,有時向下細分為亞家族(subfamily),有時又向上歸并為超家族(superfamily)93蛋白質(zhì)家族蛋白質(zhì)家族是根據(jù)蛋白質(zhì)的同源性來定義的;同一個家族Challengesfor“家族分類”并系同源蛋白:
類視紫紅質(zhì)受體超家族:視覺、聽覺、嗅覺、激素、神經(jīng)傳導(dǎo)的受體
脊椎動物進化過程早期分化而得到的不同視覺受體對不同的波長敏感人類視覺系統(tǒng)受體包括對紅光和綠光等長波敏感的各種蛋白質(zhì)分子,它們之間區(qū)別不大,其序列相似性程度為95%左右。這些視覺系統(tǒng)長波受體分子與藍光等短波受體分子以及視紫紅質(zhì)等非色彩受體分子卻相差很遠,序列平均相似性為43%??梢姡煞N類繁多的并系同源蛋白和直系同源蛋白所產(chǎn)生的序列復(fù)雜性,對蛋白質(zhì)家族分類研究是一個巨大的挑戰(zhàn)。
94Challengesfor“家族分類”并系同源蛋白:94兩個“家族”牛胰核糖核酸酶家族。絲氨酸蛋白抑制劑家族。95兩個“家族”牛胰核糖核酸酶家族。95Exampleofamultidomainprotein:HIV-1pol1003aminoacidslongcleavedintothreeproteinswithdistinctactivities:--aspartylprotease(天冬氨酸蛋白酶
)--reversetranscriptase(反轉(zhuǎn)錄酶
)--integrase(整合酶
)WewillexploreHIV-1polandotherproteinsattheExpertProteinAnalysisSystem(ExPASy)server.Visit/HIV-1的pol(polymerase,聚合酶)96Exampleofamultidomainprote97979898SwissProtentryforHIV-1pollinkstomanydatabases99SwissProtentryforHIV-1polProDomentryforHIV-1polshowsmanyrelatedproteins100ProDomentryforHIV-1polshoProteinscanhavebothdomainsandpatterns(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- LS/T 1105-2024全谷物分類與標(biāo)示要求
- 2025-2030年中國空調(diào)行業(yè)并購重組擴張戰(zhàn)略制定與實施研究報告
- 2025-2030年中國智能監(jiān)控系列芯片行業(yè)資本規(guī)劃與股權(quán)融資戰(zhàn)略制定與實施研究報告
- 2025-2030年中國晶圓制造行業(yè)開拓第二增長曲線戰(zhàn)略制定與實施研究報告
- 2025-2030年中國光纖激光器行業(yè)并購重組擴張戰(zhàn)略制定與實施研究報告
- 2025-2030年中國地理信息行業(yè)商業(yè)模式創(chuàng)新戰(zhàn)略制定與實施研究報告
- 新形勢下虛擬養(yǎng)老院行業(yè)可持續(xù)發(fā)展戰(zhàn)略制定與實施研究報告
- 2025-2030年中國團餐行業(yè)商業(yè)模式創(chuàng)新戰(zhàn)略制定與實施研究報告
- 建設(shè)項目環(huán)境影響評價技術(shù)咨詢合同
- 自動打鈴控制器-PLC控制系統(tǒng)課程設(shè)計
- QCT1067.5-2023汽車電線束和電器設(shè)備用連接器第5部分:設(shè)備連接器(插座)的型式和尺寸
- (完整版)儀表選型
- T-CCAA 39-2022碳管理體系 要求
- 成人霧化吸入護理團體標(biāo)準(zhǔn)解讀
- 油氣回收相關(guān)理論知識考試試題及答案
- 2024-2030年中國氣槍行業(yè)市場深度分析及發(fā)展前景預(yù)測報告
- 數(shù)字化技術(shù)在促進幼兒語言發(fā)展中的應(yīng)用
- 江西省上饒市2023-2024學(xué)年高一上學(xué)期期末教學(xué)質(zhì)量測試物理試題(解析版)
- 學(xué)生(幼兒)上學(xué)放學(xué)交通方式情況登記表
- 提高感染性休克集束化治療達標(biāo)率
- 電動自行車換電柜規(guī)劃方案
評論
0/150
提交評論