蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第1頁(yè)
蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第2頁(yè)
蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第3頁(yè)
蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第4頁(yè)
蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第5頁(yè)
已閱讀5頁(yè),還剩142頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

學(xué)習(xí)提綱

重點(diǎn)

蛋白質(zhì)的分離與鑒定方法、蛋白質(zhì)芯片分析技術(shù)以及酵母雙雜交技術(shù)。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法及其軟件、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法及其軟件?,F(xiàn)在是1頁(yè)\一共有147頁(yè)\編輯于星期五

難點(diǎn)

蛋白質(zhì)二級(jí)結(jié)構(gòu)和三維結(jié)構(gòu)算法以及軟件的使用。蛋白質(zhì)功能預(yù)測(cè)方法及其軟件的使用。蛋白質(zhì)與疾病發(fā)生。常用的蛋白質(zhì)組學(xué)數(shù)據(jù)庫(kù)。

熟悉現(xiàn)在是2頁(yè)\一共有147頁(yè)\編輯于星期五第一節(jié)引言Section1Introduction現(xiàn)在是3頁(yè)\一共有147頁(yè)\編輯于星期五隨著人類基因組及諸多物種基因組計(jì)劃的完成,生命科學(xué)研究已經(jīng)進(jìn)入以基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等“組學(xué)”為研究標(biāo)志的后基因組時(shí)代(post-genomicera)。在后基因組時(shí)代,蛋白質(zhì)組學(xué)研究越來(lái)越受到關(guān)注和重視?,F(xiàn)在是4頁(yè)\一共有147頁(yè)\編輯于星期五蛋白質(zhì)組(proteome):指由一個(gè)基因組(genome),或一個(gè)細(xì)胞、組織表達(dá)的所有蛋白質(zhì)(protein)。蛋白質(zhì)組學(xué)(proteomics):蛋白質(zhì)組學(xué)是采用大規(guī)模、高通量、系統(tǒng)化的方法,研究某一類型細(xì)胞、組織或體液中的所有蛋白質(zhì)組成、功能及其蛋白之間相互作用的學(xué)科。根據(jù)不同研究目的和手段,蛋白質(zhì)組學(xué)分為表達(dá)蛋白質(zhì)組學(xué)、結(jié)構(gòu)蛋白質(zhì)組學(xué)和功能蛋白質(zhì)組學(xué)?,F(xiàn)在是5頁(yè)\一共有147頁(yè)\編輯于星期五①表達(dá)蛋白質(zhì)組學(xué):主要采用經(jīng)典蛋白質(zhì)組學(xué)技術(shù)如雙向凝膠電泳和圖像分析技術(shù),開(kāi)展細(xì)胞內(nèi)蛋白樣品表達(dá)的定量研究;②結(jié)構(gòu)蛋白質(zhì)組學(xué):以繪制出蛋白復(fù)合物結(jié)構(gòu)或存在于一個(gè)特殊的細(xì)胞器中的蛋白為研究目標(biāo)的蛋白質(zhì)組學(xué),主要用于建立細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)圖譜并解釋某些特定蛋白表達(dá)對(duì)細(xì)胞產(chǎn)生的特定作用;現(xiàn)在是6頁(yè)\一共有147頁(yè)\編輯于星期五③功能蛋白質(zhì)組學(xué):以細(xì)胞在某一特定時(shí)間所表達(dá)或與某個(gè)功能相關(guān)的蛋白質(zhì)集合為研究對(duì)象進(jìn)行研究和描述,能夠提供有關(guān)蛋白糖基化、磷酸化,蛋白信號(hào)轉(zhuǎn)導(dǎo)通路,疾病機(jī)制或蛋白-藥物之間相互作用的重要信息?,F(xiàn)在是7頁(yè)\一共有147頁(yè)\編輯于星期五第二節(jié)蛋白質(zhì)組數(shù)據(jù)的獲取與分析Section2ProteomicsDataAcquisitionandAnalysis現(xiàn)在是8頁(yè)\一共有147頁(yè)\編輯于星期五一、二維凝膠電泳分析技術(shù)2-DE:是將樣品進(jìn)行電泳后在它的直角方向再進(jìn)行一次電泳,又稱雙向電泳。第一向:等電聚焦(isoelectricfocusing,IEF),蛋白質(zhì)沿pH梯度分離至各自的等電點(diǎn)。第二向:是十二磺酸鈉-聚丙烯酰胺凝膠電泳(SDS),蛋白質(zhì)進(jìn)行分子量的分離。(一)定義及特點(diǎn)現(xiàn)在是9頁(yè)\一共有147頁(yè)\編輯于星期五樣品經(jīng)過(guò)電荷和質(zhì)量?jī)纱畏蛛x后,可獲得樣品分子等電點(diǎn)(isoelectricpoint,pI)和分子量(molecularweight,MW)等信息。分離的結(jié)果不是獲得蛋白條帶,而是蛋白斑點(diǎn)。這是迄今分辨率最高、信息最多的蛋白電泳技術(shù)。目前使用廣泛的2-DE蛋白分離的方法為固相pH梯度-SDS雙向凝膠電泳?,F(xiàn)在是10頁(yè)\一共有147頁(yè)\編輯于星期五1.樣品制備目的是從成分復(fù)雜的細(xì)胞、組織等材料中取得純度高的完整蛋白質(zhì)組分。(二)固相pH梯度-SDS雙向凝膠電泳

(IPG-DALT電泳)操作原理及技術(shù)流程現(xiàn)在是11頁(yè)\一共有147頁(yè)\編輯于星期五2.蛋白質(zhì)定量BCA法、Bradford法及UV280法等,但由于這些定量方法都基于吸光度測(cè)定,而樣品溶液中往往含有高濃度尿素等溶劑可能影響吸光度的準(zhǔn)確測(cè)定,故推薦使用雙向電泳蛋白質(zhì)定量專用試劑盒進(jìn)行檢測(cè)?,F(xiàn)在是12頁(yè)\一共有147頁(yè)\編輯于星期五3.一向電泳一向電泳等電聚焦(isoelectricfocusing,IEF),是根據(jù)蛋白質(zhì)pI值不同,在電場(chǎng)力的作用下將其分離。現(xiàn)在是13頁(yè)\一共有147頁(yè)\編輯于星期五4.一向膠條的平衡進(jìn)行第二向電泳前,需要對(duì)IPG膠條進(jìn)行平衡(equilibration),平衡過(guò)程是將IPG膠條浸沒(méi)在第二向電泳所必需的SDS緩沖體系中,以便被分離蛋白質(zhì)與SDS完全結(jié)合并順利轉(zhuǎn)移入二向電泳的凝膠中。平衡后應(yīng)立即進(jìn)行第二向電泳?,F(xiàn)在是14頁(yè)\一共有147頁(yè)\編輯于星期五5.二向電泳即十二烷基磺酸鈉-聚丙烯酰胺凝膠電泳,是根據(jù)分子量大小各異的蛋白質(zhì)在電場(chǎng)中的泳動(dòng)速率不同的原理而分離蛋白質(zhì)的方法?,F(xiàn)在是15頁(yè)\一共有147頁(yè)\編輯于星期五6.凝膠檢測(cè)適用于SDS凝膠中蛋白質(zhì)檢測(cè)的方法都可用于雙向電泳凝膠檢測(cè)。銀染和考馬斯亮藍(lán)(R250、G250)染色,是蛋白質(zhì)組研究中最為廣泛使用的兩種染色方法?,F(xiàn)在是16頁(yè)\一共有147頁(yè)\編輯于星期五質(zhì)譜(massspectrometry,MS)是按照物質(zhì)的質(zhì)量與電荷的比值(質(zhì)荷比,mass-to-chargeratio,m/z)順序排列成的圖譜。質(zhì)譜分析法是按照離子的質(zhì)荷比大小對(duì)離子進(jìn)行分離和測(cè)定,從而對(duì)樣品進(jìn)行定性和定量分析的一種方法。二、蛋白質(zhì)組質(zhì)譜分析技術(shù)現(xiàn)在是17頁(yè)\一共有147頁(yè)\編輯于星期五質(zhì)譜儀(massspectrometer)是利用電磁學(xué)原理使離子按照質(zhì)荷比進(jìn)行分離,從而測(cè)定物質(zhì)的質(zhì)量與含量的科學(xué)實(shí)驗(yàn)儀器。(一)質(zhì)譜儀現(xiàn)在是18頁(yè)\一共有147頁(yè)\編輯于星期五1.基質(zhì)輔助激光解吸/電離(matrixassistedlaserdesorption/ionization,MALDI)利用激光脈沖將與基質(zhì)結(jié)晶混合的蛋白質(zhì)樣品升華并電離出來(lái)。2.電噴霧(electrpsprayionization,ESI)將分析物從溶液中電離出來(lái),可以方便地與液相色譜(liquid-chromatography,LC)聯(lián)用?,F(xiàn)在是19頁(yè)\一共有147頁(yè)\編輯于星期五1.分子量測(cè)定2.肽譜測(cè)定生物質(zhì)譜通過(guò)與特異性蛋白酶解相結(jié)合,可測(cè)定肽質(zhì)量指紋圖(peptidemassfingerprint,PMF),并獲得全部肽段的準(zhǔn)確分子量,結(jié)合蛋白質(zhì)數(shù)據(jù)庫(kù)檢索就可實(shí)現(xiàn)蛋白質(zhì)的快速鑒別和高通量篩選。(二)質(zhì)譜的應(yīng)用現(xiàn)在是20頁(yè)\一共有147頁(yè)\編輯于星期五3.肽序列測(cè)定串聯(lián)質(zhì)譜技術(shù)可直接用于肽段的測(cè)序,從一級(jí)質(zhì)譜產(chǎn)生的肽段中選擇母離子進(jìn)入二級(jí)質(zhì)譜,經(jīng)惰性氣體碰撞后,肽段沿肽鏈斷裂,由所得各肽段質(zhì)量數(shù)差值推定肽段序列,并用于數(shù)據(jù)庫(kù)查尋,稱為肽序列標(biāo)簽技術(shù)(peptidesequencetag,PST),目前廣泛應(yīng)用于蛋白質(zhì)組大規(guī)模篩選?,F(xiàn)在是21頁(yè)\一共有147頁(yè)\編輯于星期五4.巰基和二硫鍵定位利用生物質(zhì)譜的準(zhǔn)確分子量測(cè)定特性,同時(shí)結(jié)合碘乙酰胺、4-乙烯吡啶等化學(xué)試劑對(duì)蛋白質(zhì)進(jìn)行烷基化和還原烷基化以及蛋白質(zhì)酶切、肽譜技術(shù)等,可實(shí)現(xiàn)對(duì)二硫鍵和自由巰基的快速定位。現(xiàn)在是22頁(yè)\一共有147頁(yè)\編輯于星期五5.蛋白質(zhì)翻譯后修飾如用MALDI-TOF-MS對(duì)雙向電泳分離蛋白質(zhì)磷酸化位點(diǎn)進(jìn)行定位、MALDI-TOF-MS結(jié)合不同酶解方式確定糖基化位點(diǎn)等?,F(xiàn)在是23頁(yè)\一共有147頁(yè)\編輯于星期五1.MALDI-TOF質(zhì)譜測(cè)定肽質(zhì)量指紋圖將質(zhì)譜分析獲得的肽段分子質(zhì)量與蛋白質(zhì)數(shù)據(jù)庫(kù)中理論肽段的分子質(zhì)量進(jìn)行比較,通過(guò)軟件分析可獲得蛋白質(zhì)信息,根據(jù)匹配情況判斷出所鑒定分析的蛋白質(zhì)是已知的還是未知的。(三)基質(zhì)輔助激光解吸電離飛行時(shí)間質(zhì)譜(MALDI-TOF-MS)分析技術(shù)現(xiàn)在是24頁(yè)\一共有147頁(yè)\編輯于星期五2.MALDI-TOF質(zhì)譜技術(shù)用于蛋白質(zhì)C-端序列分析在質(zhì)譜儀內(nèi),應(yīng)用源后衰變(post-sourcedecay,PSD)和碰撞誘導(dǎo)解離(collision-induceddissociation,CID)可產(chǎn)生包含有僅異于一個(gè)氨基酸殘基質(zhì)量的一系列肽峰質(zhì)譜。此外,用酶或化學(xué)方法從N-或C-末端按順序除去不同數(shù)目氨基酸,亦可形成大小不同的一系列梯形肽片段,所得的一定數(shù)目肽質(zhì)量由MALDI-TOF-MS測(cè)量?,F(xiàn)在是25頁(yè)\一共有147頁(yè)\編輯于星期五1.電噴霧電離質(zhì)譜測(cè)定蛋白質(zhì)和多肽分子質(zhì)量蛋白質(zhì)和多肽分子經(jīng)電噴霧電離時(shí),會(huì)吸附一個(gè)或多個(gè)質(zhì)子,形成一系列帶電荷狀態(tài)不同的分子離子,在質(zhì)譜中形成荷質(zhì)比不同的譜峰。一般可根據(jù)譜峰的同位素離子峰分布情況以及利用相鄰兩峰的荷質(zhì)比和電荷數(shù)關(guān)系計(jì)算求得離子分子質(zhì)量。(四)電噴霧質(zhì)譜分析現(xiàn)在是26頁(yè)\一共有147頁(yè)\編輯于星期五2.液相色譜-電噴霧質(zhì)譜法鑒定雙向凝膠電泳蛋白質(zhì)對(duì)雙向凝膠電泳分離的蛋白質(zhì)點(diǎn)經(jīng)酶解后的多肽混合物進(jìn)行液相色譜-電噴霧質(zhì)譜聯(lián)用(LC-ESIMS)鑒定分析,同樣可以得到PMF?,F(xiàn)在是27頁(yè)\一共有147頁(yè)\編輯于星期五串聯(lián)質(zhì)譜的使用能夠?qū)赑MF的結(jié)果進(jìn)行再分析或?qū)ξ促x值的質(zhì)譜峰信號(hào)進(jìn)行研究。對(duì)于初始用PMF法鑒定的蛋白,可選擇其中部分肽段峰進(jìn)行MS/MS分析,得到肽段的序列。(五)串聯(lián)質(zhì)譜(MS/MS)現(xiàn)在是28頁(yè)\一共有147頁(yè)\編輯于星期五三、蛋白質(zhì)芯片分析技術(shù)蛋白質(zhì)芯片(proteinchips)技術(shù)又稱蛋白質(zhì)微陣列(proteinmicroarrays),是一種高通量的、小型化的、平行性的生物檢測(cè)技術(shù)。現(xiàn)在是29頁(yè)\一共有147頁(yè)\編輯于星期五原理蛋白質(zhì)芯片是將已知蛋白點(diǎn)印在固定于不同種類支持介質(zhì)上,制成由高密度蛋白質(zhì)或多肽分子微陣列組成的蛋白微陣列,陣列中固定分子的位置及組成已知,未經(jīng)標(biāo)記或標(biāo)記(熒光物質(zhì)、酶或化學(xué)發(fā)光物質(zhì))的生物分子與芯片上探針?lè)磻?yīng),通過(guò)掃描裝置如激光掃描系統(tǒng)(laserscannerbasessystem)或電荷偶聯(lián)照像系統(tǒng)(chargecoupleddevice-camera,CCD-camera)檢測(cè)信號(hào)強(qiáng)度,量化分析雜交結(jié)果,檢測(cè)蛋白質(zhì)?,F(xiàn)在是30頁(yè)\一共有147頁(yè)\編輯于星期五蛋白質(zhì)芯片具有以下特點(diǎn)①特異性強(qiáng);②敏感性高;③高通量;④重復(fù)性好;⑤應(yīng)用性強(qiáng);⑥適用范圍廣?,F(xiàn)在是31頁(yè)\一共有147頁(yè)\編輯于星期五分類根據(jù)功能:功能研究型芯片(functionalproteinmicroarrays)和分析檢測(cè)型芯片(analyticalproteinmicroarrays)?,F(xiàn)在是32頁(yè)\一共有147頁(yè)\編輯于星期五根據(jù)蛋白質(zhì)種類:抗體芯片和抗原芯片。根據(jù)芯片表面化學(xué)成分:化學(xué)表面芯片和生物表面芯片。根據(jù)點(diǎn)樣蛋白質(zhì)活性功能:無(wú)活性芯片和有活性芯片?,F(xiàn)在是33頁(yè)\一共有147頁(yè)\編輯于星期五根據(jù)載體:普通玻璃載體芯片(plain-glassslide)、多孔凝膠覆蓋芯片(porousgelpadchip)及微孔芯片(microwellchip)等?,F(xiàn)在是34頁(yè)\一共有147頁(yè)\編輯于星期五待測(cè)樣品準(zhǔn)備反應(yīng)過(guò)程:待蛋白質(zhì)芯片與被測(cè)樣品溶液在適宜溫度下孵育一定時(shí)間后用PBST洗去未反應(yīng)分子,再根據(jù)不同標(biāo)記物直接檢測(cè)(如熒光標(biāo)記)或顯色后檢測(cè)(如酶標(biāo)記)。蛋白質(zhì)芯片檢測(cè)及分析現(xiàn)在是35頁(yè)\一共有147頁(yè)\編輯于星期五芯片檢測(cè):對(duì)于熒光標(biāo)記芯片,用熒光掃描儀或激光共聚焦顯微鏡掃描,利用計(jì)算機(jī)分析各點(diǎn)平均熒光密度;對(duì)于酶標(biāo)記芯片,顯色后可用CCD照相機(jī)拍攝,利用計(jì)算機(jī)處理信號(hào)得到各點(diǎn)灰度?,F(xiàn)在是36頁(yè)\一共有147頁(yè)\編輯于星期五結(jié)果分析:設(shè)計(jì)對(duì)照反應(yīng),或設(shè)定陰陽(yáng)性結(jié)果閾值。排除各點(diǎn)熒光密度或灰度背景干擾后與閾值比較并定量分析?,F(xiàn)在是37頁(yè)\一共有147頁(yè)\編輯于星期五應(yīng)用領(lǐng)域基因表達(dá)篩選特異性抗原抗體檢測(cè)蛋白質(zhì)組學(xué)研究蛋白質(zhì)相互作用研究現(xiàn)在是38頁(yè)\一共有147頁(yè)\編輯于星期五四、酵母雙雜交系統(tǒng)酵母雙雜交系統(tǒng)(yeasttwo-hybridsystem)是一種直接于酵母細(xì)胞內(nèi)檢測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用且靈敏度很高的分子生物學(xué)方法?,F(xiàn)在是39頁(yè)\一共有147頁(yè)\編輯于星期五酵母中轉(zhuǎn)錄活化因子GAL4蛋白能激活轉(zhuǎn)錄主要因?yàn)槠涠€(gè)結(jié)構(gòu)可分功能相互獨(dú)立的結(jié)構(gòu)域,即位于氨基(N)端的DNA-BD及位于羧基(C)端的AD。根據(jù)GAL4特性,可構(gòu)建兩種重組質(zhì)粒載體,分別表達(dá)GAL4蛋白的DNA-BD(N端1~147個(gè)氨基酸)和AD(羧基端768~881個(gè)氨基酸)。若在DNA-BD上連接“誘餌”蛋白X基因,在AD上連接“獵物”蛋白Y基因,再將這兩個(gè)質(zhì)粒共同轉(zhuǎn)入酵母體內(nèi)表達(dá)?,F(xiàn)在是40頁(yè)\一共有147頁(yè)\編輯于星期五如果酵母體內(nèi)表達(dá)的蛋白X和Y在酵母核內(nèi)發(fā)生交互作用,可使得DNA-BD和AD在空間上接近,從而激活UAS下游啟動(dòng)子調(diào)節(jié)的酵母特定報(bào)告基因的表達(dá),使轉(zhuǎn)化子由于報(bào)告基因的表達(dá)而可以在特定的營(yíng)養(yǎng)缺陷培養(yǎng)基上生長(zhǎng),同時(shí)因激活轉(zhuǎn)錄下游GAL1-LacZ和/或MEL1基因的表達(dá),從而在X-β-Gal和/或X-α-Gal存在下顯藍(lán)色,可用于排除篩選假陽(yáng)性克隆。這樣可根據(jù)報(bào)告基因是否轉(zhuǎn)錄表達(dá)判斷“誘餌”蛋白X與“獵物”蛋白Y之間相互作用。現(xiàn)在是41頁(yè)\一共有147頁(yè)\編輯于星期五(二)酵母雙雜交系統(tǒng)特點(diǎn)與應(yīng)用1.特點(diǎn)不僅可以精確測(cè)定蛋白質(zhì)間微弱相互作用,且在DNA水平操作,不需要在體外進(jìn)行大量表達(dá)和純化蛋白質(zhì)?,F(xiàn)在是42頁(yè)\一共有147頁(yè)\編輯于星期五2.應(yīng)用分析已知蛋白質(zhì)間相互作用;可篩選cDNA文庫(kù),分離與已知蛋白作用的新配體及其基因序列。發(fā)現(xiàn)新基因的主要途徑,是研究蛋白間交互作用最有力的工具之一?,F(xiàn)在是43頁(yè)\一共有147頁(yè)\編輯于星期五3.局限性轉(zhuǎn)化效率低;適用范圍有限;存在假陽(yáng)性及假陰性;外源蛋白毒性及翻譯后修飾?,F(xiàn)在是44頁(yè)\一共有147頁(yè)\編輯于星期五五、RosettaStone方法某物種中基因C的兩個(gè)片段分別與同一物種或另一物種中基因A及基因B同源,既可認(rèn)為基因A與基因B存在功能相關(guān)性,借助于基因C能找到無(wú)同源性的基因A及基因B之間關(guān)聯(lián)?;駽稱為羅塞塔石碑基因(RosettaStonegene),其表達(dá)蛋白稱為羅塞塔石碑蛋白。(一)RosettaStone方法來(lái)源現(xiàn)在是45頁(yè)\一共有147頁(yè)\編輯于星期五根據(jù)羅塞塔石碑蛋白C可預(yù)測(cè)蛋白質(zhì)A與蛋白質(zhì)B之間存在相互作用。該方法理論基礎(chǔ)是基于功能相關(guān)蛋白常常共進(jìn)化的性質(zhì)。現(xiàn)在是46頁(yè)\一共有147頁(yè)\編輯于星期五利用RosettaStone方法,檢索大腸桿菌基因組中4290種編碼蛋白基因在其他生物細(xì)胞基因組的融合情況,共發(fā)現(xiàn)6809對(duì)蛋白能構(gòu)成RosettaStone序列,其中3950對(duì)蛋白能在SWISS-PROT數(shù)據(jù)庫(kù)檢索到注釋功能,有2682對(duì)蛋白共享至少同一個(gè)關(guān)鍵詞,說(shuō)明蛋白對(duì)功能相關(guān)。應(yīng)用此法檢索酵母菌基因組,發(fā)現(xiàn)45502對(duì)相關(guān)蛋白的基因序列。(二)RosettaStone方法的應(yīng)用現(xiàn)在是47頁(yè)\一共有147頁(yè)\編輯于星期五RosettaStone方法預(yù)測(cè)得到的蛋白互作網(wǎng)絡(luò),必須進(jìn)一步通過(guò)實(shí)驗(yàn)分析以提高其準(zhǔn)確性。可利用噬菌體展示技術(shù)、酵母雙雜交系統(tǒng)、免疫共沉淀法、X射線結(jié)晶學(xué)以及表面等離子共振技術(shù)等有效檢測(cè)蛋白質(zhì)相互作用高通量實(shí)驗(yàn)技術(shù),為蛋白質(zhì)組學(xué)發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ)?,F(xiàn)在是48頁(yè)\一共有147頁(yè)\編輯于星期五六、蛋白質(zhì)組學(xué)分析軟件與數(shù)據(jù)庫(kù)1.蛋白質(zhì)表達(dá)分布圖數(shù)據(jù)庫(kù)日內(nèi)瓦大學(xué)的xPASy系統(tǒng)。2.蛋白質(zhì)組圖譜自動(dòng)識(shí)別軟件包肽圖(peptidemapping)包含一個(gè)蛋白質(zhì)全部質(zhì)譜(MS)信息,肽段(peptidefragment)包含蛋白質(zhì)多個(gè)片段質(zhì)譜信息(類似于EST)。(一)常用蛋白質(zhì)組分析工具現(xiàn)在是49頁(yè)\一共有147頁(yè)\編輯于星期五(二)蛋白質(zhì)組分析軟件1.圖像分析2.微量測(cè)序(microsequencing)N-末端Edman降解技術(shù)現(xiàn)在是50頁(yè)\一共有147頁(yè)\編輯于星期五3.質(zhì)譜數(shù)據(jù)質(zhì)譜鑒定主要包括數(shù)據(jù)的計(jì)算機(jī)處理和蛋白質(zhì)的數(shù)據(jù)庫(kù)搜尋鑒定。質(zhì)譜數(shù)據(jù)經(jīng)計(jì)算機(jī)處理后,可使用三種數(shù)據(jù)庫(kù)搜尋方式“鑒定”蛋白質(zhì):①利用MS數(shù)據(jù)搜尋,即PMF法;②利用“原始”MS/MS數(shù)據(jù)搜尋法;③先對(duì)串聯(lián)質(zhì)譜數(shù)據(jù)進(jìn)行解析,獲得部分多肽片段氨基酸序列后對(duì)蛋白質(zhì)進(jìn)行序列查詢法鑒定。現(xiàn)在是51頁(yè)\一共有147頁(yè)\編輯于星期五4.肽質(zhì)譜指紋圖(PMF)與肽序列測(cè)定由于氨基酸序列不同,蛋白質(zhì)酶(如胰酶)酶解后產(chǎn)生的酶切肽片段序列也不同,其肽混合物質(zhì)量數(shù)具一定特征,稱為肽質(zhì)譜指紋圖(PMF)。現(xiàn)在是52頁(yè)\一共有147頁(yè)\編輯于星期五5.氨基酸組分利用氨基酸組分異質(zhì)性,基于雙向凝膠電泳圖譜鑒定蛋白質(zhì)。多種工具可用于氨基酸組分分析,如AACompIdent、ASA、FINDER、AAC-PI及PROP-SEARCH等?,F(xiàn)在是53頁(yè)\一共有147頁(yè)\編輯于星期五(三)蛋白質(zhì)組數(shù)據(jù)庫(kù)1.綜合性蛋白質(zhì)2DE數(shù)據(jù)庫(kù)具有數(shù)據(jù)直觀性,以蛋白質(zhì)雙向電泳圖片為基礎(chǔ),并整合其他數(shù)據(jù)庫(kù)中信息,如蛋白質(zhì)序列、結(jié)構(gòu)及功能等。數(shù)據(jù)庫(kù)包括:SWISS2D數(shù)據(jù)庫(kù)、Argonne2D數(shù)據(jù)庫(kù)、MaxPlanck感染生物學(xué)研究所(MPIB)創(chuàng)建的蛋白質(zhì)2D數(shù)據(jù)庫(kù)等?,F(xiàn)在是54頁(yè)\一共有147頁(yè)\編輯于星期五2.哺乳類2DE數(shù)據(jù)庫(kù)丹麥Aarhus大學(xué)人類基因組研究中心的2D數(shù)據(jù)庫(kù)、英國(guó)心臟科學(xué)中心Harefield醫(yī)院維護(hù)的心臟內(nèi)皮細(xì)胞HSC2D數(shù)據(jù)庫(kù)、德國(guó)柏林心臟研究所的人類心肌2D數(shù)據(jù)庫(kù)等?,F(xiàn)在是55頁(yè)\一共有147頁(yè)\編輯于星期五3.微生物類和植物類2DE數(shù)據(jù)庫(kù)微生物類2DE數(shù)據(jù)庫(kù)主要包括細(xì)菌、真菌和寄生蟲(chóng)三類。植物類2DE數(shù)據(jù)庫(kù)包括:澳大利亞國(guó)立大學(xué)ANU2D、法國(guó)INRACestas的樹(shù)木2D等?,F(xiàn)在是56頁(yè)\一共有147頁(yè)\編輯于星期五(四)質(zhì)譜數(shù)據(jù)庫(kù)查詢和蛋白質(zhì)鑒定常用軟件1.PepSea檢索前必須先獲得肽序列標(biāo)簽(PST)。在檢索較大蛋白時(shí)積分較高,隨機(jī)匹配的可能性也較大。2.SEQUEST可使用多個(gè)肽片段序列信息進(jìn)行查詢,無(wú)需人工干預(yù),但查詢相當(dāng)費(fèi)時(shí)。3.PeptIdent/MultiIdent基于遺傳算法。現(xiàn)在是57頁(yè)\一共有147頁(yè)\編輯于星期五4.ProbID基于概率模型。5.MOWSE(molecularweightsearch)基于概率算法的數(shù)據(jù)庫(kù)查詢軟件。6.ProFound基于Bayesian算法,綜合考慮每個(gè)蛋白質(zhì)序列詳細(xì)信息,同時(shí)考慮了酶解產(chǎn)生肽片段的蛋白質(zhì)序列信息,大大提高算法的靈敏度和選擇性?,F(xiàn)在是58頁(yè)\一共有147頁(yè)\編輯于星期五(五)PMF質(zhì)譜分析基本步驟1.核對(duì)譜圖,扣除本底等因素引起的失真,進(jìn)行峰值校正,選擇分析范圍。(1)相對(duì)豐度:以質(zhì)譜中最強(qiáng)峰為100%(稱基峰),其他碎片峰與之相比的百分?jǐn)?shù)。(2)總離子流(TIC):即一次掃描得到的所有離子強(qiáng)度之和。現(xiàn)在是59頁(yè)\一共有147頁(yè)\編輯于星期五(3)動(dòng)態(tài)范圍:即最強(qiáng)峰與最弱峰高之比。(4)本底:未進(jìn)樣時(shí),掃描得到的質(zhì)譜圖,空氣成分、儀器泵油、底物、緩沖液及吸附在離子源中其他樣品等所導(dǎo)致的背景峰。現(xiàn)在是60頁(yè)\一共有147頁(yè)\編輯于星期五以牛血清白蛋白(bovineserumalbumin,BSA)PMF圖譜為例(圖6-1)。右上角顯示質(zhì)譜分析數(shù)據(jù)。第一列表示實(shí)驗(yàn)肽段質(zhì)量數(shù),第二列表示理論酶切后肽段質(zhì)量數(shù),第三列表示BSA酶切后各肽段序列。質(zhì)譜圖中各肽段峰上數(shù)字表示各峰相對(duì)應(yīng)的質(zhì)荷比(m/z)值,(+)表示該實(shí)驗(yàn)峰質(zhì)荷比值與理論酶切后肽段峰質(zhì)荷比值相比配。現(xiàn)在是61頁(yè)\一共有147頁(yè)\編輯于星期五圖6-1BSA的MALDI-TOF質(zhì)譜圖譜現(xiàn)在是62頁(yè)\一共有147頁(yè)\編輯于星期五各標(biāo)記肽段峰上,(+)表示BSA酶切后肽段峰,(M)表示基質(zhì)峰。圖6-2BSA的MALDI-TOF質(zhì)譜圖譜500~900區(qū)域放大圖現(xiàn)在是63頁(yè)\一共有147頁(yè)\編輯于星期五2.確定肽指紋譜峰值數(shù)據(jù)集,剔除與所鑒定蛋白無(wú)關(guān)的質(zhì)量峰經(jīng)剔除基質(zhì)峰、酶自解峰等信號(hào),圖6-1中BSA的肽指紋質(zhì)量數(shù)數(shù)據(jù)集為,721.355、927.490、1163.654、1249.633、1305.694、1439.850、1479.815、1567.733、1639.953、1871.888、2044.991?,F(xiàn)在是64頁(yè)\一共有147頁(yè)\編輯于星期五3.數(shù)據(jù)庫(kù)搜索及參數(shù)設(shè)置(1)選擇允許的化學(xué)修飾(2)確定可耐受的質(zhì)量數(shù)精確度(masstolerance)(3)確定酶切所用蛋白酶(4)確定允許漏切的酶切位點(diǎn)個(gè)數(shù)(5)確定肽段質(zhì)量數(shù)值(massvalues)及計(jì)算模式(6)根據(jù)搜索蛋白的匹配對(duì)象選擇合適的數(shù)據(jù)庫(kù)及物種(taxonomy)限定(7)確定估計(jì)等電點(diǎn)(pI)及分子量數(shù)值現(xiàn)在是65頁(yè)\一共有147頁(yè)\編輯于星期五現(xiàn)以牛血清白蛋白(bovineserumalbumin,BSA)為例,采用MASCOT搜索工具進(jìn)行PMF分析鑒定(圖6-3、圖6-4、圖6-5、圖6-6)。現(xiàn)在是66頁(yè)\一共有147頁(yè)\編輯于星期五圖6-3MASCOT搜索主界面現(xiàn)在是67頁(yè)\一共有147頁(yè)\編輯于星期五圖6-4選擇MASCOTPeptideMassFingerprint程序現(xiàn)在是68頁(yè)\一共有147頁(yè)\編輯于星期五圖6-5MASCOTPMF搜索結(jié)果界面現(xiàn)在是69頁(yè)\一共有147頁(yè)\編輯于星期五圖6-6搜索結(jié)果蛋白詳細(xì)信息現(xiàn)在是70頁(yè)\一共有147頁(yè)\編輯于星期五第三節(jié)蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)Section3PredictionofProteinStructure現(xiàn)在是71頁(yè)\一共有147頁(yè)\編輯于星期五一、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)概述1961年提出的Anfinsen原理為從氨基酸序列預(yù)測(cè)蛋白質(zhì)空間結(jié)構(gòu)奠定了理論基礎(chǔ),即蛋白質(zhì)分子的一級(jí)序列決定其空間結(jié)構(gòu),而蛋白質(zhì)天然構(gòu)象是能量最低的構(gòu)象。Li和Scheraga等曾用隨機(jī)搜索方法確定多肽構(gòu)象,但單純構(gòu)象搜索對(duì)于結(jié)構(gòu)和自由度復(fù)雜得多的蛋白質(zhì)無(wú)能為力?,F(xiàn)在是72頁(yè)\一共有147頁(yè)\編輯于星期五目前蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法主要發(fā)展自兩個(gè)方向:1.物化理論分析:從頭預(yù)測(cè)2.統(tǒng)計(jì)學(xué)方法:同源建模,折疊識(shí)別現(xiàn)在是73頁(yè)\一共有147頁(yè)\編輯于星期五二、蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法及軟件蛋白質(zhì)中約85%的殘基處于三種穩(wěn)定二級(jí)結(jié)構(gòu),α螺旋、β折疊和β轉(zhuǎn)角。二級(jí)結(jié)構(gòu)預(yù)測(cè)的目標(biāo)是根據(jù)一級(jí)結(jié)構(gòu)判斷殘基是否處于特定二級(jí)結(jié)構(gòu)。其基本依據(jù)是:每段相鄰的氨基酸殘基具有形成一定二級(jí)結(jié)構(gòu)的傾向,通過(guò)統(tǒng)計(jì)和分析發(fā)現(xiàn)這些傾向或者規(guī)律,二級(jí)結(jié)構(gòu)預(yù)測(cè)問(wèn)題可轉(zhuǎn)化為模式分類和識(shí)別問(wèn)題。現(xiàn)在是74頁(yè)\一共有147頁(yè)\編輯于星期五(一)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法1.DPM(雙重預(yù)測(cè)方法)先預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)分類再預(yù)測(cè)序列的二級(jí)結(jié)構(gòu)。2.DSC算法首先預(yù)測(cè)基本概念,然后利用簡(jiǎn)單線性統(tǒng)計(jì)方法結(jié)合概念預(yù)測(cè)二級(jí)結(jié)構(gòu),其準(zhǔn)確率較高?,F(xiàn)在是75頁(yè)\一共有147頁(yè)\編輯于星期五3.PHDsec基于神經(jīng)網(wǎng)絡(luò)系統(tǒng),被認(rèn)為是二級(jí)結(jié)構(gòu)預(yù)測(cè)的標(biāo)準(zhǔn)。4.SOPMA它用五種相互獨(dú)立方法預(yù)測(cè),并匯集整理“一致預(yù)測(cè)結(jié)果”,準(zhǔn)確率達(dá)69.5%?,F(xiàn)在是76頁(yè)\一共有147頁(yè)\編輯于星期五5.MLRC算法集GOR4、SIMPA96和SOPMA為一體,處理蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果,并估計(jì)分類的后驗(yàn)概率。6.Jpred1998年由BartonGroup創(chuàng)建,運(yùn)用Jnet神經(jīng)網(wǎng)絡(luò)算法,準(zhǔn)確率可達(dá)到76.4%?,F(xiàn)在是77頁(yè)\一共有147頁(yè)\編輯于星期五(二)蛋白質(zhì)結(jié)構(gòu)域識(shí)別方法目前結(jié)構(gòu)域識(shí)別方法主要包括根據(jù)蛋白質(zhì)空間結(jié)構(gòu)信息利用機(jī)器學(xué)習(xí)方法獲取結(jié)構(gòu)域信息的方法、通過(guò)對(duì)具有代表性三級(jí)結(jié)構(gòu)的蛋白質(zhì)建立隱馬爾可夫模型方法、分析蛋白質(zhì)序列構(gòu)象熵值判定結(jié)構(gòu)域邊界的方法、運(yùn)用神經(jīng)網(wǎng)絡(luò)從蛋白質(zhì)序列獲取結(jié)構(gòu)域邊界方法和基于經(jīng)驗(yàn)的人工劃分方法等。現(xiàn)在是78頁(yè)\一共有147頁(yè)\編輯于星期五(三)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)軟件以人基質(zhì)金屬蛋白酶(matrixmetalloproteinase14,MMP14,NCBI蛋白質(zhì)數(shù)據(jù)庫(kù)編號(hào)NP_004986)為例,介紹Jpred、SOPMA及PredictProtein等預(yù)測(cè)軟件。現(xiàn)在是79頁(yè)\一共有147頁(yè)\編輯于星期五1.Jpred(pbio.dundee.ac.uk/~www-jpred/)Jpred首頁(yè)及部分分析結(jié)果見(jiàn)圖6-7,預(yù)測(cè)得到MMP14有8個(gè)α-螺旋區(qū)(H)和21個(gè)β-折疊區(qū)(E),其他區(qū)域均為無(wú)規(guī)則卷曲區(qū)(-)?,F(xiàn)在是80頁(yè)\一共有147頁(yè)\編輯于星期五Jpred預(yù)測(cè)二級(jí)結(jié)構(gòu)現(xiàn)在是81頁(yè)\一共有147頁(yè)\編輯于星期五2.SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)SOPMA主頁(yè)及預(yù)測(cè)結(jié)果如圖6-8所示,MMP14含有螺旋(h)27.66%、延伸鏈(e)19.24%、轉(zhuǎn)角(t)11.34%和無(wú)軌卷曲(c)41.75%?,F(xiàn)在是82頁(yè)\一共有147頁(yè)\編輯于星期五SOPMA預(yù)測(cè)二級(jí)結(jié)構(gòu)現(xiàn)在是83頁(yè)\一共有147頁(yè)\編輯于星期五3.PredictProtein(/)二級(jí)結(jié)構(gòu)預(yù)測(cè)和溶劑可及性分析如圖6-9,目標(biāo)蛋白序列中的Helix(紅)和Strand(藍(lán))被RePROF(上)和PROFsec(下)兩種方法預(yù)測(cè)出來(lái),同時(shí)溶劑可及(Exposed,藍(lán))與不可及(Buried,黃)的殘基也被PROFacc方法計(jì)算出來(lái)。各特征殘基的比例以餅狀圖顯示?,F(xiàn)在是84頁(yè)\一共有147頁(yè)\編輯于星期五PredictProtein預(yù)測(cè)現(xiàn)在是85頁(yè)\一共有147頁(yè)\編輯于星期五三、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法及軟件目前,蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法有三類:①比較建模(comparativemodeling,CM)需要與目標(biāo)序列的相似度較高(>30%)的已知結(jié)構(gòu)模板;②當(dāng)缺乏同源性較高的模板時(shí),就需用復(fù)雜方法獲得合適的模板并產(chǎn)生更確切的比對(duì),這種過(guò)程被稱為遠(yuǎn)程同源建模(distanthomologymodeling)、折疊識(shí)別(foldrecognition)或穿線法(threading);③不直接用已知模板的方法稱為自由建模(freemodeling)或從頭預(yù)測(cè)(abinitio)法。現(xiàn)在是86頁(yè)\一共有147頁(yè)\編輯于星期五(一)比較建模法原理比較建模又稱同源建模(homologymodeling),原理較簡(jiǎn)單,基于進(jìn)化相關(guān)的序列具有相似的三維結(jié)構(gòu)且進(jìn)化過(guò)程中三維結(jié)構(gòu)比序列保守的原理,利用進(jìn)化相關(guān)模板結(jié)構(gòu)信息建?!,F(xiàn)在是87頁(yè)\一共有147頁(yè)\編輯于星期五基本步驟①將目標(biāo)序列作為查詢序列來(lái)搜索PDB和SWISS-PROT等已知蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù),確定和識(shí)別一個(gè)同源模板,或選擇已知結(jié)構(gòu)的同源序列作為建模的模板;②將目標(biāo)序列和模板序列進(jìn)行比對(duì),利用多種比對(duì)方法或手工校正以改進(jìn)和優(yōu)化靶序列和模板結(jié)構(gòu)的比對(duì),比對(duì)中可以加入空格;現(xiàn)在是88頁(yè)\一共有147頁(yè)\編輯于星期五③以模板結(jié)構(gòu)骨架作為模型,建立目標(biāo)蛋白質(zhì)骨架模型;④構(gòu)建環(huán)區(qū)(loops)和側(cè)鏈,優(yōu)化側(cè)鏈位置;⑤優(yōu)化和評(píng)估產(chǎn)生的模型,使用能量最小化或其他方法優(yōu)化結(jié)構(gòu),如利用分子動(dòng)力學(xué)、模擬退火等優(yōu)化結(jié)構(gòu)。現(xiàn)在是89頁(yè)\一共有147頁(yè)\編輯于星期五比較建模法的局限性最大的挑戰(zhàn)是對(duì)模板鏈進(jìn)行空隙和插入的建模。目標(biāo)蛋白與模板結(jié)構(gòu)保守性的程度及序列比對(duì)的正確性嚴(yán)重影響預(yù)測(cè)模型的準(zhǔn)確性。因此,比較建模主要在序列一致性大于30%的序列間進(jìn)行?,F(xiàn)在是90頁(yè)\一共有147頁(yè)\編輯于星期五(1)SWISS-MODEL服務(wù)器是目前最廣泛使用的基于網(wǎng)絡(luò)的免費(fèi)蛋白質(zhì)3D自動(dòng)建模服務(wù)器。它與ExPASy網(wǎng)站和DeepView程序緊密相聯(lián)。常用比較建模服務(wù)器和軟件現(xiàn)在是91頁(yè)\一共有147頁(yè)\編輯于星期五(2)MODELLER軟件需要用戶提供目標(biāo)序列與其模板的比對(duì)結(jié)果,能夠自動(dòng)計(jì)算由非氫原子組成的模型,并通過(guò)搜索序列數(shù)據(jù)庫(kù)、多序列比對(duì)、聚類、對(duì)高柔性環(huán)區(qū)進(jìn)行從頭建模和多模型優(yōu)化等方法,進(jìn)一步修正模型?,F(xiàn)在是92頁(yè)\一共有147頁(yè)\編輯于星期五(3)HHpred服務(wù)器和軟件既可使用交互式服務(wù)器也可使用下載的軟件進(jìn)行模板的搜索、序列比對(duì)、二級(jí)結(jié)構(gòu)預(yù)測(cè)等同源建模準(zhǔn)備,并利用MODELLER構(gòu)建三維模型?,F(xiàn)在是93頁(yè)\一共有147頁(yè)\編輯于星期五(4)AccelrysDiscoveryStudio軟件是一個(gè)綜合生物大分子結(jié)構(gòu)分析和計(jì)算機(jī)輔助藥物設(shè)計(jì)等多種功能的軟件。整合MODELLER用于同源建模,和后續(xù)模型評(píng)價(jià)。并可進(jìn)行相關(guān)結(jié)構(gòu)域和活性位點(diǎn)分析?,F(xiàn)在是94頁(yè)\一共有147頁(yè)\編輯于星期五(5)MOE(molecularoperatingenvironment)軟件綜合生物大分子結(jié)構(gòu)分析和計(jì)算機(jī)輔助藥物設(shè)計(jì)等多種功能的商業(yè)軟件。其優(yōu)勢(shì)在于可視化工具非常方便,便于對(duì)分子局部操作,對(duì)所建模型進(jìn)一步局部?jī)?yōu)化和修正?,F(xiàn)在是95頁(yè)\一共有147頁(yè)\編輯于星期五(二)折疊識(shí)別法結(jié)構(gòu)在進(jìn)化上的保守性要高于序列。尤其在只能找到同源性小于30%的模板時(shí)比較適用。此方法包括兩步:①將目標(biāo)蛋白序列和已知的折疊進(jìn)行匹配,根據(jù)比對(duì)的進(jìn)化信息在已知的結(jié)構(gòu)中找到一個(gè)或幾個(gè)匹配最好的折疊結(jié)構(gòu),作為建模的模板。②將目標(biāo)序列的:線“穿”到模板的折疊結(jié)構(gòu)上,拼裝出最好的匹配模型?,F(xiàn)在是96頁(yè)\一共有147頁(yè)\編輯于星期五這種方法局限性在于已有的蛋白質(zhì)折疊類型還是有限的,序列相似的蛋白也可能具有明顯不同的折疊模式等等?,F(xiàn)在是97頁(yè)\一共有147頁(yè)\編輯于星期五(三)蛋白質(zhì)三維結(jié)構(gòu)的從頭預(yù)測(cè)方法如果目標(biāo)蛋白序列缺乏已知結(jié)構(gòu)的同源蛋白質(zhì),則可采用從頭預(yù)測(cè)方法(abinitio)或稱自由建模法。從頭預(yù)測(cè)法的理論依據(jù)是Anfinsen假說(shuō),即在給定條件下蛋白質(zhì)的天然結(jié)構(gòu)對(duì)應(yīng)其自由能最低的狀態(tài)。現(xiàn)在是98頁(yè)\一共有147頁(yè)\編輯于星期五成功的從頭預(yù)測(cè)依賴于以下因素的有效性:①通過(guò)能量?jī)?yōu)化找到的蛋白質(zhì)結(jié)構(gòu)具有充分的結(jié)構(gòu)可靠性和計(jì)算可控性;②符合實(shí)際的力場(chǎng)或其他作用力描述方法;③高效而準(zhǔn)確的搜索構(gòu)象空間重要區(qū)域的算法;④對(duì)獲得結(jié)構(gòu)進(jìn)行準(zhǔn)確評(píng)估的方法?,F(xiàn)在是99頁(yè)\一共有147頁(yè)\編輯于星期五四、對(duì)結(jié)構(gòu)預(yù)測(cè)結(jié)果的評(píng)價(jià)1.LiveBench(LB)實(shí)驗(yàn)方法LB不斷地對(duì)各自動(dòng)服務(wù)器進(jìn)行能力評(píng)估,約半年評(píng)估這些預(yù)測(cè)方法一次。2.CASP和CAFASP實(shí)驗(yàn)方法用于檢測(cè)現(xiàn)行建模方法的能力和局限、確定研發(fā)的進(jìn)展并闡明問(wèn)題的瓶頸,是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的一個(gè)重要里程碑?,F(xiàn)在是100頁(yè)\一共有147頁(yè)\編輯于星期五3.EVA實(shí)驗(yàn)方法主要用于二級(jí)結(jié)構(gòu)預(yù)測(cè)、接觸預(yù)測(cè)、比較蛋白質(zhì)結(jié)構(gòu)建模和穿線法/折疊識(shí)別?,F(xiàn)在是101頁(yè)\一共有147頁(yè)\編輯于星期五第四節(jié)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)Section4ProteinStructureDatabases現(xiàn)在是102頁(yè)\一共有147頁(yè)\編輯于星期五PDB:包含了通過(guò)X射線單晶衍射、磁共振和電子衍射等實(shí)驗(yàn)手段確定的蛋白質(zhì)、多糖和核酸等生物大分子的三維結(jié)構(gòu)數(shù)據(jù)。截止到2014年9月16日,PDB總共收錄了103354條結(jié)構(gòu)數(shù)據(jù),其中,收錄包括95633個(gè)蛋白質(zhì)結(jié)構(gòu)、2726個(gè)核酸結(jié)構(gòu)、4969個(gè)蛋白/核酸復(fù)合物和26個(gè)其他結(jié)構(gòu)。一、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫(kù)(PDB)現(xiàn)在是103頁(yè)\一共有147頁(yè)\編輯于星期五PDB數(shù)據(jù)庫(kù)網(wǎng)站主頁(yè)如圖6-10,在新一代的交互式界面的支持下,其大多數(shù)頁(yè)面可由用戶自行定義不同的顯示面板?,F(xiàn)在是104頁(yè)\一共有147頁(yè)\編輯于星期五圖6-10PDB數(shù)據(jù)庫(kù)及其快速增長(zhǎng)的數(shù)據(jù)量現(xiàn)在是105頁(yè)\一共有147頁(yè)\編輯于星期五PDB數(shù)據(jù)庫(kù)以文本文件的方式存放數(shù)據(jù),每個(gè)分子各用一個(gè)獨(dú)立的文件,都有唯一的PDB-ID。它包含4個(gè)字符,由大寫字母和數(shù)字組成(如血紅蛋白的PDB-ID為4HHB)。文件中除了原子坐標(biāo)外,還包括物種來(lái)源、化合物名稱、結(jié)構(gòu)以及有關(guān)文獻(xiàn)等基本注釋信息。此外,還給出分辨率、結(jié)構(gòu)因子、溫度系數(shù)、蛋白質(zhì)主鏈數(shù)目、配體分子式、金屬離子、二級(jí)結(jié)構(gòu)信息、二硫鍵位置等和結(jié)構(gòu)有關(guān)的數(shù)據(jù)?,F(xiàn)在是106頁(yè)\一共有147頁(yè)\編輯于星期五PDB格式的文件可以用于一些圖形軟件直觀觀察蛋白質(zhì)的三維結(jié)構(gòu),例如VMD、Jmol、Swiss-PDBviewer及RasMol等?,F(xiàn)在是107頁(yè)\一共有147頁(yè)\編輯于星期五PDB數(shù)據(jù)庫(kù)允許用戶用各種關(guān)鍵字進(jìn)行檢索,如功能類別、PDB代碼、名稱、作者、空間群、分辨率、來(lái)源、入庫(kù)時(shí)間、分子式、參考文獻(xiàn)和生物來(lái)源等項(xiàng)。用戶不僅可以得到生物大分子的各種注釋、原子空間坐標(biāo)和三維圖形,并能鏈接到一系列與PDB相關(guān)的數(shù)據(jù)庫(kù),包括SCOP、CATH、Medline、ENZYME和SWISS-3DIMAGE等。除了使用關(guān)鍵字搜索,用戶也可以按照分類查看PDB數(shù)據(jù)庫(kù)?,F(xiàn)在是108頁(yè)\一共有147頁(yè)\編輯于星期五二、蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)(一)SCOP(http://scop.mrc-lmb.cam.ac.uk/scop/)蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)SCOP,是對(duì)已知蛋白質(zhì)結(jié)構(gòu)進(jìn)行分類的數(shù)據(jù)庫(kù),根據(jù)不同蛋白質(zhì)的氨基酸組成及三級(jí)結(jié)構(gòu)的相似性,描述已知結(jié)構(gòu)蛋白的功能及進(jìn)化關(guān)系。SCOP數(shù)據(jù)庫(kù)的構(gòu)建除了使用計(jì)算機(jī)程序外,主要依賴于人工驗(yàn)證。現(xiàn)在是109頁(yè)\一共有147頁(yè)\編輯于星期五SCOP提供一個(gè)非冗余的ASTRAIL序列庫(kù),通常被用來(lái)評(píng)估各種序列比對(duì)算法;一個(gè)PDB-ISL中介序列庫(kù),用于比對(duì)搜索與未知結(jié)構(gòu)序列遠(yuǎn)源的已知結(jié)構(gòu)序列;還可以鏈接到PDB等外部數(shù)據(jù)庫(kù)來(lái)檢索更多信息?,F(xiàn)在是110頁(yè)\一共有147頁(yè)\編輯于星期五在SCOP數(shù)據(jù)庫(kù)中對(duì)蛋白質(zhì)的分類基于樹(shù)狀層級(jí),從根到葉依次為類(class)、折疊類型(fold)、超家族(superfamily)、家族(family)、蛋白質(zhì)結(jié)構(gòu)域(proteindomain)、來(lái)源物種(species)、單個(gè)PDB蛋白質(zhì)結(jié)構(gòu)記錄。家族用來(lái)描述相近的蛋白質(zhì)進(jìn)化關(guān)系。超家族用來(lái)描述遠(yuǎn)源的進(jìn)化關(guān)系,如果序列相似性較低,但其結(jié)構(gòu)和功能特性表明有共同的進(jìn)化起源,則將其視作超家族?,F(xiàn)在是111頁(yè)\一共有147頁(yè)\編輯于星期五折疊類型用來(lái)描述空間的幾何關(guān)系,無(wú)論有無(wú)共同的進(jìn)化起源,只要二級(jí)結(jié)構(gòu)單元具有相同的排列和拓?fù)浣Y(jié)構(gòu),即歸入相同的折疊方式。頂級(jí)的種類class則依據(jù)二級(jí)結(jié)構(gòu)組成分為:全螺旋,全折疊,螺旋和折疊,螺旋+折疊以及其他特殊種類。這樣的樹(shù)狀層次,便于對(duì)目標(biāo)蛋白的結(jié)構(gòu)功能特征進(jìn)行定位?,F(xiàn)在是112頁(yè)\一共有147頁(yè)\編輯于星期五(二)CATH(/)四種分類層次:蛋白質(zhì)的種類(class,C)、二級(jí)結(jié)構(gòu)的構(gòu)架(architecture,A)、拓?fù)浣Y(jié)構(gòu)(topology,T)和蛋白質(zhì)同源超家族(homologoussuperfamily,H)?,F(xiàn)在是113頁(yè)\一共有147頁(yè)\編輯于星期五CATH的蛋白質(zhì)種類為全α、全β、α-β(α/β型和α+β型)和低二級(jí)結(jié)構(gòu)四類,其中低二級(jí)結(jié)構(gòu)類是指二級(jí)結(jié)構(gòu)成分含量很低的蛋白質(zhì)分子。第二個(gè)層次是蛋白質(zhì)分子的構(gòu)架,主要考慮α螺旋和β折疊形成超二級(jí)結(jié)構(gòu)的排列方式,而不考慮其連接關(guān)系。這一層次的分類主要依靠人工方法?,F(xiàn)在是114頁(yè)\一共有147頁(yè)\編輯于星期五第三個(gè)層次為拓?fù)浣Y(jié)構(gòu),即二級(jí)結(jié)構(gòu)的形狀和二級(jí)結(jié)構(gòu)間的聯(lián)系,與SCOP中的折疊模式fold相當(dāng)。第四個(gè)層次為結(jié)構(gòu)的同源性,是先通過(guò)序列比對(duì)再用結(jié)構(gòu)比較來(lái)確定的?,F(xiàn)在是115頁(yè)\一共有147頁(yè)\編輯于星期五CATH的主頁(yè)、分類層級(jí)和代表性類別現(xiàn)在是116頁(yè)\一共有147頁(yè)\編輯于星期五三、其他常用蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)1.SWISS-MODEL數(shù)據(jù)庫(kù)(/)收錄的蛋白質(zhì)結(jié)構(gòu)都是使用SWISS-MODEL對(duì)蛋白質(zhì)序列進(jìn)行自動(dòng)同源建模所得到的結(jié)構(gòu)數(shù)據(jù)。直接從PDB中獲得最新的實(shí)測(cè)三維結(jié)構(gòu),存于其模板數(shù)據(jù)庫(kù)(SMTL)??商峁┑鞍踪|(zhì)四級(jí)結(jié)構(gòu)和必要的配體和輔助因子的注釋,以方便構(gòu)建完整的結(jié)構(gòu)模型,包括寡聚體結(jié)構(gòu)?,F(xiàn)在是117頁(yè)\一共有147頁(yè)\編輯于星期五新版的SWISS-MODEL允許用戶以交互方式搜索模板,根據(jù)序列相似性對(duì)其聚類,從結(jié)構(gòu)上比較不同模板,最后選擇適當(dāng)?shù)哪0逵糜诮⒛P?并且還允許用戶對(duì)數(shù)據(jù)庫(kù)中的模型質(zhì)量進(jìn)行評(píng)價(jià)?,F(xiàn)在是118頁(yè)\一共有147頁(yè)\編輯于星期五2.生物磁共振數(shù)據(jù)庫(kù)(BMRB,/)由美國(guó)威斯康星大學(xué)麥迪遜分校組織構(gòu)建的專門用于存放蛋白質(zhì)、多肽、核酸等物質(zhì)磁共振NMR波譜數(shù)據(jù),以及對(duì)應(yīng)的分子研究的源數(shù)據(jù)、研究所使用的實(shí)驗(yàn)條件和設(shè)備、與研究相關(guān)的重要出版物等信息?,F(xiàn)在是119頁(yè)\一共有147頁(yè)\編輯于星期五第五節(jié)蛋白質(zhì)功能分析Section5AnalysisofProteinFunction現(xiàn)在是120頁(yè)\一共有147頁(yè)\編輯于星期五一、蛋白質(zhì)功能分析概述蛋白質(zhì)在進(jìn)化中保守的結(jié)構(gòu)通常對(duì)應(yīng)某些保守的生物化學(xué)功能。對(duì)蛋白質(zhì)功能進(jìn)行分類和預(yù)測(cè)的方法主要還是依賴于結(jié)構(gòu)比對(duì),如DaliLite、SSM、STRUCTAL、MultiProt和3DCoffee等。還有一些方法試圖將結(jié)構(gòu)相似性方法與其他方法相結(jié)合進(jìn)行功能預(yù)測(cè)。例如,考慮一個(gè)系統(tǒng)發(fā)育上下文中的結(jié)構(gòu)相似性,會(huì)增加功能注釋精確性。(一)基于結(jié)構(gòu)分類的蛋白質(zhì)功能預(yù)測(cè)現(xiàn)在是121頁(yè)\一共有147頁(yè)\編輯于星期五(二)基于結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)間相互作用1.基于結(jié)構(gòu)的物理對(duì)接主要用于預(yù)測(cè)兩個(gè)蛋白質(zhì)間的相互作用位點(diǎn),但對(duì)體積很大的蛋白質(zhì)分子,相互作用的可能界面太多而計(jì)算工作量很大?,F(xiàn)在是122頁(yè)\一共有147頁(yè)\編輯于星期五2.基于相互作用界面序列特征模式的預(yù)測(cè)利用統(tǒng)計(jì)分析發(fā)掘蛋白質(zhì)相互作用界面的序列特征信息。主要分為幾類:(1)關(guān)聯(lián)性突變法不需要目標(biāo)蛋白的高級(jí)結(jié)構(gòu)而只需要序列信息,且計(jì)算量比基于結(jié)構(gòu)的物理對(duì)接小得多。(2)聯(lián)用方法聯(lián)用高級(jí)結(jié)構(gòu)和序列信息?,F(xiàn)在是123頁(yè)\一共有147頁(yè)\編輯于星期五(3)人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法利用高級(jí)結(jié)構(gòu)信息和序列特征進(jìn)行訓(xùn)練,可建立蛋白質(zhì)間相互作用界面的預(yù)測(cè)方法。預(yù)測(cè)準(zhǔn)確度可達(dá)到70%?,F(xiàn)在是124頁(yè)\一共有147頁(yè)\編輯于星期五二、蛋白質(zhì)功能預(yù)測(cè)方法(一)基于基序的方法基于基序的方法(motif-basedapproaches)通過(guò)識(shí)別功能相關(guān)的蛋白質(zhì)中保守的三維基序,并建立這些保守的基序和保守的蛋白質(zhì)功能間的映射關(guān)系用于預(yù)測(cè)目標(biāo)蛋白質(zhì)的某些生物化學(xué)功能?,F(xiàn)在是125頁(yè)\一共有147頁(yè)\編輯于星期五1.SITE程序和數(shù)據(jù)庫(kù)儲(chǔ)存了酶活性位點(diǎn)保守基序信息用位點(diǎn)匹配程序?qū)ふ谊P(guān)鍵的功能位點(diǎn)殘基作為保守殘基。2.TESS程序采用了幾何散列算法,通過(guò)模板研究和重疊,從蛋白質(zhì)的高級(jí)結(jié)構(gòu)中尋找保守的必須殘基?,F(xiàn)在是126頁(yè)\一共有147頁(yè)\編輯于星期五3.模糊功能形態(tài)(FFF)從三維信息角度認(rèn)證與生物學(xué)功能相關(guān)位點(diǎn)的保守性。4.SPASM同時(shí)用主鏈α碳原子和側(cè)鏈基團(tuán)作為分析對(duì)象,并列尋找保守殘基,并用于搜尋結(jié)構(gòu)數(shù)據(jù)庫(kù)中能匹配的已知功能蛋白?,F(xiàn)在是127頁(yè)\一共有147頁(yè)\編輯于星期五5.分子識(shí)別策略分析是基于已知功能域四周原子的疊合認(rèn)證保守性預(yù)測(cè)蛋白質(zhì)功能。6.蛋白質(zhì)側(cè)鏈的保守模式分析分析重復(fù)出現(xiàn)的氨基酸側(cè)鏈的保守性。現(xiàn)在是128頁(yè)\一共有147頁(yè)\編輯于星期五(二)基于表面的方法基于表面的方法(surface-basedapproaches)對(duì)給定蛋白質(zhì)進(jìn)行表面模型化,利用與結(jié)構(gòu)相關(guān)聯(lián)的蛋白質(zhì)表面模型,識(shí)別蛋白質(zhì)表面上的結(jié)構(gòu)特征(如空間特征、裂隙等),進(jìn)而利用這些特征來(lái)推斷蛋白質(zhì)功能。SURFACE數(shù)據(jù)庫(kù)提供對(duì)輸入蛋白質(zhì)局部表面特征模式的識(shí)別,以據(jù)此對(duì)蛋白質(zhì)功能進(jìn)行預(yù)測(cè)。這種匹配算法精確性一般能達(dá)到90%左右,但計(jì)算量很大?,F(xiàn)在是129頁(yè)\一共有147頁(yè)\編輯于星期五(三)基于學(xué)習(xí)的方法基于學(xué)習(xí)的方法(learning-basedapproaches)是利用有效的分類方法,從最相關(guān)的結(jié)構(gòu)特征中識(shí)別最合適的功能類別,如SVM和KNN等分類方法?;趯W(xué)習(xí)的方法以蛋白質(zhì)結(jié)構(gòu)特征作為分類依據(jù),功能分類作為樣本標(biāo)簽,通過(guò)數(shù)據(jù)對(duì)象之間的相似性矩陣對(duì)訓(xùn)練集中的蛋白質(zhì)進(jìn)行結(jié)構(gòu)與功能關(guān)系的評(píng)估。現(xiàn)在是130頁(yè)\一共有147頁(yè)\編輯于星期五三、蛋白質(zhì)結(jié)構(gòu)與功能關(guān)系數(shù)據(jù)庫(kù)(一)Pfam蛋白質(zhì)結(jié)構(gòu)域家族數(shù)據(jù)庫(kù)Pfam收集了大量使用多重序列比對(duì)和隱馬爾科夫模型對(duì)UniProtKB的蛋白質(zhì)序列數(shù)據(jù)進(jìn)行結(jié)構(gòu)域歸類形成的蛋白質(zhì)家族,廣泛用于通過(guò)序列比對(duì)推測(cè)蛋白質(zhì)的結(jié)構(gòu)域排布形式及功能?,F(xiàn)在是131頁(yè)\一共有147頁(yè)\編輯于星期五Pfam包括高質(zhì)量、手工確定的Pfam-A,和用ADDA算法自動(dòng)分類的低質(zhì)量、未注釋的Pfam-B數(shù)據(jù)庫(kù)。Pfam數(shù)據(jù)庫(kù)可使用蛋白質(zhì)或DNA序列搜索蛋白所屬家族,查看該家族的功能注釋和多序列比對(duì),擴(kuò)展至屬于同一群落的多個(gè)家族,查看一個(gè)目標(biāo)序列的結(jié)構(gòu)域組成,鏈接到該序列在PDB數(shù)據(jù)庫(kù)中的結(jié)構(gòu),或直接使用關(guān)鍵字搜索。現(xiàn)在是132頁(yè)\一共有147頁(yè)\

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論