蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析

上傳人：太*** IP屬地：廣東上傳時(shí)間：2023-04-11 格式：PPT 頁(yè)數(shù)：147 大?。?0.17MB 積分：15 舉報(bào) 版權(quán)申訴

蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第2頁(yè)

蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第3頁(yè)

蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第4頁(yè)

蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第5頁(yè)

已閱讀5頁(yè)，還剩142頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

學(xué)習(xí)提綱

重點(diǎn)

蛋白質(zhì)的分離與鑒定方法、蛋白質(zhì)芯片分析技術(shù)以及酵母雙雜交技術(shù)。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法及其軟件、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法及其軟件。現(xiàn)在是1頁(yè)\一共有147頁(yè)\編輯于星期五

難點(diǎn)

蛋白質(zhì)二級(jí)結(jié)構(gòu)和三維結(jié)構(gòu)算法以及軟件的使用。蛋白質(zhì)功能預(yù)測(cè)方法及其軟件的使用。蛋白質(zhì)與疾病發(fā)生。常用的蛋白質(zhì)組學(xué)數(shù)據(jù)庫(kù)。

熟悉現(xiàn)在是2頁(yè)\一共有147頁(yè)\編輯于星期五第一節(jié)引言Section1Introduction現(xiàn)在是3頁(yè)\一共有147頁(yè)\編輯于星期五隨著人類基因組及諸多物種基因組計(jì)劃的完成，生命科學(xué)研究已經(jīng)進(jìn)入以基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等“組學(xué)”為研究標(biāo)志的后基因組時(shí)代（post-genomicera）。在后基因組時(shí)代，蛋白質(zhì)組學(xué)研究越來(lái)越受到關(guān)注和重視?，F(xiàn)在是4頁(yè)\一共有147頁(yè)\編輯于星期五蛋白質(zhì)組（proteome）：指由一個(gè)基因組（genome），或一個(gè)細(xì)胞、組織表達(dá)的所有蛋白質(zhì)（protein）。蛋白質(zhì)組學(xué)（proteomics）：蛋白質(zhì)組學(xué)是采用大規(guī)模、高通量、系統(tǒng)化的方法，研究某一類型細(xì)胞、組織或體液中的所有蛋白質(zhì)組成、功能及其蛋白之間相互作用的學(xué)科。根據(jù)不同研究目的和手段，蛋白質(zhì)組學(xué)分為表達(dá)蛋白質(zhì)組學(xué)、結(jié)構(gòu)蛋白質(zhì)組學(xué)和功能蛋白質(zhì)組學(xué)?，F(xiàn)在是5頁(yè)\一共有147頁(yè)\編輯于星期五①表達(dá)蛋白質(zhì)組學(xué)：主要采用經(jīng)典蛋白質(zhì)組學(xué)技術(shù)如雙向凝膠電泳和圖像分析技術(shù)，開展細(xì)胞內(nèi)蛋白樣品表達(dá)的定量研究；②結(jié)構(gòu)蛋白質(zhì)組學(xué)：以繪制出蛋白復(fù)合物結(jié)構(gòu)或存在于一個(gè)特殊的細(xì)胞器中的蛋白為研究目標(biāo)的蛋白質(zhì)組學(xué)，主要用于建立細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)圖譜并解釋某些特定蛋白表達(dá)對(duì)細(xì)胞產(chǎn)生的特定作用；現(xiàn)在是6頁(yè)\一共有147頁(yè)\編輯于星期五③功能蛋白質(zhì)組學(xué)：以細(xì)胞在某一特定時(shí)間所表達(dá)或與某個(gè)功能相關(guān)的蛋白質(zhì)集合為研究對(duì)象進(jìn)行研究和描述，能夠提供有關(guān)蛋白糖基化、磷酸化，蛋白信號(hào)轉(zhuǎn)導(dǎo)通路，疾病機(jī)制或蛋白-藥物之間相互作用的重要信息。現(xiàn)在是7頁(yè)\一共有147頁(yè)\編輯于星期五第二節(jié)蛋白質(zhì)組數(shù)據(jù)的獲取與分析Section2ProteomicsDataAcquisitionandAnalysis現(xiàn)在是8頁(yè)\一共有147頁(yè)\編輯于星期五一、二維凝膠電泳分析技術(shù)2-DE：是將樣品進(jìn)行電泳后在它的直角方向再進(jìn)行一次電泳，又稱雙向電泳。第一向:等電聚焦（isoelectricfocusing，IEF），蛋白質(zhì)沿pH梯度分離至各自的等電點(diǎn)。第二向:是十二磺酸鈉-聚丙烯酰胺凝膠電泳（SDS），蛋白質(zhì)進(jìn)行分子量的分離。（一）定義及特點(diǎn)現(xiàn)在是9頁(yè)\一共有147頁(yè)\編輯于星期五樣品經(jīng)過(guò)電荷和質(zhì)量?jī)纱畏蛛x后，可獲得樣品分子等電點(diǎn)（isoelectricpoint，pI）和分子量（molecularweight，MW）等信息。分離的結(jié)果不是獲得蛋白條帶，而是蛋白斑點(diǎn)。這是迄今分辨率最高、信息最多的蛋白電泳技術(shù)。目前使用廣泛的2-DE蛋白分離的方法為固相pH梯度-SDS雙向凝膠電泳?，F(xiàn)在是10頁(yè)\一共有147頁(yè)\編輯于星期五1.樣品制備目的是從成分復(fù)雜的細(xì)胞、組織等材料中取得純度高的完整蛋白質(zhì)組分。（二）固相pH梯度-SDS雙向凝膠電泳

（IPG-DALT電泳）操作原理及技術(shù)流程現(xiàn)在是11頁(yè)\一共有147頁(yè)\編輯于星期五2.蛋白質(zhì)定量BCA法、Bradford法及UV280法等，但由于這些定量方法都基于吸光度測(cè)定，而樣品溶液中往往含有高濃度尿素等溶劑可能影響吸光度的準(zhǔn)確測(cè)定，故推薦使用雙向電泳蛋白質(zhì)定量專用試劑盒進(jìn)行檢測(cè)?，F(xiàn)在是12頁(yè)\一共有147頁(yè)\編輯于星期五3.一向電泳一向電泳等電聚焦（isoelectricfocusing，IEF），是根據(jù)蛋白質(zhì)pI值不同，在電場(chǎng)力的作用下將其分離?，F(xiàn)在是13頁(yè)\一共有147頁(yè)\編輯于星期五4.一向膠條的平衡進(jìn)行第二向電泳前，需要對(duì)IPG膠條進(jìn)行平衡（equilibration），平衡過(guò)程是將IPG膠條浸沒(méi)在第二向電泳所必需的SDS緩沖體系中，以便被分離蛋白質(zhì)與SDS完全結(jié)合并順利轉(zhuǎn)移入二向電泳的凝膠中。平衡后應(yīng)立即進(jìn)行第二向電泳。現(xiàn)在是14頁(yè)\一共有147頁(yè)\編輯于星期五5.二向電泳即十二烷基磺酸鈉-聚丙烯酰胺凝膠電泳，是根據(jù)分子量大小各異的蛋白質(zhì)在電場(chǎng)中的泳動(dòng)速率不同的原理而分離蛋白質(zhì)的方法。現(xiàn)在是15頁(yè)\一共有147頁(yè)\編輯于星期五6.凝膠檢測(cè)適用于SDS凝膠中蛋白質(zhì)檢測(cè)的方法都可用于雙向電泳凝膠檢測(cè)。銀染和考馬斯亮藍(lán)（R250、G250）染色，是蛋白質(zhì)組研究中最為廣泛使用的兩種染色方法。現(xiàn)在是16頁(yè)\一共有147頁(yè)\編輯于星期五質(zhì)譜（massspectrometry，MS）是按照物質(zhì)的質(zhì)量與電荷的比值（質(zhì)荷比，mass-to-chargeratio，m/z）順序排列成的圖譜。質(zhì)譜分析法是按照離子的質(zhì)荷比大小對(duì)離子進(jìn)行分離和測(cè)定，從而對(duì)樣品進(jìn)行定性和定量分析的一種方法。二、蛋白質(zhì)組質(zhì)譜分析技術(shù)現(xiàn)在是17頁(yè)\一共有147頁(yè)\編輯于星期五質(zhì)譜儀（massspectrometer）是利用電磁學(xué)原理使離子按照質(zhì)荷比進(jìn)行分離，從而測(cè)定物質(zhì)的質(zhì)量與含量的科學(xué)實(shí)驗(yàn)儀器。（一）質(zhì)譜儀現(xiàn)在是18頁(yè)\一共有147頁(yè)\編輯于星期五1.基質(zhì)輔助激光解吸/電離（matrixassistedlaserdesorption/ionization，MALDI）利用激光脈沖將與基質(zhì)結(jié)晶混合的蛋白質(zhì)樣品升華并電離出來(lái)。2.電噴霧（electrpsprayionization，ESI）將分析物從溶液中電離出來(lái)，可以方便地與液相色譜（liquid-chromatography，LC）聯(lián)用。現(xiàn)在是19頁(yè)\一共有147頁(yè)\編輯于星期五1.分子量測(cè)定2.肽譜測(cè)定生物質(zhì)譜通過(guò)與特異性蛋白酶解相結(jié)合，可測(cè)定肽質(zhì)量指紋圖（peptidemassfingerprint，PMF），并獲得全部肽段的準(zhǔn)確分子量，結(jié)合蛋白質(zhì)數(shù)據(jù)庫(kù)檢索就可實(shí)現(xiàn)蛋白質(zhì)的快速鑒別和高通量篩選。（二）質(zhì)譜的應(yīng)用現(xiàn)在是20頁(yè)\一共有147頁(yè)\編輯于星期五3.肽序列測(cè)定串聯(lián)質(zhì)譜技術(shù)可直接用于肽段的測(cè)序，從一級(jí)質(zhì)譜產(chǎn)生的肽段中選擇母離子進(jìn)入二級(jí)質(zhì)譜，經(jīng)惰性氣體碰撞后，肽段沿肽鏈斷裂，由所得各肽段質(zhì)量數(shù)差值推定肽段序列，并用于數(shù)據(jù)庫(kù)查尋，稱為肽序列標(biāo)簽技術(shù)（peptidesequencetag,PST），目前廣泛應(yīng)用于蛋白質(zhì)組大規(guī)模篩選?，F(xiàn)在是21頁(yè)\一共有147頁(yè)\編輯于星期五4.巰基和二硫鍵定位利用生物質(zhì)譜的準(zhǔn)確分子量測(cè)定特性，同時(shí)結(jié)合碘乙酰胺、4-乙烯吡啶等化學(xué)試劑對(duì)蛋白質(zhì)進(jìn)行烷基化和還原烷基化以及蛋白質(zhì)酶切、肽譜技術(shù)等，可實(shí)現(xiàn)對(duì)二硫鍵和自由巰基的快速定位?，F(xiàn)在是22頁(yè)\一共有147頁(yè)\編輯于星期五5.蛋白質(zhì)翻譯后修飾如用MALDI-TOF-MS對(duì)雙向電泳分離蛋白質(zhì)磷酸化位點(diǎn)進(jìn)行定位、MALDI-TOF-MS結(jié)合不同酶解方式確定糖基化位點(diǎn)等?，F(xiàn)在是23頁(yè)\一共有147頁(yè)\編輯于星期五1．MALDI-TOF質(zhì)譜測(cè)定肽質(zhì)量指紋圖將質(zhì)譜分析獲得的肽段分子質(zhì)量與蛋白質(zhì)數(shù)據(jù)庫(kù)中理論肽段的分子質(zhì)量進(jìn)行比較，通過(guò)軟件分析可獲得蛋白質(zhì)信息，根據(jù)匹配情況判斷出所鑒定分析的蛋白質(zhì)是已知的還是未知的。（三）基質(zhì)輔助激光解吸電離飛行時(shí)間質(zhì)譜（MALDI-TOF-MS）分析技術(shù)現(xiàn)在是24頁(yè)\一共有147頁(yè)\編輯于星期五2．MALDI-TOF質(zhì)譜技術(shù)用于蛋白質(zhì)C-端序列分析在質(zhì)譜儀內(nèi)，應(yīng)用源后衰變（post-sourcedecay,PSD）和碰撞誘導(dǎo)解離（collision-induceddissociation,CID）可產(chǎn)生包含有僅異于一個(gè)氨基酸殘基質(zhì)量的一系列肽峰質(zhì)譜。此外，用酶或化學(xué)方法從N-或C-末端按順序除去不同數(shù)目氨基酸，亦可形成大小不同的一系列梯形肽片段，所得的一定數(shù)目肽質(zhì)量由MALDI-TOF-MS測(cè)量?，F(xiàn)在是25頁(yè)\一共有147頁(yè)\編輯于星期五1．電噴霧電離質(zhì)譜測(cè)定蛋白質(zhì)和多肽分子質(zhì)量蛋白質(zhì)和多肽分子經(jīng)電噴霧電離時(shí)，會(huì)吸附一個(gè)或多個(gè)質(zhì)子，形成一系列帶電荷狀態(tài)不同的分子離子，在質(zhì)譜中形成荷質(zhì)比不同的譜峰。一般可根據(jù)譜峰的同位素離子峰分布情況以及利用相鄰兩峰的荷質(zhì)比和電荷數(shù)關(guān)系計(jì)算求得離子分子質(zhì)量。（四）電噴霧質(zhì)譜分析現(xiàn)在是26頁(yè)\一共有147頁(yè)\編輯于星期五2．液相色譜-電噴霧質(zhì)譜法鑒定雙向凝膠電泳蛋白質(zhì)對(duì)雙向凝膠電泳分離的蛋白質(zhì)點(diǎn)經(jīng)酶解后的多肽混合物進(jìn)行液相色譜-電噴霧質(zhì)譜聯(lián)用（LC-ESIMS）鑒定分析，同樣可以得到PMF?，F(xiàn)在是27頁(yè)\一共有147頁(yè)\編輯于星期五串聯(lián)質(zhì)譜的使用能夠?qū)赑MF的結(jié)果進(jìn)行再分析或?qū)ξ促x值的質(zhì)譜峰信號(hào)進(jìn)行研究。對(duì)于初始用PMF法鑒定的蛋白，可選擇其中部分肽段峰進(jìn)行MS/MS分析，得到肽段的序列。（五）串聯(lián)質(zhì)譜（MS/MS）現(xiàn)在是28頁(yè)\一共有147頁(yè)\編輯于星期五三、蛋白質(zhì)芯片分析技術(shù)蛋白質(zhì)芯片（proteinchips）技術(shù)又稱蛋白質(zhì)微陣列（proteinmicroarrays），是一種高通量的、小型化的、平行性的生物檢測(cè)技術(shù)?，F(xiàn)在是29頁(yè)\一共有147頁(yè)\編輯于星期五原理蛋白質(zhì)芯片是將已知蛋白點(diǎn)印在固定于不同種類支持介質(zhì)上，制成由高密度蛋白質(zhì)或多肽分子微陣列組成的蛋白微陣列，陣列中固定分子的位置及組成已知，未經(jīng)標(biāo)記或標(biāo)記（熒光物質(zhì)、酶或化學(xué)發(fā)光物質(zhì)）的生物分子與芯片上探針?lè)磻?yīng)，通過(guò)掃描裝置如激光掃描系統(tǒng)（laserscannerbasessystem）或電荷偶聯(lián)照像系統(tǒng)（chargecoupleddevice-camera，CCD-camera）檢測(cè)信號(hào)強(qiáng)度，量化分析雜交結(jié)果，檢測(cè)蛋白質(zhì)。現(xiàn)在是30頁(yè)\一共有147頁(yè)\編輯于星期五蛋白質(zhì)芯片具有以下特點(diǎn)①特異性強(qiáng)；②敏感性高；③高通量；④重復(fù)性好；⑤應(yīng)用性強(qiáng)；⑥適用范圍廣。現(xiàn)在是31頁(yè)\一共有147頁(yè)\編輯于星期五分類根據(jù)功能：功能研究型芯片（functionalproteinmicroarrays）和分析檢測(cè)型芯片（analyticalproteinmicroarrays）?，F(xiàn)在是32頁(yè)\一共有147頁(yè)\編輯于星期五根據(jù)蛋白質(zhì)種類：抗體芯片和抗原芯片。根據(jù)芯片表面化學(xué)成分：化學(xué)表面芯片和生物表面芯片。根據(jù)點(diǎn)樣蛋白質(zhì)活性功能：無(wú)活性芯片和有活性芯片?，F(xiàn)在是33頁(yè)\一共有147頁(yè)\編輯于星期五根據(jù)載體：普通玻璃載體芯片（plain-glassslide）、多孔凝膠覆蓋芯片（porousgelpadchip）及微孔芯片（microwellchip）等。現(xiàn)在是34頁(yè)\一共有147頁(yè)\編輯于星期五待測(cè)樣品準(zhǔn)備反應(yīng)過(guò)程：待蛋白質(zhì)芯片與被測(cè)樣品溶液在適宜溫度下孵育一定時(shí)間后用PBST洗去未反應(yīng)分子，再根據(jù)不同標(biāo)記物直接檢測(cè)（如熒光標(biāo)記）或顯色后檢測(cè)（如酶標(biāo)記）。蛋白質(zhì)芯片檢測(cè)及分析現(xiàn)在是35頁(yè)\一共有147頁(yè)\編輯于星期五芯片檢測(cè)：對(duì)于熒光標(biāo)記芯片，用熒光掃描儀或激光共聚焦顯微鏡掃描，利用計(jì)算機(jī)分析各點(diǎn)平均熒光密度；對(duì)于酶標(biāo)記芯片，顯色后可用CCD照相機(jī)拍攝，利用計(jì)算機(jī)處理信號(hào)得到各點(diǎn)灰度。現(xiàn)在是36頁(yè)\一共有147頁(yè)\編輯于星期五結(jié)果分析：設(shè)計(jì)對(duì)照反應(yīng)，或設(shè)定陰陽(yáng)性結(jié)果閾值。排除各點(diǎn)熒光密度或灰度背景干擾后與閾值比較并定量分析?，F(xiàn)在是37頁(yè)\一共有147頁(yè)\編輯于星期五應(yīng)用領(lǐng)域基因表達(dá)篩選特異性抗原抗體檢測(cè)蛋白質(zhì)組學(xué)研究蛋白質(zhì)相互作用研究現(xiàn)在是38頁(yè)\一共有147頁(yè)\編輯于星期五四、酵母雙雜交系統(tǒng)酵母雙雜交系統(tǒng)（yeasttwo-hybridsystem）是一種直接于酵母細(xì)胞內(nèi)檢測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用且靈敏度很高的分子生物學(xué)方法?，F(xiàn)在是39頁(yè)\一共有147頁(yè)\編輯于星期五酵母中轉(zhuǎn)錄活化因子GAL4蛋白能激活轉(zhuǎn)錄主要因?yàn)槠涠€(gè)結(jié)構(gòu)可分功能相互獨(dú)立的結(jié)構(gòu)域，即位于氨基（N）端的DNA-BD及位于羧基（C）端的AD。根據(jù)GAL4特性，可構(gòu)建兩種重組質(zhì)粒載體，分別表達(dá)GAL4蛋白的DNA-BD（N端1~147個(gè)氨基酸）和AD（羧基端768~881個(gè)氨基酸）。若在DNA-BD上連接“誘餌”蛋白X基因，在AD上連接“獵物”蛋白Y基因，再將這兩個(gè)質(zhì)粒共同轉(zhuǎn)入酵母體內(nèi)表達(dá)?，F(xiàn)在是40頁(yè)\一共有147頁(yè)\編輯于星期五如果酵母體內(nèi)表達(dá)的蛋白X和Y在酵母核內(nèi)發(fā)生交互作用，可使得DNA-BD和AD在空間上接近，從而激活UAS下游啟動(dòng)子調(diào)節(jié)的酵母特定報(bào)告基因的表達(dá)，使轉(zhuǎn)化子由于報(bào)告基因的表達(dá)而可以在特定的營(yíng)養(yǎng)缺陷培養(yǎng)基上生長(zhǎng)，同時(shí)因激活轉(zhuǎn)錄下游GAL1-LacZ和/或MEL1基因的表達(dá)，從而在X-β-Gal和/或X-α-Gal存在下顯藍(lán)色，可用于排除篩選假陽(yáng)性克隆。這樣可根據(jù)報(bào)告基因是否轉(zhuǎn)錄表達(dá)判斷“誘餌”蛋白X與“獵物”蛋白Y之間相互作用。現(xiàn)在是41頁(yè)\一共有147頁(yè)\編輯于星期五（二）酵母雙雜交系統(tǒng)特點(diǎn)與應(yīng)用1.特點(diǎn)不僅可以精確測(cè)定蛋白質(zhì)間微弱相互作用，且在DNA水平操作，不需要在體外進(jìn)行大量表達(dá)和純化蛋白質(zhì)?，F(xiàn)在是42頁(yè)\一共有147頁(yè)\編輯于星期五2.應(yīng)用分析已知蛋白質(zhì)間相互作用；可篩選cDNA文庫(kù)，分離與已知蛋白作用的新配體及其基因序列。發(fā)現(xiàn)新基因的主要途徑，是研究蛋白間交互作用最有力的工具之一。現(xiàn)在是43頁(yè)\一共有147頁(yè)\編輯于星期五3.局限性轉(zhuǎn)化效率低；適用范圍有限；存在假陽(yáng)性及假陰性；外源蛋白毒性及翻譯后修飾。現(xiàn)在是44頁(yè)\一共有147頁(yè)\編輯于星期五五、RosettaStone方法某物種中基因C的兩個(gè)片段分別與同一物種或另一物種中基因A及基因B同源，既可認(rèn)為基因A與基因B存在功能相關(guān)性，借助于基因C能找到無(wú)同源性的基因A及基因B之間關(guān)聯(lián)?；駽稱為羅塞塔石碑基因（RosettaStonegene），其表達(dá)蛋白稱為羅塞塔石碑蛋白。（一）RosettaStone方法來(lái)源現(xiàn)在是45頁(yè)\一共有147頁(yè)\編輯于星期五根據(jù)羅塞塔石碑蛋白C可預(yù)測(cè)蛋白質(zhì)A與蛋白質(zhì)B之間存在相互作用。該方法理論基礎(chǔ)是基于功能相關(guān)蛋白常常共進(jìn)化的性質(zhì)。現(xiàn)在是46頁(yè)\一共有147頁(yè)\編輯于星期五利用RosettaStone方法，檢索大腸桿菌基因組中4290種編碼蛋白基因在其他生物細(xì)胞基因組的融合情況，共發(fā)現(xiàn)6809對(duì)蛋白能構(gòu)成RosettaStone序列，其中3950對(duì)蛋白能在SWISS-PROT數(shù)據(jù)庫(kù)檢索到注釋功能，有2682對(duì)蛋白共享至少同一個(gè)關(guān)鍵詞，說(shuō)明蛋白對(duì)功能相關(guān)。應(yīng)用此法檢索酵母菌基因組，發(fā)現(xiàn)45502對(duì)相關(guān)蛋白的基因序列。（二）RosettaStone方法的應(yīng)用現(xiàn)在是47頁(yè)\一共有147頁(yè)\編輯于星期五RosettaStone方法預(yù)測(cè)得到的蛋白互作網(wǎng)絡(luò)，必須進(jìn)一步通過(guò)實(shí)驗(yàn)分析以提高其準(zhǔn)確性?？衫檬删w展示技術(shù)、酵母雙雜交系統(tǒng)、免疫共沉淀法、X射線結(jié)晶學(xué)以及表面等離子共振技術(shù)等有效檢測(cè)蛋白質(zhì)相互作用高通量實(shí)驗(yàn)技術(shù)，為蛋白質(zhì)組學(xué)發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ)。現(xiàn)在是48頁(yè)\一共有147頁(yè)\編輯于星期五六、蛋白質(zhì)組學(xué)分析軟件與數(shù)據(jù)庫(kù)1.蛋白質(zhì)表達(dá)分布圖數(shù)據(jù)庫(kù)日內(nèi)瓦大學(xué)的xPASy系統(tǒng)。2.蛋白質(zhì)組圖譜自動(dòng)識(shí)別軟件包肽圖（peptidemapping）包含一個(gè)蛋白質(zhì)全部質(zhì)譜（MS）信息，肽段（peptidefragment）包含蛋白質(zhì)多個(gè)片段質(zhì)譜信息（類似于EST）。（一）常用蛋白質(zhì)組分析工具現(xiàn)在是49頁(yè)\一共有147頁(yè)\編輯于星期五（二）蛋白質(zhì)組分析軟件1.圖像分析2.微量測(cè)序（microsequencing）N-末端Edman降解技術(shù)現(xiàn)在是50頁(yè)\一共有147頁(yè)\編輯于星期五3.質(zhì)譜數(shù)據(jù)質(zhì)譜鑒定主要包括數(shù)據(jù)的計(jì)算機(jī)處理和蛋白質(zhì)的數(shù)據(jù)庫(kù)搜尋鑒定。質(zhì)譜數(shù)據(jù)經(jīng)計(jì)算機(jī)處理后，可使用三種數(shù)據(jù)庫(kù)搜尋方式“鑒定”蛋白質(zhì)：①利用MS數(shù)據(jù)搜尋，即PMF法；②利用“原始”MS/MS數(shù)據(jù)搜尋法；③先對(duì)串聯(lián)質(zhì)譜數(shù)據(jù)進(jìn)行解析，獲得部分多肽片段氨基酸序列后對(duì)蛋白質(zhì)進(jìn)行序列查詢法鑒定。現(xiàn)在是51頁(yè)\一共有147頁(yè)\編輯于星期五4.肽質(zhì)譜指紋圖（PMF）與肽序列測(cè)定由于氨基酸序列不同，蛋白質(zhì)酶（如胰酶）酶解后產(chǎn)生的酶切肽片段序列也不同，其肽混合物質(zhì)量數(shù)具一定特征，稱為肽質(zhì)譜指紋圖（PMF）。現(xiàn)在是52頁(yè)\一共有147頁(yè)\編輯于星期五5.氨基酸組分利用氨基酸組分異質(zhì)性，基于雙向凝膠電泳圖譜鑒定蛋白質(zhì)。多種工具可用于氨基酸組分分析，如AACompIdent、ASA、FINDER、AAC-PI及PROP-SEARCH等?，F(xiàn)在是53頁(yè)\一共有147頁(yè)\編輯于星期五（三）蛋白質(zhì)組數(shù)據(jù)庫(kù)1.綜合性蛋白質(zhì)2DE數(shù)據(jù)庫(kù)具有數(shù)據(jù)直觀性，以蛋白質(zhì)雙向電泳圖片為基礎(chǔ)，并整合其他數(shù)據(jù)庫(kù)中信息，如蛋白質(zhì)序列、結(jié)構(gòu)及功能等。數(shù)據(jù)庫(kù)包括：SWISS2D數(shù)據(jù)庫(kù)、Argonne2D數(shù)據(jù)庫(kù)、MaxPlanck感染生物學(xué)研究所（MPIB）創(chuàng)建的蛋白質(zhì)2D數(shù)據(jù)庫(kù)等?，F(xiàn)在是54頁(yè)\一共有147頁(yè)\編輯于星期五2.哺乳類2DE數(shù)據(jù)庫(kù)丹麥Aarhus大學(xué)人類基因組研究中心的2D數(shù)據(jù)庫(kù)、英國(guó)心臟科學(xué)中心Harefield醫(yī)院維護(hù)的心臟內(nèi)皮細(xì)胞HSC2D數(shù)據(jù)庫(kù)、德國(guó)柏林心臟研究所的人類心肌2D數(shù)據(jù)庫(kù)等?，F(xiàn)在是55頁(yè)\一共有147頁(yè)\編輯于星期五3.微生物類和植物類2DE數(shù)據(jù)庫(kù)微生物類2DE數(shù)據(jù)庫(kù)主要包括細(xì)菌、真菌和寄生蟲三類。植物類2DE數(shù)據(jù)庫(kù)包括：澳大利亞國(guó)立大學(xué)ANU2D、法國(guó)INRACestas的樹木2D等?，F(xiàn)在是56頁(yè)\一共有147頁(yè)\編輯于星期五（四）質(zhì)譜數(shù)據(jù)庫(kù)查詢和蛋白質(zhì)鑒定常用軟件1.PepSea檢索前必須先獲得肽序列標(biāo)簽（PST）。在檢索較大蛋白時(shí)積分較高，隨機(jī)匹配的可能性也較大。2.SEQUEST可使用多個(gè)肽片段序列信息進(jìn)行查詢，無(wú)需人工干預(yù)，但查詢相當(dāng)費(fèi)時(shí)。3.PeptIdent/MultiIdent基于遺傳算法。現(xiàn)在是57頁(yè)\一共有147頁(yè)\編輯于星期五4.ProbID基于概率模型。5.MOWSE（molecularweightsearch）基于概率算法的數(shù)據(jù)庫(kù)查詢軟件。6.ProFound基于Bayesian算法，綜合考慮每個(gè)蛋白質(zhì)序列詳細(xì)信息，同時(shí)考慮了酶解產(chǎn)生肽片段的蛋白質(zhì)序列信息，大大提高算法的靈敏度和選擇性?，F(xiàn)在是58頁(yè)\一共有147頁(yè)\編輯于星期五（五）PMF質(zhì)譜分析基本步驟1.核對(duì)譜圖，扣除本底等因素引起的失真，進(jìn)行峰值校正，選擇分析范圍。（1）相對(duì)豐度：以質(zhì)譜中最強(qiáng)峰為100%（稱基峰），其他碎片峰與之相比的百分?jǐn)?shù)。（2）總離子流（TIC）：即一次掃描得到的所有離子強(qiáng)度之和。現(xiàn)在是59頁(yè)\一共有147頁(yè)\編輯于星期五（3）動(dòng)態(tài)范圍：即最強(qiáng)峰與最弱峰高之比。（4）本底：未進(jìn)樣時(shí)，掃描得到的質(zhì)譜圖，空氣成分、儀器泵油、底物、緩沖液及吸附在離子源中其他樣品等所導(dǎo)致的背景峰?，F(xiàn)在是60頁(yè)\一共有147頁(yè)\編輯于星期五以牛血清白蛋白（bovineserumalbumin,BSA）PMF圖譜為例（圖6-1）。右上角顯示質(zhì)譜分析數(shù)據(jù)。第一列表示實(shí)驗(yàn)肽段質(zhì)量數(shù)，第二列表示理論酶切后肽段質(zhì)量數(shù)，第三列表示BSA酶切后各肽段序列。質(zhì)譜圖中各肽段峰上數(shù)字表示各峰相對(duì)應(yīng)的質(zhì)荷比（m/z）值，（+）表示該實(shí)驗(yàn)峰質(zhì)荷比值與理論酶切后肽段峰質(zhì)荷比值相比配。現(xiàn)在是61頁(yè)\一共有147頁(yè)\編輯于星期五圖6-1BSA的MALDI-TOF質(zhì)譜圖譜現(xiàn)在是62頁(yè)\一共有147頁(yè)\編輯于星期五各標(biāo)記肽段峰上，（+）表示BSA酶切后肽段峰，（M）表示基質(zhì)峰。圖6-2BSA的MALDI-TOF質(zhì)譜圖譜500~900區(qū)域放大圖現(xiàn)在是63頁(yè)\一共有147頁(yè)\編輯于星期五2.確定肽指紋譜峰值數(shù)據(jù)集，剔除與所鑒定蛋白無(wú)關(guān)的質(zhì)量峰經(jīng)剔除基質(zhì)峰、酶自解峰等信號(hào)，圖6-1中BSA的肽指紋質(zhì)量數(shù)數(shù)據(jù)集為，721.355、927.490、1163.654、1249.633、1305.694、1439.850、1479.815、1567.733、1639.953、1871.888、2044.991?，F(xiàn)在是64頁(yè)\一共有147頁(yè)\編輯于星期五3.數(shù)據(jù)庫(kù)搜索及參數(shù)設(shè)置（1）選擇允許的化學(xué)修飾（2）確定可耐受的質(zhì)量數(shù)精確度（masstolerance）（3）確定酶切所用蛋白酶（4）確定允許漏切的酶切位點(diǎn)個(gè)數(shù)（5）確定肽段質(zhì)量數(shù)值（massvalues）及計(jì)算模式（6）根據(jù)搜索蛋白的匹配對(duì)象選擇合適的數(shù)據(jù)庫(kù)及物種（taxonomy）限定（7）確定估計(jì)等電點(diǎn)（pI）及分子量數(shù)值現(xiàn)在是65頁(yè)\一共有147頁(yè)\編輯于星期五現(xiàn)以牛血清白蛋白（bovineserumalbumin，BSA）為例，采用MASCOT搜索工具進(jìn)行PMF分析鑒定（圖6-3、圖6-4、圖6-5、圖6-6）?，F(xiàn)在是66頁(yè)\一共有147頁(yè)\編輯于星期五圖6-3MASCOT搜索主界面現(xiàn)在是67頁(yè)\一共有147頁(yè)\編輯于星期五圖6-4選擇MASCOTPeptideMassFingerprint程序現(xiàn)在是68頁(yè)\一共有147頁(yè)\編輯于星期五圖6-5MASCOTPMF搜索結(jié)果界面現(xiàn)在是69頁(yè)\一共有147頁(yè)\編輯于星期五圖6-6搜索結(jié)果蛋白詳細(xì)信息現(xiàn)在是70頁(yè)\一共有147頁(yè)\編輯于星期五第三節(jié)蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)Section3PredictionofProteinStructure現(xiàn)在是71頁(yè)\一共有147頁(yè)\編輯于星期五一、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)概述1961年提出的Anfinsen原理為從氨基酸序列預(yù)測(cè)蛋白質(zhì)空間結(jié)構(gòu)奠定了理論基礎(chǔ)，即蛋白質(zhì)分子的一級(jí)序列決定其空間結(jié)構(gòu)，而蛋白質(zhì)天然構(gòu)象是能量最低的構(gòu)象。Li和Scheraga等曾用隨機(jī)搜索方法確定多肽構(gòu)象，但單純構(gòu)象搜索對(duì)于結(jié)構(gòu)和自由度復(fù)雜得多的蛋白質(zhì)無(wú)能為力?，F(xiàn)在是72頁(yè)\一共有147頁(yè)\編輯于星期五目前蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法主要發(fā)展自兩個(gè)方向：1.物化理論分析：從頭預(yù)測(cè)2.統(tǒng)計(jì)學(xué)方法：同源建模，折疊識(shí)別現(xiàn)在是73頁(yè)\一共有147頁(yè)\編輯于星期五二、蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法及軟件蛋白質(zhì)中約85％的殘基處于三種穩(wěn)定二級(jí)結(jié)構(gòu)，α螺旋、β折疊和β轉(zhuǎn)角。二級(jí)結(jié)構(gòu)預(yù)測(cè)的目標(biāo)是根據(jù)一級(jí)結(jié)構(gòu)判斷殘基是否處于特定二級(jí)結(jié)構(gòu)。其基本依據(jù)是：每段相鄰的氨基酸殘基具有形成一定二級(jí)結(jié)構(gòu)的傾向，通過(guò)統(tǒng)計(jì)和分析發(fā)現(xiàn)這些傾向或者規(guī)律，二級(jí)結(jié)構(gòu)預(yù)測(cè)問(wèn)題可轉(zhuǎn)化為模式分類和識(shí)別問(wèn)題。現(xiàn)在是74頁(yè)\一共有147頁(yè)\編輯于星期五（一）蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法1.DPM（雙重預(yù)測(cè)方法）先預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)分類再預(yù)測(cè)序列的二級(jí)結(jié)構(gòu)。2.DSC算法首先預(yù)測(cè)基本概念，然后利用簡(jiǎn)單線性統(tǒng)計(jì)方法結(jié)合概念預(yù)測(cè)二級(jí)結(jié)構(gòu)，其準(zhǔn)確率較高?，F(xiàn)在是75頁(yè)\一共有147頁(yè)\編輯于星期五3.PHDsec基于神經(jīng)網(wǎng)絡(luò)系統(tǒng)，被認(rèn)為是二級(jí)結(jié)構(gòu)預(yù)測(cè)的標(biāo)準(zhǔn)。4.SOPMA它用五種相互獨(dú)立方法預(yù)測(cè)，并匯集整理“一致預(yù)測(cè)結(jié)果”，準(zhǔn)確率達(dá)69.5%?，F(xiàn)在是76頁(yè)\一共有147頁(yè)\編輯于星期五5.MLRC算法集GOR4、SIMPA96和SOPMA為一體，處理蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果，并估計(jì)分類的后驗(yàn)概率。6.Jpred1998年由BartonGroup創(chuàng)建，運(yùn)用Jnet神經(jīng)網(wǎng)絡(luò)算法，準(zhǔn)確率可達(dá)到76.4%?，F(xiàn)在是77頁(yè)\一共有147頁(yè)\編輯于星期五（二）蛋白質(zhì)結(jié)構(gòu)域識(shí)別方法目前結(jié)構(gòu)域識(shí)別方法主要包括根據(jù)蛋白質(zhì)空間結(jié)構(gòu)信息利用機(jī)器學(xué)習(xí)方法獲取結(jié)構(gòu)域信息的方法、通過(guò)對(duì)具有代表性三級(jí)結(jié)構(gòu)的蛋白質(zhì)建立隱馬爾可夫模型方法、分析蛋白質(zhì)序列構(gòu)象熵值判定結(jié)構(gòu)域邊界的方法、運(yùn)用神經(jīng)網(wǎng)絡(luò)從蛋白質(zhì)序列獲取結(jié)構(gòu)域邊界方法和基于經(jīng)驗(yàn)的人工劃分方法等?，F(xiàn)在是78頁(yè)\一共有147頁(yè)\編輯于星期五（三）蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)軟件以人基質(zhì)金屬蛋白酶（matrixmetalloproteinase14，MMP14，NCBI蛋白質(zhì)數(shù)據(jù)庫(kù)編號(hào)NP_004986）為例，介紹Jpred、SOPMA及PredictProtein等預(yù)測(cè)軟件。現(xiàn)在是79頁(yè)\一共有147頁(yè)\編輯于星期五1.Jpred（pbio.dundee.ac.uk/~www-jpred/）Jpred首頁(yè)及部分分析結(jié)果見(jiàn)圖6-7，預(yù)測(cè)得到MMP14有8個(gè)α-螺旋區(qū)（H）和21個(gè)β-折疊區(qū)（E），其他區(qū)域均為無(wú)規(guī)則卷曲區(qū)（-）。現(xiàn)在是80頁(yè)\一共有147頁(yè)\編輯于星期五Jpred預(yù)測(cè)二級(jí)結(jié)構(gòu)現(xiàn)在是81頁(yè)\一共有147頁(yè)\編輯于星期五2.SOPMA（https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html）SOPMA主頁(yè)及預(yù)測(cè)結(jié)果如圖6-8所示，MMP14含有螺旋（h）27.66%、延伸鏈（e）19.24%、轉(zhuǎn)角（t）11.34%和無(wú)軌卷曲（c）41.75%?，F(xiàn)在是82頁(yè)\一共有147頁(yè)\編輯于星期五SOPMA預(yù)測(cè)二級(jí)結(jié)構(gòu)現(xiàn)在是83頁(yè)\一共有147頁(yè)\編輯于星期五3.PredictProtein（/）二級(jí)結(jié)構(gòu)預(yù)測(cè)和溶劑可及性分析如圖6-9，目標(biāo)蛋白序列中的Helix（紅）和Strand（藍(lán)）被RePROF（上）和PROFsec（下）兩種方法預(yù)測(cè)出來(lái)，同時(shí)溶劑可及（Exposed，藍(lán)）與不可及（Buried，黃）的殘基也被PROFacc方法計(jì)算出來(lái)。各特征殘基的比例以餅狀圖顯示。現(xiàn)在是84頁(yè)\一共有147頁(yè)\編輯于星期五PredictProtein預(yù)測(cè)現(xiàn)在是85頁(yè)\一共有147頁(yè)\編輯于星期五三、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法及軟件目前，蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法有三類：①比較建模（comparativemodeling，CM）需要與目標(biāo)序列的相似度較高（>30%）的已知結(jié)構(gòu)模板；②當(dāng)缺乏同源性較高的模板時(shí)，就需用復(fù)雜方法獲得合適的模板并產(chǎn)生更確切的比對(duì)，這種過(guò)程被稱為遠(yuǎn)程同源建模（distanthomologymodeling）、折疊識(shí)別（foldrecognition）或穿線法（threading）；③不直接用已知模板的方法稱為自由建模（freemodeling）或從頭預(yù)測(cè)（abinitio）法?，F(xiàn)在是86頁(yè)\一共有147頁(yè)\編輯于星期五（一）比較建模法原理比較建模又稱同源建模（homologymodeling），原理較簡(jiǎn)單，基于進(jìn)化相關(guān)的序列具有相似的三維結(jié)構(gòu)且進(jìn)化過(guò)程中三維結(jié)構(gòu)比序列保守的原理，利用進(jìn)化相關(guān)模板結(jié)構(gòu)信息建?！，F(xiàn)在是87頁(yè)\一共有147頁(yè)\編輯于星期五基本步驟①將目標(biāo)序列作為查詢序列來(lái)搜索PDB和SWISS-PROT等已知蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)，確定和識(shí)別一個(gè)同源模板，或選擇已知結(jié)構(gòu)的同源序列作為建模的模板；②將目標(biāo)序列和模板序列進(jìn)行比對(duì)，利用多種比對(duì)方法或手工校正以改進(jìn)和優(yōu)化靶序列和模板結(jié)構(gòu)的比對(duì)，比對(duì)中可以加入空格；現(xiàn)在是88頁(yè)\一共有147頁(yè)\編輯于星期五③以模板結(jié)構(gòu)骨架作為模型，建立目標(biāo)蛋白質(zhì)骨架模型；④構(gòu)建環(huán)區(qū)（loops）和側(cè)鏈，優(yōu)化側(cè)鏈位置；⑤優(yōu)化和評(píng)估產(chǎn)生的模型，使用能量最小化或其他方法優(yōu)化結(jié)構(gòu)，如利用分子動(dòng)力學(xué)、模擬退火等優(yōu)化結(jié)構(gòu)?，F(xiàn)在是89頁(yè)\一共有147頁(yè)\編輯于星期五比較建模法的局限性最大的挑戰(zhàn)是對(duì)模板鏈進(jìn)行空隙和插入的建模。目標(biāo)蛋白與模板結(jié)構(gòu)保守性的程度及序列比對(duì)的正確性嚴(yán)重影響預(yù)測(cè)模型的準(zhǔn)確性。因此，比較建模主要在序列一致性大于30%的序列間進(jìn)行?，F(xiàn)在是90頁(yè)\一共有147頁(yè)\編輯于星期五（1）SWISS-MODEL服務(wù)器是目前最廣泛使用的基于網(wǎng)絡(luò)的免費(fèi)蛋白質(zhì)3D自動(dòng)建模服務(wù)器。它與ExPASy網(wǎng)站和DeepView程序緊密相聯(lián)。常用比較建模服務(wù)器和軟件現(xiàn)在是91頁(yè)\一共有147頁(yè)\編輯于星期五（2）MODELLER軟件需要用戶提供目標(biāo)序列與其模板的比對(duì)結(jié)果，能夠自動(dòng)計(jì)算由非氫原子組成的模型，并通過(guò)搜索序列數(shù)據(jù)庫(kù)、多序列比對(duì)、聚類、對(duì)高柔性環(huán)區(qū)進(jìn)行從頭建模和多模型優(yōu)化等方法，進(jìn)一步修正模型?，F(xiàn)在是92頁(yè)\一共有147頁(yè)\編輯于星期五（3）HHpred服務(wù)器和軟件既可使用交互式服務(wù)器也可使用下載的軟件進(jìn)行模板的搜索、序列比對(duì)、二級(jí)結(jié)構(gòu)預(yù)測(cè)等同源建模準(zhǔn)備，并利用MODELLER構(gòu)建三維模型?，F(xiàn)在是93頁(yè)\一共有147頁(yè)\編輯于星期五（4）AccelrysDiscoveryStudio軟件是一個(gè)綜合生物大分子結(jié)構(gòu)分析和計(jì)算機(jī)輔助藥物設(shè)計(jì)等多種功能的軟件。整合MODELLER用于同源建模，和后續(xù)模型評(píng)價(jià)。并可進(jìn)行相關(guān)結(jié)構(gòu)域和活性位點(diǎn)分析?，F(xiàn)在是94頁(yè)\一共有147頁(yè)\編輯于星期五（5）MOE（molecularoperatingenvironment）軟件綜合生物大分子結(jié)構(gòu)分析和計(jì)算機(jī)輔助藥物設(shè)計(jì)等多種功能的商業(yè)軟件。其優(yōu)勢(shì)在于可視化工具非常方便，便于對(duì)分子局部操作，對(duì)所建模型進(jìn)一步局部?jī)?yōu)化和修正?，F(xiàn)在是95頁(yè)\一共有147頁(yè)\編輯于星期五（二）折疊識(shí)別法結(jié)構(gòu)在進(jìn)化上的保守性要高于序列。尤其在只能找到同源性小于30%的模板時(shí)比較適用。此方法包括兩步：①將目標(biāo)蛋白序列和已知的折疊進(jìn)行匹配，根據(jù)比對(duì)的進(jìn)化信息在已知的結(jié)構(gòu)中找到一個(gè)或幾個(gè)匹配最好的折疊結(jié)構(gòu)，作為建模的模板。②將目標(biāo)序列的：線“穿”到模板的折疊結(jié)構(gòu)上，拼裝出最好的匹配模型。現(xiàn)在是96頁(yè)\一共有147頁(yè)\編輯于星期五這種方法局限性在于已有的蛋白質(zhì)折疊類型還是有限的，序列相似的蛋白也可能具有明顯不同的折疊模式等等。現(xiàn)在是97頁(yè)\一共有147頁(yè)\編輯于星期五（三）蛋白質(zhì)三維結(jié)構(gòu)的從頭預(yù)測(cè)方法如果目標(biāo)蛋白序列缺乏已知結(jié)構(gòu)的同源蛋白質(zhì)，則可采用從頭預(yù)測(cè)方法（abinitio）或稱自由建模法。從頭預(yù)測(cè)法的理論依據(jù)是Anfinsen假說(shuō)，即在給定條件下蛋白質(zhì)的天然結(jié)構(gòu)對(duì)應(yīng)其自由能最低的狀態(tài)。現(xiàn)在是98頁(yè)\一共有147頁(yè)\編輯于星期五成功的從頭預(yù)測(cè)依賴于以下因素的有效性：①通過(guò)能量?jī)?yōu)化找到的蛋白質(zhì)結(jié)構(gòu)具有充分的結(jié)構(gòu)可靠性和計(jì)算可控性；②符合實(shí)際的力場(chǎng)或其他作用力描述方法；③高效而準(zhǔn)確的搜索構(gòu)象空間重要區(qū)域的算法；④對(duì)獲得結(jié)構(gòu)進(jìn)行準(zhǔn)確評(píng)估的方法。現(xiàn)在是99頁(yè)\一共有147頁(yè)\編輯于星期五四、對(duì)結(jié)構(gòu)預(yù)測(cè)結(jié)果的評(píng)價(jià)1.LiveBench（LB）實(shí)驗(yàn)方法LB不斷地對(duì)各自動(dòng)服務(wù)器進(jìn)行能力評(píng)估，約半年評(píng)估這些預(yù)測(cè)方法一次。2.CASP和CAFASP實(shí)驗(yàn)方法用于檢測(cè)現(xiàn)行建模方法的能力和局限、確定研發(fā)的進(jìn)展并闡明問(wèn)題的瓶頸，是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的一個(gè)重要里程碑?，F(xiàn)在是100頁(yè)\一共有147頁(yè)\編輯于星期五3.EVA實(shí)驗(yàn)方法主要用于二級(jí)結(jié)構(gòu)預(yù)測(cè)、接觸預(yù)測(cè)、比較蛋白質(zhì)結(jié)構(gòu)建模和穿線法/折疊識(shí)別?，F(xiàn)在是101頁(yè)\一共有147頁(yè)\編輯于星期五第四節(jié)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)Section4ProteinStructureDatabases現(xiàn)在是102頁(yè)\一共有147頁(yè)\編輯于星期五PDB：包含了通過(guò)X射線單晶衍射、磁共振和電子衍射等實(shí)驗(yàn)手段確定的蛋白質(zhì)、多糖和核酸等生物大分子的三維結(jié)構(gòu)數(shù)據(jù)。截止到2014年9月16日，PDB總共收錄了103354條結(jié)構(gòu)數(shù)據(jù)，其中，收錄包括95633個(gè)蛋白質(zhì)結(jié)構(gòu)、2726個(gè)核酸結(jié)構(gòu)、4969個(gè)蛋白/核酸復(fù)合物和26個(gè)其他結(jié)構(gòu)。一、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫(kù)（PDB）現(xiàn)在是103頁(yè)\一共有147頁(yè)\編輯于星期五PDB數(shù)據(jù)庫(kù)網(wǎng)站主頁(yè)如圖6-10，在新一代的交互式界面的支持下，其大多數(shù)頁(yè)面可由用戶自行定義不同的顯示面板?，F(xiàn)在是104頁(yè)\一共有147頁(yè)\編輯于星期五圖6-10PDB數(shù)據(jù)庫(kù)及其快速增長(zhǎng)的數(shù)據(jù)量現(xiàn)在是105頁(yè)\一共有147頁(yè)\編輯于星期五PDB數(shù)據(jù)庫(kù)以文本文件的方式存放數(shù)據(jù)，每個(gè)分子各用一個(gè)獨(dú)立的文件,都有唯一的PDB-ID。它包含4個(gè)字符，由大寫字母和數(shù)字組成（如血紅蛋白的PDB-ID為4HHB）。文件中除了原子坐標(biāo)外，還包括物種來(lái)源、化合物名稱、結(jié)構(gòu)以及有關(guān)文獻(xiàn)等基本注釋信息。此外，還給出分辨率、結(jié)構(gòu)因子、溫度系數(shù)、蛋白質(zhì)主鏈數(shù)目、配體分子式、金屬離子、二級(jí)結(jié)構(gòu)信息、二硫鍵位置等和結(jié)構(gòu)有關(guān)的數(shù)據(jù)。現(xiàn)在是106頁(yè)\一共有147頁(yè)\編輯于星期五PDB格式的文件可以用于一些圖形軟件直觀觀察蛋白質(zhì)的三維結(jié)構(gòu)，例如VMD、Jmol、Swiss-PDBviewer及RasMol等。現(xiàn)在是107頁(yè)\一共有147頁(yè)\編輯于星期五PDB數(shù)據(jù)庫(kù)允許用戶用各種關(guān)鍵字進(jìn)行檢索，如功能類別、PDB代碼、名稱、作者、空間群、分辨率、來(lái)源、入庫(kù)時(shí)間、分子式、參考文獻(xiàn)和生物來(lái)源等項(xiàng)。用戶不僅可以得到生物大分子的各種注釋、原子空間坐標(biāo)和三維圖形，并能鏈接到一系列與PDB相關(guān)的數(shù)據(jù)庫(kù)，包括SCOP、CATH、Medline、ENZYME和SWISS-3DIMAGE等。除了使用關(guān)鍵字搜索，用戶也可以按照分類查看PDB數(shù)據(jù)庫(kù)?，F(xiàn)在是108頁(yè)\一共有147頁(yè)\編輯于星期五二、蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)（一）SCOP（http://scop.mrc-lmb.cam.ac.uk/scop/）蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)SCOP,是對(duì)已知蛋白質(zhì)結(jié)構(gòu)進(jìn)行分類的數(shù)據(jù)庫(kù)，根據(jù)不同蛋白質(zhì)的氨基酸組成及三級(jí)結(jié)構(gòu)的相似性，描述已知結(jié)構(gòu)蛋白的功能及進(jìn)化關(guān)系。SCOP數(shù)據(jù)庫(kù)的構(gòu)建除了使用計(jì)算機(jī)程序外，主要依賴于人工驗(yàn)證?，F(xiàn)在是109頁(yè)\一共有147頁(yè)\編輯于星期五SCOP提供一個(gè)非冗余的ASTRAIL序列庫(kù)，通常被用來(lái)評(píng)估各種序列比對(duì)算法；一個(gè)PDB-ISL中介序列庫(kù)，用于比對(duì)搜索與未知結(jié)構(gòu)序列遠(yuǎn)源的已知結(jié)構(gòu)序列；還可以鏈接到PDB等外部數(shù)據(jù)庫(kù)來(lái)檢索更多信息?，F(xiàn)在是110頁(yè)\一共有147頁(yè)\編輯于星期五在SCOP數(shù)據(jù)庫(kù)中對(duì)蛋白質(zhì)的分類基于樹狀層級(jí)，從根到葉依次為類（class）、折疊類型（fold）、超家族（superfamily）、家族（family）、蛋白質(zhì)結(jié)構(gòu)域（proteindomain）、來(lái)源物種（species）、單個(gè)PDB蛋白質(zhì)結(jié)構(gòu)記錄。家族用來(lái)描述相近的蛋白質(zhì)進(jìn)化關(guān)系。超家族用來(lái)描述遠(yuǎn)源的進(jìn)化關(guān)系,如果序列相似性較低，但其結(jié)構(gòu)和功能特性表明有共同的進(jìn)化起源，則將其視作超家族?，F(xiàn)在是111頁(yè)\一共有147頁(yè)\編輯于星期五折疊類型用來(lái)描述空間的幾何關(guān)系，無(wú)論有無(wú)共同的進(jìn)化起源，只要二級(jí)結(jié)構(gòu)單元具有相同的排列和拓?fù)浣Y(jié)構(gòu)，即歸入相同的折疊方式。頂級(jí)的種類class則依據(jù)二級(jí)結(jié)構(gòu)組成分為：全螺旋，全折疊，螺旋和折疊，螺旋＋折疊以及其他特殊種類。這樣的樹狀層次，便于對(duì)目標(biāo)蛋白的結(jié)構(gòu)功能特征進(jìn)行定位。現(xiàn)在是112頁(yè)\一共有147頁(yè)\編輯于星期五（二）CATH（/）四種分類層次：蛋白質(zhì)的種類（class，C）、二級(jí)結(jié)構(gòu)的構(gòu)架（architecture，A）、拓?fù)浣Y(jié)構(gòu)（topology，T）和蛋白質(zhì)同源超家族（homologoussuperfamily，H）?，F(xiàn)在是113頁(yè)\一共有147頁(yè)\編輯于星期五CATH的蛋白質(zhì)種類為全α、全β、α-β（α/β型和α+β型）和低二級(jí)結(jié)構(gòu)四類，其中低二級(jí)結(jié)構(gòu)類是指二級(jí)結(jié)構(gòu)成分含量很低的蛋白質(zhì)分子。第二個(gè)層次是蛋白質(zhì)分子的構(gòu)架,主要考慮α螺旋和β折疊形成超二級(jí)結(jié)構(gòu)的排列方式，而不考慮其連接關(guān)系。這一層次的分類主要依靠人工方法?，F(xiàn)在是114頁(yè)\一共有147頁(yè)\編輯于星期五第三個(gè)層次為拓?fù)浣Y(jié)構(gòu)，即二級(jí)結(jié)構(gòu)的形狀和二級(jí)結(jié)構(gòu)間的聯(lián)系,與SCOP中的折疊模式fold相當(dāng)。第四個(gè)層次為結(jié)構(gòu)的同源性，是先通過(guò)序列比對(duì)再用結(jié)構(gòu)比較來(lái)確定的。現(xiàn)在是115頁(yè)\一共有147頁(yè)\編輯于星期五CATH的主頁(yè)、分類層級(jí)和代表性類別現(xiàn)在是116頁(yè)\一共有147頁(yè)\編輯于星期五三、其他常用蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)1.SWISS-MODEL數(shù)據(jù)庫(kù)（/）收錄的蛋白質(zhì)結(jié)構(gòu)都是使用SWISS-MODEL對(duì)蛋白質(zhì)序列進(jìn)行自動(dòng)同源建模所得到的結(jié)構(gòu)數(shù)據(jù)。直接從PDB中獲得最新的實(shí)測(cè)三維結(jié)構(gòu)，存于其模板數(shù)據(jù)庫(kù)（SMTL）?？商峁┑鞍踪|(zhì)四級(jí)結(jié)構(gòu)和必要的配體和輔助因子的注釋，以方便構(gòu)建完整的結(jié)構(gòu)模型，包括寡聚體結(jié)構(gòu)。現(xiàn)在是117頁(yè)\一共有147頁(yè)\編輯于星期五新版的SWISS-MODEL允許用戶以交互方式搜索模板，根據(jù)序列相似性對(duì)其聚類，從結(jié)構(gòu)上比較不同模板，最后選擇適當(dāng)?shù)哪０逵糜诮⒛Ｐ?并且還允許用戶對(duì)數(shù)據(jù)庫(kù)中的模型質(zhì)量進(jìn)行評(píng)價(jià)。現(xiàn)在是118頁(yè)\一共有147頁(yè)\編輯于星期五2.生物磁共振數(shù)據(jù)庫(kù)（BMRB,/）由美國(guó)威斯康星大學(xué)麥迪遜分校組織構(gòu)建的專門用于存放蛋白質(zhì)、多肽、核酸等物質(zhì)磁共振NMR波譜數(shù)據(jù)，以及對(duì)應(yīng)的分子研究的源數(shù)據(jù)、研究所使用的實(shí)驗(yàn)條件和設(shè)備、與研究相關(guān)的重要出版物等信息?，F(xiàn)在是119頁(yè)\一共有147頁(yè)\編輯于星期五第五節(jié)蛋白質(zhì)功能分析Section5AnalysisofProteinFunction現(xiàn)在是120頁(yè)\一共有147頁(yè)\編輯于星期五一、蛋白質(zhì)功能分析概述蛋白質(zhì)在進(jìn)化中保守的結(jié)構(gòu)通常對(duì)應(yīng)某些保守的生物化學(xué)功能。對(duì)蛋白質(zhì)功能進(jìn)行分類和預(yù)測(cè)的方法主要還是依賴于結(jié)構(gòu)比對(duì),如DaliLite、SSM、STRUCTAL、MultiProt和3DCoffee等。還有一些方法試圖將結(jié)構(gòu)相似性方法與其他方法相結(jié)合進(jìn)行功能預(yù)測(cè)。例如，考慮一個(gè)系統(tǒng)發(fā)育上下文中的結(jié)構(gòu)相似性，會(huì)增加功能注釋精確性。（一）基于結(jié)構(gòu)分類的蛋白質(zhì)功能預(yù)測(cè)現(xiàn)在是121頁(yè)\一共有147頁(yè)\編輯于星期五（二）基于結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)間相互作用1.基于結(jié)構(gòu)的物理對(duì)接主要用于預(yù)測(cè)兩個(gè)蛋白質(zhì)間的相互作用位點(diǎn)，但對(duì)體積很大的蛋白質(zhì)分子，相互作用的可能界面太多而計(jì)算工作量很大?，F(xiàn)在是122頁(yè)\一共有147頁(yè)\編輯于星期五2.基于相互作用界面序列特征模式的預(yù)測(cè)利用統(tǒng)計(jì)分析發(fā)掘蛋白質(zhì)相互作用界面的序列特征信息。主要分為幾類：（1）關(guān)聯(lián)性突變法不需要目標(biāo)蛋白的高級(jí)結(jié)構(gòu)而只需要序列信息，且計(jì)算量比基于結(jié)構(gòu)的物理對(duì)接小得多。（2）聯(lián)用方法聯(lián)用高級(jí)結(jié)構(gòu)和序列信息?，F(xiàn)在是123頁(yè)\一共有147頁(yè)\編輯于星期五（3）人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法利用高級(jí)結(jié)構(gòu)信息和序列特征進(jìn)行訓(xùn)練，可建立蛋白質(zhì)間相互作用界面的預(yù)測(cè)方法。預(yù)測(cè)準(zhǔn)確度可達(dá)到70%。現(xiàn)在是124頁(yè)\一共有147頁(yè)\編輯于星期五二、蛋白質(zhì)功能預(yù)測(cè)方法（一）基于基序的方法基于基序的方法（motif-basedapproaches）通過(guò)識(shí)別功能相關(guān)的蛋白質(zhì)中保守的三維基序，并建立這些保守的基序和保守的蛋白質(zhì)功能間的映射關(guān)系用于預(yù)測(cè)目標(biāo)蛋白質(zhì)的某些生物化學(xué)功能?，F(xiàn)在是125頁(yè)\一共有147頁(yè)\編輯于星期五1.SITE程序和數(shù)據(jù)庫(kù)儲(chǔ)存了酶活性位點(diǎn)保守基序信息用位點(diǎn)匹配程序?qū)ふ谊P(guān)鍵的功能位點(diǎn)殘基作為保守殘基。2.TESS程序采用了幾何散列算法，通過(guò)模板研究和重疊，從蛋白質(zhì)的高級(jí)結(jié)構(gòu)中尋找保守的必須殘基?，F(xiàn)在是126頁(yè)\一共有147頁(yè)\編輯于星期五3.模糊功能形態(tài)（FFF）從三維信息角度認(rèn)證與生物學(xué)功能相關(guān)位點(diǎn)的保守性。4.SPASM同時(shí)用主鏈α碳原子和側(cè)鏈基團(tuán)作為分析對(duì)象，并列尋找保守殘基，并用于搜尋結(jié)構(gòu)數(shù)據(jù)庫(kù)中能匹配的已知功能蛋白?，F(xiàn)在是127頁(yè)\一共有147頁(yè)\編輯于星期五5.分子識(shí)別策略分析是基于已知功能域四周原子的疊合認(rèn)證保守性預(yù)測(cè)蛋白質(zhì)功能。6.蛋白質(zhì)側(cè)鏈的保守模式分析分析重復(fù)出現(xiàn)的氨基酸側(cè)鏈的保守性?，F(xiàn)在是128頁(yè)\一共有147頁(yè)\編輯于星期五（二）基于表面的方法基于表面的方法（surface-basedapproaches）對(duì)給定蛋白質(zhì)進(jìn)行表面模型化，利用與結(jié)構(gòu)相關(guān)聯(lián)的蛋白質(zhì)表面模型，識(shí)別蛋白質(zhì)表面上的結(jié)構(gòu)特征（如空間特征、裂隙等），進(jìn)而利用這些特征來(lái)推斷蛋白質(zhì)功能。SURFACE數(shù)據(jù)庫(kù)提供對(duì)輸入蛋白質(zhì)局部表面特征模式的識(shí)別，以據(jù)此對(duì)蛋白質(zhì)功能進(jìn)行預(yù)測(cè)。這種匹配算法精確性一般能達(dá)到90%左右，但計(jì)算量很大?，F(xiàn)在是129頁(yè)\一共有147頁(yè)\編輯于星期五（三）基于學(xué)習(xí)的方法基于學(xué)習(xí)的方法（learning-basedapproaches）是利用有效的分類方法，從最相關(guān)的結(jié)構(gòu)特征中識(shí)別最合適的功能類別，如SVM和KNN等分類方法?；趯W(xué)習(xí)的方法以蛋白質(zhì)結(jié)構(gòu)特征作為分類依據(jù)，功能分類作為樣本標(biāo)簽，通過(guò)數(shù)據(jù)對(duì)象之間的相似性矩陣對(duì)訓(xùn)練集中的蛋白質(zhì)進(jìn)行結(jié)構(gòu)與功能關(guān)系的評(píng)估。現(xiàn)在是130頁(yè)\一共有147頁(yè)\編輯于星期五三、蛋白質(zhì)結(jié)構(gòu)與功能關(guān)系數(shù)據(jù)庫(kù)（一）Pfam蛋白質(zhì)結(jié)構(gòu)域家族數(shù)據(jù)庫(kù)Pfam收集了大量使用多重序列比對(duì)和隱馬爾科夫模型對(duì)UniProtKB的蛋白質(zhì)序列數(shù)據(jù)進(jìn)行結(jié)構(gòu)域歸類形成的蛋白質(zhì)家族，廣泛用于通過(guò)序列比對(duì)推測(cè)蛋白質(zhì)的結(jié)構(gòu)域排布形式及功能?，F(xiàn)在是131頁(yè)\一共有147頁(yè)\編輯于星期五Pfam包括高質(zhì)量、手工確定的Pfam-A，和用ADDA算法自動(dòng)分類的低質(zhì)量、未注釋的Pfam-B數(shù)據(jù)庫(kù)。Pfam數(shù)據(jù)庫(kù)可使用蛋白質(zhì)或DNA序列搜索蛋白所屬家族，查看該家族的功能注釋和多序列比對(duì)，擴(kuò)展至屬于同一群落的多個(gè)家族，查看一個(gè)目標(biāo)序列的結(jié)構(gòu)域組成，鏈接到該序列在PDB數(shù)據(jù)庫(kù)中的結(jié)構(gòu)，或直接使用關(guān)鍵字搜索?，F(xiàn)在是132頁(yè)\一共有147頁(yè)\

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔