同源模建地方法與結(jié)果分析報(bào)告_第1頁(yè)
同源模建地方法與結(jié)果分析報(bào)告_第2頁(yè)
同源模建地方法與結(jié)果分析報(bào)告_第3頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、同源模建的方法與結(jié)果分析序言:作為一個(gè)以實(shí)驗(yàn)為主的生化工作者來(lái)說(shuō),很多時(shí)候可以通過(guò)分子生物學(xué)手段獲取自己需要的目的基因,并在各種表達(dá)載體和宿主中進(jìn)行對(duì)應(yīng)蛋白的表達(dá),隨后對(duì)于這些蛋白的特性進(jìn)行研究,這也是一般酶學(xué)研究的特定套路。而近十幾年來(lái),人們開(kāi)始思考是否能夠?qū)⑻匦耘c蛋白質(zhì)的三級(jí)結(jié)構(gòu)進(jìn)行關(guān)聯(lián),從分子水平理解蛋白質(zhì)與底物之間的相互作用呢?于是類 似于蛋白結(jié)構(gòu)模建、分子對(duì)接、分子動(dòng)力學(xué)模擬、量化計(jì)算等多種手段相繼被創(chuàng)造以及應(yīng)用。 在這些方法中,同源模建無(wú)疑是最基礎(chǔ)也是最重要的一個(gè)步驟,因?yàn)槠滟|(zhì)量的好壞直接決定了后續(xù)工作是否可信。因此,本文打算就同源模建的基本原理、常用軟件及服務(wù)器以及結(jié)果分析與改進(jìn)

2、提供一些個(gè)人的經(jīng)驗(yàn),并希望各位朋友能夠給予批評(píng)指正。1. 同源模建的原理及應(yīng)用限制兩點(diǎn)基本原理:1. 一個(gè)蛋白質(zhì)的結(jié)構(gòu)由其氨基酸序列唯一的決定。知道其一級(jí)序列,至少在理論上足以 獲取其結(jié)構(gòu)2. 結(jié)構(gòu)在進(jìn)化中更穩(wěn)定,變化比序列層面的變化要緩慢許多。應(yīng)用限制:模板蛋白和目標(biāo)蛋白的序列一致性需要大于30%,且越大建模準(zhǔn)確性越有保障。了解了基本的原理,我們需要知道在實(shí)際操作中,同源模建都需要怎么樣進(jìn)行。同源模建的過(guò)程從實(shí)踐中可分為以下7個(gè)步驟:1. 模板識(shí)別和初始比對(duì)在序列一致性比較高的時(shí)候,可以通過(guò)簡(jiǎn)單的序列比對(duì)程序如BLAST獲取目標(biāo)蛋白的結(jié)構(gòu)(將比對(duì)的數(shù)據(jù)庫(kù)選擇為PDB數(shù)據(jù)庫(kù))。2. 比對(duì)結(jié)果的

3、校正用以上的方法確定一個(gè)或多個(gè)建模模板后,應(yīng)該采用更為精確的方法已取得更優(yōu)的比對(duì)結(jié)果。有時(shí)在序列一致性較低的區(qū)域比對(duì)兩條序列可能會(huì)具有困難,這個(gè)時(shí)候,我們可以采取其他同源蛋白序列一起參與比對(duì)來(lái)找到解決的辦法。3. 主鏈生成比對(duì)完成后,就可以開(kāi)始實(shí)際的建模過(guò)程了,相對(duì)與后面幾步來(lái)說(shuō),主鏈建模時(shí)最 沒(méi)有難度的一步了,因?yàn)榇蟛糠周浖际峭ㄟ^(guò)簡(jiǎn)單的拷貝模板蛋白的主鏈坐標(biāo)來(lái)實(shí) 現(xiàn)這一目的的。4. 環(huán)區(qū)建模這一部分主要是目標(biāo)蛋白和模板蛋白的比對(duì)結(jié)果中存在缺口的部分如何處理的問(wèn) 題。第一種解決的方式是略去模板蛋白存在的殘基,留下一個(gè)必須補(bǔ)上的缺口。另 一種情況是將主鏈截?cái)?,插入缺少的殘基?. 側(cè)鏈建模當(dāng)我

4、們比較結(jié)構(gòu)相似的蛋白質(zhì)中保守殘基的側(cè)鏈構(gòu)象時(shí),我們會(huì)發(fā)現(xiàn)他們的側(cè)鏈構(gòu)象通常會(huì)比較相似。這就告訴我們?nèi)绻颖J貧埢膫?cè)鏈構(gòu)象完整的拷貝到模建蛋 白上時(shí),在某些時(shí)候比先拷貝主鏈構(gòu)象之后,再預(yù)測(cè)側(cè)鏈構(gòu)象來(lái)的可靠。但是這一 經(jīng)驗(yàn)規(guī)則在實(shí)際運(yùn)用中僅在兩者序列一致性較高,并且保守殘基之間形成接觸的情況下才能實(shí)現(xiàn)。因此,在現(xiàn)有的測(cè)序中,都是構(gòu)造各種可能的構(gòu)象體,并利用基于 能量的函數(shù)打分來(lái)實(shí)現(xiàn)側(cè)鏈構(gòu)象的選擇的。6. 模型優(yōu)化模型優(yōu)化其實(shí)是一個(gè)比較復(fù)雜的問(wèn)題,其質(zhì)量依賴于高精確性的預(yù)測(cè)側(cè)鏈構(gòu)象體, 而為了達(dá)到這種目的,我們需要正確的主鏈,這一步驟實(shí)際又依賴于側(cè)鏈構(gòu)象體正 確的堆積。因此,這一優(yōu)化過(guò)程是迭代直至

5、收斂的過(guò)程。需要注意的是,對(duì)于結(jié)構(gòu) 進(jìn)行能量?jī)?yōu)化需要十分謹(jǐn)慎。因此偏離正確結(jié)構(gòu)的途徑比指向正確結(jié)構(gòu)的途徑多很 多。在優(yōu)化中的每一步可以排除一些大的誤差,但是也會(huì)引入很多小的誤差,這些 小的誤差經(jīng)過(guò)多步積累,就有可能使你的結(jié)果更加偏離正確的結(jié)構(gòu)。7. 模型驗(yàn)證所有的模型都包含誤差,誤差的多少主要依賴于兩方面的內(nèi)容:1序列一致性的高低,越低的話弓I入誤差的可能性就越大。2. 模板蛋白中的誤差:如果這種誤差是局域性的,尤其是遠(yuǎn)離活性位點(diǎn)的,對(duì)于你 最后進(jìn)行分子對(duì)接等研究室?guī)缀鯖](méi)有影響的。如果是蛋白整體的,則需要小心處理。2.常用軟件、服務(wù)器2.1常用服務(wù)器: SWISS-MODEL:網(wǎng)址 SWISS

6、-MODEL可能是目前非專業(yè)人士應(yīng)用最為廣泛的一個(gè)在線建模服務(wù)器了。其常見(jiàn)的模式可分為:1. Automated mode :自動(dòng)模式,可以稱為是最傻瓜的方式了pd c # $bwl存I AiiffimrtEiC Mctctnlling MrKl* 世F嚇曲戸TQjzt TI1I1IPrrntB-dH vn srHCfu vrw.a Uirw FsatOad:-aIiiL A|AHl Ari 凸orAla 401rnfS-IDChafnFIP.'進(jìn)去之后只需要填上你的email以及在底下的框框內(nèi)輸入你所想模建的蛋白序列, 再點(diǎn)擊submit modeling request即可,底下還

7、有高級(jí)選項(xiàng),支持自定義模板蛋白 的pdb以及chain,或者自己上傳模板文件,簡(jiǎn)而言之,真是非常易于操作。這 種方法適用于PDB數(shù)據(jù)庫(kù)中存在高度同源的蛋白結(jié)構(gòu)時(shí)的建模(蛋白序列一致性最好大于80%,個(gè)人經(jīng)驗(yàn))2. Alignment mode:比對(duì)模式基本的操作和自動(dòng)模式類似,但是其序列提交的時(shí)候可以提交目標(biāo)蛋白與模板蛋白的序列比對(duì)結(jié)果(FASTA,MSF,ClustalW 等格式),如下所示:Supported Alignment formatsfhe foil awing forrriats are current ly supported: FAS TACLUGTALW, PFAM an

8、d EEL 匚工:Examples-fasta:>THN_DENCLK5 GvPTJAABtTQYM Z CEL E3ZERE 冒匚曲二 5 3CKIH 2 GJGC FF GYRH ->IHBX_TEST>1cieATT亡二WETVAE呂州亡程tFEHFEAT二盒TTTE亡工工工衛(wèi)呑矗工亡衛(wèi)在DY胡一clustal:C?U3TA1 W TMN_DENCL TMNXTE5T IcinA(1*52) rrultiple sequerce 已丄jgiun年ttc英于匚CPTTAARtTQYNI匚只二FGTFRFVCJiJLiFG匚歪TT5GTGCF FEYRH-呼五殖5匚CEDT

9、TGRDIYNTCRrGGGRQVC.RISGCKII 5ASTCPS-YPNK 專 6TTCGPSIVAR5NFNvTCRIFGTFEALCATYTGCI 11PGAT CPGDYAN - 46這種模式比較適合目標(biāo)蛋白與模板蛋白具有較高的相似性,但是利用自動(dòng)模式未必能找到最合適模板的情況,或者使用者有目的的使用特定的模板蛋白(比如具有更為相似的活性位點(diǎn)結(jié)果,而不是更為相似的整體結(jié)構(gòu) )3. Project mode:項(xiàng)目模式項(xiàng)目模式主要是針對(duì)于目標(biāo)蛋白和模板蛋白序列的相似性不高,兩者的三級(jí)結(jié)構(gòu)相似程度難以直接通過(guò)序列比對(duì)獲得,需要人工插入調(diào)節(jié)(借助蛋白結(jié)構(gòu)編輯軟件deepview),這個(gè)模式

10、能夠交互式的提高前面兩種模式的模型質(zhì)量(通過(guò)將前兩種模式模建出的蛋白進(jìn)行人為調(diào)整)。屬于針對(duì)比較困難(序列一致性較低)的建模的一種有效途徑。 (貌似被墻了?)*也可以下載本地安裝包個(gè)人使用評(píng)價(jià):根據(jù)結(jié)果質(zhì)量檢驗(yàn),貌似在用過(guò)的自動(dòng)建模的軟件里是結(jié)果最好的了不過(guò)缺點(diǎn)是給結(jié)果時(shí)間比較長(zhǎng)。個(gè)人使用評(píng)價(jià):這個(gè)軟件需要序列蛋白與模板蛋白的結(jié)構(gòu)比對(duì)文件上傳(FASTA格式),可對(duì)模建的蛋白進(jìn)行l(wèi)oop區(qū)優(yōu)化以及側(cè)鏈優(yōu)化。尚未深入的研究 CPHmodels 3.2 Server: 個(gè)人使用評(píng)價(jià):貌似沒(méi)有任何特色,只需要一條蛋白序列既可以完成自動(dòng)建模。2.2常用軟件: Modeller:說(shuō)到同源模建,不得不提其

11、中大名鼎鼎的modeller,要是做同源模建的娃們沒(méi)有聽(tīng)過(guò)modeller,實(shí)在是不好意思說(shuō)自己玩轉(zhuǎn)了同源模建的。哈哈該軟件由Sali lab開(kāi)發(fā),目前最新的版本是9.11,可在win下和linux運(yùn)行,需要對(duì)應(yīng)版本的pytho n (3.0 )。該軟件好在什么地方呢?主要是可以自己控制的地方特別多,但這個(gè)也給新手帶來(lái)了不少困擾,比如究竟在特定的場(chǎng)合用什么參數(shù)等等。(本人將在自己以后的學(xué)習(xí)過(guò)程中繼續(xù)分享對(duì)這個(gè)軟件的學(xué)習(xí)心得,真的是挺有意思的)可實(shí)現(xiàn)的功能包括:多聚體建模,二硫鍵建模,雜原子建模(配體、輔酶等)。具體的運(yùn)算流程稍后補(bǔ)充:其最成熟的GUI為easymodeller,最新版本為4.0

12、。使用方法稍后補(bǔ)充。3. 同源模建結(jié)果評(píng)價(jià)與改進(jìn)策略在我們通過(guò)各種軟件構(gòu)建出一個(gè)蛋白的同源模型后,我們?nèi)绾卧u(píng)價(jià)這一模型是否準(zhǔn)確?如果不準(zhǔn)確如何進(jìn)行進(jìn)一步的修飾能使其更好的應(yīng)用于我們的后續(xù)模擬中呢?這些問(wèn)題將在本 節(jié)得以討論3.1同源模建結(jié)果的評(píng)價(jià)本人最常使用的結(jié)構(gòu)檢測(cè)方法來(lái)源于UCLA-DOE 的SAVES服務(wù)器,其網(wǎng)址為: VES/提供的檢測(cè)工具包括 5種方法:PROCHECK:該程序可以給出特定蛋白質(zhì)模型的一系列立體化學(xué)參數(shù),并且能以直觀的彩圖輸出部分結(jié)果。 該方法的原理主要是通過(guò)對(duì)蛋白質(zhì)數(shù)據(jù)庫(kù)中高分辨的蛋白晶體結(jié)構(gòu) 的參數(shù)進(jìn)行整理,作為標(biāo)準(zhǔn)參數(shù)。將輸入蛋白結(jié)構(gòu)所具有的參數(shù)與標(biāo)準(zhǔn)參數(shù)進(jìn)行對(duì)

13、比, 如果兩者差異顯著,則說(shuō)明輸入的蛋白結(jié)構(gòu)存在明顯問(wèn)題。其輸出的結(jié)果包括:拉氏圖,主鏈的鍵長(zhǎng)與鍵角,二級(jí)結(jié)構(gòu)圖,平面?zhèn)孺溑c水平面之間的背離程度等。WHATCHECK:包含大量的檢測(cè)項(xiàng),可以針對(duì)給定的蛋白結(jié)構(gòu)與正常結(jié)構(gòu)之間的差異, 產(chǎn)生一個(gè)非常長(zhǎng)而且詳細(xì)的報(bào)告。ERRAT:計(jì)算0.35 nm范圍之內(nèi),不同原子類型對(duì)之間形成的非鍵相互作用的數(shù)目。原 子按照C、N、O/S進(jìn)行分類,所以有六種不同的相互作用類型:CC、CN、CO、NN、NO、 OO。如果這些相互作用類型出現(xiàn)的頻率與正常值相比有較大的區(qū)別,蛋白質(zhì)模 型的質(zhì)量就值得懷疑了 通常使用9個(gè)氨基酸長(zhǎng)度的滑行窗口用于獲得每一個(gè)窗口的相 互作用頻

14、率。類似的分析方法可以用于定位局部有問(wèn)題的區(qū)域。Verify_3D:PROVE:該程序可以比較給定結(jié)構(gòu)的原子體積與預(yù)先計(jì)算好的一系列標(biāo)準(zhǔn)體積之間的 差別。體積的計(jì)算方法采用Voronoi polyhedra幾何模型,通過(guò)在原子及其鄰近原子間放置一個(gè)個(gè)分散的平面來(lái)定義每一個(gè)原子占據(jù)的空間。以下以我研究的一個(gè)酶C-C鍵水解酶BphD的模型進(jìn)行實(shí)例講解:背景:首先利用BLAST進(jìn)行蛋白一致性搜索,找出最合適的蛋白模板,經(jīng)確定為2OG1, 以此蛋白結(jié)構(gòu)為模板,利用 modeller進(jìn)行模建,得到我們的 BphD的初始結(jié)構(gòu),提交到 SAVES服務(wù)器進(jìn)行處理:Suiniiidry1ProchKk * Hn

15、mnrhflnrtlrnin plot:號(hào)鼻啟* cm 3 J*fe fillowOtfliif 0-44b diallPostScript POF JM4 All filnmiicliiiiidradir 1 labellMl rfjidlues (curt of 2B4) '.airbC jPos&cnptj + PDF1 1 3 - cliil ch i J: & 佃鈍 I儲(chǔ)!11U2 )呼噸押 POPImages; 1 2 Main-chain params: b better U inside 0 worseA皿創(chuàng)訂Mfl SMe?dwili paiBMiii

16、s:、better U ini&ide U worse Mrtfcgj* MaF JPC|O¥E:r<ilk 0.03HRMflii# prop*irfte5: MLnx.d*vlnllflin: 4.0 Md ctunfinm.:0 * Bond len/anqle: 6-0 Morris et al lass: 1 1 j + 1 ctsrpeptides G-fadnr% Dihednis: OAD Ccmleatz -fluMPfiiCrtpC PDF1 ?":What checkVerify 3D98.61% of theresidues hadan

17、averaged3D-1D score >0,2UlAULf PintErratqy日別I quav factorPostScript PDF JPC Otifpilf I(WJ沁dieRamachandiHri PlotM14SM訂応喬 5 T45 S)1?5"711Pin1PLa: £ciiisx.L2s_a蘭乂】起社立世± isfl-jm 具日l(shuí)"R翼Wd 331才 4出冒.3 “431 J|LEi 二 gZf二'-fV iM#父 6*psiARi1去.托11H二"MhUTturIU峠 燼怔 附昭峠稔出壬M PV1jS二才白

18、嚇二_r±. raldL_L/dfanhii u tr-u'ii sii二口沖 減> Mdjel11Td& ib/r«£r X rti-JiKi這個(gè)服務(wù)器最好的一點(diǎn)就是可以提供處于各個(gè)區(qū)域的氨基酸殘基占總數(shù)的百分比。拉氏圖的結(jié)果主要分成 4個(gè)區(qū)域:核心區(qū)域,允許區(qū),大致允許區(qū)以及禁阻區(qū)。從圖中可以 看到大部分的氨基酸殘基均位于核心區(qū)域(95.9%),落在允許區(qū)和大致允許區(qū)的各有1個(gè)殘基,而處于禁阻區(qū)的只有殘基Ser112。通過(guò)我們對(duì)這個(gè)蛋白本身的了解可知,Ser112為該水解酶的催化三聯(lián)體,其模板蛋白的Ser112同樣處于禁阻區(qū)。戶pg-日

19、f: ERRA-2亡 naintfjOverall qualitvfastor'*: E9.9202一1>_K'd1C012914D1 旳耳 iwirdofti Genl-er)©th* 祈r Hr 4 20 I鼻就!TIMC博 氓JI肚悄PB«lf他 Wtfi a iosa z bEc m: pqih p t-EEc« :esJ rst eri rrluei41 £沖ai沾自益SE*主自M tx; 31泄 n Z 補(bǔ)1*電站 s宣tv is u6-til>»Q* a< 孕咱I -IB. 3»c Fi

20、QA N6d5itjmlJFfl 2*rwa j srd-JjEiB- /b!n£i b-t- CKM ef ug-if sv 電 iLtQ!- i j Ip 11ft |Q -5<11 曲富即 尊知 3 1W-C B1*%接下來(lái)我們看看 ERRAT的結(jié)果,該結(jié)果中 Overall quality factor值越高越好,一般高解析度的晶體結(jié)構(gòu)該值可以達(dá)到95,而對(duì)于解析度一般的來(lái)說(shuō)該值只能到91%左右。本例中的ERRAT值為89.928,已經(jīng)比較接近低解析度的晶體結(jié)構(gòu)了,但是應(yīng)該還有繼續(xù)改進(jìn) 的空間。在圖中存在的兩條誤差限表示的是位于其線以上的區(qū)域有多大的可能性是有問(wèn) 題的區(qū)

21、域。根據(jù)這一結(jié)果,可以看出從殘基120-150之間是一個(gè)需要高度注意的區(qū)域,另一個(gè)需要注意的區(qū)域是 250-255。從BphD的PDB結(jié)構(gòu)來(lái)看這兩段主要是 loop區(qū),本 身具有較大的彈性,因此再接下來(lái)的過(guò)程中可能需要重點(diǎn)關(guān)注這一段結(jié)構(gòu)的優(yōu)化。其他的參數(shù)如verify_3D等數(shù)值較好,在本例中未詳細(xì)給出,將在下一個(gè)修改版中放出 首先,我們考慮采用計(jì)算量較少的chiron服務(wù)器對(duì)模建結(jié)構(gòu)的clash進(jìn)行處理。其結(jié)果給出原始蛋白結(jié)構(gòu)中存在的結(jié)構(gòu)間的沖突以及其修正后的結(jié)果與原始結(jié)構(gòu)的疊合結(jié)果。In 1 i -rJ f-1 ka c-.-Irl m i3 L- Enp ut- Di t.mcii |A

22、AuJusi 1;眄1電円(AVOW Ry t>Uk-'£.1 a (ktal rwoOo6C02號(hào)3.6002.929137*oEOG193 2002S900 37&GS9C0彌4 4£SH 653M19Q0783破D3 157a 524CA10OO12S 955 Z32OG10NE23.2D02.G510.56011CD2263.血3.041(LS52cs14OO1223 6603.092(j 34/U001爼3貂05. ?&S2 017CD14cs244 1193 394(J *34CD14OO1223 6602 8261 B5ZCE14CG24d 11B3 06&1 ?50NZ14CG243 &602.05S1.SB200116CA212轉(zhuǎn)百弓皿QWCE1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論