蛋白質(zhì)的序列分析及結(jié)構(gòu)預測_第1頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預測_第2頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預測_第3頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預測_第4頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預測_第5頁
已閱讀5頁,還剩134頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

蛋白質(zhì)的序列分析及結(jié)構(gòu)預測當前第1頁\共有139頁\編于星期六\10點DNAsequenceProteinsequenceProteinstructureProteinfunction當前第2頁\共有139頁\編于星期六\10點一、蛋白質(zhì)數(shù)據(jù)庫介紹二、蛋白質(zhì)序列分析三、蛋白質(zhì)結(jié)構(gòu)預測四、應用分子設計當前第3頁\共有139頁\編于星期六\10點一、蛋白質(zhì)數(shù)據(jù)庫介紹蛋白質(zhì)的結(jié)構(gòu)主要分為四級,一級結(jié)構(gòu)、二級結(jié)構(gòu)、三級結(jié)構(gòu)以及四級結(jié)構(gòu)。依據(jù)這種結(jié)構(gòu)層次,將蛋白質(zhì)數(shù)據(jù)庫分為:1.蛋白質(zhì)序列數(shù)據(jù)庫:如PIR、SWISS-PROT、NCBI,這些數(shù)據(jù)庫的數(shù)據(jù)主要以蛋白質(zhì)的序列為主,并賦予相應的注釋;2.蛋白質(zhì)模體及結(jié)構(gòu)域數(shù)據(jù)庫:如PROSITE、Pfam,這些數(shù)據(jù)庫主要收集了蛋白質(zhì)的保守結(jié)構(gòu)域和功能域的特征序列;3.蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:如PDB等,這些數(shù)據(jù)庫主要以蛋白質(zhì)的結(jié)構(gòu)測量數(shù)據(jù)為主;4.蛋白質(zhì)分類數(shù)據(jù)庫:如SCOP、CATH、FSSP等,這其中有以序列比較為基礎的序列分類數(shù)據(jù)庫以及以結(jié)構(gòu)比較為基礎的結(jié)構(gòu)分類數(shù)據(jù)庫之分。當前第4頁\共有139頁\編于星期六\10點蛋白質(zhì)數(shù)據(jù)庫特征:

這些數(shù)據(jù)庫種類有差別,但內(nèi)部是相互聯(lián)系的.

每個數(shù)據(jù)庫都有指針指向其他數(shù)據(jù)庫,而且數(shù)據(jù)庫之間的序列以及相應的結(jié)構(gòu)是共享的,同一種蛋白質(zhì)依次會出現(xiàn)在不同的數(shù)據(jù)庫.這樣的數(shù)據(jù)溝通有助于更深層地挖掘蛋白質(zhì)的內(nèi)在生物信息,這些數(shù)據(jù)庫是融序列信息的索取、處理、存儲、輸出于一身的。當前第5頁\共有139頁\編于星期六\10點1.蛋白質(zhì)序列數(shù)據(jù)庫(1)PIR(proteininformationresource,PIR)和PSD(proteinsequencedatabase,PSD)

PIR-PSD是一個綜合全面的、非冗余的、專業(yè)注釋的、分類完整的蛋白質(zhì)序列數(shù)據(jù)庫。PIR-PSD的序列來自于將GenBank/EMBL/DDBJ三大數(shù)據(jù)庫的編碼序列的翻譯而成的蛋白質(zhì)序列、發(fā)表的文獻中的序列和用戶直接提交的序列。(2)SWISS-PROT/TrEMBL數(shù)據(jù)庫

數(shù)據(jù)庫由蛋白質(zhì)序列條目構(gòu)成,每個條目包含蛋白質(zhì)序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)錄后修飾位點、特殊位點和區(qū)域、二級結(jié)構(gòu)、四級結(jié)構(gòu)、與其他序列的相似性、序列殘缺與疾病的關系、序列變異體等信息。當前第6頁\共有139頁\編于星期六\10點2.模體以及結(jié)構(gòu)域數(shù)據(jù)庫模體數(shù)據(jù)庫(1)PROSITE蛋白質(zhì)家族及結(jié)構(gòu)域數(shù)據(jù)庫(/)PROSITE數(shù)據(jù)庫收集了有顯著生物學意義的蛋白質(zhì)位點序列、蛋白質(zhì)特征序列譜庫以及序列模型,并能依據(jù)這些特征屬性快速可靠地鑒定出一個未知功能蛋白質(zhì)序列屬于哪個蛋白質(zhì)家族,即使在蛋白質(zhì)序列相似性很低的情況下,也可以通過搜索隱含的功能結(jié)構(gòu)模體(motif)來鑒定,因此是有效的序列分析數(shù)據(jù)庫。PROSITE中涉及的序列模式包括酶的催化位點、配體結(jié)合位點、金屬離子結(jié)合位點、二硫鍵、小分子或者蛋白質(zhì)結(jié)合區(qū)域等,此外PROSITE還包括由多序列比對構(gòu)建的序列表譜(profile),能更敏感地發(fā)現(xiàn)序列中的信息。當前第7頁\共有139頁\編于星期六\10點PROSITE同時數(shù)據(jù)庫提供了序列分析工具:①ScanProsite

是用于搜索所提交的序列數(shù)據(jù)是否包含PROSITE數(shù)據(jù)庫中的序列模式或者SWISS-PROT數(shù)據(jù)庫中已提交的序列模式;②MotifScan

用于查找未知序列中所有可能的已知結(jié)構(gòu)組件,數(shù)據(jù)庫包括PROSITE序列表譜、PROSITE模式、Pfam收集的隱馬爾可夫模式(HMM)。當前第8頁\共有139頁\編于星期六\10點(2)PRINTSFingerprintDatabase

這個數(shù)據(jù)庫包含1500個蛋白質(zhì)指紋圖譜,編碼9136個單一模體。(3)BLOCKS(

)BLOCKS是通過一些高度保守的蛋白質(zhì)區(qū)域比對出來的無空位的片段。模體數(shù)據(jù)庫當前第9頁\共有139頁\編于星期六\10點蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫

(1)蛋白質(zhì)家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫Pfam(proteinfamiliesdatabaseofalignmentsandHMMs)Pfam是蛋白質(zhì)家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫,其網(wǎng)址是:。(2)蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫ProDom

http://(3)SMARTSMART是一個簡單的結(jié)構(gòu)研究工具,可對可轉(zhuǎn)移的遺傳因子進行鑒定和注解,以及分析結(jié)構(gòu)域結(jié)構(gòu),可以檢測出500多個參與信號傳導、胞外和染色體相關蛋白質(zhì)的結(jié)構(gòu)域家族,對這些結(jié)構(gòu)域又在系統(tǒng)進化樹分布、功能分類、三級結(jié)構(gòu)和重要的功能殘基方面做了注解。

/當前第10頁\共有139頁\編于星期六\10點3.蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB(proteindatabank,PDB)

PDB包括了蛋白質(zhì)、核酸、蛋白質(zhì)-核酸復合體以及病毒等生物大分子結(jié)構(gòu)數(shù)據(jù),主要是蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù),這些數(shù)據(jù)來源于幾乎全世界所有從事生物大分子結(jié)構(gòu)研究的研究機構(gòu),并由RCSB維護和注釋。當前第11頁\共有139頁\編于星期六\10點4.蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(1)CATH數(shù)據(jù)庫

(2)SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(structuralclassificationofproteindatabase,SCOP)

當前第12頁\共有139頁\編于星期六\10點二、蛋白質(zhì)的序列分析1.蛋白質(zhì)序列信息的獲取

2.蛋白質(zhì)序列分析

當前第13頁\共有139頁\編于星期六\10點1.蛋白質(zhì)序列信息的獲取(1)直接測序(2)翻譯編碼的DNA序列ORFFinder(3)在數(shù)據(jù)庫中搜索運用ID號、入口號、條目號等搜索。運用關鍵詞搜索其他方式搜索。如可以通過引用序列的文獻、序列的作者、序列提交的日期等進行搜索。當前第14頁\共有139頁\編于星期六\10點(1)直接測序e.g.ProteinSequencingandIdentificationbyTandem

MassSpectrometry,即用串聯(lián)質(zhì)譜儀測序1.蛋白質(zhì)序列信息的獲取當前第15頁\共有139頁\編于星期六\10點串聯(lián)質(zhì)譜及其作用兩個或更多的質(zhì)譜連接在一起,稱為串聯(lián)質(zhì)譜。最簡單的串聯(lián)質(zhì)譜(MS|MS)由兩個質(zhì)譜串聯(lián)而成,其中第一個質(zhì)量分析器(MS1)將離子預分離或加能量修飾,由第二級質(zhì)量分析器(MS2)分析結(jié)果。

當前第16頁\共有139頁\編于星期六\10點

串聯(lián)質(zhì)譜儀的組合方式:(1)磁分析器-靜電分析器-磁分析器

(2)靜電分析器-磁分析器-靜電分析器

(3)三重四極濾質(zhì)器質(zhì)譜儀

(4)混合式串聯(lián)質(zhì)譜儀,如MA-ESA-Q-Q。實現(xiàn)串聯(lián)質(zhì)譜有空間串聯(lián)和時間串聯(lián)兩種方式。

當前第17頁\共有139頁\編于星期六\10點

優(yōu)點:可以避免底物分子產(chǎn)生的干擾,大大降低背景噪音。其次,可使分子離子通過與反應氣的碰撞來產(chǎn)生斷裂。因此能提供更多的結(jié)構(gòu)信息,所以串聯(lián)質(zhì)譜特別適合于復雜組分體系且干擾嚴重的樣品中低含量組分分析測定,具有比GC-MS和LC-MS等一級質(zhì)譜更高的選擇性和靈敏度。當前第18頁\共有139頁\編于星期六\10點MassesofAminoAcidResidues當前第19頁\共有139頁\編于星期六\10點ProteinbackboneH...-HN-CH-CO-NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1AAresiduei-1AAresidueiAAresiduei+1N-terminusC-terminus當前第20頁\共有139頁\編于星期六\10點BreakingProteinintoPeptidesandPeptidesintoFragmentIonsProteases,e.g.trypsin(胰蛋白酶),breakproteinintopeptides.ATandemMassSpectrometer(串聯(lián)式質(zhì)譜儀)furtherbreaksthepeptidesdownintofragmentionsandmeasuresthemassofeachpiece.Generalforsequencing當前第21頁\共有139頁\編于星期六\10點BreakingProteinintoPeptidesandPeptidesintoFragmentIonsMassSpectrometeracceleratesthefragmentedions;heavierionsaccelerateslowerthanlighterones.MassSpectrometermeasuremass/chargeratioofanion.Generalforsequencing當前第22頁\共有139頁\編于星期六\10點PeptideFragmentationPeptidestendtofragmentalongthebackbone.FragmentscanalsolooseneutralchemicalgroupslikeNH3andH2O.H...-HN-CH-CO

...

NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1H+PrefixFragmentSuffixFragmentCollisionInducedDissociation當前第23頁\共有139頁\編于星期六\10點N-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides當前第24頁\共有139頁\編于星期六\10點TerminalpeptidesandiontypesPeptideMass(D)57+97+147+114=415H2OPeptideMass(D)57+97+147+114–18=397H2Owithout當前第25頁\共有139頁\編于星期六\10點N-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides415

486

30115457

71185332429當前第26頁\共有139頁\編于星期六\10點N-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides415

486

30115457

71185332429當前第27頁\共有139頁\編于星期六\10點PeptideFragmentationy3b2y2y1b3a2a3

HONH3+||

R1OR2OR3

OR4||||||||||H--NCCNCCNCCNC--COOH|||||||HHHHHHHb2-H2Oy3-H2Ob3-NH3y2-NH3當前第28頁\共有139頁\編于星期六\10點MassSpectraGVDLKmass057Da=‘G’

99Da=‘V’LK

DVGThepeaksinthemassspectrum:Prefix

Fragmentswithneutrallosses(-H2O,-NH3)Noiseandmissingpeaks.andSuffixFragments.DH2O當前第29頁\共有139頁\編于星期六\10點ProteinIdentificationwithMS/MSGVDLKmass0Intensitymass0MS/MSPeptideIdentification:當前第30頁\共有139頁\編于星期六\10點TandemMass-Spectrometry當前第31頁\共有139頁\編于星期六\10點BreakingProteinsintoPeptidespeptidesMPSER……GTDIMRPAKID……HPLCToMS/MSMPSERGTDIMRPAKIDprotein當前第32頁\共有139頁\編于星期六\10點MassSpectrometryMatrix-AssistedLaserDesorption/Ionization(MALDI)基質(zhì)輔助激光解吸質(zhì)譜

當前第33頁\共有139頁\編于星期六\10點基質(zhì)輔助激光解吸飛行時間質(zhì)譜儀

MALDI-TOF-MSMALDI-TOF-MS是近年來發(fā)展起來的一種軟電離新型有機質(zhì)譜。近年來已成為檢測和鑒定多肽、蛋白質(zhì)、多糖、核苷酸、糖蛋白、高聚物以及多種合成聚合物的強有力工具。原理:當用一定強度的激光照射樣品與基質(zhì)形成的共結(jié)晶薄膜,基質(zhì)從激光中吸收能量,基質(zhì)-樣品之間發(fā)生電荷轉(zhuǎn)移使得樣品分子電離,電離的樣品在電場作用下加速飛過飛行管道,根據(jù)到達檢測器的飛行時間不同而被檢測,即測定離子的質(zhì)量電荷之比與離子的飛行時間成正比來檢測離子。MALDI-TOF-MS的中心技術就是依據(jù)樣品的質(zhì)荷比(m/z)的不同來進行檢測,并測得樣品分子的分子量。當前第34頁\共有139頁\編于星期六\10點TandemMassSpectrometryScan1708LCScan1707MSMS/MSIonSourceMS-1collisioncellMS-2當前第35頁\共有139頁\編于星期六\10點多肽片段指紋圖譜(PFF)

步驟:用酶專一性酶解蛋白質(zhì),經(jīng)過分離,得到的肽段在質(zhì)譜中被選擇和破碎后得到MS/MS譜圖,與數(shù)據(jù)庫中的譜圖比較進行鑒定

代表方法:

LC-ESI-MS/MS2D-LC-MS/MS(shotgun)當前第36頁\共有139頁\編于星期六\10點1.蛋白質(zhì)序列信息的獲?。?)翻譯編碼的DNA序列

e.g.用“ORFFinder”程序找到DNA的開放閱讀框。網(wǎng)址:當前第37頁\共有139頁\編于星期六\10點當前第38頁\共有139頁\編于星期六\10點當前第39頁\共有139頁\編于星期六\10點1.蛋白質(zhì)序列信息的獲?。?)在數(shù)據(jù)庫中搜索e.g.PIR-PSDdatabase:

SWISS-PROT/TrEMBLdatabase

當前第40頁\共有139頁\編于星期六\10點目前大部分蛋白質(zhì)序列是通過DNA人工翻譯過來的,實際上很少有人能獲得真正的蛋白質(zhì),因而實驗證據(jù)就很難直接獲得,因此對蛋白質(zhì)序列初始分析是很有價值的。比如,通過一些序列分析工具進行蛋白質(zhì)理化特性的預測、修飾位點的預測等。2.蛋白質(zhì)序列分析當前第41頁\共有139頁\編于星期六\10點1.蛋白質(zhì)序列的基本性質(zhì)分析理化性質(zhì)分析,疏水性分析,跨膜區(qū)分析,信號肽預測,Coil區(qū)分析,亞細胞定位2.序列數(shù)據(jù)庫搜索

相似性搜索,模體的搜索3.結(jié)構(gòu)域定位4.空間結(jié)構(gòu)預測二級結(jié)構(gòu)及三級結(jié)構(gòu)預測,結(jié)構(gòu)預測方法評價

蛋白質(zhì)序列分析主要內(nèi)容:當前第42頁\共有139頁\編于星期六\10點1.蛋白質(zhì)序列的基本性質(zhì)分析(1)理化性質(zhì)分析分子質(zhì)量、分子式、理論等電點、氨基酸組成、消光系數(shù)、穩(wěn)定性等理化特性。例,利用ProtParam工具

當前第43頁\共有139頁\編于星期六\10點理化指標CLCLAP分子式C1615H2420N428O535S16C1211H1951N319O364S3分子量36904.426899.9理論等電點pI4.476.20總原子數(shù)50143848消光系數(shù)(280nm)754555960半衰期(小時)哺乳動物,體外3030酵母,體內(nèi)>20>20大腸桿菌,體內(nèi)>10>10不穩(wěn)定性指數(shù)31.7229.59脂肪族指數(shù)63.73105.18總體親水性-0.5420.109CL和CLAP的理化性質(zhì)預測結(jié)果

CL:組織蛋白酶L

CLAP:組織蛋白酶L相關蛋白

當前第44頁\共有139頁\編于星期六\10點(2)疏水性分析

氨基酸側(cè)鏈的疏水性用從各氨基酸減去甘氨酸疏水性之值來表示,蛋白質(zhì)的疏水性在保持蛋白質(zhì)三級結(jié)構(gòu)的形成和穩(wěn)定中起著重要作用。e.g.利用ProtScale工具利用BioEdit軟件分析當前第45頁\共有139頁\編于星期六\10點海參溶菌酶親水性/疏水性分析Score>0,表示疏水性;Score<0,表示親水性當前第46頁\共有139頁\編于星期六\10點(3)跨膜區(qū)分析

蛋白質(zhì)含有跨膜區(qū)提示它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白或離子通道蛋白。例,使用在線分析當前第47頁\共有139頁\編于星期六\10點鋁激活蘋果酸的轉(zhuǎn)運蛋白(TaALMT1)跨膜結(jié)構(gòu)分析當前第48頁\共有139頁\編于星期六\10點(4)信號肽預測信號肽:指分泌蛋白表達時氨基端的20余個氨基酸,將引導該蛋白質(zhì)最終分泌至細胞外,但這段信號肽會被信號肽酶切掉,所以成熟的分泌蛋白是不含這段信號肽的。用于指導蛋白質(zhì)的跨膜轉(zhuǎn)移(定位)的N末端的氨基酸序列,一般由15-30個氨基酸組成。使用SignalP在線分析http:///當前第49頁\共有139頁\編于星期六\10點海參溶菌酶信號肽預測Conclusion:cleavagesitebetweenpos.20and21:ASG-QV當前第50頁\共有139頁\編于星期六\10點(5)Coil區(qū)分析蛋白質(zhì)中由2-7條α螺旋鏈相互纏繞形成類似麻花狀結(jié)構(gòu)的總稱;主要存在形式是2-5條相互纏繞形成的平行或反平行同寡聚體或異寡聚體;是控制蛋白質(zhì)寡聚化的元件,轉(zhuǎn)錄因子、骨架蛋白、動力蛋白、膜蛋白、酶等;七肽重復區(qū)。e.g.使用COILS服務器分析http://當前第51頁\共有139頁\編于星期六\10點(6)亞細胞定位根據(jù)氨基酸組成可以進行亞細胞定位不同細胞器多具不同的理化環(huán)境,它會根據(jù)蛋白質(zhì)的結(jié)構(gòu)及表面理化特征選擇性容納蛋白質(zhì);蛋白質(zhì)表面直接暴露于細胞器環(huán)境中,它由序列折疊過程決定,而后者取決于氨基酸組成。亞細胞定位的步驟在線分析工具e.g.使用TargetPhttp:///當前第52頁\共有139頁\編于星期六\10點組織蛋白酶CL和相關蛋白CLAP的亞細胞定位蛋白質(zhì)各亞細胞位點出現(xiàn)可能性(%)細胞質(zhì)內(nèi)質(zhì)網(wǎng)線粒體細胞核空泡分泌性小囊泡高爾基體質(zhì)膜細胞支架CL34.8--CLAP26.14.313.013.04.317.44.313.04.3結(jié)果證明,CL和CLAP出現(xiàn)幾率最高的位點都為胞質(zhì),說明它們都為胞漿內(nèi)蛋白,這也為今年來在溶酶體內(nèi)外都發(fā)現(xiàn)組織蛋白酶活性提供了證據(jù)。當前第53頁\共有139頁\編于星期六\10點(1)相似性搜索(或同源搜索)①一個新序列與序列數(shù)據(jù)庫中的序列比對,從而找到同源或者相似序列。②常用程序是BLASTp。2.序列數(shù)據(jù)庫搜索當前第54頁\共有139頁\編于星期六\10點當前第55頁\共有139頁\編于星期六\10點(2)模體(motif)的搜索這是另一種序列搜索方法,其目的是尋找蛋白質(zhì)中結(jié)構(gòu)域或者功能域。這個方法不是給每個位置的氨基酸打分,然后得到一個相似程度,而是直接描述關鍵的幾個保守殘基,同時忽略其他位置的氨基酸多態(tài)性,這些保守的序列有時會稱為“標志”(signature),就是所謂的模式序列(pattern)。當前第56頁\共有139頁\編于星期六\10點Motif搜索即模體搜索,是序列中局部的保守區(qū)域,或是一組序列中共有的一小段序列模式。使用PROSITE數(shù)據(jù)庫進行motif搜索

模式序列常表示為:

[AG]-x-V-x(2)-x-{YW}

[

]showseitheraminoacid

x

isanyaminoacid

x(2)anyaminoacidinthenext2positions

{

}showsanyaminoacidexceptthese當前第57頁\共有139頁\編于星期六\10點模體的搜索舉例:有序列表示為:H-[FW]-x-[LIVM]-x-G-x(5)-[LV]-H-x(3)-[DE]這是描述一個DNA結(jié)合蛋白質(zhì)家族的,可以理解為組氨酸,接著是苯丙氨酸或者色氨酸,緊接一個氨基酸x,然后可以是亮氨酸、異亮氨酸、纈氨酸、或者甲硫氨酸??,這樣一段序列由于處于活性區(qū)域或者蛋白質(zhì)的重要結(jié)構(gòu)區(qū),所以特別保守,因此也是序列搜索的目標之一。當前第58頁\共有139頁\編于星期六\10點3.結(jié)構(gòu)域定位通過將序列在數(shù)據(jù)庫中搜索,可以了解到序列的一些信息,接下來就可以進行結(jié)構(gòu)域的定位,這樣就對以后的結(jié)構(gòu)預測有了一個比較清醒的認識。如果蛋白質(zhì)序列的長度大于500個氨基酸,就可以根據(jù)搜索的情況(比如按相似性高低或者結(jié)構(gòu)域多少等)將蛋白質(zhì)分割成多個不連續(xù)的區(qū)域,最好將這一段一段的序列分別鑒別。

當前第59頁\共有139頁\編于星期六\10點什么是結(jié)構(gòu)域?結(jié)構(gòu)域是在二級結(jié)構(gòu)或超二級結(jié)構(gòu)的基礎上形成三級結(jié)構(gòu)的局部折疊區(qū),一條多肽鏈在這個域范圍內(nèi)來回折疊,但相鄰的域常被一個或兩個多肽片段連結(jié)。通常由50-300個氨基酸殘基組成,其特點是在三維空間可以明顯區(qū)分和相對獨立,并且具有一定的生物功能如結(jié)合小分子。模體(motif)是結(jié)構(gòu)域的亞單位,通常由2~3二級結(jié)構(gòu)單位組成,一般為α螺旋、β折疊和環(huán)(loop)。結(jié)構(gòu)域定位當前第60頁\共有139頁\編于星期六\10點二聚體蛋白結(jié)構(gòu)域當前第61頁\共有139頁\編于星期六\10點結(jié)構(gòu)域和功能域?qū)δ切┹^小的球狀蛋白質(zhì)分子或亞基來說,結(jié)構(gòu)域和三級結(jié)構(gòu)是一個意思,也就是說這些蛋白質(zhì)或亞基是單結(jié)構(gòu)域的,如紅氧還蛋白等;較大的蛋白質(zhì)分子或亞基其三級結(jié)構(gòu)一般含有兩個以上的結(jié)構(gòu)域,即多結(jié)構(gòu)域的,其間以柔性的鉸鏈(hinge)相連,以便相對運動。結(jié)構(gòu)域有時也指功能域。功能域是蛋白質(zhì)分子中能獨立存在的功能單位,它可以是一個結(jié)構(gòu)域,也可以是由兩個或兩個以上結(jié)構(gòu)域組成。結(jié)構(gòu)域定位當前第62頁\共有139頁\編于星期六\10點結(jié)構(gòu)域定位結(jié)構(gòu)域是蛋白序列的功能、結(jié)構(gòu)和進化單元分析方法:序列比對單條蛋白質(zhì)序列可以包含一個或多個結(jié)構(gòu)域當前第63頁\共有139頁\編于星期六\10點基本類型:

64α-螺旋型

全β-折疊型

α/β型α+β型當前第64頁\共有139頁\編于星期六\10點結(jié)構(gòu)域定位分析一般流程:(1)探測序列與其他全序列之間有無同源性.如果有,那么這是該段序列為結(jié)構(gòu)域的很好證據(jù),然后進行結(jié)構(gòu)數(shù)據(jù)庫的搜索,也可以搜索注釋好的數(shù)據(jù)庫,從而得到一些有關結(jié)構(gòu)域的說明。

(2)分析低復雜度的區(qū)域。在多結(jié)構(gòu)域的蛋白質(zhì)中,這些低復雜度序列常常間隔結(jié)構(gòu)域,長的重復序列特別是pro、glu、ser、thr等常常是連接序列,也是很好的結(jié)構(gòu)域剪接位置。

結(jié)構(gòu)域定位當前第65頁\共有139頁\編于星期六\10點結(jié)構(gòu)域定位分析一般流程:(3)跨膜區(qū)域。由于跨膜結(jié)構(gòu)是一個非常典型的結(jié)構(gòu),這種結(jié)構(gòu)連續(xù)性較強,而且預測容易,準確性也比較高,因此也是一個分割的區(qū)域,這樣就很容易區(qū)分胞外和胞內(nèi)區(qū)域。(4)卷曲螺旋結(jié)構(gòu)(coiled-coil)。這個結(jié)構(gòu)有時也可能是蛋白質(zhì)結(jié)構(gòu)域之間的間隔區(qū),可以在COIL網(wǎng)站上預測coiled-coil結(jié)構(gòu)。

結(jié)構(gòu)域定位當前第66頁\共有139頁\編于星期六\10點結(jié)構(gòu)域定位分析一般流程:(5)二級結(jié)構(gòu)預測。這個方法常常用來預測一個結(jié)構(gòu)中包含的不同折疊子。例如,一個序列中的一部分可能會被預測成只有α-螺旋,而另一個部分可能會被預測成只含有β-折疊,這些都可能預示有域的結(jié)構(gòu)存在。(6)如果序列已被成功地分解成成形的結(jié)構(gòu)域,那么重復進行數(shù)據(jù)庫搜索并且進行獨立比對是很重要的.結(jié)構(gòu)域定位當前第67頁\共有139頁\編于星期六\10點結(jié)構(gòu)域定位當前第68頁\共有139頁\編于星期六\10點結(jié)構(gòu)域分析工具介于二級和三級結(jié)構(gòu)之間可以明顯區(qū)分但又相對獨立的折疊單元,每個結(jié)構(gòu)域自身形成緊實的三維結(jié)構(gòu),可以獨立存在或折疊,但結(jié)構(gòu)域與結(jié)構(gòu)域之間關系較為松散。通常由25-300個氨基酸殘基組成;全平行結(jié)構(gòu)域、反平行結(jié)構(gòu)域、α+β結(jié)構(gòu)域、α/β結(jié)構(gòu)域及其他折疊類型。利用SMART服務器進行結(jié)構(gòu)與分析當前第69頁\共有139頁\編于星期六\10點結(jié)構(gòu)域定位分析舉例實例分析:海參溶菌酶序列和其它i型溶菌酶保守區(qū)域的比對結(jié)果:高度保守的2個活性位點(E34和S50)和特有的氨基酸保守序列MDVGSLSCG(P\Y)(Y\F)QIK當前第70頁\共有139頁\編于星期六\10點i-型溶菌酶含有兩個結(jié)構(gòu)域當前第71頁\共有139頁\編于星期六\10點模體搜索和結(jié)構(gòu)域定位舉例實例分析:海參i-型溶菌酶3D結(jié)構(gòu)模式圖當前第72頁\共有139頁\編于星期六\10點4.蛋白質(zhì)空間結(jié)構(gòu)預測(1)蛋白質(zhì)二級結(jié)構(gòu)預測

蛋白質(zhì)二級結(jié)構(gòu)是蛋白質(zhì)分子中重要的組成“部件”,是研究蛋白質(zhì)氨基酸序列和三級結(jié)構(gòu)之間的橋梁。

基本的二級結(jié)構(gòu):α螺旋,β折疊,β轉(zhuǎn)角,無規(guī)則卷曲(coils)以及模體(motif)等蛋白質(zhì)局部結(jié)構(gòu)組件當前第73頁\共有139頁\編于星期六\10點

蛋白質(zhì)的二級結(jié)構(gòu)預測的基本依據(jù)是每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向。二級結(jié)構(gòu)預測問題是模式分類問題。二級結(jié)構(gòu)預測的目標:判斷每一段中心的殘基是否處于螺旋、折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級結(jié)構(gòu)態(tài),即三態(tài)。蛋白質(zhì)二級結(jié)構(gòu)預測當前第74頁\共有139頁\編于星期六\10點二級結(jié)構(gòu)的預測方法:基于統(tǒng)計和機器學習方法進行預測Chou-Fasman算法GOR算法多序列列線預測基于神經(jīng)網(wǎng)絡的序列預測基于已有知識的預測方法(knowledgebasedmethod)混合方法(hybridsystemmethod)蛋白質(zhì)二級結(jié)構(gòu)預測當前第75頁\共有139頁\編于星期六\10點二級結(jié)構(gòu)中氨基酸出現(xiàn)頻率的影響:

氨基酸殘基在二級結(jié)構(gòu)元件中出現(xiàn)頻率的研究揭示,某些殘基如Glu、Met、Ala和Leu在α螺旋中出現(xiàn)的頻率比在其他二級結(jié)構(gòu)元件中高。相反,Gly和Pro在α螺旋中頻率很低。但它們在β轉(zhuǎn)角中很高。另一些殘基包括Val、Ile和芳香族氨基酸在β折疊片中頻率很高,而Asp、Glu和Pro在β折疊片中則很低。這表明各種殘基形成各種二級結(jié)構(gòu)的傾向性是不同的。蛋白質(zhì)二級結(jié)構(gòu)預測當前第76頁\共有139頁\編于星期六\10點工具網(wǎng)站備注BCMSearchLauncher/包括了常見的蛋白質(zhì)結(jié)構(gòu)分析程序入口,一般分析可以以此服務器作為起點HNNhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.html基于神經(jīng)網(wǎng)絡的分析工具,含序列到結(jié)構(gòu)過程和結(jié)構(gòu)到結(jié)構(gòu)處理Jpredpbio.dundee.ac.uk/~www-jpred/submit.html基于Jnet神經(jīng)網(wǎng)絡的分析程序,并采用PSI-BLAST來構(gòu)建序列Profile進行預測,對于序列較短、結(jié)構(gòu)單一的蛋白預測較好nnPredict/~nomi/nnpredict.html預測蛋白質(zhì)序列中潛在的亮氨酸拉鏈結(jié)構(gòu)和卷曲螺旋NNSSPhttp://bioweb.pasteur.fr/seqanal/interfaces/nnssp-simple.html基于雙層前反饋神經(jīng)網(wǎng)絡為算法,還考慮到蛋白質(zhì)結(jié)構(gòu)分類信息PREDATORhttp://bioweb.pasteur.fr/seqanal/interfaces/predator-simple.html預測時考慮了氨基酸殘基間的氫鍵蛋白質(zhì)二級結(jié)構(gòu)分析工具當前第77頁\共有139頁\編于星期六\10點工具網(wǎng)站備注PredictProtein/提供多項蛋白質(zhì)性質(zhì)分析,并有較好準確性Profhttp://www.aber.ac.uk/~phiwww/prof/基于多重序列比對預測工具PSIpredhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html提供跨膜蛋白拓撲結(jié)構(gòu)預測和蛋白profile折疊結(jié)構(gòu)識別工具SOPMAhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html可以比較各種分析方法得到的結(jié)果,也可輸出“一致性結(jié)果”SSPREDhttp://coot.embl.de/~fmilpetz/SSPRED/sspred.html基于數(shù)據(jù)庫搜索相似蛋白并構(gòu)建多重序列比對蛋白質(zhì)二級結(jié)構(gòu)分析工具(續(xù))當前第78頁\共有139頁\編于星期六\10點PredictProtein可以獲得功能預測、二級結(jié)構(gòu)、基序、二硫鍵結(jié)構(gòu)、結(jié)構(gòu)域等許多蛋白質(zhì)序列的結(jié)構(gòu)信息該方法的平均準確率超過72%,最佳殘基預測準確率達90%以上。因此,被視為蛋白質(zhì)二級結(jié)構(gòu)預測的標準需要注冊帳號用于學術研究蛋白質(zhì)二級結(jié)構(gòu)預測當前第79頁\共有139頁\編于星期六\10點PredictProtein提交界面詳解提交郵件地址(必填)蛋白名稱(可選)分析方法當前第80頁\共有139頁\編于星期六\10點1D序列預測PROFsec(默認)基于輪廓(profile)神經(jīng)網(wǎng)絡預測蛋白質(zhì)二級結(jié)構(gòu)PROFacc(默認)基于輪廓(profile)神經(jīng)網(wǎng)絡預測殘基溶劑可及性PHDhtm(默認)基于多序列比對中預測跨膜區(qū)位置和拓撲結(jié)構(gòu)ASP(默認)識別二級結(jié)構(gòu)中構(gòu)型變化的氨基酸COILS(默認)識別卷曲螺旋PROFtmb識別細菌中Beta桶結(jié)構(gòu)序列基序識別ProSite(默認)搜索序列中保守基序SEG(默認)過濾序列中低復雜區(qū)域PredictNLS(默認)基于實驗數(shù)據(jù)預測序列核定位區(qū)域二硫鍵識別DISULFIND(默認)識別序列中二硫鍵位置無序結(jié)構(gòu)識別PROFbval識別序列標準骨架的B-value值UCON預測蛋白質(zhì)中非3D結(jié)構(gòu)區(qū)域折疊子識別AGAPE基于折疊結(jié)構(gòu)識別遠源蛋白序列殘基接觸預測PROFcon預測單鏈中原子殘基接觸性結(jié)構(gòu)域預測ProDom(默認)基于序列同源性來預測蛋白質(zhì)結(jié)構(gòu)域CHOP(comingsoon)預測蛋白質(zhì)結(jié)構(gòu)域結(jié)構(gòu)表面識別ConSeq(comingsoon)預測蛋白質(zhì)結(jié)構(gòu)表面結(jié)構(gòu)功能關鍵殘基分析方法程序詳解當前第81頁\共有139頁\編于星期六\10點跨膜螺旋預測(PHDhtm)專家選項Ambivalent序列識別(ASP)專家選項CHOP結(jié)構(gòu)域分析工具專家選項當前第82頁\共有139頁\編于星期六\10點比對內(nèi)容從SWISS-PROT數(shù)據(jù)庫返回BLAST搜索結(jié)果MaxHom參數(shù)選項最低序列比對一致性空位間隔罰分空位延伸罰分比對矩陣最大擊中值當前第83頁\共有139頁\編于星期六\10點選擇保存分析結(jié)果是否返回多序列比對結(jié)果HTML結(jié)果形式AGAPE結(jié)果PROF/PHD結(jié)果形式以下拉框中所指定的輸入格式將待測序列粘貼此提交欄當前第84頁\共有139頁\編于星期六\10點服務器運行程序信息ProSite模體搜索結(jié)果低復雜區(qū)域過濾程序ProDom結(jié)構(gòu)域搜索結(jié)果二硫鍵識別結(jié)果PHD程序信息PHD預測結(jié)果PROF預測結(jié)果球狀蛋白預測結(jié)果Ambivalent序列識別結(jié)果PredictProtein分析結(jié)果當前第85頁\共有139頁\編于星期六\10點PredictProtein分析結(jié)果跨膜區(qū)非跨膜區(qū)LoopHelixSheet當前第86頁\共有139頁\編于星期六\10點(2)蛋白質(zhì)三維結(jié)構(gòu)預測方法特點工具同源建模法(Homology/Comparativemodelling)基于序列同源比對,對于序列相似度>30%的序列模擬比較有效,最常用的方法SWISS-MODEL,CPHmodels

串線法/折疊識別法

(Threading/Foldrecognition)“穿”入已知的各種蛋白質(zhì)折疊骨架內(nèi),適于對蛋白質(zhì)核心結(jié)構(gòu)進行預測,計算量大THREADER,3D-PSSM從頭預測法(Abinitio/Denovomethods)基于分子動力學,尋找能量最低的構(gòu)象,計算量大,只能做小分子預測HMMSTR/ROSSETA當前第87頁\共有139頁\編于星期六\10點方法一:同源模建comparativemodeling

1.同源模建的基礎蛋白質(zhì)的三級結(jié)構(gòu)比一級結(jié)構(gòu)更保守。研究表明如果兩個蛋白質(zhì)的同源性達到50%,二者90%的Ca的RMS

小于1埃。

2.原理:序列高度相似的蛋白質(zhì)具有相似的三維結(jié)構(gòu)。同源蛋白質(zhì)之間具有保守的結(jié)構(gòu)內(nèi)核,差異僅存在分子表面的回折區(qū)。當一個蛋白質(zhì)的序列與一個已知結(jié)構(gòu)的蛋白質(zhì)序列相似的時候,該蛋白質(zhì)的結(jié)構(gòu)可以被模建。當前第88頁\共有139頁\編于星期六\10點

3.同源模建的前提和條件:要模建的目標蛋白必須有一個或多個已知結(jié)構(gòu)的與之同源(同源性不低于25%)的蛋白。數(shù)據(jù)庫:蛋白質(zhì)結(jié)構(gòu)、序列數(shù)據(jù)計算機:工作站分子模擬系統(tǒng):軟件系統(tǒng)4.同源模建的發(fā)展歷史

1969年,Browne利用溶菌酶的結(jié)構(gòu)手工模建了牛乳白蛋白的結(jié)構(gòu)。八十年代,Blundel發(fā)展了利用多種同源蛋白質(zhì)進行結(jié)構(gòu)預測的方法。隨著計算機技術的發(fā)展、結(jié)構(gòu)測定數(shù)據(jù)的增加,同源模建技術也在快速發(fā)展。當前第89頁\共有139頁\編于星期六\10點5.同源模建的主要算法剛體裝配模建(modelingbyrigidbodyassembly)片段匹配模建(modelingbysegmentmatching)空間制約模建(modelingbysatisfactionofspatialrestraints)當前第90頁\共有139頁\編于星期六\10點(1)剛體裝配模建從一些剛體包括核心區(qū)、環(huán)區(qū)和側(cè)鏈來構(gòu)造模型,這些剛體都來自分解的相關結(jié)構(gòu)(參考蛋白)。模型的裝配涉及計算一個框架,這個框架定義為折疊模式的保守區(qū)域的模板原子的平均,并把剛體裝進框架。(2)片段匹配模建依賴于從模板蛋白的保守原子的相近位置來計算其它原子的坐標。它可以通過使用蛋白質(zhì)結(jié)構(gòu)的短片數(shù)據(jù)庫、能量或幾何規(guī)則、以及這些標準的某些聯(lián)合來完成。(3)空間制約滿足:首先從參考蛋白結(jié)構(gòu)中抽取出一些空間制約條件,將這些制約條件用幾率密度函數(shù)來表示,然后根據(jù)氨基酸類型、等位殘基的主鏈構(gòu)象和序列之間局部的相似程度而對空間制約條件施加以不同的權(quán)重因子。模建時將幾率密度函數(shù)應用到未知結(jié)構(gòu)蛋白質(zhì)序列上,通過優(yōu)化分子的幾率密度函數(shù)使制約條件有最小的沖突而得到目標蛋白的三維結(jié)構(gòu),整個優(yōu)化過程通過分子力學和分子動力學模擬來實現(xiàn)。

當前第91頁\共有139頁\編于星期六\10點6.同源建模法分析步驟:多序列比對與已有晶體結(jié)構(gòu)的蛋白質(zhì)序列比對確定是否有可以使用的模板序列相似度>30%序列相似度<30%,結(jié)合功能,蛋白質(zhì)一級序列、二級結(jié)構(gòu)或結(jié)構(gòu)域信息構(gòu)建三維模型三維模型準確性檢驗Whatcheck程序Ramachandranplot計算檢驗手工調(diào)整多序列比對,重新擬和,構(gòu)建新的模型當前第92頁\共有139頁\編于星期六\10點當前第93頁\共有139頁\編于星期六\10點常用數(shù)據(jù)庫數(shù)據(jù)庫網(wǎng)站備注PDB/pdb/home/home.do主要的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫MMDB/Structure/MMDB/mmdb.shtmlNCBI維護的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫Psdb/~deerfiel/PSdb/從PDB和NRL-3D數(shù)據(jù)庫中衍生出的數(shù)據(jù)庫,含二級結(jié)構(gòu)和三維結(jié)構(gòu)信息3DinSighthttp://gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/3DinSight.html整合了結(jié)構(gòu)、性質(zhì)(氨基酸組成、熱力學參數(shù)等)、生物學功能(突變點,相互作用等)的綜合數(shù)據(jù)庫,F(xiàn)SSPhttp://www.ebi.ac.uk/dali//fssp/根據(jù)結(jié)構(gòu)比對的蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOPhttp://scop.mrc-lmb.cam.ac.uk/scop/蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫,將已知結(jié)構(gòu)蛋白進行有層次地分類CATH/latest/index.html另一個有名的蛋白質(zhì)結(jié)構(gòu)和結(jié)構(gòu)域主要結(jié)構(gòu)分類庫MODBASE/modbase-cgi/index.cgi用同源比對法生成的模型結(jié)構(gòu)數(shù)據(jù)庫EnzymeStructurehttp://www.ebi.ac.uk/thornton-srv/databases/enzymes/從PDB數(shù)據(jù)庫中整理已知結(jié)構(gòu)的酶蛋白數(shù)據(jù)庫HSSPhttp://www.sander.ebi.ac.uk/hssp/根據(jù)同源性到處的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫當前第94頁\共有139頁\編于星期六\10點模板搜索與比對工具網(wǎng)站備注PSI-BLAST/BLAST/位置特異性疊代BLAST,可用來搜索遠源家族序列FASTA3http://www.ebi.ac.uk/fasta33/位于EBI的序列比對工具SSEARCHrs.fr/bin/ssearch-guess.cgi采用Smith/Waterman法來進行序列比對ClustalWhttp://www.ebi.ac.uk/Tools/clustalw/index.html多序列比對工具,位于EBIT-Coffeehttp://www.ebi.ac.uk/t-coffee/用多種方法(如ClustalW、DIalign等)來構(gòu)建多序列比對Multalinhttp://bioinfo.genopole-toulouse.prd.fr/multalin/multalin.html一個老牌的多序列比對工具Dalihttp://www.ebi.ac.uk/dali/三維結(jié)構(gòu)比對網(wǎng)絡服務器VAST/Structure/VAST/vast.shtml基于向量并列分析算法的三維結(jié)構(gòu)比對工具SAM-T99/research/compbio/sam.html用HMM法搜索蛋白質(zhì)遠源同源序列當前第95頁\共有139頁\編于星期六\10點同源建模法工具網(wǎng)站備注SWISS-MODEL/完整建模程序,采用同源性鑒定來確定模板蛋白,用戶也可以自定義模板進行分析CPHmodelshttp://www.cbs.dtu.dk/services/CPHmodels/基于神經(jīng)網(wǎng)絡的同源建模工具,用戶只需提交序列,無高級選項EsyPred3Dhttp://www.fundp.ac.be/urbm/bioinfo/esypred/采用神經(jīng)網(wǎng)絡來提高同源建模準確性的預測工具3Djigsawhttp://www.bmm.icnet.uk/servers/3djigsaw/根據(jù)同源已知結(jié)構(gòu)蛋白來建模的預測工具MODELLER/modeller/一個廣泛使用的同源建模軟件,需要用戶對腳本有一定的了解當前第96頁\共有139頁\編于星期六\10點串線法工具網(wǎng)站備注3D-PSSMhttp://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html第一個運用1D-3D序列profile來預測蛋白質(zhì)折疊結(jié)構(gòu)的網(wǎng)絡服務器Fuguehttp://www-cryst.bioc.cam.ac.uk/~fugue/以序列—結(jié)構(gòu)比對搜索數(shù)據(jù)庫來預測蛋白質(zhì)折疊HHpredhttp://toolkit.tuebingen.mpg.de/hhpred基于HMM-HMM比對搜索多個數(shù)據(jù)庫來預測給定序列的的折疊結(jié)構(gòu)LOOPP/loopp.aspx學習、觀察和輸出蛋白質(zhì)模式和結(jié)構(gòu)工具THREADERhttp://bioinf.cs.ucl.ac.uk/threader/一個老牌的線索分析軟件,對搜索遠源蛋白序列較敏感PROSPECT/structure/prospect/index.html蛋白質(zhì)結(jié)構(gòu)預測和評價工具包,能以一種非常簡單的方式運行,對于高級用戶,也提供了很多的可選項123D+http://123/123D+.html結(jié)合了序列概形,二級結(jié)構(gòu)信息和接觸勢能來將待測蛋白“穿入”一系列結(jié)構(gòu)來預測結(jié)構(gòu)SAM-T02/research/compbio/HMM-apps/T02-query.html基于HMM方法的蛋白質(zhì)結(jié)構(gòu)預測GenThreaderhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html使用結(jié)構(gòu)評分和基于神經(jīng)網(wǎng)絡序列比對來也測蛋白折疊結(jié)構(gòu)當前第97頁\共有139頁\編于星期六\10點蛋白質(zhì)三維結(jié)構(gòu)預測SWISS-MODEL工具同源建模方法與PDB數(shù)據(jù)庫已知結(jié)構(gòu)的蛋白質(zhì)序列比對進行預測當前第98頁\共有139頁\編于星期六\10點主要參數(shù)/選項粘貼protein.txt中一條蛋白質(zhì)序列輸入用戶Email(選填)比對e值參照模板序列數(shù)目當前第99頁\共有139頁\編于星期六\10點輸出結(jié)果下載pdb格式文件當前第100頁\共有139頁\編于星期六\10點與模板序列比對結(jié)果,并顯示二級結(jié)構(gòu)區(qū)域當前第101頁\共有139頁\編于星期六\10點方法二:折疊識別/穿線方法對蛋白質(zhì)結(jié)構(gòu)的預測背景:序列比對后所擊中的相似序列不是完整的而是一段一段的結(jié)構(gòu)域,也可以通過二級結(jié)構(gòu)預測和折疊識別(foldrecognition)找到合適的折疊子,再以這些已知結(jié)構(gòu)的折疊子為模板來構(gòu)建模型。當前第102頁\共有139頁\編于星期六\10點折疊識別/穿線方法

觀察:有限的蛋白質(zhì)折疊種類(~1,000?)與“從頭開始”來預測蛋白質(zhì)結(jié)構(gòu)不同,我們可以從有限的蛋白質(zhì)折疊條目中得到正確的結(jié)果。基于序列技巧可以做到這一點,或者通過穿線法將序列按順序投到模板上,并評價每一個匹配好壞程度當前第103頁\共有139頁\編于星期六\10點折疊識別/穿線方法原理:將序列“穿”入已知的各種蛋白質(zhì)折疊子骨架內(nèi),通過目的蛋白序列與已知折疊子的逐一比對,計算出未知結(jié)構(gòu)序列折疊成各種已知折疊子的可能性;折疊子一般包括一個或多個蛋白質(zhì)超家族;每個折疊子的結(jié)構(gòu)內(nèi)核有確定的結(jié)構(gòu)特征;基于序列同源性很低的蛋白質(zhì)都可能存在結(jié)構(gòu)相同的折疊子進行預測。例如,通過PHYRE系統(tǒng)進行折疊識別預測http://www.sbg.bio.ic.ac.uk/~phyre/index.cgi當前第104頁\共有139頁\編于星期六\10點折疊識別或穿線法目標序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…可能折疊的庫(哪些具有已知序列和結(jié)構(gòu)):當前第105頁\共有139頁\編于星期六\10點序列-結(jié)構(gòu)比對目標序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…=t1t2t3t4t5…tn已知折疊結(jié)構(gòu)的序列=s1s2s3s4s5…sn已知折疊結(jié)構(gòu)的位置=p1p2p3p4p5…pn怎樣將目標序列與結(jié)構(gòu)進行比對?當前第106頁\共有139頁\編于星期六\10點同源模建與結(jié)構(gòu)類型識別方法的比較蛋白質(zhì)家族與蛋白質(zhì)結(jié)構(gòu)類型

Family蛋白質(zhì)家族依據(jù)序列同源性將蛋白質(zhì)分為不同的家族:一般將序列同源性大于30%的蛋白質(zhì)歸屬為一個家族。一個蛋白質(zhì)家族的成員可能由一個共同的祖先進化而來。自然界存在的可能蛋白質(zhì)家族數(shù)目大約為23100種。同一個家族的蛋白質(zhì)一般具有相近的功能和相同的結(jié)構(gòu)類型(折疊模式)。當前第107頁\共有139頁\編于星期六\10點3D-PSSM工具http://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html由英國倫敦帝國理工學院維護,其數(shù)據(jù)庫中含有9864個蛋白折疊結(jié)構(gòu)3D-PSSM先用PSI-BLAST標準方法通過多序列比對得到輪廓(profile),然后對家族中的一系列成員進行結(jié)構(gòu)比對得出該家族的結(jié)構(gòu)輪廓,接著用線串法將模板結(jié)構(gòu)輪廓和待測蛋白的序列輪廓進行1D-3D輪廓之間的比對,此外也考慮了溶劑可及性和二級結(jié)構(gòu)信息當前第108頁\共有139頁\編于星期六\10點輸入用戶Email(學術郵箱,必需)蛋白質(zhì)描述(選填)序列提交框(氨基酸單字母)當前第109頁\共有139頁\編于星期六\10點輸入用戶Email(必需)蛋白質(zhì)描述(選填)序列提交框(氨基酸單字母)Phyre

-http://www.sbg.bio.ic.ac.uk/~phyre/3d-PSSM的升級版,增加了fold數(shù)據(jù),并且性能上提高10%-15%,采用了新的分析界面當前第110頁\共有139頁\編于星期六\10點二級結(jié)構(gòu)預測當前第111頁\共有139頁\編于星期六\10點序列比對結(jié)果序列比對一致性模板長度靶標蛋白模型模板蛋白結(jié)構(gòu)分類信息折疊子描述當前第112頁\共有139頁\編于星期六\10點當前第113頁\共有139頁\編于星期六\10點當前第114頁\共有139頁\編于星期六\10點工具網(wǎng)站備注Swiss-PdbViewer/spdbv/一個界面非常友好的工具,可以分析蛋白質(zhì)的結(jié)構(gòu)性質(zhì),比較活性位點或突變點Jmol/一個基于Java語言開發(fā)的三維觀察工具,大多是作為一個內(nèi)嵌式網(wǎng)頁工具快速游覽結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)MolMolhttp://www.mol.biol.ethz.ch/wuthrich/software/molmol/免費的PDB三維分子觀察軟件,可以通過處理生成很漂亮的圖形文件PyMol/一個基于開源的三維觀察工具,有很多額外的插件來提升功能Rasmol/software/rasmol/很有名的三維觀察軟件,操作界面簡介,用命令行實現(xiàn)多種功能VMD/Research/vmd/用內(nèi)建的腳本來瀏覽、分析三維結(jié)構(gòu),還可以以動畫的形式模擬蛋白質(zhì)結(jié)構(gòu)Chime/products/framework/chime/index.jsp網(wǎng)絡游覽器插件,可以在網(wǎng)頁中直接觀察PDB格式的文件Chimera/chimera/index.html免費分子模擬顯示程序,還包括結(jié)構(gòu)比對、藥物篩選等功能ICM-Browser/icm_browser.html三維分子游覽工具,有序列比對顯示功能,由MolSodt公司免費推出常用蛋白質(zhì)三維結(jié)構(gòu)觀察和修改工具當前第115頁\共有139頁\編于星期六\10點Chime網(wǎng)絡游覽器插件基于游覽器的三維結(jié)構(gòu)觀察工具安裝后在InternetExplorer下的PLUGINS文件夾中會有:npchime.dll(pluginsfolder)npchime.zip(pluginsfolder,usedforLiveConnect)NOTE:Donotunzipthisfilechimepro.html(pluginsfolder,thereleasenotesforChime)chime26.isu(pluginsfolder,usedtouninstallChime)sculptapi.dll(WindowsSystemfolder,usedforSculpt)ChimeShim.dll(pluginsfolder,InternetExploreronly)當前第116頁\共有139頁\編于星期六\10點當前第117頁\共有139頁\編于星期六\10點SWISS-PdbView觀察三維模型SWISS-PdbView工具觀察和修改分子的三維結(jié)構(gòu)當前第118頁\共有139頁\編于星期六\10點菜單欄/工具欄圖層窗口主窗口序列聯(lián)配窗口控制面板當前第119頁\共有139頁\編于星期六\10點Ramachandran圖結(jié)構(gòu)疊加當前第120頁\共有139頁\編于星期六\10點蛋白質(zhì)序列分析蛋白質(zhì)一級序列蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)親疏水性分析跨膜區(qū)結(jié)構(gòu)預測卷曲螺旋預測翻譯后修飾位點預測蛋白質(zhì)二級結(jié)構(gòu)蛋白質(zhì)二級結(jié)構(gòu)預測蛋白質(zhì)序列信號位點分析蛋白質(zhì)超二級結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)域分析蛋白質(zhì)三級結(jié)構(gòu)蛋白質(zhì)三維結(jié)構(gòu)模擬蛋白質(zhì)分類蛋白質(zhì)家族分析蛋白質(zhì)序列分析匯總表課程總結(jié)當前第121頁\共有139頁\編于星期六\10點課程總結(jié)當前第122頁\共有139頁\編于星期六\10點四、蛋白質(zhì)結(jié)構(gòu)預測的應用蛋白質(zhì)的分子設計當前第123頁\共有139頁\編于星期六\10點

蛋白質(zhì)分子設計與基因工程技術、多肽合成技術和化學合成技術一起開創(chuàng)了新藥設計和開發(fā)研究的新局面。這個領域的研究方向主要包括蛋白三維結(jié)構(gòu)預測、蛋白質(zhì)結(jié)構(gòu)功能關系研究、蛋白相互作用、蛋白與DNA相互作用、蛋白質(zhì)突變體的分子設計、全新蛋白質(zhì)設計等。當前第124頁\共有139頁\編于星期六\10點1.分子設計的意義

分子生物學最激動人心的進展之一是能夠設計和生產(chǎn)新的蛋白質(zhì)分子。重組DNA技術使人們能夠定向改變蛋白質(zhì)中的氨基酸序列,包括氨基酸的取代、插入或缺失,甚至包括蛋白質(zhì)的融合等。

蛋白質(zhì)工程則是在深入了解蛋白質(zhì)結(jié)構(gòu)與功能關系的基礎上,利用分子生物學方法和手段有目的地改造蛋白質(zhì),使之性能得到改善。作為蛋白質(zhì)工程的組成部分,蛋白質(zhì)分子設計在其中起著十分重要的作用。

當前第125頁\共有139頁\編于星期六\10點當前第126頁\共有139頁\編于星期六\10點從預期的蛋白質(zhì)功能出發(fā)→設計預期的蛋白質(zhì)結(jié)構(gòu)→推測應有的氨基酸序列→找到相對應的脫氧核苷酸(基因)當前第127頁\共有139頁\編于星期六\10點

2.分子設計的種類小改:少數(shù)殘基的替換,突變或修飾中改:分子拼接,肽段或結(jié)構(gòu)域的替換大改:從頭設計,全新蛋白質(zhì)的設計3.分子設計與蛋白質(zhì)結(jié)構(gòu)

蛋白質(zhì)分子內(nèi)部的電荷分布、相互作用有其特定的結(jié)構(gòu)特征,隨意選擇突變位點在蛋白質(zhì)分子中改變氨基酸,不僅達不到預期目的,反而可能影響蛋白質(zhì)分子的活性中心,使蛋白質(zhì)的活性降低或喪失。當前第128頁\共有139頁\編于星期六\10點

4.蛋白質(zhì)分子設計的應用

應用1:酶穩(wěn)定性的改善酶的穩(wěn)定性

在蛋白質(zhì)工程的實踐中,一般可以通過在酶分子內(nèi)增加二硫鍵或靜電作用來提高酶分子的穩(wěn)定性。例1:核糖核酸酶的穩(wěn)定性的提高(1)已知條件:核糖核酸酶三維結(jié)構(gòu)已由晶體衍射方法測定。

分子內(nèi)有兩對二硫鍵:Tyr24與Asn84正對,二者的Ca之間的距離為6.0A,滿足二硫鍵的特征(二硫鍵的Ca的平均距離:4.5-6.8?),可能形成一個潛在的二硫鍵;二者附近沒有干擾形成二硫鍵的基團;二者離催化活性中心較遠,突變后不會影響活性。(2)設計方案:

將Tyr24與Asn84突變?yōu)镃ys

實驗結(jié)果:突變體的穩(wěn)定性大大提高

當前第129頁\共有139頁\編于星期六\10點例2.葡萄糖異構(gòu)酶(GI)在工業(yè)上應用廣泛,為提高其熱穩(wěn)定性,朱國萍等人在確定第138位甘氨酸(Gly138)為目標氨基酸后,用雙引物法對GI基因進行體外定點誘變,以脯氨酸(Pro138)替代Gly138,含突變體的重組質(zhì)粒在大腸桿菌中表達,結(jié)果突變型GI比野生型的熱半衰期長一倍;最適反應溫度提高10~12℃;酶比活相同。據(jù)分析,Pro替代Gly138后,可能由于引入了一個吡咯環(huán),該側(cè)鏈剛好能夠填充于Gly138附近的空洞,使蛋白質(zhì)空間結(jié)構(gòu)更具剛性,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論