版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、復旦大學 實驗五:蛋白質序列分析實驗五:蛋白質序列分析杜杜 娟娟基因與蛋白質組學數據分析基因與蛋白質組學數據分析實驗項目五:蛋白質序列分析實驗項目五:蛋白質序列分析一、 實驗目的和要求: 掌握蛋白質基本性質分析;基本理化性質和疏水性分析。 掌握蛋白質信號肽的預測,亞細胞定位的預測,跨膜結構及卷曲螺旋結構的預測。 了解基于motif、結構位點、結構功能域數據庫的蛋白質功能預測 掌握基于序列同源性分析的蛋白質功能預測。2(一)蛋白質基本理化性質分析蛋白質理化性質是蛋白質研究的基礎 蛋白質的基本性質: 相對分子質量 氨基酸組成 等電點(PI) 消光系數 半衰期 不穩(wěn)定系數 總平均親水性 實驗方法:
2、相對分子質量的測定、等電點實驗、沉降實驗 缺點:費時、耗資基于實驗經驗值的計算機分析方法 軟件 Bioedit 網絡工具ProtParam, Compute PI34基于一級序列的組分分析氨基酸親疏水性等分析為高級結構預測提供參考ExPASy( Expert Protein Analysis System ) 開發(fā)的針對蛋白質基本理化性質的分析: Protparam 工具 /tools/protparam.html蛋白質理化性質分析蛋白質理化性質分析 Protparam 工具工具 /tools/protparam.
3、html計算以下物理化學性質:計算以下物理化學性質: 相對分子質量相對分子質量 理論理論 pI pI 值值 氨基酸組成氨基酸組成 原子組成原子組成 消光系數消光系數 半衰期半衰期 不穩(wěn)定系數不穩(wěn)定系數 脂肪系數脂肪系數 總平均親水性總平均親水性5主要選項主要選項/參數參數序列在線提交形式:序列在線提交形式: 如果分析SWISS-PORT和TrEMBL數據庫中序列 直接填寫Swiss-Prot/TrEMBL AC號(accession number) 如果分析新序列: 直接在搜索框中粘貼氨基酸序列輸入Swiss-Prot/TrEMBL AC號打開protein.txt,將蛋白質序列粘貼在搜索框中
4、6 輸入Swiss-Prot/TrEMBL AC號分不同的功能域肽段 以P02699為例輸出結果輸出結果 功能域用戶自定義區(qū)段7點擊不同功能域得到以下結果點擊不同功能域得到以下結果氨基酸數目相對分子質量理論 pI 值氨基酸組成正/負電荷殘基數89消光系數半衰期原子組成分子式總原子數不穩(wěn)定系數脂肪系數總平均親水性40 unstable10(二)蛋白質疏水性分析 疏水作用是蛋白質折疊的主要驅動力 分析蛋白質氨基酸親疏水性是了解蛋白質折疊的第一步 氨基酸疏水分析為蛋白質二級結構預測提供佐證 是分析蛋白質跨膜區(qū)重要一步11 ProtScale工具 /tools/p
5、rotscale.html 氨基酸標度 表示氨基酸在某種實驗狀態(tài)下相對其他氨基酸在某些性質的差異,如疏水性、親水性等 收集50多個文獻中提供的氨基酸標度 默認值以Hphob. Kyte & Doolittle做疏水性分析 ProtScale能計算超過50種蛋白質的特性。僅一項需要額外設定的參數是輸入框的寬度,該參數將指示系統(tǒng)每次運行計算和顯示的殘基數,其缺省值為9。如果想考慮跨膜螺旋特性,該參數設置應為20,因為一個跨膜螺旋通常有20個氨基酸長度蛋白質親疏水性分析12主要選項/參數序列在線提交形式:如果分析SWISS-PORT和TrEMBL數據庫中序列 直接填寫Swiss-Prot/TrEMB
6、L AC號(accession number)如果分析新序列: 直接在搜索框中粘貼氨基酸序列以P02699為例輸入Swiss-Prot/TrEMBL AC號打開protein.txt,將一條蛋白質序列粘貼在搜索框中13氨基酸標度計算窗口(7-11)相對權重值 權重值變化趨勢 是否歸一化14所用氨基酸所用氨基酸標度信息標度信息分析所用參分析所用參數信息數信息輸出結果輸出結果15圖形結果圖形結果 文本結果文本結果 參數參數 每個位置每個位置 的得分的得分16三三 信號肽預測信號肽預測 蛋白質合成后要運送到細胞中不同的部位,有的蛋白質要通過內質網膜進入內質網腔內,最終成為分泌蛋白分泌蛋白。 分泌蛋白
7、的N端都有一段約1535個氨基酸的疏水性肽段,其功能是引導蛋白質多肽鏈穿過內質網膜進入腔內,稱為信號肽信號肽(signal peptide)。 按照氨基酸組成及其位置特征,可將信號肽分為4大類:分泌信號肽 2. 脂蛋白信號肽3. Pilin-like信號肽4. 細菌素和細菌素信號肽蛋白質序列分析 信號肽主要由三個domain組成:N-region、H-regin和C-region. N-region為正電荷區(qū)域,至少含有一個精氨酸(R) 或賴氨酸(K). H-region為疏水核,一般長為1214個氨基酸. C-region包含信號肽酶(SPase)的剪切位點,在剪切位點的-1位和-3位上多為
8、中性的丙氨酸,該區(qū)域也稱為富含丙氨酸區(qū)域. N H C N端 C端蛋白質序列分析 常用工具 SignaIP(http:/www.cbs.dtu.dk/services/SignalP/) 通過神經網絡方法的組合 預測信號肽的位置及相應切點19三三 信號肽的預測信號肽的預測人的內質網駐留蛋白信號肽預測 Q9BS26輸入序列的輸入序列的FASTA文件文件21人的內質網駐留蛋白信號肽預測曲線顏色曲線顏色此處此處C值最大;值最大;S值陡峭;值陡峭;Y值最高峰。預測為信號值最高峰。預測為信號肽剪切位點肽剪切位點文本結果,文本結果,YES代表該蛋代表該蛋白包含信號肽白包含信號肽,剪切位點剪切位點位于位于2
9、9,30殘基處殘基處C score: 剪切位點分值剪切位點分值S score: 信號肽分值信號肽分值Y score: 綜合剪切位點分值綜合剪切位點分值四 蛋白質亞細胞定位預測 亞細胞定位與蛋白質的功能存在著非常重要的聯系。亞細胞定位預測基于如下原理:(1)不同的細胞器往往具有不同的理化環(huán)境,它根據蛋白質的結構及表面理化特征,選擇性容納蛋白。(2)蛋白質表面直接暴露于細胞器環(huán)境中,它由序列折疊過程決定,而后者取決于氨基酸組成。因此可以通過氨基酸組成進行亞細胞定位的預測。 推薦使用PSORT(http:/psort.nibb.ac.jp/)II軟件對PDCD5蛋白的細胞內定位進行預測。PSORT將
10、動物蛋白質定位于10個細胞器:(1)細胞漿,(2)細胞骨架,(3)內質網,(4)胞外,(5)高爾基體,(6)溶酶體,(7)線粒體,(8)胞核,(9)過氧化物酶體(peroxisome)和(10)細胞膜。2223輸入蛋白質序列輸入蛋白質序列FASTA文件文件2425細胞外,細胞壁細胞外,細胞壁線粒體線粒體細胞骨架細胞骨架細胞核細胞核五 跨膜區(qū)預測 各個物種的膜蛋白的比例差別不大,約四分之一的人類已知蛋白為膜蛋白。由于膜蛋白不溶于水,分離純化困難,不容易生長晶體,很難確定其結構。因此,對膜蛋白的跨膜螺旋進行預測是生物信息學的重要應用。 推薦使用TMHMM軟件(http:/www.cbs.dtu.d
11、k/servICEs/TMHMM/)對蛋白進行跨膜預測。TMHMM綜合了跨膜區(qū)疏水性、電荷偏倚、螺旋長度和膜蛋白拓撲學限制等性質,采用隱馬氏模型(Hidden Markov Models),對跨膜區(qū)及膜內外區(qū)進行整體的預測。TMHMM是目前最好的進行跨膜區(qū)預測的軟件,它尤其長于區(qū)分可溶性蛋白和膜蛋白,因此首選它來判定一個蛋白是否為膜蛋白。所有跨膜區(qū)預測軟件的準確性都不超過52%,但86%的跨膜區(qū)可以通過不同的軟件進行正確預測。因此,綜合分析不同的軟件預測結果和疏水性圖以獲得更好的預測結果。2627輸入蛋白質序列輸入蛋白質序列FASTA文件文件鋁激活蘋果酸轉運蛋白的跨膜區(qū)預測鋁激活蘋果酸轉運蛋白
12、的跨膜區(qū)預測28跨膜區(qū)跨膜區(qū)起始氨起始氨基酸基酸終止氨終止氨基酸基酸文字結果文字結果29跨膜區(qū)跨膜區(qū)膜外區(qū)膜外區(qū)膜內區(qū)膜內區(qū)圖形結果圖形結果 卷曲螺旋卷曲螺旋(coiled coil)是蛋白質中由27條螺旋鏈纏繞成麻花狀結構的總稱 存在于多種天然蛋白質中,如轉錄因子、結構蛋白、膜蛋白中,在生物體內執(zhí)行著代謝調控、分子運動、膜通道、分子識別等重要的生物功能,30六六 蛋白質卷曲螺旋域分析蛋白質卷曲螺旋域分析 典型的有亮氨酸拉鏈,存在7殘基 重復結構(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置為疏水性氨基酸,而其他位置 殘 基為親水性 卷曲螺旋 控制蛋白質
13、寡聚化的元件,存在于轉錄因子、蛋白融合多肽等 一種很簡單的三級結構,容易預測 常用工具 COILS - Prediction of Coiled Coil Regions in Proteins (/software/COILS_form.html)選擇滑動窗口大小選擇滑動窗口大小選擇打分矩陣選擇打分矩陣和權重和權重選擇輸入格式,選擇選擇輸入格式,選擇“SwissProtID or AC”查 詢 內 容 , 輸 入查 詢 內 容 , 輸 入Q9H2G9/software/COILS_form.html3
14、333圖形結果圖形結果34預測為預測為卷曲螺卷曲螺旋的區(qū)旋的區(qū)域域七七 結構域分析結構域分析 結構域結構域(structure domain)是在蛋白質三級結構中介于二級和三級結構之間的可以明顯區(qū)分但又相對獨立的折疊單元,每個結構域自身形成緊實的三維結構,可以獨立存在或折疊,但結構域與結構域之間關系較為松散。 結構域通常由25300個氨基酸組成,不同蛋白質結構域數目或同一蛋白質結構域相似度差異較大蛋白質序列分析 常見的結構域主要有5種: 全平行結構域 反平行結構域 +結構域 /結構域 其他折疊類型 結構域是蛋白質的功能、結構和進化單元,結構域分析對于蛋白質結構的分類和預測有著重要作用。蛋白質序
15、列分析七七 基于結構域(模體)的蛋白質功能預測基于結構域(模體)的蛋白質功能預測一類基因具有轉錄功能,一類基因具有轉錄功能, 且它們所編碼的蛋且它們所編碼的蛋白質都具有白質都具有Y結構域(模體),蛋白質結構域(模體),蛋白質B也具也具有有Y結構域(模體),因而蛋白質結構域(模體),因而蛋白質B的功能也的功能也應該與基因轉錄相關。應該與基因轉錄相關。蛋白質蛋白質B 轉錄活性轉錄活性轉錄活性轉錄活性 蛋白質模體或結構域在氨基酸序列水平比其他區(qū)蛋白質模體或結構域在氨基酸序列水平比其他區(qū)域保守,通過對序列比對可以發(fā)現這些在進化上域保守,通過對序列比對可以發(fā)現這些在進化上較為保守的區(qū)域;較為保守的區(qū)域;
16、 蛋白質蛋白質模體模體或結構域通常與該蛋白質的功能直接或結構域通常與該蛋白質的功能直接相關;相關; 根據模體或結構域信息可以對同源水平較低的蛋根據模體或結構域信息可以對同源水平較低的蛋白質的進行功能預測。白質的進行功能預測。基于結構域(模體)的蛋白質功能預測基于結構域(模體)的蛋白質功能預測七七 蛋白質序列分析蛋白質序列分析 蛋白質家族、結構域、位點及功能分析蛋白質家族、結構域、位點及功能分析綠膿假單胞菌綠膿假單胞菌 RpsA 層粘連蛋白受體層粘連蛋白受體蛋白質序列分析,蛋白質序列分析, 保守結構域以及功能分析保守結構域以及功能分析RNA結合結構域結合結構域核酸結合核酸結合七七 基于同源序列的
17、蛋白質功能預測基于同源序列的蛋白質功能預測蛋白質蛋白質A具有轉錄功能,蛋白質具有轉錄功能,蛋白質B與與A在氨在氨基酸序列上相似(直系同源),因而蛋白基酸序列上相似(直系同源),因而蛋白質質B也具有轉錄功能。也具有轉錄功能。AB轉錄活性轉錄活性 轉錄活性轉錄活性蛋白質蛋白質A蛋白質蛋白質B 至少80個氨基酸長度范圍內具有25%以上的序列一致性才提示可能的顯著性意義。未知功能序列對庫檢索的一般分析策略如下: 和 運 行 B l a s t p 程 序 的 服 務 器 (/blast/)連接; 將目的序列粘貼到序列輸入框中,選擇BLOSUM62記分
18、矩陣運行BlastP程序。NCBI的BlastP程序要求輸入格式為FASTA格式; 如果BlastP檢測到了高度同源的序列,將有可能提示目的序列的生物學功能42七七 基于同源序列的蛋白質功能預測基于同源序列的蛋白質功能預測序列相似性比較作為一個非常有效的工具用于同源序列相似性比較作為一個非常有效的工具用于同源基因的發(fā)現基因的發(fā)現基于序列同源的蛋白質功能預測基于序列同源的蛋白質功能預測基于序列同源的蛋白質功能預測基于序列同源的蛋白質功能預測45在uniprot數據庫中檢索人脂聯素 (adiponectin)蛋白質序列;寫出檢索號。使用在線分析平臺ExPASy對上述蛋白質序列進行分子質量、氨基酸組成(protparam)、和疏水性等基本性質分析(protscale);寫出分子質量是多少?氨基酸組
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人企業(yè)經營周轉貸款抵押合同模板2篇
- 二零二五年度綠色生態(tài)農業(yè)項目合同書4篇
- 2025年度個人抵押車借款數據安全保密合同
- 2025年度農業(yè)廢棄物資源化利用技術服務合同8篇
- 2025年度噴砂機銷售與產業(yè)升級合作合同4篇
- 課題申報參考:面向深度學習雙向調節(jié)學習困惑:聚焦多模態(tài)診斷與調節(jié)支架設計的研究
- 2025年度家庭影院定制裝修服務合同范本
- 2025版智能爬架租賃與維護一體化服務合同4篇
- 2025年建筑工程流動資金借款合同終止條款3篇
- 2025年度新型斷橋門窗安裝與節(jié)能改造合同4篇
- 2024年山東省泰安市高考語文一模試卷
- 五年級上冊計算題大全1000題帶答案
- 工程建設行業(yè)標準內置保溫現澆混凝土復合剪力墻技術規(guī)程
- 北師大版物理九年級全一冊課件
- 2024年第三師圖木舒克市市場監(jiān)督管理局招錄2人《行政職業(yè)能力測驗》高頻考點、難點(含詳細答案)
- RFJ 006-2021 RFP型人防過濾吸收器制造與驗收規(guī)范(暫行)
- 盆腔炎教學查房課件
- 新概念英語課件NCE3-lesson15(共34張)
- GB/T 3683-2023橡膠軟管及軟管組合件油基或水基流體適用的鋼絲編織增強液壓型規(guī)范
- 電視劇《瑯琊榜》特色分析
- 5A+Chapter+1+Changes+at+home+課件(新思維小學英語)
評論
0/150
提交評論