版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
質譜數(shù)據(jù)定量分析的基本方法第1頁,共38頁,2023年,2月20日,星期二主要內(nèi)容研究背景(我們對定量問題的認識)
定量數(shù)據(jù)分析面對的問題定量數(shù)據(jù)分析的基本方法已有定量軟件和應用情況研究內(nèi)容和結果定量信息提取方法及問題多批次定量數(shù)據(jù)的對應及重復實驗差異顯著性檢驗計算問題和軟件開發(fā)未來工作第2頁,共38頁,2023年,2月20日,星期二第一部分:研究背景第3頁,共38頁,2023年,2月20日,星期二定量數(shù)據(jù)分析面對的問題大規(guī)模Biomarker發(fā)現(xiàn)低豐度蛋白質
信號S/N低+鑒定信息少
重復實驗數(shù)據(jù)綜合蛋白質和肽段預分離技術策略的數(shù)據(jù)綜合Biomarker驗證靶標分析靶標挑選(MRM)肽段分析效率預測(絕對定量)生物樣本蛋白質表達的隨機變化影響臨床診斷直接尋找差異
肽段組學,肽段特征矩陣,LC-MS策略,信號直接對比+有選擇鑒定第4頁,共38頁,2023年,2月20日,星期二定量數(shù)據(jù)分析的基本方法不包括MRM、iTRAQ和SC定量標記定量無標定量第5頁,共38頁,2023年,2月20日,星期二計算問題圖譜定量信息提取同位素峰簇處理肽段定量指標計算比值計算,XIC處理,母離子誤差校正RT對齊LC-MS策略和LC-MS/MS策略的不同信號歸一化消除系統(tǒng)誤差差異顯著性檢驗考慮信號強度影響第6頁,共38頁,2023年,2月20日,星期二質譜信號與定量無標記:同位素峰標記:配對的同位素峰第7頁,共38頁,2023年,2月20日,星期二圖譜定量信息提取方法基本方法
最大值法,平滑積分法,信號求和,構建3Dpeaks(MaxQuant),函數(shù)擬合附加處理
小波去噪,同位素分布約束,信噪比過濾結果形式
標記定量:比值,定量指標
無標定量:定量指標第8頁,共38頁,2023年,2月20日,星期二肽段定量指標計算可選步驟去噪處理:小波,平滑濾波XIC峰形擬合:復雜的類高斯函數(shù)XIC邊界確定:信噪比,連續(xù)性,局部最小值母離子匹配誤差分布:提高精度?標記定量:比值計算,MaxQuant采用了最小二乘擬合法問題:不同試劑標記的肽段XIC平移,差異越大,表現(xiàn)越明顯無標記定量:定量指標計算第9頁,共38頁,2023年,2月20日,星期二RT對齊LC-MS策略:尋找共同的肽段信號,建立非線性模型LC-MS/MS策略:利用共同鑒定肽段的RT建立對齊模型對齊模型:3次樣條,局部回歸,小波,分段線性,偏移向量等作用:對LC-MS/MS策略,可以彌補鑒定信息的不足,提高MS圖譜信號利用率第10頁,共38頁,2023年,2月20日,星期二信號歸一化和差異顯著性檢驗信號歸一化目的:針對無標記定量,消除不同實驗間的系統(tǒng)誤差基本方法:尋找不變量差異顯著性檢驗從肽段到蛋白質的信息綜合:平均?篩選?異方差問題:信號越弱,誤差分布越寬第11頁,共38頁,2023年,2月20日,星期二一個例子XIC定量信息:TGVIVGEDVHNLFTYAK圖譜計數(shù)SCXIC面積SA(對數(shù))保留時間RT上樣量(ug/ul)1268.5453.6616173.0707.5658.1350220.335.1559.1996300.0345.8957.6437970.003AVG_ISO_DISSCCHXCorr?CnLM(ug/ul)12625.10.623.01432.630.333.07025.580.470.3432.80.400.3324.90.490.03424.30.720.003132.20.340.003鑒定信息數(shù)據(jù)產(chǎn)生LTQ/FT分析Yeast樣品,SEQUEST搜庫,Target-decoy過濾(FDR=0.01),取Scannumber最小的記錄第12頁,共38頁,2023年,2月20日,星期二定量軟件Cencus、CRAWDAD、MaxQuant軟件在可視化、速度、數(shù)據(jù)文件格式支持、算法精度和實驗策略支持等方面有很大發(fā)展空間第13頁,共38頁,2023年,2月20日,星期二定量軟件-Mascot支持的定量類型
多種標記定量,MS/MS圖譜定量,emPAI,重復實驗Labelfree,選擇信號最強的3個肽段數(shù)據(jù)處理算法特色
基于m/z和RT的對齊,多種XIC積分方法,多參數(shù)鑒定結果過濾,outliers排除,歸一化處理(利用均值)使用方法
在搜庫前定義修飾和定量的參數(shù)(通過修改XML文件實現(xiàn)),搜庫,然后使用Distiller定量第14頁,共38頁,2023年,2月20日,星期二第二部分:研究內(nèi)容和結果第15頁,共38頁,2023年,2月20日,星期二定量信息的提?。篖abelfree去噪方法不去噪Xcalibur默認小波去噪譜峰定量信息最大值平滑積分函數(shù)擬合信號加和同位素峰單一最高全部XIC處理小波去噪平滑去噪連續(xù)性截斷誤差分析XIC定量平滑積分函數(shù)擬合信號加和XXX圖譜水平肽段水平X共3*4*3*4*3=432種計算流程比較原則:重復實驗的CV值最小目前結論:(1)不進行去噪處理的信號加和方法最優(yōu)(2)高信號水平的處理結果CV值都比較小
第16頁,共38頁,2023年,2月20日,星期二定量信息提?。簶擞浂繄D譜水平:非線性擬合算法特點可定義一般模式,支持自定義標記方法,支持多重標記能夠充分利用同位素分布信息能夠直接解決譜峰疊加問題第17頁,共38頁,2023年,2月20日,星期二定量信息提?。簶擞浂侩亩嗡?/p>
實現(xiàn)了多種算法:XIC面積比,
圖譜比值平均,主成分分析,最小二乘回歸采用了異常值排除策略實現(xiàn)了基于XIC連續(xù)性的截斷第18頁,共38頁,2023年,2月20日,星期二
單一同位素峰最高問題:同位素峰分布測量誤差第二同位素峰最高第三同位素峰最高第四同位素峰最高數(shù)據(jù):FT_yeast,BPRC,高可信鑒定肽段第19頁,共38頁,2023年,2月20日,星期二問題:從質量預測同位素分布經(jīng)驗公式:從IPI.Human3.49酶切肽段中統(tǒng)計(胰酶,2個漏切,肽段長度不超過100)aibi1.0070.00057920.0006321-0.092120.00056830.022920.00055260.096750.0005680.11380.00057950.1215Bellew,M.,M.Coram,etal.,Bioinformatics,2006.22(15):.第20頁,共38頁,2023年,2月20日,星期二重復實驗的數(shù)據(jù)處理RT對齊和交叉搜索P1P2Pn…√XX√√√MS搜索MS搜索信息的充分利用不可逆:需要建立個RT對齊模型可逆:需要建立n-1個模型工作:實現(xiàn)了基于局部回歸(采用線性函數(shù))的可逆模型和算法,大大減小了計算量第21頁,共38頁,2023年,2月20日,星期二交叉搜索的效果鑒定次數(shù)定量次數(shù)第22頁,共38頁,2023年,2月20日,星期二重復實驗的數(shù)據(jù)處理信息融合問題:一個肽段,多個定量結果,怎樣給出最終結果?方法:信號歸一化后,求平均值、中值或者最大值結果:對簡單重復來說,分組平均后組間差異更小,例如10次重復,分為兩組,求5次平均。數(shù)據(jù):FT_yeast,BPRC第23頁,共38頁,2023年,2月20日,星期二標記定量中比值分布--信號強度H/D(3)標記實驗中發(fā)現(xiàn),比值的標準差隨著XIC中peaknumber的增大而減小數(shù)據(jù):FT,人血漿,BPRC第24頁,共38頁,2023年,2月20日,星期二無標記定量中差異分布分段估計方差第25頁,共38頁,2023年,2月20日,星期二帶有參數(shù)的分布模型極大似然估計—直接優(yōu)化似然函數(shù)初始值的選擇決定成敗第26頁,共38頁,2023年,2月20日,星期二標記定量軟件SILVERC++語言GUI交互操作批量數(shù)據(jù)處理文件格式支持:XML,Mascotdat和html多線程,圖譜、XIC導出,多種輸出格式,算法優(yōu)化第27頁,共38頁,2023年,2月20日,星期二索引文件和速度提升索引文件和數(shù)據(jù)結構Scannumber到MS圖譜索引:Hash表圖譜中Isotopicpeaks定位:二分法查找第28頁,共38頁,2023年,2月20日,星期二無標記定量軟件LFQuant重復實驗支持定量精度和參數(shù)優(yōu)化速度:1s可以定量1000個肽段支持pepXML,protXML,mzXML,mzData,mzML蛋白質組裝和未鑒定肽段搜索RT對齊、信號歸一化從搜庫(SEQUEST)到定量完成的全流程自動化,有GUI界面第29頁,共38頁,2023年,2月20日,星期二LC-MS策略支持軟件XICFinder不需要鑒定信息,直接從MS圖譜中解析同位素峰簇考慮了XIC截斷,同位素峰疊加,母離子誤差校正等問題提供了信噪比、同位素分布擬合優(yōu)度等過濾測試:發(fā)現(xiàn)采用嚴格過濾規(guī)則,則鑒定肽段也可能不能定量,說明和LC-MS/MS策略可以相互補充第30頁,共38頁,2023年,2月20日,星期二第三部分:進一步的思考第31頁,共38頁,2023年,2月20日,星期二預分離和信號歸一化SDS分離蛋白質多條帶分布條帶切割的不均勻性不同實驗之間信號不可比第32頁,共38頁,2023年,2月20日,星期二1D-SDSPAGE和Labelfree定量蛋白質的多條帶分布問題沒有提及多條帶分布的原因:修飾、誤切、可變剪接第33頁,共38頁,2023年,2月20日,星期二信號歸一化“局部效應”僅僅考慮了信號強度因素RPLC和ESI過程中的離子抑制效應和Matrixeffect:信號的局部歸一化尋找RT軸上的校正曲線:不變量第34頁,共38頁,2023年,2月20日,星期二可能方法儀器加性電子噪聲的不變性圖譜信號統(tǒng)計不變量小波去噪第35頁,共38頁,2023年,2月20日,星期二蛋白質組裝與定量Quant:MSIDscore:MS/MSPCP:sequenceQuant:MSPCP:sequence影響圖譜質量,從而影響IDScore決定碎裂模式,影響IDscore蛋白質肽段RPLC分離過程中肽段之間相互影響色譜流出曲線與肽段混合物有關MSresponse不僅僅由肽段自身屬性決定,還與其它混合在一起的肽段相關肽段檢測效率預測問題第36頁,共38頁,2023年,2月20日,星期二貝葉斯網(wǎng)絡蛋白質肽段肽段肽段酶切模型MS圖譜(多張,組成XI
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人商品住宅買賣合同標準范本4篇
- 2025年度綠色建筑個人勞務分包合同規(guī)范文本4篇
- 2025年度個人二手卡車買賣合同規(guī)范4篇
- 引水隧洞豎井施工方案
- 2025年度個人貸款合同范本集錦與利率調整機制3篇
- 2025年個人股權清算分配協(xié)議范本4篇
- 2024年中職學生教案模板(共8篇)
- 二零二五版美發(fā)企業(yè)股東股權變更與投資協(xié)議3篇
- 軋輥示熱處理課程設計
- 二零二五版美容院員工加班費計算合同樣本4篇
- 2024高考復習必背英語詞匯3500單詞
- 消防控制室值班服務人員培訓方案
- 《貴州旅游介紹》課件2
- 2024年中職單招(護理)專業(yè)綜合知識考試題庫(含答案)
- 無人機應用平臺實施方案
- 挪用公款還款協(xié)議書范本
- 事業(yè)單位工作人員年度考核登記表(醫(yī)生個人總結)
- 盾構隧道施工數(shù)字化與智能化系統(tǒng)集成
- 【企業(yè)盈利能力探析文獻綜述2400字】
- 2019年醫(yī)養(yǎng)結合項目商業(yè)計劃書
- 2023年店鋪工程主管年終業(yè)務工作總結
評論
0/150
提交評論