《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明

上傳人：1*** IP屬地：浙江上傳時間：2024-12-01 格式：PDF 頁數(shù)：33 大?。?.56MB 積分：11 舉報 版權(quán)申訴

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第2頁

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第3頁

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第4頁

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第5頁

已閱讀5頁，還剩28頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明

一、工作簡況

1、任務(wù)來源

本標準基于衛(wèi)健委/科技部國家重點研發(fā)計劃《醫(yī)學(xué)生命組學(xué)數(shù)據(jù)質(zhì)量控制關(guān)鍵技術(shù)

研發(fā)與應(yīng)用》（2018YFC0910200，2018年立項，2021年結(jié)題）和廣東省重點領(lǐng)域研發(fā)計劃

《多組學(xué)整合技術(shù)研發(fā)及標準化組學(xué)數(shù)據(jù)質(zhì)量控制技術(shù)的推廣應(yīng)用》（2019B020226001，

2019年立項，2022年結(jié)題）兩個項目的研究成果，本標準由深圳承啟生物科技有限公司于

2023年9月提出申報，根據(jù)中國國際科技促進會標準化工作委員會[2023]中科促標字第982

號文件：關(guān)于開展《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》團體標準立項通知，正式確立立

項，本項目計劃編號為：CI2023419。

2、目的和意義

質(zhì)譜是目前蛋白質(zhì)組學(xué)研究的主流技術(shù)，可以一次性分析復(fù)雜樣品中上萬種蛋白質(zhì)。

但質(zhì)譜的重現(xiàn)性一直是一個很大的問題。同一個樣品做兩次質(zhì)譜實驗，鑒定到的蛋白質(zhì)都

有較大的不同，重現(xiàn)性（即兩次都能鑒定到的蛋白數(shù)量占總鑒定數(shù)的百分比）一般只能達

到65-85%。2017年《NatureCommunications》上的一篇文章指出(Collinsetal.,

NatureCommunications)，只有約一半的蛋白質(zhì)能在SWATH（SequentialWindowed

AcquisitionofallTheoreticalfragmentions,SWATH）質(zhì)譜技術(shù)中被重復(fù)鑒定到，

而SWATH已經(jīng)被認為是重現(xiàn)性相對較高的質(zhì)譜技術(shù)了?！禨cience》曾組織專題研討會討論

如何提高質(zhì)譜的重現(xiàn)性，指出現(xiàn)有質(zhì)譜的重現(xiàn)性遠遠不能滿足生物標志物的要求。重現(xiàn)性

問題如果不能得到很好的解決，那么基于質(zhì)譜的生物標志物發(fā)現(xiàn)及臨床應(yīng)用將十分困難。

對于定量蛋白質(zhì)組學(xué)研究，因為樣品制備流程、質(zhì)譜平臺和分析流程常常不一致，加大了

蛋白質(zhì)組學(xué)在精準醫(yī)學(xué)中的應(yīng)用難度；此外，Hela細胞蛋白酶解的標準品作為一種高度驗

證的哺乳動物蛋白消化物，可用作復(fù)雜蛋白質(zhì)組學(xué)樣品的質(zhì)譜分析的質(zhì)控樣品被人們廣泛

使用。然而Hela細胞因其存在超強的種內(nèi)污染和種間污染而存在廣泛爭論。基于以上領(lǐng)域

內(nèi)存在的諸多問題，我們利用多組學(xué)技術(shù)手段評估并開發(fā)出一種或多種可作為蛋白質(zhì)組標

準品的細胞株，并以此制定蛋白質(zhì)組標準操作流程供行業(yè)內(nèi)流通使用。

目前國內(nèi)外均無相關(guān)的標準流程，各蛋白質(zhì)組學(xué)研究單位處于各自為戰(zhàn)的狀態(tài)。流程

不通用，結(jié)果不可比。

本標準對樣品采集、處理、運輸、質(zhì)控和檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評估和數(shù)據(jù)分析全

流程進行標準化和規(guī)范化。該標準的特點是：流程標準化，可應(yīng)對各種類型樣品蛋白質(zhì)提

取和制備需求，同時保持結(jié)果的重現(xiàn)性，對樣品保存運輸?shù)囊蟮?；開發(fā)出了具有極高蛋

白質(zhì)組穩(wěn)定性且可穩(wěn)定傳代的蛋白質(zhì)組標準品細胞株：MHCC97H，可用于監(jiān)控實驗流程或

校準儀器，該標準品已申請國家發(fā)明專利，具有完整自主知識產(chǎn)權(quán)。

3、起草單位

本標準負責(zé)起草單位：深圳承啟生物科技有限公司。

本標準參加起草單位：暨南大學(xué)、華南理工大學(xué)、北京師范大學(xué)、中國科學(xué)院大連化

學(xué)物理研究所、福建農(nóng)林大學(xué)、福建省婦幼保健院、上海易算生物科技有限公司、布魯克

（北京）科技有限公司。

本標準主要起草人：張弓、陳洋、余卓、盧少華、趙晶、李亞星、范小路、杜紅麗、

高友鶴、袁曉明、沈城頻、王心睿、盧紅、劉先明、杜蕭賢。

參加單位工作分配：深圳承啟生物科技有限公司負責(zé)標準方案的制定及網(wǎng)頁發(fā)布；深

圳承啟生物科技有限公司、暨南大學(xué)、華南理工大學(xué)、中國科學(xué)院大連化學(xué)物理研究所、

北京師范大學(xué)、福建農(nóng)林大學(xué)、福建省婦幼保健院、上海易算生物科技有限公司和布魯克

生物科技有限公司參與了標準方案的實驗測試和質(zhì)量評估；暨南大學(xué)、深圳承啟生物科技

有限公司進行了標準起草和編制說明編寫，其他參與單位對標準各個版本的全部內(nèi)容提出

編寫和修改意見。

4、起草過程

4.1起草階段

2019年1月至2019年6月，標準起草單位組織相關(guān)技術(shù)人員對標準項目進行了預(yù)研，課

題組成員廣泛收集了國內(nèi)外基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)的應(yīng)用現(xiàn)狀及技術(shù)發(fā)展趨勢相關(guān)

的標準、文獻，了解了國內(nèi)外相關(guān)技術(shù)動態(tài)，并且明確了工作思路和進程安排；

2019年7月至2022年4月，標準起草單位對標準草案進行實驗驗證和技術(shù)論證并確立了

基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)從采樣、前處理、運輸、質(zhì)控和檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評

估和數(shù)據(jù)分析全流程，形成了《基于質(zhì)譜的定量蛋白質(zhì)組學(xué)技術(shù)規(guī)程》的初稿，并于2023

年3月以網(wǎng)頁形式向社會發(fā)布

（/Resources/omicsStandard/index.html）；

2022年8月，國家衛(wèi)生健康委醫(yī)藥衛(wèi)生科技發(fā)展研究中心組織專家對本標準流程初稿

進行評審，參會專家做“基本完成主要相關(guān)考核指標”的評價，建議進一步加強相關(guān)數(shù)據(jù)

采集與檢測標準的認定，同時提出應(yīng)加強應(yīng)用示范的建議；

2022年9月至11月，編制組針對收集的意見，對標準進行了補充和完善。包括：1）增

加了蛋白質(zhì)提取質(zhì)量檢測標準；2）增加了使用MHCC97H標準品及標準數(shù)據(jù)集進行數(shù)據(jù)質(zhì)量

控制的內(nèi)容；3）在暨南大學(xué)、華南理工大學(xué)、北京師范大學(xué)和布魯克生物科技有限公司

等單位宣傳和推廣本標準，充分交流并進一步收集相關(guān)單位的反饋意見；

2022年12月，向廣東省科技創(chuàng)新監(jiān)測研究中心組織的專家組進行總結(jié)報告，專家組考

察了標準實施場地，審閱了相關(guān)資料并進行了咨詢。項目開發(fā)技術(shù)已在多家機構(gòu)推廣應(yīng)用，

取得較好的評價和一定的經(jīng)濟效益；

本標準由深圳承啟生物科技有限公司提出，由暨南大學(xué)和深圳承啟生物科技有限公司

主編，其他單位共同參與起草，于2023年9月提交團體標準《基于質(zhì)譜的定量蛋白質(zhì)組學(xué)

技術(shù)規(guī)程》的立項申請書，經(jīng)中國國際科技促進會標準化工作委員會及相關(guān)專家技術(shù)審核，

于2023年10月19日正式發(fā)布立項公告，并于同日在全國團體標準平臺發(fā)布立項公示。

2024年1月，中國國際科技促進會標準化工作委員會完成了對本標準內(nèi)容的審核并提

出對格式重排和規(guī)范書寫的意見，編制組進一步參考標準書寫規(guī)范，修改和完善了標準文

本內(nèi)容，形成了《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》團體標準征求意見稿和團體標準編

制說明。

4.2征求意見階段

2024年2月，本標準由中國國際科促會標準化工作委員會，在全國團體標準信息平臺

面向社會進行公開征求意見。同時由編制組向相關(guān)單位進行定向征求意見。

4.3審查階段

4.4報批階段

二、標準編制原則、主要內(nèi)容及其確定依據(jù)，修訂標準時，還包括修訂前后

技術(shù)內(nèi)容的對比

1、標準的編寫原則

本標準的制定工作遵循“先進性、適用性、可操作性、實用性、規(guī)范性”的原則，依

據(jù)GB/T1.1-2020《標準化工作導(dǎo)則第1部分：標準化文件的結(jié)構(gòu)和起草規(guī)則》和GB/T

20001.4-2015《標準編寫規(guī)則第4部分：試驗方法標準》給出的規(guī)則編寫。

2、標準主要內(nèi)容

1）樣品量要求；

2）樣品采集與保存要求；

3）樣品前處理要求；

4）各種裂解液主要特點、差異和選擇建議；

5）樣品運輸要求；

6）SDS質(zhì)量控制結(jié)果判定及解決方法；

7）非標記定量蛋白質(zhì)組蛋白質(zhì)酶解實驗流程；

8）iTRAQ標記定量蛋白質(zhì)組蛋白質(zhì)酶解及標記實驗流程（以8標為例）；

9）多肽樣品除鹽實驗流程；

10）質(zhì)譜數(shù)據(jù)采集實驗流程；

11）質(zhì)譜數(shù)據(jù)質(zhì)量控制要求。

3、制定本標準的依據(jù)

3.1蛋白質(zhì)組標準流程可極大提高大腸桿菌蛋白組的重復(fù)性

本項目前期已初步建立蛋白質(zhì)組的制備分析全流程，并已研發(fā)獲得極為穩(wěn)定的蛋白質(zhì)

標準品，據(jù)此，我們利用前期研究成果進一步驗證流程和標準品的穩(wěn)健性。細菌中半數(shù)以

上的蛋白質(zhì)編碼基因是由兩個或兩個以上的基因組成的多順反子操縱子所組成。操縱子組

織是否維持操縱子內(nèi)基因的化學(xué)計量表達仍有爭議。在本研究中，我們進行了一項無標記、

與數(shù)據(jù)無關(guān)的采集超反應(yīng)監(jiān)測質(zhì)譜(HRM-MS)實驗，以定量指數(shù)期的大腸桿菌蛋白質(zhì)組，并

定量了93.6%的胞質(zhì)蛋白，分別涵蓋了BW25113和MG1655菌株中67.9%和56.0%的翻譯多

順反子操縱子。我們發(fā)現(xiàn)翻譯調(diào)控在很大程度上有助于蛋白質(zhì)組的復(fù)雜性:對于化學(xué)計量，

較短的操縱子往往比較長的操縱子受到更嚴格的控制；主要編碼復(fù)合物的操縱子比主要編

碼代謝途徑的操縱子更嚴格地控制化學(xué)計量?；蜷g隔(一個操縱子中相鄰基因之間的距

離)可以作為化學(xué)計量的調(diào)節(jié)因子。催化效率可能是一個操縱子編碼的酶的差異表達的驅(qū)

動力。這些結(jié)果說明了操縱子調(diào)控的多面性:操縱子統(tǒng)一轉(zhuǎn)錄水平和基因特異性翻譯水平。

這種多水平調(diào)控通過優(yōu)化代謝途徑的生產(chǎn)力效率和維持不同類型的蛋白質(zhì)復(fù)合物而有益于

宿主。

為了評估HRM-MS方法的定量能力和再現(xiàn)性，我們應(yīng)用自研標準品對質(zhì)譜進行標準測

定及校準，使用上述已建立的蛋白質(zhì)組標準流程對菌株BW25113和MG1655的大腸桿菌總

可溶性蛋白進行了兩次生物學(xué)重復(fù)實驗。當(dāng)使用先前的鑒定標準(至少一種獨特肽，肽長

度≥6個氨基酸)時，我們的HRM-MS結(jié)果分別定量了這兩種菌株中的1951和1571個蛋白

質(zhì)。兩次生物復(fù)制鑒定了幾乎相同的蛋白質(zhì)，證明了高穩(wěn)健性和再現(xiàn)性(圖1A)。兩個重復(fù)

對幾乎相同的蛋白質(zhì)進行了定量:僅在一個重復(fù)中對少數(shù)蛋白質(zhì)進行了定量(圖1A)。在嚴

格標準下為兩個獨特的肽和至少七個氨基酸的肽長度。即使在嚴格標準下，我們?nèi)砸愿咴?/p>

現(xiàn)性定量了1675和1252個蛋白質(zhì)(圖1B、C)。與之前通過其他方法定量的結(jié)果(APEX為1

021個蛋白質(zhì)，iBAQ為1183個蛋白質(zhì)，emPAI為1138個蛋白質(zhì))相比，定量的可溶性蛋白

質(zhì)數(shù)量幾乎增加了一倍。

圖1.不同非標記定量方法獲得的蛋白質(zhì)豐度比較。

為了排除儀器的差異，我們在同一臺OrbitrapFusionLumos儀器中對兩種菌株進行

了DDAMS實驗。根據(jù)嚴格標準鑒定蛋白質(zhì)，并使用iBAQ法進行定量。DDAMS分別定量了

BW25113和MG1655菌株的1520和1482個蛋白質(zhì)，與HRM-MS實驗相當(dāng)。然而，兩個生物

學(xué)復(fù)制品的iBAQ定量的相關(guān)系數(shù)分別為0.932和0.939(圖1D，E)，低于HRM-MS(兩個菌

株的R分別為0.982和0.988)。兩個菌株中每個鑒定蛋白平均被19.20和15.45個肽覆蓋，

分別覆蓋31.56%和24.87%的氨基酸序列(圖1F)，高于人類蛋白質(zhì)組質(zhì)譜實驗的典型肽覆

蓋(單個搜索引擎，覆蓋高達20%)。

以上研究發(fā)表在：FrontiersinGenetics(2019)10:473.

3.2翻譯組可作為指導(dǎo)蛋白質(zhì)組質(zhì)量控制的獨立數(shù)據(jù)集

到目前為止，在質(zhì)譜蛋白質(zhì)組鑒定的時候依然有超過一半的譜圖無法被鑒定。開放式

搜索（OpenSearch）策略很早就被提出用來解決這一問題。但是OpenSearch的搜索策

略的鑒定結(jié)果可靠程度一直難以評估，也缺乏一套完整系統(tǒng)的使用手冊。我們提出使用翻

譯組測序數(shù)據(jù)作為最小化庫對OpenSearch的鑒定結(jié)果進行質(zhì)控，主要的方法是引入可疑

發(fā)現(xiàn)率（SDR）作為參考指標對OpenSearch策略和限制性搜索（NarrowwindowSearch）

策略的鑒定結(jié)果進行評價。結(jié)果發(fā)現(xiàn)，OpenSearch策略確實可能引入更多的假陽性，但

它確實能夠有效提高譜圖利用率，我們還提出將肽段FDR控制在0.001以下能夠有效控制

OpenSearch鑒定結(jié)果假陽性發(fā)生，并且給出了一套OpenSearch較為完整的使用規(guī)范，

這對于促進容差搜索策略的發(fā)展有重要意義，并且能幫助我們更好地認識那些無法被鑒定

和使用的譜圖，揭示更多的翻譯后修飾、單氨基酸多態(tài)性以及新型剪接變體等事件。

3.2.1實現(xiàn)接近完整的翻譯中基因鑒定率

所有RNC-seq都是以非常高的通量下測序，測序通量達到144-188M讀段。假設(shè)一個

典型的哺乳動物細胞含有200，000個mRNA分子，一個平均長度為2.2kb且豐度為1拷

貝/細胞的轉(zhuǎn)錄物相當(dāng)于2.27RPKM。采用每種轉(zhuǎn)錄物10次閱讀的量化標準，這種通量可

以量化平均長度的轉(zhuǎn)錄物，豐度為0.014拷貝/細胞，表明翻譯mRNA鑒定接近完成。事實

上，我們發(fā)現(xiàn)RNC-seq-量化的低豐度翻譯mRNAs低至0.001RPKM(圖2A)。此外，在此處

理量下，量化的基因數(shù)量接近飽和(圖2B)，再次表明翻譯mRNAs的鑒定接近完整。

圖2.不同設(shè)置下限制性搜索和開放搜索策略的SDR評估。

3.2.2利用質(zhì)量容差和多肽FDR可以控制開放搜索SDR

不管是NarrowSearch策略還是OpenSearch策略，在進行數(shù)據(jù)庫搜索之前都會對氨

基酸修飾進行預(yù)先的設(shè)置，包括固定修飾或者可變修飾。在通常情況下，氨基酸的修飾千

變?nèi)f化，無法準確地清楚所有的氨基酸修飾的具體情況，那么較為經(jīng)典的做法是對氨基酸

進行占比例較大的一些修飾進行預(yù)先的設(shè)置，例如半胱氨酸的烷基化修飾和蛋氨酸的氧化

修飾以及肽段的N端乙酰化修飾等。理論上，增加可變修飾的種類將使得搜空間擴大，不

僅需要更多的計算也會導(dǎo)致鑒定結(jié)果的準確性的下降，因此，我們在這里只進行兩種占比

例較大的氨基酸修飾進行預(yù)先的設(shè)置，分別為半胱氨酸的烷基化修飾和蛋氨酸的氧化修飾。

通過不同的修飾設(shè)置的組合對相同數(shù)據(jù)集進行NarrowwindowSearch（Precursortolera

nce=10ppm），我們發(fā)現(xiàn)對于一般的搜庫軟件如pFind，增加可變修飾會使得鑒定結(jié)果的

SDR提高，不設(shè)置任何修飾信息不會使得SDR增加（圖2C）。

開放搜索策略的關(guān)鍵是允許更大的母離子質(zhì)量容差，以耐受由修飾引起的質(zhì)量偏移。

然而，這也將導(dǎo)致允許更多假陽性的副作用。允許較小的母離子容差在理論上應(yīng)該會降低

SDR。當(dāng)允許100–800Da母離子質(zhì)量容限時，我們驗證了兩種算法的這一假設(shè):容限越低，

SDR越低(圖3A)。我們還注意到，當(dāng)質(zhì)量容差超過400Da時，SDR幾乎飽和。相比之下，

識別能力幾乎與窗口大小無關(guān)(圖3B)。這些結(jié)果表明，當(dāng)大部分預(yù)期修改已經(jīng)包括在內(nèi)時，

較大的質(zhì)量公差是沒有用的。事實上，300Da的耐受性已經(jīng)涵蓋了90%的預(yù)期修改，500

Da的耐受性涵蓋了94%。38–70%的質(zhì)量位移為+1至+3，表明質(zhì)量位移的主要來源是同位

素偏移。

肽FDR過濾是用于控制鑒別質(zhì)量的另一個因素。由于大的前體耐受性可能導(dǎo)致肽鑒定

的較高誤差，因此更嚴格的肽FDR應(yīng)有助于控制質(zhì)量。事實上，我們發(fā)現(xiàn)設(shè)置更嚴格的肽

FDR標準顯著降低了兩種算法的SDR(圖3C和D)。當(dāng)將肽FDR設(shè)置為0.001時，無論將半

胱氨酸氨基甲酸乙酯化設(shè)置為可變修飾還是固定修飾，均可將開放搜索SDR平均控制在窄

窗口搜索水平(圖3C和D)。值得注意的是，算法之間存在差異:當(dāng)將肽FDR設(shè)置為0.002

時，pFind開放搜索SDR降至窄搜索SDR以下，而MSFragger需要設(shè)置為0.001。

兩個搜索引擎獲取的身份信息的一致性反映了身份識別質(zhì)量的提高。在所有數(shù)據(jù)集中，

肽FDR<0.001時的一致性鑒定分數(shù)高于肽FDR<0.01時的一致性鑒定分數(shù)(圖3E)。

以上研究發(fā)表在：JournalofProteomeResearch(2018)17(11),3719-3729.

圖3.使用不同因素控制SDR。

3.3利用翻譯組發(fā)現(xiàn)隱藏的非編碼基因來源蛋白質(zhì)組

人類基因組上已知大約有5萬個基因，其中約2萬個被標注為可以表達蛋白質(zhì)的

“編碼基因”，而另外3萬個基因被標注為“非編碼基因”(non-codinggenes)。已有的

報道中，除了部分非編碼基因可以表達為小肽行使調(diào)控功能外，也有個別lncRNA被發(fā)現(xiàn)

實際上能翻譯成>50氨基酸的蛋白質(zhì)，例如CLUU1,ESRG等，問題是，如果這種情況不是

個案而是普遍存在的現(xiàn)象，則確實存在部分“編碼基因”被錯誤地標注成了“非編碼基

因”，這將意味著人基因組需要被系統(tǒng)性地重新注釋。

事實上，這一問題很早就被學(xué)界關(guān)注過。2013年，EricLander等人僅僅根據(jù)Riboso

meprofiling計算模型認為lncRNA不可能編碼蛋白質(zhì)。但僅僅一年后，該團隊又發(fā)表文

章，僅僅是調(diào)整了計算模型，認為lncRNA可能編碼蛋白質(zhì)，然而其始終拿不出蛋白質(zhì)實

驗證據(jù)。2014年，人類蛋白質(zhì)組草圖在Nature上發(fā)表，聲稱發(fā)現(xiàn)千余個lncRNA所編碼的

“新蛋白質(zhì)”，但隨后便被人類蛋白質(zhì)組組織(HUPO)爆出其分析不合規(guī)范，存在大量的假

陽性鑒定，在用較嚴格的標準進行質(zhì)控后，這些所謂的“新蛋白質(zhì)證據(jù)”幾乎都被認定為

假陽性。因此，如何避免蛋白質(zhì)組學(xué)質(zhì)譜技術(shù)的固有缺陷，提供獨立的蛋白質(zhì)編碼信息源，

就顯得非常重要。在本項目中使用翻譯組測序技術(shù)（RNC-seq），在肺癌細胞中發(fā)現(xiàn)了139

7個有可能被翻譯的“非編碼RNA”[16]。從9株人細胞系中共鑒定到約4700種lncRNA

正在被翻譯，且可能以經(jīng)典翻譯起始方式翻譯出>50氨基酸的蛋白質(zhì)。利用目前公認的驗

證標準，我們提供了其中314個新蛋白質(zhì)的證據(jù)。這些蛋白質(zhì)是穩(wěn)定存在的，并且有著明

確的細胞定位，功能實驗也證實它們以蛋白質(zhì)形式（而非RNA形式）行使著明確的生物學(xué)

功能。

3.3.1人類細胞中含有大量正在翻譯的長鏈非編碼RNA

我們先前已對人肺HBE細胞、A549和H1299細胞、人結(jié)直腸癌Caco-2細胞、人肝癌

MHCCLM3、MHCC97H和Hep3B細胞和人宮頸癌HeLa細胞中的全長翻譯mRNA進行了測序。在

此，我們進一步對MHCCLM6細胞進行了mRNA測序和全長翻譯mRNA-seq(RNC-seq)分析。

總之，我們發(fā)現(xiàn)1028-3330lncRNA與9個受試人類細胞系中的核糖體結(jié)合。其中，2969

個翻譯型lncRNAs具有至少一個以AUG起始的規(guī)范開放閱讀框(ORF)，可編碼長度至少為5

0aa的蛋白質(zhì)(圖4A)。這意味著一個前所未有的顯著的隱藏的人類蛋白質(zhì)組。

我們的核糖體分析結(jié)果證實，這些翻譯型lncRNAs由核糖體主動翻譯，因為核糖體足

跡跨越轉(zhuǎn)錄本，尤其是跨越預(yù)測的CDS區(qū)域(圖4B)。翻譯的lncRNAs分布在整個人類基因

組的所有染色體中，幾乎未檢測到染色體富集(圖4C)，表明這些潛在的新編碼基因在整個

人類基因組中普遍存在。同時，在幾乎所有9個受試細胞系中檢測到約1/3的這些翻譯ln

cRNAs(≥0.1RPKM和≥10次讀取)，其余的表現(xiàn)出顯著的細胞特異性表達(圖4D)，這在我

們使用RPKM=1.0作為閾值時也觀察到(圖4E)。這些結(jié)果表明這些lncRNAs的翻譯受到

普遍調(diào)控。

圖4.翻譯中的lncRNA可以編碼蛋白質(zhì)。

3.3.2lncRNA編碼蛋白質(zhì)組的蛋白質(zhì)證據(jù)

接下來，我們旨在為這些翻譯的lncRNAs編碼的潛在新蛋白找到質(zhì)譜證據(jù)。我們注意

到，新蛋白的長度比已知蛋白短得多，即由人類蛋白質(zhì)組項目(HPP)提出的蛋白證據(jù)水平1

(PE1)蛋白(圖5A)。因此，我們對低分子量蛋白質(zhì)(<25kDa)進行了MS分析，以補充對

總蛋白質(zhì)的鳥槍法蛋白質(zhì)組學(xué)分析。我們認為根據(jù)以下標準進行鑒定是有把握的:(I)蛋白

質(zhì)水平FDR<1%，(ii)肽長度至少9aa，(iii)如前所述，根據(jù)Smith-Waterman分析，至

少一種獨特的肽具有不超過兩種可能的aa錯配。因此，我們通過MS分析分別從總(216種

蛋白質(zhì))和低分子量(109種蛋白質(zhì))蛋白質(zhì)組分中鑒定出與lncRNAs編碼的308種新蛋白質(zhì)

相對應(yīng)的372種獨特肽(圖5B)，只有17種重疊。308個新蛋白的所有蛋白識別信息，包

括蛋白名稱、唯一肽序列、肽長、搜索引擎，均可在S2增補表中找到?？赏ㄟ^iProX數(shù)

據(jù)庫(注冊號:IPX00076300)獲取原始數(shù)據(jù)文件、參考數(shù)據(jù)庫和搜索結(jié)果文件。

圖5.翻譯中l(wèi)ncRNA的蛋白質(zhì)證據(jù)。

我們發(fā)現(xiàn)，超過36%的MS檢測到的新蛋白由至少兩種獨立肽段(47種蛋白質(zhì))或一種

獨立肽段加上至少一種支持肽段(66種蛋白質(zhì))證明。這里，支持肽段是由數(shù)據(jù)庫搜索引擎

分配給某個蛋白質(zhì)鑒定的非唯一肽。此外，在308個MS鑒定的新蛋白中，有261個僅由

一種獨立肽段證明(圖5C)，這可以部分解釋為翻譯-mRNA分析中大多數(shù)新蛋白的表達水平

普遍較低(<10RPKM)(圖4D和E)以及長度較短(圖5A)。

我們參考了HPP指南2.1標準來表述特殊檢測結(jié)果，該標準要求使用獨立于數(shù)據(jù)的采

集方法，包括多反應(yīng)監(jiān)測(MRM)和平行反應(yīng)監(jiān)測(PRM)。通常，MRM/PRM用于選擇某些母肽

進行片段化和定量?？赏ㄟ^添加合成肽作為樣品中這些肽的進一步定量的加樣標準來輔助

這一操作。對于常規(guī)MRM(不含合成肽)，我們發(fā)現(xiàn)184種新蛋白有203種獨特肽的證據(jù)(圖

5D)，分別占所有已鑒定獨特肽和新蛋白的54.6%和59.7%。

對于基于合成肽的PRM分析，在372個新的蛋白質(zhì)編碼肽中，我們合成了313個技術(shù)

上允許的重標記標準肽。我們可以通過數(shù)據(jù)相關(guān)采集(DDA)分析確定313項標準中的206

項(圖5D)。通過對這206種肽的PRM分析，我們只能驗證8種肽的存在(圖5D)，表明需

要優(yōu)化MRM。在DDA和常規(guī)MRM中均檢測到104種重肽(圖2D)。由此，通過對重鏈MRM分

析的逐一優(yōu)化，我們可以進一步驗證細胞裂解液中存在來自38種蛋白質(zhì)的40種肽(圖5D)。

這些肽的峰組的相對強度和洗脫時間均與合成參考肽匹配，表明根據(jù)HPP指南2.1標準對

其存在進行了有把握的驗證。

接下來，我們使用含有抗原表位的特異性肽制備了用于鳥槍法MS檢測的四種新蛋白

的多克隆抗體。免疫印跡結(jié)果顯示，在各種人細胞系和人組織中，所有這些蛋白在預(yù)期分

子量下均有清晰特異性條帶(圖5E)，表明它們在體內(nèi)以全長和穩(wěn)定形式存在。為了進一步

確?？贵w的特異性，我們使用體外翻譯的全長蛋白作為陽性對照，從細菌鮑曼不動桿菌和

肺炎鏈球菌中提取的總蛋白作為陰性對照(圖5E)。此外，我們?yōu)樵诜gmRNA分析中發(fā)現(xiàn)

但未被MS檢測到的另外6種新蛋白制備了多克隆抗體，并獲得了它們可靠的免疫印跡證

據(jù)(圖5F)。這些結(jié)果表明，由于MS的局限性，它只能檢測到一部分新蛋白，并提示隱藏

蛋白質(zhì)組的大小應(yīng)該更大。總之，我們使用翻譯、MS和抗體證據(jù)驗證了翻譯lncRNAs編碼

的隱藏人類蛋白質(zhì)組的存在。

以上研究發(fā)表在：NucleicAcidsResearch(2019)47(15),8111-8125.

3.4全長翻譯組的測序和蛋白質(zhì)剪切變體的深度鑒定

3.4.1RNC-mRNA的全長測序及修正

通過優(yōu)化和建立細胞中完整RNC提取技術(shù)，提高提取效率；優(yōu)化RNC-mRNA抽提方法，

確保獲得序列完整的RNC-mRNA；對提取的MHCC97H細胞系的RNC-mRNA進行基于Nanopore

MinION三代測序平臺的三代長讀長測序，產(chǎn)生初始reads平均錯誤率大約為8.47%；對

同一樣品進行精度高、短讀長的二代測序，用以對三代序列進行修正。修正后RNC-mRNA

全長測序誤差最終控制在約0.61%。該研究實現(xiàn)了翻譯組的三代全長測序，并建立了相關(guān)

實驗和分析流程。相關(guān)成果發(fā)表于FrontiersinMolecularBiosciences2022,9:89574

6。

3.4.2剪切變體的蛋白質(zhì)產(chǎn)物鑒定

利用翻譯組的二代測序數(shù)據(jù)，構(gòu)建最小化蛋白質(zhì)參考數(shù)據(jù)庫；在MHCC97H細胞系中，

利用15906個翻譯中剪切變體mRNA序列；在HeLa中利用15195個翻譯中剪切變體mRNA

序列（圖6）。此外，在MHCC97H細胞系中，利用校正的三代全長翻譯組測序數(shù)據(jù)，獲得

了15131個全長剪切變體序列，其中包括4525個公共數(shù)據(jù)庫中從未報道過的新的剪切變

體；建立了包含基因剪切變體信息的最小化參考蛋白序列庫，鑒定到6766個來自于已知

蛋白的不同全長剪切變體以及50個全新的蛋白剪切變體。該研究高精度地實現(xiàn)了蛋白質(zhì)

剪切變體的大規(guī)模鑒定，完善了相關(guān)的實驗流程和分析流程，并發(fā)現(xiàn)了大量可翻譯的新剪

切變體。

以上研究發(fā)表在：FrontiersinMolecularBiosciences2022,9:895746。

圖6.利用全長測序在基因水平和剪切變體水平檢測到的基因數(shù)目（A）以及在蛋白質(zhì)

組水平檢測到的剪切變體數(shù)目（B）。

4、制定本標準的基礎(chǔ)

起草人在本標準研究領(lǐng)域的成績：

本標準核心起草人張弓研究員，現(xiàn)為暨南大學(xué)翻譯組學(xué)實驗室負責(zé)人。國家優(yōu)青，國

家863青年科學(xué)家，國家萬人計劃青年拔尖人才，中國蛋白質(zhì)組學(xué)專業(yè)委員會(CNHUPO)理

事，中國分子系統(tǒng)生物學(xué)專業(yè)委員會委員。獲美國化學(xué)學(xué)會頒發(fā)的會員獎。任國際人類蛋

白質(zhì)組計劃（C-HPP）副主席，是中國人在C-HPP中的最高職位。建立了翻譯組學(xué)新學(xué)科

領(lǐng)域，首次實現(xiàn)翻譯組全長測序，將中心法則定量化，對1972年諾貝爾化學(xué)獎理論“安

芬森原則”作出重大更新，發(fā)現(xiàn)大量“非編碼RNA”可編碼蛋白質(zhì)（暗蛋白質(zhì)組）。翻譯

組分析被作為C-HPP的核心支柱之一。2016年被寫進國家統(tǒng)編教材。

張弓研究院研發(fā)了一系列大規(guī)模測序和蛋白質(zhì)組質(zhì)譜的基礎(chǔ)算法和實驗策略，建立了

第一個全國產(chǎn)化測序分析全流程并規(guī)?；逃?，打破美國壟斷，被新聞聯(lián)播報道。建立核

酸組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)的質(zhì)控標準和方法，研發(fā)出準確度接近100%的蛋白質(zhì)全長

測序方案。除精準醫(yī)學(xué)的應(yīng)用外，在湖北省應(yīng)用于新冠核酸檢測中，迄今為止準確率100%，

2020.8-2021.12無一例本地傳播案例，證明了這些技術(shù)的價值。

本團體標準中實驗流程和技術(shù)要求制定依據(jù)來自已完成的國家重點研發(fā)計劃項目2017

YFA0505000和2018YFC0910200的項目成果。本標準的參與單位為當(dāng)前國內(nèi)外蛋白質(zhì)組學(xué)

研究領(lǐng)域一線的代表性高校、科研院所、技術(shù)服務(wù)及儀器供應(yīng)商，可為本標準的執(zhí)行和推

廣提供強有力的技術(shù)支持和應(yīng)用推廣。

5、實驗內(nèi)容

對基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)進行調(diào)研評估，搜集相關(guān)資料及研究結(jié)果，結(jié)合文獻

及眾多科研項目，以及深圳承啟生物科技有限公司內(nèi)部標準化流程及評估標準，梳理出了

具有代表性的關(guān)鍵步驟和通用流程。因此本標準規(guī)定了基于質(zhì)譜的定量蛋白質(zhì)組檢測的主

要內(nèi)容，主要實驗內(nèi)容包括了：樣品采集、保存和運輸、蛋白質(zhì)提取和質(zhì)控、蛋白質(zhì)酶解

及質(zhì)譜檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評估和分析。

6、實際應(yīng)用效果

我們首先對數(shù)據(jù)產(chǎn)生的源頭即樣品開始了甄選，在各實驗室，各平臺廣泛使用且容易

生產(chǎn)培養(yǎng)的細胞系的基礎(chǔ)上，選擇代次之間穩(wěn)定性最強的細胞株是組學(xué)數(shù)據(jù)產(chǎn)出的可靠保

障。正常細胞系體外培養(yǎng)傳代次數(shù)有限，因此選擇多種惡性程度強的癌細胞系作為組學(xué)數(shù)

據(jù)產(chǎn)出的候選標準樣品。

通過連續(xù)多代次采集MHCC97H等5株細胞株，進行轉(zhuǎn)錄組測序，得出在6株實驗細胞

株中，MHCC97H5-14代次細胞定量相關(guān)性最高R2達到0.97以上，獲得MHCC97H細胞傳代

過程中轉(zhuǎn)錄組穩(wěn)定性最高的結(jié)論，進一步評價該MHCC97H細胞株的翻譯組、蛋白質(zhì)組的穩(wěn)

定性，結(jié)果發(fā)現(xiàn)MHCC97H細胞株RNC-seq定量相關(guān)性R達到0.9以上。進一步通過蛋白質(zhì)

質(zhì)譜定量結(jié)果R也達到0.92以上，并且按照標準流程在第三方實驗室的操作下也得到了

可重復(fù)和可驗證的穩(wěn)定數(shù)據(jù)，這個結(jié)果不僅肯定了我們所建立的標準操作程序，還說明了

MHCC97H是非常穩(wěn)定的，可以作為標準物質(zhì)進行長時間生產(chǎn)，可以在各個實驗室廣泛推廣

使用。與此同時通過蛋白質(zhì)組標準流程，我們對對大腸桿菌全蛋白質(zhì)組進行了質(zhì)譜測定。

在兩個不同菌株的全蛋白質(zhì)組兩次生物學(xué)重復(fù)測定中，實現(xiàn)了99.7%和99.8%的重現(xiàn)性，

距離完美重現(xiàn)僅一步之遙。不僅重現(xiàn)性極高，其蛋白質(zhì)鑒定數(shù)量也創(chuàng)造了大腸桿菌蛋白質(zhì)

組單次鑒定量的世界紀錄。

在蛋白質(zhì)組學(xué)數(shù)據(jù)質(zhì)控方面，使用穩(wěn)態(tài)細胞翻譯組數(shù)據(jù)作為“標準答案”來評價開放

式搜索蛋白質(zhì)鑒定結(jié)果，質(zhì)譜搜庫結(jié)果中沒有翻譯證據(jù)的蛋白被認為是假陽性蛋白，屬于

“可疑鑒定”（SuspiciousIdentifications，SI），而利用SI和有翻譯證據(jù)的蛋白質(zhì)

（Translation-supportedIdentifications，TI）則可計算可疑鑒定率（SuspiciousDi

scoveryRate，SDR），以此來反映蛋白質(zhì)的潛在錯誤鑒定率。研究發(fā)現(xiàn)，開放式搜索結(jié)

果的SDR可達限制性搜索的兩倍甚至更多，強調(diào)開放性搜索若不進行有效質(zhì)量控制難以保

證鑒定結(jié)果可靠性，而將肽段FDR嚴格控制在0.001以下，則可控制SDR與限制性搜庫一

樣水平。對比開放式搜索不同參數(shù)設(shè)置下的結(jié)果，發(fā)現(xiàn)FDR控制是開放式搜索質(zhì)控最重要

的影響因素，而質(zhì)量容差值、可變修飾、酶切方式和色譜分離條件并不是影響SDR的主要

因素。該研究首次將翻譯組數(shù)據(jù)應(yīng)用于開放式搜索策略的質(zhì)控評估中，有效挖掘質(zhì)譜數(shù)據(jù)

中的“暗物質(zhì)”，為蛋白質(zhì)組開放式搜索策略制定了簡便易行的質(zhì)控標準。

此外，我們利用已經(jīng)建立的蛋白質(zhì)組學(xué)標準流程和翻譯組學(xué)質(zhì)控策略，成功發(fā)現(xiàn)

“隱藏的蛋白質(zhì)組”。長期的研究以來，lncRNAs經(jīng)常被報道與癌癥的發(fā)生發(fā)展、心血管

疾病、神經(jīng)退行性疾病以及其他的疾病相關(guān)，而對他們的功能研究主要的停留在轉(zhuǎn)錄水平

上或者與miRNA相互作用等。然而，我們的研究提供了確切的證據(jù)證明462個lncRNA

s可以翻譯成具有功能的新蛋白質(zhì)，而且數(shù)目可能不止462個，而是會更大。這一成果將

推動lncRNAs研究領(lǐng)域從轉(zhuǎn)錄水平研究進入到蛋白水平的研究，也將會從根本上提高我

們對疾病模型研究的認識。我們的研究成果，不僅豐富了人類基因組編碼基因的參考庫，

還將會成為科學(xué)界對人類基因組重新注釋的啟發(fā)。

以上研究成果表明，蛋白質(zhì)組學(xué)的標準操作流程和質(zhì)控方法可以極大提高基于質(zhì)譜技

術(shù)的蛋白質(zhì)組學(xué)實驗重復(fù)性和穩(wěn)健性，具有極強的科研和應(yīng)用價值。

三、試驗驗證的分析、綜述報告，技術(shù)經(jīng)濟論證，預(yù)期的經(jīng)濟效益、社會效

益和生態(tài)效益

1、主要技術(shù)指標

（1）樣品量指標

根據(jù)不同樣品類型和檢測目標準備足量樣品，在條件許可情況下，盡量加倍準備樣品

量，并做好樣品備份工作，表1為推薦樣品量。

表1推薦樣品量指標

樣品類型推薦樣品量

新鮮動物組織50mg~2g

新鮮植物組織100mg~50g

細菌/真菌菌體50mg~2g

新鮮培養(yǎng)細胞5×106個~1×107個

血清50μL~100μL

血漿50μL~100μL

唾液、羊水、腦脊液100μL~500μL

尿液15mL~50mL

（2）蛋白質(zhì)裂解液投入量指標

應(yīng)選擇溶解性強的蛋白質(zhì)裂解液裂解樣品，亦可采購樣品溶解效果好、蛋白質(zhì)提取效

率高、酶解及質(zhì)譜兼容的商品化蛋白質(zhì)裂解液。為取得最佳的使用效果，可以適當(dāng)將裂解

液分裝后使用，應(yīng)盡量避免過多的反復(fù)凍融。需在裂解液中新鮮加入終濃度為1mM的PMS

F。如需檢測磷酸化蛋白，必須加入含磷酸酶抑制劑的蛋白酶抑制劑化合物。裂解樣品的

所有步驟都需在冰上或4℃進行。建議蛋白質(zhì)裂解液投入量如下：

1)常見的動物、植物、真菌等物種，包括人、鼠、水稻、擬南芥、酵母等，應(yīng)盡量充分

破碎和溶解樣品，但也需要盡可能減少不必要的破碎步驟，以減少樣品損失；蛋白質(zhì)

裂解液的量要加足，建議按樣品重量：裂解液體積（w：v）=1:5~1：10添加，即10

0mg克樣品，加入0.5mL~1mL的蛋白質(zhì)裂解液；

2)每1×106個細胞添加200μL蛋白質(zhì)裂解液；

3)血清、血漿、唾液、尿液、羊水、腦脊液、關(guān)節(jié)液等體液類樣品，可不加蛋白質(zhì)裂解

液，經(jīng)蛋白質(zhì)濃度檢測后，直接進入酶解操作環(huán)節(jié)。

（3）蛋白質(zhì)樣品質(zhì)量控制指標

使用聚丙烯酰胺凝膠電泳（SDS）對樣品進行質(zhì)檢，將所有蛋白質(zhì)樣品取等量

（推薦上樣量：20μg蛋白質(zhì)/樣品）加載到凝膠后進行電泳，對凝膠進行考馬斯亮藍染

色，脫色至背景透明無色后使用凝膠成像儀掃描獲得樣品的完整蛋白質(zhì)組條帶。樣品結(jié)果

判定及對應(yīng)解決方法見表2。

表2SDS質(zhì)量控制結(jié)果判定及解決方法

SDS結(jié)果質(zhì)檢結(jié)果判定解決方法

背景干凈，可明顯分辨蛋白

質(zhì)梯狀條帶，在不同分子量

間分布均勻，同類樣品間蛋質(zhì)量高，可繼續(xù)

白質(zhì)條帶整體和局部無明顯后續(xù)實驗操作。

差異，各泳道重復(fù)性和顏色

一致。

蛋白質(zhì)濃度檢測

樣品間的蛋白質(zhì)條帶灰度值重新進行蛋白質(zhì)濃度檢

結(jié)果不準確，不

差異過大。測后再次質(zhì)檢。

符合要求。

再次實驗，重新提取蛋

樣品質(zhì)量存疑，白質(zhì)，再次質(zhì)檢判定是

同一類型樣品蛋白質(zhì)條帶分

有待再次實驗判提取不充分導(dǎo)致條帶差

布差異過大。

定。異過大還是樣品本身存

在差異。

蛋白質(zhì)分布不均勻，出現(xiàn)蛋白質(zhì)提取效率

使用較前更強的破碎/裂

如：分布在某一范圍分子量低，提取不充

解條件處理樣品后再次

的蛋白質(zhì)條帶過少，或樣品分。不符合要

質(zhì)檢。

條帶分布零星且單一。求。

蛋白質(zhì)樣品中鹽使用有機溶劑如丙酮、

蛋白質(zhì)條帶中橫紋、縱紋較

類等雜質(zhì)含量甲醇沉淀蛋白質(zhì)后溶于

多，或背景較深，無法清洗

高，不符合要蛋白質(zhì)裂解液后再次質(zhì)

分辨出蛋白質(zhì)梯狀條帶。

求。檢。

無明顯梯狀蛋白質(zhì)條帶、條采集新鮮樣品，注意操

蛋白質(zhì)樣品發(fā)生

帶出現(xiàn)拖尾、主要條帶堆積作手法，重新進行蛋白

降解。

在低分子量區(qū)域。質(zhì)提取和質(zhì)檢。

（4）質(zhì)譜儀質(zhì)控指標

使用MHCC97H細胞來源的蛋白質(zhì)標準品進行質(zhì)譜檢測，對質(zhì)譜儀穩(wěn)定性進行評估：

高分辨質(zhì)譜的質(zhì)量檢測分辨率和精度往往能夠達到ppm級別（百萬分之一）。由于儀

器本身固有特性，其在長時間工作后會出現(xiàn)質(zhì)量精度的偏移如不及時矯正，則會出現(xiàn)信息

遺漏、錯報等問題。Orbitrap類型儀器應(yīng)實現(xiàn)10ppm內(nèi)的分辨率，同時質(zhì)量精度不能超

過±10ppm的偏差。峰寬由樣品中蛋白豐度分布、色譜柱效能等因素決定，較窄且恒定的

峰寬能夠得到較好的定性定量效果。肽段碎裂信號的好壞決定了定性結(jié)果優(yōu)劣，因此保證

較高的碎裂強度及一致性是保證結(jié)果的重要因素。

iRT標肽的出峰均勻說明色譜流出的一致性較高，保證了定量信息的最高覆蓋及準確

性。色譜半峰寬（FWHM）是衡量色譜效能的重要指標，大規(guī)模蛋白質(zhì)組定性定量檢測中采

用25cm~50cm柱長，F(xiàn)WHM盡可能在0.15min~0.25min的色譜柱，F(xiàn)WHM過長會大大

影響定性定量效果。

具體質(zhì)控要求如下：

4.1液相系統(tǒng)質(zhì)控

4.1.1MS1TIC(MS1色譜總離子流)：各樣品在色譜圖梯度內(nèi)譜峰盡可能的均勻分布；

4.2.2MS2TIC(MS2色譜總離子流)：各樣品在色譜圖梯度內(nèi)譜峰盡可能的均勻分布；

4.2.3RTFragmentDistribution(碎片離子保留時間分布)：在色譜圖梯度內(nèi)不同

樣本中鑒定到的碎片離子數(shù)目基本一致。如出現(xiàn)的樣品間峰型基本一致而強度波動較大，

則說明色譜體系分離穩(wěn)定但進樣量未完全矯正，導(dǎo)致平行檢測的多肽量不太一致；

4.2.4RTPrecursorDistribution(母離子保留時間分布)：在色譜圖梯度內(nèi)不同樣

本中鑒定到的母離子數(shù)目基本一致；

4.2.5DeltaRT(保留時間偏差)：通過iRT預(yù)測的肽段保留時間和實際檢測到的肽段

（或iRT肽段）保留時間之間的偏差，由iRT/RT回歸算法得到。DeltaRT值越小表明保

留時間越符合模型計算，在定量中越可以得到較好的矯正計算結(jié)果。DeltaRT/iRT推薦

閾值為±2min；當(dāng)閾值在±0.5min表示極好；

4.2.6FWHMDistribution(半峰寬分布)：FWHM在0.2min~0.3min左右較為理想，

0.05min~0.2min表示色譜柱性能極好，而大于0.5min則代表色譜柱性能下降，建議

更換;

4.2.7Datapointsperpeak(每個峰采集的數(shù)據(jù)點):推薦為5-10個點為好，點數(shù)太

少會使定量的準確度降低，而點數(shù)太多會使得蛋白鑒定數(shù)目減少;

4.2.8Capacity(色譜峰容量):峰容量圖顯示了超高效液相色譜(UPLC)色譜柱在分

離肽方面的效率。Peakcapacity=g/(FWHM*1.7)。其中g(shù)為梯度分鐘數(shù),FWHM為所有鑒定

成功多肽的平均半峰寬。更高的峰容量代表更窄的色譜峰，也代表了更好的肽分離能力，

檢測到的肽段也就越多，通常FWHM會隨著梯度拉長而變寬。對于采用自填柱的色譜，峰

容量2小時梯度，大于350表示色譜柱性能較好。而采用高性能商品柱的1小時梯度峰容

量則通常大于400;

4.3質(zhì)譜系統(tǒng)質(zhì)控

4.3.1MS1MassAccuracy(MS1質(zhì)量精度):MS1質(zhì)量精度計算方法為：（實際檢測到

的m/z-理論m/z）/理論m/z。單位為ppm。校正后MS1水平質(zhì)量精度小于5ppm。矯正

前的MS1偏差盡量不超過10ppm；

4.3.2MS2MassAccuracy(MS2質(zhì)量精度)：MS2的質(zhì)量精度計算為：（實際檢測到

的m/z-理論m/z）/理論m/z。單位為ppm。校正后MS2水平質(zhì)量精度應(yīng)小于10ppm；

4.4定性結(jié)果質(zhì)控

4.4.1ExperimentIdentificationFrequency(鑒定結(jié)果分布)：組內(nèi)各樣品鑒定數(shù)

目不應(yīng)出現(xiàn)較大波動；

4.4.2MissedCleavages(漏切)：通常情況下理想的漏切比例應(yīng)小于20%，血液等含

高豐度蛋白的樣品會比常規(guī)的略高；

4.4.3Charge(電荷)：通常情況下，大多數(shù)母離子會帶2電荷和3電荷，單電荷和多

電荷的母離子比例較少。如果單電荷和4電荷以上比例偏高，如>20%，則說明樣品或ESI

噴霧可能存在問題需要排查；

4.5定量結(jié)果質(zhì)控

4.5.1Heatmap(熱圖)：DDA/DIA數(shù)據(jù)進行搜庫分析后的第一步不進行任何缺失值填充，

因此缺失值會相對偏高，其缺失值比例主要取決于樣品情況，其次是整個前處理和質(zhì)譜流

程中的重復(fù)性。組內(nèi)的樣品缺失值比例和分布不應(yīng)出現(xiàn)太大波動，且可盡可能聚類到一起；

4.5.2NormalizedQuantityDistribution(歸一化)：通常情況下，不同樣本間del

taLog10Quantity的絕對值應(yīng)小于0.5，deltaLog10Quantity的絕對值如小于0.3更

好；

4.5.3QuantityCV(變異系數(shù))：用于評估各觀測值變異程度，即組內(nèi)定量結(jié)果的重

復(fù)性，CV越小，組內(nèi)重復(fù)性越好。樣本的生物學(xué)重復(fù)性比較好或是技術(shù)重復(fù)，CV值應(yīng)小

于15%。但是對于一些復(fù)雜樣本如臨床樣本，CV會相對偏高；

4.5.4Correlation(相關(guān)性)：通常情況下，同一組內(nèi)樣本重復(fù)性越好，相關(guān)性就越

高。如：細胞樣品組內(nèi)重復(fù)性應(yīng)達到95%以上，組織樣品重復(fù)性應(yīng)達到90%以上。

2、主要試驗和驗證數(shù)據(jù)分析

按照本標準的方法，我們組織實施了關(guān)鍵性能指標的試驗項目驗證，實施驗證的內(nèi)容

為對MHCC97H細胞株不同代次的細胞提取蛋白質(zhì)后，我們設(shè)計不同時空和不同測序平臺上

進行l(wèi)abelfree和DIA定量蛋白質(zhì)組檢測，并進行對比分析，來論證本MHCC97H可作為

蛋白質(zhì)標準品來源細胞株。

2.1MHCC97H可作為核酸、蛋白質(zhì)標準品來源細胞株

圖7.MHCC97H細胞不同代次翻譯組測序定量穩(wěn)定性評估

進一步評價MHCC97H細胞翻譯組穩(wěn)定性，最終確定參比物質(zhì)來源細胞株。通過連續(xù)不

間斷連續(xù)采集MHCC97H第5到14代次細胞翻譯中的mRNA（RNC），翻譯組定量相關(guān)系數(shù)R

=0.90~0.99(圖7)，表明MHCC97H細胞在翻譯層面上存在高度穩(wěn)定性。

圖8.MHCC97H蛋白質(zhì)組定量穩(wěn)定性評估

接下來我們進一步對MHCC97H的第2代至12代次細胞全蛋白進行質(zhì)譜鑒定，使用Orb

itrapFusionLumos質(zhì)譜儀質(zhì)譜儀對肽斷進行鑒定，形成10個DDA及10個DIA數(shù)據(jù)集。

評估蛋白通過目標-誘餌庫（Target-decoy）搜庫策略降低鑒定假陽性率，最終得到不同

代次間細胞的蛋白質(zhì)定性及定量列表。對MHCC97H的第2代至12代次細胞蛋白質(zhì)定量結(jié)

果進行相關(guān)性分析，DDA模式下的蛋白質(zhì)各代次之間定量相關(guān)性達到R=0.94~0.97，DIA模

式下蛋白質(zhì)各代次之間定量相關(guān)性達到R=0.92~0.97(圖8)。

候選標準品MHCC97H各代次之間的核酸以及蛋白質(zhì)定量相關(guān)性均達到超高水平，從核

酸和蛋白質(zhì)層面均表現(xiàn)出高度穩(wěn)定性，進一步表明MHCC97H可作為標準樣品連續(xù)穩(wěn)定的產(chǎn)

出。

2.2MHCC97H蛋白質(zhì)組樣品第三方實驗室質(zhì)譜一致性評估

同一批次標準樣品MHCC97H細胞株全蛋白，分別給華南理工大學(xué)，北京師范大學(xué)、大

連物化和暨南大學(xué)所每個實驗室1mg蛋白質(zhì)，所有實驗室均采取標準化的酶解及質(zhì)譜實驗

流程，質(zhì)控方法如下：采取超濾管酶解標準操作進行實驗，酶解后對肽斷除鹽并進行肽斷

濃度檢測，富集后肽斷≥1μg/μL。儀器全部統(tǒng)一為ThermoOrbitrapFusionLumos，D

DA模式，不分組分。評估蛋白通過目標-誘餌庫（Target-decoy）搜庫策略降低鑒定假陽

性率，最終得到不同實驗室對同一樣品的蛋白質(zhì)定性及定量列表。同一樣品蛋白質(zhì)在四個

實驗室的測試下（暨南大學(xué)一個生物學(xué)重復(fù)，鑒定結(jié)果取交集），蛋白質(zhì)的鑒定數(shù)量相對

一致。對四個實驗室蛋白質(zhì)定量結(jié)果進行DDAiBAQ定量一致性測試同實驗室定量重復(fù)性

R2=0.93-0.97，不同實驗室DIA定量相關(guān)性R2=0.83-0.99左右（圖9）。在不同實驗室質(zhì)

譜鑒定下，MHCC97H細胞株的蛋白質(zhì)質(zhì)譜定量仍舊達到超高的可重復(fù)性和可驗證性。

以上研究發(fā)表在：ScientificData10.1(2023):455.

圖9.不同實驗室MHCC97H蛋白質(zhì)組定量相關(guān)性分析。標準流程的穩(wěn)健性。

2.3超微量MHCC97H蛋白質(zhì)樣品4DDIA檢測數(shù)據(jù)評估

布魯克生物科技有限公司的timsTOFHT質(zhì)譜儀采用全新的第四代TIMS-XR和更先進

的數(shù)字轉(zhuǎn)換技術(shù)，能夠在細胞和組織的定量蛋白質(zhì)組學(xué)分析中，實現(xiàn)更寬的動態(tài)范圍和更

高的蛋白覆蓋深度，是目前業(yè)內(nèi)較為先進的質(zhì)譜儀，我們使用本標準流程制備的MHCC97H

多肽標準品評估標質(zhì)譜儀性能。實驗結(jié)果如下：

如圖10所示，當(dāng)上樣MHCC97H標準多肽200ng時，采用20min分析總時長，使用

dia-PASEF采集，PaSER軟件搜庫，平均可鑒定超過10000種蛋白，94000條多肽；鑒定結(jié)

果顯示重復(fù)性好，重復(fù)三針進樣測試相關(guān)性超過0.99。

如圖10所示，當(dāng)上樣MHCC97H標準多肽1ng時，采用20min分析總時長，使用dia

-PASEF采集，PaSER軟件搜庫，平均可鑒定約5000種蛋白，超過24000條多肽；鑒定結(jié)

果重復(fù)性好，重復(fù)三針進樣測試相關(guān)性超過0.99。

以上結(jié)果顯示MHCC97H標準多肽標準品可以用于業(yè)內(nèi)領(lǐng)先的質(zhì)譜儀的蛋白質(zhì)檢測質(zhì)量

監(jiān)控。

人人文庫> 全部分類> 專業(yè)文獻 > 工程機械

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明

文檔簡介

溫馨提示

最新文檔

評論

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔