《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第1頁
《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第2頁
《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第3頁
《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第4頁
《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明

一、工作簡況

1、任務(wù)來源

本標準基于衛(wèi)健委/科技部國家重點研發(fā)計劃《醫(yī)學(xué)生命組學(xué)數(shù)據(jù)質(zhì)量控制關(guān)鍵技術(shù)

研發(fā)與應(yīng)用》(2018YFC0910200,2018年立項,2021年結(jié)題)和廣東省重點領(lǐng)域研發(fā)計劃

《多組學(xué)整合技術(shù)研發(fā)及標準化組學(xué)數(shù)據(jù)質(zhì)量控制技術(shù)的推廣應(yīng)用》(2019B020226001,

2019年立項,2022年結(jié)題)兩個項目的研究成果,本標準由深圳承啟生物科技有限公司于

2023年9月提出申報,根據(jù)中國國際科技促進會標準化工作委員會[2023]中科促標字第982

號文件:關(guān)于開展《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》團體標準立項通知,正式確立立

項,本項目計劃編號為:CI2023419。

2、目的和意義

質(zhì)譜是目前蛋白質(zhì)組學(xué)研究的主流技術(shù),可以一次性分析復(fù)雜樣品中上萬種蛋白質(zhì)。

但質(zhì)譜的重現(xiàn)性一直是一個很大的問題。同一個樣品做兩次質(zhì)譜實驗,鑒定到的蛋白質(zhì)都

有較大的不同,重現(xiàn)性(即兩次都能鑒定到的蛋白數(shù)量占總鑒定數(shù)的百分比)一般只能達

到65-85%。2017年《NatureCommunications》上的一篇文章指出(Collinsetal.,

NatureCommunications),只有約一半的蛋白質(zhì)能在SWATH(SequentialWindowed

AcquisitionofallTheoreticalfragmentions,SWATH)質(zhì)譜技術(shù)中被重復(fù)鑒定到,

而SWATH已經(jīng)被認為是重現(xiàn)性相對較高的質(zhì)譜技術(shù)了?!禨cience》曾組織專題研討會討論

如何提高質(zhì)譜的重現(xiàn)性,指出現(xiàn)有質(zhì)譜的重現(xiàn)性遠遠不能滿足生物標志物的要求。重現(xiàn)性

問題如果不能得到很好的解決,那么基于質(zhì)譜的生物標志物發(fā)現(xiàn)及臨床應(yīng)用將十分困難。

對于定量蛋白質(zhì)組學(xué)研究,因為樣品制備流程、質(zhì)譜平臺和分析流程常常不一致,加大了

蛋白質(zhì)組學(xué)在精準醫(yī)學(xué)中的應(yīng)用難度;此外,Hela細胞蛋白酶解的標準品作為一種高度驗

2

證的哺乳動物蛋白消化物,可用作復(fù)雜蛋白質(zhì)組學(xué)樣品的質(zhì)譜分析的質(zhì)控樣品被人們廣泛

使用。然而Hela細胞因其存在超強的種內(nèi)污染和種間污染而存在廣泛爭論。基于以上領(lǐng)域

內(nèi)存在的諸多問題,我們利用多組學(xué)技術(shù)手段評估并開發(fā)出一種或多種可作為蛋白質(zhì)組標

準品的細胞株,并以此制定蛋白質(zhì)組標準操作流程供行業(yè)內(nèi)流通使用。

目前國內(nèi)外均無相關(guān)的標準流程,各蛋白質(zhì)組學(xué)研究單位處于各自為戰(zhàn)的狀態(tài)。流程

不通用,結(jié)果不可比。

本標準對樣品采集、處理、運輸、質(zhì)控和檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評估和數(shù)據(jù)分析全

流程進行標準化和規(guī)范化。該標準的特點是:流程標準化,可應(yīng)對各種類型樣品蛋白質(zhì)提

取和制備需求,同時保持結(jié)果的重現(xiàn)性,對樣品保存運輸?shù)囊蟮?;開發(fā)出了具有極高蛋

白質(zhì)組穩(wěn)定性且可穩(wěn)定傳代的蛋白質(zhì)組標準品細胞株:MHCC97H,可用于監(jiān)控實驗流程或

校準儀器,該標準品已申請國家發(fā)明專利,具有完整自主知識產(chǎn)權(quán)。

3、起草單位

本標準負責(zé)起草單位:深圳承啟生物科技有限公司。

本標準參加起草單位:暨南大學(xué)、華南理工大學(xué)、北京師范大學(xué)、中國科學(xué)院大連化

學(xué)物理研究所、福建農(nóng)林大學(xué)、福建省婦幼保健院、上海易算生物科技有限公司、布魯克

(北京)科技有限公司。

本標準主要起草人:張弓、陳洋、余卓、盧少華、趙晶、李亞星、范小路、杜紅麗、

高友鶴、袁曉明、沈城頻、王心睿、盧紅、劉先明、杜蕭賢。

參加單位工作分配:深圳承啟生物科技有限公司負責(zé)標準方案的制定及網(wǎng)頁發(fā)布;深

圳承啟生物科技有限公司、暨南大學(xué)、華南理工大學(xué)、中國科學(xué)院大連化學(xué)物理研究所、

北京師范大學(xué)、福建農(nóng)林大學(xué)、福建省婦幼保健院、上海易算生物科技有限公司和布魯克

生物科技有限公司參與了標準方案的實驗測試和質(zhì)量評估;暨南大學(xué)、深圳承啟生物科技

有限公司進行了標準起草和編制說明編寫,其他參與單位對標準各個版本的全部內(nèi)容提出

3

編寫和修改意見。

4、起草過程

4.1起草階段

2019年1月至2019年6月,標準起草單位組織相關(guān)技術(shù)人員對標準項目進行了預(yù)研,課

題組成員廣泛收集了國內(nèi)外基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)的應(yīng)用現(xiàn)狀及技術(shù)發(fā)展趨勢相關(guān)

的標準、文獻,了解了國內(nèi)外相關(guān)技術(shù)動態(tài),并且明確了工作思路和進程安排;

2019年7月至2022年4月,標準起草單位對標準草案進行實驗驗證和技術(shù)論證并確立了

基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)從采樣、前處理、運輸、質(zhì)控和檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評

估和數(shù)據(jù)分析全流程,形成了《基于質(zhì)譜的定量蛋白質(zhì)組學(xué)技術(shù)規(guī)程》的初稿,并于2023

年3月以網(wǎng)頁形式向社會發(fā)布

(/Resources/omicsStandard/index.html);

2022年8月,國家衛(wèi)生健康委醫(yī)藥衛(wèi)生科技發(fā)展研究中心組織專家對本標準流程初稿

進行評審,參會專家做“基本完成主要相關(guān)考核指標”的評價,建議進一步加強相關(guān)數(shù)據(jù)

采集與檢測標準的認定,同時提出應(yīng)加強應(yīng)用示范的建議;

2022年9月至11月,編制組針對收集的意見,對標準進行了補充和完善。包括:1)增

加了蛋白質(zhì)提取質(zhì)量檢測標準;2)增加了使用MHCC97H標準品及標準數(shù)據(jù)集進行數(shù)據(jù)質(zhì)量

控制的內(nèi)容;3)在暨南大學(xué)、華南理工大學(xué)、北京師范大學(xué)和布魯克生物科技有限公司

等單位宣傳和推廣本標準,充分交流并進一步收集相關(guān)單位的反饋意見;

2022年12月,向廣東省科技創(chuàng)新監(jiān)測研究中心組織的專家組進行總結(jié)報告,專家組考

察了標準實施場地,審閱了相關(guān)資料并進行了咨詢。項目開發(fā)技術(shù)已在多家機構(gòu)推廣應(yīng)用,

取得較好的評價和一定的經(jīng)濟效益;

本標準由深圳承啟生物科技有限公司提出,由暨南大學(xué)和深圳承啟生物科技有限公司

主編,其他單位共同參與起草,于2023年9月提交團體標準《基于質(zhì)譜的定量蛋白質(zhì)組學(xué)

4

技術(shù)規(guī)程》的立項申請書,經(jīng)中國國際科技促進會標準化工作委員會及相關(guān)專家技術(shù)審核,

于2023年10月19日正式發(fā)布立項公告,并于同日在全國團體標準平臺發(fā)布立項公示。

2024年1月,中國國際科技促進會標準化工作委員會完成了對本標準內(nèi)容的審核并提

出對格式重排和規(guī)范書寫的意見,編制組進一步參考標準書寫規(guī)范,修改和完善了標準文

本內(nèi)容,形成了《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》團體標準征求意見稿和團體標準編

制說明。

4.2征求意見階段

2024年2月,本標準由中國國際科促會標準化工作委員會,在全國團體標準信息平臺

面向社會進行公開征求意見。同時由編制組向相關(guān)單位進行定向征求意見。

4.3審查階段

4.4報批階段

二、標準編制原則、主要內(nèi)容及其確定依據(jù),修訂標準時,還包括修訂前后

技術(shù)內(nèi)容的對比

1、標準的編寫原則

本標準的制定工作遵循“先進性、適用性、可操作性、實用性、規(guī)范性”的原則,依

據(jù)GB/T1.1-2020《標準化工作導(dǎo)則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》和GB/T

20001.4-2015《標準編寫規(guī)則第4部分:試驗方法標準》給出的規(guī)則編寫。

2、標準主要內(nèi)容

1)樣品量要求;

2)樣品采集與保存要求;

3)樣品前處理要求;

4)各種裂解液主要特點、差異和選擇建議;

5

5)樣品運輸要求;

6)SDS質(zhì)量控制結(jié)果判定及解決方法;

7)非標記定量蛋白質(zhì)組蛋白質(zhì)酶解實驗流程;

8)iTRAQ標記定量蛋白質(zhì)組蛋白質(zhì)酶解及標記實驗流程(以8標為例);

9)多肽樣品除鹽實驗流程;

10)質(zhì)譜數(shù)據(jù)采集實驗流程;

11)質(zhì)譜數(shù)據(jù)質(zhì)量控制要求。

3、制定本標準的依據(jù)

3.1蛋白質(zhì)組標準流程可極大提高大腸桿菌蛋白組的重復(fù)性

本項目前期已初步建立蛋白質(zhì)組的制備分析全流程,并已研發(fā)獲得極為穩(wěn)定的蛋白質(zhì)

標準品,據(jù)此,我們利用前期研究成果進一步驗證流程和標準品的穩(wěn)健性。細菌中半數(shù)以

上的蛋白質(zhì)編碼基因是由兩個或兩個以上的基因組成的多順反子操縱子所組成。操縱子組

織是否維持操縱子內(nèi)基因的化學(xué)計量表達仍有爭議。在本研究中,我們進行了一項無標記、

與數(shù)據(jù)無關(guān)的采集超反應(yīng)監(jiān)測質(zhì)譜(HRM-MS)實驗,以定量指數(shù)期的大腸桿菌蛋白質(zhì)組,并

定量了93.6%的胞質(zhì)蛋白,分別涵蓋了BW25113和MG1655菌株中67.9%和56.0%的翻譯多

順反子操縱子。我們發(fā)現(xiàn)翻譯調(diào)控在很大程度上有助于蛋白質(zhì)組的復(fù)雜性:對于化學(xué)計量,

較短的操縱子往往比較長的操縱子受到更嚴格的控制;主要編碼復(fù)合物的操縱子比主要編

碼代謝途徑的操縱子更嚴格地控制化學(xué)計量?;蜷g隔(一個操縱子中相鄰基因之間的距

離)可以作為化學(xué)計量的調(diào)節(jié)因子。催化效率可能是一個操縱子編碼的酶的差異表達的驅(qū)

動力。這些結(jié)果說明了操縱子調(diào)控的多面性:操縱子統(tǒng)一轉(zhuǎn)錄水平和基因特異性翻譯水平。

這種多水平調(diào)控通過優(yōu)化代謝途徑的生產(chǎn)力效率和維持不同類型的蛋白質(zhì)復(fù)合物而有益于

宿主。

為了評估HRM-MS方法的定量能力和再現(xiàn)性,我們應(yīng)用自研標準品對質(zhì)譜進行標準測

6

定及校準,使用上述已建立的蛋白質(zhì)組標準流程對菌株BW25113和MG1655的大腸桿菌總

可溶性蛋白進行了兩次生物學(xué)重復(fù)實驗。當(dāng)使用先前的鑒定標準(至少一種獨特肽,肽長

度≥6個氨基酸)時,我們的HRM-MS結(jié)果分別定量了這兩種菌株中的1951和1571個蛋白

質(zhì)。兩次生物復(fù)制鑒定了幾乎相同的蛋白質(zhì),證明了高穩(wěn)健性和再現(xiàn)性(圖1A)。兩個重復(fù)

對幾乎相同的蛋白質(zhì)進行了定量:僅在一個重復(fù)中對少數(shù)蛋白質(zhì)進行了定量(圖1A)。在嚴

格標準下為兩個獨特的肽和至少七個氨基酸的肽長度。即使在嚴格標準下,我們?nèi)砸愿咴?/p>

現(xiàn)性定量了1675和1252個蛋白質(zhì)(圖1B、C)。與之前通過其他方法定量的結(jié)果(APEX為1

021個蛋白質(zhì),iBAQ為1183個蛋白質(zhì),emPAI為1138個蛋白質(zhì))相比,定量的可溶性蛋白

質(zhì)數(shù)量幾乎增加了一倍。

7

圖1.不同非標記定量方法獲得的蛋白質(zhì)豐度比較。

為了排除儀器的差異,我們在同一臺OrbitrapFusionLumos儀器中對兩種菌株進行

了DDAMS實驗。根據(jù)嚴格標準鑒定蛋白質(zhì),并使用iBAQ法進行定量。DDAMS分別定量了

BW25113和MG1655菌株的1520和1482個蛋白質(zhì),與HRM-MS實驗相當(dāng)。然而,兩個生物

學(xué)復(fù)制品的iBAQ定量的相關(guān)系數(shù)分別為0.932和0.939(圖1D,E),低于HRM-MS(兩個菌

株的R分別為0.982和0.988)。兩個菌株中每個鑒定蛋白平均被19.20和15.45個肽覆蓋,

分別覆蓋31.56%和24.87%的氨基酸序列(圖1F),高于人類蛋白質(zhì)組質(zhì)譜實驗的典型肽覆

8

蓋(單個搜索引擎,覆蓋高達20%)。

以上研究發(fā)表在:FrontiersinGenetics(2019)10:473.

3.2翻譯組可作為指導(dǎo)蛋白質(zhì)組質(zhì)量控制的獨立數(shù)據(jù)集

到目前為止,在質(zhì)譜蛋白質(zhì)組鑒定的時候依然有超過一半的譜圖無法被鑒定。開放式

搜索(OpenSearch)策略很早就被提出用來解決這一問題。但是OpenSearch的搜索策

略的鑒定結(jié)果可靠程度一直難以評估,也缺乏一套完整系統(tǒng)的使用手冊。我們提出使用翻

譯組測序數(shù)據(jù)作為最小化庫對OpenSearch的鑒定結(jié)果進行質(zhì)控,主要的方法是引入可疑

發(fā)現(xiàn)率(SDR)作為參考指標對OpenSearch策略和限制性搜索(NarrowwindowSearch)

策略的鑒定結(jié)果進行評價。結(jié)果發(fā)現(xiàn),OpenSearch策略確實可能引入更多的假陽性,但

它確實能夠有效提高譜圖利用率,我們還提出將肽段FDR控制在0.001以下能夠有效控制

OpenSearch鑒定結(jié)果假陽性發(fā)生,并且給出了一套OpenSearch較為完整的使用規(guī)范,

這對于促進容差搜索策略的發(fā)展有重要意義,并且能幫助我們更好地認識那些無法被鑒定

和使用的譜圖,揭示更多的翻譯后修飾、單氨基酸多態(tài)性以及新型剪接變體等事件。

3.2.1實現(xiàn)接近完整的翻譯中基因鑒定率

所有RNC-seq都是以非常高的通量下測序,測序通量達到144-188M讀段。假設(shè)一個

典型的哺乳動物細胞含有200,000個mRNA分子,一個平均長度為2.2kb且豐度為1拷

貝/細胞的轉(zhuǎn)錄物相當(dāng)于2.27RPKM。采用每種轉(zhuǎn)錄物10次閱讀的量化標準,這種通量可

以量化平均長度的轉(zhuǎn)錄物,豐度為0.014拷貝/細胞,表明翻譯mRNA鑒定接近完成。事實

上,我們發(fā)現(xiàn)RNC-seq-量化的低豐度翻譯mRNAs低至0.001RPKM(圖2A)。此外,在此處

理量下,量化的基因數(shù)量接近飽和(圖2B),再次表明翻譯mRNAs的鑒定接近完整。

9

圖2.不同設(shè)置下限制性搜索和開放搜索策略的SDR評估。

3.2.2利用質(zhì)量容差和多肽FDR可以控制開放搜索SDR

不管是NarrowSearch策略還是OpenSearch策略,在進行數(shù)據(jù)庫搜索之前都會對氨

基酸修飾進行預(yù)先的設(shè)置,包括固定修飾或者可變修飾。在通常情況下,氨基酸的修飾千

變?nèi)f化,無法準確地清楚所有的氨基酸修飾的具體情況,那么較為經(jīng)典的做法是對氨基酸

進行占比例較大的一些修飾進行預(yù)先的設(shè)置,例如半胱氨酸的烷基化修飾和蛋氨酸的氧化

修飾以及肽段的N端乙酰化修飾等。理論上,增加可變修飾的種類將使得搜空間擴大,不

10

僅需要更多的計算也會導(dǎo)致鑒定結(jié)果的準確性的下降,因此,我們在這里只進行兩種占比

例較大的氨基酸修飾進行預(yù)先的設(shè)置,分別為半胱氨酸的烷基化修飾和蛋氨酸的氧化修飾。

通過不同的修飾設(shè)置的組合對相同數(shù)據(jù)集進行NarrowwindowSearch(Precursortolera

nce=10ppm),我們發(fā)現(xiàn)對于一般的搜庫軟件如pFind,增加可變修飾會使得鑒定結(jié)果的

SDR提高,不設(shè)置任何修飾信息不會使得SDR增加(圖2C)。

開放搜索策略的關(guān)鍵是允許更大的母離子質(zhì)量容差,以耐受由修飾引起的質(zhì)量偏移。

然而,這也將導(dǎo)致允許更多假陽性的副作用。允許較小的母離子容差在理論上應(yīng)該會降低

SDR。當(dāng)允許100–800Da母離子質(zhì)量容限時,我們驗證了兩種算法的這一假設(shè):容限越低,

SDR越低(圖3A)。我們還注意到,當(dāng)質(zhì)量容差超過400Da時,SDR幾乎飽和。相比之下,

識別能力幾乎與窗口大小無關(guān)(圖3B)。這些結(jié)果表明,當(dāng)大部分預(yù)期修改已經(jīng)包括在內(nèi)時,

較大的質(zhì)量公差是沒有用的。事實上,300Da的耐受性已經(jīng)涵蓋了90%的預(yù)期修改,500

Da的耐受性涵蓋了94%。38–70%的質(zhì)量位移為+1至+3,表明質(zhì)量位移的主要來源是同位

素偏移。

肽FDR過濾是用于控制鑒別質(zhì)量的另一個因素。由于大的前體耐受性可能導(dǎo)致肽鑒定

的較高誤差,因此更嚴格的肽FDR應(yīng)有助于控制質(zhì)量。事實上,我們發(fā)現(xiàn)設(shè)置更嚴格的肽

FDR標準顯著降低了兩種算法的SDR(圖3C和D)。當(dāng)將肽FDR設(shè)置為0.001時,無論將半

胱氨酸氨基甲酸乙酯化設(shè)置為可變修飾還是固定修飾,均可將開放搜索SDR平均控制在窄

窗口搜索水平(圖3C和D)。值得注意的是,算法之間存在差異:當(dāng)將肽FDR設(shè)置為0.002

時,pFind開放搜索SDR降至窄搜索SDR以下,而MSFragger需要設(shè)置為0.001。

兩個搜索引擎獲取的身份信息的一致性反映了身份識別質(zhì)量的提高。在所有數(shù)據(jù)集中,

肽FDR<0.001時的一致性鑒定分數(shù)高于肽FDR<0.01時的一致性鑒定分數(shù)(圖3E)。

以上研究發(fā)表在:JournalofProteomeResearch(2018)17(11),3719-3729.

11

圖3.使用不同因素控制SDR。

3.3利用翻譯組發(fā)現(xiàn)隱藏的非編碼基因來源蛋白質(zhì)組

人類基因組上已知大約有5萬個基因,其中約2萬個被標注為可以表達蛋白質(zhì)的

“編碼基因”,而另外3萬個基因被標注為“非編碼基因”(non-codinggenes)。已有的

報道中,除了部分非編碼基因可以表達為小肽行使調(diào)控功能外,也有個別lncRNA被發(fā)現(xiàn)

實際上能翻譯成>50氨基酸的蛋白質(zhì),例如CLUU1,ESRG等,問題是,如果這種情況不是

個案而是普遍存在的現(xiàn)象,則確實存在部分“編碼基因”被錯誤地標注成了“非編碼基

12

因”,這將意味著人基因組需要被系統(tǒng)性地重新注釋。

事實上,這一問題很早就被學(xué)界關(guān)注過。2013年,EricLander等人僅僅根據(jù)Riboso

meprofiling計算模型認為lncRNA不可能編碼蛋白質(zhì)。但僅僅一年后,該團隊又發(fā)表文

章,僅僅是調(diào)整了計算模型,認為lncRNA可能編碼蛋白質(zhì),然而其始終拿不出蛋白質(zhì)實

驗證據(jù)。2014年,人類蛋白質(zhì)組草圖在Nature上發(fā)表,聲稱發(fā)現(xiàn)千余個lncRNA所編碼的

“新蛋白質(zhì)”,但隨后便被人類蛋白質(zhì)組組織(HUPO)爆出其分析不合規(guī)范,存在大量的假

陽性鑒定,在用較嚴格的標準進行質(zhì)控后,這些所謂的“新蛋白質(zhì)證據(jù)”幾乎都被認定為

假陽性。因此,如何避免蛋白質(zhì)組學(xué)質(zhì)譜技術(shù)的固有缺陷,提供獨立的蛋白質(zhì)編碼信息源,

就顯得非常重要。在本項目中使用翻譯組測序技術(shù)(RNC-seq),在肺癌細胞中發(fā)現(xiàn)了139

7個有可能被翻譯的“非編碼RNA”[16]。從9株人細胞系中共鑒定到約4700種lncRNA

正在被翻譯,且可能以經(jīng)典翻譯起始方式翻譯出>50氨基酸的蛋白質(zhì)。利用目前公認的驗

證標準,我們提供了其中314個新蛋白質(zhì)的證據(jù)。這些蛋白質(zhì)是穩(wěn)定存在的,并且有著明

確的細胞定位,功能實驗也證實它們以蛋白質(zhì)形式(而非RNA形式)行使著明確的生物學(xué)

功能。

3.3.1人類細胞中含有大量正在翻譯的長鏈非編碼RNA

我們先前已對人肺HBE細胞、A549和H1299細胞、人結(jié)直腸癌Caco-2細胞、人肝癌

MHCCLM3、MHCC97H和Hep3B細胞和人宮頸癌HeLa細胞中的全長翻譯mRNA進行了測序。在

此,我們進一步對MHCCLM6細胞進行了mRNA測序和全長翻譯mRNA-seq(RNC-seq)分析。

總之,我們發(fā)現(xiàn)1028-3330lncRNA與9個受試人類細胞系中的核糖體結(jié)合。其中,2969

個翻譯型lncRNAs具有至少一個以AUG起始的規(guī)范開放閱讀框(ORF),可編碼長度至少為5

0aa的蛋白質(zhì)(圖4A)。這意味著一個前所未有的顯著的隱藏的人類蛋白質(zhì)組。

我們的核糖體分析結(jié)果證實,這些翻譯型lncRNAs由核糖體主動翻譯,因為核糖體足

跡跨越轉(zhuǎn)錄本,尤其是跨越預(yù)測的CDS區(qū)域(圖4B)。翻譯的lncRNAs分布在整個人類基因

13

組的所有染色體中,幾乎未檢測到染色體富集(圖4C),表明這些潛在的新編碼基因在整個

人類基因組中普遍存在。同時,在幾乎所有9個受試細胞系中檢測到約1/3的這些翻譯ln

cRNAs(≥0.1RPKM和≥10次讀取),其余的表現(xiàn)出顯著的細胞特異性表達(圖4D),這在我

們使用RPKM=1.0作為閾值時也觀察到(圖4E)。這些結(jié)果表明這些lncRNAs的翻譯受到

普遍調(diào)控。

圖4.翻譯中的lncRNA可以編碼蛋白質(zhì)。

3.3.2lncRNA編碼蛋白質(zhì)組的蛋白質(zhì)證據(jù)

接下來,我們旨在為這些翻譯的lncRNAs編碼的潛在新蛋白找到質(zhì)譜證據(jù)。我們注意

到,新蛋白的長度比已知蛋白短得多,即由人類蛋白質(zhì)組項目(HPP)提出的蛋白證據(jù)水平1

14

(PE1)蛋白(圖5A)。因此,我們對低分子量蛋白質(zhì)(<25kDa)進行了MS分析,以補充對

總蛋白質(zhì)的鳥槍法蛋白質(zhì)組學(xué)分析。我們認為根據(jù)以下標準進行鑒定是有把握的:(I)蛋白

質(zhì)水平FDR<1%,(ii)肽長度至少9aa,(iii)如前所述,根據(jù)Smith-Waterman分析,至

少一種獨特的肽具有不超過兩種可能的aa錯配。因此,我們通過MS分析分別從總(216種

蛋白質(zhì))和低分子量(109種蛋白質(zhì))蛋白質(zhì)組分中鑒定出與lncRNAs編碼的308種新蛋白質(zhì)

相對應(yīng)的372種獨特肽(圖5B),只有17種重疊。308個新蛋白的所有蛋白識別信息,包

括蛋白名稱、唯一肽序列、肽長、搜索引擎,均可在S2增補表中找到??赏ㄟ^iProX數(shù)

據(jù)庫(注冊號:IPX00076300)獲取原始數(shù)據(jù)文件、參考數(shù)據(jù)庫和搜索結(jié)果文件。

圖5.翻譯中l(wèi)ncRNA的蛋白質(zhì)證據(jù)。

我們發(fā)現(xiàn),超過36%的MS檢測到的新蛋白由至少兩種獨立肽段(47種蛋白質(zhì))或一種

15

獨立肽段加上至少一種支持肽段(66種蛋白質(zhì))證明。這里,支持肽段是由數(shù)據(jù)庫搜索引擎

分配給某個蛋白質(zhì)鑒定的非唯一肽。此外,在308個MS鑒定的新蛋白中,有261個僅由

一種獨立肽段證明(圖5C),這可以部分解釋為翻譯-mRNA分析中大多數(shù)新蛋白的表達水平

普遍較低(<10RPKM)(圖4D和E)以及長度較短(圖5A)。

我們參考了HPP指南2.1標準來表述特殊檢測結(jié)果,該標準要求使用獨立于數(shù)據(jù)的采

集方法,包括多反應(yīng)監(jiān)測(MRM)和平行反應(yīng)監(jiān)測(PRM)。通常,MRM/PRM用于選擇某些母肽

進行片段化和定量??赏ㄟ^添加合成肽作為樣品中這些肽的進一步定量的加樣標準來輔助

這一操作。對于常規(guī)MRM(不含合成肽),我們發(fā)現(xiàn)184種新蛋白有203種獨特肽的證據(jù)(圖

5D),分別占所有已鑒定獨特肽和新蛋白的54.6%和59.7%。

對于基于合成肽的PRM分析,在372個新的蛋白質(zhì)編碼肽中,我們合成了313個技術(shù)

上允許的重標記標準肽。我們可以通過數(shù)據(jù)相關(guān)采集(DDA)分析確定313項標準中的206

項(圖5D)。通過對這206種肽的PRM分析,我們只能驗證8種肽的存在(圖5D),表明需

要優(yōu)化MRM。在DDA和常規(guī)MRM中均檢測到104種重肽(圖2D)。由此,通過對重鏈MRM分

析的逐一優(yōu)化,我們可以進一步驗證細胞裂解液中存在來自38種蛋白質(zhì)的40種肽(圖5D)。

這些肽的峰組的相對強度和洗脫時間均與合成參考肽匹配,表明根據(jù)HPP指南2.1標準對

其存在進行了有把握的驗證。

接下來,我們使用含有抗原表位的特異性肽制備了用于鳥槍法MS檢測的四種新蛋白

的多克隆抗體。免疫印跡結(jié)果顯示,在各種人細胞系和人組織中,所有這些蛋白在預(yù)期分

子量下均有清晰特異性條帶(圖5E),表明它們在體內(nèi)以全長和穩(wěn)定形式存在。為了進一步

確??贵w的特異性,我們使用體外翻譯的全長蛋白作為陽性對照,從細菌鮑曼不動桿菌和

肺炎鏈球菌中提取的總蛋白作為陰性對照(圖5E)。此外,我們?yōu)樵诜gmRNA分析中發(fā)現(xiàn)

但未被MS檢測到的另外6種新蛋白制備了多克隆抗體,并獲得了它們可靠的免疫印跡證

據(jù)(圖5F)。這些結(jié)果表明,由于MS的局限性,它只能檢測到一部分新蛋白,并提示隱藏

16

蛋白質(zhì)組的大小應(yīng)該更大。總之,我們使用翻譯、MS和抗體證據(jù)驗證了翻譯lncRNAs編碼

的隱藏人類蛋白質(zhì)組的存在。

以上研究發(fā)表在:NucleicAcidsResearch(2019)47(15),8111-8125.

3.4全長翻譯組的測序和蛋白質(zhì)剪切變體的深度鑒定

3.4.1RNC-mRNA的全長測序及修正

通過優(yōu)化和建立細胞中完整RNC提取技術(shù),提高提取效率;優(yōu)化RNC-mRNA抽提方法,

確保獲得序列完整的RNC-mRNA;對提取的MHCC97H細胞系的RNC-mRNA進行基于Nanopore

MinION三代測序平臺的三代長讀長測序,產(chǎn)生初始reads平均錯誤率大約為8.47%;對

同一樣品進行精度高、短讀長的二代測序,用以對三代序列進行修正。修正后RNC-mRNA

全長測序誤差最終控制在約0.61%。該研究實現(xiàn)了翻譯組的三代全長測序,并建立了相關(guān)

實驗和分析流程。相關(guān)成果發(fā)表于FrontiersinMolecularBiosciences2022,9:89574

6。

3.4.2剪切變體的蛋白質(zhì)產(chǎn)物鑒定

利用翻譯組的二代測序數(shù)據(jù),構(gòu)建最小化蛋白質(zhì)參考數(shù)據(jù)庫;在MHCC97H細胞系中,

利用15906個翻譯中剪切變體mRNA序列;在HeLa中利用15195個翻譯中剪切變體mRNA

序列(圖6)。此外,在MHCC97H細胞系中,利用校正的三代全長翻譯組測序數(shù)據(jù),獲得

了15131個全長剪切變體序列,其中包括4525個公共數(shù)據(jù)庫中從未報道過的新的剪切變

體;建立了包含基因剪切變體信息的最小化參考蛋白序列庫,鑒定到6766個來自于已知

蛋白的不同全長剪切變體以及50個全新的蛋白剪切變體。該研究高精度地實現(xiàn)了蛋白質(zhì)

剪切變體的大規(guī)模鑒定,完善了相關(guān)的實驗流程和分析流程,并發(fā)現(xiàn)了大量可翻譯的新剪

切變體。

以上研究發(fā)表在:FrontiersinMolecularBiosciences2022,9:895746。

17

圖6.利用全長測序在基因水平和剪切變體水平檢測到的基因數(shù)目(A)以及在蛋白質(zhì)

組水平檢測到的剪切變體數(shù)目(B)。

4、制定本標準的基礎(chǔ)

起草人在本標準研究領(lǐng)域的成績:

本標準核心起草人張弓研究員,現(xiàn)為暨南大學(xué)翻譯組學(xué)實驗室負責(zé)人。國家優(yōu)青,國

家863青年科學(xué)家,國家萬人計劃青年拔尖人才,中國蛋白質(zhì)組學(xué)專業(yè)委員會(CNHUPO)理

事,中國分子系統(tǒng)生物學(xué)專業(yè)委員會委員。獲美國化學(xué)學(xué)會頒發(fā)的會員獎。任國際人類蛋

白質(zhì)組計劃(C-HPP)副主席,是中國人在C-HPP中的最高職位。建立了翻譯組學(xué)新學(xué)科

領(lǐng)域,首次實現(xiàn)翻譯組全長測序,將中心法則定量化,對1972年諾貝爾化學(xué)獎理論“安

芬森原則”作出重大更新,發(fā)現(xiàn)大量“非編碼RNA”可編碼蛋白質(zhì)(暗蛋白質(zhì)組)。翻譯

組分析被作為C-HPP的核心支柱之一。2016年被寫進國家統(tǒng)編教材。

張弓研究院研發(fā)了一系列大規(guī)模測序和蛋白質(zhì)組質(zhì)譜的基礎(chǔ)算法和實驗策略,建立了

第一個全國產(chǎn)化測序分析全流程并規(guī)?;逃?,打破美國壟斷,被新聞聯(lián)播報道。建立核

酸組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)的質(zhì)控標準和方法,研發(fā)出準確度接近100%的蛋白質(zhì)全長

測序方案。除精準醫(yī)學(xué)的應(yīng)用外,在湖北省應(yīng)用于新冠核酸檢測中,迄今為止準確率100%,

18

2020.8-2021.12無一例本地傳播案例,證明了這些技術(shù)的價值。

本團體標準中實驗流程和技術(shù)要求制定依據(jù)來自已完成的國家重點研發(fā)計劃項目2017

YFA0505000和2018YFC0910200的項目成果。本標準的參與單位為當(dāng)前國內(nèi)外蛋白質(zhì)組學(xué)

研究領(lǐng)域一線的代表性高校、科研院所、技術(shù)服務(wù)及儀器供應(yīng)商,可為本標準的執(zhí)行和推

廣提供強有力的技術(shù)支持和應(yīng)用推廣。

5、實驗內(nèi)容

對基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)進行調(diào)研評估,搜集相關(guān)資料及研究結(jié)果,結(jié)合文獻

及眾多科研項目,以及深圳承啟生物科技有限公司內(nèi)部標準化流程及評估標準,梳理出了

具有代表性的關(guān)鍵步驟和通用流程。因此本標準規(guī)定了基于質(zhì)譜的定量蛋白質(zhì)組檢測的主

要內(nèi)容,主要實驗內(nèi)容包括了:樣品采集、保存和運輸、蛋白質(zhì)提取和質(zhì)控、蛋白質(zhì)酶解

及質(zhì)譜檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評估和分析。

6、實際應(yīng)用效果

我們首先對數(shù)據(jù)產(chǎn)生的源頭即樣品開始了甄選,在各實驗室,各平臺廣泛使用且容易

生產(chǎn)培養(yǎng)的細胞系的基礎(chǔ)上,選擇代次之間穩(wěn)定性最強的細胞株是組學(xué)數(shù)據(jù)產(chǎn)出的可靠保

障。正常細胞系體外培養(yǎng)傳代次數(shù)有限,因此選擇多種惡性程度強的癌細胞系作為組學(xué)數(shù)

據(jù)產(chǎn)出的候選標準樣品。

通過連續(xù)多代次采集MHCC97H等5株細胞株,進行轉(zhuǎn)錄組測序,得出在6株實驗細胞

株中,MHCC97H5-14代次細胞定量相關(guān)性最高R2達到0.97以上,獲得MHCC97H細胞傳代

過程中轉(zhuǎn)錄組穩(wěn)定性最高的結(jié)論,進一步評價該MHCC97H細胞株的翻譯組、蛋白質(zhì)組的穩(wěn)

定性,結(jié)果發(fā)現(xiàn)MHCC97H細胞株RNC-seq定量相關(guān)性R達到0.9以上。進一步通過蛋白質(zhì)

質(zhì)譜定量結(jié)果R也達到0.92以上,并且按照標準流程在第三方實驗室的操作下也得到了

可重復(fù)和可驗證的穩(wěn)定數(shù)據(jù),這個結(jié)果不僅肯定了我們所建立的標準操作程序,還說明了

MHCC97H是非常穩(wěn)定的,可以作為標準物質(zhì)進行長時間生產(chǎn),可以在各個實驗室廣泛推廣

19

使用。與此同時通過蛋白質(zhì)組標準流程,我們對對大腸桿菌全蛋白質(zhì)組進行了質(zhì)譜測定。

在兩個不同菌株的全蛋白質(zhì)組兩次生物學(xué)重復(fù)測定中,實現(xiàn)了99.7%和99.8%的重現(xiàn)性,

距離完美重現(xiàn)僅一步之遙。不僅重現(xiàn)性極高,其蛋白質(zhì)鑒定數(shù)量也創(chuàng)造了大腸桿菌蛋白質(zhì)

組單次鑒定量的世界紀錄。

在蛋白質(zhì)組學(xué)數(shù)據(jù)質(zhì)控方面,使用穩(wěn)態(tài)細胞翻譯組數(shù)據(jù)作為“標準答案”來評價開放

式搜索蛋白質(zhì)鑒定結(jié)果,質(zhì)譜搜庫結(jié)果中沒有翻譯證據(jù)的蛋白被認為是假陽性蛋白,屬于

“可疑鑒定”(SuspiciousIdentifications,SI),而利用SI和有翻譯證據(jù)的蛋白質(zhì)

(Translation-supportedIdentifications,TI)則可計算可疑鑒定率(SuspiciousDi

scoveryRate,SDR),以此來反映蛋白質(zhì)的潛在錯誤鑒定率。研究發(fā)現(xiàn),開放式搜索結(jié)

果的SDR可達限制性搜索的兩倍甚至更多,強調(diào)開放性搜索若不進行有效質(zhì)量控制難以保

證鑒定結(jié)果可靠性,而將肽段FDR嚴格控制在0.001以下,則可控制SDR與限制性搜庫一

樣水平。對比開放式搜索不同參數(shù)設(shè)置下的結(jié)果,發(fā)現(xiàn)FDR控制是開放式搜索質(zhì)控最重要

的影響因素,而質(zhì)量容差值、可變修飾、酶切方式和色譜分離條件并不是影響SDR的主要

因素。該研究首次將翻譯組數(shù)據(jù)應(yīng)用于開放式搜索策略的質(zhì)控評估中,有效挖掘質(zhì)譜數(shù)據(jù)

中的“暗物質(zhì)”,為蛋白質(zhì)組開放式搜索策略制定了簡便易行的質(zhì)控標準。

此外,我們利用已經(jīng)建立的蛋白質(zhì)組學(xué)標準流程和翻譯組學(xué)質(zhì)控策略,成功發(fā)現(xiàn)

“隱藏的蛋白質(zhì)組”。長期的研究以來,lncRNAs經(jīng)常被報道與癌癥的發(fā)生發(fā)展、心血管

疾病、神經(jīng)退行性疾病以及其他的疾病相關(guān),而對他們的功能研究主要的停留在轉(zhuǎn)錄水平

上或者與miRNA相互作用等。然而,我們的研究提供了確切的證據(jù)證明462個lncRNA

s可以翻譯成具有功能的新蛋白質(zhì),而且數(shù)目可能不止462個,而是會更大。這一成果將

推動lncRNAs研究領(lǐng)域從轉(zhuǎn)錄水平研究進入到蛋白水平的研究,也將會從根本上提高我

們對疾病模型研究的認識。我們的研究成果,不僅豐富了人類基因組編碼基因的參考庫,

還將會成為科學(xué)界對人類基因組重新注釋的啟發(fā)。

20

以上研究成果表明,蛋白質(zhì)組學(xué)的標準操作流程和質(zhì)控方法可以極大提高基于質(zhì)譜技

術(shù)的蛋白質(zhì)組學(xué)實驗重復(fù)性和穩(wěn)健性,具有極強的科研和應(yīng)用價值。

三、試驗驗證的分析、綜述報告,技術(shù)經(jīng)濟論證,預(yù)期的經(jīng)濟效益、社會效

益和生態(tài)效益

1、主要技術(shù)指標

(1)樣品量指標

根據(jù)不同樣品類型和檢測目標準備足量樣品,在條件許可情況下,盡量加倍準備樣品

量,并做好樣品備份工作,表1為推薦樣品量。

表1推薦樣品量指標

樣品類型推薦樣品量

新鮮動物組織50mg~2g

新鮮植物組織100mg~50g

細菌/真菌菌體50mg~2g

新鮮培養(yǎng)細胞5×106個~1×107個

血清50μL~100μL

血漿50μL~100μL

唾液、羊水、腦脊液100μL~500μL

尿液15mL~50mL

(2)蛋白質(zhì)裂解液投入量指標

應(yīng)選擇溶解性強的蛋白質(zhì)裂解液裂解樣品,亦可采購樣品溶解效果好、蛋白質(zhì)提取效

率高、酶解及質(zhì)譜兼容的商品化蛋白質(zhì)裂解液。為取得最佳的使用效果,可以適當(dāng)將裂解

液分裝后使用,應(yīng)盡量避免過多的反復(fù)凍融。需在裂解液中新鮮加入終濃度為1mM的PMS

F。如需檢測磷酸化蛋白,必須加入含磷酸酶抑制劑的蛋白酶抑制劑化合物。裂解樣品的

所有步驟都需在冰上或4℃進行。建議蛋白質(zhì)裂解液投入量如下:

1)常見的動物、植物、真菌等物種,包括人、鼠、水稻、擬南芥、酵母等,應(yīng)盡量充分

21

破碎和溶解樣品,但也需要盡可能減少不必要的破碎步驟,以減少樣品損失;蛋白質(zhì)

裂解液的量要加足,建議按樣品重量:裂解液體積(w:v)=1:5~1:10添加,即10

0mg克樣品,加入0.5mL~1mL的蛋白質(zhì)裂解液;

2)每1×106個細胞添加200μL蛋白質(zhì)裂解液;

3)血清、血漿、唾液、尿液、羊水、腦脊液、關(guān)節(jié)液等體液類樣品,可不加蛋白質(zhì)裂解

液,經(jīng)蛋白質(zhì)濃度檢測后,直接進入酶解操作環(huán)節(jié)。

(3)蛋白質(zhì)樣品質(zhì)量控制指標

使用聚丙烯酰胺凝膠電泳(SDS)對樣品進行質(zhì)檢,將所有蛋白質(zhì)樣品取等量

(推薦上樣量:20μg蛋白質(zhì)/樣品)加載到凝膠后進行電泳,對凝膠進行考馬斯亮藍染

色,脫色至背景透明無色后使用凝膠成像儀掃描獲得樣品的完整蛋白質(zhì)組條帶。樣品結(jié)果

判定及對應(yīng)解決方法見表2。

表2SDS質(zhì)量控制結(jié)果判定及解決方法

SDS結(jié)果質(zhì)檢結(jié)果判定解決方法

背景干凈,可明顯分辨蛋白

質(zhì)梯狀條帶,在不同分子量

間分布均勻,同類樣品間蛋質(zhì)量高,可繼續(xù)

/

白質(zhì)條帶整體和局部無明顯后續(xù)實驗操作。

差異,各泳道重復(fù)性和顏色

一致。

蛋白質(zhì)濃度檢測

樣品間的蛋白質(zhì)條帶灰度值重新進行蛋白質(zhì)濃度檢

結(jié)果不準確,不

差異過大。測后再次質(zhì)檢。

符合要求。

再次實驗,重新提取蛋

樣品質(zhì)量存疑,白質(zhì),再次質(zhì)檢判定是

同一類型樣品蛋白質(zhì)條帶分

有待再次實驗判提取不充分導(dǎo)致條帶差

布差異過大。

定。異過大還是樣品本身存

在差異。

蛋白質(zhì)分布不均勻,出現(xiàn)蛋白質(zhì)提取效率

使用較前更強的破碎/裂

如:分布在某一范圍分子量低,提取不充

解條件處理樣品后再次

的蛋白質(zhì)條帶過少,或樣品分。不符合要

質(zhì)檢。

條帶分布零星且單一。求。

22

蛋白質(zhì)樣品中鹽使用有機溶劑如丙酮、

蛋白質(zhì)條帶中橫紋、縱紋較

類等雜質(zhì)含量甲醇沉淀蛋白質(zhì)后溶于

多,或背景較深,無法清洗

高,不符合要蛋白質(zhì)裂解液后再次質(zhì)

分辨出蛋白質(zhì)梯狀條帶。

求。檢。

無明顯梯狀蛋白質(zhì)條帶、條采集新鮮樣品,注意操

蛋白質(zhì)樣品發(fā)生

帶出現(xiàn)拖尾、主要條帶堆積作手法,重新進行蛋白

降解。

在低分子量區(qū)域。質(zhì)提取和質(zhì)檢。

(4)質(zhì)譜儀質(zhì)控指標

使用MHCC97H細胞來源的蛋白質(zhì)標準品進行質(zhì)譜檢測,對質(zhì)譜儀穩(wěn)定性進行評估:

高分辨質(zhì)譜的質(zhì)量檢測分辨率和精度往往能夠達到ppm級別(百萬分之一)。由于儀

器本身固有特性,其在長時間工作后會出現(xiàn)質(zhì)量精度的偏移如不及時矯正,則會出現(xiàn)信息

遺漏、錯報等問題。Orbitrap類型儀器應(yīng)實現(xiàn)10ppm內(nèi)的分辨率,同時質(zhì)量精度不能超

過±10ppm的偏差。峰寬由樣品中蛋白豐度分布、色譜柱效能等因素決定,較窄且恒定的

峰寬能夠得到較好的定性定量效果。肽段碎裂信號的好壞決定了定性結(jié)果優(yōu)劣,因此保證

較高的碎裂強度及一致性是保證結(jié)果的重要因素。

iRT標肽的出峰均勻說明色譜流出的一致性較高,保證了定量信息的最高覆蓋及準確

性。色譜半峰寬(FWHM)是衡量色譜效能的重要指標,大規(guī)模蛋白質(zhì)組定性定量檢測中采

用25cm~50cm柱長,F(xiàn)WHM盡可能在0.15min~0.25min的色譜柱,F(xiàn)WHM過長會大大

影響定性定量效果。

具體質(zhì)控要求如下:

4.1液相系統(tǒng)質(zhì)控

4.1.1MS1TIC(MS1色譜總離子流):各樣品在色譜圖梯度內(nèi)譜峰盡可能的均勻分布;

4.2.2MS2TIC(MS2色譜總離子流):各樣品在色譜圖梯度內(nèi)譜峰盡可能的均勻分布;

4.2.3RTFragmentDistribution(碎片離子保留時間分布):在色譜圖梯度內(nèi)不同

樣本中鑒定到的碎片離子數(shù)目基本一致。如出現(xiàn)的樣品間峰型基本一致而強度波動較大,

23

則說明色譜體系分離穩(wěn)定但進樣量未完全矯正,導(dǎo)致平行檢測的多肽量不太一致;

4.2.4RTPrecursorDistribution(母離子保留時間分布):在色譜圖梯度內(nèi)不同樣

本中鑒定到的母離子數(shù)目基本一致;

4.2.5DeltaRT(保留時間偏差):通過iRT預(yù)測的肽段保留時間和實際檢測到的肽段

(或iRT肽段)保留時間之間的偏差,由iRT/RT回歸算法得到。DeltaRT值越小表明保

留時間越符合模型計算,在定量中越可以得到較好的矯正計算結(jié)果。DeltaRT/iRT推薦

閾值為±2min;當(dāng)閾值在±0.5min表示極好;

4.2.6FWHMDistribution(半峰寬分布):FWHM在0.2min~0.3min左右較為理想,

0.05min~0.2min表示色譜柱性能極好,而大于0.5min則代表色譜柱性能下降,建議

更換;

4.2.7Datapointsperpeak(每個峰采集的數(shù)據(jù)點):推薦為5-10個點為好,點數(shù)太

少會使定量的準確度降低,而點數(shù)太多會使得蛋白鑒定數(shù)目減少;

4.2.8Capacity(色譜峰容量):峰容量圖顯示了超高效液相色譜(UPLC)色譜柱在分

離肽方面的效率。Peakcapacity=g/(FWHM*1.7)。其中g(shù)為梯度分鐘數(shù),FWHM為所有鑒定

成功多肽的平均半峰寬。更高的峰容量代表更窄的色譜峰,也代表了更好的肽分離能力,

檢測到的肽段也就越多,通常FWHM會隨著梯度拉長而變寬。對于采用自填柱的色譜,峰

容量2小時梯度,大于350表示色譜柱性能較好。而采用高性能商品柱的1小時梯度峰容

量則通常大于400;

4.3質(zhì)譜系統(tǒng)質(zhì)控

4.3.1MS1MassAccuracy(MS1質(zhì)量精度):MS1質(zhì)量精度計算方法為:(實際檢測到

的m/z-理論m/z)/理論m/z。單位為ppm。校正后MS1水平質(zhì)量精度小于5ppm。矯正

前的MS1偏差盡量不超過10ppm;

4.3.2MS2MassAccuracy(MS2質(zhì)量精度):MS2的質(zhì)量精度計算為:(實際檢測到

24

的m/z-理論m/z)/理論m/z。單位為ppm。校正后MS2水平質(zhì)量精度應(yīng)小于10ppm;

4.4定性結(jié)果質(zhì)控

4.4.1ExperimentIdentificationFrequency(鑒定結(jié)果分布):組內(nèi)各樣品鑒定數(shù)

目不應(yīng)出現(xiàn)較大波動;

4.4.2MissedCleavages(漏切):通常情況下理想的漏切比例應(yīng)小于20%,血液等含

高豐度蛋白的樣品會比常規(guī)的略高;

4.4.3Charge(電荷):通常情況下,大多數(shù)母離子會帶2電荷和3電荷,單電荷和多

電荷的母離子比例較少。如果單電荷和4電荷以上比例偏高,如>20%,則說明樣品或ESI

噴霧可能存在問題需要排查;

4.5定量結(jié)果質(zhì)控

4.5.1Heatmap(熱圖):DDA/DIA數(shù)據(jù)進行搜庫分析后的第一步不進行任何缺失值填充,

因此缺失值會相對偏高,其缺失值比例主要取決于樣品情況,其次是整個前處理和質(zhì)譜流

程中的重復(fù)性。組內(nèi)的樣品缺失值比例和分布不應(yīng)出現(xiàn)太大波動,且可盡可能聚類到一起;

4.5.2NormalizedQuantityDistribution(歸一化):通常情況下,不同樣本間del

taLog10Quantity的絕對值應(yīng)小于0.5,deltaLog10Quantity的絕對值如小于0.3更

好;

4.5.3QuantityCV(變異系數(shù)):用于評估各觀測值變異程度,即組內(nèi)定量結(jié)果的重

復(fù)性,CV越小,組內(nèi)重復(fù)性越好。樣本的生物學(xué)重復(fù)性比較好或是技術(shù)重復(fù),CV值應(yīng)小

于15%。但是對于一些復(fù)雜樣本如臨床樣本,CV會相對偏高;

4.5.4Correlation(相關(guān)性):通常情況下,同一組內(nèi)樣本重復(fù)性越好,相關(guān)性就越

高。如:細胞樣品組內(nèi)重復(fù)性應(yīng)達到95%以上,組織樣品重復(fù)性應(yīng)達到90%以上。

2、主要試驗和驗證數(shù)據(jù)分析

按照本標準的方法,我們組織實施了關(guān)鍵性能指標的試驗項目驗證,實施驗證的內(nèi)容

25

為對MHCC97H細胞株不同代次的細胞提取蛋白質(zhì)后,我們設(shè)計不同時空和不同測序平臺上

進行l(wèi)abelfree和DIA定量蛋白質(zhì)組檢測,并進行對比分析,來論證本MHCC97H可作為

蛋白質(zhì)標準品來源細胞株。

2.1MHCC97H可作為核酸、蛋白質(zhì)標準品來源細胞株

圖7.MHCC97H細胞不同代次翻譯組測序定量穩(wěn)定性評估

進一步評價MHCC97H細胞翻譯組穩(wěn)定性,最終確定參比物質(zhì)來源細胞株。通過連續(xù)不

間斷連續(xù)采集MHCC97H第5到14代次細胞翻譯中的mRNA(RNC),翻譯組定量相關(guān)系數(shù)R

=0.90~0.99(圖7),表明MHCC97H細胞在翻譯層面上存在高度穩(wěn)定性。

26

圖8.MHCC97H蛋白質(zhì)組定量穩(wěn)定性評估

接下來我們進一步對MHCC97H的第2代至12代次細胞全蛋白進行質(zhì)譜鑒定,使用Orb

itrapFusionLumos質(zhì)譜儀質(zhì)譜儀對肽斷進行鑒定,形成10個DDA及10個DIA數(shù)據(jù)集。

評估蛋白通過目標-誘餌庫(Target-decoy)搜庫策略降低鑒定假陽性率,最終得到不同

代次間細胞的蛋白質(zhì)定性及定量列表。對MHCC97H的第2代至12代次細胞蛋白質(zhì)定量結(jié)

果進行相關(guān)性分析,DDA模式下的蛋白質(zhì)各代次之間定量相關(guān)性達到R=0.94~0.97,DIA模

式下蛋白質(zhì)各代次之間定量相關(guān)性達到R=0.92~0.97(圖8)。

候選標準品MHCC97H各代次之間的核酸以及蛋白質(zhì)定量相關(guān)性均達到超高水平,從核

酸和蛋白質(zhì)層面均表現(xiàn)出高度穩(wěn)定性,進一步表明MHCC97H可作為標準樣品連續(xù)穩(wěn)定的產(chǎn)

出。

2.2MHCC97H蛋白質(zhì)組樣品第三方實驗室質(zhì)譜一致性評估

同一批次標準樣品MHCC97H細胞株全蛋白,分別給華南理工大學(xué),北京師范大學(xué)、大

27

連物化和暨南大學(xué)所每個實驗室1mg蛋白質(zhì),所有實驗室均采取標準化的酶解及質(zhì)譜實驗

流程,質(zhì)控方法如下:采取超濾管酶解標準操作進行實驗,酶解后對肽斷除鹽并進行肽斷

濃度檢測,富集后肽斷≥1μg/μL。儀器全部統(tǒng)一為ThermoOrbitrapFusionLumos,D

DA模式,不分組分。評估蛋白通過目標-誘餌庫(Target-decoy)搜庫策略降低鑒定假陽

性率,最終得到不同實驗室對同一樣品的蛋白質(zhì)定性及定量列表。同一樣品蛋白質(zhì)在四個

實驗室的測試下(暨南大學(xué)一個生物學(xué)重復(fù),鑒定結(jié)果取交集),蛋白質(zhì)的鑒定數(shù)量相對

一致。對四個實驗室蛋白質(zhì)定量結(jié)果進行DDAiBAQ定量一致性測試同實驗室定量重復(fù)性

R2=0.93-0.97,不同實驗室DIA定量相關(guān)性R2=0.83-0.99左右(圖9)。在不同實驗室質(zhì)

譜鑒定下,MHCC97H細胞株的蛋白質(zhì)質(zhì)譜定量仍舊達到超高的可重復(fù)性和可驗證性。

以上研究發(fā)表在:ScientificData10.1(2023):455.

圖9.不同實驗室MHCC97H蛋白質(zhì)組定量相關(guān)性分析。標準流程的穩(wěn)健性。

2.3超微量MHCC97H蛋白質(zhì)樣品4DDIA檢測數(shù)據(jù)評估

布魯克生物科技有限公司的timsTOFHT質(zhì)譜儀采用全新的第四代TIMS-XR和更先進

的數(shù)字轉(zhuǎn)換技術(shù),能夠在細胞和組織的定量蛋白質(zhì)組學(xué)分析中,實現(xiàn)更寬的動態(tài)范圍和更

高的蛋白覆蓋深度,是目前業(yè)內(nèi)較為先進的質(zhì)譜儀,我們使用本標準流程制備的MHCC97H

多肽標準品評估標質(zhì)譜儀性能。實驗結(jié)果如下:

28

如圖10所示,當(dāng)上樣MHCC97H標準多肽200ng時,采用20min分析總時長,使用

dia-PASEF采集,PaSER軟件搜庫,平均可鑒定超過10000種蛋白,94000條多肽;鑒定結(jié)

果顯示重復(fù)性好,重復(fù)三針進樣測試相關(guān)性超過0.99。

如圖10所示,當(dāng)上樣MHCC97H標準多肽1ng時,采用20min分析總時長,使用dia

-PASEF采集,PaSER軟件搜庫,平均可鑒定約5000種蛋白,超過24000條多肽;鑒定結(jié)

果重復(fù)性好,重復(fù)三針進樣測試相關(guān)性超過0.99。

以上結(jié)果顯示MHCC97H標準多肽標準品可以用于業(yè)內(nèi)領(lǐng)先的質(zhì)譜儀的蛋白質(zhì)檢測質(zhì)量

監(jiān)控。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論