版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》編制說明
一、工作簡況
1、任務(wù)來源
本標準基于衛(wèi)健委/科技部國家重點研發(fā)計劃《醫(yī)學(xué)生命組學(xué)數(shù)據(jù)質(zhì)量控制關(guān)鍵技術(shù)
研發(fā)與應(yīng)用》(2018YFC0910200,2018年立項,2021年結(jié)題)和廣東省重點領(lǐng)域研發(fā)計劃
《多組學(xué)整合技術(shù)研發(fā)及標準化組學(xué)數(shù)據(jù)質(zhì)量控制技術(shù)的推廣應(yīng)用》(2019B020226001,
2019年立項,2022年結(jié)題)兩個項目的研究成果,本標準由深圳承啟生物科技有限公司于
2023年9月提出申報,根據(jù)中國國際科技促進會標準化工作委員會[2023]中科促標字第982
號文件:關(guān)于開展《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》團體標準立項通知,正式確立立
項,本項目計劃編號為:CI2023419。
2、目的和意義
質(zhì)譜是目前蛋白質(zhì)組學(xué)研究的主流技術(shù),可以一次性分析復(fù)雜樣品中上萬種蛋白質(zhì)。
但質(zhì)譜的重現(xiàn)性一直是一個很大的問題。同一個樣品做兩次質(zhì)譜實驗,鑒定到的蛋白質(zhì)都
有較大的不同,重現(xiàn)性(即兩次都能鑒定到的蛋白數(shù)量占總鑒定數(shù)的百分比)一般只能達
到65-85%。2017年《NatureCommunications》上的一篇文章指出(Collinsetal.,
NatureCommunications),只有約一半的蛋白質(zhì)能在SWATH(SequentialWindowed
AcquisitionofallTheoreticalfragmentions,SWATH)質(zhì)譜技術(shù)中被重復(fù)鑒定到,
而SWATH已經(jīng)被認為是重現(xiàn)性相對較高的質(zhì)譜技術(shù)了?!禨cience》曾組織專題研討會討論
如何提高質(zhì)譜的重現(xiàn)性,指出現(xiàn)有質(zhì)譜的重現(xiàn)性遠遠不能滿足生物標志物的要求。重現(xiàn)性
問題如果不能得到很好的解決,那么基于質(zhì)譜的生物標志物發(fā)現(xiàn)及臨床應(yīng)用將十分困難。
對于定量蛋白質(zhì)組學(xué)研究,因為樣品制備流程、質(zhì)譜平臺和分析流程常常不一致,加大了
蛋白質(zhì)組學(xué)在精準醫(yī)學(xué)中的應(yīng)用難度;此外,Hela細胞蛋白酶解的標準品作為一種高度驗
2
證的哺乳動物蛋白消化物,可用作復(fù)雜蛋白質(zhì)組學(xué)樣品的質(zhì)譜分析的質(zhì)控樣品被人們廣泛
使用。然而Hela細胞因其存在超強的種內(nèi)污染和種間污染而存在廣泛爭論。基于以上領(lǐng)域
內(nèi)存在的諸多問題,我們利用多組學(xué)技術(shù)手段評估并開發(fā)出一種或多種可作為蛋白質(zhì)組標
準品的細胞株,并以此制定蛋白質(zhì)組標準操作流程供行業(yè)內(nèi)流通使用。
目前國內(nèi)外均無相關(guān)的標準流程,各蛋白質(zhì)組學(xué)研究單位處于各自為戰(zhàn)的狀態(tài)。流程
不通用,結(jié)果不可比。
本標準對樣品采集、處理、運輸、質(zhì)控和檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評估和數(shù)據(jù)分析全
流程進行標準化和規(guī)范化。該標準的特點是:流程標準化,可應(yīng)對各種類型樣品蛋白質(zhì)提
取和制備需求,同時保持結(jié)果的重現(xiàn)性,對樣品保存運輸?shù)囊蟮?;開發(fā)出了具有極高蛋
白質(zhì)組穩(wěn)定性且可穩(wěn)定傳代的蛋白質(zhì)組標準品細胞株:MHCC97H,可用于監(jiān)控實驗流程或
校準儀器,該標準品已申請國家發(fā)明專利,具有完整自主知識產(chǎn)權(quán)。
3、起草單位
本標準負責(zé)起草單位:深圳承啟生物科技有限公司。
本標準參加起草單位:暨南大學(xué)、華南理工大學(xué)、北京師范大學(xué)、中國科學(xué)院大連化
學(xué)物理研究所、福建農(nóng)林大學(xué)、福建省婦幼保健院、上海易算生物科技有限公司、布魯克
(北京)科技有限公司。
本標準主要起草人:張弓、陳洋、余卓、盧少華、趙晶、李亞星、范小路、杜紅麗、
高友鶴、袁曉明、沈城頻、王心睿、盧紅、劉先明、杜蕭賢。
參加單位工作分配:深圳承啟生物科技有限公司負責(zé)標準方案的制定及網(wǎng)頁發(fā)布;深
圳承啟生物科技有限公司、暨南大學(xué)、華南理工大學(xué)、中國科學(xué)院大連化學(xué)物理研究所、
北京師范大學(xué)、福建農(nóng)林大學(xué)、福建省婦幼保健院、上海易算生物科技有限公司和布魯克
生物科技有限公司參與了標準方案的實驗測試和質(zhì)量評估;暨南大學(xué)、深圳承啟生物科技
有限公司進行了標準起草和編制說明編寫,其他參與單位對標準各個版本的全部內(nèi)容提出
3
編寫和修改意見。
4、起草過程
4.1起草階段
2019年1月至2019年6月,標準起草單位組織相關(guān)技術(shù)人員對標準項目進行了預(yù)研,課
題組成員廣泛收集了國內(nèi)外基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)的應(yīng)用現(xiàn)狀及技術(shù)發(fā)展趨勢相關(guān)
的標準、文獻,了解了國內(nèi)外相關(guān)技術(shù)動態(tài),并且明確了工作思路和進程安排;
2019年7月至2022年4月,標準起草單位對標準草案進行實驗驗證和技術(shù)論證并確立了
基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)從采樣、前處理、運輸、質(zhì)控和檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評
估和數(shù)據(jù)分析全流程,形成了《基于質(zhì)譜的定量蛋白質(zhì)組學(xué)技術(shù)規(guī)程》的初稿,并于2023
年3月以網(wǎng)頁形式向社會發(fā)布
(/Resources/omicsStandard/index.html);
2022年8月,國家衛(wèi)生健康委醫(yī)藥衛(wèi)生科技發(fā)展研究中心組織專家對本標準流程初稿
進行評審,參會專家做“基本完成主要相關(guān)考核指標”的評價,建議進一步加強相關(guān)數(shù)據(jù)
采集與檢測標準的認定,同時提出應(yīng)加強應(yīng)用示范的建議;
2022年9月至11月,編制組針對收集的意見,對標準進行了補充和完善。包括:1)增
加了蛋白質(zhì)提取質(zhì)量檢測標準;2)增加了使用MHCC97H標準品及標準數(shù)據(jù)集進行數(shù)據(jù)質(zhì)量
控制的內(nèi)容;3)在暨南大學(xué)、華南理工大學(xué)、北京師范大學(xué)和布魯克生物科技有限公司
等單位宣傳和推廣本標準,充分交流并進一步收集相關(guān)單位的反饋意見;
2022年12月,向廣東省科技創(chuàng)新監(jiān)測研究中心組織的專家組進行總結(jié)報告,專家組考
察了標準實施場地,審閱了相關(guān)資料并進行了咨詢。項目開發(fā)技術(shù)已在多家機構(gòu)推廣應(yīng)用,
取得較好的評價和一定的經(jīng)濟效益;
本標準由深圳承啟生物科技有限公司提出,由暨南大學(xué)和深圳承啟生物科技有限公司
主編,其他單位共同參與起草,于2023年9月提交團體標準《基于質(zhì)譜的定量蛋白質(zhì)組學(xué)
4
技術(shù)規(guī)程》的立項申請書,經(jīng)中國國際科技促進會標準化工作委員會及相關(guān)專家技術(shù)審核,
于2023年10月19日正式發(fā)布立項公告,并于同日在全國團體標準平臺發(fā)布立項公示。
2024年1月,中國國際科技促進會標準化工作委員會完成了對本標準內(nèi)容的審核并提
出對格式重排和規(guī)范書寫的意見,編制組進一步參考標準書寫規(guī)范,修改和完善了標準文
本內(nèi)容,形成了《基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)規(guī)程》團體標準征求意見稿和團體標準編
制說明。
4.2征求意見階段
2024年2月,本標準由中國國際科促會標準化工作委員會,在全國團體標準信息平臺
面向社會進行公開征求意見。同時由編制組向相關(guān)單位進行定向征求意見。
4.3審查階段
4.4報批階段
二、標準編制原則、主要內(nèi)容及其確定依據(jù),修訂標準時,還包括修訂前后
技術(shù)內(nèi)容的對比
1、標準的編寫原則
本標準的制定工作遵循“先進性、適用性、可操作性、實用性、規(guī)范性”的原則,依
據(jù)GB/T1.1-2020《標準化工作導(dǎo)則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》和GB/T
20001.4-2015《標準編寫規(guī)則第4部分:試驗方法標準》給出的規(guī)則編寫。
2、標準主要內(nèi)容
1)樣品量要求;
2)樣品采集與保存要求;
3)樣品前處理要求;
4)各種裂解液主要特點、差異和選擇建議;
5
5)樣品運輸要求;
6)SDS質(zhì)量控制結(jié)果判定及解決方法;
7)非標記定量蛋白質(zhì)組蛋白質(zhì)酶解實驗流程;
8)iTRAQ標記定量蛋白質(zhì)組蛋白質(zhì)酶解及標記實驗流程(以8標為例);
9)多肽樣品除鹽實驗流程;
10)質(zhì)譜數(shù)據(jù)采集實驗流程;
11)質(zhì)譜數(shù)據(jù)質(zhì)量控制要求。
3、制定本標準的依據(jù)
3.1蛋白質(zhì)組標準流程可極大提高大腸桿菌蛋白組的重復(fù)性
本項目前期已初步建立蛋白質(zhì)組的制備分析全流程,并已研發(fā)獲得極為穩(wěn)定的蛋白質(zhì)
標準品,據(jù)此,我們利用前期研究成果進一步驗證流程和標準品的穩(wěn)健性。細菌中半數(shù)以
上的蛋白質(zhì)編碼基因是由兩個或兩個以上的基因組成的多順反子操縱子所組成。操縱子組
織是否維持操縱子內(nèi)基因的化學(xué)計量表達仍有爭議。在本研究中,我們進行了一項無標記、
與數(shù)據(jù)無關(guān)的采集超反應(yīng)監(jiān)測質(zhì)譜(HRM-MS)實驗,以定量指數(shù)期的大腸桿菌蛋白質(zhì)組,并
定量了93.6%的胞質(zhì)蛋白,分別涵蓋了BW25113和MG1655菌株中67.9%和56.0%的翻譯多
順反子操縱子。我們發(fā)現(xiàn)翻譯調(diào)控在很大程度上有助于蛋白質(zhì)組的復(fù)雜性:對于化學(xué)計量,
較短的操縱子往往比較長的操縱子受到更嚴格的控制;主要編碼復(fù)合物的操縱子比主要編
碼代謝途徑的操縱子更嚴格地控制化學(xué)計量?;蜷g隔(一個操縱子中相鄰基因之間的距
離)可以作為化學(xué)計量的調(diào)節(jié)因子。催化效率可能是一個操縱子編碼的酶的差異表達的驅(qū)
動力。這些結(jié)果說明了操縱子調(diào)控的多面性:操縱子統(tǒng)一轉(zhuǎn)錄水平和基因特異性翻譯水平。
這種多水平調(diào)控通過優(yōu)化代謝途徑的生產(chǎn)力效率和維持不同類型的蛋白質(zhì)復(fù)合物而有益于
宿主。
為了評估HRM-MS方法的定量能力和再現(xiàn)性,我們應(yīng)用自研標準品對質(zhì)譜進行標準測
6
定及校準,使用上述已建立的蛋白質(zhì)組標準流程對菌株BW25113和MG1655的大腸桿菌總
可溶性蛋白進行了兩次生物學(xué)重復(fù)實驗。當(dāng)使用先前的鑒定標準(至少一種獨特肽,肽長
度≥6個氨基酸)時,我們的HRM-MS結(jié)果分別定量了這兩種菌株中的1951和1571個蛋白
質(zhì)。兩次生物復(fù)制鑒定了幾乎相同的蛋白質(zhì),證明了高穩(wěn)健性和再現(xiàn)性(圖1A)。兩個重復(fù)
對幾乎相同的蛋白質(zhì)進行了定量:僅在一個重復(fù)中對少數(shù)蛋白質(zhì)進行了定量(圖1A)。在嚴
格標準下為兩個獨特的肽和至少七個氨基酸的肽長度。即使在嚴格標準下,我們?nèi)砸愿咴?/p>
現(xiàn)性定量了1675和1252個蛋白質(zhì)(圖1B、C)。與之前通過其他方法定量的結(jié)果(APEX為1
021個蛋白質(zhì),iBAQ為1183個蛋白質(zhì),emPAI為1138個蛋白質(zhì))相比,定量的可溶性蛋白
質(zhì)數(shù)量幾乎增加了一倍。
7
圖1.不同非標記定量方法獲得的蛋白質(zhì)豐度比較。
為了排除儀器的差異,我們在同一臺OrbitrapFusionLumos儀器中對兩種菌株進行
了DDAMS實驗。根據(jù)嚴格標準鑒定蛋白質(zhì),并使用iBAQ法進行定量。DDAMS分別定量了
BW25113和MG1655菌株的1520和1482個蛋白質(zhì),與HRM-MS實驗相當(dāng)。然而,兩個生物
學(xué)復(fù)制品的iBAQ定量的相關(guān)系數(shù)分別為0.932和0.939(圖1D,E),低于HRM-MS(兩個菌
株的R分別為0.982和0.988)。兩個菌株中每個鑒定蛋白平均被19.20和15.45個肽覆蓋,
分別覆蓋31.56%和24.87%的氨基酸序列(圖1F),高于人類蛋白質(zhì)組質(zhì)譜實驗的典型肽覆
8
蓋(單個搜索引擎,覆蓋高達20%)。
以上研究發(fā)表在:FrontiersinGenetics(2019)10:473.
3.2翻譯組可作為指導(dǎo)蛋白質(zhì)組質(zhì)量控制的獨立數(shù)據(jù)集
到目前為止,在質(zhì)譜蛋白質(zhì)組鑒定的時候依然有超過一半的譜圖無法被鑒定。開放式
搜索(OpenSearch)策略很早就被提出用來解決這一問題。但是OpenSearch的搜索策
略的鑒定結(jié)果可靠程度一直難以評估,也缺乏一套完整系統(tǒng)的使用手冊。我們提出使用翻
譯組測序數(shù)據(jù)作為最小化庫對OpenSearch的鑒定結(jié)果進行質(zhì)控,主要的方法是引入可疑
發(fā)現(xiàn)率(SDR)作為參考指標對OpenSearch策略和限制性搜索(NarrowwindowSearch)
策略的鑒定結(jié)果進行評價。結(jié)果發(fā)現(xiàn),OpenSearch策略確實可能引入更多的假陽性,但
它確實能夠有效提高譜圖利用率,我們還提出將肽段FDR控制在0.001以下能夠有效控制
OpenSearch鑒定結(jié)果假陽性發(fā)生,并且給出了一套OpenSearch較為完整的使用規(guī)范,
這對于促進容差搜索策略的發(fā)展有重要意義,并且能幫助我們更好地認識那些無法被鑒定
和使用的譜圖,揭示更多的翻譯后修飾、單氨基酸多態(tài)性以及新型剪接變體等事件。
3.2.1實現(xiàn)接近完整的翻譯中基因鑒定率
所有RNC-seq都是以非常高的通量下測序,測序通量達到144-188M讀段。假設(shè)一個
典型的哺乳動物細胞含有200,000個mRNA分子,一個平均長度為2.2kb且豐度為1拷
貝/細胞的轉(zhuǎn)錄物相當(dāng)于2.27RPKM。采用每種轉(zhuǎn)錄物10次閱讀的量化標準,這種通量可
以量化平均長度的轉(zhuǎn)錄物,豐度為0.014拷貝/細胞,表明翻譯mRNA鑒定接近完成。事實
上,我們發(fā)現(xiàn)RNC-seq-量化的低豐度翻譯mRNAs低至0.001RPKM(圖2A)。此外,在此處
理量下,量化的基因數(shù)量接近飽和(圖2B),再次表明翻譯mRNAs的鑒定接近完整。
9
圖2.不同設(shè)置下限制性搜索和開放搜索策略的SDR評估。
3.2.2利用質(zhì)量容差和多肽FDR可以控制開放搜索SDR
不管是NarrowSearch策略還是OpenSearch策略,在進行數(shù)據(jù)庫搜索之前都會對氨
基酸修飾進行預(yù)先的設(shè)置,包括固定修飾或者可變修飾。在通常情況下,氨基酸的修飾千
變?nèi)f化,無法準確地清楚所有的氨基酸修飾的具體情況,那么較為經(jīng)典的做法是對氨基酸
進行占比例較大的一些修飾進行預(yù)先的設(shè)置,例如半胱氨酸的烷基化修飾和蛋氨酸的氧化
修飾以及肽段的N端乙酰化修飾等。理論上,增加可變修飾的種類將使得搜空間擴大,不
10
僅需要更多的計算也會導(dǎo)致鑒定結(jié)果的準確性的下降,因此,我們在這里只進行兩種占比
例較大的氨基酸修飾進行預(yù)先的設(shè)置,分別為半胱氨酸的烷基化修飾和蛋氨酸的氧化修飾。
通過不同的修飾設(shè)置的組合對相同數(shù)據(jù)集進行NarrowwindowSearch(Precursortolera
nce=10ppm),我們發(fā)現(xiàn)對于一般的搜庫軟件如pFind,增加可變修飾會使得鑒定結(jié)果的
SDR提高,不設(shè)置任何修飾信息不會使得SDR增加(圖2C)。
開放搜索策略的關(guān)鍵是允許更大的母離子質(zhì)量容差,以耐受由修飾引起的質(zhì)量偏移。
然而,這也將導(dǎo)致允許更多假陽性的副作用。允許較小的母離子容差在理論上應(yīng)該會降低
SDR。當(dāng)允許100–800Da母離子質(zhì)量容限時,我們驗證了兩種算法的這一假設(shè):容限越低,
SDR越低(圖3A)。我們還注意到,當(dāng)質(zhì)量容差超過400Da時,SDR幾乎飽和。相比之下,
識別能力幾乎與窗口大小無關(guān)(圖3B)。這些結(jié)果表明,當(dāng)大部分預(yù)期修改已經(jīng)包括在內(nèi)時,
較大的質(zhì)量公差是沒有用的。事實上,300Da的耐受性已經(jīng)涵蓋了90%的預(yù)期修改,500
Da的耐受性涵蓋了94%。38–70%的質(zhì)量位移為+1至+3,表明質(zhì)量位移的主要來源是同位
素偏移。
肽FDR過濾是用于控制鑒別質(zhì)量的另一個因素。由于大的前體耐受性可能導(dǎo)致肽鑒定
的較高誤差,因此更嚴格的肽FDR應(yīng)有助于控制質(zhì)量。事實上,我們發(fā)現(xiàn)設(shè)置更嚴格的肽
FDR標準顯著降低了兩種算法的SDR(圖3C和D)。當(dāng)將肽FDR設(shè)置為0.001時,無論將半
胱氨酸氨基甲酸乙酯化設(shè)置為可變修飾還是固定修飾,均可將開放搜索SDR平均控制在窄
窗口搜索水平(圖3C和D)。值得注意的是,算法之間存在差異:當(dāng)將肽FDR設(shè)置為0.002
時,pFind開放搜索SDR降至窄搜索SDR以下,而MSFragger需要設(shè)置為0.001。
兩個搜索引擎獲取的身份信息的一致性反映了身份識別質(zhì)量的提高。在所有數(shù)據(jù)集中,
肽FDR<0.001時的一致性鑒定分數(shù)高于肽FDR<0.01時的一致性鑒定分數(shù)(圖3E)。
以上研究發(fā)表在:JournalofProteomeResearch(2018)17(11),3719-3729.
11
圖3.使用不同因素控制SDR。
3.3利用翻譯組發(fā)現(xiàn)隱藏的非編碼基因來源蛋白質(zhì)組
人類基因組上已知大約有5萬個基因,其中約2萬個被標注為可以表達蛋白質(zhì)的
“編碼基因”,而另外3萬個基因被標注為“非編碼基因”(non-codinggenes)。已有的
報道中,除了部分非編碼基因可以表達為小肽行使調(diào)控功能外,也有個別lncRNA被發(fā)現(xiàn)
實際上能翻譯成>50氨基酸的蛋白質(zhì),例如CLUU1,ESRG等,問題是,如果這種情況不是
個案而是普遍存在的現(xiàn)象,則確實存在部分“編碼基因”被錯誤地標注成了“非編碼基
12
因”,這將意味著人基因組需要被系統(tǒng)性地重新注釋。
事實上,這一問題很早就被學(xué)界關(guān)注過。2013年,EricLander等人僅僅根據(jù)Riboso
meprofiling計算模型認為lncRNA不可能編碼蛋白質(zhì)。但僅僅一年后,該團隊又發(fā)表文
章,僅僅是調(diào)整了計算模型,認為lncRNA可能編碼蛋白質(zhì),然而其始終拿不出蛋白質(zhì)實
驗證據(jù)。2014年,人類蛋白質(zhì)組草圖在Nature上發(fā)表,聲稱發(fā)現(xiàn)千余個lncRNA所編碼的
“新蛋白質(zhì)”,但隨后便被人類蛋白質(zhì)組組織(HUPO)爆出其分析不合規(guī)范,存在大量的假
陽性鑒定,在用較嚴格的標準進行質(zhì)控后,這些所謂的“新蛋白質(zhì)證據(jù)”幾乎都被認定為
假陽性。因此,如何避免蛋白質(zhì)組學(xué)質(zhì)譜技術(shù)的固有缺陷,提供獨立的蛋白質(zhì)編碼信息源,
就顯得非常重要。在本項目中使用翻譯組測序技術(shù)(RNC-seq),在肺癌細胞中發(fā)現(xiàn)了139
7個有可能被翻譯的“非編碼RNA”[16]。從9株人細胞系中共鑒定到約4700種lncRNA
正在被翻譯,且可能以經(jīng)典翻譯起始方式翻譯出>50氨基酸的蛋白質(zhì)。利用目前公認的驗
證標準,我們提供了其中314個新蛋白質(zhì)的證據(jù)。這些蛋白質(zhì)是穩(wěn)定存在的,并且有著明
確的細胞定位,功能實驗也證實它們以蛋白質(zhì)形式(而非RNA形式)行使著明確的生物學(xué)
功能。
3.3.1人類細胞中含有大量正在翻譯的長鏈非編碼RNA
我們先前已對人肺HBE細胞、A549和H1299細胞、人結(jié)直腸癌Caco-2細胞、人肝癌
MHCCLM3、MHCC97H和Hep3B細胞和人宮頸癌HeLa細胞中的全長翻譯mRNA進行了測序。在
此,我們進一步對MHCCLM6細胞進行了mRNA測序和全長翻譯mRNA-seq(RNC-seq)分析。
總之,我們發(fā)現(xiàn)1028-3330lncRNA與9個受試人類細胞系中的核糖體結(jié)合。其中,2969
個翻譯型lncRNAs具有至少一個以AUG起始的規(guī)范開放閱讀框(ORF),可編碼長度至少為5
0aa的蛋白質(zhì)(圖4A)。這意味著一個前所未有的顯著的隱藏的人類蛋白質(zhì)組。
我們的核糖體分析結(jié)果證實,這些翻譯型lncRNAs由核糖體主動翻譯,因為核糖體足
跡跨越轉(zhuǎn)錄本,尤其是跨越預(yù)測的CDS區(qū)域(圖4B)。翻譯的lncRNAs分布在整個人類基因
13
組的所有染色體中,幾乎未檢測到染色體富集(圖4C),表明這些潛在的新編碼基因在整個
人類基因組中普遍存在。同時,在幾乎所有9個受試細胞系中檢測到約1/3的這些翻譯ln
cRNAs(≥0.1RPKM和≥10次讀取),其余的表現(xiàn)出顯著的細胞特異性表達(圖4D),這在我
們使用RPKM=1.0作為閾值時也觀察到(圖4E)。這些結(jié)果表明這些lncRNAs的翻譯受到
普遍調(diào)控。
圖4.翻譯中的lncRNA可以編碼蛋白質(zhì)。
3.3.2lncRNA編碼蛋白質(zhì)組的蛋白質(zhì)證據(jù)
接下來,我們旨在為這些翻譯的lncRNAs編碼的潛在新蛋白找到質(zhì)譜證據(jù)。我們注意
到,新蛋白的長度比已知蛋白短得多,即由人類蛋白質(zhì)組項目(HPP)提出的蛋白證據(jù)水平1
14
(PE1)蛋白(圖5A)。因此,我們對低分子量蛋白質(zhì)(<25kDa)進行了MS分析,以補充對
總蛋白質(zhì)的鳥槍法蛋白質(zhì)組學(xué)分析。我們認為根據(jù)以下標準進行鑒定是有把握的:(I)蛋白
質(zhì)水平FDR<1%,(ii)肽長度至少9aa,(iii)如前所述,根據(jù)Smith-Waterman分析,至
少一種獨特的肽具有不超過兩種可能的aa錯配。因此,我們通過MS分析分別從總(216種
蛋白質(zhì))和低分子量(109種蛋白質(zhì))蛋白質(zhì)組分中鑒定出與lncRNAs編碼的308種新蛋白質(zhì)
相對應(yīng)的372種獨特肽(圖5B),只有17種重疊。308個新蛋白的所有蛋白識別信息,包
括蛋白名稱、唯一肽序列、肽長、搜索引擎,均可在S2增補表中找到??赏ㄟ^iProX數(shù)
據(jù)庫(注冊號:IPX00076300)獲取原始數(shù)據(jù)文件、參考數(shù)據(jù)庫和搜索結(jié)果文件。
圖5.翻譯中l(wèi)ncRNA的蛋白質(zhì)證據(jù)。
我們發(fā)現(xiàn),超過36%的MS檢測到的新蛋白由至少兩種獨立肽段(47種蛋白質(zhì))或一種
15
獨立肽段加上至少一種支持肽段(66種蛋白質(zhì))證明。這里,支持肽段是由數(shù)據(jù)庫搜索引擎
分配給某個蛋白質(zhì)鑒定的非唯一肽。此外,在308個MS鑒定的新蛋白中,有261個僅由
一種獨立肽段證明(圖5C),這可以部分解釋為翻譯-mRNA分析中大多數(shù)新蛋白的表達水平
普遍較低(<10RPKM)(圖4D和E)以及長度較短(圖5A)。
我們參考了HPP指南2.1標準來表述特殊檢測結(jié)果,該標準要求使用獨立于數(shù)據(jù)的采
集方法,包括多反應(yīng)監(jiān)測(MRM)和平行反應(yīng)監(jiān)測(PRM)。通常,MRM/PRM用于選擇某些母肽
進行片段化和定量??赏ㄟ^添加合成肽作為樣品中這些肽的進一步定量的加樣標準來輔助
這一操作。對于常規(guī)MRM(不含合成肽),我們發(fā)現(xiàn)184種新蛋白有203種獨特肽的證據(jù)(圖
5D),分別占所有已鑒定獨特肽和新蛋白的54.6%和59.7%。
對于基于合成肽的PRM分析,在372個新的蛋白質(zhì)編碼肽中,我們合成了313個技術(shù)
上允許的重標記標準肽。我們可以通過數(shù)據(jù)相關(guān)采集(DDA)分析確定313項標準中的206
項(圖5D)。通過對這206種肽的PRM分析,我們只能驗證8種肽的存在(圖5D),表明需
要優(yōu)化MRM。在DDA和常規(guī)MRM中均檢測到104種重肽(圖2D)。由此,通過對重鏈MRM分
析的逐一優(yōu)化,我們可以進一步驗證細胞裂解液中存在來自38種蛋白質(zhì)的40種肽(圖5D)。
這些肽的峰組的相對強度和洗脫時間均與合成參考肽匹配,表明根據(jù)HPP指南2.1標準對
其存在進行了有把握的驗證。
接下來,我們使用含有抗原表位的特異性肽制備了用于鳥槍法MS檢測的四種新蛋白
的多克隆抗體。免疫印跡結(jié)果顯示,在各種人細胞系和人組織中,所有這些蛋白在預(yù)期分
子量下均有清晰特異性條帶(圖5E),表明它們在體內(nèi)以全長和穩(wěn)定形式存在。為了進一步
確??贵w的特異性,我們使用體外翻譯的全長蛋白作為陽性對照,從細菌鮑曼不動桿菌和
肺炎鏈球菌中提取的總蛋白作為陰性對照(圖5E)。此外,我們?yōu)樵诜gmRNA分析中發(fā)現(xiàn)
但未被MS檢測到的另外6種新蛋白制備了多克隆抗體,并獲得了它們可靠的免疫印跡證
據(jù)(圖5F)。這些結(jié)果表明,由于MS的局限性,它只能檢測到一部分新蛋白,并提示隱藏
16
蛋白質(zhì)組的大小應(yīng)該更大。總之,我們使用翻譯、MS和抗體證據(jù)驗證了翻譯lncRNAs編碼
的隱藏人類蛋白質(zhì)組的存在。
以上研究發(fā)表在:NucleicAcidsResearch(2019)47(15),8111-8125.
3.4全長翻譯組的測序和蛋白質(zhì)剪切變體的深度鑒定
3.4.1RNC-mRNA的全長測序及修正
通過優(yōu)化和建立細胞中完整RNC提取技術(shù),提高提取效率;優(yōu)化RNC-mRNA抽提方法,
確保獲得序列完整的RNC-mRNA;對提取的MHCC97H細胞系的RNC-mRNA進行基于Nanopore
MinION三代測序平臺的三代長讀長測序,產(chǎn)生初始reads平均錯誤率大約為8.47%;對
同一樣品進行精度高、短讀長的二代測序,用以對三代序列進行修正。修正后RNC-mRNA
全長測序誤差最終控制在約0.61%。該研究實現(xiàn)了翻譯組的三代全長測序,并建立了相關(guān)
實驗和分析流程。相關(guān)成果發(fā)表于FrontiersinMolecularBiosciences2022,9:89574
6。
3.4.2剪切變體的蛋白質(zhì)產(chǎn)物鑒定
利用翻譯組的二代測序數(shù)據(jù),構(gòu)建最小化蛋白質(zhì)參考數(shù)據(jù)庫;在MHCC97H細胞系中,
利用15906個翻譯中剪切變體mRNA序列;在HeLa中利用15195個翻譯中剪切變體mRNA
序列(圖6)。此外,在MHCC97H細胞系中,利用校正的三代全長翻譯組測序數(shù)據(jù),獲得
了15131個全長剪切變體序列,其中包括4525個公共數(shù)據(jù)庫中從未報道過的新的剪切變
體;建立了包含基因剪切變體信息的最小化參考蛋白序列庫,鑒定到6766個來自于已知
蛋白的不同全長剪切變體以及50個全新的蛋白剪切變體。該研究高精度地實現(xiàn)了蛋白質(zhì)
剪切變體的大規(guī)模鑒定,完善了相關(guān)的實驗流程和分析流程,并發(fā)現(xiàn)了大量可翻譯的新剪
切變體。
以上研究發(fā)表在:FrontiersinMolecularBiosciences2022,9:895746。
17
圖6.利用全長測序在基因水平和剪切變體水平檢測到的基因數(shù)目(A)以及在蛋白質(zhì)
組水平檢測到的剪切變體數(shù)目(B)。
4、制定本標準的基礎(chǔ)
起草人在本標準研究領(lǐng)域的成績:
本標準核心起草人張弓研究員,現(xiàn)為暨南大學(xué)翻譯組學(xué)實驗室負責(zé)人。國家優(yōu)青,國
家863青年科學(xué)家,國家萬人計劃青年拔尖人才,中國蛋白質(zhì)組學(xué)專業(yè)委員會(CNHUPO)理
事,中國分子系統(tǒng)生物學(xué)專業(yè)委員會委員。獲美國化學(xué)學(xué)會頒發(fā)的會員獎。任國際人類蛋
白質(zhì)組計劃(C-HPP)副主席,是中國人在C-HPP中的最高職位。建立了翻譯組學(xué)新學(xué)科
領(lǐng)域,首次實現(xiàn)翻譯組全長測序,將中心法則定量化,對1972年諾貝爾化學(xué)獎理論“安
芬森原則”作出重大更新,發(fā)現(xiàn)大量“非編碼RNA”可編碼蛋白質(zhì)(暗蛋白質(zhì)組)。翻譯
組分析被作為C-HPP的核心支柱之一。2016年被寫進國家統(tǒng)編教材。
張弓研究院研發(fā)了一系列大規(guī)模測序和蛋白質(zhì)組質(zhì)譜的基礎(chǔ)算法和實驗策略,建立了
第一個全國產(chǎn)化測序分析全流程并規(guī)?;逃?,打破美國壟斷,被新聞聯(lián)播報道。建立核
酸組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)的質(zhì)控標準和方法,研發(fā)出準確度接近100%的蛋白質(zhì)全長
測序方案。除精準醫(yī)學(xué)的應(yīng)用外,在湖北省應(yīng)用于新冠核酸檢測中,迄今為止準確率100%,
18
2020.8-2021.12無一例本地傳播案例,證明了這些技術(shù)的價值。
本團體標準中實驗流程和技術(shù)要求制定依據(jù)來自已完成的國家重點研發(fā)計劃項目2017
YFA0505000和2018YFC0910200的項目成果。本標準的參與單位為當(dāng)前國內(nèi)外蛋白質(zhì)組學(xué)
研究領(lǐng)域一線的代表性高校、科研院所、技術(shù)服務(wù)及儀器供應(yīng)商,可為本標準的執(zhí)行和推
廣提供強有力的技術(shù)支持和應(yīng)用推廣。
5、實驗內(nèi)容
對基于質(zhì)譜的定量蛋白質(zhì)組技術(shù)進行調(diào)研評估,搜集相關(guān)資料及研究結(jié)果,結(jié)合文獻
及眾多科研項目,以及深圳承啟生物科技有限公司內(nèi)部標準化流程及評估標準,梳理出了
具有代表性的關(guān)鍵步驟和通用流程。因此本標準規(guī)定了基于質(zhì)譜的定量蛋白質(zhì)組檢測的主
要內(nèi)容,主要實驗內(nèi)容包括了:樣品采集、保存和運輸、蛋白質(zhì)提取和質(zhì)控、蛋白質(zhì)酶解
及質(zhì)譜檢測以及數(shù)據(jù)產(chǎn)生、質(zhì)量評估和分析。
6、實際應(yīng)用效果
我們首先對數(shù)據(jù)產(chǎn)生的源頭即樣品開始了甄選,在各實驗室,各平臺廣泛使用且容易
生產(chǎn)培養(yǎng)的細胞系的基礎(chǔ)上,選擇代次之間穩(wěn)定性最強的細胞株是組學(xué)數(shù)據(jù)產(chǎn)出的可靠保
障。正常細胞系體外培養(yǎng)傳代次數(shù)有限,因此選擇多種惡性程度強的癌細胞系作為組學(xué)數(shù)
據(jù)產(chǎn)出的候選標準樣品。
通過連續(xù)多代次采集MHCC97H等5株細胞株,進行轉(zhuǎn)錄組測序,得出在6株實驗細胞
株中,MHCC97H5-14代次細胞定量相關(guān)性最高R2達到0.97以上,獲得MHCC97H細胞傳代
過程中轉(zhuǎn)錄組穩(wěn)定性最高的結(jié)論,進一步評價該MHCC97H細胞株的翻譯組、蛋白質(zhì)組的穩(wěn)
定性,結(jié)果發(fā)現(xiàn)MHCC97H細胞株RNC-seq定量相關(guān)性R達到0.9以上。進一步通過蛋白質(zhì)
質(zhì)譜定量結(jié)果R也達到0.92以上,并且按照標準流程在第三方實驗室的操作下也得到了
可重復(fù)和可驗證的穩(wěn)定數(shù)據(jù),這個結(jié)果不僅肯定了我們所建立的標準操作程序,還說明了
MHCC97H是非常穩(wěn)定的,可以作為標準物質(zhì)進行長時間生產(chǎn),可以在各個實驗室廣泛推廣
19
使用。與此同時通過蛋白質(zhì)組標準流程,我們對對大腸桿菌全蛋白質(zhì)組進行了質(zhì)譜測定。
在兩個不同菌株的全蛋白質(zhì)組兩次生物學(xué)重復(fù)測定中,實現(xiàn)了99.7%和99.8%的重現(xiàn)性,
距離完美重現(xiàn)僅一步之遙。不僅重現(xiàn)性極高,其蛋白質(zhì)鑒定數(shù)量也創(chuàng)造了大腸桿菌蛋白質(zhì)
組單次鑒定量的世界紀錄。
在蛋白質(zhì)組學(xué)數(shù)據(jù)質(zhì)控方面,使用穩(wěn)態(tài)細胞翻譯組數(shù)據(jù)作為“標準答案”來評價開放
式搜索蛋白質(zhì)鑒定結(jié)果,質(zhì)譜搜庫結(jié)果中沒有翻譯證據(jù)的蛋白被認為是假陽性蛋白,屬于
“可疑鑒定”(SuspiciousIdentifications,SI),而利用SI和有翻譯證據(jù)的蛋白質(zhì)
(Translation-supportedIdentifications,TI)則可計算可疑鑒定率(SuspiciousDi
scoveryRate,SDR),以此來反映蛋白質(zhì)的潛在錯誤鑒定率。研究發(fā)現(xiàn),開放式搜索結(jié)
果的SDR可達限制性搜索的兩倍甚至更多,強調(diào)開放性搜索若不進行有效質(zhì)量控制難以保
證鑒定結(jié)果可靠性,而將肽段FDR嚴格控制在0.001以下,則可控制SDR與限制性搜庫一
樣水平。對比開放式搜索不同參數(shù)設(shè)置下的結(jié)果,發(fā)現(xiàn)FDR控制是開放式搜索質(zhì)控最重要
的影響因素,而質(zhì)量容差值、可變修飾、酶切方式和色譜分離條件并不是影響SDR的主要
因素。該研究首次將翻譯組數(shù)據(jù)應(yīng)用于開放式搜索策略的質(zhì)控評估中,有效挖掘質(zhì)譜數(shù)據(jù)
中的“暗物質(zhì)”,為蛋白質(zhì)組開放式搜索策略制定了簡便易行的質(zhì)控標準。
此外,我們利用已經(jīng)建立的蛋白質(zhì)組學(xué)標準流程和翻譯組學(xué)質(zhì)控策略,成功發(fā)現(xiàn)
“隱藏的蛋白質(zhì)組”。長期的研究以來,lncRNAs經(jīng)常被報道與癌癥的發(fā)生發(fā)展、心血管
疾病、神經(jīng)退行性疾病以及其他的疾病相關(guān),而對他們的功能研究主要的停留在轉(zhuǎn)錄水平
上或者與miRNA相互作用等。然而,我們的研究提供了確切的證據(jù)證明462個lncRNA
s可以翻譯成具有功能的新蛋白質(zhì),而且數(shù)目可能不止462個,而是會更大。這一成果將
推動lncRNAs研究領(lǐng)域從轉(zhuǎn)錄水平研究進入到蛋白水平的研究,也將會從根本上提高我
們對疾病模型研究的認識。我們的研究成果,不僅豐富了人類基因組編碼基因的參考庫,
還將會成為科學(xué)界對人類基因組重新注釋的啟發(fā)。
20
以上研究成果表明,蛋白質(zhì)組學(xué)的標準操作流程和質(zhì)控方法可以極大提高基于質(zhì)譜技
術(shù)的蛋白質(zhì)組學(xué)實驗重復(fù)性和穩(wěn)健性,具有極強的科研和應(yīng)用價值。
三、試驗驗證的分析、綜述報告,技術(shù)經(jīng)濟論證,預(yù)期的經(jīng)濟效益、社會效
益和生態(tài)效益
1、主要技術(shù)指標
(1)樣品量指標
根據(jù)不同樣品類型和檢測目標準備足量樣品,在條件許可情況下,盡量加倍準備樣品
量,并做好樣品備份工作,表1為推薦樣品量。
表1推薦樣品量指標
樣品類型推薦樣品量
新鮮動物組織50mg~2g
新鮮植物組織100mg~50g
細菌/真菌菌體50mg~2g
新鮮培養(yǎng)細胞5×106個~1×107個
血清50μL~100μL
血漿50μL~100μL
唾液、羊水、腦脊液100μL~500μL
尿液15mL~50mL
(2)蛋白質(zhì)裂解液投入量指標
應(yīng)選擇溶解性強的蛋白質(zhì)裂解液裂解樣品,亦可采購樣品溶解效果好、蛋白質(zhì)提取效
率高、酶解及質(zhì)譜兼容的商品化蛋白質(zhì)裂解液。為取得最佳的使用效果,可以適當(dāng)將裂解
液分裝后使用,應(yīng)盡量避免過多的反復(fù)凍融。需在裂解液中新鮮加入終濃度為1mM的PMS
F。如需檢測磷酸化蛋白,必須加入含磷酸酶抑制劑的蛋白酶抑制劑化合物。裂解樣品的
所有步驟都需在冰上或4℃進行。建議蛋白質(zhì)裂解液投入量如下:
1)常見的動物、植物、真菌等物種,包括人、鼠、水稻、擬南芥、酵母等,應(yīng)盡量充分
21
破碎和溶解樣品,但也需要盡可能減少不必要的破碎步驟,以減少樣品損失;蛋白質(zhì)
裂解液的量要加足,建議按樣品重量:裂解液體積(w:v)=1:5~1:10添加,即10
0mg克樣品,加入0.5mL~1mL的蛋白質(zhì)裂解液;
2)每1×106個細胞添加200μL蛋白質(zhì)裂解液;
3)血清、血漿、唾液、尿液、羊水、腦脊液、關(guān)節(jié)液等體液類樣品,可不加蛋白質(zhì)裂解
液,經(jīng)蛋白質(zhì)濃度檢測后,直接進入酶解操作環(huán)節(jié)。
(3)蛋白質(zhì)樣品質(zhì)量控制指標
使用聚丙烯酰胺凝膠電泳(SDS)對樣品進行質(zhì)檢,將所有蛋白質(zhì)樣品取等量
(推薦上樣量:20μg蛋白質(zhì)/樣品)加載到凝膠后進行電泳,對凝膠進行考馬斯亮藍染
色,脫色至背景透明無色后使用凝膠成像儀掃描獲得樣品的完整蛋白質(zhì)組條帶。樣品結(jié)果
判定及對應(yīng)解決方法見表2。
表2SDS質(zhì)量控制結(jié)果判定及解決方法
SDS結(jié)果質(zhì)檢結(jié)果判定解決方法
背景干凈,可明顯分辨蛋白
質(zhì)梯狀條帶,在不同分子量
間分布均勻,同類樣品間蛋質(zhì)量高,可繼續(xù)
/
白質(zhì)條帶整體和局部無明顯后續(xù)實驗操作。
差異,各泳道重復(fù)性和顏色
一致。
蛋白質(zhì)濃度檢測
樣品間的蛋白質(zhì)條帶灰度值重新進行蛋白質(zhì)濃度檢
結(jié)果不準確,不
差異過大。測后再次質(zhì)檢。
符合要求。
再次實驗,重新提取蛋
樣品質(zhì)量存疑,白質(zhì),再次質(zhì)檢判定是
同一類型樣品蛋白質(zhì)條帶分
有待再次實驗判提取不充分導(dǎo)致條帶差
布差異過大。
定。異過大還是樣品本身存
在差異。
蛋白質(zhì)分布不均勻,出現(xiàn)蛋白質(zhì)提取效率
使用較前更強的破碎/裂
如:分布在某一范圍分子量低,提取不充
解條件處理樣品后再次
的蛋白質(zhì)條帶過少,或樣品分。不符合要
質(zhì)檢。
條帶分布零星且單一。求。
22
蛋白質(zhì)樣品中鹽使用有機溶劑如丙酮、
蛋白質(zhì)條帶中橫紋、縱紋較
類等雜質(zhì)含量甲醇沉淀蛋白質(zhì)后溶于
多,或背景較深,無法清洗
高,不符合要蛋白質(zhì)裂解液后再次質(zhì)
分辨出蛋白質(zhì)梯狀條帶。
求。檢。
無明顯梯狀蛋白質(zhì)條帶、條采集新鮮樣品,注意操
蛋白質(zhì)樣品發(fā)生
帶出現(xiàn)拖尾、主要條帶堆積作手法,重新進行蛋白
降解。
在低分子量區(qū)域。質(zhì)提取和質(zhì)檢。
(4)質(zhì)譜儀質(zhì)控指標
使用MHCC97H細胞來源的蛋白質(zhì)標準品進行質(zhì)譜檢測,對質(zhì)譜儀穩(wěn)定性進行評估:
高分辨質(zhì)譜的質(zhì)量檢測分辨率和精度往往能夠達到ppm級別(百萬分之一)。由于儀
器本身固有特性,其在長時間工作后會出現(xiàn)質(zhì)量精度的偏移如不及時矯正,則會出現(xiàn)信息
遺漏、錯報等問題。Orbitrap類型儀器應(yīng)實現(xiàn)10ppm內(nèi)的分辨率,同時質(zhì)量精度不能超
過±10ppm的偏差。峰寬由樣品中蛋白豐度分布、色譜柱效能等因素決定,較窄且恒定的
峰寬能夠得到較好的定性定量效果。肽段碎裂信號的好壞決定了定性結(jié)果優(yōu)劣,因此保證
較高的碎裂強度及一致性是保證結(jié)果的重要因素。
iRT標肽的出峰均勻說明色譜流出的一致性較高,保證了定量信息的最高覆蓋及準確
性。色譜半峰寬(FWHM)是衡量色譜效能的重要指標,大規(guī)模蛋白質(zhì)組定性定量檢測中采
用25cm~50cm柱長,F(xiàn)WHM盡可能在0.15min~0.25min的色譜柱,F(xiàn)WHM過長會大大
影響定性定量效果。
具體質(zhì)控要求如下:
4.1液相系統(tǒng)質(zhì)控
4.1.1MS1TIC(MS1色譜總離子流):各樣品在色譜圖梯度內(nèi)譜峰盡可能的均勻分布;
4.2.2MS2TIC(MS2色譜總離子流):各樣品在色譜圖梯度內(nèi)譜峰盡可能的均勻分布;
4.2.3RTFragmentDistribution(碎片離子保留時間分布):在色譜圖梯度內(nèi)不同
樣本中鑒定到的碎片離子數(shù)目基本一致。如出現(xiàn)的樣品間峰型基本一致而強度波動較大,
23
則說明色譜體系分離穩(wěn)定但進樣量未完全矯正,導(dǎo)致平行檢測的多肽量不太一致;
4.2.4RTPrecursorDistribution(母離子保留時間分布):在色譜圖梯度內(nèi)不同樣
本中鑒定到的母離子數(shù)目基本一致;
4.2.5DeltaRT(保留時間偏差):通過iRT預(yù)測的肽段保留時間和實際檢測到的肽段
(或iRT肽段)保留時間之間的偏差,由iRT/RT回歸算法得到。DeltaRT值越小表明保
留時間越符合模型計算,在定量中越可以得到較好的矯正計算結(jié)果。DeltaRT/iRT推薦
閾值為±2min;當(dāng)閾值在±0.5min表示極好;
4.2.6FWHMDistribution(半峰寬分布):FWHM在0.2min~0.3min左右較為理想,
0.05min~0.2min表示色譜柱性能極好,而大于0.5min則代表色譜柱性能下降,建議
更換;
4.2.7Datapointsperpeak(每個峰采集的數(shù)據(jù)點):推薦為5-10個點為好,點數(shù)太
少會使定量的準確度降低,而點數(shù)太多會使得蛋白鑒定數(shù)目減少;
4.2.8Capacity(色譜峰容量):峰容量圖顯示了超高效液相色譜(UPLC)色譜柱在分
離肽方面的效率。Peakcapacity=g/(FWHM*1.7)。其中g(shù)為梯度分鐘數(shù),FWHM為所有鑒定
成功多肽的平均半峰寬。更高的峰容量代表更窄的色譜峰,也代表了更好的肽分離能力,
檢測到的肽段也就越多,通常FWHM會隨著梯度拉長而變寬。對于采用自填柱的色譜,峰
容量2小時梯度,大于350表示色譜柱性能較好。而采用高性能商品柱的1小時梯度峰容
量則通常大于400;
4.3質(zhì)譜系統(tǒng)質(zhì)控
4.3.1MS1MassAccuracy(MS1質(zhì)量精度):MS1質(zhì)量精度計算方法為:(實際檢測到
的m/z-理論m/z)/理論m/z。單位為ppm。校正后MS1水平質(zhì)量精度小于5ppm。矯正
前的MS1偏差盡量不超過10ppm;
4.3.2MS2MassAccuracy(MS2質(zhì)量精度):MS2的質(zhì)量精度計算為:(實際檢測到
24
的m/z-理論m/z)/理論m/z。單位為ppm。校正后MS2水平質(zhì)量精度應(yīng)小于10ppm;
4.4定性結(jié)果質(zhì)控
4.4.1ExperimentIdentificationFrequency(鑒定結(jié)果分布):組內(nèi)各樣品鑒定數(shù)
目不應(yīng)出現(xiàn)較大波動;
4.4.2MissedCleavages(漏切):通常情況下理想的漏切比例應(yīng)小于20%,血液等含
高豐度蛋白的樣品會比常規(guī)的略高;
4.4.3Charge(電荷):通常情況下,大多數(shù)母離子會帶2電荷和3電荷,單電荷和多
電荷的母離子比例較少。如果單電荷和4電荷以上比例偏高,如>20%,則說明樣品或ESI
噴霧可能存在問題需要排查;
4.5定量結(jié)果質(zhì)控
4.5.1Heatmap(熱圖):DDA/DIA數(shù)據(jù)進行搜庫分析后的第一步不進行任何缺失值填充,
因此缺失值會相對偏高,其缺失值比例主要取決于樣品情況,其次是整個前處理和質(zhì)譜流
程中的重復(fù)性。組內(nèi)的樣品缺失值比例和分布不應(yīng)出現(xiàn)太大波動,且可盡可能聚類到一起;
4.5.2NormalizedQuantityDistribution(歸一化):通常情況下,不同樣本間del
taLog10Quantity的絕對值應(yīng)小于0.5,deltaLog10Quantity的絕對值如小于0.3更
好;
4.5.3QuantityCV(變異系數(shù)):用于評估各觀測值變異程度,即組內(nèi)定量結(jié)果的重
復(fù)性,CV越小,組內(nèi)重復(fù)性越好。樣本的生物學(xué)重復(fù)性比較好或是技術(shù)重復(fù),CV值應(yīng)小
于15%。但是對于一些復(fù)雜樣本如臨床樣本,CV會相對偏高;
4.5.4Correlation(相關(guān)性):通常情況下,同一組內(nèi)樣本重復(fù)性越好,相關(guān)性就越
高。如:細胞樣品組內(nèi)重復(fù)性應(yīng)達到95%以上,組織樣品重復(fù)性應(yīng)達到90%以上。
2、主要試驗和驗證數(shù)據(jù)分析
按照本標準的方法,我們組織實施了關(guān)鍵性能指標的試驗項目驗證,實施驗證的內(nèi)容
25
為對MHCC97H細胞株不同代次的細胞提取蛋白質(zhì)后,我們設(shè)計不同時空和不同測序平臺上
進行l(wèi)abelfree和DIA定量蛋白質(zhì)組檢測,并進行對比分析,來論證本MHCC97H可作為
蛋白質(zhì)標準品來源細胞株。
2.1MHCC97H可作為核酸、蛋白質(zhì)標準品來源細胞株
圖7.MHCC97H細胞不同代次翻譯組測序定量穩(wěn)定性評估
進一步評價MHCC97H細胞翻譯組穩(wěn)定性,最終確定參比物質(zhì)來源細胞株。通過連續(xù)不
間斷連續(xù)采集MHCC97H第5到14代次細胞翻譯中的mRNA(RNC),翻譯組定量相關(guān)系數(shù)R
=0.90~0.99(圖7),表明MHCC97H細胞在翻譯層面上存在高度穩(wěn)定性。
26
圖8.MHCC97H蛋白質(zhì)組定量穩(wěn)定性評估
接下來我們進一步對MHCC97H的第2代至12代次細胞全蛋白進行質(zhì)譜鑒定,使用Orb
itrapFusionLumos質(zhì)譜儀質(zhì)譜儀對肽斷進行鑒定,形成10個DDA及10個DIA數(shù)據(jù)集。
評估蛋白通過目標-誘餌庫(Target-decoy)搜庫策略降低鑒定假陽性率,最終得到不同
代次間細胞的蛋白質(zhì)定性及定量列表。對MHCC97H的第2代至12代次細胞蛋白質(zhì)定量結(jié)
果進行相關(guān)性分析,DDA模式下的蛋白質(zhì)各代次之間定量相關(guān)性達到R=0.94~0.97,DIA模
式下蛋白質(zhì)各代次之間定量相關(guān)性達到R=0.92~0.97(圖8)。
候選標準品MHCC97H各代次之間的核酸以及蛋白質(zhì)定量相關(guān)性均達到超高水平,從核
酸和蛋白質(zhì)層面均表現(xiàn)出高度穩(wěn)定性,進一步表明MHCC97H可作為標準樣品連續(xù)穩(wěn)定的產(chǎn)
出。
2.2MHCC97H蛋白質(zhì)組樣品第三方實驗室質(zhì)譜一致性評估
同一批次標準樣品MHCC97H細胞株全蛋白,分別給華南理工大學(xué),北京師范大學(xué)、大
27
連物化和暨南大學(xué)所每個實驗室1mg蛋白質(zhì),所有實驗室均采取標準化的酶解及質(zhì)譜實驗
流程,質(zhì)控方法如下:采取超濾管酶解標準操作進行實驗,酶解后對肽斷除鹽并進行肽斷
濃度檢測,富集后肽斷≥1μg/μL。儀器全部統(tǒng)一為ThermoOrbitrapFusionLumos,D
DA模式,不分組分。評估蛋白通過目標-誘餌庫(Target-decoy)搜庫策略降低鑒定假陽
性率,最終得到不同實驗室對同一樣品的蛋白質(zhì)定性及定量列表。同一樣品蛋白質(zhì)在四個
實驗室的測試下(暨南大學(xué)一個生物學(xué)重復(fù),鑒定結(jié)果取交集),蛋白質(zhì)的鑒定數(shù)量相對
一致。對四個實驗室蛋白質(zhì)定量結(jié)果進行DDAiBAQ定量一致性測試同實驗室定量重復(fù)性
R2=0.93-0.97,不同實驗室DIA定量相關(guān)性R2=0.83-0.99左右(圖9)。在不同實驗室質(zhì)
譜鑒定下,MHCC97H細胞株的蛋白質(zhì)質(zhì)譜定量仍舊達到超高的可重復(fù)性和可驗證性。
以上研究發(fā)表在:ScientificData10.1(2023):455.
圖9.不同實驗室MHCC97H蛋白質(zhì)組定量相關(guān)性分析。標準流程的穩(wěn)健性。
2.3超微量MHCC97H蛋白質(zhì)樣品4DDIA檢測數(shù)據(jù)評估
布魯克生物科技有限公司的timsTOFHT質(zhì)譜儀采用全新的第四代TIMS-XR和更先進
的數(shù)字轉(zhuǎn)換技術(shù),能夠在細胞和組織的定量蛋白質(zhì)組學(xué)分析中,實現(xiàn)更寬的動態(tài)范圍和更
高的蛋白覆蓋深度,是目前業(yè)內(nèi)較為先進的質(zhì)譜儀,我們使用本標準流程制備的MHCC97H
多肽標準品評估標質(zhì)譜儀性能。實驗結(jié)果如下:
28
如圖10所示,當(dāng)上樣MHCC97H標準多肽200ng時,采用20min分析總時長,使用
dia-PASEF采集,PaSER軟件搜庫,平均可鑒定超過10000種蛋白,94000條多肽;鑒定結(jié)
果顯示重復(fù)性好,重復(fù)三針進樣測試相關(guān)性超過0.99。
如圖10所示,當(dāng)上樣MHCC97H標準多肽1ng時,采用20min分析總時長,使用dia
-PASEF采集,PaSER軟件搜庫,平均可鑒定約5000種蛋白,超過24000條多肽;鑒定結(jié)
果重復(fù)性好,重復(fù)三針進樣測試相關(guān)性超過0.99。
以上結(jié)果顯示MHCC97H標準多肽標準品可以用于業(yè)內(nèi)領(lǐng)先的質(zhì)譜儀的蛋白質(zhì)檢測質(zhì)量
監(jiān)控。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年統(tǒng)編版2024九年級生物上冊月考試卷
- 2025年度舞臺搭建與施工售后服務(wù)合同2篇
- 二零二五年度快遞快遞點經(jīng)營權(quán)轉(zhuǎn)讓合同范本5篇
- 2025年華東師大版八年級科學(xué)下冊階段測試試卷含答案
- 二零二五年度網(wǎng)絡(luò)主播社會保障權(quán)益合同要點3篇
- 二零二五年度建筑工程質(zhì)量監(jiān)管員聘用合同3篇
- 2025年冀教版高一物理下冊月考試卷
- 2025年人教A版高三地理上冊月考試卷
- 2025年粵教滬科版五年級語文上冊月考試卷含答案
- 2025年綠色能源項目場地租賃分成及能源管理合同3篇
- 德魯克《創(chuàng)新與企業(yè)家精神》 課件
- 陜西省漢中市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細
- 工藝豎井開挖支護施工技術(shù)方案(清楚明了)
- 初中《合唱》校本課程
- 一元一次含參不等式教學(xué)設(shè)計83
- 100道湊十法練習(xí)習(xí)題(含答案)
- 牛仔面料成本核算
- 簡單娛樂yy頻道設(shè)計模板
- 健康體檢的八大意義
- 銷售顧問初級認證筆試題
- 市場化人才選聘管理辦法
評論
0/150
提交評論