版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、藥物臨床試驗(yàn)多重性問(wèn)題指導(dǎo)原則(征求意見(jiàn)稿)2020年8月目 錄一、概述1二、多重檢驗(yàn)中的I類錯(cuò)誤、總I類錯(cuò)誤率和II類錯(cuò)誤1(一)I類錯(cuò)誤和總I類錯(cuò)誤率1(二)II類錯(cuò)誤2三、常見(jiàn)的多重性問(wèn)題3(一)多個(gè)終點(diǎn)3(二)多組間比較6(三)縱向數(shù)據(jù)不同時(shí)間點(diǎn)的分析8(四)亞組分析9(五)期中分析9(六)復(fù)雜設(shè)計(jì)10四、常見(jiàn)的多重性調(diào)整的策略與方法10(一)多重性問(wèn)題的決策策略10(二)多重性調(diào)整方法15(三)多重性分析方法20(四)多重性問(wèn)題的基本解決思路22五、其它考慮22(一)不需要調(diào)整的多重性問(wèn)題22(二)多重性檢驗(yàn)的參數(shù)估計(jì)問(wèn)題24(三)與監(jiān)管機(jī)構(gòu)的溝通24六、參考文獻(xiàn)25附錄1:詞匯表2
2、8附錄2:中英文對(duì)照表31藥物臨床試驗(yàn)多重性問(wèn)題指導(dǎo)原則一、概述臨床試驗(yàn)中普遍存在多重性問(wèn)題,它是指在一項(xiàng)完整的研究中,需要經(jīng)過(guò)不止一次統(tǒng)計(jì)推斷(多重檢驗(yàn))對(duì)研究結(jié)論做出決策的相關(guān)問(wèn)題。例如,多個(gè)終點(diǎn)(如主要終點(diǎn)和關(guān)鍵次要終點(diǎn))、多組間比較、多階段整體決策(如出于有效性決策為目的的期中分析)、縱向數(shù)據(jù)的多個(gè)時(shí)間點(diǎn)分析、亞組分析、分層分析、同一模型不同參數(shù)組合或不同數(shù)據(jù)集的分析、敏感性分析等。對(duì)于確證性臨床試驗(yàn),將總I類錯(cuò)誤率a(FWER)控制在合理水平是統(tǒng)計(jì)學(xué)的基本準(zhǔn)則。上述多重性問(wèn)題有的可以導(dǎo)致FWER膨脹,有的則不會(huì)。對(duì)于前者,需要采用恰當(dāng)?shù)臎Q策策略和分析方法將FWER控制在合理水平,這一
3、過(guò)程稱為多重性調(diào)整;對(duì)于后者,則無(wú)需多重性調(diào)整。因此,在制訂臨床試驗(yàn)方案和統(tǒng)計(jì)分析計(jì)劃時(shí),采用恰當(dāng)?shù)臎Q策策略和分析方法以控制FWER是非常重要的。本指導(dǎo)原則主要闡述常見(jiàn)的多重性問(wèn)題和相應(yīng)的解決策略,介紹常用的多重性調(diào)整的統(tǒng)計(jì)方法,旨在為確證性藥物臨床試驗(yàn)中如何控制FWER提供指導(dǎo)意見(jiàn),所討論的一般原則也適用于其它類型的臨床研究。二、多重檢驗(yàn)中的I類錯(cuò)誤、總I類錯(cuò)誤率和II類錯(cuò)誤(一)I類錯(cuò)誤和總I類錯(cuò)誤率I類錯(cuò)誤是指原假設(shè)(或稱無(wú)效假設(shè))正確但檢驗(yàn)結(jié)果拒絕了原假設(shè)的錯(cuò)誤,相當(dāng)于把實(shí)際上無(wú)效的藥物經(jīng)統(tǒng)計(jì)推斷得出有效結(jié)論的錯(cuò)誤,其概率需控制在某一水平,該水平稱為檢驗(yàn)水準(zhǔn),或稱顯著性水準(zhǔn)。對(duì)于多重檢
4、驗(yàn)中某一假設(shè)檢驗(yàn)的檢驗(yàn)水準(zhǔn)稱之為名義檢驗(yàn)水準(zhǔn),又稱局部檢驗(yàn)水準(zhǔn),用ai表示??侷類錯(cuò)誤率是指在同一試驗(yàn)所關(guān)注的多個(gè)假設(shè)檢驗(yàn)中,至少一個(gè)真的原假設(shè)被拒絕的概率,而不論多次檢驗(yàn)中哪個(gè)或哪些原假設(shè)為真。如此定義的FWER得到控制時(shí),稱為強(qiáng)控制FWER。在所有原假設(shè)都為真的條件下至少一個(gè)真的原假設(shè)被拒絕的概率,如此定義的FWER得到控制時(shí),稱為弱控制FWER。弱控制只能得出整體性結(jié)論,而不支持其中單個(gè)假設(shè)檢驗(yàn)的結(jié)論,故在確證性臨床試驗(yàn)中的應(yīng)用意義不大。本指導(dǎo)原則僅限于強(qiáng)控制FWER的應(yīng)用問(wèn)題。(二)II類錯(cuò)誤對(duì)于確證性臨床試驗(yàn),在I類錯(cuò)誤得到有效控制的前提下,II類錯(cuò)誤的風(fēng)險(xiǎn)也需要注意。II類錯(cuò)誤是指
5、原假設(shè)不正確,但檢驗(yàn)結(jié)果未能拒絕原假設(shè)的錯(cuò)誤,相當(dāng)于把實(shí)際上有效的藥物經(jīng)統(tǒng)計(jì)推斷得出無(wú)效結(jié)論的錯(cuò)誤,其概率用表示,相應(yīng)地1-稱為檢驗(yàn)效能。對(duì)于需要調(diào)整的多重檢驗(yàn),由于控制FWER降低了多重檢驗(yàn)中每個(gè)獨(dú)立檢驗(yàn)的i,相應(yīng)地也降低了檢驗(yàn)效能。因此,當(dāng)涉及多重性調(diào)整時(shí),制定研究計(jì)劃應(yīng)考慮控制FWER對(duì)檢驗(yàn)效能的影響,例如通過(guò)適當(dāng)增加樣本量以保證足夠的檢驗(yàn)效能。三、常見(jiàn)的多重性問(wèn)題臨床試驗(yàn)中常見(jiàn)的多重性問(wèn)題一般體現(xiàn)在多個(gè)終點(diǎn)、多組間比較、亞組分析、期中分析、縱向數(shù)據(jù)不同時(shí)間點(diǎn)的分析等方面。(一)多個(gè)終點(diǎn)1. 主要終點(diǎn)主要終點(diǎn)是指與臨床試驗(yàn)所關(guān)注的主要問(wèn)題(主要目的)直接相關(guān)的、能夠提供最具臨床意義和令人
6、信服的證據(jù)的終點(diǎn),常用于主分析、樣本量估計(jì)和評(píng)價(jià)試驗(yàn)是否達(dá)到主要目的。確證性臨床試驗(yàn)中,單一主要終點(diǎn)較為常見(jiàn),但某些情況下會(huì)涉及多個(gè)主要終點(diǎn),對(duì)于多個(gè)主要終點(diǎn)的研究,通常有兩類統(tǒng)計(jì)假設(shè)策略,即多個(gè)主要終點(diǎn)均要求顯著和多個(gè)主要終點(diǎn)中至少有一個(gè)顯著。(1)多個(gè)主要終點(diǎn)均要求顯著。即要求所有主要終點(diǎn)均顯著時(shí)才認(rèn)為研究藥物有效(此種情況常稱為共同主要終點(diǎn))。例如,在一項(xiàng)治療慢性梗阻性肺?。–OPD)的III期臨床試驗(yàn)中設(shè)置兩個(gè)單獨(dú)的主要療效終點(diǎn),第1秒用力呼氣量(FEV1)和患者報(bào)告癥狀評(píng)分,決策規(guī)定兩個(gè)主要終點(diǎn)均顯著才可推斷研究藥物有效。在此情況下,不會(huì)導(dǎo)致I類錯(cuò)誤膨脹,因?yàn)檫@種策略沒(méi)有機(jī)會(huì)選擇對(duì)研
7、究藥物最有利的某個(gè)或某幾個(gè)主要終點(diǎn),只有一種可能得出藥物有效的結(jié)論(即兩個(gè)原假設(shè)都被拒絕)。但是,這會(huì)增大II類錯(cuò)誤和降低檢驗(yàn)效能。檢驗(yàn)效能降低的程度與主要終點(diǎn)的個(gè)數(shù)和主要終點(diǎn)之間的相關(guān)性有關(guān),個(gè)數(shù)越多、相關(guān)性越弱,檢驗(yàn)效能降低的幅度越大。因此,對(duì)于多個(gè)主要終點(diǎn)均要求顯著的情形,無(wú)需多重性調(diào)整,但應(yīng)留意對(duì)檢驗(yàn)效能的影響。(2)多個(gè)主要終點(diǎn)中要求至少一個(gè)終點(diǎn)顯著。即至少一個(gè)主要終點(diǎn)顯著時(shí)就認(rèn)為研究藥物有效。例如,某一確證性臨床試驗(yàn)旨在驗(yàn)證一種治療燒傷傷口的藥物,設(shè)置兩個(gè)單獨(dú)的主要終點(diǎn):傷口閉合率和瘢痕形成,臨床試驗(yàn)方案規(guī)定只要其中一個(gè)終點(diǎn)顯著,或兩個(gè)終點(diǎn)都顯著,就可認(rèn)為該藥物整體臨床有效。此種情
8、況下需要多重性調(diào)整,因?yàn)榈贸鏊幬镉行У慕Y(jié)論包括以下三種可能的情形:傷口閉合率顯著而瘢痕形成不顯著;傷口閉合率不顯著而瘢痕形成顯著;傷口閉合率和瘢痕形成都顯著。由于多個(gè)主要終點(diǎn)中至少有一個(gè)終點(diǎn)顯著的組合策略不盡相同,多重性調(diào)整策略應(yīng)視具體的統(tǒng)計(jì)假設(shè)而定。2. 次要終點(diǎn)臨床試驗(yàn)的次要終點(diǎn)通常有多個(gè),多數(shù)情況下它們用于提供藥物對(duì)主要療效終點(diǎn)療效的支持作用。但在某種情況下,有些次要終點(diǎn)可能用于支持藥品說(shuō)明書聲稱的獲益,一般被稱為關(guān)鍵次要終點(diǎn)。此時(shí),應(yīng)將關(guān)鍵次要終點(diǎn)與主要終點(diǎn)共同納入I類錯(cuò)誤控制。只有主要終點(diǎn)的檢驗(yàn)認(rèn)為整體顯著后,才考慮關(guān)鍵次要終點(diǎn)的檢驗(yàn)。3. 復(fù)合終點(diǎn)復(fù)合終點(diǎn)是指將多個(gè)臨床相關(guān)結(jié)局合并
9、為一個(gè)單一變量,如表示心血管事件的復(fù)合終點(diǎn),只要發(fā)生心肌梗死、心力衰竭、冠心病猝死等其中的任一事件將被視為終點(diǎn)事件發(fā)生;或者將若干癥狀和體征的評(píng)分通過(guò)一定的方法合并為一個(gè)單一變量,如評(píng)價(jià)類風(fēng)濕關(guān)節(jié)炎的ACR20量表。如果將某一復(fù)合終點(diǎn)作為單一主要終點(diǎn),將不涉及多重性問(wèn)題。但是,如果同時(shí)將復(fù)合終點(diǎn)中某一組成部分(如某一事件或構(gòu)成量表的某一維度)用于支持藥品說(shuō)明書聲稱的獲益,應(yīng)將其定位于主要或關(guān)鍵次要終點(diǎn),再根據(jù)上述定位對(duì)所涉及的主要或次要終點(diǎn)的多重性問(wèn)題予以考慮。4. 探索性終點(diǎn)探索性終點(diǎn)可以是預(yù)先設(shè)定、也可以是非預(yù)先設(shè)定(例如數(shù)據(jù)驅(qū)動(dòng))的終點(diǎn),一般包括預(yù)期發(fā)生頻率很低而無(wú)法顯示治療效果的臨床重
10、要事件,或由于其它原因被認(rèn)為不太可能顯示效果但被納入探索性假設(shè)的終點(diǎn),其結(jié)果可能有助于設(shè)計(jì)未來(lái)新的臨床試驗(yàn)。此類終點(diǎn)無(wú)需考慮多重性調(diào)整。5. 安全性終點(diǎn)如果安全性終點(diǎn)(事件)是確證性策略的一部分,即用于支持藥品說(shuō)明書聲稱的獲益,則應(yīng)事先確定,并將其與主要療效終點(diǎn)所涉及的多重性問(wèn)題做同樣處理。此時(shí),安全性評(píng)價(jià)和有效性評(píng)價(jià)均應(yīng)控制各自的FWER。需注意,在臨床試驗(yàn)的實(shí)踐中,由于安全性事件具有很大的不確定性,有時(shí)難以事先規(guī)定主要安全性假設(shè),因此,對(duì)于多個(gè)安全性終點(diǎn)(通常是嚴(yán)重的不良反應(yīng))的確證性策略可能會(huì)基于事后的多重性調(diào)整策略,此時(shí)應(yīng)充分說(shuō)明其合理性,并與監(jiān)管機(jī)構(gòu)達(dá)成共識(shí)。(二)多組間比較臨床研究
11、中多組間的比較頗為常見(jiàn),如三臂設(shè)計(jì)、劑量-反應(yīng)關(guān)系研究、聯(lián)合用藥和復(fù)方藥的評(píng)價(jià)等。1. 三臂設(shè)計(jì)三臂設(shè)計(jì)多用于非劣效試驗(yàn),安排的三個(gè)組分別是試驗(yàn)組、陽(yáng)性對(duì)照組和安慰劑組。此時(shí),統(tǒng)計(jì)假設(shè)應(yīng)該考慮三種情形:試驗(yàn)組與安慰劑組比較的優(yōu)效性;陽(yáng)性對(duì)照組與安慰劑組比較的優(yōu)效性;試驗(yàn)組與陽(yáng)性對(duì)照組比較的非劣效性(和可能的優(yōu)效性)。對(duì)于這一多重性問(wèn)題,如果三個(gè)假設(shè)檢驗(yàn)的結(jié)果均顯著才可認(rèn)為試驗(yàn)藥物有效,無(wú)需多重性調(diào)整;或者,基于一個(gè)比較弱的研究假設(shè),即只要滿足即可認(rèn)為試驗(yàn)藥物有效;如果采用固定順序策略,如檢驗(yàn)順序?yàn)?#174;®,此時(shí)也無(wú)需多重性調(diào)整。但需要注意,后者這種基于較弱的研究假設(shè)需得到監(jiān)管機(jī)
12、構(gòu)的認(rèn)可才可實(shí)施。其它的三臂設(shè)計(jì)如果不是遵循這一多重性檢驗(yàn)策略,且不滿足所有檢驗(yàn)結(jié)果均顯著的話,需根據(jù)情況考慮是否需要多重性調(diào)整。2. 劑量-反應(yīng)關(guān)系劑量-反應(yīng)關(guān)系研究對(duì)于找到安全有效的治療劑量或劑量范圍至關(guān)重要。劑量探索的方法和目的在II期和III期試驗(yàn)中有所不同。在II期試驗(yàn)中,劑量探索研究多用于估計(jì)劑量-反應(yīng)關(guān)系,通?;诮y(tǒng)計(jì)模型證明臨床效應(yīng)與劑量增加總體呈正相關(guān)關(guān)系,不需要對(duì)不同劑量組和安慰劑組之間進(jìn)行比較,故無(wú)需控制FWER。但是,如果劑量反應(yīng)研究作為確證性策略的一部分,就需要控制FWER。在確證性臨床試驗(yàn)中,劑量探索通常是基于假設(shè)檢驗(yàn)進(jìn)行多劑量組間的比較,旨在選擇和確證試驗(yàn)藥物在特
13、定患者人群中推薦使用的一個(gè)或多個(gè)劑量水平,此時(shí)必須控制FWER,如采用基于p值的多重檢驗(yàn),或基于參數(shù)方法的多重檢驗(yàn)(如Dunnett檢驗(yàn))。3. 聯(lián)合用藥和復(fù)方藥聯(lián)合用藥是指治療用藥同時(shí)使用兩種或以上的藥物,復(fù)方藥是指治療用藥由兩種或以上的藥物組合而成。聯(lián)合用藥或復(fù)方藥臨床試驗(yàn)的目的主要是驗(yàn)證聯(lián)合用藥的獲益-風(fēng)險(xiǎn)是否優(yōu)于其中的單藥,或復(fù)方藥的獲益-風(fēng)險(xiǎn)是否優(yōu)于其組分藥。以兩個(gè)單藥的聯(lián)合用藥為例,試驗(yàn)設(shè)計(jì)至少會(huì)設(shè)置三個(gè)組,即聯(lián)合用藥組、單藥A組和單藥B組,后兩組為陽(yáng)性對(duì)照組。如果再增加一個(gè)安慰劑組,就是一個(gè)2´2的析因設(shè)計(jì)。無(wú)論是三組的設(shè)計(jì)還是四組的析因設(shè)計(jì),其統(tǒng)計(jì)檢驗(yàn)以推斷聯(lián)合用藥組
14、是否優(yōu)于其它各組為主,這將不會(huì)導(dǎo)致I類錯(cuò)誤膨脹,因?yàn)橹挥兴屑僭O(shè)均顯著的情況下方可證明聯(lián)合治療的療效。(三)縱向數(shù)據(jù)不同時(shí)間點(diǎn)的分析縱向數(shù)據(jù),即基于時(shí)間點(diǎn)的重復(fù)測(cè)量數(shù)據(jù),是臨床試驗(yàn)常見(jiàn)的數(shù)據(jù)類型。此類數(shù)據(jù)與時(shí)間點(diǎn)相關(guān)的分析分兩種情況,一種是在不同時(shí)間點(diǎn)進(jìn)行組間比較;另一種是比較處理組內(nèi)不同時(shí)間點(diǎn)的效應(yīng)。假設(shè)研究設(shè)計(jì)只有一個(gè)主要終點(diǎn)且只涉及兩個(gè)處理組(多于一個(gè)主要終點(diǎn)或多于兩個(gè)處理組的多重性問(wèn)題上文已述及),如果主要終點(diǎn)評(píng)價(jià)被定義為在多個(gè)時(shí)間點(diǎn)中的某一個(gè)時(shí)間點(diǎn)(如最后一個(gè)訪視點(diǎn))進(jìn)行處理組間的比較,其它時(shí)間點(diǎn)的組間比較被視為次要終點(diǎn)評(píng)價(jià),則不涉及多重性調(diào)整;如果主要終點(diǎn)評(píng)價(jià)被定義為在不止一個(gè)時(shí)間
15、點(diǎn)進(jìn)行處理組間的比較,若其所有相關(guān)時(shí)間點(diǎn)的組間比較達(dá)到顯著才認(rèn)為有效,就無(wú)需多重性調(diào)整,否則,就需要多重性調(diào)整。對(duì)于比較處理組內(nèi)不同時(shí)間點(diǎn)效應(yīng)的情形,如果目的是通過(guò)時(shí)間點(diǎn)之間的比較確證最佳時(shí)間點(diǎn)的效應(yīng),即當(dāng)時(shí)間效應(yīng)成為確證性策略的一部分時(shí),就需要多重性調(diào)整;否則,無(wú)需多重性調(diào)整。如果希望回避縱向數(shù)據(jù)的多重性調(diào)整問(wèn)題,一種可能的解決方案是將不同時(shí)間點(diǎn)的效應(yīng)轉(zhuǎn)換為折線下的面積,例如治療后不同時(shí)間點(diǎn)的疼痛VAS評(píng)分可以轉(zhuǎn)化為折線下面積以代表治療后總的疼痛評(píng)分,即把多個(gè)變量轉(zhuǎn)化為一個(gè)變量,但相應(yīng)地,在這種轉(zhuǎn)換之后,每個(gè)時(shí)間點(diǎn)的組間比較就無(wú)法實(shí)施了。另一種可能的解決方案是對(duì)重復(fù)測(cè)量數(shù)據(jù)用單個(gè)模型分析,如
16、重復(fù)測(cè)量方差分析或混合效應(yīng)模型。(四)亞組分析亞組分析通常用于說(shuō)明試驗(yàn)藥物在某一特定亞組人群中的療效、或者各亞組之間療效的一致性。如果特定亞組的分析用于支持藥品說(shuō)明書聲稱的獲益,則需要綜合考慮總?cè)巳汉蛠喗M人群的多重性問(wèn)題,同時(shí)還要注意保證亞組有足夠的檢驗(yàn)效能。反之,如果亞組分析不用于支持藥品說(shuō)明書聲稱的獲益,則無(wú)需多重性調(diào)整。(五)期中分析針對(duì)有效性和/或無(wú)效性進(jìn)行監(jiān)查的期中分析,因?yàn)樵谘芯窟^(guò)程中需要進(jìn)行多次決策,所以FWER的控制顯得尤為重要,多重性調(diào)整的策略和方法也復(fù)雜多樣。在制定臨床試驗(yàn)方案時(shí),應(yīng)仔細(xì)考慮并預(yù)先設(shè)定恰當(dāng)?shù)亩嘀匦哉{(diào)整策略和相應(yīng)的統(tǒng)計(jì)方法。(六)復(fù)雜設(shè)計(jì)對(duì)于用于確證性目的的籃
17、式設(shè)計(jì)、傘式設(shè)計(jì)、平臺(tái)設(shè)計(jì)等涵蓋多疾病領(lǐng)域、多種藥物、跨研究的復(fù)雜設(shè)計(jì),由于同時(shí)開(kāi)展多個(gè)分題研究,涉及多重決策的問(wèn)題。但由于這些分題研究多是獨(dú)立的研究且回答特定的臨床問(wèn)題,如適用疾病、目標(biāo)人群等,故一般無(wú)需多重性調(diào)整。但是,對(duì)于復(fù)雜設(shè)計(jì)分題研究的目標(biāo)人群有較大重疊時(shí),以及對(duì)于多個(gè)分題研究使用同一個(gè)對(duì)照組時(shí),是否需要多重性調(diào)整,應(yīng)視具體情況而定。此時(shí),建議申辦方與監(jiān)管機(jī)構(gòu)進(jìn)行充分溝通。四、常見(jiàn)的多重性調(diào)整的策略與方法針對(duì)臨床試驗(yàn)中普遍存在的多重性問(wèn)題,所采用的多重性調(diào)整的策略與方法取決于試驗(yàn)的目的、設(shè)計(jì)、統(tǒng)計(jì)假設(shè)及其分析方法。申辦方需在試驗(yàn)設(shè)計(jì)時(shí)對(duì)選用的多重性調(diào)整的策略與方法進(jìn)行必要的評(píng)估,并在
18、臨床試驗(yàn)方案和統(tǒng)計(jì)分析計(jì)劃中詳述。多重性調(diào)整的策略與方法可以從決策策略、調(diào)整方法和分析方法三個(gè)層面考慮。(一)多重性問(wèn)題的決策策略臨床試驗(yàn)的研究結(jié)論主要依據(jù)綜合所有試驗(yàn)數(shù)據(jù)分析結(jié)果所做的推斷,也是一個(gè)從局部決策到整體決策的過(guò)程。多重性問(wèn)題的決策策略可分為平行策略(或稱單步法)和序貫策略(或稱多步法)。除了從局部決策到整體決策的過(guò)程外,還有分階段的整體決策,例如,出于有效性決策為目的的期中分析。1. 平行策略平行策略是指所包含的各個(gè)假設(shè)檢驗(yàn)相互獨(dú)立,平行進(jìn)行,與檢驗(yàn)順序無(wú)關(guān),就像一種并聯(lián)關(guān)系,每個(gè)假設(shè)檢驗(yàn)的推斷結(jié)果不依賴于其它假設(shè)檢驗(yàn)的推斷結(jié)果。圖1是平行策略的示意圖,H0i為第i個(gè)原假設(shè)(i=
19、1,2,m),m為假設(shè)檢驗(yàn)的個(gè)數(shù);HA為整體備擇假設(shè),即整個(gè)研究結(jié)論對(duì)應(yīng)的假設(shè),HAi為第i個(gè)備擇假設(shè);a為FWER水平,ai為第i個(gè)名義檢驗(yàn)水準(zhǔn)。平行策略有以下三種情形:圖1 多重性問(wèn)題的平行策略示意圖如果所有假設(shè)檢驗(yàn)均顯著才被認(rèn)為是陽(yáng)性結(jié)論(如三臂設(shè)計(jì)的非劣效試驗(yàn),多個(gè)主要終點(diǎn)等),即試驗(yàn)藥物有效(圖1右側(cè)的備擇假設(shè)HA成立),則無(wú)需多重性調(diào)整,每個(gè)檢驗(yàn)的名義水準(zhǔn)與FWER水平相同(ai=a)。如果其中至少一個(gè)假設(shè)檢驗(yàn)結(jié)果顯著就被認(rèn)為是陽(yáng)性結(jié)論但不包含(圖1下方的備擇假設(shè)HA成立),則需要多重性調(diào)整(ai<a)。例如設(shè)有3個(gè)主要終點(diǎn)(O1,O2,O3)的試驗(yàn),如果采用Bonferro
20、ni法,每個(gè)終點(diǎn)的名義檢驗(yàn)水準(zhǔn)可以相同也可以不同,但其和為FWER水平,即a1+a2+a3=a。圖1上部的HA1、HA2等代表局部決策,即在整體結(jié)論為陽(yáng)性的前提下,并基于多重性調(diào)整(ai<a)的檢驗(yàn)結(jié)果,可進(jìn)一步對(duì)某個(gè)或某幾個(gè)備擇假設(shè)是否成立做出獨(dú)立的推斷。仍以設(shè)有3個(gè)主要終點(diǎn)的試驗(yàn)為例,在采用策略得出試驗(yàn)藥物有效的整體結(jié)論后,局部決策有6種可能的組合,一個(gè)終點(diǎn)的假設(shè)檢驗(yàn)結(jié)果顯著有3種,3個(gè)終點(diǎn)中任意兩個(gè)終點(diǎn)的假設(shè)檢驗(yàn)結(jié)果顯著有3種。類似的例子還可見(jiàn)于劑量探索研究的確證性臨床試驗(yàn)中,如設(shè)置2個(gè)或3個(gè)劑量組和一個(gè)安慰劑對(duì)照組,采用策略,只要其中一個(gè)劑量組與安慰劑組比較顯著就可整體以推斷試驗(yàn)
21、藥物有效,并在此基礎(chǔ)上進(jìn)一步做出局部決策,即哪一個(gè)或幾個(gè)劑量有效。對(duì)于和情形下的多重性調(diào)整可采用Bonferroni法或idák法。2. 序貫策略序貫策略是指按一定順序?qū)υ僭O(shè)進(jìn)行檢驗(yàn),直到滿足相關(guān)條件而停止檢驗(yàn),就像一種串聯(lián)關(guān)系,根據(jù)設(shè)定條件前一個(gè)假設(shè)檢驗(yàn)的結(jié)果將決定是否進(jìn)行后續(xù)的假設(shè)檢驗(yàn)。序貫順序分為固定順序和非固定順序兩種方式,如下所述。圖2 多重性問(wèn)題的序貫策略示意圖(以向下法為例)固定順序策略:見(jiàn)圖2上半部分,假設(shè)檢驗(yàn)的順序需事先確定,分需要和不需要進(jìn)行多重性調(diào)整兩種情況。以不需要調(diào)整(ai=a)為例,每一個(gè)假設(shè)檢驗(yàn)的名義水準(zhǔn)與FWER水平相同。假設(shè)檢驗(yàn)以既定順序依次進(jìn)行,
22、直到某一個(gè)假設(shè)檢驗(yàn)不拒絕原假設(shè)(不顯著)為止,而最終的推斷結(jié)論為該假設(shè)前面的陽(yáng)性檢驗(yàn)結(jié)果均被接受。例如,按順序有3個(gè)原假設(shè)分別是H01、H02和H03,若第1和第2個(gè)假設(shè)檢驗(yàn)都在0.05水平拒絕了原假設(shè),但第3個(gè)假設(shè)檢驗(yàn)未能拒絕原假設(shè)H03,則備擇假設(shè)HA1和HA2都成立,而HA3不成立。當(dāng)固定順序策略需要做多重性調(diào)整時(shí),可參見(jiàn)回退法一節(jié)。固定順序策略也適用于對(duì)假設(shè)檢驗(yàn)集合進(jìn)行的檢驗(yàn),如守門法,即將所有原假設(shè)分成若干集合,并預(yù)先確定各集合假設(shè)檢驗(yàn)順序,按順序?qū)Ω骷线M(jìn)行檢驗(yàn)。對(duì)于復(fù)雜的固定順序策略,可借助圖示方法直觀展現(xiàn)決策規(guī)則。非固定順序策略:見(jiàn)圖2下半部分,以向下法為例,假設(shè)檢驗(yàn)的順序按事
23、先規(guī)定以檢驗(yàn)統(tǒng)計(jì)量由大到?。╬值由小到大)排序,圖2中下標(biāo)“x”表示順序位次在試驗(yàn)設(shè)計(jì)階段無(wú)法確定,只能在事后求出檢驗(yàn)統(tǒng)計(jì)量后才能確定,例如H0x2的含義是在所有檢驗(yàn)統(tǒng)計(jì)量中第2大的假設(shè)檢驗(yàn)所對(duì)應(yīng)的原假設(shè)。該策略需要做多重性調(diào)整(ai<a),每個(gè)假設(shè)有各自的名義檢驗(yàn)水準(zhǔn)。假設(shè)檢驗(yàn)以規(guī)定的順序依次進(jìn)行,直到某一個(gè)假設(shè)檢驗(yàn)不拒絕原假設(shè)(不顯著)為止,而最終的推斷結(jié)論為該假設(shè)前面的陽(yáng)性檢驗(yàn)結(jié)果均被接受。序貫策略中假設(shè)檢驗(yàn)的順序以及相應(yīng)的多重性調(diào)整方法的不同對(duì)整體結(jié)論的影響也不同,這一點(diǎn)在設(shè)計(jì)階段尤其要注意。序貫策略的檢驗(yàn)效能通常優(yōu)于平行策略,但其置信區(qū)間的計(jì)算較為復(fù)雜甚至難以估計(jì)。3. 分階段
24、的整體決策策略分階段的整體決策策略是指將整體決策按照時(shí)間順序分階段進(jìn)行,其典型代表是出于有效性為目的的期中分析,如圖3所示。每個(gè)階段都進(jìn)行一次整體決策,確定試驗(yàn)因有效或無(wú)效提前終止還是繼續(xù)。每一階段的整體決策可以采用多重性問(wèn)題決策策略中的平行策略或序貫策略。多階段決策需要多重性調(diào)整,即每個(gè)階段都會(huì)消耗一定的a,各階段的名義檢驗(yàn)水準(zhǔn)ai可以相同,也可以不同,視采用的a消耗策略而定。需要注意,在每個(gè)階段的整體決策過(guò)程中,如果涉及到局部決策的多重性調(diào)整,則該階段的名義檢驗(yàn)水準(zhǔn)ai就是該階段的總a水平。圖3 多重性問(wèn)題的分階段整體決策示意圖(二)多重性調(diào)整方法多重性調(diào)整方法實(shí)質(zhì)上是通過(guò)調(diào)整整體決策中每
25、一個(gè)獨(dú)立假設(shè)檢驗(yàn)的名義檢驗(yàn)水準(zhǔn)i以達(dá)到控制FWER的目的。名義檢驗(yàn)水準(zhǔn)的確定方法可以根據(jù)多重性問(wèn)題的決策策略選擇。1. 平行策略的多重性調(diào)整方法(1)Bonferroni法。Bonferroni法的基本思想是各個(gè)獨(dú)立檢驗(yàn)的名義水準(zhǔn)之和等于FWER水平a,即a1+a2+ai+am=a各名義水準(zhǔn)可以相同(ai=a/m),也可以不同,后者往往在各個(gè)檢驗(yàn)假設(shè)的優(yōu)先順序時(shí)使用。例如,某臨床試驗(yàn)設(shè)有3個(gè)主要終點(diǎn),需要進(jìn)行3次假設(shè)檢驗(yàn),設(shè)定a=0.05。如果3個(gè)主要終點(diǎn)的優(yōu)先順序相同,則每個(gè)檢驗(yàn)的ai相同,均為0.0167(=0.05/3),則每個(gè)假設(shè)檢驗(yàn)的p值小于0.0167才被認(rèn)為該檢驗(yàn)顯著;如果3個(gè)主
26、要終點(diǎn)的優(yōu)先順序不同,如設(shè)置a1、a2和a3分別為0.030、0.015和0.005,則每個(gè)假設(shè)檢驗(yàn)的p值小于所對(duì)應(yīng)的ai才被認(rèn)為該檢驗(yàn)顯著。該法較為保守,各檢驗(yàn)統(tǒng)計(jì)量正相關(guān)程度越高越保守。盡管如此,由于該法簡(jiǎn)單,其應(yīng)用最為廣泛,而且其思想為許多方法所借鑒,如后述的Holm法、Hochberg法、回退法等。(2)前瞻性分配法。前瞻性分配法(PAAS)與Bonferroni法思想相近,可理解為各個(gè)假設(shè)檢驗(yàn)的互余的乘積等于FWER水平a的互余,即(1-1)(1-2)(1-i)(1-m)=(1-)各i可以相同也可以不同,若相同,則可根據(jù)idák法求得i=1-(1-)1/m例如,一個(gè)有3個(gè)終
27、點(diǎn)的臨床試驗(yàn),其中兩個(gè)終點(diǎn)被指定分配了i值,1=0.02、2=0.025,若設(shè)為0.05,則根據(jù)上式有0.98×0.975×(1-3)=0.95,求得第3個(gè)終點(diǎn)的3為0.0057。如果采用Bonferroni法,則第3個(gè)終點(diǎn)的值為0.005??梢?jiàn)PAAS法分配的3要高于Bonferroi法。如果3個(gè)原假設(shè)的i等權(quán)重分配,則基于idák法求得i為0.01695,略高于Bonferroni法分配的0.0167。因此,PAAS法較Bonferroni法可略微增加檢驗(yàn)效能。2. 序貫策略的多重性調(diào)整方法(1)Holm法。Holm法是一種基于Bonferroni法的檢驗(yàn)統(tǒng)計(jì)
28、量逐步減?。╬值逐步增大)的多重調(diào)整方法,又稱向下法。該法首先計(jì)算出各檢驗(yàn)假設(shè)的p值后,將各p值按從小到大排序,記為p1<p2<<pm,其相對(duì)應(yīng)的原假設(shè)為H01,H02,H0m,然后按照p值從小到大順序依次與相對(duì)應(yīng)的i進(jìn)行比較,依次檢驗(yàn)H0i,1im。第一步從最小的p值開(kāi)始,檢驗(yàn)原假設(shè)H01,如果p1>1(=/m),則不拒絕原假設(shè)H01,并停止檢驗(yàn)所有剩余的假設(shè);如果p1<1,則拒絕H01,HA1成立,進(jìn)入下一個(gè)檢驗(yàn)。第2個(gè)檢驗(yàn)的名義水準(zhǔn)2=/(m-1),將該檢驗(yàn)的p值與2比較,若p2>2,則停止檢驗(yàn)余下的假設(shè);否則,HA2成立,并進(jìn)入下一個(gè)檢驗(yàn)。更一般地,
29、在檢驗(yàn)第i個(gè)原假設(shè)H0i時(shí),如果pi>ai(=a/(mi+1),則停止檢驗(yàn)并接受H0k,H0m;否則,拒絕H0i(接受HAi),并進(jìn)入下一個(gè)檢驗(yàn)。(2)Hochberg法。Hochberg法是一種基于Bonferroni法的檢驗(yàn)統(tǒng)計(jì)量逐步增大(p值逐步減?。┑亩嘀卣{(diào)整方法,又稱向上法。該法首先計(jì)算出各檢驗(yàn)假設(shè)的p值,將各p值按從小到大排序,記為p1<p2<<pm,然后按照p值從大到小順序依次與相對(duì)應(yīng)的i進(jìn)行比較。第一步從最大的p值開(kāi)始,檢驗(yàn)原假設(shè)H0m,如果pm<,則拒絕所有原假設(shè),并停止檢驗(yàn),所有的備擇假設(shè)HAi成立;否則不拒絕H0m,進(jìn)入下一步檢驗(yàn)。第2個(gè)檢驗(yàn)
30、的名義水準(zhǔn)m-1=/2,將該檢驗(yàn)的p值與m-1比較,若pm-1</2,則停止檢驗(yàn)余下的假設(shè),除HAm外,其余的備擇假設(shè)均成立;否則,不拒絕H0(m-1),并進(jìn)入下一個(gè)檢驗(yàn)。第3個(gè)檢驗(yàn)的名義水準(zhǔn)m-2=/3將該檢驗(yàn)的p值與m-2比較,若pm-2</3,則停止檢驗(yàn)余下的假設(shè),除HAm和HA(m-1)外,其余的備擇假設(shè)均成立;否則,不拒絕H0(m-2),并進(jìn)入下一個(gè)檢驗(yàn)。余類推。需要注意,Hochberg法在滿足終點(diǎn)變量獨(dú)立或檢驗(yàn)統(tǒng)計(jì)量正相關(guān)條件才能實(shí)現(xiàn)FWER強(qiáng)控制。(3)回退法?;赝朔ㄊ枪潭樞虿呗灾械囊环N多重性調(diào)整方法。對(duì)于固定順序策略不做多重性調(diào)整的情況,由于固定順序的限制,一旦
31、前一個(gè)檢驗(yàn)結(jié)果不顯著,后續(xù)的其它檢驗(yàn)將終止,這種策略可能失去發(fā)現(xiàn)有意義的研究假設(shè)的機(jī)會(huì)。例如,一項(xiàng)設(shè)有2個(gè)主要終點(diǎn)的臨床試驗(yàn),采用固定順序策略(O1®O2),為0.05。如果兩個(gè)終點(diǎn)的檢驗(yàn)結(jié)果分別是p1=0.062,p2=0.005,那么決策的結(jié)論是兩個(gè)終點(diǎn)均無(wú)效,因?yàn)榈?個(gè)檢驗(yàn)的結(jié)果不顯著,未能進(jìn)行到第2個(gè)檢驗(yàn),喪失了發(fā)現(xiàn)對(duì)第2個(gè)終點(diǎn)獲益的機(jī)會(huì)?;赝朔ㄐ枋孪雀鶕?jù)固定順序策略對(duì)各假設(shè)排序,并采用Bonferroni法確定每個(gè)檢驗(yàn)的i,然后依順序進(jìn)行檢驗(yàn)。該法首先在1水平檢驗(yàn)H01,如果拒絕H01,則在1+2水平檢驗(yàn)H02;如果不拒絕H01,則在2水平檢驗(yàn)H02,余類推。該法具有兩個(gè)特
32、點(diǎn),一是在前一個(gè)原假設(shè)未被拒絕時(shí),仍可繼續(xù)后續(xù)的檢驗(yàn),例如上例,采用回退法,對(duì)應(yīng)O1和O2的名義水準(zhǔn)分別是0.04和0.01,最終的決策結(jié)論為試驗(yàn)藥物對(duì)第2個(gè)主要終點(diǎn)O2有顯著獲益;二是如果前一個(gè)檢驗(yàn)顯著,其對(duì)應(yīng)的i可以疊加到下一個(gè)檢驗(yàn)的名義水準(zhǔn),體現(xiàn)了i的傳遞思想。例如,假設(shè)對(duì)應(yīng)O1和O2的名義水準(zhǔn)分別是0.04和0.01,如果對(duì)O1的假設(shè)檢驗(yàn)顯著(1=0.04),則對(duì)O2的檢驗(yàn)水準(zhǔn)為0.05(=0.01+0.04),即把前一次檢驗(yàn)顯著的名義水準(zhǔn)傳遞給了下一次檢驗(yàn)。對(duì)于固定順序策略是否采用多重性調(diào)整各有利弊,需權(quán)衡之。3. 期中分析常見(jiàn)的分割方法期中分析較經(jīng)典的分割方法有Pocock法、OB
33、rien-Fleming法和Haybittle-Peto法。這三種分割方法的一個(gè)共同前提是每一次期中分析的間隔和樣本量相同,只是每次假設(shè)檢驗(yàn)i的分配有不同側(cè)重。更為靈活的分割方法則是消耗函數(shù),如Lan-DeMets 消耗函數(shù),該方法是上述經(jīng)典方法的擴(kuò)展,它不要求期中分析間隔樣本量相等,在設(shè)定期中分析時(shí)間點(diǎn)上更為靈活。例如,一項(xiàng)評(píng)價(jià)免疫靶點(diǎn)抑制劑抗腫瘤藥物的確證性臨床試驗(yàn),主要評(píng)價(jià)指標(biāo)為全因死亡,擬進(jìn)行一次期中分析,可基于有效性早期終止試驗(yàn)??紤]到免疫靶點(diǎn)抑制劑起效時(shí)間可能存在延遲,因此計(jì)劃在研究相對(duì)較晚的時(shí)間點(diǎn),即觀察到75%的死亡事件時(shí),開(kāi)展期中分析。采用近似OBrien Fleming邊界
34、的Lan-Demets 消耗函數(shù),且要求雙側(cè)FWER控制在0.05,則期中分析和最終分析的雙側(cè)名義檢驗(yàn)水準(zhǔn)分別為0.019和0.044。(三)多重性分析方法對(duì)于需要解決的多重性問(wèn)題,多數(shù)是基于具體的統(tǒng)計(jì)檢驗(yàn)方法結(jié)合多重性調(diào)整方法來(lái)實(shí)現(xiàn)的。例如,對(duì)于不同數(shù)據(jù)類型的多個(gè)終點(diǎn)(如定量、定性、生存時(shí)間),組間比較會(huì)用到不同的統(tǒng)計(jì)分析方法(如協(xié)方差分析、M-H c2檢驗(yàn)、Kaplan-Meier檢驗(yàn)),與此同時(shí),還要依靠多個(gè)終點(diǎn)的多重性調(diào)整方法(如Bonferroni法等)來(lái)確定每個(gè)假設(shè)檢驗(yàn)的檢驗(yàn)水準(zhǔn)i,然后才能做出決策結(jié)論。對(duì)于單一終點(diǎn)變量、同一研究階段的多組比較,有些統(tǒng)計(jì)分析方法是在整體檢驗(yàn)的基礎(chǔ)上
35、解決多重比較的問(wèn)題,其根本思想是兩兩比較所涉及的標(biāo)準(zhǔn)誤是整體檢驗(yàn)的標(biāo)準(zhǔn)誤,由此達(dá)到控制FWER的目的。例如,定量結(jié)局變量基于方差分析的兩兩比較有LSD法、SNK(Student-Neuman-Keuls)法、Scheffe法、Tukey法、Levy法、Ryan法、Duncan法,等等,多組與參照組的比較有Dunnett法、Dunnett-SNK法、Dunnett-Levy法等;定性結(jié)局變量的多重比較可通過(guò)變量變換(如反正弦變換)成為定量變量,然后采用上述定量變量的分析方法;生存時(shí)間結(jié)局變量基于Kaplan-Meier法的log rank檢驗(yàn)(Mantel-Cox法)、Breslow法(擴(kuò)展Wi
36、lcoxon法)、Tarone-Ware法等。上述方法可通過(guò)專業(yè)統(tǒng)計(jì)軟件實(shí)現(xiàn)。對(duì)于在整體檢驗(yàn)的基礎(chǔ)上無(wú)法實(shí)現(xiàn)多重比較的統(tǒng)計(jì)分析方法,就需要采用局部檢驗(yàn)(兩兩比較)結(jié)合a分配的方法(如Bonferroni法等)。多變量的參數(shù)方法(如多元方差分析)是解決多重性問(wèn)題的手段之一,特別是對(duì)于多終點(diǎn)的情況,但是此類方法一則要求滿足多元正態(tài)分布,二則分析結(jié)果的解釋往往不直觀,限制了其應(yīng)用。重復(fù)抽樣(如bootstrap法和permutation法)也是解決多重性問(wèn)題的手段之一,此類方法的優(yōu)點(diǎn)是在控制FWER的同時(shí)還能保證較高的檢驗(yàn)效能;其不足之處在于它所基于的經(jīng)驗(yàn)分布難以驗(yàn)證從而導(dǎo)致估計(jì)的準(zhǔn)確性不足,此外它
37、更依賴于大樣本。因此,該類方法在臨床試驗(yàn)中少有實(shí)踐,需慎重使用。由于解決多重性問(wèn)題的統(tǒng)計(jì)分析方法眾多,每種方法都有其優(yōu)勢(shì)與不足,申辦方需要在臨床試驗(yàn)方案或統(tǒng)計(jì)分析計(jì)劃中事先規(guī)定針對(duì)多重性問(wèn)題所采用的統(tǒng)計(jì)分析方法。(四)多重性問(wèn)題的基本解決思路臨床試驗(yàn)的多重性問(wèn)題較為普遍而且復(fù)雜,解決這一問(wèn)題的基本思路如圖4所示。首先,根據(jù)研究目的和試驗(yàn)方案,梳理出可能的多重性問(wèn)題。其次,判斷哪些多重性問(wèn)題需要多重性調(diào)整,哪些不需要。之后,進(jìn)入多重性調(diào)整過(guò)程。先判斷是做一次整體決策還是分階段做若干次整體決策(如基于有效性決策的期中分析),對(duì)某一個(gè)整體決策而言可采用平行策略、序貫策略或平行+序貫策略,最后根據(jù)所選
38、策略確定每一個(gè)檢驗(yàn)假設(shè)(局部決策)所對(duì)應(yīng)的統(tǒng)計(jì)分析方法和名義水準(zhǔn)i的分配策略(如需要)。圖4 多重性問(wèn)題的基本解決思路五、其它考慮(一)不需要調(diào)整的多重性問(wèn)題不需要調(diào)整的多重性問(wèn)題包括但不限于以下情形(均不包含有效性的期中分析):1. 針對(duì)單一主要終點(diǎn)的非劣效試驗(yàn)的標(biāo)準(zhǔn)三臂設(shè)計(jì),所有假設(shè)檢驗(yàn)結(jié)果均顯著才被視為有效;2. 針對(duì)單一主要終點(diǎn),研究假設(shè)為試驗(yàn)藥物的療效至少非劣于陽(yáng)性對(duì)照藥,即檢驗(yàn)假設(shè)為固定順序,第一步驗(yàn)證試驗(yàn)藥物的療效非劣于陽(yáng)性對(duì)照藥的假設(shè),第二步驗(yàn)證試驗(yàn)藥物的療效優(yōu)于陽(yáng)性對(duì)照藥的假設(shè)(在第一步假設(shè)被拒絕后),每一步的檢驗(yàn)水準(zhǔn)與FWER水平相同;3. 針對(duì)多個(gè)主要終點(diǎn),當(dāng)且僅當(dāng)所有終
39、點(diǎn)的假設(shè)檢驗(yàn)結(jié)果均顯著才被視為有效;4. 針對(duì)多個(gè)均不以說(shuō)明書聲稱的獲益為目的的次要終點(diǎn);5. 有效性和安全性評(píng)價(jià)應(yīng)分別獨(dú)立控制FWER,兩者間無(wú)需調(diào)整;6. 對(duì)于籃式設(shè)計(jì)、傘式設(shè)計(jì)、平臺(tái)設(shè)計(jì)等跨研究的復(fù)雜設(shè)計(jì),如果分題研究多是獨(dú)立的研究且回答各自的臨床問(wèn)題,如適用疾病、目標(biāo)人群等;7. 在統(tǒng)計(jì)分析過(guò)程中,對(duì)同一主要終點(diǎn)指標(biāo),可能會(huì)對(duì)不同的分析數(shù)據(jù)集進(jìn)行分析,只要事先定義以哪個(gè)分析數(shù)據(jù)集為主要結(jié)論依據(jù);8. 采用不同的統(tǒng)計(jì)模型或同一模型采用不同的參數(shù)設(shè)置,只要事先定義主分析模型;9. 根據(jù)不同的假設(shè)進(jìn)行敏感性分析,例如采用不同的缺失數(shù)據(jù)估計(jì)方法填補(bǔ)后的分析,對(duì)離群值采用不同處理后的分析等。(二
40、)多重性檢驗(yàn)的參數(shù)估計(jì)問(wèn)題多重性調(diào)整的假設(shè)檢驗(yàn)方法眾多,有的方法較為復(fù)雜,可能難以做出相應(yīng)的區(qū)間估計(jì),此時(shí)應(yīng)該考慮采用較為簡(jiǎn)單但是相對(duì)保守的方法進(jìn)行區(qū)間估計(jì),例如采用Bonferroni方法調(diào)整置信區(qū)間。多重性調(diào)整還有可能帶來(lái)點(diǎn)估計(jì)的選擇性偏倚。例如,在含有多個(gè)劑量組的確證性臨床試驗(yàn)中,如果多重性問(wèn)題的決策策略選擇了在藥物說(shuō)明書中標(biāo)示與安慰劑差異最大的劑量組的效應(yīng)量,則有可能高估藥物的療效。類似的選擇性偏倚也會(huì)因亞組的選擇而產(chǎn)生。因此,有必要評(píng)估多重性調(diào)整可能帶來(lái)的選擇性偏倚。(三)與監(jiān)管機(jī)構(gòu)的溝通在臨床試驗(yàn)方案和統(tǒng)計(jì)分析計(jì)劃中應(yīng)事先明確多重性問(wèn)題和多重性調(diào)整的策略和方法。對(duì)于復(fù)雜的多重性問(wèn)題
41、,是否需要多重性調(diào)整以及如何調(diào)整,現(xiàn)有的策略和方法可能面臨挑戰(zhàn),因此鼓勵(lì)申辦方在確證性臨床試驗(yàn)設(shè)計(jì)階段積極與監(jiān)管機(jī)構(gòu)溝通,以求雙方能夠達(dá)成共識(shí)。在試驗(yàn)過(guò)程中,如果因?yàn)楦亩嘀匦哉{(diào)整策略和方法而使臨床試驗(yàn)方案做出重大調(diào)整,應(yīng)與監(jiān)管機(jī)構(gòu)充分溝通,在征得同意的情況下對(duì)方案進(jìn)行修改和備案。六、參考文獻(xiàn)1. CDE. 非劣效設(shè)計(jì)臨床試驗(yàn)指導(dǎo)原則2. CDE. 臨床試驗(yàn)數(shù)據(jù)監(jiān)查委員會(huì)指導(dǎo)原則(征求意見(jiàn)稿)3. CDE. 藥物臨床試驗(yàn)適應(yīng)性設(shè)計(jì)指導(dǎo)原則(征求意見(jiàn)稿)4. CDE. 藥物臨床試驗(yàn)的富集策略與設(shè)計(jì)指導(dǎo)原則(征求意見(jiàn)稿)5. CDE. 藥物臨床試驗(yàn)亞組分析的指導(dǎo)原則(征求意見(jiàn)稿)6. ICH E9
42、(臨床試驗(yàn)的統(tǒng)計(jì)學(xué)指導(dǎo)原則)7. ICH E8(臨床研究的一般注意事項(xiàng))8. ICH E17(多地區(qū)臨床試驗(yàn)計(jì)劃與設(shè)計(jì)總體原則)9. 錢俊,陳平雁. Bootstrap和Permutation方法在樣本率多重比較中的應(yīng)用. 中國(guó)醫(yī)院統(tǒng)計(jì),2008;15(1):43-45.10. 錢俊,陳平雁. 多個(gè)樣本率的多重比較. 中國(guó)衛(wèi)生統(tǒng)計(jì),2008;25(2):206-212.11. 錢俊,陳平雁. 樣本率多重比較方法的模擬研究. 中國(guó)衛(wèi)生統(tǒng)計(jì),2009;26(2):131-134.12. Bretz F, Tamhane AC, Pinheiro J, et al. Multiple Testing
43、 in Dose-Response Problem, Chapter 3 of Multiplicity Testing Problem in Pharmaceutical Statistics. CRC Press, 2010.13. Chen J, Luo JF, Liu K, et al. On power and sample size computation for multiple testing procedures. Computational Statistics and Data Analysis, 2011; 55: 110-122.14. Collignon O, Ch
44、ristian Gartner C, Haidich AB, et al. Current statistical considerations and regulatory perspectives on the planning of confirmatory basket umbrella and platform trial. Clinical Pharmacology & Therapeutics, 2020; doi:10.1002/cpt.1804.15. Dmitrienko A, Tamhane AC, Bretz F, et al. Multiple Testing
45、 Methodology, Chapter 2 of Multiplicity Testing Problem in Pharmaceutical Statistics. CRC Press, 2010.16. Dmitrienko A, Tamhane AC, Bretz F, et al. Gatekeeping Procedures in Clinical Trials, Chapter 5 of Multiplicity Testing Problem in Pharmaceutical Statistics. CRC Press, 2010.17. EMA. Guidance on
46、Multiplicity Issues in Clinical Trials.18. FDA. Multiple Endpoints in Clinical Trials Guidance for the Industry.19. Hochberg Y, Tamhane A. Multiplicity Comparison Procedure. New York: Wiley, 1987.20. Huque MF, Rohmel J. Multiplicity Problem in Clinical Trials, Chapter 1 of Multiplicity Testing Probl
47、em in Pharmaceutical Statistics. CRC Press, 2010.21. Lan KKG, DeMets DL. Discrete sequential boundaries for clinical trials. Biometrika, 1983; 70: 659-663.22. OBrien PC, Fleming TR. A multiple testing procedure for clinical trials. Biometrics, 1979; 35: 549-556.23. Peto R, Pike MC, Armitage P, et al
48、. Design and analysis of randomized clinical trials requiring prolonged observations of each patient, I. Introduction and design. British Journal of cancer, 1976; 34: 585-612.24. Pocock SJ. Group sequential methods in the design and analysis of clinical trials. Biornetrika, 1997; 64:191-199.25. Sen.
49、 Some remark on Simes-type multiple tests of significance. Journal of statistical Planning and Inference, 1991; 82:139-145.26. Wang DL, Li YH, Wang X, et al. Overview of multiple testing methodology and recent development in clinical trials. Contemporary Clinical Trials, 2015; 45: 13-20.附錄1:詞匯表I類錯(cuò)誤(
50、Type I Error):指原假設(shè)(或稱無(wú)效假設(shè))正確但檢驗(yàn)結(jié)果拒絕了原假設(shè)的錯(cuò)誤,相當(dāng)于把實(shí)際上無(wú)效的藥物經(jīng)統(tǒng)計(jì)推斷得出有效結(jié)論的錯(cuò)誤,其概率需控制在某一水平,該水平稱為檢驗(yàn)水準(zhǔn),或稱顯著性水準(zhǔn),習(xí)慣用a表示。II類錯(cuò)誤(Type II Error):指原假設(shè)不正確,但檢驗(yàn)結(jié)果未能拒絕原假設(shè)的錯(cuò)誤,相當(dāng)于把實(shí)際上有效的藥物經(jīng)統(tǒng)計(jì)推斷得出無(wú)效結(jié)論的錯(cuò)誤。消耗函數(shù)( Spending Function):當(dāng)某個(gè)臨床研究分若干階段進(jìn)行整體決策時(shí)(如基于有效性或無(wú)效性所做的期中分析),每個(gè)階段都要消耗一定的,隨著研究進(jìn)展,研究所完成的比例(如1/3、1/2、60%等)與累積的I類錯(cuò)誤率呈現(xiàn)某種函數(shù)關(guān)系,如下圖所示。Bonferroni法(Bonferroni Method):Bonferroni法的基本思想是各個(gè)獨(dú)立檢驗(yàn)的名義水準(zhǔn)之和等于FWER水平a,即a1+a2+ai+am=a(m是獨(dú)立檢驗(yàn)的個(gè)數(shù))各名義水準(zhǔn)可以相同(ai=a/m
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版礦區(qū)作業(yè)承包合同版
- 2024芒果園果樹病蟲害防治產(chǎn)品供應(yīng)與技術(shù)服務(wù)合同3篇
- 2024煤炭供需長(zhǎng)期合作協(xié)議
- 2025年度智能物流設(shè)備代理商合作協(xié)議(全新發(fā)布)4篇
- 2024-2030年中國(guó)城市地下綜合管廊建設(shè)市場(chǎng)現(xiàn)狀研究分析與發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 單晶氮化鋁項(xiàng)目商業(yè)計(jì)劃書
- 2025年度個(gè)人二手房買賣合同房屋租賃權(quán)轉(zhuǎn)讓與限制4篇
- 2025年度個(gè)人留置車輛借款合同(二手車市場(chǎng)交易版)3篇
- 2025年環(huán)保項(xiàng)目合作協(xié)議范本(含碳排放權(quán)交易)3篇
- 2025年度個(gè)人教育培訓(xùn)機(jī)構(gòu)連帶擔(dān)保協(xié)議4篇
- 電商運(yùn)營(yíng)管理制度
- 二零二五年度一手房購(gòu)房協(xié)議書(共有產(chǎn)權(quán)房購(gòu)房協(xié)議)3篇
- 2025年上半年上半年重慶三峽融資擔(dān)保集團(tuán)股份限公司招聘6人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 城市公共交通運(yùn)營(yíng)協(xié)議
- 內(nèi)燃副司機(jī)晉升司機(jī)理論知識(shí)考試題及答案
- 2024北京東城初二(上)期末語(yǔ)文試卷及答案
- 2024設(shè)計(jì)院與職工勞動(dòng)合同書樣本
- 2024年貴州公務(wù)員考試申論試題(B卷)
- 電工高級(jí)工練習(xí)題庫(kù)(附參考答案)
- 村里干零工協(xié)議書
- 2024年高考八省聯(lián)考地理適應(yīng)性試卷附答案解析
評(píng)論
0/150
提交評(píng)論