版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
17/17臨床試驗中樣本量確定的統(tǒng)計學考慮樣本量確定(samplesizedetermination),又稱樣本量估計(samplesizeestimation),是指為滿足統(tǒng)計的準確性和可靠性(I類錯誤的控制和檢驗效能的保證)計算出所需的樣本量,它是臨床試驗設(shè)計中一個極為重要的環(huán)節(jié),直接關(guān)系到研究結(jié)論的可靠性、可重復性,以及研究效率的高低。樣本量估計也是一個成本-效果和檢驗效能的權(quán)衡過程。ICHE9(1998)指出,臨床試驗的樣本量必須足夠大,以可靠地回答研究假設(shè)所提出的相關(guān)問題;同時又不至于太大而造成浪費。樣本量的估計方法應(yīng)該在研究方案中詳細闡述,包括計算樣本量所依據(jù)的參數(shù),如方差、均數(shù)、反應(yīng)率、陽性事件發(fā)生率、差值等。本文適用于確證性試驗。
樣本量估計需考慮的主要因素
在確定臨床研究的目的之后,首先考慮試驗設(shè)計,包括對照的選擇(如標準對照、陽性對照、安慰劑對照、劑量對照等)、比較類型(如優(yōu)效性試驗、非劣效性試驗、等效性試驗)、設(shè)計類型(如平行設(shè)計、交叉設(shè)計、析因設(shè)計、成組序貫設(shè)計等)、主要指標(定量、定性、生存時間)等;其次考慮統(tǒng)計分析方法,并提出效應(yīng)量(effectsize)的假定;然后根據(jù)試驗特點定義統(tǒng)計特征,如統(tǒng)計分布、檢驗水準(significantlevel)、檢驗效能(power)、單雙側(cè)和分配比例等;再應(yīng)用正確的樣本量估計方法計算出樣本量;最后根據(jù)協(xié)變量、試驗中的脫落率、剔除率和依從性等具體情況進行適當調(diào)整。
1.研究目的與試驗設(shè)計
(1)研究目的
就臨床試驗而言,在確證性研究中研究目的主要體現(xiàn)在有效性評價和安全性評價兩個方面。樣本量估計常用于有效性評價。
(2)比較類型及其檢驗假設(shè)臨床試驗常用的比較類型有優(yōu)效性試驗(superioritytrial)、等效性試驗(包括生物等效性試驗)(equivalencetrial)、非劣效性試驗(non-inferioritytrial)等。下面以兩組效應(yīng)量為均數(shù)的正向指標比較為例,設(shè)定優(yōu)效、等效和非劣效的界值為Δ,說明它們的檢驗假設(shè)與推斷結(jié)論。
優(yōu)效性試驗:試驗的目的是驗證試驗組效應(yīng)是否優(yōu)于對照組,如果研究不設(shè)定優(yōu)效界值,其檢驗假設(shè)為:
此時,若P≤α,則可推斷試驗組療效優(yōu)于對照組。等效性試驗:試驗的目的是驗證試驗組效應(yīng)是否與對照組相當。如果研究設(shè)定等效界值Δ,其檢驗假設(shè)為:
非劣性試驗:試驗的目的是驗證試驗組效應(yīng)是否非劣于對照組。如果研究設(shè)定非劣效界值Δ,其檢驗假設(shè)為:
H0:μT-μC≤-Δ;
H1:μT-μC>-Δ。
此時,若P≤α,則可推斷試驗組療效非劣于對照組。
(3)設(shè)計類型
臨床試驗的設(shè)計模型相對比較簡單,常用的有平行設(shè)計、交叉設(shè)計、析因設(shè)計、序貫設(shè)計、群隨機設(shè)計和適應(yīng)性設(shè)計等。有關(guān)這些設(shè)計的詳細介紹可參考相關(guān)文獻。
2.主要指標
臨床試驗的樣本量通常依據(jù)對主要指標做出相應(yīng)的假定后進行估計的。在II、III期臨床試驗中主要指標一般是有效性評價指標,上市后的IV期臨床試驗主要指標可以是有效性評價指標,也可以是安全性評價指標,或兼而有之。如果樣本量估計應(yīng)同時依據(jù)主要有效性指標和主要安全性指標,在設(shè)計時應(yīng)針對有效性和安全性分別提出統(tǒng)計假設(shè),逐一計算樣本量,最終樣本量取其中最大者。主要指標應(yīng)在研究方案中明確定義,通常需根據(jù)專業(yè)知識確定,應(yīng)是專業(yè)領(lǐng)域具有共識的或認可程度較高的指標,一般源于某一標準或指南,或源于專業(yè)領(lǐng)域公開發(fā)表的權(quán)威論著或?qū)<夜沧R等。主要指標不宜太多,一般只有一個。當主要指標有多個時,樣本量估計要考慮假設(shè)檢驗的多重性問題。
在定義主要指標過程中,不僅要說明指標的含義,其測量時點、測量手段以及計算方法都應(yīng)注明。指標的類型要明確,這一點非常重要,因為樣本量估計和數(shù)據(jù)分析都需要依此進行。例如,某些指標可以有定量、定性(如有效和無效)、等級(如痊愈、顯效、有效、無效)、生存時間等不同類型。對應(yīng)于指標的不同類型,樣本量估計方法亦不相同。所以,方案中對主要指標的定義要具體到指標類型上。
3.效應(yīng)量
效應(yīng)量是樣本量估計所需的最重要參數(shù)之一,根據(jù)不同的指標類型,常見的效應(yīng)量有:均數(shù)的組間差值或標準化差值,率的組間差值或比值(RR、HR)、OR,或相關(guān)系數(shù)、回歸系數(shù)等。效應(yīng)量參數(shù)的確定主要基于下述三種途徑:
(1)本項目的任何既往研究結(jié)果。即源于同一項目的預試驗、探索性試驗(I期或II期臨床試驗)、單中心試驗的結(jié)果等作為確定參數(shù)的依據(jù)。由于此類研究結(jié)果屬于內(nèi)部證據(jù),因此是首選途徑。
(2)基于他人的研究結(jié)果。當本項目的先前研究無法提供確切的參數(shù)數(shù)據(jù),或尚未開展研究時,參數(shù)的確定可以以公開發(fā)表的研究結(jié)果作為依據(jù)。由于此類研究結(jié)果屬外部證據(jù),因此是次選途徑。若公開發(fā)表的同類研究報道不止一個,最好是經(jīng)meta分析所得合并效應(yīng)量作為樣本量估計的參數(shù)。
(3)基于本試驗的預期結(jié)果。如果本試驗沒有任何之前的研究結(jié)果可以借鑒(無論是自己的還是他人的),或以往的研究數(shù)據(jù)不能得到本試驗設(shè)計所需的參數(shù)(如本試驗采用交叉設(shè)計,而以往研究數(shù)據(jù)均來自兩平行組設(shè)計的研究),可以用預期的形式進行預設(shè),通常以廣義效應(yīng)量表達。若對試驗藥物或器械有充足信心,則預期效應(yīng)量較大(如設(shè)為0.8),此時所需樣本量較小。若對試驗藥物或器械信心不足,則預期效應(yīng)量較小(如設(shè)為0.2),此時所需樣本量較大。若對試驗藥物或器械的信心尚可,則預期效應(yīng)量為中等水平(如設(shè)為0.5),此時所需樣本量也是中等大小。
此外,對于單臂設(shè)計或配對雙臂設(shè)計,若涉及標準對照參數(shù)(或目標值)的確定,其途徑的優(yōu)先順序大致為國際標準、國家標準、行業(yè)標準(含指南等)、被權(quán)威機構(gòu)認可的企業(yè)標準、外部證據(jù)(同類研究的綜合結(jié)果,如meta分析結(jié)果)。
4.統(tǒng)計特征
樣本量估計需要考慮的統(tǒng)計特征主要有統(tǒng)計分布、檢驗水準、檢驗效能、單雙側(cè)和平衡與否等。
統(tǒng)計分布:樣本量估計方法的選擇與主要指標的統(tǒng)計分布假定密切相關(guān),基于正態(tài)分布的假定會選擇參數(shù)方法,基于非正態(tài)分布的假定會選擇非參數(shù)方法。同樣,生存分析的樣本量估計方法會因Weibull分布族的假定有所不同。
檢驗水準:檢驗水準也就是I類錯誤概率,用α表示,以雙側(cè)0.05的水準最為常用。對于優(yōu)效性檢驗設(shè)定單側(cè)α=0.025的情形,以及等效性或非劣效性檢驗設(shè)定雙單側(cè)的α=0.025的情形,其本質(zhì)仍然是雙側(cè)0.05的檢驗水準。但在某些情況下檢驗水準的設(shè)定會有所不同。例如,為控制整體I類錯誤概率α,涉及多重檢驗時(如定義多個主要指標),每次檢驗的名義檢驗水準α*將小于或等于α;涉及期中分析時,考慮α消耗,每次檢驗的α*將小于α。此外,對于生物等效性檢驗,習慣取雙側(cè)α為0.1。
檢驗效能:用1-β表示,β代表II類錯誤概率。檢驗效能是指在設(shè)定的α基礎(chǔ)上,原假設(shè)H0為假且檢驗結(jié)果拒絕了H0的概率。檢驗效能越高,發(fā)現(xiàn)差別的可能性越大,但同時所需樣本量也越大。臨床試驗中,檢驗效能通常不得低于80%。在樣本量估計過程中,可通過對檢驗效能的敏感性分析提供不同的樣本量方案,供研究人員選擇。
單側(cè)和雙側(cè)檢驗:單側(cè)檢驗的樣本量會明顯小于雙側(cè)檢驗的樣本量。一般而言,醫(yī)學研究領(lǐng)域的統(tǒng)計檢驗約定俗成地使用雙側(cè)檢驗,如果采用單側(cè)檢驗,需要給出充足的理由。需要指出,對于一般意義的檢驗水準0.05而言,如果取單側(cè)水準為0.025的話,其實質(zhì)仍然是雙側(cè)0.05水平。
平衡或非平衡設(shè)計:所謂平衡設(shè)計,即每組的樣本量相同。在其他條件不變時,各組樣本量相同時平衡設(shè)計效率最高,即試驗所需總樣本量最小。因此,研究設(shè)計應(yīng)盡可能采用平衡設(shè)計。非平衡設(shè)計是指比較組間的樣本量有明顯差別,習慣上這種差別成倍數(shù)關(guān)系,例如,新藥III期臨床試驗,因為安慰劑對照的療效相對可以確定,同時出于倫理考慮,安慰劑對照組的樣本量會安排的少一些,而試驗組的樣本量相對要大一些,比如是對照組的2倍或3倍。
樣本量估計原理和方法
1.樣本量估計原理
樣本量估計的方法通常是從檢驗統(tǒng)計量計算公式反推而來。一般地,統(tǒng)計推斷的效應(yīng)量可認為是給定模型參數(shù)θ的函數(shù)f(θ),用T表示f(θ)的一個無偏估計統(tǒng)計量,若數(shù)據(jù)來自正態(tài)分布,或根據(jù)中心極限定理,有:
基于t分布,則檢驗統(tǒng)計量服從非中心t分布,通過迭代計算可求出樣本量,即:
當統(tǒng)計量T=logHR時,我們同樣可以先求出Var(T),然后代入公式(4)中計算樣本量,此時所得樣本量計算公式可拆解成一個關(guān)于所需陽性事件數(shù)(numberofevents)與個體發(fā)生陽性事件概率的表達式,這也是目前最常用的方法。
2.樣本量估計方法
樣本量估計方法,即樣本量的計算公式,應(yīng)根據(jù)研究背景、研究假設(shè)、設(shè)計模型、主要評價指標的數(shù)據(jù)特征等做出正確選擇。由于樣本量計算公式繁多,本文不做詳細介紹,讀者可參考《中國衛(wèi)生統(tǒng)計》2012年至2014年連續(xù)刊發(fā)的“樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)”系列文章(共19篇)[9]。該系列文章以樣本量估計專業(yè)軟件nQueryAdvisor7.0為依據(jù),系統(tǒng)介紹常用的樣本量估計方法,給出計算公式及其權(quán)威出處,通過實例加以說明,同時還給出了SAS9.2軟件實現(xiàn)的程序,便于廣大讀者應(yīng)用。表1列出了常用的樣本量估計方法,可看作通過統(tǒng)計檢驗方法正確選擇樣本量估計方法的一個索引。
樣本量估計的其他考慮
1.樣本量的調(diào)整
根據(jù)統(tǒng)計學方法估計出的樣本量是在給定條件下滿足臨床試驗所需的最小樣本量。實際試驗過程中,由于病例的脫落和剔除、病例依從性差等原因,會導致可評價例數(shù)的減少。因此,需要在樣本量估計基礎(chǔ)上適度擴大樣本量,以保證最終的有效樣本量可以滿足最小樣本量的要求。從分析角度講,需保證最終的可評價樣本量(即符合方案數(shù)據(jù)集(per-protocolset)的例數(shù))應(yīng)大于經(jīng)樣本量估計方法求得的樣本量。樣本量調(diào)整通常會考慮不大于20%的脫落剔除率,具體的脫落剔除率如何確定,將視不同的研究項目而定,確定的依據(jù)主要來自專業(yè)方面的判斷,或經(jīng)由以往研究數(shù)據(jù)的meta分析為重要參考。
當亞組分析的結(jié)果是主要療效指標時,則應(yīng)保證最終的亞組可評價病例達到最小樣本量。臨床試驗結(jié)果可能受某些預后因素(協(xié)變量)的影響,如年齡、性別、病情程度等。樣本量估計時一般不考慮預后因素,主要是因為隨機分組可使各組間的協(xié)變量達到均衡。
2.樣本量再估計
樣本量再估計較多地用于適應(yīng)性設(shè)計。適應(yīng)性設(shè)計樣本量再估計常用的三種方法如下。
(1)成組序貫設(shè)計:每組的樣本量固定,每次期中分析的目的是對是否終止試驗(成功或失敗)或進入下一周期的試驗做出決策。
(2)固定期中分析:每次期中分析對參數(shù)重新進行估計,并據(jù)此對樣本量做出新的估計和調(diào)整,但不對檢驗假設(shè)進行檢驗。
(3)上述兩種方法的結(jié)合:每次期中分析既對參數(shù)重新進行估計,并據(jù)此對樣本量做出新的估計和調(diào)整;又對檢驗假設(shè)進行檢驗,以判斷是否終止試驗(成功或失敗)或進入下一周期的試驗。上述三種方法均屬于期中分析的樣本量估計問題,詳細過程可參閱文獻[9]。需要指出,基于期中分析的樣本量再估計應(yīng)盡可能地在盲態(tài)下進行。
臨床試驗方案中對樣本量估計的要求
在臨床試驗方案中,需要對樣本量估計進行清晰和完整的闡述,應(yīng)至少包含以下內(nèi)容:試驗的研究假設(shè),對照的類型,比較類型,設(shè)計模型,主要指標,將要用到的統(tǒng)計分析方法,參數(shù)(包括等效或非劣效界值)的來源以及依據(jù),檢驗水準(若涉及多重檢驗或期中分析,需解釋確定檢驗水準的依據(jù)),檢驗效能,單雙側(cè)檢驗,分配比例,樣本量估計方法及其出處(列參考文獻),所用軟件及其版本,樣本量調(diào)整及其依據(jù),各組以及各中心的樣本量分配(列表),若競爭入組需特別說明。
常見問題回答
Q1.樣本量估計有哪些專用軟件?
目前常用的樣本量估計軟件有nQueryAdvisor+nTerim,PASS,DSTPLAN,G*Power,PC-Size,PS,SASPowerandSampleSizeapplication(PSS),Stata,R。這些軟件中,nQuery和PASS是其中最常用的,它們涵蓋了幾乎所有的樣本量統(tǒng)計方法。下面對這些軟件做一簡要介紹。
nQueryAdvisor+nTerim:愛爾蘭StatisticalSolutions公司開發(fā)的商業(yè)軟件,由nQueryAdvisor7軟件加入nTerim模塊組成,前者原先是一獨立樣本量估計軟件,后者是專門用于期中分析的樣本量估計模塊。目前最新版本為3.0,運行于Windows平臺。該軟件同時得到美國FDA、歐洲藥品管理局、日本、韓國的官方認可,為世界制藥企業(yè)和生物技術(shù)公司50強中的49家所使用。內(nèi)容幾乎已經(jīng)涵蓋了樣本量計算的所有方面?!吨袊l(wèi)生統(tǒng)計》連載的系列文獻系統(tǒng)介紹了常用的樣本量估計方法[9],給出了計算公式及其出處,并附有樣本量估計專業(yè)軟件nQueryAdvisor7.0的操作主界面和樣本量估計中參數(shù)設(shè)置的界面,同時還給出了SAS9.2軟件實現(xiàn)的程序,便于廣大讀者應(yīng)用。
PASS:美國NCSS公司開發(fā),是一款運行在Windows平臺下的商業(yè)軟件,目前最新版本為13。類似于nQuery,它也覆蓋了幾乎所有的樣本量計算方法,其官方網(wǎng)站宣稱用到的統(tǒng)計方法已經(jīng)超過了230種。DSTPLAN:是一款運行在Windows環(huán)境下的免費軟件,其本身是基于Fortran語言構(gòu)造,由安德森癌癥中心開發(fā)。包括的統(tǒng)計分析方法有t檢驗、相關(guān)分析、率的比較、2×N的列聯(lián)表檢驗,以及生存分析的差異性檢驗。
G*Power:是一款在Windows以及MacOSX環(huán)境下運行的免費軟件,由德國杜塞爾多夫大學開發(fā)。包括的統(tǒng)計分析方法有t檢驗、One-wayANOVA、回歸分析、相關(guān)分析以及擬合優(yōu)度分析。該軟件在用戶輸入關(guān)鍵參數(shù)后就會立即給出效應(yīng)量。PC-Size:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年醫(yī)療設(shè)備維修合同
- 2025年倉儲租金費用合同
- 2025年家居和解協(xié)議書
- 2025年在線音樂電臺服務(wù)合約
- 2025年企業(yè)員工靈活用工管理服務(wù)合同
- 2025年分期付款游泳館會員購買合同
- 2025年度二零二五年度獼猴桃產(chǎn)業(yè)鏈金融服務(wù)平臺合作合同4篇
- 2025版小公司租車及車輛租賃售后服務(wù)合同2篇
- 二零二五版醫(yī)院康復病區(qū)承包服務(wù)協(xié)議2篇
- 二零二五年度木地板綠色環(huán)保材料采購合同4篇
- 項目績效和獎勵計劃
- 光伏自發(fā)自用項目年用電清單和消納計算表
- 量子計算在醫(yī)學圖像處理中的潛力
- 阿里商旅整體差旅解決方案
- 浙江天臺歷史文化名城保護規(guī)劃說明書
- 邏輯思維訓練500題
- 第八講 發(fā)展全過程人民民主PPT習概論2023優(yōu)化版教學課件
- 實體瘤療效評價標準RECIST-1.1版中文
- 企業(yè)新春茶話會PPT模板
- GB/T 19185-2008交流線路帶電作業(yè)安全距離計算方法
- DIC診治新進展課件
評論
0/150
提交評論