樣本含量的估計_第1頁
樣本含量的估計_第2頁
樣本含量的估計_第3頁
樣本含量的估計_第4頁
樣本含量的估計_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十八章樣本含量估計無論是調(diào)查研究還是實驗性研究,醫(yī)學(xué)研究大都是抽樣研究,最終目的在于利用實際觀測得到的樣本信息推斷未知的總體特征,即統(tǒng)計推斷。抽樣研究設(shè)計時需要回答一個非常關(guān)鍵的問題:樣本中包含多少個研究對象(人、動物、生物學(xué)材料等)才能既滿足統(tǒng)計學(xué)要求,完成有效的統(tǒng)計推斷,又照顧研究的可行性、倫理學(xué)等實際問題,從而最大限度控制研究成本和研究風(fēng)險,提高研究效率。這就是樣本含量估計(estimation of sample size)本章將從統(tǒng)計推斷的目的出發(fā),介紹樣本含量估計意義及常用的計算公式,并在此基礎(chǔ)上介紹檢驗效能的估計(power analysis)。第一節(jié) 樣本含量估計的意義及方法

2、一、樣本含量估計的意義由于抽樣研究中抽樣誤差不可避免,樣本統(tǒng)計量與其所對應(yīng)的總體參數(shù)間總是存在一定差異。因此, 盡量減小抽樣誤差是提高統(tǒng)計推斷精度的必然要求。在總體變異性確定的條件下,樣本中所含的研究對象數(shù)越多,抽樣誤差必然越小,樣本統(tǒng)計量的穩(wěn)定性肯定越高,總體參數(shù)的估計精度越好,假設(shè)檢驗中的檢驗效能 (power=1- )亦會越高,從而避免出現(xiàn)假陰性的結(jié)論。同時在實驗性研究中,只有在研究對象數(shù)量足夠大時才能使隨機(jī)分組更加有效,從而保證組間均衡性。但在實際研究中,除了要考慮抽樣誤差外,還需考慮研究的可行性、結(jié)論的時效性、 醫(yī)學(xué)倫理以及非隨機(jī)誤差的影響等實際問題,并非研究對象數(shù)越多越好。比如在改

3、良肩周炎貼膏臨床試驗中,如果片面地追求大樣本,研究中所需的人力、物力、財力等物質(zhì)支持必然增大,研究的可行性下降。由于需納入更多病例,可能會延長產(chǎn)品研發(fā)周期,影響新藥投產(chǎn)上市;若增加醫(yī)院或臨床實驗中心參與該研究, 又增加了組織協(xié)調(diào)的工作量和工作難度。同時增加各種混雜、偏倚發(fā)生的機(jī)會,比如由于肩周炎發(fā)病、預(yù)后與季節(jié)、氣候密切相關(guān),臨床病例接收時間太長,組內(nèi)病例同質(zhì)性差;測量儀器增多導(dǎo)致測量誤差增大,觀察療效的醫(yī)院、醫(yī)生增多, 研究結(jié)果的一致性降低等現(xiàn)實問題,使得試驗結(jié)果難于分析或者難以合理解釋, 影響研究結(jié)論的科學(xué)性。另外, 由于所施加干預(yù)措施可能存在的不良事件反應(yīng)尚屬未知,讓過多的臨床病例面臨風(fēng)

4、險,亦有悖醫(yī)學(xué)倫理原則。因此, 恰當(dāng)?shù)臉颖竞繎?yīng)該是滿足醫(yī)學(xué)科研統(tǒng)計學(xué)要求,保證一定推斷精度和檢驗效能的前提下的最少研究對象數(shù)。二、樣本含量估計的方法樣本含量的估計方法目前主要有兩種:一是公式法,可根據(jù)研究目的、設(shè)計類型、已知條件等選擇合適的公式進(jìn)行估算,是目前使用最廣泛的方法。二是查表法,統(tǒng)計學(xué)家利用公式法獲得樣本含量后編制成工具表,使用者只需根據(jù)已知條件查表即可獲得相應(yīng)的樣本含量,省去了繁雜的計算過程,但較為局限。本章 將主要介紹公式法樣本含量的估計。第二節(jié) 調(diào)查設(shè)計中樣本含量估計調(diào)查研究的目的在于描述健康相關(guān)狀態(tài)、事件在研究當(dāng)時某特定群體中的分布,并在此基礎(chǔ)上通過不同群體分布的比較,探索

5、可能的關(guān)聯(lián)或影響因素。但其主要目的仍在于描述分布,如考察某地菜農(nóng)鉤蟲感染率、醫(yī)學(xué)生的吸煙率、某地 健康男性居民血紅蛋白的含量等。 若研究方式為抽樣研究,便需要利用已知的樣 本信息推斷總體參數(shù),如總體均數(shù)、總體率的估計等。因此本節(jié)將根據(jù)所估 計的參數(shù)不同,介紹樣本含量估計的基本條件, 及總體均數(shù)、總體率估計中的樣 本含量估計方法。一、樣本含量估計的基本條件采用公式計算樣本含量,必須有一些先決條件和基本信息,下面以例18.1為例簡單介紹總體參數(shù)估計中樣本含量估計的基本條件。例18.1擬采用單純隨機(jī)抽樣的方法調(diào)查某地區(qū)男性成年人群血紅蛋白含量(g/L)的平均水平。根據(jù)文獻(xiàn),中國男性成人血紅蛋白含量為

6、(140 60)g/L,要求所獲得允許誤差不超過 5g/L,取 0.05,問需要調(diào)查多少位該地區(qū)成年男 性?此研究為調(diào)查研究,目的在于利用抽樣獲得的樣本均數(shù) X估計該地區(qū)成年 男性血紅蛋白含量(g/L)的總體均數(shù)。假定該地區(qū)成年男性血紅蛋白含量 X服從 正態(tài)分布,以文獻(xiàn)中中國男性成人的血紅蛋白含量信息進(jìn)行替代 (140g/L ,30g/L),則該地區(qū)成年男性的血紅蛋白含量 XN(140, 302)。題意要求允許誤差不超過5g/L, =0.05,可解釋為樣本均數(shù)X與總體均數(shù)之間的差距( X)不超過5g/L,且X落在135145g/L之間的概率為1- =0.95。由于總體服從正態(tài)分布,樣本均數(shù)的分

7、布亦服從正態(tài)分布,當(dāng)抽樣方 式為單純隨機(jī)抽樣,且總體為無限總體時,標(biāo)準(zhǔn)誤 X/Jn, X的分布記為X N( ,2) o可用圖18.1表示。圖18.1樣本均數(shù)的抽樣分布示意圖0,15jflTk結(jié)合圖18.1,根據(jù)正態(tài)分布的原理可得:(18.1)Z /2上式反推即可獲得單純隨機(jī)抽樣研究中總體均數(shù)估計中的樣本含量公式:(18.2)式中,為總體標(biāo)準(zhǔn)差;為允許誤差;Z /2為標(biāo)準(zhǔn)正態(tài)分布下雙尾Z值如例 18.1 中 =30 g/L,=5 g/L, Z /2 Z0.05/2 1.96 ,代入式(18.2)得:2138.31.96 305所以至少需要調(diào)查139人才能達(dá)到所要求的精度。由公式(18.2)可知,

8、在總體服從正態(tài)分布且為無限總體、抽樣方式為單純隨 機(jī)抽樣的前提下,其所需基本信息包括:1 .置信度1- 置信度越高,需要的樣本含量越大,常取 =0.05。2 .允許誤差(allowable error)是指研究者要求的樣本統(tǒng)計量與其對應(yīng)的總 體參數(shù)之間的最大差距,其既可以用絕對誤差 ( X 或 |p |),也可以用相對誤差 來表示,其中 X ,或 |p 1/ ,則絕對誤差或。根據(jù)前面章節(jié)置信區(qū)間的估計,即區(qū)間長度的一半。允許誤差越小, 所需樣本含量越大3 .總體變異度常用總體標(biāo)準(zhǔn)差刻畫,總體率估計中的 總體的變異程度越高,所需樣本含量越大。二、單純隨機(jī)抽樣的樣本含量估計(一)估計總體均數(shù)時的樣

9、本含量估計調(diào)查研究中利用抽樣獲得的樣本均數(shù) X估計總體均數(shù)。例18.1即為估計總體均數(shù)時的樣本含量估計,這里不再贅述。需指出的是,式(18.2)適用于無限總體抽樣時的樣本含量估計,對個體數(shù)為N的有限總體中進(jìn)行單純隨機(jī)抽樣時,nc需在式(18.2)計算出樣本含量n的基礎(chǔ)上利用式(18.3)進(jìn)行校正:(18.3)若抽樣比n/N很小,如小于0.05或0.1,這種校正可省略。同時,實際工作中總體標(biāo)準(zhǔn)差常常未知,可首先通過小規(guī)模預(yù)調(diào)查獲得的樣本標(biāo)準(zhǔn)差S估計。此時,若繼續(xù)采用式(18.2)估計樣本含量,往往造成樣本 量的低估,尤其當(dāng)樣本量較小時,實際上難以達(dá)到總體均數(shù)估計的精度要求。需用式(18.4)進(jìn)行

10、校正: 2t/2 Sn一(18.4)式(18.4)中t /2表示自由度 n 1時t分布界值,在估計出樣本含量前其未 知,可先用Z 計算出初步的樣本含量na),并以自由度V(1) 口1獲得t?,, 代入式(18.3),求出更近似的n,依次類推,直至樣本例數(shù)穩(wěn)定。但在實際應(yīng)用 中,如果樣本估計量較大(如n 50),為方便起見可無需校正。如例18.1中,若根據(jù)前期預(yù)調(diào)查得該地血紅蛋白含量標(biāo)準(zhǔn)差=30g/L,其余條件不變,問需要調(diào)查多少該地區(qū)居民?根據(jù)Z /2計算出的初步樣本含量 “1)=139 , t0.05/2,138 1.9773,帶入式(18.4)得:n(2)21.9773 30140.7 1

11、41以門二,t0.05/2,140 1.9771,代入式(18.4)得門 140.7 141, 口-,可停止計算。故至少需要調(diào)查141位成年男性。(二)估計總體率時的樣本含量估計調(diào)查研究中常需利用抽樣獲得的樣本率 p估計總體率,由第十章的學(xué)習(xí)可 知,當(dāng)n較大, 和1均不太小,如n和n(1)均大于5時,樣本率p的分布亦近似服從正態(tài)分布,記為 PN( , p),其中p Q1 而,同樣根據(jù) 正態(tài)分布原理,由式(18.1)反推可得: 2n Z-2(1 )(18.5)式中, 為總體率,其它符號含義同前總體率未知時,可取=50% ,以使(1)達(dá)到最大,算得樣本含量也最大,從而保證總體率推斷的精確性。例18

12、.2研究某地菜農(nóng)鉤蟲感染率,要求允許誤差不超過2%,取 0.05,需調(diào)查多少人?0.05 , Z /2 = Z0.05/2 = 1.96,=2%=0.02??傮w率未知,取 =0.50代入式(18.5)得:1.960.020.5 (1 0.5) 2401式(18.5)同樣僅適用于無限總體抽樣的樣本含量估計,對有限總體進(jìn)行抽樣時,仍需按式(18.3)進(jìn)行校正。同時,當(dāng)總體率 接近0或1時,如 >70%或<30%,應(yīng)用式(18.5)會有偏 差,此時可對 作以弧度為單位的平方根反正弦變換,再利用正態(tài)分布原理獲得樣本含量的估計公式:2(18.6)arcsin( 、, (1)57.3Z /2止

13、匕外,亦可使用基于Poisson分布的正態(tài)近似樣本含量估計等,讀者可根據(jù) 上述理論自行推導(dǎo),或參考其它書籍,這里不再贅述。三、其它概率抽樣方法的樣本含量估計概率抽樣方法不同,樣本含量估計方法各異。對系統(tǒng)抽樣而言,抽樣間隔不同,其抽樣誤差也不同,故系統(tǒng)抽樣尚無統(tǒng)一的方法估計樣本含量。 但如果研究 的變量與總體中個體的編號無確定的上升、 下降或周期性變化的關(guān)系,系統(tǒng)抽樣 的抽樣誤差應(yīng)小于單純隨機(jī)抽樣,可參照單純隨機(jī)抽樣所計算的樣本含量。這里簡單介紹分層隨機(jī)抽樣和整群抽樣中樣本含量的估計。(一)分層隨機(jī)抽樣樣本含量的估計抽樣方式為分層抽樣研究中,若總體為無限總體,可在估計各層總體參數(shù)i2 或i基礎(chǔ)上

14、,以各層例數(shù)在總體中所占比例 w為權(quán)重進(jìn)行加權(quán)平均,獲得總體方差(2i2W()或總體率( i W(),再按式(18.2)或式(18.5)估計調(diào)查總例數(shù)。若總體為有限總體,設(shè)總體例數(shù)為方差為i2(總體率的估計中2 i(1N,共有L層,每層例數(shù)為Ni,各層總體 i),則調(diào)查總例數(shù)的估計公式為:(18.7),余符號同前。若按比例分/Ni i o得到總的樣本例22Ni i Wi222N ( Z 2)2 2Ni i式中wi為各層樣本比例(sample fraction),即w n/n配,則wiNi/NWi ;若進(jìn)行最優(yōu)分配,wiNi數(shù)n后,各層樣本量為ni nwi。(二)整群隨機(jī)抽樣樣本含量的估計整群抽

15、樣中,由于群內(nèi)個體的相似性和群間個體的異質(zhì)性,使得整群抽樣獲得的方差往往大于單純隨機(jī)抽樣的方差。若定義整群抽樣中計算的方差與單純隨 機(jī)抽樣中方差比值為設(shè)計效率 DEFF(design effect),其估計公式為:DEFF 1 (m 1)式中m為各群平均個體數(shù);為群內(nèi)相關(guān)系數(shù)(intra-cluster correlation, ICC),即群問方差2與總方差b W2的比值(B/( BW;),反映群內(nèi)個體的相似程度,其未知時,可通過預(yù)調(diào)查進(jìn)行估計。整群隨機(jī)抽樣樣本含量nC的計算,首先按單純隨機(jī)抽樣計算樣本含量n,再乘以整群抽樣的設(shè)計效應(yīng),則:(18.8)nC n DEFF所需群數(shù)G n/m第三

16、節(jié) 實驗研究中的樣本含量估計實驗研究的目的主要在于通過不同干預(yù)措施或?qū)嶒灄l件效應(yīng)指標(biāo)(均數(shù)或率)的比較, 說明處理因素的作用,如研究方式為抽樣研究,比較的過程即為假設(shè)檢驗。需要特別指出的是不僅在實驗研究中存在比較的過程,在調(diào)查設(shè)計中為了探索可能的影響因素,以及流行病學(xué)中的病例對照研究、隊列研究也需要進(jìn)行比較,即也存在假設(shè)檢驗的問題。因此本節(jié)將從假設(shè)檢驗中不同變量類型及設(shè)計形式出發(fā),介紹樣本含量估計條件和估計方法。一、樣本含量估計的基本條件假設(shè)檢驗中樣本含量的估計公式在不同情況下雖有所不同,但其基本思想大同小異,估計的基本條件也大致相同。這里以例18.3為例介紹估計的基本條件。例 18.3 欲研

17、究海拔對血紅蛋白的影響,擬在某高原地區(qū)對健康成年男性進(jìn)行抽樣調(diào)查,以確定高原地區(qū)成年男性的血紅蛋白是否高于一般成年男性。已知一般正常成年男子血紅蛋白為(140±30)g/L, 根據(jù)醫(yī)學(xué)專業(yè)知識,當(dāng)血紅蛋白含量相差至少在10g/L 以上時, 可認(rèn)為二者存在差異。取單側(cè)= 0.05, 1-= 0.90,問應(yīng)對多少名高原地區(qū)健康成年男性進(jìn)行檢查?若血紅蛋白服從正態(tài)分布,此研究目的在于若高原成年男性血紅蛋白總體均數(shù) 與一般成年男性人群總體均數(shù)0 =140g/L 之間的差別在 10g/L 及以上, 且總體標(biāo)準(zhǔn)差30 g/L ,則利用抽樣研究獲得的高原地區(qū)成年男性血紅蛋白樣本信息發(fā)現(xiàn)這種差異,并

18、保證發(fā)現(xiàn)所存在差異的能力(即檢驗效能)1-= 0.90。通過前面章節(jié)學(xué)習(xí)不難發(fā)現(xiàn),此時需進(jìn)行單樣本設(shè)計均數(shù)比較的假設(shè)檢驗:H0 :0 140 g/L (高原地區(qū)成年男性血紅蛋白均數(shù)與一般正常成年男子相同 )H1 :0150 g/L (高原地區(qū)成年男性血紅蛋白均數(shù)比一般正常成年男子高 10 g/L)注意: 這里 的 H 1 :1 不同于 前面章 節(jié)建 立假 設(shè)時 備擇假 設(shè)的 寫法H1 :0,后者未給出的具體數(shù)值。所以前面有關(guān)章節(jié)介紹過的假設(shè)檢驗,不能估計犯第二類錯誤的概率和檢驗效能1-。例 18.3 中,由于總體服從正態(tài)分布,樣本均數(shù)的分布亦服從正態(tài)分布,標(biāo)準(zhǔn)誤X/jn ,在Ho規(guī)定的總體中X

19、N( 0, X2),在Hi規(guī)定的總體中抽樣,樣本均數(shù)XN( 0,2),可用圖18.2表示。圖18.2 假設(shè)檢驗中樣本均數(shù)的分布示意圖從圖18.2可見,在H0成立的正態(tài)分布中,在特定的檢驗水準(zhǔn)下,臨界點c(圖18.2中的圓點)的坐標(biāo)為:c 0 Z /百。進(jìn)一步考慮控制第二類錯誤時, 假設(shè)真正的總體分布位置為圖中 H1所對應(yīng)白0,那么當(dāng)H1分布c點坐標(biāo)左側(cè)面積為 時,可同時控制此假設(shè)檢驗的效能為1-,即c ( 0) Z / Vn ,從而有:0 Z . n (0) Z/A(18.9)推導(dǎo)可得:2 (Z Z ) n (18.10)這樣得到的樣本量估計就同時控制了假設(shè)檢驗的第一類錯誤和第二類錯誤(即檢驗

20、效能為1-)。式18.10中, 為總體標(biāo)準(zhǔn)差,為總體均數(shù)間差異,Z為指定檢驗水準(zhǔn)下的單側(cè)Z值,若為雙側(cè)檢驗應(yīng)改為Z ;2,Z為指II型錯誤下的單側(cè)Z值。需要注意的是,公式18.10中的 根據(jù)無效假設(shè)有單雙側(cè)之分,而 只有單 側(cè)。因為確定必須考慮無效假設(shè)H0不成立時真正的總體分布位置,而此時真正的總體分布位置只會在0的左邊或右邊(0在左邊,0在右邊),兩者只能居其一,不可能既在左邊又在右邊。例 18.3 中 =30 g/L,=10g/L, ZZ0.05 1.65, ZZ0.10 1.28,代入(1.65 1.28) 3077.3 78式(18.10"10所以至少需要調(diào)查78人。由公式(

21、18.10)可知,在假設(shè)檢驗樣本含量估計中,所需基本信息包括:1 . I型錯誤概率即假設(shè)檢驗中的檢驗水準(zhǔn),愈小,所需樣本含量愈多。對于相同的 ,雙側(cè)檢驗比單側(cè)檢驗所需樣本含量多。通常取0.05。2 . II型錯誤概率或檢驗效能(1 ) II型錯誤的概率愈小,檢驗效能愈大,所需樣本含量愈多。一般要求檢驗效能 >0.80 通常取0.20或0.10。3 .欲比較的兩總體參數(shù)間的實際差異 如兩總體均數(shù)的差值 1 2|,兩總體率的差值| 12。 愈大,所需樣本含量愈小。4 .總體變異度比較均數(shù)時需了解總體標(biāo)準(zhǔn)差,比較頻率時需了解總體概率1和2??傮w的變異度愈高,所需樣本含量愈多。二、均數(shù)比較中的樣

22、本含量估計(一)單樣本設(shè)計均數(shù)比較的樣本含量估計例18.3即為單樣本設(shè)計均數(shù)比較的樣本含量估計的情形,這里不再贅述。 當(dāng)總體標(biāo)準(zhǔn)差 未知時,可用樣本標(biāo)準(zhǔn)差S代替。此時,以t分布中對應(yīng)的t和t 界值代替Z和Z ,式(18.10)就轉(zhuǎn)換為:2(t t )Sn (18.11)但n求出之前,自由度未知,t和t查不出,可首先利用Z計算出初步的樣本 含量n。),并以自由度%)%) 1獲得t ,,代入式(18.11),求出更近似的n,依次類推,直至樣本例數(shù)穩(wěn)定。(二)配對設(shè)計均數(shù)比較的樣本含量估計配對設(shè)計假設(shè)檢驗的目的在于通過樣本信息考察配對數(shù)據(jù)差值的總體均數(shù)d與0之間的差異,與上述單樣本設(shè)計均數(shù)的比較并無

23、本質(zhì)區(qū)別,其樣本含量計算公式只要將式(18.10)中 改為d即可,單側(cè)檢驗時即:(18.12)(Z Z ) d例18.4欲研究某藥對四氧喀噬糖尿病模型小鼠的降血糖作用。假設(shè)該藥使空腹血糖下降2.0mmol/L及以上有專業(yè)意義,若d =1.7mmol/L, 取單側(cè)0.05,檢驗效能1-取0.90,需要多大的樣本含量?本例的研究目的在于通過某藥治療四氧喀噬糖尿病模型小鼠前后血糖的動 態(tài)變化(差值)來說明藥物的療效,治療前、治療后血糖值間存在關(guān)聯(lián),可看成是 配對設(shè)計,或關(guān)聯(lián)樣本。根據(jù)題意 d =1.70mmol/L,=2.0mmol/L,=0.05, Z0.05 =1.65;=0.10,乙.10=1

24、.28,代入式(18.12)得:、22n (Z Z ) d (1.65 1.28) 1.762“2.0.故需7只四氧喀噬糖尿病模型小鼠。(三)獨立兩樣本設(shè)計均數(shù)比較的樣本含量估計獨立兩樣本設(shè)計指的是相對于配對設(shè)計(或關(guān)聯(lián)樣本)而言,兩樣本中的個體 測量值彼此獨立,沒有關(guān)聯(lián)。常見于實驗性研究中的完全隨機(jī)設(shè)計樣本, 及觀察 性研究中分別獨立從兩個總體抽樣獲得的樣本。獨立兩樣本設(shè)計均數(shù)比較的假設(shè)檢驗中 H0: 12,也:12進(jìn)一步可改寫為H0: 12 0, Hi: 12 0,即通過樣本均數(shù)的差值考察兩總體均數(shù)差值與0之間的差異。此時,若兩總體均服從正態(tài)分布,且總體方差齊,樣本均數(shù)差值的分布記為Xi

25、X2 N 12, 2( ),定義樣本比例Qi 必/N,n1 n2Q21/N ,不難推導(dǎo)兩組總例數(shù) N的計算公式為:2(Z /2 Z )11N Q1 1 Q2 1(18.13)式中、Z /2、Z含義同前,nNQi , n2 NQ2。例18.5欲采用完全隨機(jī)設(shè)計比較 A藥與B藥對改善貧血的效果,據(jù)以往經(jīng)驗,A藥可增加紅細(xì)胞1 1012/L , B藥可增加紅細(xì)胞2 1012/L。若1.8 1012/L,取雙側(cè)0.05,0.20,每組例數(shù)相等,問需要多少病例?若A藥組樣本含量占整個樣本含量的60%,每組各需多少病例?已知 1.8 1012/L,=(2 1) 1012/L=1 1012/L , Z /2

26、 = Z0.05/2 =1.96,Z =Z0.20=0.84。代入式(18.13):z (1.96 0.84) 1.8 1012小廣 1 八廣1、N 12 (0.50.5 ) 101.61 1012即兩組例數(shù)相等時,共需病例102例,每組51例。(2)若要求A藥組樣本占整個樣本含量的60%,即Q1 0.6 , Q2 1 Q1 0.4 ,則代入式(18.13):(1.96 0.84) 1.8 10121 1012(0.60.4 ) 105.8即兩組病例共需106例,其中A藥組nNQ1 106 0.6 64例;B藥組 n2 NQ2 106 0.4 42例。從上述計算可以看出,在其它條件不變的情況下

27、, 若兩組樣本含量的比例相同,所需的樣本含量最少。當(dāng)總體標(biāo)準(zhǔn)差未知時,可用兩樣本合并方差的平方根,或兩樣本標(biāo)準(zhǔn)差中較大的一個進(jìn)行估計。同時以 匕2和1界值代替公式(18.13)中的Z ,2和Z 。、率比較中的樣本含量估計(一)單樣本設(shè)計率比較的樣本含量估計根據(jù)二項分布正態(tài)近似原理,單樣本設(shè)計率比較的樣本含量估計過程與單樣本設(shè)計均數(shù)的比較基本類似,唯一的區(qū)別在于由于標(biāo)準(zhǔn)誤°的計算與 有關(guān)。p則在Ho規(guī)定的總體中pN ( 0, 0(10)/n),在Hi規(guī)定的總體中pN( , (1)/n)0單側(cè)檢驗時,樣本含量的公式為:(18.14)Z . o(1例18.6已知靜脈滴注抗生素治療盆腔炎模型

28、兔的有效率為50%,現(xiàn)欲研究腹腔穿刺灌注法的效果是否優(yōu)于靜脈滴注,預(yù)計腹腔穿刺灌注法的有效率為80%。若取單側(cè)=0.05,檢驗效能1 取0.80,問需多少只盆腔炎模型兔?0.80 0.50=0.30。Z005=1.65, Z020=0.84,代 .本例,0=0.50,=0.80,入式(18.14)得: 215.01.65 . 0.50 (1 0.50) 0.840.80 (1 0.80)030故至少需15只盆腔炎模型兔。(二)配對設(shè)計樣本率比較的樣本含量估計表18.1配對設(shè)計四格表甲乙+ 合一計+/2一/12合計1111由表18.1可見,配對設(shè)計率1、 2的比較可通過考察配對的甲、乙兩種處理措

29、施不一致率/和/的差別實現(xiàn)。若已知甲、乙兩種措施陽性率分別為12 ,兩種方法均陽性率為/ ,則/1/ ,/2/ ,雙側(cè)檢驗時樣本含量的估計公式為:(18.15)z , 2- z ,2n2n 1 22 , 式中,/ 丁 /-2-余符號意義同前。22分別采用例18.7欲比較心電圖和生化測定法診斷低鉀血癥陽性率的差別,兩種方法對同一批臨床確診的低鉀血癥患者進(jìn)行檢查,已知心電圖法的陽性率為80%,生化法陽性率為65%,兩法均陽性率為50%。若取雙側(cè)0.05,檢驗效能10.80,問需檢查多少低鉀血癥患者?表18.2 例18.7配對設(shè)計四格表生化法+合計一+/0.50/2/0.152 0.65一/1/0.

30、30/0.0512 0.35合計1 0.8011 0.201根據(jù)題意,Z005;2 1.96, Z Z0200.84,.0.80 0.65 2 0.500.225,代入式(18.15)得: 21.96 -.2 0.225 0.8420.80 0.500.65 0.50 /0.225n 0.80 0.65151.5 152故至少需檢查152名低鉀血癥患者。(三)獨立兩樣本設(shè)計率比較的樣本含量估計獨立兩樣本設(shè)計率比較的假設(shè)檢驗中,若定義兩組樣本比例Q15/N ,Q2n2 / N,貝H 0 : 12 ,且設(shè) 12 cQ1 1Q2 2 ; H 1 : 120 ,雙側(cè)檢驗兩組總例數(shù)N的計算公式為: 2(

31、18.16)(18.17)Z /2 , c(1c)(Q11Q212若兩組樣本例數(shù)相等,則每組的例數(shù)為:Z /2 2 c(1c) Z 1(11)2(12)例18.8欲比較上頜竇竇口擴(kuò)大術(shù)與上頜竇竇口開放術(shù)治療真菌性上頜竇炎模型兔的療效。根據(jù)文獻(xiàn),上頜竇竇口擴(kuò)大術(shù)有效率為83%,上頜竇竇口開放 術(shù)有效率為33%。若取雙側(cè) =0.05, 3=0.20,兩組例數(shù)相等,問每組需多少只 真菌性上頜竇炎模型兔?根據(jù)題意,Z /2 = Z0.05/2=1.96, z =Z0.20=0.84o1=0.83,2=0.33, Q=0.50,Q2=0.50,c 0.83 0.50 0.33 0.50 0.58,代入式

32、(18.17)得:z ? .2"1J z ,T(1 1)21 2)2n1n2 21.96 2 0.58 (1 0.58) 0.84,0.83(1 0.83) 0.33(1 0.33) 20.83 0.3314.05 15故每組需15只真菌性上頜竇炎模型兔。)Z . 1(11)Q12(12) Q2四、簡單直線相關(guān)和回歸分析中樣本含量估計抽樣研究中,兩正態(tài)分布定量變量間的關(guān)聯(lián)性可通過假設(shè)檢驗考察總體直線相關(guān)系數(shù) 與0之間的差別來說明。其檢驗假設(shè)為 H0:0, Hi:0,同時樣本相關(guān)系數(shù)r經(jīng)z轉(zhuǎn)換(z 0.5ln()后近似地服從均數(shù)為-ln(1 1 r21差為-JL=的正態(tài)分布,則直線相關(guān)

33、分析中的樣本含量公式推導(dǎo)為: n 32Z /2 Z n 4 1 3(18.18)ln(1)1 式中,為總體相關(guān)系數(shù),余符號含義同前。對于兩正態(tài)分布定量變量間的直線相關(guān)分析和回歸分析的假設(shè)檢驗是等價 的,因此直線回歸分析與相關(guān)分析的樣本含量估計公式也是一致的。例18.9欲探討男性腰圍與腹腔內(nèi)脂肪面積的關(guān)系, 根據(jù)以往調(diào)查結(jié)果,兩0.10,問需測量多少男性?者間的直線相關(guān)系數(shù)=0.75,取雙側(cè)0.05,由題意可知 Z /2 Z0.05/2 = 1.96, ZZ0.10=1.28,=0.75,代入式(18.18)得:1.96 1.28ln(1 0.753 14.1 151 0.75即需要15個觀察對

34、象。第四節(jié) 樣本含量估計中的注意事項樣本含量估計是抽樣研究設(shè)計階段的一個關(guān)鍵問題,是根據(jù)分析目的、已知條件(抽樣方法、設(shè)計方法、總體特征信息等)及推斷精度或檢驗效能的要求,利 用樣本統(tǒng)計量與其所對應(yīng)總體參數(shù)之間的關(guān)系, 一般在正態(tài)分布基礎(chǔ)上,進(jìn)行數(shù) 學(xué)推導(dǎo)的過程,在具體計算過程中應(yīng)注意以下一些問題。(一)正確理解和應(yīng)用樣本含量估計公式。樣本含量估計公式有嚴(yán)格的應(yīng)用 條件,包括研究目的、研究設(shè)計類型、抽樣方法、總體分布特征以及數(shù)據(jù)類型等。 在使用時應(yīng)具體分析,選擇合適的計算公式。同時,前面對于樣本含量估計公式 的介紹只是研究中最基本、最簡單的情況,主要在于讓大家理解樣本含量估計的 意義和基本思想

35、。理論上,只要存在樣本統(tǒng)計量的抽樣誤差計算公式, 其必然與 樣本含量n有關(guān),即可在以一定分布理論基礎(chǔ)上,根據(jù)分析目的和已知條件,獲 得樣本含量n的估計公式。比如在多重線性回歸、logistic回歸、Cox回歸分析等,其分析目的在于確定自變量對應(yīng)變量的影響作用,可通過假設(shè)檢驗考察偏回歸系數(shù)i是否等于0實現(xiàn),因此亦可采用假設(shè)檢驗中樣本含量估計的方法進(jìn)行樣本含量估計,大家可參閱相關(guān)文獻(xiàn),但由于其計算過于繁雜,一般均通過軟件進(jìn)行估計。(二)樣本含量估計的基本參數(shù)信息獲得方式。抽樣研究中,有關(guān)總體特征的指標(biāo)(如總體標(biāo)準(zhǔn)差 、總體率、總體相關(guān)系數(shù) 、總體參數(shù)間的差異 等)一般是未知的,具獲得常見兩種途徑:

36、根據(jù)既往文獻(xiàn)提供的信息進(jìn)行估計;通過正式研究前進(jìn)行的小規(guī)模預(yù)調(diào)查或預(yù)實驗獲得的樣本信息進(jìn)行估計,此時需以t分布中對應(yīng)的t (單側(cè)檢驗時,雙側(cè)檢驗時為t)和t界值代替公 式中的Z (或Z .;2)和Z(三)多指標(biāo)時樣本含量的估計。前述的樣本含量估計都是基于單指標(biāo),當(dāng) 效應(yīng)指標(biāo)涉及多個時,其最佳的處理方法是基于指標(biāo)聯(lián)合分布的分析方法獲得相 應(yīng)的估計公式。如在多個定量變量比較中,其假設(shè)檢驗方法多用Hotelling 'TS檢驗或MANOVA等,相關(guān)估計方法可參閱相關(guān)文獻(xiàn)。止匕外,也可通過在多指標(biāo) 中確定一個主要指標(biāo)進(jìn)行粗略估計,或分別根據(jù)各指標(biāo)進(jìn)行計算,取樣本含量最 大者作為保守估計。(四)

37、樣本含量的調(diào)整。應(yīng)用上述公式估計出的樣本含量是滿足統(tǒng)計學(xué)要求 的最小樣本含量或有效樣本含量。 若直接以此作為最終研究對象數(shù),由于各種原 因(如調(diào)查研究、回顧性研究中缺失值、無效訪問等,前瞻性研究中對象的退出、 失訪、意外死亡、剔除等),造成實際上樣本量不足。因此,設(shè)計時必須對此情 況予以充分考慮,對通過樣本含量估計公式獲得的樣本數(shù) n予以校正。比如在臨 床試驗中,其校正公式為nc=n/(1 R R1)2, R和R分別表示試驗組退出試驗和對照組接受試驗藥物的比例也有研究者為簡便起見,在樣本含量公式估計值基礎(chǔ)上增加20%, 作為研究設(shè)計的樣本含量。(五 ) 樣本含量估計的軟件。樣本含量的估計過程是

38、利用給定條件進(jìn)行數(shù)學(xué)運算的過程,其計算公式較為繁雜,不過目前已經(jīng)有相關(guān)的軟件完成相應(yīng)的計算,如專門用于樣本含量及檢驗效能估計的PASS、 G*Power、 PC-Size、 PS、 NQueryAdvisor,以及在SAS、Stata中一些相關(guān)過程等。第五節(jié) 檢驗效能的估計一、檢驗效能估計的意義檢驗效能是指假設(shè)檢驗中Ho實際上不成立,而檢驗結(jié)果亦拒絕 H。、發(fā)現(xiàn)其差異的概率,用1 表示。差異性假設(shè)檢驗中即為總體間差異客觀存在時,通過樣本信息發(fā)現(xiàn)這種差異的能力。由前述樣本含量估計可知,為了使假設(shè)檢驗的結(jié)果足夠可靠,在研究設(shè)計時通過事先設(shè)定檢驗效能并據(jù)此來估計所需樣本量,檢驗效能越高,所需的樣本量

39、就越大。不難推理,除個別假設(shè)檢驗(如正態(tài)性檢驗、方差齊性檢驗、擬合優(yōu)度檢驗等)外,對于任何一個基于抽樣的研究,如果檢驗結(jié)果P ,則需要進(jìn)一步估計檢驗效能,以判斷樣本量是否足夠,結(jié)論是否為假陰性。但實際研究中,總體參數(shù)未知,檢驗效能是不可估計的。此時,若根據(jù)已知的樣本量n 及其它樣本信息,在既定的檢驗水準(zhǔn)下,推算檢驗效能1 ,是一種假設(shè)檢驗后利用樣本信息估計檢驗效能的方法,即所謂的觀察檢驗效能(observed power),也稱為回顧性檢驗效能(retrospective power),并以此作為理論檢驗效能的估計值。一般情況下,要求檢驗效能應(yīng)高于80%;當(dāng)檢驗效能低于75%時,則認(rèn)為結(jié)果不可靠。二、檢驗效能估計的方法樣本含量估計與檢驗效能估計方法的理論基礎(chǔ)其實是一致的,只不過分析目的和已知條

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論