統(tǒng)計學-兩個率或多個率的比較[教育類別]_第1頁
統(tǒng)計學-兩個率或多個率的比較[教育類別]_第2頁
統(tǒng)計學-兩個率或多個率的比較[教育類別]_第3頁
統(tǒng)計學-兩個率或多個率的比較[教育類別]_第4頁
統(tǒng)計學-兩個率或多個率的比較[教育類別]_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、浙江大學流行病與衛(wèi)生統(tǒng)計學教研室浙江大學流行病與衛(wèi)生統(tǒng)計學教研室 李秀央李秀央 Email: 1 培訓類培訓類培訓類 率的抽樣誤差與可信區(qū)間率的抽樣誤差與可信區(qū)間 一、率的抽樣誤差與標準誤一、率的抽樣誤差與標準誤 二、總體率的可信區(qū)間二、總體率的可信區(qū)間 培訓類培訓類培訓類 一、一、 率的抽樣誤差與標準誤率的抽樣誤差與標準誤 樣本率樣本率(p)和總體率和總體率()的差異稱為率的的差異稱為率的抽抽 樣誤差樣誤差(sampling error of rate) ,用,用率的標率的標 準誤準誤(standard error of rate)度量。)度量。 n p )1( 如果總體率如果總體率未知,用

2、未知,用 樣本率樣本率p估計估計 n pp s p )1( 培訓類培訓類培訓類 標準誤的計算標準誤的計算 例例 5 5- -1 1 觀觀察察某某醫(yī)醫(yī)院院產(chǎn)產(chǎn)婦婦 106 人人,其其中中行行剖剖腹腹產(chǎn)產(chǎn)者者 62 人人, 剖剖腹腹產(chǎn)產(chǎn)率率為為 58.5%,試試估估計計剖剖腹腹產(chǎn)產(chǎn)率率的的標標準準誤誤。 解解:已已知知 n=106,p=0.585,其其標標準準誤誤為為: %8 . 4048. 0 106 )585. 01 (585. 0)1 ( n pp S p 培訓類培訓類培訓類 二、二、 總體率的可信區(qū)間總體率的可信區(qū)間 總體率的可信區(qū)間總體率的可信區(qū)間 (confidence interva

3、l of rate):根據(jù)樣本率推算總體率可能所在的范圍根據(jù)樣本率推算總體率可能所在的范圍 培訓類培訓類培訓類 率的統(tǒng)計學推斷率的統(tǒng)計學推斷 一、樣本率與總體率比較一、樣本率與總體率比較u u檢驗檢驗 二、兩個樣本率的比較二、兩個樣本率的比較u u檢驗檢驗 培訓類培訓類培訓類 一、樣本率與總體率比較的一、樣本率與總體率比較的u u檢驗檢驗 u u檢驗的條件:檢驗的條件:n p 和n(1- p)均大于5時 例例55,-地中海貧血基因攜帶率:山區(qū)地中海貧血基因攜帶率:山區(qū)p=12/125=0.096, n=125;本省一般成人;本省一般成人0 0=0.076, H0:= =0 0=0.076 =0

4、.076 H1:0 0 =0.05=0.05。 按按=0.05=0.05 水準,不拒絕水準,不拒絕H0,即不能認為,即不能認為該山區(qū)與本省一般該山區(qū)與本省一般 成人的成人的-地中海貧血基因攜帶率有差異。地中海貧血基因攜帶率有差異。 )1( 00 00 n pp u p 844.0 125 )076.01(076.0 076.0096.0 培訓類培訓類培訓類 二、兩個獨立樣本率比較的二、兩個獨立樣本率比較的u u檢驗檢驗 96. 11949. 2 ) 64 1 204 1 )(1045. 01 (1045. 0 0313. 01275. 0 u 表表5-1 兩種療法的心血管病病死率比較兩種療法的

5、心血管病病死率比較 療法死亡生存 合計病死率(%) 鹽酸苯乙雙胍26 (X1)178 204(n1) 12.75 (p1) 安慰劑 2 (X2) 62 64(n2) 3.13 (p2) 合 計 28240 268 10.45 (pc) 21 2211 21 21 nn pnpn nn XX pc ) 11 )(1 ( 21 2121 21 nn pp pp S pp u cc pp u u檢驗的條件:檢驗的條件: n n1 1p p1 1 和和n n1 1( (1- p1- p1 1) )與與 n n2 2p p2 2 和和n n2 2( (1- p1- p2 2) )均均 55 培訓類培訓類

6、培訓類 卡方檢驗卡方檢驗 2檢驗(Chi-square test)是現(xiàn)代統(tǒng)計學的創(chuàng) 始人之一,英國人K . Pearson(1857-1936) 于1900年提出的一種具有廣泛用途的統(tǒng)計方 法,可用于兩個或多個率間的比較,計數(shù)資 料的關(guān)聯(lián)度分析,擬合優(yōu)度檢驗等等。 本章僅限于介紹兩個和多個率或構(gòu)成比比 較的2檢驗。 培訓類培訓類培訓類 一、卡方檢驗的基本思想一、卡方檢驗的基本思想(1) 療法療法死亡死亡生存生存 合計合計病死率病死率(%) 鹽酸苯乙雙胍鹽酸苯乙雙胍26 (a)178 (b) 204(a+b) 12.75 (p1) 安慰劑安慰劑 2 (c) 62 (d) 64(c+d) 3.13

7、 (p2) 合合 計計 28 (a+c.)240(b+d.) 268(a+b+c+d=n) 10.45 (pc) 表表5-1 5-1 兩種療法的心血管病病死率的比較兩種療法的心血管病病死率的比較 (a+b)pc= (a+b)(a+c.)/ n=nRnC/n =21.3 (a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC/n =182.7 (c+d)pc= (c+d)(a+c)/ n =nRnC/n =6.7 (c+d)(1-pc)= (c+d)(b+d.)/ n =nRnC/n =57.3 n nncolumnrow T CR 總例數(shù) 合計列合計行)()( 培訓類培訓類培訓類

8、一、卡方檢驗的基本思想一、卡方檢驗的基本思想(2) 各種情形下,理論與實際偏離的總和即為卡方值( chi-square value),它服從自由度為的卡方分布。 ) 1)(1(, 1 )( )( 2 2 2 CR T TA T TA 1) 12)(12( 82. 4) 3 .57 1 7 . 6 1 7 .182 1 3 .21 1 ( 7 . 4 2 3 .57 )3 .5762( 2 7 . 6 )7 . 62( 2 7 .182 )7 .182178( 2 3 .21 )3 .2126( 2 2 v 培訓類培訓類培訓類 2/ ) 12/( 2 2 2 2)2/(2 1 )( ef 3.8

9、47.8112.59 P P0.050.05的臨界值的臨界值 2分布分布(chi-square distribution) 培訓類培訓類培訓類 2檢驗的基本公式檢驗的基本公式 ) 1)(1( 1 )( )( 2 2 2 CR T TA T TA 上述上述基本公式基本公式由由Pearson提出,因此軟 件上常稱這種檢驗為Peareson卡方檢驗,下 面將要介紹的其他卡方檢驗公式都是在此 基礎上發(fā)展起來的。它不僅適用于四格表 資料,也適用于其它的“行列表”。 培訓類培訓類培訓類 二、四格表專用公式(二、四格表專用公式(1) 為了不計算理論頻數(shù)為了不計算理論頻數(shù)T, 可由可由基本公式基本公式推導出,

10、推導出,直接由直接由 各格子的實際頻數(shù)(各格子的實際頻數(shù)(a、b、c、d)計算卡方值的公式:)計算卡方值的公式: (四格表專用公式) 基本公式: ;1 )()()( )( )( )( )( )( )( )( )( 2 222 2 2 dbcadcba nbcad dcba dbdc dcba dbdc d dcba dbba dcba dbba b dcba caba dcba caba a T TA 培訓類培訓類培訓類 二、四格表專用公式(二、四格表專用公式(2) 0 2 1 ,05. 0 2 210 2 1 ,05. 0 2 2 1 ,05. 0 2 05. 0;84. 3 ,05. 0;

11、84. 3 05. 0;84. 3 1 , 82. 4 6424028204 268)21786226( 2 2 HP HP P ,即不拒絕則如果 即拒絕如果 下結(jié)論: 2(1) u2 2.194924.82(n40,所有T5時) 培訓類培訓類培訓類 三、連續(xù)性校正公式(三、連續(xù)性校正公式(1) 2分布是一連續(xù)型分布,而行分布是一連續(xù)型分布,而行列表資料屬離散型分布列表資料屬離散型分布 ,對其進行校正稱為連續(xù)性校正,對其進行校正稱為連續(xù)性校正(correction for (correction for continuity),continuity),又稱又稱YatesYates校正(校正(Y

12、ates correctionYates correction)。)。 當當n40,而,而1T5時,用時,用連續(xù)性校正連續(xù)性校正公式公式 當當n40或或T1時,用時,用Fisher精確精確檢驗檢驗(Fisher exact test ) 校正公式校正公式: 列表資料),(也適合其它行 T TA c 2 2 )5 . 0( )()()( )2/( 2 2 dbcadcba nnbcad c 培訓類培訓類培訓類 三、連續(xù)性校正公式(三、連續(xù)性校正公式(2) 表 5-2 兩零售點豬肉表層沙門氏菌帶菌情況檢查結(jié)果 沙門氏菌 零售點 陽性 陰性 合計 帶菌率(%) 甲 2(4.17) 26(23.33)

13、 28 7.14 乙 5(2.33) 9(11.67) 14 35.71 合計 7 35 42 16.67 1 , 62. 3 3571428 42)24262592( 2 2 c 1 , 49. 5 3571428 42)26592( 2 2 因為因為1 1T T5 5,且,且n n4040時,所以應用連續(xù)性校正時,所以應用連續(xù)性校正2檢驗檢驗 培訓類培訓類培訓類 四、配對四格表資料的四、配對四格表資料的2檢驗檢驗 培訓類培訓類培訓類 配對四格表資料的配對四格表資料的2檢驗也稱檢驗也稱 McNemar檢驗(檢驗(McNemars test) 1, ) 1( 2 40 2 cb cb cb時,

14、需作連續(xù)性校正, 1,27. 4 312 ) 1312( 2 2 ,4015 采用連續(xù)性校正本例cb 1, )( 2 2 40c cb cb b時,當 05. 0;84. 3 2 1 ,05. 0 2 P H0:b,c來自同一個實驗總體(兩種劑量的毒性無差異); H1:b,c來自不同的實驗總體(兩種劑量的毒性有差別);=0.05。 培訓類培訓類培訓類 五、行列(RC)表資料的2檢驗 培訓類培訓類培訓類 RC表的2檢驗通用公式 n nn T CR 總例數(shù) 列合計行合計 理論頻數(shù)代入基本公式 可推導出: 基本公式 通用公式 ) 1( )( 2 2 2 2 CRn n A n T TA 自由度=(行

15、數(shù)1) (列數(shù)1) 培訓類培訓類培訓類 幾種RC表的檢驗假設H0 1. 多多個個樣樣本本率率的的比比較較 H H0 0:1 1= =2 2= =3 3= =4 4(四四種種療療法法三三年年總總體體生生存存率率相相等等) H H1 1:i ij j,4 ji(四四種種療療法法三三年年總總體體生生存存率率不不全全相相等等) 2. 2. 兩兩組組構(gòu)構(gòu)成成比比的的比比較較 H H0 0:兩兩處處理理組組的的總總體體構(gòu)構(gòu)成成相相同同 H H1 1:兩兩處處理理組組的的總總體體構(gòu)構(gòu)成成不不同同 3. 多多組組構(gòu)構(gòu)成成比比的的比比較較 H H0 0:各各年年齡齡組組病病變變類類型型的的總總體體構(gòu)構(gòu)成成相相同

16、同(年年齡齡與與病病變變類類型型無無關(guān)關(guān)) H H1 1:各各年年齡齡組組病病變變類類型型的的總總體體構(gòu)構(gòu)成成不不全全相相同同(年年齡齡與與病病變變類類型型有有關(guān)關(guān)) 培訓類培訓類培訓類 RC表的計算舉例 例例 5 5- -12 12 對對 1135 例絕經(jīng)后出血的婦女進行臨床與病理分析,例絕經(jīng)后出血的婦女進行臨床與病理分析, 結(jié)果見表結(jié)果見表 5-6,試分析病變類型是否與年齡有關(guān)。,試分析病變類型是否與年齡有關(guān)。 表表 5 5- -6 6 不同年齡婦女絕經(jīng)后出血的病變類型不同年齡婦女絕經(jīng)后出血的病變類型 病變類型,例數(shù)(病變類型,例數(shù)(% %) 年齡組(歲)年齡組(歲) 功能性功能性 惡性惡

17、性 良性良性 合計合計 5050 6060(44.444.4) 1616(11.911.9) 5959(43.743.7) 135135 5151 208208(33.333.3) 111111(17.817.8) 306306(49.049.0) 625625 6161 6666(25.025.0) 7979(29.929.9) 119119(45.145.1) 264264 7171 2121(18.918.9) 4747(42.342.3) 4343(38.738.7) 111111 合計合計 355355(31.331.3) 253253(22.322.3) 527527(46.446

18、.4) 11351135 2 222 601643 2 11135(1)58.91 135 355135 253111 527 (4 1)(3 1)6 RC A n n n 2=58.91=58.9120.05,6=12.59=12.59,所以,所以,P P0.050.05,以,以=0.05=0.05 水準拒絕水準拒絕H H0 0 培訓類培訓類培訓類 RC表2檢驗的應用注意事項 1. 對RC表,若較多格子(1/5)的理論頻數(shù)小于5 或有一個格子的理論頻數(shù)小于1,則易犯第一類錯誤。 出現(xiàn)某些格子中理論頻數(shù)過小時怎么辦? (1)增大樣本含量(最好?。?(2)刪去該格所在的行或列(丟失信息?。?(3)根據(jù)專業(yè)知識將該格所在行或列與別的行或列合并 。(丟失信息!甚至出假象) 培訓類培訓類培訓類 RC表2檢驗的應用注意事項 2.2.多組比較時,若效應有強弱的等級,如多組比較時,若效應有強弱的等級,如+ +,+,+, 最好采用后面的非參數(shù)檢驗方法。最好采用后面的非參數(shù)檢驗方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論