卡方檢驗1、2課件_第1頁
卡方檢驗1、2課件_第2頁
卡方檢驗1、2課件_第3頁
卡方檢驗1、2課件_第4頁
卡方檢驗1、2課件_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

計數(shù)資料的統(tǒng)計推斷率的抽樣誤差與可信區(qū)間卡方檢驗

一、卡方檢驗的基本思想二、四格表專用公式三、連續(xù)性校正公式四、配對四格表資料的χ2檢驗五、行×列(R×C)表資料的χ2檢驗計數(shù)資料的統(tǒng)計學推斷率的抽樣誤差與可信區(qū)間

一、率的抽樣誤差與標準誤二、總體率的可信區(qū)間標準誤的計算二、總體率的可信區(qū)間

總體率的可信區(qū)間(confidenceintervalofrate):根據(jù)樣本率推算總體率可能所在的范圍

當n足夠大,且np和n(1-p)均大于5時,p的抽樣分布逼近正態(tài)分布。其可信區(qū)間為:雙側:(p-uα/2

Sp,p+uα/2Sp)(u0.05/2=1.96)單側:p-uαSp或p+uαSp(u0.05=1.645)試估計p=0.80,Sp=0.04的總體率雙側95%可信區(qū)間。解:u0.05/2=1.96,(p-uα/2Sp,p+uα/2Sp)=(0.80-1.96×0.04,0.80+1.96×0.04)=(0.7216,0.8784)即總體率的95%可信區(qū)間為(72.16%~87.84%)。注意:如果計算獲得的可信區(qū)間下限小于0%,上限大于100%,則將下限直接定為0%,上限直接定為100%。2、不能直接從附表查到例:某療法治療某病10人,治愈8人,請據(jù)此估計該療法治愈率的95%可信區(qū)間。(附表中的X值只列出X≦n/2部分,當X>n/2時,應以n-X值查表,再用1減去由此查得的可信區(qū)間。)即:X=10-8=2,以n=10和X=2查表得未愈率的95%可信區(qū)間為(3%,56%),治愈率的95%可信區(qū)間為(1-56%,1-3%)=(44%,97%)??ǚ綑z驗

χ2檢驗(Chi-squaretest)是現(xiàn)代統(tǒng)計學的創(chuàng)始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法,可用于兩個或多個率間的比較,計數(shù)資料的關聯(lián)度分析,擬合優(yōu)度檢驗等等。一、卡方檢驗的基本思想(1)療法死亡生存合計病死率(%)鹽酸苯乙雙胍26(a)178(b)204(a+b)12.75(p1)安慰劑2(c)62(d)64(c+d)3.13(p2)合計28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表兩種療法的心血管病病死率的比較2×2表或四格表(fourfoldtable)實際頻數(shù)A

(actualfrequency)(a、b、c、d)的理論頻數(shù)T(theoreticalfrequency)(H0:π1=π2=π):a的理論頻數(shù)=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理論頻數(shù)=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理論頻數(shù)=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理論頻數(shù)=(c+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.3

四格表資料的基本形式

一、卡方檢驗的基本思想(2)各種情形下,理論與實際偏離的總和即為卡方值(chi-squarevalue),它服從自由度為ν的卡方分布。3.847.8112.59P=0.05的臨界值χ2分布(chi-squaredistribution)χ2檢驗的基本公式上述基本公式由Pearson提出,因此軟件上常稱這種檢驗為Peareson卡方檢驗,下面將要介紹的其他卡方檢驗公式都是在此基礎上發(fā)展起來的。它不僅適用于四格表資料,也適用于其它的“行×列表”。二、四格表專用公式(2)2(1)~u2=2.19492=4.82(n>40,所有T5時)三、連續(xù)性校正公式(1)

χ2分布是一連續(xù)型分布,而行×列表資料屬離散型分布,對其進行校正稱為連續(xù)性校正(correctionforcontinuity),又稱Yates校正(Yates'correction)。⑴當n≥40,而1≤T<5時,用連續(xù)性校正公式⑵當n<40或T<1時,用Fisher精確檢驗(Fisherexacttest)校正公式:四、四格表的確切概率檢驗法在四格表χ2檢驗中,若n<40,或有理論頻數(shù)T<1,采用Fisher確切概率法五、配對四格表資料的χ2檢驗配對四格表資料的χ2檢驗公式推導六、行×列(R×C)表資料的χ2檢驗R×C表的χ2檢驗通用公式R×C表的計算舉例地區(qū)ABABO合計亞洲321369952951080歐洲2584322194517北美洲40810637444995合計9875181549332592某研究人員收集了亞洲、歐洲和北美洲的A、B、AB、O血型資料,結果見表1,其目的是研究不同地區(qū)的人群血型分類構成比是否一樣。

表1三個不同地區(qū)血型樣本的頻數(shù)分布R×C表χ2檢驗的應用注意事項1.對R×C表,若較多格子(1/5)的理論頻數(shù)小于5或有一個格子的理論頻數(shù)小于1,則易犯第一類錯誤。 出現(xiàn)某些格子中理論頻數(shù)過小時怎么辦?(1)增大樣本含量(最好?。?)刪去該格所在的行或列(丟失信息?。?)根據(jù)專業(yè)知識將該格所在行或列與別的行或列合并。(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論