第五講卡方檢驗_第1頁
第五講卡方檢驗_第2頁
第五講卡方檢驗_第3頁
第五講卡方檢驗_第4頁
第五講卡方檢驗_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

2/6/20231第五講卡方檢驗周虹公共衛(wèi)生學院婦女與兒童青少年衛(wèi)生學系2/6/20232基本內(nèi)容

統(tǒng)計描述統(tǒng)計推斷(1)統(tǒng)計推斷(2)數(shù)值變量頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差標準誤均數(shù)可信區(qū)間tZF檢驗秩和檢驗直線相關與回歸偏相關多元線性回歸因子分析分類變量相對數(shù)(率、比)率的可信區(qū)間2檢驗Logistic回歸主要內(nèi)容一、分類變量概述二、分類變量的統(tǒng)計描述相對數(shù)應用相對數(shù)的注意事項動態(tài)數(shù)列率的標準化三、分類變量的統(tǒng)計推斷率的標準誤和可信區(qū)間2檢驗2/6/20234

x2檢驗(Chi-squaretest)是一種假設檢驗方法與其他假設檢驗的原理相同統(tǒng)計量服從x2分布

(一)成組設計四格表資料的x2

檢驗

(二)配對設計四格表資料的x2

檢驗

(三)行x列表x2

檢驗

(四)趨勢x2

檢驗2/6/20235什么是成組設計四格表資料?

兩個獨立樣本的率或構成比資料例1:某醫(yī)生想觀察一種新藥對流感的預防效果,進行了如下的研究,問此藥是否有效?(一)成組設計四格表資料的χ2檢驗2/6/20236四格表的一般形式理論頻數(shù)E計算公式為:

NR:所在的行合計,NC:所在的列合計SPSS練習加權數(shù)據(jù)庫的建立:分類變量進行樣本率的比較時,如果沒有原始數(shù)據(jù)庫,只有每種分類變量的樣本數(shù)和某現(xiàn)象的陽性數(shù),可在SPSS軟件中建立數(shù)據(jù)庫;用加權變量的方法建立數(shù)據(jù)庫甲組乙組陽性aba+b陰性cdc+da+cb+dN+/-組cases+甲a+乙b-甲c-乙d+/-組Weight11a12b21c22dSPSS程序:DataWeightCasesWeightcasesby選入

FrequencyvariableOK8四格表卡方檢驗與配對卡方檢驗數(shù)據(jù)庫格式組+/-Weight11a12b21c22d甲法乙法Weight11a12b21c22d9數(shù)據(jù)處理:Data---WeightCases并進行樣本率的比較。練習:實習六中練習6.1和6.2數(shù)據(jù)建立數(shù)據(jù)庫。102/6/202311實際頻數(shù)(O,observed)和理論頻數(shù)(E,expected)

實際頻數(shù)是指調(diào)查或?qū)嶒灥脕淼臄?shù)值,在例1中,四格表中的四個基本數(shù)據(jù)都是實際頻數(shù)。

理論頻數(shù)是根據(jù)假設檢驗來確定的。也就是H0成立時,計算出的格子中的數(shù)。本題中假設實驗組和對照組發(fā)病率相同,這樣可以算出總的患病率:

那么:實驗組的理論發(fā)病人數(shù)為對照組的理論發(fā)病人數(shù)為…因此,四個格子的理論頻數(shù)為:208024961.

x2

檢驗的基本思想148630902/6/202312x2檢驗的基本公式:▲O:表示實際頻數(shù),即實際觀察到的例數(shù)。▲

E:理論頻數(shù),即如果假設檢驗成立,應該觀察到的例數(shù)?!?/p>

:求和符號,所有格子的值之和▲自由度:=(R-1)x(C-1)

R行數(shù),C列數(shù)

注意:反映的格子數(shù),而不是例數(shù)。2/6/202313χ2檢驗假設兩組率相同,(O-E)2/E應該很小。如果實際頻數(shù)和理論頻數(shù)相差的很大,χ2值也越大。當χ2值比規(guī)定的界值還大時,被認為是小概率事件,就拒絕H0,認為兩組率不相同。因為χ2值是對每個格子的(O-E)2/E求和,所以格子數(shù)越多,χ2值也越大。即使O和E相差很小,如果格子數(shù)多的話,總和也會很大。這就引出了自由度的概念,用以消除不同格子數(shù)的影響。

x2檢驗的原理:2/6/202314χ2分布規(guī)律:χ2分布的圖形是不對稱的,而且只有正值。其形狀和自由度有關,自由度越大,則圖形右移。隨著自由度的增加,分布的偏斜程度趨于緩解,逐漸顯露出對稱性。隨著自由度的繼續(xù)增大,χ2分布將趨近于對稱的正態(tài)分布。2/6/2023152/6/202316自由度一定時,P值越小,x2值越大,反比關系。=1時,P=0.05,x2=3.84P=0.01,x2=6.63當P值一定時,自由度越大,x2越大。

P=0.05時,=1,x2=3.84

=2,x2=5.99

2/6/2023172.成組四格表的專用公式

該公式從x2基本公式推導而來,計算較為簡單,結(jié)果相同。abcd2/6/2023183.成組四格表χ2檢驗計算公式的適用條件(1)當實驗對象總個數(shù)n>40,且所有格子的理論頻數(shù)E≥5時,可用χ2檢驗基本公式或?qū)S霉接嬎悝?值。

(2)當n>40,但有任一格子的理論頻數(shù)E僅滿足1<E<5時,需用校正公式:

或:

(3)當n≤40,或有任一格子E≤1時,不能計算χ2值,而需用Fisher確切概率計算法。2/6/202319成組四格表x2

檢驗的SPSS計算程序AnalyzeDescriptivestatisticscrosstabs2/6/2023202/6/2023212/6/2023224.檢驗步驟例1:①建立檢驗假設

H0:兩組發(fā)病率相同,都等于合計率,即π1=π2H1:兩組發(fā)病率不同,即π1≠π2②確定顯著性水平α=0.05。③計算統(tǒng)計量

n=220>40,所有格子E>5,所以不用校正:χ2=4.125④確定p值

p=0.042<0.05。⑤判斷結(jié)果:

因為p<0.05,所以在α=0.05的水平上拒絕檢驗假設H0,接受H1,可以認為兩組發(fā)病率不同,該新藥對預防流感有效。2/6/202323例2.某醫(yī)師用甲、乙兩療法治療小兒單純性消化不良,結(jié)果如下。試比較兩種療法效果有無差異。

甲乙兩種方法治療小兒單純性消化不良效果療法痊愈數(shù)未愈數(shù)合計甲26(28.82)7(4.18)33乙36(33.18)2(4.82)38合計629712/6/202324作業(yè)1某縣為了解農(nóng)村兒童低出生體重的發(fā)生率。在婦幼保健院測量了263名農(nóng)村戶籍兒童出生體重,其中低出生體重為22名,試估計該縣農(nóng)村兒童低出生體重發(fā)生率的95%可信區(qū)間?25分類變量的統(tǒng)計推斷作業(yè)2我國城市兒童巨大兒(出生體重大于等于4000克)的發(fā)生率為6.5%。某醫(yī)院測量了336名兒童出生體重數(shù)據(jù)(出生體重-率.sav),請問該醫(yī)院調(diào)查的兒童巨大兒發(fā)生率是否高于我國城市兒童?男孩和女孩巨大兒發(fā)生率有無差別?26分類變量的統(tǒng)計推斷2/6/202327(二)配對設計四格表資料的2檢驗例3.有93份咽喉涂抹標本,每份標本分別接種在甲乙兩種培養(yǎng)基上,觀察其生長情況,結(jié)果如下表,請問兩種培養(yǎng)基的效果是否不同?甲乙兩種培養(yǎng)基的生長情況乙培養(yǎng)法甲培養(yǎng)法合計陽性陰性陽性371047陰性192746合計5637932/6/202328

配對資料:是同一研究對象用不同的方法進行實驗或調(diào)查,也就是說,這28份標本既進行了甲種方法的培養(yǎng),又進行了乙種方法的培養(yǎng)。

我們要研究的是兩種培養(yǎng)基有什么不同?

所以a和d格子里的數(shù)對研究沒有多大意義,只要b和c的標本份數(shù)相差不大,就可以認為兩種培養(yǎng)基效果相同。2/6/202329配對四格表資料χ2檢驗的公式:當b+c>40時,或

當b+c≤40時,用校正公式:

或2/6/202330配對四格表2檢驗的SPSS計算程序ANALYZEnonparametrictest2relatedsamplestestpairsMcnemar2/6/202331例3:檢驗步驟第一步:建立假設H0:B=C=b+c/2

H1:

B?C

第二步:確定顯著性水平=0.05第三步:計算統(tǒng)計量:b+c40時,校正公式:

x2

=(|O-E|-0.5)2/E或x2=(lb-cl-1)2/b+c自由度:=(2-1)x(2-1)=1第四步:確定P值第五步:判斷結(jié)果2/6/202332(三)行x列表x2

檢驗

四格表是指只有2行2列,當行數(shù)或列數(shù)超過2時,統(tǒng)稱為行x列表。行x列表x2

檢驗是對多個樣本率(或構成比)的檢驗。

基本公式:x2

=(O-E)2/E專用公式:自由度:=(R-1)x(C-1)適用條件:表中不宜有1/5以上格子的理論頻數(shù)小于5,或有一個格子的理論頻數(shù)小于1。2/6/202333例4.為了解花生黃曲霉素污染,隨機觀察了三個地區(qū),結(jié)果見下表。試問這三個地區(qū)花生的黃曲霉素污染率是否不同?

三個地區(qū)花生的黃曲霉素污染情況調(diào)查地區(qū)受檢樣品合計污染率(%)未污染污染甲6232979.3乙30144431.8丙831127.3合計44408447.62/6/2023342/6/202335初次分娩時的年齡疾病狀態(tài)<2020~2425~2930~34≥35總計乳腺癌320120610114632203220對照組142244322893109340610246總計174256383904155662613466乳腺癌%0.1840.2140.2590.2980.3510.239例5.初次分娩年齡與乳腺癌的關聯(lián)性2/6/2023362/6/202337H0:乳腺癌患者與非患者的初次分娩年齡構成相同

(初次分娩時的年齡與乳腺癌無關)H1:乳腺癌患者與非患者的初次分娩年齡構成不同

(初次分娩時的年齡與乳腺癌有關)α=0.05自由度ν=(R-1)×(C-1)=(2-1)(5-1)=4χ2

0.01,4=13.28,χ2=130.2>13.28,p<0.01

所以拒絕檢驗假設H0,接受H1,認為初次分娩時的年齡與乳腺癌的發(fā)生有關聯(lián)。2/6/202338行×列表χ2檢驗下結(jié)論時應注意:1.三組(或三組以上)樣本率經(jīng)χ2檢驗,差異有顯著性,只說明三組比例數(shù)不同或不全相同,不能確定是哪兩個比例數(shù)不同。2/6/2023392.行×列表χ2檢驗時,如果有一個格子的理論數(shù)小于1,或者有1/5以上的格子的理論數(shù)小于5,可以將理論數(shù)小于5的組別與相鄰的組合并,再進行χ2檢驗,否則會得到錯誤結(jié)果

解決辦法χ2分割法2/6/202340例4.為了解花生黃曲霉素污染,隨機觀察了三個地區(qū),結(jié)果見下表。試問這三個地區(qū)花生的黃曲霉素污染率是否不同?

三個地區(qū)花生的黃曲霉素污染情況調(diào)查地區(qū)受檢樣品合計污染率(%)未污染污染甲6232979.3乙30144431.8丙831127.3合計44408447.62/6/2023412/6/202342比較地區(qū)未污染數(shù)污染數(shù)合計污染率(%)χ2值P1乙30144431.80.09>0.05丙831127.3合計3817552乙+丙38175530.917.83<0.05甲6232979.3χ2分割計算表2/6/202343初次分娩時的年齡疾病狀態(tài)<2020~2425~2930~34≥35總計乳腺癌320120610114632203220對照組142244322893109340610246總計174256383904155662613466乳腺癌%0.1840.2140.2590.2980.3510.239例5.初次分娩年齡與乳腺癌的關聯(lián)性(四)趨勢x2檢驗2/6/2023442/6/202345

例5:行x列表x2檢驗結(jié)論是,5個年齡組中至少有2個年齡組的乳腺癌的構成不同。

進一步——關聯(lián)的性質(zhì)?(趨勢χ2檢驗)當某因素是按自然順序的等級分層或者在連續(xù)性資料等級化后再分層的情況下,可采用趨勢χ2檢驗以分析比例是否隨分層等級而變化的趨勢

。

2/6/202346步驟:

假設共有k組,當組號i增加時,對應的Pi是否有增加(或減少)的傾向性。對應于第i組構建一個記分變量Si:k個組的記分常選1,2,3,……k2/6/202347H0:P1,P2,……Pk之間沒有傾向性H1:P1,P2,……Pk隨記分變量S1,S2,……Sk

的增加而增加(或減少),即Pi=α+βSi成立。

檢驗的統(tǒng)計量為:υ=12/6/202348χ2=128.8,p<0.001

所以拒絕檢驗假設H0,認為隨著初次分娩的年齡增加,乳腺癌的比例上升。表11.8避孕措施與避孕措施來源之間的關系避孕措施避孕措施來源合計醫(yī)務人員推薦自己選擇他人推薦避孕環(huán)口服藥安全套其它424108145911762032111023458117345945392529238合計7686926442104H0:采用何種避孕措施與其來源無關聯(lián)H1:采用何種避孕措施與其來源有關聯(lián)

查附表18(2界值表),本例2=189.8>12.59

P<0.05,按α=0.05水準,拒絕H0,接受H1,兩變量的關聯(lián)性有統(tǒng)計學意義,

認為育齡婦女采用的避孕措施與其來源有關聯(lián)

除關聯(lián)性檢驗外,用于說明兩個變量之間關系的密切程度,需計算關聯(lián)系數(shù)(contingencycoefficient,符號C),

計算公式為結(jié)合2檢驗結(jié)果可知,雖然該地育齡婦女采用的避孕措施與其來源有關聯(lián),但關聯(lián)系數(shù)顯示兩變量關聯(lián)的密切程度并不大。用SPSS統(tǒng)計軟件的crosstabs程序可以作兩個無序分類變量的關聯(lián)檢驗,并通過點擊statistics----nominal----contingencycoefficient得到關聯(lián)系數(shù)。附:四格表資料的確切概率法

四格表資料當有理論數(shù)小于1或者總樣本例數(shù)不足40時,不能用卡方檢驗,而要用Fisher確切概率法(Fisherexactprobability)。確切概率法的基本思想

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論