第七章(研究生)卡方檢驗_第1頁
第七章(研究生)卡方檢驗_第2頁
第七章(研究生)卡方檢驗_第3頁
第七章(研究生)卡方檢驗_第4頁
第七章(研究生)卡方檢驗_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Chi-squareTest第七章檢驗P111~1311湖南師大醫(yī)學院2014.10.292主講內(nèi)容第七章卡方檢驗2014.10.29ContenttestoffourfolddatatestofpairedfourfolddataFisherprobabilitiesinfourfolddatatestofR×CtableMultiplecomparisonofsampleratestestofgoodnessoffit3第七章卡方檢驗2014.10.29檢驗概述:研究目的:率的假設(shè)檢驗(大樣本率或小樣本率)資料類型:定性資料基本思想:檢驗中的是希臘字母,稱為卡方檢驗,是一種用途較廣的定性資料的假設(shè)檢驗方法,屬于非參數(shù)檢驗的范疇,其基本思想就是在于比較理論頻數(shù)和實際頻數(shù)的吻合程度或擬合優(yōu)度。

推斷兩個總體率或構(gòu)成比之間有無差別多個總體率或構(gòu)成比之間有無差別多個樣本率的多重比較兩個分類變量之間有無關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗。5第七章卡方檢驗2014.10.29檢驗的應(yīng)用:設(shè)計:成組設(shè)計(兩獨立樣本率的比較)目的:推斷兩個未知總體率是否有差別要求:兩樣本的兩分類個體數(shù)排列成四格表

資料理論:卡方分布

6第一節(jié)四格表資料的卡方檢驗第七章卡方檢驗2014.10.29

χ2檢驗:是現(xiàn)代統(tǒng)計學的創(chuàng)始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法,此方法以χ2分布為理論依據(jù),可用于一組、兩組或多組率(頻率)間的比較,計數(shù)資料的關(guān)聯(lián)度分析等等。

7一、檢驗的基本思想第七章卡方檢驗8一、檢驗的基本思想......1.卡方分布0.051.96-1.969(2)自由度為

v的x2分布如果一、檢驗的基本思想......1.卡方分布第七章卡方檢驗10圖7-1不同自由度的卡方分布曲線一、檢驗的基本思想......1.卡方分布第七章卡方檢驗

2分布是一種連續(xù)型分布,按分布的密度函數(shù)可給出不同自由度的一簇分布曲線。

2分布的形狀依賴于自由度的大小:

(1)當自由度小于等于2時,曲線呈L形;

(2)隨著自由度的增大,曲線逐漸趨于對稱;

(3)當自由度趨向于無窮大時,

2分布趨向正態(tài)分布。

11一、檢驗的基本思想......1.卡方分布第七章卡方檢驗(3)x2值的可加(減)性12一、檢驗的基本思想......1.卡方分布第七章卡方檢驗注:多組樣本構(gòu)成比的多重比較通常利用上述特性進行卡方分割(4)x2分布界值當自由度

確定后,χ2分布曲線下右側(cè)尾部的面積為α時,橫軸上相應(yīng)的χ2值記作χ2α,v可見:

一定時,x2值越大,P值越小

P值一定時,

越大,x2值越大13一、檢驗的基本思想......1.卡方分布第七章卡方檢驗Ai

:實際觀測到的頻數(shù)即樣本頻數(shù);Ti:根據(jù)某種理論假設(shè)計算所得自由度=k-1-sS:為計算T時,利用樣本資料估計的參數(shù)個數(shù)14一、檢驗的基本思想......2.基本公式與思想第七章卡方檢驗

例7-1

某院欲比較異梨醇口服液(試驗組)和氫氯噻嗪+地塞米松(對照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機分為兩組,結(jié)果見表7-1。問兩組降低顱內(nèi)壓的總體有效率有無差別?

15一、檢驗的基本思想......2.基本公式與思想第七章卡方檢驗

16表7-1兩組降低顱內(nèi)壓有效率的比較

一、檢驗的基本思想......2.基本公式與思想第七章卡方檢驗目的:推斷π1,π2是否有差別?

17表7-1兩組降低顱內(nèi)壓有效率的比較

一、檢驗的基本思想......2.基本公式與思想第七章卡方檢驗目的:推斷π1,π2是否有差別?18一、檢驗的基本思想......2.基本公式與思想第七章卡方檢驗2014.10.29四格表資料的一般形式和符號基本思想:檢驗實際頻數(shù)與理論頻數(shù)的吻合程度19式中:Ai為實際頻數(shù)、Ti為理論頻數(shù)自由度=k-1-s一、檢驗的基本思想......2.基本公式與思想第七章卡方檢驗99575212014.10.29

22表7-1兩組降低顱內(nèi)壓有效率的比較

第七章卡方檢驗

檢驗統(tǒng)計量值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。若檢驗假設(shè)H0:π1=π2成立,四個格子的實際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,即統(tǒng)計量不應(yīng)該很大。如果值很大,即相對應(yīng)的P值很小,則反過來推斷兩樣本率相差太大,不太可能來自同一總體,因而拒絕H0,接受其對立假設(shè)H1,即π1≠π2。23第七章卡方檢驗檢驗的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,=1,即在周邊合計數(shù)固定的情況下,4個基本數(shù)據(jù)當中只有一個可以自由取值。24一、檢驗的基本思想......2.基本公式與思想第七章卡方檢驗(1)建立檢驗假設(shè),確定檢驗水平。H0:π1=π2即試驗組與對照組降低顱內(nèi)壓的總體有效率相等H1:π1≠π2

即試驗組與對照組降低顱內(nèi)壓的總體有效率不相等α=0.0525一、檢驗的基本思想......3.檢驗步驟第七章卡方檢驗(2)求檢驗統(tǒng)計量值26一、檢驗的基本思想......3.檢驗步驟第七章卡方檢驗27一、檢驗的基本思想......3.檢驗步驟第七章卡方檢驗28二、四格表資料檢驗的專用公式條件:n≥40,且所有的T≥5第七章卡方檢驗29二、四格表資料檢驗的專用公式第七章卡方檢驗30三、四格表資料檢驗的校正公式條件:n≥40,且1≤T<5如果:n<40,或T<1,改用Fisher確切概率計算法第七章卡方檢驗31三、四格表資料檢驗的校正公式條件:n≥40,且1≤T<5如果:n<40,或T<1,改用Fisher確切概率計算法第七章卡方檢驗32三、四格表資料檢驗的校正公式......實例例

某礦石粉廠生產(chǎn)一種礦石粉時,在數(shù)天內(nèi)即有部分工人患職業(yè)性皮膚炎。后隨機抽取15名工人穿新防護服,其余仍穿原用的防護服,一個月后檢查兩組工人皮膚炎患病情況,資料見

下表,問兩組的患病率有無差別?

第七章卡方檢驗防護服種類皮膚炎癥合計患病率(%)陽性例數(shù)陰性例數(shù)新1(3.83)14156.7舊10182835.7合計11324325.6穿新舊兩種防護服工人的皮膚炎患病率比較

本例n>40,因第一行第一列對應(yīng)的合計數(shù)最小,故最小理論數(shù)為T11=1511/43=3.83<5,因而要用校正x2檢驗。33第七章卡方檢驗34第七章卡方檢驗三、四格表資料檢驗的校正公式......實例

關(guān)于卡方檢驗的連續(xù)性校正問題贊成依據(jù)是:這樣做可使卡方統(tǒng)計量抽樣分布的連續(xù)性和平滑性得到改善,可以降低I類錯誤的概率,連續(xù)性校正后的卡方檢驗,其結(jié)果更接近于Fisher確切概率法。不過,校正也不是無條件的,它只適合于自由度為1時,樣本含量較小,如n<40,或至少有一個格子的理論頻數(shù)太小,如T<5的情形。反對依據(jù)是:經(jīng)連續(xù)性校正后,P值有過分保守之嫌。此外,F(xiàn)isher確切概率法建立在四格表雙邊固定的假定下,而實際資料則是單邊固定的四格表,連續(xù)性校正卡方檢驗的P值與Fisher確切概率法的P值沒有可比性。

關(guān)于卡方檢驗的連續(xù)性校正問題就應(yīng)用而言,無論是否經(jīng)過連續(xù)性校正,若兩種檢驗的結(jié)果一致,無須在此問題上糾纏。但是,當兩種檢驗結(jié)果相互矛盾時,如上例,就需要謹慎解釋結(jié)果了。為客觀起見,建議將兩種結(jié)論同時報告出來,以便他人判斷。當然,如果兩種結(jié)論一致,如均是或否,則只報道非連續(xù)性檢驗的結(jié)果即可。

關(guān)于卡方檢驗的連續(xù)性校正問題

同一資料即符合x2檢驗條件,又符合z檢驗條件時,兩者均可用。而且:38四、四格表資料檢驗與z

檢驗的聯(lián)系小結(jié):四格表資料檢驗方法及條件:

39

,專用公式或基本公式;,校正公式;,直接計算概率。

連續(xù)性校正僅用于的四格表資料,當時,一般不作校正。

第七章卡方檢驗40

第二節(jié)

配對四格表資料的x2

檢驗湖南師大醫(yī)學院統(tǒng)計學教研室411、配對四格表資料的x2

檢驗......設(shè)計

例設(shè)有56份咽喉涂抹標本,把每份標本一分為二,依同樣的條件分別接種于甲、乙兩種白喉桿菌培養(yǎng)基上,觀察白喉桿菌的生長情況,結(jié)果如下表,問兩種培養(yǎng)基上白喉桿菌的生長概率有無差別?

上述配對設(shè)計實驗中,每份標本一分為二,分別接種于甲、乙兩種白喉桿菌培養(yǎng)基上,在兩培養(yǎng)基上生長的情況不外乎有四種可能:①兩種培養(yǎng)方法皆為陽性數(shù)(a=22);②兩種培養(yǎng)方法皆為陰性數(shù)(d=14);③甲法為陽性,乙法為陰性數(shù)(b=18);④甲法為陰性,乙法為陽性數(shù)(c=2)。42兩種培養(yǎng)基上白喉桿菌的生長情況甲培養(yǎng)基乙培養(yǎng)基合計陽性陰性陽性221840陰性21416合計243256(固定值)43一批對象(單樣本)、兩種處理,每種處理結(jié)果為二分類、兩分類結(jié)果交叉排列甲處理(變量1)乙處理(變量2)合計+-+aba+b-cdc+d合計a+cb+dn配對四格表(2×2表)一般形式和符號441、配對四格表資料的x2

檢驗......設(shè)計

目的:通過配對設(shè)計的兩樣本率p1與p2的差別,

推斷所代表的兩總體率π1,π2是否有差

別,即是否π1=π2

?(即配對設(shè)計的兩相關(guān)樣本率的比較)452、配對四格表資料的x2

檢驗......目的

463、配對四格表資料的x2

檢驗......統(tǒng)計量

兩種方法的差別由b、c兩格數(shù)據(jù)來反映,a、d兩格表示兩法結(jié)果相同,不予考慮。

因為:

假設(shè)兩處理總體陽性率無差別,即總體B=C=(b+c)/2,則473、配對四格表資料的x2

檢驗......統(tǒng)計量

H0:兩法總體陽性率相同,即總體B=C

H1:兩法總體陽性率不同,即總體B≠C

α=0.05

本例b+c=18+2=14<40,故

48

查界值表,得P<0.005,按α=0.05水準,拒絕H0,接受H1,故可認為兩培養(yǎng)基的陽性生長率不同,即甲培養(yǎng)基陽性生長率高于…

4、配對四格表資料的x2

檢驗......步驟

第三節(jié)四格表資料的Fisher確切概率法

基本思想是:在四格表邊緣合計固定不變的條件下,利用公式直接計算表內(nèi)四個格子數(shù)據(jù)的各種組合的概率,然后計算單側(cè)或雙側(cè)累計概率,并與檢驗水準

比較,作出是否拒絕H0的結(jié)論。應(yīng)用條件:理論數(shù)小于1或n<40

或作

2檢驗后所得概率P

接近檢驗水準

49a、b、c、d為四格表中的四個頻數(shù),n為總例數(shù)。50概率P值的計算公式:51

例7-4

某醫(yī)師為研究乙肝免疫球蛋白預防胎兒宮內(nèi)感染HBV的效果,將33例HBsAg陽性孕婦隨機分為預防注射組和非預防組,結(jié)果見表7-4。問兩組新生兒的HBV總體感染率有無差別?Fisher確切概率法......實例

52表7-4兩組新生兒HBV感染率的比較

Fisher確切概率法......實例

本例n<40,只能選用四格表的確切概率法。其假設(shè)檢驗的步驟如下:1、建立檢驗假設(shè)H0

兩組新生兒HBV的總體感染率相等H1

兩組新生兒HBV的總體感染率不等

=0.0553Fisher確切概率法......實例

2.目前樣本四格表:

D*=ad-bc=-66雙側(cè)檢驗單側(cè)檢驗5441856

在邊緣合計不變的條件下,列出表中四個數(shù)據(jù)變化的各種組合表、Di、Pi。55Fisher確切概率法......實例

56四格表編號i有效無效Di=ad-bcPi1022-1980.00000143922121-1650.00009412833220-1320.00197656744319-990.01844785655418-660.08762728566517-33477616038871533299814660.0912039011010913990.01289752011

57表7-5例7-4的

Fisher確切概率法計算表

3.確定P值(本例為雙側(cè)檢驗)

4.結(jié)論:按α=0.05水準,不拒絕H0,尚不能認為預防注射組與非預防組的新生兒HBV的感染率不同。58Fisher確切概率法......實例

例7-5

某單位研究膽囊腺癌、腺瘤的P53基因表達,對同期手術(shù)切除的膽囊腺癌、腺瘤標本各10份,用免疫組化法檢測P53基因,資料見表7-6。問膽囊腺癌和膽囊腺瘤的P53基因表達陽性率有無差別?Fisher確切概率法......實例2

59表7-6膽囊腺癌與膽囊腺瘤P53基因表達陽性率的比較

Fisher確切概率法......實例2

60

本例a+b=c+d=10,由表7-7可看出,四格表內(nèi)各種組合以i=4和i=5的組合為中心呈對稱分布。

表7-7例7-5的Fisher確切概率法計算表

*為現(xiàn)有樣本61(1)計算現(xiàn)有樣本的D*和P*及各組合下四格表的Di。本例D*=50,P*=0.02708978。(2)計算滿足Di≥50條件的各組合下四格表的概率Pi。(3)計算同時滿足Di≥50和Pi≤P*條件的四格表的累計概率。本例為P7和P8,(4)計算雙側(cè)累計概率P。

P>0.05,按α=0.05檢驗水準不拒絕H0,尚不能認為膽囊腺癌與膽囊腺瘤的P53基因表達陽性率不等。6263注意:第四節(jié)R×C表資料的x2

檢驗64目的:可用于多個獨立樣本率的比較兩個及多個獨立樣本構(gòu)成比的比較

雙變量關(guān)聯(lián)性分析設(shè)計:

R×2表(多個樣本率的比較)

2×C表(兩個樣本構(gòu)成比的比較)

R×C表(多個樣本構(gòu)成比的比較或雙變量關(guān)聯(lián)分析)

多個獨立樣本率的比較65分組陽性陰性合計陽性率%樣本1A11A12n1(固定)p1樣本2A21A22n2(固定)p2.....樣本RAR1AR2nR(固定)pR合計..n(固定)pc兩組或多組內(nèi)部構(gòu)成比(頻率分布)的比較分組內(nèi)部構(gòu)成合計?ПШ.樣本1A11A12A13.n1(固定)樣本2A21A22A23.n2(固定)......樣本R....nR(固定)合計....n(固定)6667雙向無序(雙變量)分類資料關(guān)聯(lián)性檢驗表屬性1屬性2合計?ПШ.1A11A12A13.n12A21A22A23.n2......R....nR合計m1m2m3mcn(固定)6869R×C行列表資料的x2

檢驗......統(tǒng)計量例

某單位在中小學觀察三種方案治療近視眼的效果,其療效見下表,問三種方案治療近視眼的有效率有無差別?70一、多個獨立樣本率的比較方案有效無效合計有效率(%)甲24265048.00乙16294535.56丙8404816.67合計489514333.57

三種方案的有效率的比較

,即三種方案治療近視眼的有效率相等

不全相同,即三種近視眼的有效率不全相等

=0.05

據(jù),查界值表得P<0.005。按

=0.05檢驗水準拒絕H0,接受H1,可以認為三種不同方案治療近視眼的有效率有差別。71例

1986年某地城市和農(nóng)村20至40歲已婚婦女避孕方法情況如下表,試分析該地城市和農(nóng)村避孕方法的總體分布是否有差別?

72二、樣本構(gòu)成比的比較......實例及步驟地區(qū)避孕方法合計節(jié)育器服避孕藥避孕套其它城市153(0.39)33(0.08)165(0.42)40(0.11)391農(nóng)村320(0.71)75(0.16)43(0.09)18(0.04)456合計473(0.56)108(0.13)208(0.24)58(0.07)847某地城市和農(nóng)村已婚婦女避孕方法情況73①H0:城市和農(nóng)村已婚婦女避孕方法的總體構(gòu)成

比相同

H1:城市和農(nóng)村已婚婦女避孕方法的總體構(gòu)成

比不同

74二、樣本構(gòu)成比的比較......實例及步驟②計算統(tǒng)計量:75二、樣本構(gòu)成比的比較......實例及步驟根據(jù)基本公式得:76υ=k-1-s=8-1-4=(2-1)(4-1)=3二、樣本構(gòu)成比的比較......實例及步驟或根據(jù)簡便公式得:77二、樣本構(gòu)成比的比較......實例及步驟③查界值表,得P

0.005,按

=0.05水準拒絕H0,接受H1。故可認為城市和農(nóng)村已婚婦女避孕方法的總體分布不同。據(jù)調(diào)查數(shù)據(jù),城市使用男性避孕套的頻率高于農(nóng)村;農(nóng)村實用宮內(nèi)節(jié)育器的頻率高于城市。78二、樣本構(gòu)成比的比較......實例及步驟79三、雙向無序分類資料的關(guān)聯(lián)性檢驗

雙向無序分類資料為單樣本,按兩屬性或處理分類所得,需分析※兩屬性是否有關(guān)聯(lián):用R×C表資料的方法推斷※兩屬性關(guān)聯(lián)的密切程度:用Pearson列聯(lián)系數(shù)

列聯(lián)系數(shù)C取值范圍在0~1之間。0表示完全獨立;1表示完全相關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。

例7-8

測得某地5801人的ABO血型和MN血型結(jié)果如表7-10,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?表7-10某地5801人的血型

(單樣本,做關(guān)聯(lián)性檢驗)8081雙向無序分類資料的關(guān)聯(lián)性檢驗......實例及步驟82由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。雙向無序分類資料的關(guān)聯(lián)性檢驗......實例及步驟1、關(guān)于χ2檢驗的條件理論數(shù)不能太小一般,各格的T≥1,且1≤T<5的格子不宜多于總格子數(shù)R×C的1/5。否則處理辦法有①增大樣本含量(首選);(如同一批號試劑已用完?)②相鄰的行(列)合理合并,以增大理論頻數(shù);③刪除該行(列);(損失信息)④改用雙向無序R×C表的Fisher確切概率法(SAS軟件)83四、行×列表資料

2檢驗的注意事項84四、行×列表資料

2檢驗的注意事項3、有序分類資料,不適宜此法。目的:R×2表列聯(lián)資料,總的卡方檢驗,P≤0.05。方法:把多個樣本率比較的R×2表資料分成多個四格表資料進行兩兩比較,根據(jù)多個樣本率兩兩比較的次數(shù)的不同,重新規(guī)定四格表資料的檢驗水準,其目的是保證檢驗假設(shè)中I類錯誤

的不變。檢驗水準的重新規(guī)定方法如下:85第五節(jié)多個樣本率比較的x2

分割法

新的檢驗水準

的計算:

86常用的值與對應(yīng)的概率P值見下表v=1時的界值表(多重比較)P5.910.016676.240.012506.960.008337.240.007

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論