醫(yī)學(xué)統(tǒng)計學(xué)卡方秩和_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)卡方秩和_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)卡方秩和_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)卡方秩和_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)卡方秩和_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

χ2檢驗

χ2檢驗是英國統(tǒng)計學(xué)家Pearson提出的一種以χ2分布為理論基礎(chǔ),用途非常廣泛的假設(shè)檢驗方法。下面介紹常用的幾種χ2檢驗方法。1.1.四格表資料的χ2檢驗先看一個例子:某醫(yī)生用A、B兩種藥物治療急性下呼吸道感染,A藥治療74例,有效68例,B藥治療63例,有效52例,結(jié)果見下表。問兩種藥的有效率是否有差別?處理有效例數(shù)無效例數(shù)合計有效率(%)A藥6867491.89B藥52116382.54合計1201713787.592.

這是一個假設(shè)檢驗問題。這里要檢驗的是兩個樣本率所代表的兩個總體率是否相等,即檢驗如下的假設(shè):H0:π1=π2

對于這種兩樣本率的檢驗,我們總可以將資料整理為如下格式:+-合計IA11A12n1?IIA21A22n2?合計n?1n?2n

由于這個表格中只有中間四個數(shù)是起決定作用的,其余的數(shù)均可由這四個數(shù)計算出來,故這個表格又稱為四格表。3.

為了檢驗這個假設(shè),我們先計算出合并陽性率:pc=n?1/n(合并陰性率:1-pc=n?2/n)。

如果H0成立,我們假設(shè)兩個總體率相等,且等于合并率,即H0:π1=π2=pc于是:4.A+A-合計H0成立T+T-IA11A12n1?pc=n?1/nT11=n1?pc

=n1?n?1/nT12=n1?(1-pc)=n1?n?2/nIIA21A22n2?1-pc=n?2/nT21=n2?pc

=n2?n?1/nT22=n2?(1-pc)=n2?n?2/n合計n?1n?2n5.+-合計IA11(T11)A12(T12)n1?IIA21(T21)A22(T22)n2?合計n?1n?2n并稱:Tij=ni?(n?j/n)為理論數(shù),而稱Aij為實際數(shù)。為方便計,將上表整理為:

對于我們要檢驗:H0:π1=π2=pcPearson給出了如下的統(tǒng)計量:6.Pearson還證明了當(dāng)N(≥40)充分大時,如上定義的卡方統(tǒng)計量近似地服從自由度為(r-1)(c-1)的卡方分布。于是,可利用這個卡方統(tǒng)計量來對上述假設(shè)進行檢驗。由于這個統(tǒng)計量涉及到理論數(shù)T,一般應(yīng)先計算T的值,然后再計算卡方值。

這個統(tǒng)計量反映的是實際數(shù)與理論數(shù)之間的差異,如果H0成立,則這個差異不應(yīng)該很大。因此,如果這個差異大到一定程度,即可認(rèn)為H0不成立。7.四格表資料卡方檢驗的專用公式為了便于計算,可先將四格表改寫為如下形式:+-合計Iaba+bIIcdc+d合計a+cb+dn于是,卡方統(tǒng)計量可改寫為:8.注意:上述公式應(yīng)滿足的條件是:n≥40且所有T≥5。

當(dāng)n≥40,但若有一個理論數(shù)1≤T<5時,用下面的校正公式計算卡方值:當(dāng)n<40或有一個理論數(shù)T<1時,則可采用確切概率法。9.藥物療效合計有效率(%)有效無效甲2823093.33乙合計1241675.004064686.96例

兩種藥物治療白色葡萄球菌敗血癥療效的試驗結(jié)果見下表,問兩種藥物的療效有無差別?兩種藥物治療白色葡萄球菌敗血癥的有效率H0:π1=π2=pc兩種藥物的有效率無差別檢驗水準(zhǔn):α=0.05計算檢驗統(tǒng)計量:

先計算最小理論數(shù)T22=16*6/46=2.09<5,且n=46>40,故用連續(xù)性校正公式計算χ2值:10.查χ2界值表,得χ20.05,1=3.84,于是,P>0.05。故按α=0.05的水準(zhǔn),不拒絕H0,尚不能認(rèn)為兩種藥物的有效率有差別。11.交叉分類2*2表的關(guān)聯(lián)性分析例

為觀察嬰兒腹瀉是否與喂養(yǎng)方式有關(guān),某醫(yī)院兒科隨機收集了消化不良的嬰兒82例,若把該院兒科所有消化不良的患兒視為一個總體的話,則該82例患兒可看作是一份隨機樣本。對每個個體分別觀察腹瀉與否和喂養(yǎng)方式兩種屬性,結(jié)果見下表。試分析兩種屬性的關(guān)聯(lián)性。喂養(yǎng)方式腹瀉合計有無人工301040母乳合計172542473582

這里,實際上是用兩個率的檢驗來推斷兩個定性變量之間的關(guān)聯(lián)性。12.H0:喂養(yǎng)方式與腹瀉之間相互獨立。檢驗水準(zhǔn):α=0.05計算檢驗統(tǒng)計量:

本例最小理論數(shù)T12=40*35/82=17.05>5,且總例數(shù)n>40,故直接計算χ2值:查χ2界值表,得χ20.05,1=3.84,于是,P<0.05。故按α=0.05的水準(zhǔn),拒絕H0,可以認(rèn)為嬰兒腹瀉與喂養(yǎng)方式有關(guān)。

13.列聯(lián)系數(shù)對于兩個定性變量之間的關(guān)聯(lián)程度,可用以下的Pearson列聯(lián)系數(shù)來度量:

對于四格表資料而言,列聯(lián)系數(shù)r的取值介于0~1之間,r值越接近于1,則說明兩變量之間的關(guān)系越密切。本例的Pearson列聯(lián)系數(shù)為:為了確定關(guān)聯(lián)程度大小,可用下面的列聯(lián)系數(shù)來度量。14.2.配對四格表資料的χ2檢驗計數(shù)資料配對設(shè)計的特點是:將一份標(biāo)本分為2份,分別用兩種方法進行處理,然后將二分類的處理結(jié)果用下表形式表示出來。甲法乙法合計+-+aba+b-cdc+d合計a+cb+dn

這里要比較的是兩種方法的檢測結(jié)果是否一致?通過觀察,發(fā)現(xiàn)a、d反映的是兩種方法的一致性,而b、c反映的是兩種方法的差異,故只需考慮b、c即可。15.其檢驗假設(shè)為:H0:兩種方法的檢測結(jié)果一致即:兩種方法的總體檢出率相同檢驗統(tǒng)計量為:當(dāng)b+c>40時,可用下式:16.甲法乙法合計+

+25227

合計111526361753例

用兩種不同的方法對53例肺癌患者進行診斷,結(jié)果見下表,問兩種方法的檢測結(jié)果有無差別?兩種方法診斷肺癌的檢測結(jié)果H0:兩種檢測方法的總體檢出率相同。檢驗水準(zhǔn):α=0.05計算檢驗統(tǒng)計量:

本例b=2,c=11,b+c<40,故采用下式計算χ2值:17.查χ2界值表,得χ20.05,1=3.84,于是,P<0.05。故按α=0.05的水準(zhǔn),拒絕H0,可以認(rèn)為兩種方法的陽性檢出率不同。18.3.行*列表資料的χ2檢驗四格表只有兩行、兩列,如果我們將四格表推廣到多行、多列的情形,即可得下面的行*列表:12…k合計IA11A12…A1kn1?IIA21A22…A2kn2?………………SAs1As2…Askns?合計n?1n?2n?kn1)多個率的比較

我們先來看上表中的k=2的情形,即19.這時,需要比較多個率,即需要檢驗如下的假設(shè):H0:π1=π2=…=πs12合計IA11A12n1?IIA21A22n2?…………SAs1As2ns?合計n?1n?2n其檢驗統(tǒng)計量仍為:20.穴位治愈數(shù)未愈數(shù)合計治愈率(%)后溪穴80189881.6人中穴20204050.0腰痛穴合計24386238.71247620062.0例某醫(yī)院用三種穴位針刺治療急性腰扭傷,結(jié)果見下表,試比較三種穴位針刺效果有無差別。針刺不同穴位治療急性腰扭傷的治愈率21.H0:π1=π2=π3三組治愈率相等H1:π1、π2

、π3三組治愈率不全相等檢驗水準(zhǔn):α=0.05計算檢驗統(tǒng)計量:查χ2界值表,得χ20.05,2=5.99,于是,P<0.05。故按α=0.05的水準(zhǔn),拒絕H0,可以認(rèn)為三組治愈率不全相等。22.2)多個構(gòu)成比的比較

對于一般的行*列表的資料:12…k合計IA11A12…A1kn1?IIA21A22…A2kn2?………………SAs1As2…Askns?合計n?1n?2n?kn這里,將每一行都視為一個總體,于是,每個總體都有一個構(gòu)成比:Aij/ni.。我們要比較的是各總體的構(gòu)成比是否相同。即H0:各總體的構(gòu)成比相同,都為合并的構(gòu)成比:n?j/n23.于是可用Pearson的卡方統(tǒng)計量來對H0進行檢驗。24.例某研究者欲比較維吾爾族和回族居民的血型分布狀況,得下表數(shù)據(jù),試比較兩個民族的血型構(gòu)成有無差別。民族血型合計ABOAB維吾爾族4424834161721513回族合計36938448711513558118679032872868兩種民族的血型構(gòu)成比較檢驗步驟:(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)H0:兩個民族的血型總體構(gòu)成比相同H1:兩個民族的血型總體構(gòu)成比不同或不全相同

=0.0525.(2)計算檢驗統(tǒng)計量及自由度計算每一格子的觀察頻數(shù)與對應(yīng)的期望頻數(shù),并代入χ2計算公式,有v=(4-1)(2-1)=3(3)確定P值,作出推斷結(jié)論

P

0.05,按

=0.05檢驗水準(zhǔn),拒絕H0,接受H1,可認(rèn)為兩個民族的血型構(gòu)成比不同或不全相同。26.3)行*列表分類資料的關(guān)聯(lián)性分析例某研究組為了解不同民族血型分布情況,獲得的資料見下表,問不同民族的血型是否有差異?不同民族受檢者的血型分布民族血型合計ABOAB漢族607045100275回族43321931125滿族合計192322208412212586151484(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)

H0:民族與血型無關(guān)(三個民族血型分布相同)H1:民族與血型有關(guān)(三個民族血型分布不同)

=0.0527.(2)計算檢驗統(tǒng)計量及自由度計算每一格子的觀察頻數(shù)與對應(yīng)的期望頻數(shù),并代入χ2計算公式,有v=(3-1)(4-1)=6,(3)確定P值,作出推斷結(jié)論查

2值表得

20.05,6=12.59,

2

20.05,6,P

0.05,

=0.05的水準(zhǔn),拒絕H0,接受H1,可認(rèn)為民族與血型有關(guān)聯(lián)性。

28.多個樣本率之間的多重比較在上例中,如果我們希望進一步了解究竟是哪些比較組之間的治愈率不相等,這就需要進行多個率之間的兩兩比較。一般地,在進行多個樣本率的比較時,如果檢驗結(jié)果為拒絕H0,即認(rèn)為多個總體率之間存在差異。為了進一步了解哪兩個總體率不同,就需要進行兩兩比較或稱多重比較。若將行*列表拆分為多個2*k表分別進行比較,則將會增大犯I類錯誤的概率。例如有4個比較組(4個樣本率的比較)需進行兩兩比較,則需拆分成6個2*k表來進行比較,即需作6次檢驗,每次檢驗的水準(zhǔn)為α=0.05,于是:

29.第1次比較時不犯一類錯誤的概率為:1-0.05前2次比較均不犯一類錯誤的概率為:(1-0.05)2……………6次比較均不犯一類錯誤的概率為:(1-0.05)6

于是,6次比較中至少有一次犯一類錯誤的概率為:1-(1-0.05)6=0.26這個概率遠(yuǎn)大于0.05。因此,需要對檢驗水準(zhǔn)α進行調(diào)整,其調(diào)整原則是:對于k個比較組時,需要比較的次數(shù)為:k(k-1)/2;對于各實驗組與一個共用對照組比較時,需要比較的次數(shù)為:k-1。30.穴位治愈數(shù)未愈數(shù)合計治愈率(%)后溪穴80189881.6人中穴20204050.0腰痛穴合計24386238.71247620062.0例某醫(yī)院用三種穴位針刺治療急性腰扭傷,結(jié)果見下表,試比較三種穴位針刺效果有無差別。針刺不同穴位治療急性腰扭傷的治愈率

經(jīng)前面的檢驗已知,三組治愈率不全相等?,F(xiàn)在的問題是三組中究竟哪些組之間的總體治愈率不相等?為了解決這個問題,可將上表拆分為以下三個表格:31.穴位治愈數(shù)未愈數(shù)合計后溪穴801898腰痛穴合計24386210456160穴位治愈數(shù)未愈數(shù)合計人中穴202040腰痛穴合計2438624458102表2表3穴位治愈數(shù)未愈數(shù)合計后溪穴801898人中穴202040合計10038138表132.H10:表1中兩個對比組的總體治愈率相等H20:表2中兩個對比組的總體治愈率相等H30:表3中兩個對比組的總體治愈率相等檢驗水準(zhǔn):α=0.05本例為三個實驗組間的兩兩比較,其調(diào)整的檢驗水準(zhǔn)為:計算檢驗統(tǒng)計量:由表1,得χ21=14.24

由表2,得χ22=30.75

由表3,得χ23=1.2633.當(dāng)α’=0.0167時,查表得:χ20.0167,1=5.73

由此可知,不能認(rèn)為表3中的兩個比較組的總體治愈率不等,而可以認(rèn)為其余兩個表中所表示的兩個比較組的總體治愈率不等。

34.秩和檢驗假設(shè)檢驗:

參數(shù)檢驗:總體分布已知,需要檢驗參數(shù)是否相等。非參數(shù)檢驗:總體分布未知,需要檢驗總體分布是否相同。非參數(shù)檢驗的方法很多,秩和檢驗就是其中一種。1.秩和檢驗的基本思想例:測得鉛作業(yè)與非鉛作業(yè)工人的血鉛值(μg/100g)如下(將其各組觀測值按從小到大的順序排列):A(非鉛組):567912151921n1=8B(鉛作業(yè)組)171820253443n2=6

試推斷兩組血鉛值有無差異?35.這個問題等價于:兩樣本所代表的兩總體分布是否相同?或等價于:兩樣本是否來自同一總體?我們這樣來考慮問題:先將所有數(shù)據(jù)按大小順序編號—編秩:A(非鉛組):567912151921B(鉛作業(yè)組):171820253443

秩號:1234567891011121314

然后求出各組秩號之和—秩和:Ti

TA=41TB=64這里,秩和反映了該組數(shù)據(jù)的位置趨勢。36.兩總體分布相同兩組數(shù)據(jù)位置分布應(yīng)較均勻TA、TB之間的差異不大兩總體分布不同兩組數(shù)據(jù)的位置分布有傾向性差異TA、TB之間的差異較大在進行推斷時,按給定的檢驗水準(zhǔn)α,確定相應(yīng)的界值來判斷各組秩和Ti之間的差異大小,從而對各樣本所代表的總體是否相同作出推斷。37.

2.兩組獨立樣本資料的比較(Wilcoxonranktest)某醫(yī)院采用隨機雙盲對照試驗,比較新療法與傳統(tǒng)療法對腎綜合征出血熱患者的降溫效果。試驗將病人隨機分為兩組,分別用新療法與傳統(tǒng)療法治療,以用藥開始的體溫降至正常值時所用的時間(小時)為療效指標(biāo)(每天固定時間測量體溫四次),結(jié)果見下表,試比較兩種療法的退熱時間有無差別?38.39.1)建立假設(shè)H0:兩種療法退熱時間的總體分布相同。2)編秩先將兩組數(shù)據(jù)統(tǒng)一排序,然后編秩,注意遇到數(shù)值相等的數(shù)據(jù)時,需取平均秩。3)求出秩和Ti,并確定T值規(guī)定:n1≤n2,令T=T1;若n1=n2,令T=min(T1,T2)4)查表,定P值,作出推斷查T界值表,若T落入相應(yīng)范圍,則不拒絕H0,否則拒絕H0。

若n1或n2-n1超出T界值表的范圍,則需用下式作近似正態(tài)檢驗。40.當(dāng)相同秩次的情況較多時,采用下式進行校正:其中tj為相同秩次的個數(shù)41.3.兩組有序變量(等級資料)的秩和檢驗例

在一項隨機雙盲對照臨床試驗中,研究者欲比較消炎痛與消炎痛+皮質(zhì)激素制劑(簡稱合劑)治療腎小球腎病的療效;將64例腎小球腎病患者隨機分為兩組,分別用消炎痛與合劑治療,全程用藥后病情分為完全緩解、基本緩解、部分緩解與無效四個等級,結(jié)果見下表,試比較兩種藥物治療腎小球腎病的療效有無不同?42.療效患者數(shù)秩次范圍平均秩次秩和消炎痛合劑合計消炎痛合劑(1)(2)(3)(4)(5)(6)(7)=(2)×(6)(8)=(3)×(6)完全緩解219211~211122209基本緩解45922~3026104130部分緩解691531~4538228342無效1541946~6455825220合計273764

T1=1179T2=901兩種療效對腎小球腎病的療效比較43.1.作假設(shè):H0:兩總體分布相同2.編秩3.求秩和4.統(tǒng)計量本例n1=27,超出了T界值表的范圍,進行近似正態(tài)檢驗。44.tj為第j次相同秩次的個數(shù),本例中,即為各等級的人數(shù)。5.查正態(tài)分布表,可知P<0.01,故可認(rèn)為兩總體分布不同。45.多組計量資料的秩和檢驗(KruskalWallistest)例

某醫(yī)院用3種不同方法治療15例胰腺癌患者,每種方法各治療5例。治療后生存月數(shù)見表10-5第(1)、(3)、(5)欄,問這3種方法對胰腺癌患者的療效有無差別?

46.表10-53種方法治療胰腺癌患者的生存月數(shù)比較甲法

乙法

丙法生存月數(shù)秩次

生存月數(shù)秩次

生存月數(shù)秩次(1)(2)

(3)(4)

(5)(6)32.5

66

2144

912

32.577.5

1013

55810

1214

77.5810

1315

810Ti34

–60

–26ni5

–5

–547.1.建立檢驗假設(shè),確定檢驗水準(zhǔn)

H0:3種方法治療后患者生存月數(shù)的總體分布相同H1:3種方法治療后患者生存月數(shù)的總體分布不同

α=0.052.計算檢驗統(tǒng)計量值。(1)編秩將三組數(shù)據(jù)由小到大統(tǒng)一編秩,遇相同數(shù)值編平均秩次。(2)求各組秩和Ti將表10-5各組秩次相加即得,本例T1=34,T2=

60,T3=

26。(3)計算檢驗統(tǒng)計量值按下式計算H值。48.當(dāng)相同秩次出現(xiàn)較多時,由上式求得的H值偏小,可下式進行校正。tj為第j次相同秩次的個數(shù)。49.4.確定p值,做出推斷(1)查H界值表(三樣本比較的秩和檢驗用)當(dāng)組數(shù)k=3,且各組例數(shù)均不大于5時,可查H界值表得到p值。本例k=3,且各組例數(shù)均為5,由H界值表查得p<0.05。按照α=0.05水準(zhǔn),拒絕H0,接受H1,故可認(rèn)為3種方法治療后胰腺癌患者的生存月數(shù)有差別。(2)查卡方界值表當(dāng)組數(shù)或各組例數(shù)超出H界值表時,由于H0成立時H值近似地服從自由度為k-1的卡方分布,此時可由卡方界值表得到p值。50.4.配對資料的比較—

符號秩和檢驗(Wilcoxonsignedranktest)由于配對資料具有配對信息,因此需要考慮差值。

若配對設(shè)計考慮的是兩種處理間的差別,假定兩種處理的效應(yīng)相同,則差值的總體分布應(yīng)是對稱的,即差值總體的中位數(shù)為0;否則,差值總體的中位數(shù)就會偏離0.編號xyd=x-y1x1y1d1=x1-y12x2y2d2=x2-y2…………nxnyndn=xn-yn51.

同樣,如果配對設(shè)計考慮的是自身前后對照間某種處理的效應(yīng),假定該處理沒有作用,則差值的總體中位數(shù)亦應(yīng)為0,否則,差值總體的中位數(shù)就會偏離0.

基于這種思想,對于配對設(shè)計的資料,采用如下步驟來進行秩和檢驗:1)作假設(shè)H0:差值總體中位數(shù)為0;2)求差值dj=xj-yj;3)編秩:按差值的絕對值從小到大編秩,并標(biāo)上原來的符號;注意兩種情況:(1)|di|=|dj|時,取平均秩,然后分別標(biāo)上符號;(2)當(dāng)d=0時,舍去不計。4)分別求出T+、T-,并取T=min(T+,T-);5)查表確定P值,作出推斷結(jié)論(查表時,n為不為0的差值個數(shù))。52.例

某單位欲研究某保健食品對小鼠是否具有抗疲勞作用,將同種屬的小鼠按性別與年齡相同、體重相近配成對子,共14對,并將每對中的兩只小鼠隨機分配

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論