醫(yī)學(xué)統(tǒng)計(jì)學(xué)-孫振球-第七章-卡方檢驗(yàn)課件_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-孫振球-第七章-卡方檢驗(yàn)課件_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-孫振球-第七章-卡方檢驗(yàn)課件_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-孫振球-第七章-卡方檢驗(yàn)課件_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-孫振球-第七章-卡方檢驗(yàn)課件_第5頁(yè)
已閱讀5頁(yè),還剩193頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1051檢驗(yàn)

Chi-SquareTest

第七章1051檢驗(yàn)

Chi-SquareTest第七章1052ContenttestoffourfolddatatestofpairedfourfolddataFisherprobabilitiesinfourfolddatatestofR×CtableMultiplecomparisonofsampleratestestofgoodnessoffit1052Contenttestoffourfol10531053

目的:推斷兩個(gè)總體率或構(gòu)成比之間有無(wú)差別多個(gè)總體率或構(gòu)成比之間有無(wú)差別多個(gè)樣本率的多重比較兩個(gè)分類變量之間有無(wú)關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗(yàn)。

檢驗(yàn)統(tǒng)計(jì)量:應(yīng)用:計(jì)數(shù)資料

目的:1055第一節(jié)四格表資料的檢驗(yàn)

1055第一節(jié)四格表資料的檢驗(yàn)

1056目的:推斷兩個(gè)總體率(構(gòu)成比)是否有差別(和u檢驗(yàn)等價(jià))要求:兩樣本的兩分類個(gè)體數(shù)排列成四格表資料1056目的:推斷兩個(gè)總體率(構(gòu)成比)是1057

(1)

分布是一種連續(xù)型分布:按分布的密度函數(shù)可給出自由度=1,2,3,……的一簇分布曲線(圖7-1)。(2)分布的一個(gè)基本性質(zhì)是可加性:如果兩個(gè)獨(dú)立的隨機(jī)變量X1和X2分別服從自由度ν1和ν2的分布,即,那么它們的和(X1+X2

)服從自由度(ν1+ν2

)的分布,即~。

一、檢驗(yàn)的基本思想

1.分布1057(1)分布是一種連續(xù)型分布:按分布的密105810581059

2.檢驗(yàn)的基本思想

例7-1

某院欲比較異梨醇口服液(試驗(yàn)組)和氫氯噻嗪+地塞米松(對(duì)照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機(jī)分為兩組,結(jié)果見表7-1。問兩組降低顱內(nèi)壓的總體有效率有無(wú)差別?10592.檢驗(yàn)的基本思想例7-1某10510表7-1兩組降低顱內(nèi)壓有效率的比較

10510表7-1兩組降低顱內(nèi)壓有效率的比較10511

本例資料經(jīng)整理成圖7-2形式,即有兩個(gè)處理組,每個(gè)處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有四個(gè)基本數(shù)據(jù),其余數(shù)據(jù)均由此四個(gè)數(shù)據(jù)推算出來(lái)的,故稱四格表資料。10511本例資料經(jīng)整理成圖7-2形10512

圖7-2四格表資料的基本形式

10512圖7-2四格表資料的基本形式10513基本思想:可通過(guò)檢驗(yàn)的基本公式來(lái)理解。式中,A為實(shí)際頻數(shù)(actualfrequency),

T為理論頻數(shù)(theoreticalfrequency)。10513基本思想:可通過(guò)檢驗(yàn)的基本公式來(lái)理解。10514理論頻數(shù)由下式求得:式中,TRC為第R行C列的理論頻數(shù)

nR為相應(yīng)的行合計(jì)

nC為相應(yīng)的列合計(jì)10514理論頻數(shù)由下式求得:式中,TRC為第R行C列10515

理論頻數(shù)是根據(jù)檢驗(yàn)假設(shè),且用合并率來(lái)估計(jì)而定的。如上例,無(wú)效假設(shè)是試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率相等,均等于合計(jì)的有效率87%。那么理論上,試驗(yàn)組的104例顱內(nèi)壓增高癥患者中有效者應(yīng)為104(174/200)=90.48,無(wú)效者為104(26/200)=13.52;同理,對(duì)照組的96例顱內(nèi)壓增高癥患者中有效者應(yīng)為96(174/200)=83.52,無(wú)效者為96(26/200)=12.48。

10515理論頻數(shù)是根據(jù)檢驗(yàn)假設(shè)10516

檢驗(yàn)統(tǒng)計(jì)量值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。若檢驗(yàn)假設(shè)H0:π1=π2成立,四個(gè)格子的實(shí)際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,即統(tǒng)計(jì)量不應(yīng)該很大。如果值很大,即相對(duì)應(yīng)的P值很小,若,則反過(guò)來(lái)推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對(duì)立假設(shè)H1,即π1≠π2。10516檢驗(yàn)統(tǒng)計(jì)量值反10517

由公式(7-1)還可以看出:值的大小還取決于個(gè)數(shù)的多少(嚴(yán)格地說(shuō)是自由度ν的大?。?。由于各皆是正值,故自由度ν愈大,值也會(huì)愈大;所以只有考慮了自由度ν的影響,值才能正確地反映實(shí)際頻數(shù)A和理論頻數(shù)T的吻合程度。檢驗(yàn)的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,=1,即在周邊合計(jì)數(shù)固定的情況下,4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值。10517由公式(7-1)還可以看10518(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。H0:π1=π2即試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率相等H1:π1≠π2

即試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率不相等α=0.05。3.假設(shè)檢驗(yàn)步驟10518(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。3.假設(shè)檢驗(yàn)10519(2)求檢驗(yàn)統(tǒng)計(jì)量值10519(2)求檢驗(yàn)統(tǒng)計(jì)量值105201052010521二、四格表資料檢驗(yàn)的專用公式10521二、四格表資料檢驗(yàn)的專用公式10522

分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計(jì)算得的統(tǒng)計(jì)量的抽樣分布亦呈離散性質(zhì)。為改善統(tǒng)計(jì)量分布的連續(xù)性,則需行連續(xù)性校正。10522 分布是一連續(xù)型分布10523三、四格表資料檢驗(yàn)的校正公式

10523三、四格表資料檢驗(yàn)的校正公式10524四格表資料檢驗(yàn)公式選擇條件:

,專用公式;,校正公式;,直接計(jì)算概率。

連續(xù)性校正僅用于的四格表資料,當(dāng)時(shí),一般不作校正。

10524四格表資料檢驗(yàn)公式選擇條件:10525

例7-2

某醫(yī)師欲比較胞磷膽堿與神經(jīng)節(jié)苷酯治療腦血管疾病的療效,將78例腦血管疾病患者隨機(jī)分為兩組,結(jié)果見表7-2。問兩種藥物治療腦血管疾病的有效率是否相等?10525例7-2某醫(yī)師欲10526表7-2兩種藥物治療腦血管疾病有效率的比較10526表7-2兩種藥物治療腦血管疾病有效率的比較10527

本例,故用四格表資料檢驗(yàn)的校正公式

,查界值表得。按

檢驗(yàn)水準(zhǔn)不拒絕,尚不能認(rèn)為兩種藥物治療腦血管疾病的有效率不等。

10527本例10528

本資料若不校正時(shí),結(jié)論與之相反。10528本資料若不校正時(shí),10529第二節(jié)配對(duì)四格表資料的檢驗(yàn)10529第二節(jié)配對(duì)四格表資料的檢驗(yàn)10530與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)和配對(duì)設(shè)計(jì)一樣,計(jì)數(shù)資料推斷兩個(gè)總體率(構(gòu)成比)是否有差別也有成組設(shè)計(jì)和配對(duì)設(shè)計(jì),即四格表資料和配對(duì)四格表資料。10530與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)10531

例7-3

某實(shí)驗(yàn)室分別用乳膠凝集法和免疫熒光法對(duì)58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進(jìn)行測(cè)定,結(jié)果見表7-3。問兩種方法的檢測(cè)結(jié)果有無(wú)差別?10531例7-3某實(shí)驗(yàn)室分別10532

表7-3兩種方法的檢測(cè)結(jié)果

10532表7-3兩種方法的檢測(cè)結(jié)果10533

上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言,兩種處理的結(jié)果不外乎有四種可能:①兩種檢測(cè)方法皆為陽(yáng)性數(shù)(a);②兩種檢測(cè)方法皆為陰性數(shù)(d);③免疫熒光法為陽(yáng)性,乳膠凝集法為陰性數(shù)(b);④乳膠凝集法為陽(yáng)性,免疫熒光法為陰性數(shù)(c)。10533上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言10534其中,a,d為兩法觀察結(jié)果一致的兩種情況,

b,c為兩法觀察結(jié)果不一致的兩種情況。檢驗(yàn)統(tǒng)計(jì)量為10534其中,a,d為兩法觀察結(jié)果一致的兩種情況,

10535注意:

本法一般用于樣本含量不太大的資料。因?yàn)樗鼉H考慮了兩法結(jié)果不一致的兩種情況(b,c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a,d)。所以,當(dāng)n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對(duì)較小時(shí),即便是檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際意義往往也不大。10535注意:本法一般10536檢驗(yàn)步驟:10536檢驗(yàn)步驟:10537第三節(jié)

四格表資料的Fisher確切概率法10537第三節(jié)四格表資料的Fisher確切概率法10538條件:理論依據(jù):超幾何分布(非檢驗(yàn)的范疇)10538條件:10539

例7-4

某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染HBV的效果,將33例HBsAg陽(yáng)性孕婦隨機(jī)分為預(yù)防注射組和非預(yù)防組,結(jié)果見表7-4。問兩組新生兒的HBV總體感染率有無(wú)差別?

10539例7-4某醫(yī)師為10540表7-4兩組新生兒HBV感染率的比較

10540表7-4兩組新生兒HBV感染率的比較10541一、基本思想

在四格表周邊合計(jì)數(shù)固定不變的條件下,計(jì)算表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)的各種組合之概率;再按檢驗(yàn)假設(shè)用單側(cè)或雙側(cè)的累計(jì)概率,依據(jù)所取的檢驗(yàn)水準(zhǔn)做出推斷。

10541一、基本思想在四格表周邊10542

1.各組合概率Pi的計(jì)算

在四格表周邊合計(jì)數(shù)不變的條件下,表內(nèi)4個(gè)實(shí)際頻數(shù)a,b,c,d變動(dòng)的組合數(shù)共有“周邊合計(jì)中最小數(shù)+1”個(gè)。如例7-4,表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)的組合數(shù)共有9+1=10個(gè),依次為:105421.各組合概率Pi的計(jì)算在四格表周邊合計(jì)數(shù)不10543各組合的概率Pi服從超幾何分布,其和為1。計(jì)算公式為!為階乘符號(hào)10543各組合的概率Pi服從超幾何分布,其和為1。計(jì)算公式10544

2.累計(jì)概率的計(jì)算(單、雙側(cè)檢驗(yàn)不同)

105442.累計(jì)概率的計(jì)算(單、雙側(cè)檢驗(yàn)不同)

1054510545105461054610547二、檢驗(yàn)步驟()10547二、檢驗(yàn)步驟(105481054810549表7-5例7-4的

Fisher確切概率法計(jì)算表

10549表7-5例7-4的Fisher確切概率法計(jì)10550

例7-5

某單位研究膽囊腺癌、腺瘤的P53基因表達(dá),對(duì)同期手術(shù)切除的膽囊腺癌、腺瘤標(biāo)本各10份,用免疫組化法檢測(cè)P53基因,資料見表7-6。問膽囊腺癌和膽囊腺瘤的P53基因表達(dá)陽(yáng)性率有無(wú)差別?10550例7-5某單位研究膽囊腺癌10551表7-6膽囊腺癌與膽囊腺瘤P53基因表達(dá)陽(yáng)性率的比較

10551表7-6膽囊腺癌與膽囊腺瘤P53基因表達(dá)陽(yáng)性10552

本例a+b+c+d=10,由表7-7可看出,四格表內(nèi)各種組合以i=4和i=5的組合為中心呈對(duì)稱分布。

表7-7例7-5的Fisher確切概率法計(jì)算表

*為現(xiàn)有樣本10552本例a+b+c+d=10,由表7-10553(1)計(jì)算現(xiàn)有樣本的D*和P*及各組合下四格表的Di。本例D*=50,P*=0.02708978。(2)計(jì)算滿足Di≥50條件的各組合下四格表的概率Pi。(3)計(jì)算同時(shí)滿足Di≥50和Pi≤P*條件的四格表的累計(jì)概率。本例為P7和P8,(4)計(jì)算雙側(cè)累計(jì)概率P。

P>0.05,按α=0.05檢驗(yàn)水準(zhǔn)不拒絕H0,尚不能認(rèn)為膽囊腺癌與膽囊腺瘤的P53基因表達(dá)陽(yáng)性率不等。10553(1)計(jì)算現(xiàn)有樣本的D*和P*及各組合下四格表的D10554注意:10554注意:10555第四節(jié)行×列表資料的檢驗(yàn)

10555第四節(jié)行×列表資料的檢驗(yàn)10556行×列表資料①

多個(gè)樣本率比較時(shí),有R行2列,稱為R×2表;②

兩個(gè)樣本的構(gòu)成比比較時(shí),有2行C列,稱2×C表;③

多個(gè)樣本的構(gòu)成比比較,以及雙向無(wú)序分類資料關(guān)聯(lián)性檢驗(yàn)時(shí),有行列,稱為R×C表。10556行×列表資料①

多個(gè)樣本率比較時(shí),有R行2列,稱為10557檢驗(yàn)統(tǒng)計(jì)量10557檢驗(yàn)統(tǒng)計(jì)量10558一、多個(gè)樣本率的比較10558一、多個(gè)樣本率的比較10559

例7-6

某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見表7-8。問三種療法的有效率有無(wú)差別?表7-8三種療法有效率的比較10559例7-6某醫(yī)師研究物理療法、藥10560檢驗(yàn)步驟:10560檢驗(yàn)步驟:10561二、樣本構(gòu)成比的比較10561二、樣本構(gòu)成比的比較10562

例7-7

某醫(yī)師在研究血管緊張素I轉(zhuǎn)化酶(ACE)基因I/D多態(tài)(分3型)與2型糖尿病腎病(DN)的關(guān)系時(shí),將249例2型糖尿病患者按有無(wú)糖尿病腎病分為兩組,資料見表7-9。問兩組2型糖尿病患者的ACE基因型總體分布有無(wú)差別?表7-9DN組與無(wú)DN組2型糖尿病患者ACE基因型分布的比較

10562例7-7某醫(yī)師在研究血管緊張素10563檢驗(yàn)步驟10563檢驗(yàn)步驟10564三、雙向無(wú)序分類資料的關(guān)聯(lián)性檢驗(yàn)

表中兩個(gè)分類變量皆為無(wú)序分類變量的行列表資料,又稱為雙向無(wú)序表資料。

10564三、雙向無(wú)序分類資料的關(guān)聯(lián)性檢驗(yàn)

10565

注意:雙向無(wú)序分類資料為兩個(gè)或多個(gè)樣本,做差別檢驗(yàn)(例7-7);若為單樣本,做關(guān)聯(lián)性檢驗(yàn)。

10565注意:雙向無(wú)序分類資料為兩個(gè)或10566例7-8

測(cè)得某地5801人的ABO血型和MN血型結(jié)果如表7-10,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?

表7-10某地5801人的血型

(單樣本,做關(guān)聯(lián)性檢驗(yàn))10566例7-8測(cè)得某地5801人的ABO血型和MN10567

表7-10資料,可用行×列表資料檢驗(yàn)來(lái)推斷兩個(gè)分類變量之間有無(wú)關(guān)系(或關(guān)聯(lián));若有關(guān)系,可計(jì)算Pearson列聯(lián)系數(shù)C進(jìn)一步分析關(guān)系的密切程度:

列聯(lián)系數(shù)C取值范圍在0~1之間。0表示完全獨(dú)立;1表示完全相關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。

10567表7-10資料,可用行×列表10568檢驗(yàn)步驟10568檢驗(yàn)步驟10569由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認(rèn)為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。10569由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認(rèn)為兩種10570四、行×列表資料檢驗(yàn)的注意事項(xiàng)10570四、行×列表資料檢驗(yàn)的105711.行列表中的各格T≥1,并且1≤T<5的格子數(shù)不宜超過(guò)1/5格子總數(shù),否則可能產(chǎn)生偏性。處理方法有三種:

增大樣本含量以達(dá)到增大理論頻數(shù)的目的,屬首選方法,只是有些研究無(wú)法增大樣本含量,如同一批號(hào)試劑已用完等。105711.行列表中的各格T≥1,并且1≤T<5的格子數(shù)不10572根據(jù)專業(yè)知識(shí),刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并。這樣做會(huì)損失信息及損害樣本的隨機(jī)性。注意:不同年齡組可以合并,但不同血型就不能合并。改用雙向無(wú)序R×C表的Fisher確切概率法(可用SAS軟件實(shí)現(xiàn))。10572根據(jù)專業(yè)知識(shí),刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l1057310573105741057410575

第五節(jié)多個(gè)樣本率間的多重比較10575第五節(jié)105761057610577分割法

10577分割法10578一、基本思想因分析目的不同,k個(gè)樣本率兩兩比較的次數(shù)不同,故重新規(guī)定的檢驗(yàn)水準(zhǔn)的估計(jì)方法亦不同。通常有兩種情況:10578一、基本思想因分析目的不同,k個(gè)樣本率兩兩比較的次10579

105791058010580105811058110582二、多個(gè)實(shí)驗(yàn)組間的兩兩比較10582二、多個(gè)實(shí)驗(yàn)組間的兩兩比較10583

例7-9

對(duì)例7-6中表7-8的資料進(jìn)行兩兩比較,以推斷是否任兩種療法治療周圍性面神經(jīng)麻痹的有效率均有差別?10583例7-9對(duì)例7-10584檢驗(yàn)步驟本例為3個(gè)實(shí)驗(yàn)組間的兩兩比較

10584檢驗(yàn)步驟本例為3個(gè)實(shí)驗(yàn)組間的兩兩比較10585表7-12三種療法有效率的兩兩比較

10585表7-12三種療法有效率的兩兩比較105861058610587三、各實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較10587三、各實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較10588

例7-10

以表7-8資料中的藥物治療組為對(duì)照組,物理療法組與外用膏藥組為試驗(yàn)組,試分析兩試驗(yàn)組與對(duì)照組的總體有效率有無(wú)差別?

本例為各實(shí)驗(yàn)組與同一對(duì)照組的比較10588例7-10以表7-81058910589105901059010591第七節(jié)頻數(shù)分布擬合優(yōu)度的檢驗(yàn)

10591第七節(jié)頻數(shù)分布擬合優(yōu)度的檢驗(yàn)10592

醫(yī)學(xué)研究實(shí)踐中,常需推斷某現(xiàn)象頻數(shù)分布是否符合某一理論分布。如正態(tài)性檢驗(yàn)就是推斷某資料是否符合正態(tài)分布的一種檢驗(yàn)方法,但只適用于正態(tài)分布。

Pearson值能反映實(shí)際頻數(shù)和理論頻數(shù)的吻合程度,故檢驗(yàn)可用于推斷頻數(shù)分布的擬合優(yōu)度,且應(yīng)用廣泛。如正態(tài)分布,二項(xiàng)分布,Poisson分布,負(fù)二項(xiàng)分布等。

10592醫(yī)學(xué)研究實(shí)踐中,常需推斷10593

例7-12

觀察某克山病區(qū)克山病患者的空間分布情況,調(diào)查者將該地區(qū)劃分為279個(gè)取樣單位,統(tǒng)計(jì)各取樣單位歷年累計(jì)病例數(shù),資料見表7-15的第(1)、(2)欄,問此資料是否服從Poisson分布?

10593例7-12觀察某克山病10594表7-15Poisson分布的擬合與檢驗(yàn)

*:X≥8的概率:

10594表7-15Poisson分布的擬合與檢驗(yàn)105951059510596105961059710597練習(xí)題P156一、最佳選擇題全做三、計(jì)算分析題第3、5、7、10題練習(xí)題謝謝大家!謝謝大家!105100檢驗(yàn)

Chi-SquareTest

第七章1051檢驗(yàn)

Chi-SquareTest第七章105101ContenttestoffourfolddatatestofpairedfourfolddataFisherprobabilitiesinfourfolddatatestofR×CtableMultiplecomparisonofsampleratestestofgoodnessoffit1052Contenttestoffourfol1051021053

目的:推斷兩個(gè)總體率或構(gòu)成比之間有無(wú)差別多個(gè)總體率或構(gòu)成比之間有無(wú)差別多個(gè)樣本率的多重比較兩個(gè)分類變量之間有無(wú)關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗(yàn)。

檢驗(yàn)統(tǒng)計(jì)量:應(yīng)用:計(jì)數(shù)資料

目的:105104第一節(jié)四格表資料的檢驗(yàn)

1055第一節(jié)四格表資料的檢驗(yàn)

105105目的:推斷兩個(gè)總體率(構(gòu)成比)是否有差別(和u檢驗(yàn)等價(jià))要求:兩樣本的兩分類個(gè)體數(shù)排列成四格表資料1056目的:推斷兩個(gè)總體率(構(gòu)成比)是105106

(1)

分布是一種連續(xù)型分布:按分布的密度函數(shù)可給出自由度=1,2,3,……的一簇分布曲線(圖7-1)。(2)分布的一個(gè)基本性質(zhì)是可加性:如果兩個(gè)獨(dú)立的隨機(jī)變量X1和X2分別服從自由度ν1和ν2的分布,即,那么它們的和(X1+X2

)服從自由度(ν1+ν2

)的分布,即~。

一、檢驗(yàn)的基本思想

1.分布1057(1)分布是一種連續(xù)型分布:按分布的密1051071058105108

2.檢驗(yàn)的基本思想

例7-1

某院欲比較異梨醇口服液(試驗(yàn)組)和氫氯噻嗪+地塞米松(對(duì)照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機(jī)分為兩組,結(jié)果見表7-1。問兩組降低顱內(nèi)壓的總體有效率有無(wú)差別?10592.檢驗(yàn)的基本思想例7-1某105109表7-1兩組降低顱內(nèi)壓有效率的比較

10510表7-1兩組降低顱內(nèi)壓有效率的比較105110

本例資料經(jīng)整理成圖7-2形式,即有兩個(gè)處理組,每個(gè)處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有四個(gè)基本數(shù)據(jù),其余數(shù)據(jù)均由此四個(gè)數(shù)據(jù)推算出來(lái)的,故稱四格表資料。10511本例資料經(jīng)整理成圖7-2形105111

圖7-2四格表資料的基本形式

10512圖7-2四格表資料的基本形式105112基本思想:可通過(guò)檢驗(yàn)的基本公式來(lái)理解。式中,A為實(shí)際頻數(shù)(actualfrequency),

T為理論頻數(shù)(theoreticalfrequency)。10513基本思想:可通過(guò)檢驗(yàn)的基本公式來(lái)理解。105113理論頻數(shù)由下式求得:式中,TRC為第R行C列的理論頻數(shù)

nR為相應(yīng)的行合計(jì)

nC為相應(yīng)的列合計(jì)10514理論頻數(shù)由下式求得:式中,TRC為第R行C列105114

理論頻數(shù)是根據(jù)檢驗(yàn)假設(shè),且用合并率來(lái)估計(jì)而定的。如上例,無(wú)效假設(shè)是試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率相等,均等于合計(jì)的有效率87%。那么理論上,試驗(yàn)組的104例顱內(nèi)壓增高癥患者中有效者應(yīng)為104(174/200)=90.48,無(wú)效者為104(26/200)=13.52;同理,對(duì)照組的96例顱內(nèi)壓增高癥患者中有效者應(yīng)為96(174/200)=83.52,無(wú)效者為96(26/200)=12.48。

10515理論頻數(shù)是根據(jù)檢驗(yàn)假設(shè)105115

檢驗(yàn)統(tǒng)計(jì)量值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。若檢驗(yàn)假設(shè)H0:π1=π2成立,四個(gè)格子的實(shí)際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,即統(tǒng)計(jì)量不應(yīng)該很大。如果值很大,即相對(duì)應(yīng)的P值很小,若,則反過(guò)來(lái)推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對(duì)立假設(shè)H1,即π1≠π2。10516檢驗(yàn)統(tǒng)計(jì)量值反105116

由公式(7-1)還可以看出:值的大小還取決于個(gè)數(shù)的多少(嚴(yán)格地說(shuō)是自由度ν的大?。?。由于各皆是正值,故自由度ν愈大,值也會(huì)愈大;所以只有考慮了自由度ν的影響,值才能正確地反映實(shí)際頻數(shù)A和理論頻數(shù)T的吻合程度。檢驗(yàn)的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,=1,即在周邊合計(jì)數(shù)固定的情況下,4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值。10517由公式(7-1)還可以看105117(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。H0:π1=π2即試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率相等H1:π1≠π2

即試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率不相等α=0.05。3.假設(shè)檢驗(yàn)步驟10518(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。3.假設(shè)檢驗(yàn)105118(2)求檢驗(yàn)統(tǒng)計(jì)量值10519(2)求檢驗(yàn)統(tǒng)計(jì)量值10511910520105120二、四格表資料檢驗(yàn)的專用公式10521二、四格表資料檢驗(yàn)的專用公式105121

分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計(jì)算得的統(tǒng)計(jì)量的抽樣分布亦呈離散性質(zhì)。為改善統(tǒng)計(jì)量分布的連續(xù)性,則需行連續(xù)性校正。10522 分布是一連續(xù)型分布105122三、四格表資料檢驗(yàn)的校正公式

10523三、四格表資料檢驗(yàn)的校正公式105123四格表資料檢驗(yàn)公式選擇條件:

,專用公式;,校正公式;,直接計(jì)算概率。

連續(xù)性校正僅用于的四格表資料,當(dāng)時(shí),一般不作校正。

10524四格表資料檢驗(yàn)公式選擇條件:105124

例7-2

某醫(yī)師欲比較胞磷膽堿與神經(jīng)節(jié)苷酯治療腦血管疾病的療效,將78例腦血管疾病患者隨機(jī)分為兩組,結(jié)果見表7-2。問兩種藥物治療腦血管疾病的有效率是否相等?10525例7-2某醫(yī)師欲105125表7-2兩種藥物治療腦血管疾病有效率的比較10526表7-2兩種藥物治療腦血管疾病有效率的比較105126

本例,故用四格表資料檢驗(yàn)的校正公式

,查界值表得。按

檢驗(yàn)水準(zhǔn)不拒絕,尚不能認(rèn)為兩種藥物治療腦血管疾病的有效率不等。

10527本例105127

本資料若不校正時(shí),結(jié)論與之相反。10528本資料若不校正時(shí),105128第二節(jié)配對(duì)四格表資料的檢驗(yàn)10529第二節(jié)配對(duì)四格表資料的檢驗(yàn)105129與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)和配對(duì)設(shè)計(jì)一樣,計(jì)數(shù)資料推斷兩個(gè)總體率(構(gòu)成比)是否有差別也有成組設(shè)計(jì)和配對(duì)設(shè)計(jì),即四格表資料和配對(duì)四格表資料。10530與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)105130

例7-3

某實(shí)驗(yàn)室分別用乳膠凝集法和免疫熒光法對(duì)58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進(jìn)行測(cè)定,結(jié)果見表7-3。問兩種方法的檢測(cè)結(jié)果有無(wú)差別?10531例7-3某實(shí)驗(yàn)室分別105131

表7-3兩種方法的檢測(cè)結(jié)果

10532表7-3兩種方法的檢測(cè)結(jié)果105132

上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言,兩種處理的結(jié)果不外乎有四種可能:①兩種檢測(cè)方法皆為陽(yáng)性數(shù)(a);②兩種檢測(cè)方法皆為陰性數(shù)(d);③免疫熒光法為陽(yáng)性,乳膠凝集法為陰性數(shù)(b);④乳膠凝集法為陽(yáng)性,免疫熒光法為陰性數(shù)(c)。10533上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言105133其中,a,d為兩法觀察結(jié)果一致的兩種情況,

b,c為兩法觀察結(jié)果不一致的兩種情況。檢驗(yàn)統(tǒng)計(jì)量為10534其中,a,d為兩法觀察結(jié)果一致的兩種情況,

105134注意:

本法一般用于樣本含量不太大的資料。因?yàn)樗鼉H考慮了兩法結(jié)果不一致的兩種情況(b,c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a,d)。所以,當(dāng)n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對(duì)較小時(shí),即便是檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際意義往往也不大。10535注意:本法一般105135檢驗(yàn)步驟:10536檢驗(yàn)步驟:105136第三節(jié)

四格表資料的Fisher確切概率法10537第三節(jié)四格表資料的Fisher確切概率法105137條件:理論依據(jù):超幾何分布(非檢驗(yàn)的范疇)10538條件:105138

例7-4

某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染HBV的效果,將33例HBsAg陽(yáng)性孕婦隨機(jī)分為預(yù)防注射組和非預(yù)防組,結(jié)果見表7-4。問兩組新生兒的HBV總體感染率有無(wú)差別?

10539例7-4某醫(yī)師為105139表7-4兩組新生兒HBV感染率的比較

10540表7-4兩組新生兒HBV感染率的比較105140一、基本思想

在四格表周邊合計(jì)數(shù)固定不變的條件下,計(jì)算表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)的各種組合之概率;再按檢驗(yàn)假設(shè)用單側(cè)或雙側(cè)的累計(jì)概率,依據(jù)所取的檢驗(yàn)水準(zhǔn)做出推斷。

10541一、基本思想在四格表周邊105141

1.各組合概率Pi的計(jì)算

在四格表周邊合計(jì)數(shù)不變的條件下,表內(nèi)4個(gè)實(shí)際頻數(shù)a,b,c,d變動(dòng)的組合數(shù)共有“周邊合計(jì)中最小數(shù)+1”個(gè)。如例7-4,表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)的組合數(shù)共有9+1=10個(gè),依次為:105421.各組合概率Pi的計(jì)算在四格表周邊合計(jì)數(shù)不105142各組合的概率Pi服從超幾何分布,其和為1。計(jì)算公式為!為階乘符號(hào)10543各組合的概率Pi服從超幾何分布,其和為1。計(jì)算公式105143

2.累計(jì)概率的計(jì)算(單、雙側(cè)檢驗(yàn)不同)

105442.累計(jì)概率的計(jì)算(單、雙側(cè)檢驗(yàn)不同)

1051441054510514510546105146二、檢驗(yàn)步驟()10547二、檢驗(yàn)步驟(10514710548105148表7-5例7-4的

Fisher確切概率法計(jì)算表

10549表7-5例7-4的Fisher確切概率法計(jì)105149

例7-5

某單位研究膽囊腺癌、腺瘤的P53基因表達(dá),對(duì)同期手術(shù)切除的膽囊腺癌、腺瘤標(biāo)本各10份,用免疫組化法檢測(cè)P53基因,資料見表7-6。問膽囊腺癌和膽囊腺瘤的P53基因表達(dá)陽(yáng)性率有無(wú)差別?10550例7-5某單位研究膽囊腺癌105150表7-6膽囊腺癌與膽囊腺瘤P53基因表達(dá)陽(yáng)性率的比較

10551表7-6膽囊腺癌與膽囊腺瘤P53基因表達(dá)陽(yáng)性105151

本例a+b+c+d=10,由表7-7可看出,四格表內(nèi)各種組合以i=4和i=5的組合為中心呈對(duì)稱分布。

表7-7例7-5的Fisher確切概率法計(jì)算表

*為現(xiàn)有樣本10552本例a+b+c+d=10,由表7-105152(1)計(jì)算現(xiàn)有樣本的D*和P*及各組合下四格表的Di。本例D*=50,P*=0.02708978。(2)計(jì)算滿足Di≥50條件的各組合下四格表的概率Pi。(3)計(jì)算同時(shí)滿足Di≥50和Pi≤P*條件的四格表的累計(jì)概率。本例為P7和P8,(4)計(jì)算雙側(cè)累計(jì)概率P。

P>0.05,按α=0.05檢驗(yàn)水準(zhǔn)不拒絕H0,尚不能認(rèn)為膽囊腺癌與膽囊腺瘤的P53基因表達(dá)陽(yáng)性率不等。10553(1)計(jì)算現(xiàn)有樣本的D*和P*及各組合下四格表的D105153注意:10554注意:105154第四節(jié)行×列表資料的檢驗(yàn)

10555第四節(jié)行×列表資料的檢驗(yàn)105155行×列表資料①

多個(gè)樣本率比較時(shí),有R行2列,稱為R×2表;②

兩個(gè)樣本的構(gòu)成比比較時(shí),有2行C列,稱2×C表;③

多個(gè)樣本的構(gòu)成比比較,以及雙向無(wú)序分類資料關(guān)聯(lián)性檢驗(yàn)時(shí),有行列,稱為R×C表。10556行×列表資料①

多個(gè)樣本率比較時(shí),有R行2列,稱為105156檢驗(yàn)統(tǒng)計(jì)量10557檢驗(yàn)統(tǒng)計(jì)量105157一、多個(gè)樣本率的比較10558一、多個(gè)樣本率的比較105158

例7-6

某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見表7-8。問三種療法的有效率有無(wú)差別?表7-8三種療法有效率的比較10559例7-6某醫(yī)師研究物理療法、藥105159檢驗(yàn)步驟:10560檢驗(yàn)步驟:105160二、樣本構(gòu)成比的比較10561二、樣本構(gòu)成比的比較105161

例7-7

某醫(yī)師在研究血管緊張素I轉(zhuǎn)化酶(ACE)基因I/D多態(tài)(分3型)與2型糖尿病腎病(DN)的關(guān)系時(shí),將249例2型糖尿病患者按有無(wú)糖尿病腎病分為兩組,資料見表7-9。問兩組2型糖尿病患者的ACE基因型總體分布有無(wú)差別?表7-9DN組與無(wú)DN組2型糖尿病患者ACE基因型分布的比較

10562例7-7某醫(yī)師在研究血管緊張素105162檢驗(yàn)步驟10563檢驗(yàn)步驟105163三、雙向無(wú)序分類資料的關(guān)聯(lián)性檢驗(yàn)

表中兩個(gè)分類變量皆為無(wú)序分類變量的行列表資料,又稱為雙向無(wú)序表資料。

10564三、雙向無(wú)序分類資料的關(guān)聯(lián)性檢驗(yàn)

105164

注意:雙向無(wú)序分類資料為兩個(gè)或多個(gè)樣本,做差別檢驗(yàn)(例7-7);若為單樣本,做關(guān)聯(lián)性檢驗(yàn)。

10565注意:雙向無(wú)序分類資料為兩個(gè)或105165例7-8

測(cè)得某地5801人的ABO血型和MN血型結(jié)果如表7-10,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?

表7-10某地5801人的血型

(單樣本,做關(guān)聯(lián)性檢驗(yàn))10566例7-8測(cè)得某地5801人的ABO血型和MN105166

表7-10資料,可用行×列表資料檢驗(yàn)來(lái)推斷兩個(gè)分類變量之間有無(wú)關(guān)系(或關(guān)聯(lián));若有關(guān)系,可計(jì)算Pearson列聯(lián)系數(shù)C進(jìn)一步分析關(guān)系的密切程度:

列聯(lián)系數(shù)C取值范圍在0~1之間。0表示完全獨(dú)立;1表示完全相關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。

10567表7-10資料,可用行×列表105167檢

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論