最新卡方檢驗(yàn)解釋_第1頁(yè)
最新卡方檢驗(yàn)解釋_第2頁(yè)
最新卡方檢驗(yàn)解釋_第3頁(yè)
最新卡方檢驗(yàn)解釋_第4頁(yè)
最新卡方檢驗(yàn)解釋_第5頁(yè)
已閱讀5頁(yè),還剩73頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、卡方檢驗(yàn)解釋醫(yī)學(xué)統(tǒng)計(jì)學(xué)- e-mail: 主講內(nèi)容第一第一 概述概述基本思想基本思想第二第二 2 22 2表卡方檢驗(yàn)表卡方檢驗(yàn)第三第三 配對(duì)四格表卡方檢驗(yàn)配對(duì)四格表卡方檢驗(yàn)第四第四 r rc c表卡方檢驗(yàn)表卡方檢驗(yàn)第五第五 fisherfisher確切概率檢驗(yàn)確切概率檢驗(yàn)第六第六 多個(gè)樣本率的多重比較多個(gè)樣本率的多重比較第七有序分組資料的線(xiàn)性趨勢(shì)檢驗(yàn)第七有序分組資料的線(xiàn)性趨勢(shì)檢驗(yàn) 2卡方檢驗(yàn)概述p136 研究目的:率研究目的:率 or 構(gòu)成比構(gòu)成比的假設(shè)檢驗(yàn)(大樣本率或的假設(shè)檢驗(yàn)(大樣本率或 小樣本率)小樣本率) 資料類(lèi)型:計(jì)數(shù)資料資料類(lèi)型:計(jì)數(shù)資料 基本思想:基本思想: 檢驗(yàn)中的檢驗(yàn)中的 是

2、希臘字母,稱(chēng)為卡方是希臘字母,稱(chēng)為卡方檢驗(yàn),是一種用途較廣的計(jì)數(shù)資料的假設(shè)檢驗(yàn)方法,檢驗(yàn),是一種用途較廣的計(jì)數(shù)資料的假設(shè)檢驗(yàn)方法,屬于非參數(shù)檢驗(yàn)的范疇,主要是比較兩個(gè)及兩個(gè)以屬于非參數(shù)檢驗(yàn)的范疇,主要是比較兩個(gè)及兩個(gè)以上樣本率上樣本率( 構(gòu)成比)以及兩個(gè)分類(lèi)變量的關(guān)聯(lián)性分構(gòu)成比)以及兩個(gè)分類(lèi)變量的關(guān)聯(lián)性分析。其根本思想就是在于比較理論頻數(shù)和實(shí)際頻數(shù)析。其根本思想就是在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或擬合優(yōu)度問(wèn)題。的吻合程度或擬合優(yōu)度問(wèn)題。22檢驗(yàn)的應(yīng)用 檢驗(yàn)兩個(gè)樣本率之間差別的顯著性; 檢驗(yàn)多個(gè)樣本率或構(gòu)成比之間差別的顯著性; 檢驗(yàn)兩個(gè)雙向無(wú)序分類(lèi)變量是否存在關(guān)聯(lián); 配對(duì)計(jì)數(shù)資料的比較。2

3、一、兩獨(dú)立樣本率檢驗(yàn)一、兩獨(dú)立樣本率檢驗(yàn)(一)(一)兩獨(dú)立樣本率資料的四格表形式 例例7-1 為研究腫瘤標(biāo)志物癌胚抗原(為研究腫瘤標(biāo)志物癌胚抗原(cea)對(duì)肺癌的診斷價(jià)值,隨機(jī)抽取對(duì)肺癌的診斷價(jià)值,隨機(jī)抽取72例確診為肺癌的例確診為肺癌的患者為肺癌組,患者為肺癌組,114例接受健康體檢的非肺癌患例接受健康體檢的非肺癌患者為對(duì)照組。用者為對(duì)照組。用cea對(duì)其進(jìn)行檢測(cè),結(jié)果呈陽(yáng)性對(duì)其進(jìn)行檢測(cè),結(jié)果呈陽(yáng)性反應(yīng)者病例組中反應(yīng)者病例組中33例,對(duì)照組中例,對(duì)照組中10例。問(wèn)兩組人例。問(wèn)兩組人群的群的cea陽(yáng)性率有無(wú)差異?陽(yáng)性率有無(wú)差異? 表表7-1 cea對(duì)兩組人群的診斷結(jié)果對(duì)兩組人群的診斷結(jié)果* *

4、括號(hào)內(nèi)為理論頻數(shù)。 本例資料經(jīng)整理成表本例資料經(jīng)整理成表7-1形式,即有形式,即有兩個(gè)處理組,每個(gè)處理組的例數(shù)由發(fā)生數(shù)兩個(gè)處理組,每個(gè)處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有和未發(fā)生數(shù)兩部分組成。表內(nèi)有33、39、10、104 四個(gè)基本數(shù)據(jù),其余數(shù)據(jù)均由此四個(gè)基本數(shù)據(jù),其余數(shù)據(jù)均由此四個(gè)數(shù)據(jù)推算出來(lái)的,故稱(chēng)四格表資料。四個(gè)數(shù)據(jù)推算出來(lái)的,故稱(chēng)四格表資料。(二)(二) 檢驗(yàn)的基本思想檢驗(yàn)的基本思想2處處理理組組 發(fā)發(fā)生生數(shù)數(shù) 未未發(fā)發(fā)生生數(shù)數(shù) 合合計(jì)計(jì) 甲甲 a b a+b 乙乙 c d c+d 合合 計(jì)計(jì) a+c b+d n 表表7-2 四格表資料的基本形式四格表資料的基本形式 基本思

5、想:可通過(guò)基本思想:可通過(guò) 檢驗(yàn)的基本公式檢驗(yàn)的基本公式來(lái)理解。來(lái)理解。22(), ()(1)a tt行數(shù)-1 列數(shù)式中,式中,a為實(shí)際頻數(shù)(為實(shí)際頻數(shù)(actual frequency),), t為理論頻數(shù)(為理論頻數(shù)(theoretical frequency)。)。2 理論頻數(shù)理論頻數(shù) 是根據(jù)檢驗(yàn)設(shè)是根據(jù)檢驗(yàn)設(shè) ,且,且用合并率用合并率 來(lái)估計(jì)而定的。來(lái)估計(jì)而定的。 t012:h (72)acacabcdn11()() (73)aab acttn21()() (74)ccd acttn理論頻數(shù)由下式求得:理論頻數(shù)由下式求得: r crcn ntn式中,式中,trc 為第為第r 行行c 列

6、的理論頻數(shù)列的理論頻數(shù) nr 為相應(yīng)的行合計(jì)為相應(yīng)的行合計(jì) nc 為相應(yīng)的列合計(jì)為相應(yīng)的列合計(jì) 檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量 值反映了實(shí)際頻數(shù)與值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。理論頻數(shù)的吻合程度。 若檢驗(yàn)假設(shè)若檢驗(yàn)假設(shè)h0:1=2成立,四個(gè)格子的實(shí)際成立,四個(gè)格子的實(shí)際頻數(shù)頻數(shù)a 與理論頻數(shù)與理論頻數(shù)t 相差不應(yīng)該很大,即統(tǒng)計(jì)量相差不應(yīng)該很大,即統(tǒng)計(jì)量 不應(yīng)該很大。如果不應(yīng)該很大。如果 值很大,即相對(duì)應(yīng)的值很大,即相對(duì)應(yīng)的p 值很值很小,若小,若 ,則反過(guò)來(lái)推斷,則反過(guò)來(lái)推斷a與與t相差太大,超相差太大,超出了抽樣誤差允許的范圍,從而懷疑出了抽樣誤差允許的范圍,從而懷疑h0的正確性,的正確性,繼

7、而拒絕繼而拒絕h0,接受其對(duì)立假設(shè),接受其對(duì)立假設(shè)h1,即,即12 。p22 由公式(由公式(7-1)還可以看出:)還可以看出: 值的大小還取決于值的大小還取決于 個(gè)數(shù)的多少(嚴(yán)格地說(shuō)是自由度個(gè)數(shù)的多少(嚴(yán)格地說(shuō)是自由度的大?。S捎诟鞯拇笮。S捎诟?皆是正值,故自由度皆是正值,故自由度愈大,愈大, 值也會(huì)愈大;所以只有考慮值也會(huì)愈大;所以只有考慮了自由度了自由度的影響,的影響, 值才能正確地反映實(shí)際頻數(shù)值才能正確地反映實(shí)際頻數(shù)a和理論和理論頻數(shù)頻數(shù)t 的吻合程度。的吻合程度。 檢驗(yàn)的自由度取決于可以自由取值的格檢驗(yàn)的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量子數(shù)目,而不是樣本含量n

8、 n。四格表資料只。四格表資料只有兩行兩列,有兩行兩列,=1=1,即在周邊合計(jì)數(shù)固定的情,即在周邊合計(jì)數(shù)固定的情況下,況下,4 4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值。取值。 22()a tt2()a tt222(1) 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。h0:1=2h1:12=0.05。(三)(三) 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(2)求檢驗(yàn)統(tǒng)計(jì)量值)求檢驗(yàn)統(tǒng)計(jì)量值 1172 43/18616.6t ,1272 16.655.4t 2143 16.626.4t,2211426.487.6t。 1) 12)(12( 22222(33 16.6)(3955.4)

9、(1026.4)(10487.6)16.655.426.487.611112()34.3216.416.655.426.487.6四格表資料檢驗(yàn)的專(zhuān)用公式四格表資料檢驗(yàn)的專(zhuān)用公式22()()()()()ad bc na b a c b d c d2186(33 104 10 39)234.1072 43 143 114( (四四) )四格表資料檢驗(yàn)的校正公式四格表資料檢驗(yàn)的校正公式 22(0.5)ca tt22()2()()()()cn|ad -bc|-n=a+b c+d a+c b+d 分布是一連續(xù)型分布,而四分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計(jì)算格表資料屬離散型分布,由此計(jì)

10、算得的得的 統(tǒng)計(jì)量的抽樣分布亦呈離散統(tǒng)計(jì)量的抽樣分布亦呈離散性質(zhì)。為改善性質(zhì)。為改善 統(tǒng)計(jì)量分布的連續(xù)統(tǒng)計(jì)量分布的連續(xù)性,則進(jìn)行連續(xù)性校正。性,則進(jìn)行連續(xù)性校正。222四格表資料 檢驗(yàn)公式選擇條件: 40, 5nt2 ,不校正的理論或?qū)S霉剑?,校正公式; ,直接計(jì)算概率 (fisher)。40, 15nt40 1nt或 連續(xù)性校正僅用于連續(xù)性校正僅用于 的四格表資料,當(dāng)?shù)乃母癖碣Y料,當(dāng) 時(shí),一般不作校正。時(shí),一般不作校正。 212 例例7-2 將將116例癲癇患者隨機(jī)分例癲癇患者隨機(jī)分為兩組,一組為兩組,一組70例接受常規(guī)加高壓氧例接受常規(guī)加高壓氧治療(高壓氧組),另一組治療(高壓氧組),

11、另一組46例接受例接受常規(guī)治療(常規(guī)組),治療結(jié)果見(jiàn)表常規(guī)治療(常規(guī)組),治療結(jié)果見(jiàn)表7-3。問(wèn)兩種療法的有效率有無(wú)差別?問(wèn)兩種療法的有效率有無(wú)差別? 表7-3 兩種療法治療癲癇的效果 治療結(jié)果 治療方法 有效 無(wú)效 合計(jì) 有效率(%) 高壓氧組 66(62.8) 4(7.2) 70 94.3 常規(guī)組 38(41.2) 8(4.8) 46 82.6 合 計(jì) 104 12 116 89.7 012112:, :, 0.05hh 本例 ,故用四格表資料 檢驗(yàn)的校正公式22116, 4.8nt但2 ,查 界值表得 。按 檢驗(yàn)水準(zhǔn)不拒絕 ,尚不能認(rèn)為組有效率不等。 1210. 005. 0 p05.

12、00h2(66 84 38116 2)11622.9270 46 104 12c 本資料若不校正時(shí),本資料若不校正時(shí), 結(jié)論與之相反。結(jié)論與之相反。24.080.05p,(四)卡方檢驗(yàn)的連續(xù)性校正問(wèn)題s贊成依據(jù)是:這樣做可使卡方統(tǒng)計(jì)量抽樣分布的連續(xù)性和平滑性得到改善,可以降低i類(lèi)錯(cuò)誤的概率,連續(xù)性校正后的卡方檢驗(yàn),其結(jié)果更接近于fisher確切概率法。不過(guò),校正也不是無(wú)條件的,它只適合于自由度為1時(shí),樣本含量較小,如n40,或至少有一個(gè)格子的理論頻數(shù)太小,如t5的情形。(四)卡方檢驗(yàn)的連續(xù)性校正問(wèn)題s反對(duì)依據(jù)是:經(jīng)連續(xù)性校正后,p值有過(guò)分保守之嫌。此外,fisher確切概率法建立在四格表雙邊固

13、定的假定下,而實(shí)際資料則是單邊固定的四格表,連續(xù)性校正卡方檢驗(yàn)的p值與fisher確切概率法的p值沒(méi)有可比性。就應(yīng)用而言,無(wú)論是否經(jīng)過(guò)連續(xù)性校就應(yīng)用而言,無(wú)論是否經(jīng)過(guò)連續(xù)性校正,若兩種檢驗(yàn)的結(jié)果一致,無(wú)須在正,若兩種檢驗(yàn)的結(jié)果一致,無(wú)須在此問(wèn)題上糾纏。但是,當(dāng)兩種檢驗(yàn)結(jié)此問(wèn)題上糾纏。但是,當(dāng)兩種檢驗(yàn)結(jié)果相互矛盾時(shí),如例果相互矛盾時(shí),如例7-27-2,就需要謹(jǐn),就需要謹(jǐn)慎解釋結(jié)果了。慎解釋結(jié)果了。為客觀(guān)起見(jiàn),建議將兩種結(jié)論同時(shí)報(bào)為客觀(guān)起見(jiàn),建議將兩種結(jié)論同時(shí)報(bào)告出來(lái),以便他人判斷。當(dāng)然,如果告出來(lái),以便他人判斷。當(dāng)然,如果兩種結(jié)論一致,如均為或,則只報(bào)道兩種結(jié)論一致,如均為或,則只報(bào)道非連續(xù)性檢

14、驗(yàn)的結(jié)果即可。非連續(xù)性檢驗(yàn)的結(jié)果即可。第第二二節(jié)節(jié)、兩相關(guān)樣本率檢驗(yàn)兩相關(guān)樣本率檢驗(yàn)(mcnemar檢驗(yàn))檢驗(yàn)) 配對(duì)四格表資料的配對(duì)四格表資料的 檢驗(yàn)檢驗(yàn)2與計(jì)量資料推斷兩總體均數(shù)是否與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)和配對(duì)設(shè)計(jì)一樣,有差別有成組設(shè)計(jì)和配對(duì)設(shè)計(jì)一樣,計(jì)數(shù)資料推斷兩個(gè)總體率(構(gòu)成比)計(jì)數(shù)資料推斷兩個(gè)總體率(構(gòu)成比)是否有差別也有成組設(shè)計(jì)和配對(duì)設(shè)計(jì),是否有差別也有成組設(shè)計(jì)和配對(duì)設(shè)計(jì),即即四格表資料四格表資料和和配對(duì)四格表資料配對(duì)四格表資料。 例例7-3某抗癌新藥的毒理研究中,將某抗癌新藥的毒理研究中,將78只大鼠按性別、窩別、體重、年齡等因只大鼠按性別、窩別、體重、年齡

15、等因素配成素配成39對(duì),每個(gè)對(duì)子的兩只大鼠經(jīng)隨機(jī)對(duì),每個(gè)對(duì)子的兩只大鼠經(jīng)隨機(jī)分配,分別接受甲劑量和乙劑量注射,試分配,分別接受甲劑量和乙劑量注射,試驗(yàn)結(jié)果見(jiàn)表驗(yàn)結(jié)果見(jiàn)表7-4。試分析該新藥兩種不同劑。試分析該新藥兩種不同劑量的毒性有無(wú)差異。量的毒性有無(wú)差異。 表表7-4 某抗癌新藥兩種劑量的毒理實(shí)驗(yàn)結(jié)果某抗癌新藥兩種劑量的毒理實(shí)驗(yàn)結(jié)果 乙劑量 甲劑量 死亡() 生存() 合 計(jì) 死亡() 6(a) 12(b) 18 生存() 3(c) 18(d) 21 合 計(jì) 9 30 39 上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言,兩種處理的結(jié)果不外乎有言,兩種處理的結(jié)果不外乎有四

16、種可能四種可能:兩只大鼠均死亡(甲兩只大鼠均死亡(甲乙乙)數(shù)數(shù)(a);兩只均生存(甲兩只均生存(甲乙乙)數(shù)數(shù)(d);其中一只死亡(甲其中一只死亡(甲乙乙 )數(shù)數(shù)(b);其中一只死亡(甲其中一只死亡(甲乙乙)數(shù)數(shù) (c)。其中,其中,a, d 為兩法觀(guān)察結(jié)果一致的兩種情況,為兩法觀(guān)察結(jié)果一致的兩種情況, b, c為兩法觀(guān)察結(jié)果不一致的兩種情況為兩法觀(guān)察結(jié)果不一致的兩種情況。cbcb22)(, 1 cbcbc22) 1(, 1= 檢驗(yàn)統(tǒng)計(jì)量為檢驗(yàn)統(tǒng)計(jì)量為h0: 總體四格表中甲乙 的對(duì)子數(shù)與甲乙的對(duì)子數(shù)出現(xiàn)頻率相同 (兩劑量毒性相同) ; h1: 總體四格表中甲乙 的對(duì)子數(shù)與甲乙的對(duì)子數(shù)出現(xiàn)頻率不同

17、 (兩劑量毒性不同) ; =0.05 已知樣本四格表中,b=12,c=3,因 b+c=15,故將其代入公式 9-13,有 查附表 8,20.025,15.02,20.05,13.84,得 0.025p0.05,按=0.05 水準(zhǔn)拒絕 h0,接受 h1,可以認(rèn)為兩種劑量的毒性有差異,甲劑量組的死亡率較高(因 bc) 。 27. 4312) 1321(22c注意:注意: 本法一般用于樣本含量不太大的資料。因本法一般用于樣本含量不太大的資料。因?yàn)樗鼉H考慮了兩法結(jié)果不一致的兩種情況為它僅考慮了兩法結(jié)果不一致的兩種情況(b, c),而未考慮樣本含量而未考慮樣本含量n和兩法結(jié)果一致的兩種情和兩法結(jié)果一致的

18、兩種情況況(a, d)。所以,當(dāng)。所以,當(dāng)n很大且很大且a與與d的數(shù)值很大的數(shù)值很大(即兩法的一致率較高),(即兩法的一致率較高),b與與c的數(shù)值相對(duì)較的數(shù)值相對(duì)較小時(shí),即便是檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際小時(shí),即便是檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際意義往往也不大。意義往往也不大。第第三三節(jié)節(jié)r c表 檢驗(yàn) 2行行列表資料列表資料 多個(gè)樣本率比較時(shí),有r行2列,稱(chēng)為r 2表; 兩個(gè)樣本的構(gòu)成比比較時(shí),有2行c列,稱(chēng)2c表; 多個(gè)樣本的構(gòu)成比比較,以及雙向無(wú)序分類(lèi)資料關(guān)聯(lián)性檢驗(yàn)時(shí),有行列,稱(chēng)為r c表。檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量22(1)(1)(1)rcann n行數(shù)列數(shù)一、多個(gè)樣本率的比較一、多個(gè)樣本率的

19、比較 例7-4用a、b、c三種不同方法分別處理新生兒臍帶,發(fā)生感染的情況見(jiàn)表7-6,試比較3種不同方法的臍帶感染率有無(wú)差異。 表9-6 三種臍帶處理方法的臍帶感染情況 臍帶感染 處理組 感染 未感染 合計(jì) 感染率(%) a 76 3143 3219 2.36 b 15 2409 2424 0.62 c 2 762 764 0.26 合計(jì) 93 6314 6407 1.45 二、兩組構(gòu)成比的比較 例7-5為研究某種新藥對(duì)尿路疼痛的止痛效果,將有尿路疼痛的患者144例隨機(jī)分為兩組,每組72例,一組服該新藥(治療組),另一組服安慰劑(對(duì)照組)。兩組患者尿路疼痛的原因見(jiàn)表7-7,問(wèn)兩組患者尿路疼痛原因

20、的分布有無(wú)差異? 表7-7 兩組患者尿路疼痛原因的分布 尿路疼痛原因 分 組 尿路感染 器械損傷 其它 合計(jì) 治療組 34 29 9 72 對(duì)照組 29 35 8 72 合 計(jì) 63 64 17 144 2. 求檢驗(yàn)統(tǒng)計(jì)量和自由度。將表 9-7 數(shù)據(jù)代入公式 9-14,有 22222234299293582144(1)1.027263726472 177263726472 17(21)(31)2 3. 確定 p 值,下結(jié)論。查2界值表,20.5,21.39, 20.5,21.018,所以,p0.50,以0.05水準(zhǔn)不拒絕 h0,即尚不能認(rèn)為兩組患者尿路疼痛原因的分布有差異。 三、多組構(gòu)成比的比

21、較例例7-6 在某項(xiàng)疼痛測(cè)量研究中,給160例手術(shù)后疼痛的患者提供四種疼痛測(cè)量量表,即直觀(guān)模擬量表(vas),數(shù)字評(píng)估量表(nrs),詞語(yǔ)描述量表(vds),面部表情疼痛量表(fps),患者首選的量表以及患者的文化程度見(jiàn)表7-8,問(wèn)患者首選疼痛量表與文化程度是否有關(guān)? 表7-8 不同文化程度患者首選疼痛量表的類(lèi)型 首選測(cè)痛量表 文化程度 v as vds nrs fps 合計(jì) 高中以下 3(3.5) 16(18.7) 18(19.7) 44(39.0) 81 高中 0(1.6) 10(8.6) 9(9.0) 18(17.8) 37 高中以上 4(1.8) 11(9.7) 12(10.2) 15

22、(20.2) 42 合計(jì) 7 37 39 77 160 四、 r c表 檢驗(yàn)的條件21行列表中的各格t1,并且1t5的格子數(shù)不宜超過(guò)1/5格子總數(shù),否則可能產(chǎn)生偏性。處理方法有三種: 增大樣本含量以達(dá)到增大理論頻數(shù)的目的,屬首選方法,只是有些研究無(wú)法增大樣本含量,如同一批號(hào)試劑已用完等。根據(jù)專(zhuān)業(yè)知識(shí),刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并。這樣做會(huì)損失信息及損害樣本的隨機(jī)性。注意注意:不同年齡組可以合并,但不同血型就不能合并。改用雙向無(wú)序rc表的fisher確切概率法(可用sas軟件實(shí)現(xiàn))。第四節(jié)、fisher確切概率檢驗(yàn) 確切概率檢驗(yàn)是由fisher 1

23、934年提出的一種用于兩個(gè)獨(dú)立樣本率比較的方法,故又稱(chēng)fisher確切概率法。有人認(rèn)為,當(dāng)樣本量n和理論頻數(shù)t太小時(shí),如n40而且t5,或t1,或n20,應(yīng)該用確切概率檢驗(yàn)。這一觀(guān)點(diǎn)所基于的理論是,當(dāng)樣本量太小時(shí),二項(xiàng)分布的正態(tài)逼近性較差,因而不宜用基于正態(tài)分布的檢驗(yàn)。提出上述條件的另外一種考慮是確切概率法的計(jì)算量偏大,但隨著計(jì)算工具的大大改進(jìn),確切概率法的應(yīng)用不一定限于上述條件。例7-4 某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染hbv的效果,將33例hbsag陽(yáng)性孕婦隨機(jī)分為預(yù)防注射組和非預(yù)防組,結(jié)果見(jiàn)表7-4。問(wèn)兩組新生兒的hbv總體感染率有無(wú)差別? 組別組別陽(yáng)性陽(yáng)性陰性陰性合計(jì)合計(jì)感染

24、率感染率(%) 預(yù)防注射預(yù)防注射組組4182218.18 非預(yù)防組非預(yù)防組5 61145.45 合計(jì)合計(jì)9243327.27基本思想 在四格表周邊合計(jì)數(shù)固定不變的條件下,計(jì)算表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)的各種組合之概率;再按檢驗(yàn)假設(shè)用單側(cè)或雙側(cè)的累計(jì)概率,依據(jù)所取的檢驗(yàn)水準(zhǔn)做出推斷。1各組合概率的計(jì)算 在四格表周邊合計(jì)數(shù)不變的條件下,表內(nèi)4個(gè)實(shí)際頻數(shù),變動(dòng)的組合數(shù)共有“周邊合計(jì)中最小數(shù)+1”個(gè)。如例7-4,表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)的組合數(shù)共有個(gè),依次為: (1)(2)(3)(4)(5)0221212203194189 28 37 46 55 6(6)(7)(8)(9)(10)51761671581491

25、34 73 82 9110011 1計(jì)算現(xiàn)有樣本四格表的和及各組合下四格表的,見(jiàn)表7-5。本例、。 2計(jì)算滿(mǎn)足條件的各組合下四格表的概率。 3計(jì)算同時(shí)滿(mǎn)足和條件的四格表的累計(jì)概率。本例 滿(mǎn)足條件,累計(jì)概率為 1234510pppppp、 、 、 、 、1210. 01054321ppppppps教材批p143 本例,宜用四格表資料的fisher確切概率法直接計(jì)算累計(jì)概率。檢驗(yàn)步驟為: :,即兩組新生兒hbv的總體感染率相等 :,即兩組新生兒hbv的總體感染率不等21210h1hibcaddiipabcd四格表組合四格表組合102292-1980.00000143212183-1650.0000

26、9412322074-1320.00197656431965-990.018447855*41856-66*0.08762728*651747-337616380871529339814110660.0912039010913011990.01289752bcaddiip第五節(jié) 多個(gè)樣本率間的多重比較 當(dāng)多個(gè)樣本率比較的表資料檢驗(yàn),推斷結(jié)論為拒絕,接受時(shí),只能認(rèn)為各總體率之間總的來(lái)說(shuō)有差別,但不能說(shuō)明任兩個(gè)總體率之間有差別。要進(jìn)一步推斷哪兩兩總體間有差別,若直接用四格表資料的檢驗(yàn)進(jìn)行多重比較,將會(huì)加大犯類(lèi)錯(cuò)誤的概率。 1多個(gè)實(shí)驗(yàn)組間的兩兩比較 , ,k 為樣本率的個(gè)數(shù)。 12+k=2)1(2k

27、kk2、實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較 ) 1(2k第六節(jié) 雙向無(wú)序分類(lèi)資料的關(guān)聯(lián)性檢驗(yàn) 例例 7-8 測(cè)得某地測(cè)得某地5801人的人的abo血型和血型和mn血型血型結(jié)果如表,問(wèn)兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?結(jié)果如表,問(wèn)兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?abo血型血型mn血型血型合計(jì)合計(jì)mnmno4314909021823a3884108001598b4955879502032a計(jì)合計(jì)1451166626845801步驟 1、建立檢驗(yàn)假設(shè) 2、計(jì)算檢驗(yàn)統(tǒng)計(jì)量 3、求出p值,作結(jié)論 注意:若須進(jìn)一步分析關(guān)系的密切程度時(shí),可計(jì)算pearson列聯(lián)系數(shù)22cn第七節(jié) 有序分組資料的線(xiàn)性

28、趨勢(shì)檢驗(yàn) 例7-11 某研究者欲研究年齡與冠狀動(dòng)脈粥樣硬化等級(jí)之間的關(guān)系,將278例尸解資料整理成表7-13,問(wèn)年齡與冠狀動(dòng)脈粥樣硬化等級(jí)之間是否存在線(xiàn)性變化趨勢(shì)?表表7-13 7-13 年齡與冠狀動(dòng)脈硬化的關(guān)系年齡與冠狀動(dòng)脈硬化的關(guān)系年齡年齡( (歲歲) )(x)(x)冠狀動(dòng)脈硬化等級(jí)冠狀動(dòng)脈硬化等級(jí)(y)(y)合計(jì)合計(jì)+ +2020707022224 42 298983030272724249 93 3636340401616232313137 7595950509 92020151514145858合計(jì)合計(jì)122122898941412626278278步驟 1、建立檢驗(yàn)假設(shè) 2、計(jì)算檢

29、驗(yàn)統(tǒng)計(jì)量 3、求出p值,作結(jié)論 注意:基本思想是: 首先計(jì)算表資料的值,然后將總的值分解成線(xiàn)性回歸分量與偏離線(xiàn)性回歸分量。若兩分量均有統(tǒng)計(jì)學(xué)意義,說(shuō)明兩個(gè)分類(lèi)變量存在相關(guān)關(guān)系,但關(guān)系不是簡(jiǎn)單的直線(xiàn)關(guān)系;若線(xiàn)性回歸分量有統(tǒng)計(jì)學(xué)意義,偏離線(xiàn)性回歸分量無(wú)統(tǒng)計(jì)學(xué)意義時(shí),說(shuō)明兩個(gè)分類(lèi)變量不僅存在相關(guān)關(guān)系,而且是線(xiàn)性關(guān)系。 nonzero correlation 8 63.3895 .0001 chi-square 1 71.4325 .0001data ex7_11; input r c f ;cards;1 1 701 2 221 3 41 4 22 1 272 2 242 3 92 4 33 1 1

30、63 2 233 3 133 4 74 1 94 2 204 3 154 4 14;proc freq; weight f; tables r*c /cmh1;run;注意注意 雙向有序?qū)傩圆煌谋碣Y料 表資料中兩個(gè)分類(lèi)變量皆為有序的,但屬性不同,如表7-13。對(duì)于該類(lèi)資料,若研究目的為分析不同年齡組患者療效之間有無(wú)差別時(shí),可把它視為單向有序表資料,選用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn);若研究目的為分析兩個(gè)有序分類(lèi)變量間是否存在相關(guān)關(guān)系,宜用等級(jí)相關(guān)分析或pearson積矩相關(guān)分析(見(jiàn)第九章);若研究目的為分析兩個(gè)有序分類(lèi)變量間是否存在線(xiàn)性變化趨勢(shì),宜用本節(jié)所介紹的有序分組資料的線(xiàn)性趨勢(shì)檢驗(yàn)。summary 1、研究目的:率研究目的:率 or 構(gòu)成比構(gòu)成比的假設(shè)檢驗(yàn)(大樣本率或的假設(shè)檢驗(yàn)(大樣本率或 小樣本率)小樣本率) 2、資料類(lèi)型:計(jì)數(shù)資料資料類(lèi)型:計(jì)數(shù)資料 3、基本思想:基本思想: 根本思想就是在于比較理論頻數(shù)和實(shí)際頻數(shù)的根本思想就是在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或擬合優(yōu)度問(wèn)題。吻合程度或擬合優(yōu)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論