




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
醫(yī)學(xué)統(tǒng)計學(xué)第七章卡方檢驗1第一頁,共一百頁,2022年,8月28日
目的:推斷兩個總體率或構(gòu)成比之間有無差別多個總體率或構(gòu)成比之間有無差別多個樣本率的多重比較兩個分類變量之間有無關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗。
檢驗統(tǒng)計量:應(yīng)用:計數(shù)資料第二頁,共一百頁,2022年,8月28日第一節(jié)四格表資料的檢驗
3第三頁,共一百頁,2022年,8月28日目的:推斷兩個總體率(構(gòu)成比)是否有差別(和u檢驗等價)要求:兩樣本的兩分類個體數(shù)排列成四格表資料4第四頁,共一百頁,2022年,8月28日
(1)
分布是一種連續(xù)型分布:按分布的密度函數(shù)可給出自由度=1,2,3,……的一簇分布曲線(圖7-1)。(2)分布的一個基本性質(zhì)是可加性:如果兩個獨立的隨機(jī)變量X1和X2分別服從自由度ν1和ν2的分布,即,那么它們的和(X1+X2
)服從自由度(ν1+ν2
)的分布,即~。
一、檢驗的基本思想
1.分布5第五頁,共一百頁,2022年,8月28日6第六頁,共一百頁,2022年,8月28日
2.檢驗的基本思想
例7-1
某院欲比較異梨醇口服液(試驗組)和氫氯噻嗪+地塞米松(對照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機(jī)分為兩組,結(jié)果見表7-1。問兩組降低顱內(nèi)壓的總體有效率有無差別?7第七頁,共一百頁,2022年,8月28日表7-1兩組降低顱內(nèi)壓有效率的比較
8第八頁,共一百頁,2022年,8月28日表7-2兩組降低顱內(nèi)壓有效率的比較
9第九頁,共一百頁,2022年,8月28日
本例資料經(jīng)整理成圖7-2形式,即有兩個處理組,每個處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有四個基本數(shù)據(jù),其余數(shù)據(jù)均由此四個數(shù)據(jù)推算出來的,故稱四格表資料。10第十頁,共一百頁,2022年,8月28日
圖7-2四格表資料的基本形式
11第十一頁,共一百頁,2022年,8月28日基本思想:可通過檢驗的基本公式來理解。式中,A為實際頻數(shù)(actualfrequency),
T為理論頻數(shù)(theoreticalfrequency)。12第十二頁,共一百頁,2022年,8月28日理論頻數(shù)由下式求得:式中,TRC為第R行C列的理論頻數(shù)
nR為相應(yīng)的行合計
nC為相應(yīng)的列合計13第十三頁,共一百頁,2022年,8月28日
理論頻數(shù)是根據(jù)檢驗假設(shè),且用合并率來估計而定的。如上例,無效假設(shè)是試驗組與對照組降低顱內(nèi)壓的總體有效率相等,均等于合計的有效率87%。那么理論上,試驗組的104例顱內(nèi)壓增高癥患者中有效者應(yīng)為104(174/200)=90.48,無效者為104(26/200)=13.52;同理,對照組的96例顱內(nèi)壓增高癥患者中有效者應(yīng)為96(174/200)=83.52,無效者為96(26/200)=12.48。
14第十四頁,共一百頁,2022年,8月28日
檢驗統(tǒng)計量值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。若檢驗假設(shè)H0:π1=π2成立,四個格子的實際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,即統(tǒng)計量不應(yīng)該很大。如果值很大,即相對應(yīng)的P值很小,若,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對立假設(shè)H1,即π1≠π2。15第十五頁,共一百頁,2022年,8月28日
由公式(7-1)還可以看出:值的大小還取決于個數(shù)的多少(嚴(yán)格地說是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也會愈大;所以只有考慮了自由度ν的影響,值才能正確地反映實際頻數(shù)A和理論頻數(shù)T的吻合程度。檢驗的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,=1,即在周邊合計數(shù)固定的情況下,4個基本數(shù)據(jù)當(dāng)中只有一個可以自由取值。16第十六頁,共一百頁,2022年,8月28日(1)建立檢驗假設(shè),確定檢驗水平。H0:π1=π2即試驗組與對照組降低顱內(nèi)壓的總體有效率相等H1:π1≠π2
即試驗組與對照組降低顱內(nèi)壓的總體有效率不相等α=0.05。3.假設(shè)檢驗步驟17第十七頁,共一百頁,2022年,8月28日(2)求檢驗統(tǒng)計量值18第十八頁,共一百頁,2022年,8月28日19第十九頁,共一百頁,2022年,8月28日二、四格表資料檢驗的專用公式20第二十頁,共一百頁,2022年,8月28日
分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計算得的統(tǒng)計量的抽樣分布亦呈離散性質(zhì)。為改善統(tǒng)計量分布的連續(xù)性,則需行連續(xù)性校正。21第二十一頁,共一百頁,2022年,8月28日三、四格表資料檢驗的校正公式
22第二十二頁,共一百頁,2022年,8月28日四格表資料檢驗公式選擇條件:
,專用公式;,校正公式;,直接計算概率。
連續(xù)性校正僅用于的四格表資料,當(dāng)時,一般不作校正。
23第二十三頁,共一百頁,2022年,8月28日
例7-2
某醫(yī)師欲比較胞磷膽堿與神經(jīng)節(jié)苷酯治療腦血管疾病的療效,將78例腦血管疾病患者隨機(jī)分為兩組,結(jié)果見表7-3。問兩種藥物治療腦血管疾病的有效率是否相等?24第二十四頁,共一百頁,2022年,8月28日表7-3兩種藥物治療腦血管疾病有效率的比較25第二十五頁,共一百頁,2022年,8月28日
本例,故用四格表資料檢驗的校正公式
,查界值表得。按
檢驗水準(zhǔn)不拒絕,尚不能認(rèn)為兩種藥物治療腦血管疾病的有效率不等。
26第二十六頁,共一百頁,2022年,8月28日
本資料若不校正時,結(jié)論與之相反。27第二十七頁,共一百頁,2022年,8月28日第二節(jié)配對四格表資料的檢驗28第二十八頁,共一百頁,2022年,8月28日與計量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計和配對設(shè)計一樣,計數(shù)資料推斷兩個總體率(構(gòu)成比)是否有差別也有成組設(shè)計和配對設(shè)計,即四格表資料和配對四格表資料。29第二十九頁,共一百頁,2022年,8月28日
例7-3
某實驗室分別用乳膠凝集法和免疫熒光法對58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進(jìn)行測定,結(jié)果見表7-4。問兩種方法的檢測結(jié)果有無差別?30第三十頁,共一百頁,2022年,8月28日
表7-4兩種方法的檢測結(jié)果
31第三十一頁,共一百頁,2022年,8月28日
上述配對設(shè)計實驗中,就每個對子而言,兩種處理的結(jié)果不外乎有四種可能:①兩種檢測方法皆為陽性數(shù)(a);②兩種檢測方法皆為陰性數(shù)(d);③免疫熒光法為陽性,乳膠凝集法為陰性數(shù)(b);④乳膠凝集法為陽性,免疫熒光法為陰性數(shù)(c)。32第三十二頁,共一百頁,2022年,8月28日其中,a,d為兩法觀察結(jié)果一致的兩種情況,
b,c為兩法觀察結(jié)果不一致的兩種情況。檢驗統(tǒng)計量為33第三十三頁,共一百頁,2022年,8月28日注意:
本法一般用于樣本含量不太大的資料。因為它僅考慮了兩法結(jié)果不一致的兩種情況(b,c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a,d)。所以,當(dāng)n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對較小時,即便是檢驗結(jié)果有統(tǒng)計學(xué)意義,其實際意義往往也不大。34第三十四頁,共一百頁,2022年,8月28日檢驗步驟:35第三十五頁,共一百頁,2022年,8月28日第三節(jié)
四格表資料的Fisher確切概率法36第三十六頁,共一百頁,2022年,8月28日條件:理論依據(jù):超幾何分布(非檢驗的范疇)37第三十七頁,共一百頁,2022年,8月28日
例7-4
某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染HBV的效果,將33例HBsAg陽性孕婦隨機(jī)分為預(yù)防注射組和非預(yù)防組,結(jié)果見表7-5。問兩組新生兒的HBV總體感染率有無差別?
38第三十八頁,共一百頁,2022年,8月28日表7-5兩組新生兒HBV感染率的比較
39第三十九頁,共一百頁,2022年,8月28日一、基本思想
在四格表周邊合計數(shù)固定不變的條件下,計算表內(nèi)4個實際頻數(shù)變動時的各種組合之概率;再按檢驗假設(shè)用單側(cè)或雙側(cè)的累計概率,依據(jù)所取的檢驗水準(zhǔn)做出推斷。
40第四十頁,共一百頁,2022年,8月28日
1.各組合概率Pi的計算
在四格表周邊合計數(shù)不變的條件下,表內(nèi)4個實際頻數(shù)a,b,c,d變動的組合數(shù)共有“周邊合計中最小數(shù)+1”個。如例7-4,表內(nèi)4個實際頻數(shù)變動的組合數(shù)共有9+1=10個,依次為:41第四十一頁,共一百頁,2022年,8月28日各組合的概率Pi服從超幾何分布,其和為1。計算公式為!為階乘符號42第四十二頁,共一百頁,2022年,8月28日
2.累計概率的計算(單、雙側(cè)檢驗不同)
43第四十三頁,共一百頁,2022年,8月28日44第四十四頁,共一百頁,2022年,8月28日45第四十五頁,共一百頁,2022年,8月28日二、檢驗步驟()46第四十六頁,共一百頁,2022年,8月28日47第四十七頁,共一百頁,2022年,8月28日表7-6例7-4的
Fisher確切概率法計算表
48第四十八頁,共一百頁,2022年,8月28日
例7-5
某單位研究膽囊腺癌、腺瘤的P53基因表達(dá),對同期手術(shù)切除的膽囊腺癌、腺瘤標(biāo)本各10份,用免疫組化法檢測P53基因,資料見表7-7。問膽囊腺癌和膽囊腺瘤的P53基因表達(dá)陽性率有無差別?49第四十九頁,共一百頁,2022年,8月28日表7-7膽囊腺癌與膽囊腺瘤P53基因表達(dá)陽性率的比較
50第五十頁,共一百頁,2022年,8月28日
本例a+b+c+d=10,由表7-7可看出,四格表內(nèi)各種組合以i=4和i=5的組合為中心呈對稱分布。
表7-8例7-5的Fisher確切概率法計算表
*為現(xiàn)有樣本51第五十一頁,共一百頁,2022年,8月28日(1)計算現(xiàn)有樣本的D*和P*及各組合下四格表的Di。本例D*=50,P*=0.02708978。(2)計算滿足Di≥50條件的各組合下四格表的概率Pi。(3)計算同時滿足Di≥50和Pi≤P*條件的四格表的累計概率。本例為P7和P8,(4)計算雙側(cè)累計概率P。
P>0.05,按α=0.05檢驗水準(zhǔn)不拒絕H0,尚不能認(rèn)為膽囊腺癌與膽囊腺瘤的P53基因表達(dá)陽性率不等。52第五十二頁,共一百頁,2022年,8月28日注意:53第五十三頁,共一百頁,2022年,8月28日第四節(jié)行×列表資料的檢驗
54第五十四頁,共一百頁,2022年,8月28日行×列表資料①
多個樣本率比較時,有R行2列,稱為R×2表;②
兩個樣本的構(gòu)成比比較時,有2行C列,稱2×C表;③
多個樣本的構(gòu)成比比較,以及雙向無序分類資料關(guān)聯(lián)性檢驗時,有行列,稱為R×C表。55第五十五頁,共一百頁,2022年,8月28日檢驗統(tǒng)計量56第五十六頁,共一百頁,2022年,8月28日一、多個樣本率的比較57第五十七頁,共一百頁,2022年,8月28日
例7-6
某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見表7-9。問三種療法的有效率有無差別?表7-9三種療法有效率的比較58第五十八頁,共一百頁,2022年,8月28日檢驗步驟:59第五十九頁,共一百頁,2022年,8月28日二、樣本構(gòu)成比的比較60第六十頁,共一百頁,2022年,8月28日
例7-7
某醫(yī)師在研究血管緊張素I轉(zhuǎn)化酶(ACE)基因I/D多態(tài)(分3型)與2型糖尿病腎病(DN)的關(guān)系時,將249例2型糖尿病患者按有無糖尿病腎病分為兩組,資料見表7-10。問兩組2型糖尿病患者的ACE基因型總體分布有無差別?表7-9DN組與無DN組2型糖尿病患者ACE基因型分布的比較
61第六十一頁,共一百頁,2022年,8月28日檢驗步驟62第六十二頁,共一百頁,2022年,8月28日三、雙向無序分類資料的關(guān)聯(lián)性檢驗
表中兩個分類變量皆為無序分類變量的行列表資料,又稱為雙向無序表資料。
63第六十三頁,共一百頁,2022年,8月28日
注意:雙向無序分類資料為兩個或多個樣本,做差別檢驗(例7-7);若為單樣本,做關(guān)聯(lián)性檢驗。
64第六十四頁,共一百頁,2022年,8月28日例7-8
測得某地5801人的ABO血型和MN血型結(jié)果如表7-11,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?
表7-11某地5801人的血型
(單樣本,做關(guān)聯(lián)性檢驗)65第六十五頁,共一百頁,2022年,8月28日
表7-10資料,可用行×列表資料檢驗來推斷兩個分類變量之間有無關(guān)系(或關(guān)聯(lián));若有關(guān)系,可計算Pearson列聯(lián)系數(shù)C進(jìn)一步分析關(guān)系的密切程度:
列聯(lián)系數(shù)C取值范圍在0~1之間。0表示完全獨立;1表示完全相關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。
66第六十六頁,共一百頁,2022年,8月28日檢驗步驟67第六十七頁,共一百頁,2022年,8月28日由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認(rèn)為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。68第六十八頁,共一百頁,2022年,8月28日四、行×列表資料檢驗的注意事項69第六十九頁,共一百頁,2022年,8月28日1.行列表中的各格T≥1,并且1≤T<5的格子數(shù)不宜超過1/5格子總數(shù),否則可能產(chǎn)生偏性。處理方法有三種:
增大樣本含量以達(dá)到增大理論頻數(shù)的目的,屬首選方法,只是有些研究無法增大樣本含量,如同一批號試劑已用完等。70第七十頁,共一百頁,2022年,8月28日根據(jù)專業(yè)知識,刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并。這樣做會損失信息及損害樣本的隨機(jī)性。注意:不同年齡組可以合并,但不同血型就不能合并。改用雙向無序R×C表的Fisher確切概率法(可用SAS軟件實現(xiàn))。71第七十一頁,共一百頁,2022年,8月28日72第七十二頁,共一百頁,2022年,8月28日73第七十三頁,共一百頁,2022年,8月28日
第五節(jié)多個樣本率間的多重比較74第七十四頁,共一百頁,2022年,8月28日75第七十五頁,共一百頁,2022年,8月28日分割法
76第七十六頁,共一百頁,2022年,8月28日一、基本思想因分析目的不同,k個樣本率兩兩比較的次數(shù)不同,故重新規(guī)定的檢驗水準(zhǔn)的估計方法亦不同。通常有兩種情況:77第七十七頁,共一百頁,2022年,8月28日
78第七十八頁,共一百頁,2022年,8月28日79第七十九頁,共一百頁,2022年,8月28日80第八十頁,共一百頁,2022年,8月28日二、多個實驗組間的兩兩比較81第八十一頁,共一百頁,2022年,8月28日
例7-9
對例7-6中表7-8的資料進(jìn)行兩兩比較,以推斷是否任兩種療法治療周圍性面神經(jīng)麻痹的有效率均有差別?82第八十二頁,共一百頁,2022年,8月28日檢驗步驟本例為3個實驗組間的兩兩比較
83第八十三頁,共一百頁,2022年,8月28日表7-12三種療法有效率的兩兩比較
84第八十四頁,共一百頁,2022年,8月28日85第八十五頁,共一百頁,2022年,8月28日三、各實驗組與同一個對照組的比較86第八十六頁,共一百頁,2022年,8月28日
例7-10
以表7-8資料中的藥物治療組為對照組,物理療法組與外用膏藥組為試驗組,試分析兩試驗組與對照組的總體有效率有無差別?
本例為各實驗組與同一對照組的比較87第八十七頁,共一百頁,2022年,8月28日88第八十八頁,共一百頁,2022年,8月28日第六節(jié)有序分組資料的線性趁勢檢驗一、R*C表資料的分類及其檢驗方法的選擇
89第八十九頁,共一百頁,2022年,8月28日(1)雙向無序R×C表:目的為多個率或構(gòu)成比的比較,可用R×C列聯(lián)表χ2檢驗;(2)單向有序R×C表:有兩種形式
A)R×C表中分組變量是有序的(如年齡),而指標(biāo)變量是無序的(如腫瘤的類型),研究目的通常是分析不同年齡組各種疾病的構(gòu)成情況,可用R×C列聯(lián)表χ2檢驗;
B)R×C表中分組變量是無序的(如治療方法),而指標(biāo)變量是有序的(如療效),目的研究不同療法的療效,宜用秩和檢驗。90第九十頁,共一百頁,2022年,8月28日(3)雙向有序?qū)傩韵嗤腞×C表(2×2配對設(shè)計的擴(kuò)大):目的是分析兩種測定結(jié)果的概率分布有無差別宜用有關(guān)T統(tǒng)計量。如研究目的是分析兩種檢測方法的一致性,宜用一致性檢驗(Kappa檢驗)(4)雙向有序?qū)傩圆煌腞×C表A)若目的為分析不同年齡組患者療效之間有無差別時,可視為單向有序R×C表資料,選用秩和檢驗;B)若研究目的為分析兩有序分類變量間是否存在相關(guān)關(guān)系,宜用等級相關(guān)分析,或Pearson積差相關(guān)分析;C)若研究目的為分析兩有序分類變量間是否存在線性變化趨勢,宜用有序分組資料的線性趨勢檢驗。91第九十一頁,共一百頁,2022年,8月28日二、有序分組資料的線性趁勢檢驗基本思想:首先計算R*C表資料的值,然后將總值分解為線性回歸與偏離線性回歸分量。若兩分量均有統(tǒng)計學(xué)意義,說明兩個分類變量存在相關(guān)關(guān)系,但關(guān)系不是線性關(guān)系;若線性回歸分量有統(tǒng)計學(xué)意義,偏離線性回歸分量無統(tǒng)計學(xué)意義時,說明兩個分類變量存在相關(guān)關(guān)系,且關(guān)系為線性關(guān)系。92第九十二頁,共一百頁,2022年,8月28日計算步驟:1、首先計算總值2、線性回歸分量3、計算偏離線性回歸分量93第九十三頁,共一百頁,2022年,8月28日例7-11某研究者欲研究年齡與冠狀動脈硬化等級之間的關(guān)系,將278例尸解資料整理成表7-13,問年齡與冠狀動脈硬化等級是否存在線性變化趨勢?94第九十四頁,共一百頁,2022年,8月28日年齡
冠狀動脈硬化等級合計-++++++20~7022429830~2724936340~162313759≥50920151458合計12289412627895第九十五頁,共一百頁,2022年,8月28日H0:年齡與冠狀動脈硬化等級無線性變化趨勢H1:年齡與冠狀動脈硬化等級有線性變化趨勢變異來源自由度P總變異71.43259<0.005線性回歸分量63.18001<0.005偏離線性回歸分量8.252580.25~.596第九十六頁,共一百頁,2022年,8月28日第七節(jié)頻數(shù)分布擬合優(yōu)度的檢驗
97第
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 介紹采購居間合同范例
- 上海電梯安裝合同范例
- 單位借款買車合同范例
- 華為公司采購合同范例
- 單位承包食堂合同范例
- 伐木工人合同范本
- 出售進(jìn)口貨車合同范例
- 取樣員服務(wù)合同范例
- 住房指標(biāo)轉(zhuǎn)讓合同范例
- 勞動實習(xí)合同范例
- 2025年合肥經(jīng)濟(jì)技術(shù)職業(yè)學(xué)院單招職業(yè)技能測試題庫含答案
- 2025年河南應(yīng)用技術(shù)職業(yè)學(xué)院單招職業(yè)技能測試題庫新版
- 2025年上半年黑龍江鶴崗市興山區(qū)招聘事業(yè)單位人員5人重點基礎(chǔ)提升(共500題)附帶答案詳解-1
- 區(qū)域臨床檢驗中心
- 2024年版人民醫(yī)院新院建設(shè)施工合作合同一
- 基于大數(shù)據(jù)的拉薩旅游業(yè)市場分析
- 術(shù)后疼痛病人中醫(yī)護(hù)理
- 布局經(jīng)營-繪畫構(gòu)圖基礎(chǔ) 課件-2024-2025學(xué)年高中美術(shù)人美版(2019)選擇性必修1 繪畫
- 人力資源社會保障宣傳工作計劃及打算
- 語法辨析-中考語文真題題源解密(遼寧版)(帶答案)
- 養(yǎng)老院安全管理體系方案
評論
0/150
提交評論