




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
兩組兩分類資料檢驗(yàn)第1頁/共42頁兩組兩分類資料檢驗(yàn)第2頁/共42頁內(nèi)容卡方檢驗(yàn)入門1配對設(shè)計(jì)兩樣本率比較的χ2檢驗(yàn)2行列表資料的分析3確切概率法4第3頁/共42頁檢驗(yàn)分類資料服從某個(gè)分布設(shè)從總體A中隨機(jī)抽取一個(gè)樣本,樣本量為n,其資料分布如下:第4頁/共42頁檢驗(yàn)分類資料服從某個(gè)分布第5頁/共42頁舉例:某醫(yī)生收治在某地50個(gè)患者,其血型分別如下:已知該地區(qū)的一般人群的血型分布如下:問題:患病人群的血型是否屬于該地區(qū)一般人群的血樣分布血型ABABO人數(shù)1510817血型ABABO概率0.250.50.10.15第6頁/共42頁實(shí)例血型ABABO概率0.250.50.10.15理論數(shù)T12.525107.5第7頁/共42頁行列表資料的檢驗(yàn)卡方檢驗(yàn)是以卡方分布為基礎(chǔ)的一種常用假設(shè)檢驗(yàn)方法,主要用于分類變量,它基本的無效假設(shè)是:H0:行分類變量與列分類變量無關(guān)聯(lián)H1:行分類變量與列分類變量有關(guān)聯(lián)=0.05統(tǒng)計(jì)量,其中Ai是樣本資料的計(jì)數(shù),Ti是在H0為真的情況下的理論數(shù)(期望值)。第8頁/共42頁卡方檢驗(yàn)在H0為真時(shí),實(shí)際觀察數(shù)與理論數(shù)之差A(yù)i-Ti
應(yīng)該比較接近0。所以在H0為真時(shí),檢驗(yàn)統(tǒng)計(jì)量服從自由度為k-1的卡方分布。即:,拒絕H0。
上述卡方檢驗(yàn)由此派生了不同應(yīng)用背景的各種問題的檢驗(yàn),特別最常用的是兩個(gè)樣本率的檢驗(yàn)等。因?yàn)樵撛淼氖褂梅秶軓V,但本次課程只學(xué)習(xí)用于推斷兩個(gè)分類變量是否相互關(guān)聯(lián)。第9頁/共42頁方法原理第10頁/共42頁方法原理理論頻數(shù)基于H0成立,兩樣本所在總體無差別的前提下計(jì)算出各單元格的理論頻數(shù)來第11頁/共42頁方法原理殘差設(shè)A代表某個(gè)類別的觀察頻數(shù),E代表基于H0計(jì)算出的期望頻數(shù),A與E之差被稱為殘差。殘差可以表示某一個(gè)類別觀察值和理論值的偏離程度,但殘差有正有負(fù),相加后會(huì)彼此抵消,總和仍然為0。為此可以將殘差平方后求和,以表示樣本總的偏離無效假設(shè)的程度。第12頁/共42頁方法原理
另一方面,殘差大小是一個(gè)相對的概念,相對于期望頻數(shù)為10時(shí),20的殘差非常大;可相對于期望頻數(shù)為1000時(shí)20就很小了。因此又將殘差平方除以期望頻數(shù)再求和,以標(biāo)準(zhǔn)化觀察頻數(shù)與期望頻數(shù)的差別。這就是我們所說的卡方統(tǒng)計(jì)量,在1900年由英國統(tǒng)計(jì)學(xué)家Pearson首次提出,其公式為:第13頁/共42頁方法原理從卡方的計(jì)算公式可見,當(dāng)觀察頻數(shù)與期望頻數(shù)完全一致時(shí),卡方值為0;觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小,卡方值越??;反之,觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的差異越大,卡方值越大。當(dāng)然,卡方值的大小也和自由度有關(guān)。第14頁/共42頁方法原理卡方分布顯然,卡方值的大小不僅與A、E之差有關(guān),還與單元格數(shù)(自由度)有關(guān)第15頁/共42頁操作步驟1.建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)H0:使用含氟牙膏和一般牙膏兒童齲患率相等H1:使用含氟牙膏和一般牙膏兒童齲患率不等2.=0.053.計(jì)算檢驗(yàn)統(tǒng)計(jì)量2值第16頁/共42頁操作步驟4.確定P值和作出推斷結(jié)論查附表8,2界值表,得p>0.05。按
=0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為使用含氟牙膏比使用一般牙膏兒童的齲患率低。對于四格表,卡方的計(jì)算公式又可進(jìn)行簡化,以方便手工計(jì)算對計(jì)算機(jī)而言并無實(shí)際價(jià)值tabiab\cd,chi2第17頁/共42頁操作步驟值得指出,成組設(shè)計(jì)四格表資料的2檢驗(yàn)與前面學(xué)習(xí)過的兩樣本率比較的雙側(cè)u檢驗(yàn)是等價(jià)的。若對同一資料作兩種檢驗(yàn),兩個(gè)統(tǒng)計(jì)量的關(guān)系為2=u2。其對應(yīng)的界值也為平方關(guān)系。兩者的應(yīng)用條件也是基本一致的,連續(xù)性校正也基本互相對應(yīng)。第18頁/共42頁卡方檢驗(yàn)假設(shè)的等價(jià)性兩組兒童的齲齒率相同兩組發(fā)生率的比較實(shí)際數(shù)據(jù)的頻數(shù)分布和理論假設(shè)相同理論分布與實(shí)際分布的檢驗(yàn)使用不同的牙膏并不會(huì)影響齲齒的發(fā)生(兩個(gè)分類變量間無關(guān)聯(lián))兩變量的相關(guān)分析第19頁/共42頁四格表2值的校正英國統(tǒng)計(jì)學(xué)家Yates認(rèn)為,2分布是一種連續(xù)型分布,而四格表資料是分類資料,屬離散型分布,由此計(jì)算的2值的抽樣分布也應(yīng)當(dāng)是不連續(xù)的,當(dāng)樣本量較小時(shí),兩者間的差異不可忽略,應(yīng)進(jìn)行連續(xù)性校正(在每個(gè)單元格的殘差中都減去0.5)若n>40,此時(shí)有1<T5時(shí),需計(jì)算Yates連續(xù)性校正2值T<1,或n<40時(shí),應(yīng)改用Fisher確切概率法直接計(jì)算概率第20頁/共42頁四格表2值的校正第21頁/共42頁確切概率法第22頁/共42頁分析實(shí)例注意:確切概率法不屬于2檢驗(yàn)的范疇,但常作為2檢驗(yàn)應(yīng)用上的補(bǔ)充。第23頁/共42頁分析實(shí)例1.建立檢驗(yàn)假設(shè)和確立檢驗(yàn)水準(zhǔn)H0:新藥組與對照組療效相等,即1=2H1:新藥組與對照組療效不等,即1
22.計(jì)算概率和確定P值本例n=36<40,不滿足2檢驗(yàn)的應(yīng)用條件,宜采用四格表確切概率法。第24頁/共42頁方法原理在四格表周邊合計(jì)不變的條件下,在相應(yīng)的總體中進(jìn)行抽樣,四格表中出現(xiàn)各種排列組合情況的概率本例即28、8、22、14保持不變的條件下,若H0成立,計(jì)算出現(xiàn)各種四格表的概率第25頁/共42頁方法原理然后將其中小于等于現(xiàn)有樣本概率的概率值相加,即為P值:本例中P值=P(0)+P(6)+P(7)+P(8)=0.0361<0.05第26頁/共42頁配對設(shè)計(jì)兩樣本率比較的χ2檢驗(yàn)第27頁/共42頁方法原理例6.9用A、B兩種方法檢查已確診的乳腺癌患者140名,A法檢出91名(65%),B法檢出77名(55%),A、B兩法一致的檢出56名(40%),問哪種方法陽性檢出率更高?第28頁/共42頁方法原理顯然,本例對同一個(gè)個(gè)體有兩次不同的測量,從設(shè)計(jì)的角度上講可以被理解為自身配對設(shè)計(jì)按照配對設(shè)計(jì)的思路進(jìn)行分析,則首先應(yīng)當(dāng)求出各對的差值,然后考察樣本中差值的分布是否按照H0假設(shè)的情況對稱分布按此分析思路,最終可整理出如前所列的配對四格表第29頁/共42頁方法原理注意主對角線上兩種檢驗(yàn)方法的結(jié)論相同,對問題的解答不會(huì)有任何貢獻(xiàn)另兩個(gè)單元格才代表了檢驗(yàn)方法間的差異假設(shè)檢驗(yàn)步驟如下:H0:兩法總體陽性檢出率無差別,即B=CH1:兩法總體陽性檢出率有差別,即BC第30頁/共42頁方法原理mcci56352128
第31頁/共42頁注意事項(xiàng)McNemar檢驗(yàn)只會(huì)利用非主對角線單元格上的信息,即它只關(guān)心兩者不一致的評(píng)價(jià)情況,用于比較兩個(gè)評(píng)價(jià)者間存在怎樣的傾向。因此,對于一致性較好的大樣本數(shù)據(jù),McNemar檢驗(yàn)可能會(huì)失去實(shí)用價(jià)值。例如對1萬個(gè)案例進(jìn)行一致性評(píng)價(jià),9995個(gè)都是完全一致的,在主對角線上,另有5個(gè)分布在左下的三角區(qū),顯然,此時(shí)一致性相當(dāng)?shù)暮?。但如果使用McNemar檢驗(yàn),此時(shí)反而會(huì)得出兩種評(píng)價(jià)有差異的結(jié)論來。第32頁/共42頁行列表資料的分析第33頁/共42頁第34頁/共42頁分析步驟建立假設(shè)H0:三種不同類型關(guān)節(jié)炎的療效相同H1:三種不同類型關(guān)節(jié)炎的療效不全相同求出統(tǒng)計(jì)量下結(jié)論第35頁/共42頁幾點(diǎn)遺留問題是否應(yīng)當(dāng)進(jìn)行兩兩比較?這又是一個(gè)打嘴仗的問題,雖然有人提出用卡方分割等方法來檢驗(yàn),但同樣也有學(xué)者對這種做法嗤之以鼻實(shí)際上,隨著統(tǒng)計(jì)學(xué)的發(fā)展,這個(gè)問題已被超越,可以使用對分類數(shù)據(jù)的建模方法,如logistic模型等對此問題加以解答第36頁/共42頁幾點(diǎn)遺留問題如果是有序資料該怎么處理傳統(tǒng)的卡方檢驗(yàn)是無法對次序信息加以利用的單向有序:秩和檢驗(yàn)雙向有序:實(shí)際上考察的是兩變量間的關(guān)聯(lián)性(相關(guān)性),可以使用專門的關(guān)聯(lián)性指標(biāo)分析目前對卡方檢驗(yàn)還有一些擴(kuò)展方法,如CMH卡方,可以處理此類問題第37頁/共42頁幾點(diǎn)遺留問題行列表卡方檢驗(yàn)的適用條件理論頻數(shù)不宜太小,一般認(rèn)為不宜有1/5以上格子的理論頻數(shù)小于5或有一個(gè)格子的理論頻數(shù)小于1不太理想的辦法與鄰近行或列中的實(shí)際頻數(shù)合并刪去理論頻數(shù)太小的格子所對應(yīng)的行或列最理想的辦法增加樣本含量以增大理論頻數(shù)(但是可能嗎)確切概率法第38頁/共42頁一點(diǎn)補(bǔ)充確切概率法的原理具有通用性,對于四格表以外的情況也適用,如行乘列表、配對、配伍表格均可對于較大的行乘列表,確切概率法的計(jì)算量將變得十分驚人,有可能超出硬件系統(tǒng)可以支持的范圍此時(shí)可以采用計(jì)算統(tǒng)計(jì)學(xué)中的其他抽樣技術(shù)加以解決,如Bootstrap方法等第39頁/共42頁Stata計(jì)算兩個(gè)或多個(gè)率、構(gòu)成比的比較
1.Pearsonχ2對兩個(gè)樣本率比較
tabiab\cd,chi2r其中r表示按行計(jì)算比例
2.用Fisher確切概率法檢驗(yàn)量個(gè)樣本率
tabiab\cd,chi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專利使用許可合同范本
- 外賣承運(yùn)合同范本
- ppp總包合同范本
- 買賣鮑魚合同范本
- 出售工程潔具合同范本
- 人才引進(jìn)股權(quán)激勵(lì)合同范本
- 分期合同與框架合同范本
- ppp合同范本 政府
- 鄉(xiāng)鎮(zhèn)建設(shè)用地合同范本
- 出軌賠償合同范本
- 模具轉(zhuǎn)移合同協(xié)議書
- DeepSeek學(xué)習(xí)科普專題
- 2025春季學(xué)期少先隊(duì)工作安排表
- 學(xué)校2025年春季學(xué)期學(xué)校安全工作計(jì)劃+行事歷
- 廣西壯族自治區(qū)柳州市2025年中考物理模擬考試卷三套附答案
- 2024中國糖果、巧克力制造市場前景及投資研究報(bào)告
- 第11課《山地回憶》說課稿 2024-2025學(xué)年統(tǒng)編版語文七年級(jí)下冊
- 羅森運(yùn)營部經(jīng)營管理手冊
- 2023年H3CNE題庫附答案
- 2024年首都醫(yī)科大學(xué)附屬北京安定醫(yī)院招聘筆試真題
- 老舊小區(qū)改造項(xiàng)目施工組織設(shè)計(jì)方案
評(píng)論
0/150
提交評(píng)論