版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
8.3.2獨立性檢驗(1)復(fù)習(xí)引入2.2×2列聯(lián)表定義一對分類變量X和Y,我們整理數(shù)據(jù)如表所示:XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d上表是關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表:最后一行的前兩個數(shù)分別是事件{Y=0}和{Y=1}的
;最后一列的前兩個數(shù)分別是事件{X=0}和{X=1}的_;中間的四個數(shù)a,b,c,d是事件{X=x,Y=y(tǒng)}(x,y=0,1)的
;右下角格中的數(shù)n是
.頻數(shù)頻數(shù)頻數(shù)樣本容量3.等高堆積條形圖等高堆積條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的
特征,依據(jù)_____________的原理,我們可以推斷結(jié)果.頻率頻率穩(wěn)頻率穩(wěn)定于概率例1:為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機抽樣的方法抽取88名學(xué)生.通過測驗得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績優(yōu)秀率之間是否存在差異.回顧上節(jié)課的例1學(xué)校數(shù)學(xué)成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計711788依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷甲校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績優(yōu)秀的概率.探究二:獨立性檢驗課本126頁思考:你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯誤的?這一結(jié)論有可能是錯誤的.事實上,“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個結(jié)論是根據(jù)兩個頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機抽取的這個樣本中,兩個頻率間確實存在差異,但兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率實際上是沒有差別的.對于隨機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法,同時也希望能對出現(xiàn)錯誤推斷的概率有一定的控制或估算.這里,P(Y=1|X=0)表示從{X=0}中隨機選一個樣本點,該樣本點屬于{X=0,Y=1}的概率;P(Y=1|X=1)表示從{X=1}中隨機選一個樣本點,該樣本點屬于{X=1,Y=1}的概率.考慮以Ω為樣本空間的古典概型.設(shè)X和Y定義在Ω上,取值于{0,1}的成對分類變量.我們希望判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián).我們需要判斷下面的假定關(guān)系是否成立,通常稱H0為零假設(shè)或原假設(shè).抽象簡化列聯(lián)表如下:Y=0Y=1X=0X=0,Y=0X=0,Y=1X=1X=1,Y=0X=1,Y=1{X=1}與{Y=1}是否有關(guān)聯(lián)呢?注意到{X=0}與{X=1}對立,{Y=0}與{Y=1}對立,零假設(shè)或原假設(shè):由條件概率的定義可知,零假設(shè)H0等價于由于{X=0}和{X=1}為對立事件,故有因此,零假設(shè)H0等價于{X=1}和{Y=1}獨立.Y=0Y=1X=0X=0,Y=0X=0,Y=1X=1X=1,Y=0X=1,Y=1根據(jù)已經(jīng)學(xué)過的概率知識,下面的四條性質(zhì)彼此等價:{X=0}與{Y=0}獨立{X=0}與{Y=1}獨立{X=1}與{Y=0}獨立{X=1}與{Y=1}獨立②如果這些性質(zhì)成立,我們就稱分類變量X和Y獨立.因此,我們可以用概率語言,將零假設(shè)改述為
H0:分類變量X和Y獨立.思考:如何基于②中的四個等式及下列2×2列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計量,對成對分類變量X和Y是否相互獨立作出推斷?XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+da+b+c+dXY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+da+b+c+d{X=0,Y=0}發(fā)生的頻數(shù)的期望值(或預(yù)期值)為思考:如何衡量頻數(shù)的期望值Ea與實際值a的差別呢?如果零假設(shè)H0成立,下面四個量的取值都不應(yīng)該太大:反之,當(dāng)這些量的取值較大時,就可以推斷H0不成立.顯然,分別考慮上面四個差的絕對值很困難,我們需要找到一個既合理又能夠計算分布的統(tǒng)計量,來推斷H0是否成立.一般來說,若頻數(shù)的期望值較大,則差的絕對值也會較大;而若頻數(shù)的期望值較小,則相應(yīng)的差的絕對值也會較小.為了合理地平衡這種影響,我們將四個差的絕對值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計量:該表達(dá)式可化簡為上述表達(dá)式是χ2的計算公式,
χ2讀作“卡方”.卡方統(tǒng)計量思考:卡方統(tǒng)計量有什么用呢?隨機變量χ2取值的大小可作為判斷零假設(shè)H0是否成立的依據(jù),當(dāng)它比較大時推斷H0不成立,否則認(rèn)為H0成立.χ2計算公式:思考:究竟χ2大到什么程度,可以推斷H0不成立呢?或者說,怎樣確定判斷χ2大小的標(biāo)準(zhǔn)呢?根據(jù)小概率事件在一次試驗中不大可能發(fā)生的規(guī)律,上面的想法可以通過確定一個與H0相矛盾的小概率事件來實現(xiàn).在假定H0的條件下,對于有放回簡單隨機抽樣,當(dāng)樣本容量
n充分大時,統(tǒng)計學(xué)家得到了χ2的近似分布.忽略χ2的實際分
布與該近似分布的誤差后,對于任何小概率值α,可以找到
相應(yīng)的正實數(shù)xα,使得下面關(guān)系成立:我們稱xα為α的臨界值,這個臨界值就可以作為判斷χ2大小的標(biāo)準(zhǔn).概率值α越小,臨界值xα越大.由P(χ2≥xα)=α可知,只要把概率值α取得充分小,在假設(shè)H0的情況下,事件{χ2≥xα}是不大可能發(fā)生的.根據(jù)這個規(guī)律,如果該事件發(fā)生,我們就可以推斷H0不成立.不過這個推斷有可能犯錯誤,但犯錯誤的概率不會超過α.xαα概率值α越小,臨界值xα越大.基于小概率值α的檢驗規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨立,該推斷犯錯誤的概率不超過α;當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨立.這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例如,對于小概率值α=0.05,我們有如下的具體檢驗規(guī)則:(1)當(dāng)χ2≥x0.05=3.841時,我們推斷H0不成立,即認(rèn)為X和Y不獨立,該推斷犯錯誤的概率不超過0.05;(2)當(dāng)χ2<x0.05=3.841時,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨立.解:零假設(shè)為H0:分類變量X與Y相互獨立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異.例:依據(jù)小概率值α=0.1的χ2獨立性檢驗,分析例1(課本126)中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率有差異?學(xué)校數(shù)學(xué)成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計711788α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828根據(jù)小概率值α=0.1的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績優(yōu)秀率沒有差異.例題課本131頁根據(jù)表中的數(shù)據(jù),計算得到思考:例1(課本126)和本例都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說明其中的原因嗎?事實上,如前所述,例1只是根據(jù)一個樣本的兩個頻率間存在差異得出兩校學(xué)生數(shù)學(xué)成績優(yōu)秀率有差異的結(jié)論,并沒有考慮由樣本隨機性可能導(dǎo)致的錯誤,所以例1的推斷依據(jù)不太充分.在本例中,我們用χ2獨立性檢驗對零假設(shè)H0進(jìn)行了檢驗.
通過計算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對應(yīng)的臨界值2.706,因此認(rèn)為沒有充分證據(jù)推斷H0不成立,所以接受H0,推斷出兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率沒有顯著差異的結(jié)論.這個檢驗結(jié)果意味著,抽樣數(shù)據(jù)中兩個頻率的差異很有可能是由樣本隨機性導(dǎo)致的.
因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率有差異的結(jié)論是不可靠的.由此可見,相對于簡單比較兩個頻率的推斷,用χ2獨立性檢驗得到的結(jié)果更理性、更全面,理論依據(jù)也更充分.練習(xí)1.對196個接受心臟搭橋手術(shù)的病人和196個接受血管清障手術(shù)的病人進(jìn)行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示:手術(shù)心臟病合計又發(fā)作過未發(fā)作過心臟搭橋39157196血管清障29167196合計68324392試根據(jù)上述數(shù)據(jù)計算χ2≈__________,能否根據(jù)小概率值α=0.1的獨立性檢驗作出這兩種手術(shù)對病人又發(fā)作心臟病的影響有差別的結(jié)論________(填“能”或“不能”).1.779不能χ2<2.076=x0.1,根據(jù)小概率值α=0.1的χ2獨立性檢驗,我們沒有充分的證據(jù)推斷H0不成立,即認(rèn)為這兩種手術(shù)對病人又發(fā)作心臟病的影響無差別.課本134頁2.為考察某種藥物A對預(yù)防疾病B的效果,進(jìn)行了動物試驗,根據(jù)105個有放回簡單隨機樣本的數(shù)據(jù),得到如下列聯(lián)表:依據(jù)α=0.05的獨立性檢驗,分析藥物A對預(yù)防疾病B的有效性.藥物A疾病B合計未患病患病未服用291544服用471461合計7629105α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:零假設(shè)為H0:藥物A與預(yù)防疾病B無關(guān)聯(lián),即藥物A對預(yù)防疾病B沒有效果,根據(jù)列聯(lián)表中數(shù)據(jù),經(jīng)計算得到根據(jù)小概率值α=0.05的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,即可以認(rèn)為藥物A對預(yù)防疾病B沒有效果.則χ2約為(
)1.高二第二學(xué)期期中考試,按照甲、乙兩個班學(xué)生的數(shù)學(xué)成績優(yōu)秀和及格統(tǒng)計人數(shù)后,得到如下列聯(lián)表:
優(yōu)秀及格合計甲班113445乙班83745合計197190隨堂檢測2.下表是某屆某校本科志愿報名時,對其中304名學(xué)生進(jìn)入高校時是否知道想學(xué)專業(yè)的調(diào)查表:
知道想學(xué)專業(yè)不知道想學(xué)專業(yè)合計男生63117180女生4282124合計105199304根據(jù)表中數(shù)據(jù),則下列說法正確的是______.(填序號)①性別與知道想學(xué)專業(yè)有關(guān);②性別與知道想學(xué)專業(yè)無關(guān);③女生比男生更易知道所學(xué)專業(yè).②所以性別與知道想學(xué)專業(yè)無關(guān).3.學(xué)校舉行運動會,為了搞好接待工作,組委會招募了16名男志愿者和14名女志愿者,調(diào)查發(fā)現(xiàn),男、女志愿者中分別有10人和6人喜愛運動,其余人不喜愛運動.(1)根據(jù)以上數(shù)據(jù)完成以下2×2列聯(lián)表:
運動的喜好合計喜愛運動不喜愛運動
男10
16女6
14合計
30解:
喜愛運動不喜愛運動合計男10616女6814合計161430(2)根據(jù)列聯(lián)表的獨立性檢驗,能否在犯錯誤的概率不超過0.10的前提下認(rèn)為性別與喜愛運動有關(guān)?解:零假設(shè)為H0:喜愛運動與性別無關(guān),由已知數(shù)據(jù)可得因為1.1575<2.706=x0.1,根據(jù)小概率值α=0.1的獨立性檢驗,沒有充分證據(jù)推斷H0不成立,即認(rèn)為性別與喜愛運動無關(guān).4.為了探究學(xué)生選報文、理科與對外語的興趣是否有關(guān),某同學(xué)調(diào)查了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科生對外語有興趣的有138人,無興趣的有98人,文科生對外語有興趣的有73人,無興趣的有52人.試根據(jù)小概率值α=0.1的獨立性檢驗,分析學(xué)生選報文、理科與對外語的興趣是否有關(guān)?解:零假設(shè)為H0:選報文、理科與對外語的興趣無關(guān).列出2×2列聯(lián)表對外語興趣選報文、理科合計理文有13873211無9852150合計236125361代入公式得∵1.871×10-4<2.706=x0.1,根據(jù)小概率值α=0.1的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,即選報文、理科與對外語的興趣無關(guān).5.為了檢驗兩種不同的課堂教學(xué)模式對學(xué)生的成績是否有影響,現(xiàn)從高二年級的甲(實行“問題—探究式”模式)、乙(實行“自學(xué)—指導(dǎo)式”模式)兩個班中每班任意抽取20名學(xué)生進(jìn)行測試,他們的成績(總分150分)如下.甲班:88929598103108110112118118
120121126132134135140142146148乙班:9697104107108108114117119121124124125127132135135137138
147記成績在120分以上(包括120分)為優(yōu)秀,其他的成績?yōu)橐话?,試根?jù)小概率
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 40064-2024節(jié)能技術(shù)評價導(dǎo)則
- 2025版水利工程勘察設(shè)計合同熱3篇
- 物流行業(yè)安全防護(hù)規(guī)則
- 公園戶外攀巖墻施工協(xié)議
- 物業(yè)服務(wù)合同書范本
- 教育培訓(xùn)行業(yè)投資操作手冊
- 醫(yī)療行業(yè)財務(wù)收支管理規(guī)程
- 外包售后服務(wù)協(xié)議書
- 森林防火攪拌站招標(biāo)文件
- 展覽館玻璃膜施工合同
- 2024年重慶市高考地理試卷(含答案與解析)
- 教育機構(gòu)合作伙伴招募方案
- 高校實驗室安全基礎(chǔ)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 大學(xué)生心理健康教育學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 2024年秋國家開放大學(xué)會計信息系統(tǒng)(本)客觀題及答案
- 干部任免審批表樣表
- 2024年大學(xué)班主任工作總結(jié)經(jīng)典版(4篇)
- 電網(wǎng)工程施工安全基準(zhǔn)風(fēng)險指南
- 蘇科版九年級物理上冊教案:11.5機械效率
- 中醫(yī)內(nèi)科學(xué)智慧樹知到答案2024年浙江中醫(yī)藥大學(xué)
- DL∕T 2602-2023 電力直流電源系統(tǒng)保護(hù)電器選用與試驗導(dǎo)則
評論
0/150
提交評論