版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
3.2獨立性檢驗的基本思想及其初步應用學習目標核心素養(yǎng)1.理解獨立性檢驗的基本思想及其實施步驟.(重點)2.能利用條形圖、列聯(lián)表探討兩個分類變量的關系.(易混點)3.了解K2的含義及其應用.(重點)4.通過對數據的處理,來提高解決實際問題的能力.(難點)1.通過學習獨立性檢驗的基本思想提升邏輯推理的素養(yǎng).2.借助k2公式培養(yǎng)數學運算的素養(yǎng).3.借助條形圖培養(yǎng)直觀想象的素養(yǎng).1.分類變量及2×2列聯(lián)表(1)分類變量變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯(lián)表①定義:列出的兩個分類變量的頻數表,稱為列聯(lián)表.②2×2列聯(lián)表:一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數列聯(lián)表(稱為2×2列聯(lián)表)為:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d2.等高條形圖(1)等高條形圖與表格相比,圖形更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數據的頻率特征.(2)觀察等高條形圖發(fā)現eq\f(a,a+b)和eq\f(c,c+d)相差很大,就判斷兩個分類變量之間有關系.3.獨立性檢驗(1)定義:利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.(2)K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.(3)獨立性檢驗的具體做法①根據實際問題的需要確定容許推斷“兩個分類變量有關系”犯錯誤概率的上界α,然后查表確定臨界值k0.②利用公式計算隨機變量K2的觀測值k.③如果k≥k0,就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數據中沒有發(fā)現足夠證據支持結論“X與Y有關系”.思考:有人說:“我們有99%的把握認為吸煙和患肺癌有關,是指每100個吸煙者中就會有99個患肺癌的.”你認為這種觀點正確嗎?為什么?[提示]觀點不正確.99%的把握說明的是吸煙與患肺癌有關的程度,不是患肺癌的百分數.1.下列變量中不屬于分類變量的是()A.性別 B.吸煙C.宗教信仰 D.國籍B[“吸煙”不是分類變量,“是否吸煙”才是分類變量.故選B.]2.下面是一個2×2列聯(lián)表:y1y2總計x1a2173x282533總計b46則表中a,b處的值分別為________.52,60[∵a+21=73,∴a=52.b=a+8=52+8=60.]3.根據下表計算:不看電視看電視男3785女35143K2的觀測值k≈________(保留3位小數).4.514[k=eq\f(300×37×143-85×352,122×178×72×228)≈4.514.]用2×2列聯(lián)表分析兩變量間的關系【例1】在對人們飲食習慣的一次調查中,共調查了124人,其中六十歲以上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另外33人則以肉類為主.請根據以上數據作出飲食習慣與年齡的列聯(lián)表,并利用eq\f(a,a+b)與eq\f(c,c+d)判斷二者是否有關系.[解]2×2列聯(lián)表如下:年齡在六十歲以上年齡在六十歲以下總計飲食以蔬菜為主432164飲食以肉類為主273360總計7054124將表中數據代入公式得eq\f(a,a+b)=eq\f(43,64)=0.671875.eq\f(c,c+d)=eq\f(27,60)=0.45.顯然二者數據具有較為明顯的差距,據此可以在某種程度上認為飲食習慣與年齡有關系.1.作2×2列聯(lián)表時,關鍵是對涉及的變量分清類別.注意應該是4行4列,計算時要準確無誤.2.利用2×2列聯(lián)表分析兩變量間的關系時,首先要根據題中數據獲得2×2列聯(lián)表,然后根據頻率特征,即將eq\f(a,a+b)與eq\f(c,c+d)eq\b\lc\(\rc\)(\a\vs4\al\co1(或\f(b,a+b)與\f(d,c+d)))的值相比,直觀地反映出兩個分類變量間是否相互影響,但方法較粗劣.eq\o([跟進訓練])1.假設有兩個分類變量X與Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為:y1y2x11018x2m26則當m取下面何值時,X與Y的關系最弱()A.8 B.9C.14 D.19C[由10×26=18m,解得m≈14.4,所以當m=14時,X與Y的關系最弱.用等高條形圖分析兩變量間的關系【例2】為了解鉛中毒病人與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結果如下:陽性數陰性數總計鉛中毒病人29736對照組92837總計383573試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數有無差別,鉛中毒病人與尿棕色素為陽性是否有關系?[解]等高條形圖如圖所示:其中兩個淺色條的高分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關系.利用等高條形圖判斷兩個分類變量是否相關的步驟eq\o([跟進訓練])2.如圖所示的是調查某地區(qū)男、女中學生喜歡理科的等高條形圖,陰影部分表示喜歡理科的百分比,從圖中可以看出()A.性別與喜歡理科無關B.女生中喜歡理科的比例約為80%C.男生比女生喜歡理科的可能性大些D.男生中不喜歡理科的比例約為60%C[由題圖可知女生中喜歡理科的比例約為20%,男生中喜歡理科的比例約為60%,因此男生比女生喜歡理科的可能性大些.故選C.]由K2進行獨立性檢驗[探究問題]1.在K2運算后,得到K2的值為29.78,在判斷變量相關時,P(K2≥6.635)≈0.01和P(K2≥7.879)≈0.005,哪種說法是正確的?[提示]兩種說法均正確.P(K2≥6.635)≈0.01的含義是在犯錯誤的概率不超過0.01的前提下認為兩個變量相關;而P(K2≥7.879)≈0.005的含義是在犯錯誤的概率不超過0.005的前提下認為兩個變量相關.2.你能說一下用K2進行獨立性檢驗的依據嗎?[提示]獨立性檢驗的基本思想類似于數學中的反證法.先假設“兩個分類變量沒有關系”成立,計算隨機變量K2的值,如果K2值很大,說明假設不合理.K2越大,兩個分類變量有關系的可能性越大.【例3】隨著生活水平的提高,人們的休閑方式也發(fā)生了變化.某機構隨機調查了n個人,其中男性占調查人數的eq\f(2,5).已知男性中有一半的人的休閑方式是運動,而女性中只有eq\f(1,3)的人的休閑方式是運動.(1)完成下列2×2列聯(lián)表:運動非運動總計男生女生總計n(2)若在犯錯誤的概率不超過0.05的前提下,可認為“性別與休閑方式有關”,那么本次被調查的人數至少有多少?[思路點撥](1)依據2×2列聯(lián)表的定義填表;(2)計算K2,利用臨界值建立不等關系,求n的值.[解](1)補全2×2列聯(lián)表如下:運動非運動總計男性eq\f(1,5)neq\f(1,5)neq\f(2,5)n女性eq\f(1,5)neq\f(2,5)neq\f(3,5)n總計eq\f(2,5)neq\f(3,5)nn(2)若在犯錯誤的概率不超過0.05的前提下,可認為“性別與休閑方式有關”,則P(K2≥k0)≈3.841.由于K2的觀測值k=eq\f(n\b\lc\(\rc\)(\a\vs4\al\co1(\f(n,5)·\f(2n,5)-\f(n,5)·\f(n,5)))eq\s\up12(2),\f(2n,5)·\f(3n,5)·\f(2n,5)·\f(3n,5))=eq\f(n,36),故eq\f(n,36)≥3.841,即n≥138.276.又由eq\f(1,5)n∈Z,故n≥140.故若在犯錯誤的概率不超過0.05的前提下,可認為“性別與休閑方式有關”,那么本次被調查的至少有140人.1.(變結論)根據(2)的結論,本次被調查的人中,至少有多少人的休閑方式是運動?[解]根據(2)的結論,本次被調查的人中,至少有eq\f(2,5)×140=56(人)的休閑方式是運動.2.(變條件)若增加條件n=100,問能否在犯錯誤不超過0.1的前提下,可認為“性別與休閑方式有關”?[解]由(2)可知,當n=100時,K2的觀測值k=eq\f(100,36)≈2.78>2.706.故在犯錯誤不超過0.1的前提下,我們可以認為性別與休閑方式有關.解決一般的獨立性檢驗問題的步驟獨立性檢驗問題的求解策略(1)等高條形圖法:依據題目信息畫出等高條形圖,依據頻率差異來粗略地判斷兩個變量的相關性.(2)K2統(tǒng)計量法:通過公式k=eq\f(nad-bc2,a+bc+da+cb+d).先計算觀測值k,再與臨界值表作比較,最后得出結論.1.判斷(正確的打“√”,錯誤的打“×”)(1)在獨立性檢驗中,若K2越大,則兩個分類變量有關系的可能性越大.()(2)2×2列聯(lián)表是借助兩個分類變量之間頻率大小差異說明兩個變量之間是否有關聯(lián)關系.()(3)應用獨立性檢驗的基本思想對兩個變量間的關系作出的推斷一定是正確的.()[答案](1)√(2)√(3)×2.在研究打鼾與患心臟病之間的關系中,通過收集數據、整理分析數據得到“打鼾與患心臟病有關”的結論,并且在犯錯誤的概率不超過0.01的前提下認為這個結論是成立的.下列說法中正確的是()A.100個心臟病患者中至少有99人打鼾B.1個人患心臟病,則這個人有99%的概率打鼾C.100個心臟病患者中一定有打鼾的人D.100個心臟病患者中可能一個打鼾的人都沒有D[這是獨立性檢驗,在犯錯誤的概率不超過0.01的前提下認為“打鼾與患心臟病有關”.這只是一個概率,即打鼾與患心臟病有關的可能性為99%.根據概率的意義可知答案應選D.]3.觀察下列各圖,其中兩個分類變量x,y之間關系最強的是________.(4)[在四幅圖中圖(4)中兩個深色條的高相差最明顯,說明兩個分類變量之間關系最強,故選(4).]4.某大學餐飲中心為了了解新生的飲食習慣,在全校一年級學生中進行了抽樣調查,調查結果如下表所示:喜歡甜品不喜歡甜品總計南方學生602080北方學生101020
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025新人教版英語七年級下單詞默寫表(小學部分)
- 莫言《兒子的敵人》閱讀答案及解析
- 商務英語筆譯之宣傳資料
- 住宅室內裝修工序間歇及工藝間歇標準
- 二零二五年度醫(yī)療設備維護與保養(yǎng)合同4篇
- 蘇科版七年級(上)期末復習模擬卷
- 八年級數學期末模擬卷(全解全析)(蘇州專用)
- 2024年浙江經貿職業(yè)技術學院高職單招數學歷年參考題庫含答案解析
- 2024年浙江電力職業(yè)技術學院高職單招職業(yè)適應性測試歷年參考題庫含答案解析
- 21世紀中國電子商務網校講義資料
- 醫(yī)院感染管理辦法
- 物流學概論(崔介何第五版)物流學概述
- 《載畜量計算》課件
- 統(tǒng)編版六年級語文上冊專項 專題12說明文閱讀-原卷版+解析
- 軟件無線電原理與應用第3版 課件 【ch03】軟件無線電體系結構
- 石油化工裝置火炬系統(tǒng)堵塞風險分析
- 防突抽采隊202年度工作總結
- 四川省石棉縣石石石材有限責任公司石棉縣大巖窩花崗石礦礦山地質環(huán)境保護與土地復墾方案
- 2023年ERCP圍手術期用藥專家共識意見
- 2019年內蒙古鄂爾多斯市中考數學試題(原卷+解析)
- 塑鋼門窗及鋁合金門窗制作和安裝合同
評論
0/150
提交評論