獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用Word版含解析_第1頁
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用Word版含解析_第2頁
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用Word版含解析_第3頁
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用Word版含解析_第4頁
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用Word版含解析_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

3.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用學(xué)習(xí)目標(biāo)核心素養(yǎng)1.理解獨(dú)立性檢驗(yàn)的基本思想及其實(shí)施步驟.(重點(diǎn))2.能利用條形圖、列聯(lián)表探討兩個(gè)分類變量的關(guān)系.(易混點(diǎn))3.了解K2的含義及其應(yīng)用.(重點(diǎn))4.通過對(duì)數(shù)據(jù)的處理,來提高解決實(shí)際問題的能力.(難點(diǎn))1.通過學(xué)習(xí)獨(dú)立性檢驗(yàn)的基本思想提升邏輯推理的素養(yǎng).2.借助k2公式培養(yǎng)數(shù)學(xué)運(yùn)算的素養(yǎng).3.借助條形圖培養(yǎng)直觀想象的素養(yǎng).1.分類變量及2×2列聯(lián)表(1)分類變量變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯(lián)表①定義:列出的兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表.②2×2列聯(lián)表:一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d2.等高條形圖(1)等高條形圖與表格相比,圖形更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.(2)觀察等高條形圖發(fā)現(xiàn)eq\f(a,a+b)和eq\f(c,c+d)相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.3.獨(dú)立性檢驗(yàn)(1)定義:利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).(2)K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.(3)獨(dú)立性檢驗(yàn)的具體做法①根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤概率的上界α,然后查表確定臨界值k0.②利用公式計(jì)算隨機(jī)變量K2的觀測(cè)值k.③如果k≥k0,就推斷“X與Y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過α,否則就認(rèn)為在犯錯(cuò)誤的概率不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“X與Y有關(guān)系”.思考:有人說:“我們有99%的把握認(rèn)為吸煙和患肺癌有關(guān),是指每100個(gè)吸煙者中就會(huì)有99個(gè)患肺癌的.”你認(rèn)為這種觀點(diǎn)正確嗎?為什么?[提示]觀點(diǎn)不正確.99%的把握說明的是吸煙與患肺癌有關(guān)的程度,不是患肺癌的百分?jǐn)?shù).1.下列變量中不屬于分類變量的是()A.性別 B.吸煙C.宗教信仰 D.國籍B[“吸煙”不是分類變量,“是否吸煙”才是分類變量.故選B.]2.下面是一個(gè)2×2列聯(lián)表:y1y2總計(jì)x1a2173x282533總計(jì)b46則表中a,b處的值分別為________.52,60[∵a+21=73,∴a=52.b=a+8=52+8=60.]3.根據(jù)下表計(jì)算:不看電視看電視男3785女35143K2的觀測(cè)值k≈________(保留3位小數(shù)).4.514[k=eq\f(300×37×143-85×352,122×178×72×228)≈4.514.]用2×2列聯(lián)表分析兩變量間的關(guān)系【例1】在對(duì)人們飲食習(xí)慣的一次調(diào)查中,共調(diào)查了124人,其中六十歲以上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另外33人則以肉類為主.請(qǐng)根據(jù)以上數(shù)據(jù)作出飲食習(xí)慣與年齡的列聯(lián)表,并利用eq\f(a,a+b)與eq\f(c,c+d)判斷二者是否有關(guān)系.[解]2×2列聯(lián)表如下:年齡在六十歲以上年齡在六十歲以下總計(jì)飲食以蔬菜為主432164飲食以肉類為主273360總計(jì)7054124將表中數(shù)據(jù)代入公式得eq\f(a,a+b)=eq\f(43,64)=0.671875.eq\f(c,c+d)=eq\f(27,60)=0.45.顯然二者數(shù)據(jù)具有較為明顯的差距,據(jù)此可以在某種程度上認(rèn)為飲食習(xí)慣與年齡有關(guān)系.1.作2×2列聯(lián)表時(shí),關(guān)鍵是對(duì)涉及的變量分清類別.注意應(yīng)該是4行4列,計(jì)算時(shí)要準(zhǔn)確無誤.2.利用2×2列聯(lián)表分析兩變量間的關(guān)系時(shí),首先要根據(jù)題中數(shù)據(jù)獲得2×2列聯(lián)表,然后根據(jù)頻率特征,即將eq\f(a,a+b)與eq\f(c,c+d)eq\b\lc\(\rc\)(\a\vs4\al\co1(或\f(b,a+b)與\f(d,c+d)))的值相比,直觀地反映出兩個(gè)分類變量間是否相互影響,但方法較粗劣.eq\o([跟進(jìn)訓(xùn)練])1.假設(shè)有兩個(gè)分類變量X與Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為:y1y2x11018x2m26則當(dāng)m取下面何值時(shí),X與Y的關(guān)系最弱()A.8 B.9C.14 D.19C[由10×26=18m,解得m≈14.4,所以當(dāng)m=14時(shí),X與Y的關(guān)系最弱.用等高條形圖分析兩變量間的關(guān)系【例2】為了解鉛中毒病人與尿棕色素為陽性是否有關(guān)系,分別對(duì)病人組和對(duì)照組的尿液作尿棕色素定性檢查,結(jié)果如下:陽性數(shù)陰性數(shù)總計(jì)鉛中毒病人29736對(duì)照組92837總計(jì)383573試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和對(duì)照組的尿棕色素陽性數(shù)有無差別,鉛中毒病人與尿棕色素為陽性是否有關(guān)系?[解]等高條形圖如圖所示:其中兩個(gè)淺色條的高分別代表鉛中毒病人和對(duì)照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人與對(duì)照組相比,尿棕色素為陽性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關(guān)系.利用等高條形圖判斷兩個(gè)分類變量是否相關(guān)的步驟eq\o([跟進(jìn)訓(xùn)練])2.如圖所示的是調(diào)查某地區(qū)男、女中學(xué)生喜歡理科的等高條形圖,陰影部分表示喜歡理科的百分比,從圖中可以看出()A.性別與喜歡理科無關(guān)B.女生中喜歡理科的比例約為80%C.男生比女生喜歡理科的可能性大些D.男生中不喜歡理科的比例約為60%C[由題圖可知女生中喜歡理科的比例約為20%,男生中喜歡理科的比例約為60%,因此男生比女生喜歡理科的可能性大些.故選C.]由K2進(jìn)行獨(dú)立性檢驗(yàn)[探究問題]1.在K2運(yùn)算后,得到K2的值為29.78,在判斷變量相關(guān)時(shí),P(K2≥6.635)≈0.01和P(K2≥7.879)≈0.005,哪種說法是正確的?[提示]兩種說法均正確.P(K2≥6.635)≈0.01的含義是在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為兩個(gè)變量相關(guān);而P(K2≥7.879)≈0.005的含義是在犯錯(cuò)誤的概率不超過0.005的前提下認(rèn)為兩個(gè)變量相關(guān).2.你能說一下用K2進(jìn)行獨(dú)立性檢驗(yàn)的依據(jù)嗎?[提示]獨(dú)立性檢驗(yàn)的基本思想類似于數(shù)學(xué)中的反證法.先假設(shè)“兩個(gè)分類變量沒有關(guān)系”成立,計(jì)算隨機(jī)變量K2的值,如果K2值很大,說明假設(shè)不合理.K2越大,兩個(gè)分類變量有關(guān)系的可能性越大.【例3】隨著生活水平的提高,人們的休閑方式也發(fā)生了變化.某機(jī)構(gòu)隨機(jī)調(diào)查了n個(gè)人,其中男性占調(diào)查人數(shù)的eq\f(2,5).已知男性中有一半的人的休閑方式是運(yùn)動(dòng),而女性中只有eq\f(1,3)的人的休閑方式是運(yùn)動(dòng).(1)完成下列2×2列聯(lián)表:運(yùn)動(dòng)非運(yùn)動(dòng)總計(jì)男生女生總計(jì)n(2)若在犯錯(cuò)誤的概率不超過0.05的前提下,可認(rèn)為“性別與休閑方式有關(guān)”,那么本次被調(diào)查的人數(shù)至少有多少?[思路點(diǎn)撥](1)依據(jù)2×2列聯(lián)表的定義填表;(2)計(jì)算K2,利用臨界值建立不等關(guān)系,求n的值.[解](1)補(bǔ)全2×2列聯(lián)表如下:運(yùn)動(dòng)非運(yùn)動(dòng)總計(jì)男性eq\f(1,5)neq\f(1,5)neq\f(2,5)n女性eq\f(1,5)neq\f(2,5)neq\f(3,5)n總計(jì)eq\f(2,5)neq\f(3,5)nn(2)若在犯錯(cuò)誤的概率不超過0.05的前提下,可認(rèn)為“性別與休閑方式有關(guān)”,則P(K2≥k0)≈3.841.由于K2的觀測(cè)值k=eq\f(n\b\lc\(\rc\)(\a\vs4\al\co1(\f(n,5)·\f(2n,5)-\f(n,5)·\f(n,5)))eq\s\up12(2),\f(2n,5)·\f(3n,5)·\f(2n,5)·\f(3n,5))=eq\f(n,36),故eq\f(n,36)≥3.841,即n≥138.276.又由eq\f(1,5)n∈Z,故n≥140.故若在犯錯(cuò)誤的概率不超過0.05的前提下,可認(rèn)為“性別與休閑方式有關(guān)”,那么本次被調(diào)查的至少有140人.1.(變結(jié)論)根據(jù)(2)的結(jié)論,本次被調(diào)查的人中,至少有多少人的休閑方式是運(yùn)動(dòng)?[解]根據(jù)(2)的結(jié)論,本次被調(diào)查的人中,至少有eq\f(2,5)×140=56(人)的休閑方式是運(yùn)動(dòng).2.(變條件)若增加條件n=100,問能否在犯錯(cuò)誤不超過0.1的前提下,可認(rèn)為“性別與休閑方式有關(guān)”?[解]由(2)可知,當(dāng)n=100時(shí),K2的觀測(cè)值k=eq\f(100,36)≈2.78>2.706.故在犯錯(cuò)誤不超過0.1的前提下,我們可以認(rèn)為性別與休閑方式有關(guān).解決一般的獨(dú)立性檢驗(yàn)問題的步驟獨(dú)立性檢驗(yàn)問題的求解策略(1)等高條形圖法:依據(jù)題目信息畫出等高條形圖,依據(jù)頻率差異來粗略地判斷兩個(gè)變量的相關(guān)性.(2)K2統(tǒng)計(jì)量法:通過公式k=eq\f(nad-bc2,a+bc+da+cb+d).先計(jì)算觀測(cè)值k,再與臨界值表作比較,最后得出結(jié)論.1.判斷(正確的打“√”,錯(cuò)誤的打“×”)(1)在獨(dú)立性檢驗(yàn)中,若K2越大,則兩個(gè)分類變量有關(guān)系的可能性越大.()(2)2×2列聯(lián)表是借助兩個(gè)分類變量之間頻率大小差異說明兩個(gè)變量之間是否有關(guān)聯(lián)關(guān)系.()(3)應(yīng)用獨(dú)立性檢驗(yàn)的基本思想對(duì)兩個(gè)變量間的關(guān)系作出的推斷一定是正確的.()[答案](1)√(2)√(3)×2.在研究打鼾與患心臟病之間的關(guān)系中,通過收集數(shù)據(jù)、整理分析數(shù)據(jù)得到“打鼾與患心臟病有關(guān)”的結(jié)論,并且在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為這個(gè)結(jié)論是成立的.下列說法中正確的是()A.100個(gè)心臟病患者中至少有99人打鼾B.1個(gè)人患心臟病,則這個(gè)人有99%的概率打鼾C.100個(gè)心臟病患者中一定有打鼾的人D.100個(gè)心臟病患者中可能一個(gè)打鼾的人都沒有D[這是獨(dú)立性檢驗(yàn),在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為“打鼾與患心臟病有關(guān)”.這只是一個(gè)概率,即打鼾與患心臟病有關(guān)的可能性為99%.根據(jù)概率的意義可知答案應(yīng)選D.]3.觀察下列各圖,其中兩個(gè)分類變量x,y之間關(guān)系最強(qiáng)的是________.(4)[在四幅圖中圖(4)中兩個(gè)深色條的高相差最明顯,說明兩個(gè)分類變量之間關(guān)系最強(qiáng),故選(4).]4.某大學(xué)餐飲中心為了了解新生的飲食習(xí)慣,在全校一年級(jí)學(xué)生中進(jìn)行了抽樣調(diào)查,調(diào)查結(jié)果如下表所示:喜歡甜品不喜歡甜品總計(jì)南方學(xué)生602080北方學(xué)生101020

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論