列聯(lián)表與獨立性檢驗_第1頁
列聯(lián)表與獨立性檢驗_第2頁
列聯(lián)表與獨立性檢驗_第3頁
列聯(lián)表與獨立性檢驗_第4頁
列聯(lián)表與獨立性檢驗_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

8.3列聯(lián)表與獨立性檢驗1.通過實例,理解分類變量與2×2列聯(lián)表的統(tǒng)計意義.能用等高堆積條形圖、列聯(lián)表探討兩個分類變量的關(guān)系.2.通過實例,了解χ2的含義及應(yīng)用,理解獨立性檢驗的基本思想,獨立性檢驗的實施步驟,并能應(yīng)用解決實際問題.3.通過2×2列聯(lián)表統(tǒng)計意義的學(xué)習(xí),體會數(shù)學(xué)抽象的素養(yǎng).4.借助χ2計算公式進行獨立性檢驗,培養(yǎng)數(shù)學(xué)運算和數(shù)據(jù)分析的素養(yǎng).知識點一分類變量與列聯(lián)表(一)教材梳理填空1.分類變量我們經(jīng)常會使用一種特殊的隨機變量,以區(qū)別不同的

,這類隨機變量稱為分類變量.2.列聯(lián)表(1)定義:列出的兩個分類變量的

,稱為列聯(lián)表.現(xiàn)象性質(zhì)頻數(shù)表[微思考]

如何用列聯(lián)表判定兩個分類變量是否有關(guān)系?

提示:利用列聯(lián)表中的數(shù)據(jù)計算,若P(Y=1|X=0)=P(Y=1|X=1),則說明兩分類變量無影響,若P(Y=1|X=0)≠P(Y=1|X=1),則說明兩分類變量有影響.XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d3.等高堆積條形圖(1)等高堆積條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.(2)如果直接觀察等高堆積條形圖發(fā)現(xiàn)P(Y=1|X=0)與P(Y=1|X=1)相差很大,就可以判斷兩個分類變量之間有關(guān)系.(二)基本知能小試1.判斷正誤(1)分類變量中的變量與函數(shù)中的變量是同一概念.

(

)(2)2×2列聯(lián)表是借助兩個分類變量之間頻率大小差異說明兩個變量之間是否有關(guān)聯(lián)關(guān)系.

(

)答案:(1)×

(2)√2.下列關(guān)于等高堆積條形圖的敘述正確的是

(

)A.從等高堆積條形圖中可以精確地判斷兩個分類變量是否有關(guān)系B.從等高堆積條形圖中可以看出兩個變量頻數(shù)的相對大小C.從等高堆積條形圖中可以粗略地看出兩個分類變量是否有關(guān)系D.以上說法都不對解析:在等高條形圖中僅能粗略判斷兩個分類變量的關(guān)系,故A錯.在等高堆積條形圖中僅能夠找出頻率,無法找出頻數(shù).答案:C

3.為了解某挑戰(zhàn)賽中是否接受挑戰(zhàn)與受邀者的性別是否有關(guān)系,得到關(guān)于分類變量X,Y的列聯(lián)表如下:則表中a,b處的值分別為________.解析:∵a+21=73,∴a=52.b=a+8=52+8=60.答案:52,60性別挑戰(zhàn)合計不接受挑戰(zhàn)(Y=0)接受挑戰(zhàn)(Y=1)男生(X=0)a2173女生(X=1)82533合計b46106知識點二獨立性檢驗(一)教材梳理填空1.定義:利用χ2的取值推斷分類變量X和Y

的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱

.3.小概率值α的檢驗規(guī)則(1)當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;(2)當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.是否獨立獨立性檢驗4.臨界值表5.應(yīng)用獨立性檢驗解決實際問題包括的主要環(huán)節(jié)(1)提出零假設(shè)H0:X和Y

,并給出在問題中的解釋;(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算

的值,并與

比較;(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論;(4)在X和Y不獨立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.α0.10.050.010.0050.001xα2.706____________6.6357.879________3.84110.828相互獨立臨界值xα[微思考]

有人說:“根據(jù)小概率值α=0.01的獨立性檢驗認為吸煙和患肺癌有關(guān)”,是指“每100個吸煙者中就會有1個患肺癌.”你認為這種觀點正確嗎?為什么?提示:觀點不正確.“根據(jù)小概率值α=0.01”說明的是吸煙與患肺癌有關(guān)程度的概率值,不是患肺癌的百分數(shù).(二)基本知能小試1.判斷正誤(1)在獨立性檢驗中,若χ2越大,則兩個分類變量有關(guān)系的可能性越大.

(

)(2)應(yīng)用獨立性檢驗的基本思想對兩個變量間的關(guān)系作出的推斷一定是正確的.

(

)答案:(1)√

(2)×2.在研究打鼾與患心臟病之間的關(guān)系中,通過收集數(shù)據(jù)、整理分析數(shù)據(jù)得到“打鼾與患心臟病有關(guān)”的結(jié)論,并且根據(jù)小概率值α=0.01的獨立性檢驗認為這個結(jié)論是成立的.下列說法中正確的是

(

)A.100個心臟病患者中至少有99人打鼾B.1個人患心臟病,則這個人有99%的概率打鼾C.100個心臟病患者中一定有打鼾的人D.100個心臟病患者中可能一個打鼾的人都沒有解析:這是獨立性檢驗,根據(jù)小概率值α=0.01的獨立性檢驗認為“打鼾與患心臟病有關(guān)”.這只是一個概率,即打鼾與患心臟病有關(guān)的可能性為99%.根據(jù)概率的意義可知答案應(yīng)選D.答案:D

3.根據(jù)下表計算:χ2≈________(保留3位小數(shù)).性別X是否看電視Y合計不看電視(Y=0)看電視(Y=1)男(X=0)3785122女(X=1)35143178合計72228300題型一用2×2列聯(lián)表分析兩變量間的關(guān)系

[探究發(fā)現(xiàn)]借助列聯(lián)表,通過比較哪些值來反映出兩個分類變量的相互影響?提示:將P(Y=1|X=0)與P(Y=1|X=1)的值相比較.若近似相等,則表明兩分類變量無關(guān);若有差異,則表明兩分類變量有關(guān)系.

[學(xué)透用活][典例1]在對人們飲食習(xí)慣的一次調(diào)查中,從某一居民小區(qū)中共調(diào)查了124位居民,其中六十歲以上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另外33人則以肉類為主.請根據(jù)以上數(shù)據(jù)作出飲食習(xí)慣與年齡的列聯(lián)表,并利用P(Y=1|X=0)與P(Y=1|X=1)判斷二者是否有關(guān)系.飲食年齡合計六十歲以上(Y=0)六十歲以下(Y=1)以蔬菜為主(X=0)432164以肉類為主(X=1)273360合計7054124(1)作2×2列聯(lián)表時,關(guān)鍵是對涉及的變量分清類別,同時計算時要準確無誤.(2)利用2×2列聯(lián)表分析兩變量間的關(guān)系時,首先要根據(jù)題中數(shù)據(jù)獲得2×2列聯(lián)表,然后根據(jù)頻率特征,即將P(Y=1|X=0)與P(Y=1|x=1)的值相比,可直觀地反映出兩個分類變量間是否相互影響.則當(dāng)m取下面何值時,X與Y之間沒有影響

(

)A.8

B.9C.14 D.19XY合計Y=0Y=1X=0101828X=1m26m+26合計10+m44m+54題型二用等高堆積條形圖分析兩變量間的關(guān)系

[學(xué)透用活]在等高堆積條形圖中展示列聯(lián)表數(shù)據(jù)的頻率特征,比較圖中兩個深色條的高可以發(fā)現(xiàn)兩者頻率不一樣而得出結(jié)論,這種直觀判斷的不足之處在于不能給出推斷“兩個分類變量有關(guān)系”犯錯誤的概率.[典例2]為了解鉛中毒病人與尿棕色素為陽性是否有關(guān)系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結(jié)果如下:分組尿液定性合計陽性(Y=0)陰性(Y=1)病人組(X=0)29736對照組(X=1)92837合計383573試畫出列聯(lián)表的等高堆積條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數(shù)有無差別,鉛中毒病人與尿棕色素為陽性是否有關(guān)系?等高堆積條形圖如圖所示:其中兩個淺色條的高分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關(guān)系.利用等高條形圖判斷兩個分類變量是否相關(guān)的步驟(1)收集數(shù)據(jù),統(tǒng)計結(jié)果;(2)列出2×2列聯(lián)表,計算頻率粗略估計;(3)畫等高條形圖,直觀分析.

心情性格合計性格內(nèi)向(Y=0)性格外向(Y=1)心情緊張(X=0)332213545心情不緊張(X=1)94381475合計4265941020圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內(nèi)向的比例,從圖中可以看出考前心情緊張的樣本中性格內(nèi)向占的比例比考前心情不緊張樣本中性格內(nèi)向占的比例高,可以認為考前心情緊張與性格類型有關(guān).題型三有關(guān)獨立性檢驗的計算

[學(xué)透用活]1.用χ2進行獨立性檢驗的依據(jù)獨立性檢驗的基本思想類似于數(shù)學(xué)中的反證法.先假設(shè)“兩個分類變量獨立”成立,計算隨機變量χ2的值,如果χ2值很大,說明假設(shè)不合理.χ2越大,兩個分類變量有關(guān)系的可能性越大.2.獨立性檢驗與反證法的異同點

(1)兩者都是先假設(shè)結(jié)論不成立,然后根據(jù)是否能夠推出“矛盾”來斷定結(jié)論是否成立.(2)但二者“矛盾”的含義不同,反證法中的“矛盾”是指一種不符合邏輯事情的發(fā)生;而獨立性檢驗中的“矛盾”是指一種不符合邏輯的小概率事件的發(fā)生,即在結(jié)論不成立的假設(shè)下,推出有利于結(jié)論成立的小概率事件發(fā)生.性別休閑方式合計運動(Y=0)非運動(Y=1)男生(X=0)

女生(X=1)

合計

(2)根據(jù)小概率值α=0.05的獨立性檢驗,可認為“性別與休閑方式有關(guān)”,那么本次被調(diào)查的人數(shù)至少有多少?[解]

(1)補全2×2列聯(lián)表如下.利用χ2進行獨立性檢驗的步驟(1)列表:列出2×2列聯(lián)表.(2)求值:計算出χ2的值.(3)判斷:與臨界值xα比較,得出事件有關(guān)的可能性大小,作出判斷.

[對點練清]1.[變設(shè)問]根據(jù)(2)的結(jié)論,本次被調(diào)查的人中,至少有多少人的休閑方式是運動?2.[變條件,變設(shè)問]若增加條件n=100,問能否根據(jù)小概率值α=0.1的獨立性檢驗,可認為“性別與休閑方式有關(guān)”?解:零假設(shè)為H0:性別與休閑獨立,即性別與休閑方式無關(guān).3.某大型企業(yè)人力資源部為了研究企業(yè)員工工作積極性和對待企業(yè)改革態(tài)度的關(guān)系,經(jīng)過調(diào)查得到如下列聯(lián)表:根據(jù)列聯(lián)表的獨立性檢驗,能否根據(jù)小概率值α=0.005的獨立性檢驗,認為員工工作態(tài)度與支持企業(yè)改革之間有關(guān)系?工作態(tài)度對待改革態(tài)度合計積極支持(Y=0)不太支持(Y=1)工作積極(X=0)544094工作一般(X=1)326395合計86103189題型四獨立性檢驗的綜合應(yīng)用

[學(xué)透用活][典例4]某校為了探索一種新的教學(xué)模式,進行了一項課題實驗,乙班為實驗班,甲班為對比班,甲、乙兩班均有50人,一年后對兩班進行測試,成績分別如表1和表2所示(總分:150分):表1表2成績[80,90)[90,100)[100,110)[110,120)[120,130)頻數(shù)42015101成績[80,90)[90,100)[100,110)[110,120)[120,130)頻數(shù)11123132(1)現(xiàn)從甲班成績位于[90,120)內(nèi)的試卷中抽取9份進行試卷分析,用什么抽樣方法更合理?并寫出最后的抽樣結(jié)果;(2)根據(jù)所給數(shù)據(jù)可估計在這次測試中,甲班的平均分是101.8,請你估計乙班的平均分,并計算兩班平均分相差幾分;(3)完成下面2×2列聯(lián)表,你能否根據(jù)小概率值α=0.05的獨立性檢驗,認為

“這兩個班在這次測試中成績的差異與實施課題實驗有關(guān)”嗎?并說明理由.班級成績合計成績小于100分(Y=0)成績不小于100分(Y=1)甲班(X=0)a=______2650乙班(X=1)12d=______50合計3664100(3)補全列聯(lián)表如下.班級成績合計成績小于100分(Y=0)成績不小于100分(Y=1)甲班(X=0)a=242650乙班(X=1)12d=3850合計3664100[方法技巧](1)獨立性檢驗在實際中有著廣泛的應(yīng)用,是對實際生活中數(shù)據(jù)進行分析的一種方法,通過這種分析得出的結(jié)論對實際生活或者生產(chǎn)都有一定的指導(dǎo)作用.(2)近幾年高考中較少單獨考查獨立性檢驗,經(jīng)常與統(tǒng)計、概率等知識綜合,頻率分布表、頻率分布直方圖與獨立性檢驗融合在一起是常見的考查形式,一般需要根據(jù)條件列出2×2列聯(lián)表,計算χ2的值,從而解決問題.[對點練清]某高校共有學(xué)生15000人,其中男生10500人,女生4500人,為調(diào)查該校學(xué)生每周平均體育運動時間的情況,采用分層抽樣的方法,收集300位學(xué)生每周平均體育運動時間的樣本數(shù)據(jù)(單位:小時).(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個樣本數(shù)據(jù),得到學(xué)生每周平均體育運動時間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與性別的列聯(lián)表,并判斷能否根據(jù)小概率值α=0.05的獨立性檢驗,認為“該校學(xué)生的每周平均體育運動時間與性別有關(guān)”.P(χ2≥xα)0.100.050.0100.005xα2.7063.8416.6357.879運動時間性別合計男生(Y=0)女生(Y=1)不超過4小時(X=0)453075超過4小時(X=1)16560225合計21090300[課堂思維激活]一、綜合性——

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論