《8.3 列聯(lián)表與獨立性檢驗》教案_第1頁
《8.3 列聯(lián)表與獨立性檢驗》教案_第2頁
《8.3 列聯(lián)表與獨立性檢驗》教案_第3頁
《8.3 列聯(lián)表與獨立性檢驗》教案_第4頁
《8.3 列聯(lián)表與獨立性檢驗》教案_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

8.3列聯(lián)表與獨立性檢驗(第一課時分類變量與列聯(lián)表)課標要求素養(yǎng)要求1.通過實例,理解2×2列聯(lián)表的統(tǒng)計意義.2.理解判斷兩個分類變量是否有關系的常用方法.通過學習2×2列聯(lián)表,提升數(shù)學抽象、直觀想象及數(shù)據(jù)分析素養(yǎng).【課前預習】新知探究飲用水的質量是人類普遍關心的問題,根據(jù)統(tǒng)計,飲用優(yōu)質水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人.問題人的身體健康狀況與飲用水的質量之間有關系嗎?提示我們可以根據(jù)2×2列聯(lián)表找到人的身體健康與飲用水之間的關系,也就是本節(jié)課所要學習的內容.1.分類變量這里所說的變量和值不一定是具體的數(shù)值,例如:性別變量,其取值為男和女兩種我們經常會使用一種特殊的隨機變量,以區(qū)別不同的現(xiàn)象或性質,這類隨機變量稱為分類變量,分類變量的取值可以用實數(shù)表示.2.2×2列聯(lián)表在實踐中,由于保存原始數(shù)據(jù)的成本較高,人們經常按研究問題的需要,將數(shù)據(jù)分類統(tǒng)計,并做成表格加以保存,我們將這類數(shù)據(jù)統(tǒng)計表稱為2×2列聯(lián)表,2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為y1y2合計x1aba+bx2cdc+d合計a+cb+da+b+c+d3.等高堆積條形圖等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征,依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷結果.拓展深化[微判斷]1.分類變量中的變量與函數(shù)中的變量是同一概念.(×)提示分類變量中的變量是指一定范圍內的兩種現(xiàn)象或性質,與函數(shù)中的變量不是同一概念.2.列聯(lián)表中的數(shù)據(jù)是兩個分類變量的頻數(shù).(√)3.列聯(lián)表、頻率分析法、等高條形圖都可初步分析兩分類變量是否有關系.(√)[微訓練]1.下列不是分類變量的是()A.近視 B.成績C.血壓 D.飲酒解析近視變量有近視與不近視兩種類別,血壓變量有異常、正常兩種類別,飲酒變量有飲酒與不飲酒兩種類別.故選B.答案B2.某校為了檢驗高中數(shù)學新課程改革的成果,在兩個班進行教學方式的對比試驗,兩個月后進行了一次檢測,試驗班與對照班成績統(tǒng)計如2×2列聯(lián)表所示(單位:人),則其中m=________,n=________.80分及80分以上80分以下合計試驗班321850對照班24m50合計5644n解析由題意得eq\b\lc\{(\a\vs4\al\co1(24+m=50,,56+44=n,))解得eq\b\lc\{(\a\vs4\al\co1(m=26,,n=100.))答案26100[微思考]1.是否吸煙、是否患肺癌是什么變量?提示分類變量.2.吸煙與患肺癌之間的關系還是前面我們研究的線性相關關系嗎?提示不是.【課堂互動】題型一用2×2列聯(lián)表分析兩分類變量間的關系【例1】在對人們飲食習慣的一次調查中,共調查了124人,其中六十歲以上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另外33人則以肉類為主.請根據(jù)以上數(shù)據(jù)作出飲食習慣與年齡的列聯(lián)表,并利用eq\f(a,a+b)與eq\f(c,c+d)判斷二者是否有關系.解2×2列聯(lián)表如下:年齡在六十歲以上年齡在六十歲以下合計飲食以蔬菜為主432164飲食以肉類為主273360合計7054124將表中數(shù)據(jù)代入公式得eq\f(a,a+b)=eq\f(43,64)=0.671875.eq\f(c,c+d)=eq\f(27,60)=0.45.顯然二者數(shù)據(jù)具有較為明顯的差距,據(jù)此可以在某種程度上認為飲食習慣與年齡有關系.規(guī)律方法(1)作2×2列聯(lián)表時,關鍵是對涉及的變量分清類別.計算時要準確無誤.(2)利用2×2列聯(lián)表分析兩個分類變量間的關系時,首先要根據(jù)題中數(shù)據(jù)獲得2×2列聯(lián)表,然后根據(jù)頻率特征,即將eq\f(a,a+b)與eq\f(c,c+d)eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(b,a+b)與\f(d,c+d)))的值相比,直觀地反映出兩個分類變量間是否相互影響,但方法較粗劣.【訓練1】假設有兩個分類變量X與Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為:y1y2x11018x2m26則當m取下面何值時,X與Y的關系最弱()A.8 B.9C.14 D.19解析由10×26≈18m,解得m≈14.4,所以當m=14時,X與Y的關系最弱.答案C題型二用等高堆積條形圖分析兩分類變量間的關系【例2】某學校對高三學生作了一項調查發(fā)現(xiàn):在平時的模擬考試中,性格內向的學生426人中有332人在考前心情緊張,性格外向的學生594人中有213人在考前心情緊張,作出等高條形圖,利用圖形判斷考前心情緊張與性格類型是否有關系.解作列聯(lián)表如下:性格內向性格外向合計考前心情緊張332213545考前心情不緊張94381475合計4265941020相應的等高堆積條形圖如圖所示:圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內向的人數(shù)的比例,從圖中可以看出考前心情緊張的樣本中性格內向的人數(shù)占的比例比考前心情不緊張樣本中性格內向的人數(shù)占的比例高,可以認為考前心情緊張與性格類型有關.規(guī)律方法利用等高堆積條形圖判斷兩個分類變量是否相關的步驟:【訓練2】在調查的480名男人中有38人患色盲,520名女人中有6名患色盲,試利用圖形來判斷色盲與性別是否有關?解根據(jù)題目給出的數(shù)據(jù)作出如下的列聯(lián)表:色盲不色盲合計男38442480女6514520合計449561000根據(jù)列聯(lián)表作出相應的等高堆積條形圖:從等高堆積條形圖來看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我們認為患色盲與性別是有關系的.【素養(yǎng)達成】一、素養(yǎng)落地1.通過本節(jié)課的學習,進一步提升數(shù)學抽象、直觀想象及數(shù)據(jù)分析素養(yǎng).2.列聯(lián)表與等高堆積條形圖列聯(lián)表由兩個分類變量之間頻率大小的差異說明這兩個變量之間是否有相關關系,而利用等高堆積條形圖能形象直觀地反映它們之間的差異,進而推斷它們之間是否具有相關關系.二、素養(yǎng)訓練1.與表格相比,能更直觀地反映出相關數(shù)據(jù)總體狀況的是()A.列聯(lián)表 B.散點圖C.殘差圖 D.等高堆積條形圖答案D2.在一項有關醫(yī)療保健的社會調查中,發(fā)現(xiàn)調查的男性為530人,女性為670人,其中男性中喜歡吃甜食的為117人,女性中喜歡吃甜食的為492人,則性別與喜歡吃甜食的2×2列聯(lián)表為________.答案喜歡吃甜食不喜歡吃甜食合計男117413530女492178670合計60959112003.根據(jù)如圖所示的等高堆積條形圖可知吸煙與患肺病________關系(填“有”或“沒有”).解析從等高條形圖上可以明顯地看出吸煙患肺病的頻率遠遠大于不吸煙患肺病的頻率.答案有4.(多空題)下面是一個2×2列聯(lián)表:y1y2合計x1a2173x222527合計b46100則表中a=________,b=__________.解析由題意得eq\b\lc\{(\a\vs4\al\co1(a+21=73,,a+2=b,))解得eq\b\lc\{(\a\vs4\al\co1(a=52,,b=54.))答案52545.為考察某種藥物預防疾病的效果進行動物試驗,得到如下列聯(lián)表:患病未患病合計服用藥104555未服用藥203050合計3075105試用等高條形圖分析服用藥和患病之間是否有關系.解根據(jù)列聯(lián)表所給的數(shù)據(jù)可得出服用藥患病的頻率為eq\f(10,55)≈0.18,未服用藥患病的頻率為eq\f(20,50)=0.4,兩者的差距是|0.18-0.4|=0.22,兩者相差很大,作出等高條形圖如圖所示,因此服用藥與患病有關系.【課后作業(yè)】基礎達標一、選擇題1.觀察下列各圖,其中兩個分類變量x,y之間關系最強的是()解析觀察等高條形圖發(fā)現(xiàn)eq\f(x1,x1+y1)和eq\f(x2,x2+y2)相差越大,就判斷兩個分類變量之間關系越強.答案D2.可以粗略地判斷兩個分類變量是否有關系的是()A.散點圖 B.等高堆積條形圖C.殘差圖 D.以上都不對解析用等高堆積條形圖可以粗略地判斷兩個分類變量是否有關系,體現(xiàn)了數(shù)形結合思想,但是無法給出結論的可信程度,故選B.答案B3.(多選題)分類變量X和Y的列聯(lián)表如下:y1y2合計x1aba+bx2cdc+d合計a+cb+da+b+c+d則下列說法不正確的是()A.ad-bc越小,說明X與Y關系越弱B.ad-bc越大,說明X與Y關系越強C.(ad-bc)2越大,說明X與Y關系越強D.(ad-bc)2越接近于0,說明X與Y關系越強解析|ad-bc|越小,說明X與Y關系越弱,|ad-bc|越大,說明X與Y關系越強.答案ABD4.已知兩分類變量的列聯(lián)表如下:Aeq\o(A,\s\up6(-))合計B2008001000eq\o(B,\s\up6(-))180a180+a合計380800+a1180+a最后發(fā)現(xiàn),這兩個分類變量沒有任何關系,則a的值可能是()A.200 B.720C.100 D.180解析由于A和B沒有任何關系,根據(jù)列聯(lián)表可知eq\f(200,1000)和eq\f(180,180+a)基本相等,檢驗可知,B滿足條件,故選B.答案B5.(多選題)如圖是調查某地區(qū)男、女中學生喜歡理科的等高條形圖,陰影部分表示喜歡理科的百分比,從圖可以看出()A.性別與喜歡理科無關B.女生中喜歡理科的百分比為80%C.男生比女生喜歡理科的可能性大些D.男生不喜歡理科的百分比為40%解析由題圖知女生中喜歡理科的百分比為20%,男生不喜歡理科的百分比為40%,男生比女生喜歡理科的可能性大些,故A,B不正確,C,D正確.答案CD二、填空題6.某大學在研究性別與職稱(分正教授、副教授)之間是否有關系,你認為應該收集的數(shù)據(jù)是_______________________________.答案男正教授人數(shù),男副教授人數(shù);女正教授人數(shù),女副教授人數(shù)7.2013年6月11日,中國的“神舟十號”發(fā)射成功,由此許多人認為中國進入了航天強國之列,也有許多人持反對意見,為此進行了調查.在參加調查的3648名男性公民與3432名女性公民中,持反對意見的男性有1843人、女性有1672人,在運用這些數(shù)據(jù)說明中國“神十”發(fā)射成功是否與中國進入航天強國有關系時,用下列給出的________最具說服力(填序號).①回歸直線方程;②平均數(shù)與方差;③等高堆積條形圖.解析由于參加調查的公民按性別被分成兩組,而且每一組又被分成兩種情況:認為有關與無關,故該資料取自完全隨機統(tǒng)計,符合2×2列聯(lián)表的要求,應用等高堆積條形圖最具說服力.答案③8.某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調查中,隨機抽取了100名電視觀眾,相關的數(shù)據(jù)如下表所示:文藝節(jié)目新聞節(jié)目合計20至40歲401858大于40歲152742合計5545100由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關:_______(填“是”或“否”).解析因為在20至40歲的58名觀眾中有18名觀眾收看新聞節(jié)目,而大于40歲的42名觀眾中有27名觀眾收看新聞節(jié)目,即eq\f(b,a+b)=eq\f(18,58),eq\f(d,c+d)=eq\f(27,42),兩者相差較大,所以經直觀分析,收看新聞節(jié)目的觀眾與年齡是有關的.答案是三、解答題9.為了解鉛中毒病人與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結果如下:組別陽性數(shù)陰性數(shù)合計鉛中毒病人29736對照組92837合計383573試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數(shù)有無差別,鉛中毒病人與尿棕色素為陽性是否有關系?解等高條形圖如圖所示:其中兩個淺色條的高分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關系.10.當某礦石粉廠生產一種礦石粉時,在數(shù)天內就有部分工人患職業(yè)性皮膚炎.在生產季節(jié)期間,隨機抽取車間工人抽血化驗,75名穿新防護服的車間工人中5例陽性,70例陰性,28名穿舊防護服的車間工人中10例陽性,18例陰性,請用圖形判定這種新防護服對預防工人職業(yè)性皮膚炎是否有效.(注:顯陰性即未患皮膚炎)解由題目所給的數(shù)據(jù)得2×2列聯(lián)表:陽性例數(shù)陰性例數(shù)合計穿新防護服57075穿舊防護服101828合計1588103相應的等高條形圖如圖所示.圖中兩個深色條的高分別表示穿新、舊防護服樣本中呈陽性的頻率,從圖中可以看出,穿舊防護服呈陽性的頻率高于穿新防護服呈陽性的頻率.因此,可以認為新防護服比舊防護服對預防這種皮膚炎有效.能力提升11.在2×2列聯(lián)表中,兩個比值相差越大,兩個分類變量有關系的可能性就越大,那么這兩個比值為()A.eq\f(a,a+b)與eq\f(c,c+d) B.eq\f(a,c+d)與eq\f(c,a+b)C.eq\f(a,a+d)與eq\f(c,b+c) D.eq\f(a,b+d)與eq\f(c,a+c)解析由題意,eq\b\lc\|\rc\|(\a\vs4\al\co1(\f(a,a+b)-\f(c,c+d)))=eq\b\lc\|\rc\|(\a\vs4\al\co1(\f(ac+ad-ac-bc,(a+b)(c+d))))=eq\b\lc\|\rc\|(\a\vs4\al\co1(\f(ad-bc,(a+b)(c+d)))),因為|ad-bc|的值越大,兩個分類變量有關系的可能性就越大,故選A.答案A12.為了研究子女吸煙與父母吸煙的關系,調查了一千多名青少年及其家長,數(shù)據(jù)如下:子女吸煙子女不吸煙合計父母吸煙237678915父母不吸煙83522605合計32012001520利用等高條形圖判斷父母吸煙對子女吸煙是否有影響?解等高條形圖如圖所示:由圖形觀察可以看出父母吸煙者中子女吸煙的比例要比父母不吸煙者中子女吸煙的比例高,因此可以在某種程度上認為“子女吸煙與父母吸煙有關系”.創(chuàng)新猜想13.(多選題)已知兩個分類變量X,Y,它們的取值分別為{x1,x2}和{y1,y2},其列聯(lián)表為:y1y2合計x1aba+bx2cdc+d合計a+cb+da+b+c+d若兩個分類變量X,Y沒有關系,則下列結論正確的()A.ad≈bcB.eq\f(a,a+b)≈eq\f(c,c+d)C.eq\f(c+d,a+b+c+d)≈eq\f(b+d,a+b+c+d)D.eq\f(c+a,a+b+c+d)≈eq\f(b+d,a+b+c+d)解析因為分類變量X,Y沒有關系,所以eq\f(a,a+b)≈eq\f(c,c+d),化簡得ad≈bc,所以A,B正確,C,D顯然不正確.答案AB14.(多空題)下表是關于男嬰與女嬰出生時間調查的列聯(lián)表:晚上白天合計男嬰45AB女嬰E35C合計98D180那么,A=__________,B=__________,C=__________,D=__________,E=__________.解析由列聯(lián)表知識得eq\b\lc\{(\a\vs4\al\co1(45+E=98,,98+D=180,,A+35=D,,E+35=C,,B+C=180,))解得eq\b\lc\{(\a\vs4\al\co1(A=47,,B=92,,C=88,,D=82,,E=53.))答案47928882538.3列聯(lián)表與獨立性檢驗(第二課時獨立性檢驗)課標要求素養(yǎng)要求了解隨機變量χ2的意義,通過對典型案例分析,了解獨立性檢驗的基本思想和方法.通過運用列聯(lián)表進行獨立性檢驗,提升數(shù)學抽象及數(shù)據(jù)分析素養(yǎng).【課前預習】新知探究山東省教育廳大力推行素質教育,增加了高中生的課外活動時間,某校調查了學生的課外活動方式,結果整理成下表:問題如何判定“喜歡體育還是文娛與性別是否有聯(lián)系”?提示可通過表格與圖形進行直觀分析,也可通過統(tǒng)計分析定量判斷.1.臨界值χ2統(tǒng)計量也可以用來作相關性的度量.χ2越小說明變量之間越獨立,χ2越大說明變量之間越相關χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).忽略χ2的實際分布與該近似分布的誤差后,對于任何小概率值α,可以找到相應的正實數(shù)xα,使得P(χ2≥xα)=α成立.我們稱xα為α的臨界值,這個臨界值就可作為判斷χ2大小的標準.2.獨立性檢驗基于小概率值α的檢驗規(guī)則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗(testofindependence).下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8283.應用獨立性檢驗解決實際問題的大致步驟(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋;(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值xα比較;(3)根據(jù)檢驗規(guī)則得出推斷結論;(4)在X和Y不獨立的情況下,根據(jù)需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律.拓展深化[微判斷]1.概率值α越小,臨界值xα越大.(√)2.獨立性檢驗的思想類似于反證法.(√)3.獨立性檢驗的結論是有多大的把握認為兩個分類變量有關系.(√)[微訓練]1.如果根據(jù)小概率α=0.01的χ2檢測試驗,認為H0成立,那么具體算出的數(shù)據(jù)滿足()附表:α0.050.0250.0100.0050.001xα3.8415.0246.6357.87910.828A.χ2>6.635 B.χ2>5.024C.χ2>7.879 D.χ2>3.841答案A2.某校為了研究“學生的性別”和“對待某一活動的態(tài)度”是否有關,運用2×2列聯(lián)表進行獨立性檢驗,經計算χ2=7.069,則認為“學生性別與支持某項活動有關系”的犯錯誤的概率不超過()A.0.1% B.1%C.99% D.99.9%解析∵χ2=7.069>6.635=x0.01,∴認為“學生性別與支持某項活動有關系”的犯錯誤的概率不超過1%.答案B[微思考]1.有人說:“在犯錯誤的概率不超過0.01的前提下認為吸煙和患肺病有關,是指每100個吸煙者中就會有99個患肺病的.”你認為這種觀點正確嗎?為什么?提示觀點不正確.犯錯誤的概率不超過0.01說明的是吸煙與患肺病有關的程度,不是患肺病的百分數(shù).2.應用獨立性檢驗的基本思想對兩個變量間的關系作出的推斷一定是正確的嗎?提示不一定.所有的推斷只代表一種可能性,不代表具體情況.【課堂互動】題型一有關“相關的檢驗”【例1】某校對學生課外活動進行調查,結果整理成下表,用你所學過的知識進行分析,能否在犯錯誤的概率不超過0.005的前提下,認為“喜歡體育還是文娛與性別有關系”?體育文娛合計男生212344女生62935合計275279解零假設為H0:喜歡體育還是喜歡文娛與性別沒有關系∵a=21,b=23,c=6,d=29,n=79,∴χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))=eq\f(79×(21×29-23×6)2,44×35×27×52)≈8.106>7.879=x0.005.根據(jù)小概率值α=0.005的χ2獨立性檢驗,我們推斷H0不成立,即認為喜歡體育還是喜歡文娛與性別有關系,此推斷犯錯誤的概率不大于0.005.規(guī)律方法獨立性檢驗的具體做法①根據(jù)實際問題的需要確定允許推斷“兩個分類變量有關系”犯錯誤的概率的上界α,然后查表確定臨界值xα.②利用公式χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))計算χ2.③如果χ2>xα,則“X與Y有關系”這種推斷犯錯誤的概率不超過α;否則,就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠的證據(jù)支持結論“X與Y有關系”.【訓練1】打鼾不僅影響別人休息,而且可能與患某種疾病有關.下表是一次調查所得的數(shù)據(jù):患心臟病未患心臟病合計每一晚都打鼾30224254不打鼾2413551379合計5415791633根據(jù)獨立性檢驗,能否在犯錯誤的概率不超過0.001的前提下認為每一晚都打鼾與患心臟病有關系?解零假設為H0:打鼾與患心臟病無關系由列聯(lián)表中的數(shù)據(jù),得χ2=eq\f(1633×(30×1355-224×24)2,254×1379×54×1579)≈68.033>10.828=x0.001.根據(jù)小概率值α=0.001的χ2獨立性檢驗,我們推斷H0不成立,即認為打鼾與患心臟病有關系,此推斷犯錯誤的概率不大于0.001.題型二有關“無關的檢驗”【例2】為了探究學生選報文、理科是否與對外語的興趣有關,某同學調查了361名高二在校學生,調查結果如下:理科生對外語有興趣的有138人,無興趣的有98人,文科生對外語有興趣的有73人,無興趣的有52人.試分析學生選報文、理科與對外語的興趣是否有關?解零假設為H0:選報文、理科與對外語的興趣無關.列出2×2列聯(lián)表理文合計有興趣13873211無興趣9852150合計236125361代入公式得χ2的觀測值χ2=eq\f(361×(138×52-73×98)2,236×125×211×150)≈1.871×10-4.∵1.871×10-4<2.706=x0.1,根據(jù)小概率值α=0.1的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,即選報文、理科與對外語的興趣無關.規(guī)律方法獨立性檢驗的關注點在2×2列聯(lián)表中,如果兩個分類變量沒有關系,則應滿足ad-bc≈0,因此|ad-bc|越小,關系越弱;|ad-bc|越大,關系越強.【訓練2】某教育機構為了研究成年人具有大學??埔陨蠈W歷(包括大學專科)和對待教育改革態(tài)度的關系,隨機抽取了392名成年人進行調查,所得數(shù)據(jù)如下表所示:積極支持教育改革不太贊成教育改革合計大學專科以上學歷39157196大學專科以下學歷29167196合計68324392對于教育機構的研究項目,根據(jù)上述數(shù)據(jù)能得出什么結論?解零假設為H0:成年人具有大學專科以上學歷(包括大學???和對待教育改革態(tài)度無關.根據(jù)表中數(shù)據(jù),計算得χ2=eq\f(392×(39×167-157×29)2,196×196×68×324)≈1.78.因為1.78<2.706=x0.1,根據(jù)小概率值α=0.1的χ2獨立性檢驗,沒有充分證據(jù)推斷H0不成立,所以我們沒有理由說成年人具有大學??埔陨蠈W歷(包括大學專科)和對待教育改革態(tài)度有關.題型三獨立性檢驗的綜合應用【例3】某高校共有學生15000人,其中男生10500人,女生4500人.為調查該校學生每周平均體育運動時間的情況,采用分層隨機抽樣的方法,收集300位學生每周平均體育運動時間(單位:時)的樣本數(shù)據(jù).(1)應收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個樣本數(shù)據(jù),得到學生每周平均體育運動時間的頻率分布直方圖(如圖),其中樣本數(shù)據(jù)的分組區(qū)間為[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學生每周平均體育運動時間超過4小時的概率.(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與性別的列聯(lián)表,并判斷是否認為“該校學生的每周平均體育運動時間與性別有關”.附:α0.1000.0500.0100.005xα2.7063.8416.6357.879χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).解(1)由分層隨機抽樣可得300×eq\f(4500,15000)=90,所以應收集90位女生的樣本數(shù)據(jù).(2)由頻率分布直方圖得學生每周平均體育運動時間超過4小時的頻率為1-2×(0.100+0.025)=0.75,所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75.(3)由(2)知,300位學生中有300×0.75=225(人)的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時.樣本數(shù)據(jù)中有210份是關于男生的,90份是關于女生的,可得每周平均體育運動時間與性別的列聯(lián)表如下:男生女生合計每周平均體育運動時間不超過4小時453075每周平均體育運動時間超過4小時16560225合計21090300零假設為H0:該校學生的每周平均體育運動時間與性別無關.結合列聯(lián)表可算得χ2=eq\f(300×(45×60-30×165)2,75×225×210×90)≈4.762>3.841=x0.05.根據(jù)小概率值α=0.1的χ2獨立性檢驗,我們推斷H0不成立,即認為“該校學生的每周平均體育運動時間與性別有關”,此推斷犯錯誤的概率不大于0.05.規(guī)律方法(1)解答此類題目的關鍵在于正確利用χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))計算χ2的值,再用它與臨界值xα的大小作比較來判斷假設檢驗是否成立,從而使問題得到解決.(2)此類題目規(guī)律性強,解題比較格式化,填表計算分析比較即可,要熟悉其計算流程,不難理解掌握.【訓練3】某校高三年級在一次全年級的大型考試中,數(shù)學成績優(yōu)秀和非優(yōu)秀的學生中,物理、化學、總分成績優(yōu)秀的人數(shù)如下表所示,能否在犯錯誤的概率不超過0.001的前提下認為數(shù)學成績優(yōu)秀與物理、化學、總分成績優(yōu)秀有關系?物理優(yōu)秀化學優(yōu)秀總分優(yōu)秀數(shù)學優(yōu)秀228225267數(shù)學非優(yōu)秀14315699注:該年級在此次考試中數(shù)學成績優(yōu)秀的有360人,非優(yōu)秀的有880人.解零假設為H0:數(shù)學成績優(yōu)秀與物理、化學、總分成績優(yōu)秀都無關系.列出數(shù)學成績與物理成績的2×2列聯(lián)表如下:物理優(yōu)秀物理非優(yōu)秀合計數(shù)學優(yōu)秀228132360數(shù)學非優(yōu)秀143737880合計3718691240將表中數(shù)據(jù)代入公式,得χeq\o\al(2,1)=eq\f(1240×(228×737-132×143)2,360×880×371×869)≈270.1>10.828=x0.001.列出數(shù)學成績與化學成績的2×2列聯(lián)表如下:化學優(yōu)秀化學非優(yōu)秀合計數(shù)學優(yōu)秀225135360數(shù)學非優(yōu)秀156724880合計3818591240將表中數(shù)據(jù)代入公式,得χeq\o\al(2,2)=eq\f(1240×(225×724-156×135)2,360×880×381×859)≈240.6>10.828=x0.001.列出數(shù)學成績與總分成績的2×2列聯(lián)表如下:總分優(yōu)秀總分非優(yōu)秀合計數(shù)學優(yōu)秀26793360數(shù)學非優(yōu)秀99781880合計3668741240將表中數(shù)據(jù)代入公式,得χeq\o\al(2,3)=eq\f(1240×(267×781-93×99)2,360×880×366×874)≈486.1>10.828=x0.001.根據(jù)小概率值α=0.001的χ2獨立性檢驗,我們推斷H0不成立,即認為數(shù)學成績優(yōu)秀與物理、化學、總分成績優(yōu)秀都有關系,此推斷犯錯誤的概率不大于0.001.【素養(yǎng)達成】一、素養(yǎng)落地1.通過本節(jié)課的學習,提升數(shù)學抽象及數(shù)據(jù)分析素養(yǎng).2.對獨立性檢驗思想的理解獨立性檢驗的基本思想類似于數(shù)學中的反證法.先假設“兩個分類變量沒有關系”成立,計算χ2的值,如果χ2值很大,說明假設不合理,χ2越大,兩個分類變量有關系的可能性越大.二、素養(yǎng)訓練1.對兩個分類變量A,B的下列說法中正確的個數(shù)為()①A與B無關,即A與B互不影響;②A與B關系越密切,則χ2的值就越大;③χ2的大小是判定A與B是否相關的唯一依據(jù)A.0 B.1C.2 D.3解析①正確,A與B無關即A與B相互獨立;②不正確,χ2的值的大小只是用來檢驗A與B是否相互獨立;③不正確,例如借助三維柱形圖、二維條形圖等.故選B.答案B2.高二第二學期期中考試,按照甲、乙兩個班學生的數(shù)學成績優(yōu)秀和及格統(tǒng)計人數(shù)后,得到如下列聯(lián)表:優(yōu)秀及格合計甲班113445乙班83745合計197190則χ2的觀測值約為()A.0.600 B.0.828C.2.712 D.6.004解析根據(jù)列聯(lián)表中的數(shù)據(jù),可得χ2=eq\f(90×(11×37-34×8)2,45×45×19×71)≈0.600.故選A.答案A3.考察棉花種子經過處理跟生病之間的關系得到下表數(shù)據(jù):種子處理種子未處理合計得病32101133不得病61213274合計93314407根據(jù)以上數(shù)據(jù),可得出()A.種子是否經過處理跟是否生病有關B.種子是否經過處理跟是否生病無關C.種子是否經過處理決定是否生病D.以上都是錯誤的解析由χ2=eq\f(407×(32×213-61×101)2,93×314×133×274)≈0.164<2.706=x0.1,故沒有把握認為種子是否經過處理跟是否生病有關.答案B4.(多選題)對于分類變量X與Y的隨機變量χ2的值,下列說法正確的是()A.χ2越大,“X與Y有關系”的可信程度越小B.χ2越小,“X與Y有關系”的可信程度越小C.χ2越接近于0,“X與Y沒有關系”的可信程度越小D.χ2越大,“X與Y沒有關系”的可信程度越小解析χ2越大,“X與Y沒有關系”的可信程度越小,則“X與Y有關系”的可信程度越大,χ2越小,“X與Y有關系”的可信程度越?。鸢窧D5.高中流行這樣一句話“文科就怕數(shù)學不好,理科就怕英語不好”.下表是一次針對高三文科學生的調查所得的數(shù)據(jù).總成績好總成績不好合計數(shù)學成績好478a490數(shù)學成績不好39924423合計bc913(1)計算a,b,c的值;(2)文科學生總成績不好與數(shù)學成績不好有關系嗎?解(1)由478+a=490,得a=12.由a+24=c,得c=12+24=36.b=478+399=877.(2)零假設為H0:文科學生總成績不好與數(shù)學成績不好沒有關系.計算得χ2=eq\f(913×(478×24-399×12)2,490×423×877×36)≈6.233>5.024=x0.05,根據(jù)小概率值α=0.05的χ2獨立性檢驗,我們推斷H0不成立,即認為文科學生總成績不好與數(shù)學成績不好有關系,此推斷犯錯誤的概率不大于0.05.【課后作業(yè)】基礎達標一、選擇題1.想要檢驗是否喜歡參加體育活動是不是與性別有關,應該檢驗()A.零假設H0:男性喜歡參加體育活動B.零假設H0:女性不喜歡參加體育活動C.零假設H0:喜歡參加體育活動與性別有關D.零假設H0:喜歡參加體育活動與性別無關解析獨立性檢驗假設有反證法的意味,應假設兩類變量(而非變量的屬性)無關,這時的χ2應該很小,如果χ2很大,則可以否定假設,如果χ2很小,則不能夠肯定或者否定假設.答案D2.某市政府調查市民收入增減與旅游愿望的關系時,采用獨立性檢驗法抽查了3000人,計算得χ2=6.023,則市政府斷言市民收入增減與旅游愿望有關系的可信程度是()A.90% B.95%C.99% D.99.5%解析由臨界值表,得6.023>3.841=x0.05,所以可斷言市民收入增減與旅游愿望有關系的可信程度為95%.答案B3.為了研究高中學生對鄉(xiāng)村音樂的態(tài)度(喜歡和不喜歡兩種態(tài)度)與性別的關系,運用2×2列聯(lián)表進行獨立性檢驗,經計算得χ2=7.01,則認為“喜歡鄉(xiāng)村音樂與性別有關系”的把握約為()A.0.1% B.1%C.99% D.99.9%解析易知χ2=7.01>6.635=x0.01,對照臨界值表知,有99%的把握認為喜歡鄉(xiāng)村音樂與性別有關系.答案C4.在獨立性檢驗中,兩個分類變量“X與Y有關系”的可信度為99%,則隨機變量χ2的取值范圍是()A.[2.706,3.841) B.[3.841,6.635)C.[6.635,7.879) D.[7.879,10.828)解析對照臨界值表可知選C.答案C5.某班主任對全班50名學生進行了作業(yè)量的調查,數(shù)據(jù)如下表:認為作業(yè)量大認為作業(yè)量不大合計男生18927女生81523合計262450則推斷“學生的性別與認為作業(yè)量大有關”這種推斷犯錯誤的概率不超過()A.0.01 B.0.025C.0.05 D.0.001解析由公式得χ2=eq\f(50×(18×15-8×9)2,26×24×27×23)≈5.059>3.841=x0.05.∴犯錯誤的概率不超過0.05.答案C二、填空題6.在研究性別與吃零食這兩個分類變量是否有關系時,下列說法中正確的是________(填序號).①若χ2=6.635,則我們在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系,那么在100個吃零食的人中必有99人是女性;②由獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系時,如果某人吃零食,那么此人是女性的可能性為99%;③由獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系時,是指每進行100次這樣的推斷,平均有1次推斷錯誤.解析χ2的觀測值是支持確定有多大把握認為“兩個分類變量吃零食與性別有關系”的隨機變量值,所以由獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下認為吃零食與性別有關系時,是指每進行100次這樣的推斷,平均有1次推斷錯誤,故填③.答案③7.某高校“統(tǒng)計初步”課程的教師隨機調查了選該課的一些學生的情況,具體數(shù)據(jù)如下表:專業(yè)性別非統(tǒng)計專業(yè)統(tǒng)計專業(yè)男1310女720為了判斷主修統(tǒng)計專業(yè)是否與性別有關系,根據(jù)表中的數(shù)據(jù),得到χ2=eq\f(50×(13×20-10×7)2,23×27×20×30)≈4.844>3.841=x0.05,所以判定主修統(tǒng)計專業(yè)與性別有關系,那么這種判斷出錯的可能性最大為__________.解析因為χ2>3.841=x0.05,所以有95%的把握認為主修統(tǒng)計專業(yè)與性別有關,出錯的可能性不超過5%.答案5%8.世界杯期間,某一電視臺對年齡高于40歲和不高于40歲的人是否喜歡西班牙隊進行調查,對高于40歲的調查了50人,不高于40歲的調查了50人,所得數(shù)據(jù)制成如下列聯(lián)表:不喜歡西班牙隊喜歡西班牙隊合計高于40歲pq50不高于40歲153550合計ab100若工作人員從所有統(tǒng)計結果中任取一個,取到喜歡西班牙隊的人的概率為eq\f(3,5),則在犯錯誤的概率不超過__________下認為年齡與西班牙隊的被喜歡程度有關.附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).α0.150.100.050.0250.0100.0050.001xα2.0722.7063.8415.0246.6357.87910.828解析設“從所有人中任意抽取一個,取到喜歡西班牙隊的人”為事件A,由已知得P(A)=eq\f(q+35,100)=eq\f(3,5),所以q=25,p=25,a=40,b=60.χ2=eq\f(100×(25×35-25×15)2,40×60×50×50)=eq\f(25,6)≈4.167>3.841=x0.05.故認為年齡與西班牙隊的被喜歡程度有關,此推斷犯錯誤的概率不超過5%.答案5%三、解答題9.研究人員選取170名青年男女大學生的樣本,對他們進行一種心理測驗,發(fā)現(xiàn)有60名女生對該心理測驗中的最后一個題目的反應是:作肯定的有22名,否定的有38名;男生110名在相同的項目上作肯定的有22名,否定的有88名.問:性別與態(tài)度之間是否存在某種關系?分別用條形圖和獨立性檢驗的方法判斷.解建立性別與態(tài)度的2×2列聯(lián)表如下:肯定否定合計男生2288110女生223860合計44126170根據(jù)列聯(lián)表中所給的數(shù)據(jù),可求出男生中作肯定態(tài)度的頻率為eq\f(22,110)=0.2,女生中作肯定態(tài)度的頻率為eq\f(22,60)≈0.37.作等高條形圖如圖,其中兩個深色條形的高分別表示男生和女生中作肯定態(tài)度的頻率,比較圖中深色條形的高可以發(fā)現(xiàn),女生中作肯定態(tài)度的頻率明顯高于男生中作肯定態(tài)度的頻率,因此可以認為性別與態(tài)度有關系.零假設為H0:性別和態(tài)度沒有關系.根據(jù)列聯(lián)表中的數(shù)據(jù)得到χ2=eq\f(170×(22×38-22×88)2,110×60×44×126)≈5.622>5.024=x0.025.根據(jù)小概率值α=0.025的χ2獨立性檢驗,我們推斷H0不成立,即認為性別和態(tài)度有關系,此推斷犯錯誤的概率不大于0.025.10.某旅行社為調查市民喜歡“人文景觀”景點是否與年齡有關,隨機抽取了55名市民,得到數(shù)據(jù)如下表所示:喜歡不喜歡合計大于40歲2052520歲至40歲102030合計302555(1)推斷能否在犯錯誤的概率不大于0.005的情況下認為喜歡“人文景觀”景點與年齡有關?(2)用分層隨機抽樣的方法從喜歡“人文景觀”景點的市民中隨機抽取6人作進一步調查,將這6名市民作為一個樣本,從中任選2人,求恰有1位大于40歲的市民和1位20歲至40歲的市民的概率.解(1)零假設為H0:喜歡“人文景觀”景點與年齡無關.由公式χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))得,χ2≈11.978>7.879=x0.005,根據(jù)小概率值α=0.005的χ2獨立性檢驗,我們推斷H0不成立,即認為喜歡“人文景觀”景點與年齡有關,此推斷犯錯誤的概率不大于0.005.(2)由題意知抽取的6人中大于40歲的市民有4個,20歲至40歲的市民有2個,分別記為B1,B2,B3,B4,C1,C2,從中任選2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,C1),(B1,C2),(B2,B3),(B2,B4),(B2,C1),(B2,C2),(B3,B4),(B3,C1),(B3,C2),(B4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論