高中數學第8章成對數據的統計分析8.3列聯表與獨立性檢驗課件新人教版選修3_第1頁
高中數學第8章成對數據的統計分析8.3列聯表與獨立性檢驗課件新人教版選修3_第2頁
高中數學第8章成對數據的統計分析8.3列聯表與獨立性檢驗課件新人教版選修3_第3頁
高中數學第8章成對數據的統計分析8.3列聯表與獨立性檢驗課件新人教版選修3_第4頁
高中數學第8章成對數據的統計分析8.3列聯表與獨立性檢驗課件新人教版選修3_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

8.3列聯表與獨立性檢驗課前·基礎認知課堂·重難突破素養(yǎng)·目標定位隨堂訓練素養(yǎng)?目標定位目標素養(yǎng)1.通過實例,了解分類變量、2×2列聯表的統計意義.2.通過實例,了解獨立性檢驗及其應用.3.通過學習,提升數學抽象、數學運算和數學建模的核心素養(yǎng).知識概覽課前·基礎認知1.分類變量與列聯表(1)分類變量用來區(qū)別不同的現象或性質的隨機變量稱為

分類變量

.分類變量的取值可以用實數表示.

(2)列聯表按研究問題的需要,將數據分類統計,并做成表格加以保存.我們將下表這種形式的數據統計表稱為

2×2列聯表

.2×2列聯表給出了成對分類變量數據的交叉分類頻數.

注:運用古典概型和條件概率的思路,用2×2列聯表去研究所關心對象的全體.XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d2.獨立性檢驗(1)利用隨機變量χ2的取值推斷分類變量X和Y是否獨立的方法稱為

χ2獨立性檢驗

,讀作“

卡方獨立性檢驗

”,簡稱獨立性檢驗.(2)獨立性檢驗公式

(3)基于小概率值α的檢驗規(guī)則當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.(4)χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828微思考獨立性檢驗的基本思想與反證法的思想有何相似之處?提示:反證法假設檢驗要證明結論A要確認“兩個變量有關系”在A不成立的前提下進行推理假設該結論不成立,即假設結論“兩個變量沒有關系”成立,在該假設下計算χ2推出矛盾,意味著結論A成立由觀測數據計算得到的χ2很大,則在一定可信程度上說明假設不合理沒有找到矛盾,不能對A下任何結論,即反證不成立根據隨機變量χ2的含義,可以通過χ2的大小來判斷“兩個變量有關系”這一結論成立有多大把握微訓練下面是一個2×2列聯表:則表中a,b處的值分別為(

)A.94,96 B.52,50

C.52,54

D.54,52答案:C解析:a=73-21=52,b=100-46=54.XY合計Y=0Y=1X=0a2173X=122527合計b46100(5)應用獨立性檢驗解決實際問題大致應包括以下幾個主要環(huán)節(jié):①提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.②根據抽樣數據整理出2×2列聯表,計算χ2的值,并與臨界值xα比較.③根據檢驗規(guī)則得出推斷結論.④在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律.注意,上述幾個環(huán)節(jié)的內容可以根據不同情況進行調整.課堂·重難突破一

列聯表與等高堆積條形圖的應用典例剖析1.為了解鉛中毒病人與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結果如下:單位:人組別陽性、陰性數合計陽性數陰性數鉛中毒病人29736對照組92837合計383573試畫出列聯表的等高堆積條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數有無差別,鉛中毒病人與尿棕色素為陽性是否存在差異?解:等高堆積條形圖如圖所示:其中兩個白色條的高度分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的概率.由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻率差異明顯,根據頻率穩(wěn)定于概率的原理,知鉛中毒病人與尿棕色素為陽性存在差異.規(guī)律總結判斷兩個分類變量是否有差異的兩種常用方法(1)利用數形結合思想,借助等高堆積條形圖來判斷兩個分類變量是否存在差異.(2)一般地,在等高堆積條形圖中,相差越大,兩個分類變量存在差異的可能性就越大.學以致用1.網絡對現代人的生活影響較大,尤其是對青少年.為了解網絡對中學生學習成績的影響,某地區(qū)教育主管部門從轄區(qū)初中生中隨機抽取了1000人調查,發(fā)現其中經常上網的有200人,這200人中有80人期末考試不及格,而另外800人中有120人不及格.利用等高堆積條形圖判斷學生學習成績與經常上網和不經常上網是否有關.解:根據題目所給的數據得到如下2×2列聯表:單位:人得出等高堆積條形圖如圖所示:比較圖中陰影部分的高度可以發(fā)現經常上網不及格的頻率明顯高于經常上網及格的頻率,根據頻率穩(wěn)定于概率的原理,可以認為學習成績與經常上網和不經常上網有關.二

獨立性檢驗典例剖析2.甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統計如下表:單位:件機床產品質量合計一級品二級品甲機床15050200乙機床12080200合計270130400(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少?(2)依據小概率值α=0.01的獨立性檢驗,分析甲機床的產品質量與乙機床的產品質量是否有差異.α0.050.010.001xα3.8416.63510.828(2)零假設為H0:甲機床的產品質量與乙機床的產品質量之間無差異.根據列聯表中的數據,依據小概率值α=0.01的獨立性檢驗,推斷H0不成立,即認為甲機床的產品質量與乙機床的產品質量有差異,此推斷犯錯誤的概率不大于0.01.互動探究(變問法)依據小概率值α=0.001的獨立性檢驗,分析甲機床的產品質量與乙機床的產品質量是否有差異.解:零假設為H0:甲機床的產品質量與乙機床的產品質量之間無差異.根據列聯表中的數據,經計算得到所以根據小概率值α=0.001的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即甲機床的產品質量與乙機床的產品質量無差異.規(guī)律總結1.利用χ2進行獨立性檢驗的步驟(1)零假設:即先假設兩變量沒有關系.(2)列表:列出2×2列聯表.(3)求值:求出χ2.(4)判斷:與臨界值比較,作出判斷.2.獨立性檢驗的必要性列聯表中的數據是樣本數據,它只是總體的代表,它具有隨機性,因此只能利用列聯表的數據和等高堆積條形圖粗略判斷兩個分類變量是否有關系.而χ2給出了不同樣本容量的數據的統一評判標準.利用它能精確判斷兩個分類變量是否有關系.學以致用2.某大學餐飲中心為了解新生的飲食習慣,在全校一年級學生中進行了抽樣調查,調查結果如下表所示:單位:人學生是否喜歡甜品合計喜歡甜品不喜歡甜品南方學生602080北方學生101020合計7030100根據表中數據,根據小概率值α=0.05的獨立性檢驗,分析南方學生和北方學生在選用甜品的飲食習慣方面是否有差異.解:零假設為H0:南方學生和北方學生在選用甜品的飲食習慣方面無差異.根據列聯表中的數據,經計算,得根據小概率值α=0.05的獨立性檢驗,推斷H0不成立,即認為南方學生和北方學生在選用甜品的飲食習慣方面有差異,此推斷犯錯誤的概率不大于0.05.三

獨立性檢驗的綜合應用典例剖析3.某生物疫苗研究所加緊對某種疫苗進行研究,將某一型號的疫苗用在動物小白鼠身上進行科研和臨床實驗,得到統計數據如下:單位:只是否注射疫苗是否感染病毒合計未感染病毒感染病毒未注射疫苗20xm注射疫苗30yn合計5050100現從所有感染病毒的小白鼠中隨機抽取一只,抽到注射疫苗的小白鼠的概率為

.(1)完成下面的2×2列聯表:單位:只是否注射疫苗是否感染病毒合計未感染病毒感染病毒未注射疫苗20

注射疫苗30

合計5050100(2)依據小概率值α=0.01的獨立性檢驗,分析注射疫苗是否對預防該病毒有效.α0.10.050.01xα2.7063.8416.635解:(1)所有感染病毒的小白鼠共有50只,其中注射疫苗的有y只,所以P=,所以y=10,x=50-10=40,m=40+20=60,n=30+10=40,所以2×2列聯表為

單位:只是否注射疫苗是否感染病毒合計未感染病毒感染病毒未注射疫苗204060注射疫苗301040合計5050100(2)零假設為H0:注射疫苗對預防該病毒無效.根據列聯表中的數據,根據小概率值α=0.01的獨立性檢驗,推斷H0不成立,即認為注射疫苗對預防該病毒有效,此推斷犯錯誤的概率不大于0.01.規(guī)律總結獨立性檢驗綜合應用的方法策略(1)獨立性檢驗在實際中有著廣泛的應用,是對實際生活中數據進行分析的一種方法,通過這種分析得出的結論對實際生活或者生產都有一定的指導作用.(2)近幾年高考中較少單獨考查獨立性檢驗,與統計、概率等知識綜合,頻率分布表、頻率分布直方圖與獨立性檢驗融合在一起是常見的考查形式,一般需要根據條件列出2×2列聯表,計算χ2的值,從而解決問題.學以致用3.為了解某班學生喜愛打籃球是否與性別有關,對本班48人進行了問卷調查,得到2×2列聯表如下表所示:單位:人性別是否喜愛打籃球合計喜愛打籃球不喜愛打籃球男生

6

女生10

合計

48已知在全班48人中隨機抽取1人,抽到喜愛打籃球的學生的概率為

.(1)請將上面的2×2列聯表補充完整(不用寫計算過程);(2)根據小概率值α=0.05的獨立性檢驗分析喜愛打籃球與性別是否有關,說明你的理由;(3)現從女生中抽取2人進一步調查,設其中喜愛打籃球的女生人數為X,求X的分布列與均值.解:(1)列聯表補充如下:

單位:人(2)零假設為H0:喜愛打籃球與性別無關聯.根據列聯表中的數據,經計算得到根據小概率值α=0.05的獨立性檢驗,推斷H0不成立,即認為喜愛打籃球與性別有關,此推斷犯錯誤的概率不大于0.05.(3)喜愛打籃球的女生人數X的可能取值為0,1,2.其概率分別為隨堂訓練1.(多選題)在研究肥胖與高血壓的關系時,通過收集、整理、分析數據得到“高血壓與肥胖有關”的結論,并且依據小概率值α=0.01的χ2獨立性檢驗,推斷這個結論是成立的,下列說法中錯誤的是(

)A.在100個肥胖的人中至少有99人患有高血壓B.肥胖的人至少有99%的概率患有高血壓C.在100個高血壓患者中一定有肥胖的人D.在100個高血壓患者中可能沒有肥胖的人答案:ABC2.通過對χ2的統計量的研究得到了若干個臨界值,當χ2<2.706時,我們認為(

)A.X與Y有差異,犯錯誤的概率不超過0.05B.X與Y有差異,犯錯誤的概率不超過0.01C.依據小概率值α=0.1的χ2獨立性檢驗,沒有充分理由認為X與Y有差異D.不能確定答案:C解析:χ2<2.706=x0.1,根據小概率值α=0.1的χ2獨立性檢驗沒有充分理由認為X與Y有差異.3.(多選題)下面是某地區(qū)男、女學生喜歡物理情況的等高堆積條形圖,陰影部分表示喜歡物理的百分比.下列說法錯誤的是(

)A.性別與喜歡物理無關B.女生喜歡物理的百分比為80%C.男生喜歡物理比女生喜歡物理的可能性大些D.男生不喜歡物理的百分比為60%答案:ABD解析:由題圖知女生中喜歡物理的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論