




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
PAGE3.2獨立性檢驗的基本思想及其初步應(yīng)用內(nèi)容標(biāo)準(zhǔn)學(xué)科素養(yǎng)1.能用等高條形圖反映兩個分類變量之間是否有關(guān)系.2.能夠依據(jù)條件列出列聯(lián)表并會由公式求k.3.能知道獨立性檢驗的基本思想和方法.利用數(shù)據(jù)分析提升數(shù)學(xué)建模及數(shù)學(xué)運算授課提示:對應(yīng)學(xué)生用書第54頁[基礎(chǔ)相識]學(xué)問點一分類變量及2×2列聯(lián)表eq\a\vs4\al(預(yù)習(xí)教材P91-92,思索并完成以下問題)在日常生活中,我們經(jīng)常關(guān)切兩個分類變量之間是否有關(guān)系.例如,吸煙與患肺癌是否有關(guān)系?性別是否對寵愛數(shù)學(xué)課程有影響?等等.為探討吸煙是否對患肺癌有影響,某腫瘤探討所隨機地調(diào)查了9965人,得到如下結(jié)果:不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965那么吸煙是否對患肺癌有影響?提示:在不吸煙樣本中,有0.54%患肺癌;在吸煙樣本中,有2.28%患肺癌.因此,直觀上可以得到結(jié)論:吸煙群體和不吸煙群體患肺癌的可能性存在差異,吸煙者患肺癌的可能性大.學(xué)問梳理1.分類變量變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.2.列聯(lián)表(1)定義:列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.(2)2×2列聯(lián)表一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(也稱為2×2列聯(lián)表)為下表.y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d學(xué)問點二等高條形圖學(xué)問梳理與表格相比,圖形更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.比較圖中兩個深色條的高可以發(fā)覺,在吸煙樣本中患肺癌的頻率要高一些,因此直觀上可以認為吸煙更簡單引發(fā)肺癌.假如通過干脆計算或等高條形圖發(fā)覺eq\f(a,a+b)和eq\f(c,c+d)相差很大,就推斷兩個分類變量之間有關(guān)系.學(xué)問點三獨立性檢驗學(xué)問梳理1.定義:利用隨機變量K2來推斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗.2.K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.3.獨立性檢驗的詳細做法(1)依據(jù)實際問題的須要確定容許推斷“兩個分類變量有關(guān)系”犯錯誤概率的上界α,然后查表確定臨界值k0.(2)利用公式計算隨機變量K2的觀測值k.(3)假如k≥k0,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過α,否則就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)覺足夠證據(jù)支持結(jié)論“X與Y有關(guān)系”.[自我檢測]1.在一個2×2列聯(lián)表中,由其數(shù)據(jù)計算得K2=13.097,認為兩個變量有關(guān)系犯錯誤的概率不超過()A.0.001 B.0.05C.0.1 D.0.2答案:A2.由如圖所示的等高條形圖,可知吸煙與患肺病________關(guān)系.(填“有”或“沒有”)答案:有授課提示:對應(yīng)學(xué)生用書第55頁探究一等高條形圖的應(yīng)用[閱讀教材P95例1]在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂.(1)利用圖形推斷禿頂與患心臟病是否有關(guān)系;(2)能否在犯錯誤的概率不超過0.01的前提下認為禿頂與患心臟病有關(guān)系?題型:利用等高條形圖推斷兩分類變量是否有關(guān)方法步驟:(1)列出2×2列聯(lián)表.(2)計算出禿頂樣本中患心臟病的頻率,和不禿頂樣本中患心臟病的頻率.(3)作出兩樣本中的等高條形圖作出推斷:禿頂與患心臟病有關(guān).[例1]為了解鉛中毒病人與尿棕色素為陽性是否有關(guān)系,分別對病人組和比照組的尿液作尿棕色素定性檢查,結(jié)果如下:組別陽性數(shù)陰性數(shù)總計鉛中毒病人29736比照組92837總計383573試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和比照組的尿棕色素陽性數(shù)有無差別,鉛中毒病人與尿棕色素為陽性是否有關(guān)系?[解析]等高條形圖如圖所示:其中兩個淺色條的高分別代表鉛中毒病人和比照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人與比照組相比,尿棕色素為陽性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關(guān)系.方法技巧1.推斷兩個分類變量是否有關(guān)系的方法(1)利用數(shù)形結(jié)合思想,借助等高條形圖來推斷兩個分類變量是否相關(guān)是推斷變量相關(guān)的常見方法.(2)在等高條形圖中,eq\f(a,a+b)與eq\f(c,c+d)相差越大,兩個分類變量有關(guān)系的可能性就越大.2.利用等高條形圖推斷兩個分類變量是否相關(guān)的步驟跟蹤探究1.為考察某種藥物預(yù)防疾病的效果進行動物試驗,得到如下列聯(lián)表:患病未患病總計服用藥104555未服用藥203050總計3075105試用等高條形圖分析服用藥和患病之間是否有關(guān)系.解析:依據(jù)列聯(lián)表所給的數(shù)據(jù)可得出服用藥患病的頻率為eq\f(10,55)≈0.18,未服用藥患病的頻率為eq\f(20,50)=0.4,兩者的差距是|0.18-0.4|=0.22,兩者相差很大,作出等高條形圖如圖所示,因此服用藥與患病有關(guān)系.探究二獨立性檢驗[閱讀教材P97習(xí)題3.2第2題]通過隨機詢問72名不同性別的高校生在購買食物時是否看養(yǎng)分說明,得到如下列聯(lián)表:性別與讀養(yǎng)分說明列聯(lián)表女男總計讀養(yǎng)分說明162844不讀養(yǎng)分說明20828總計363672能否在犯錯誤的概率不超過0.005的前提下認為性別和是否看養(yǎng)分說明有關(guān)系呢?解析:由題意得K2=eq\f(72×16×8-20×282,36×36×28×44)=8.416>7.879因此能在犯錯誤的概率不超過0.005的前提下認為性別與讀養(yǎng)分說明之間有關(guān)系.[例2]某高校餐飲中心為了解新生的飲食習(xí)慣,在全校一年級學(xué)生中進行了抽樣調(diào)查,調(diào)查結(jié)果如下表所示:寵愛甜品不寵愛甜品合計南方學(xué)生602080北方學(xué)生101020合計7030100依據(jù)表中數(shù)據(jù),問是否在犯錯誤的概率不超過0.05的前提下認為“南方學(xué)生和北方學(xué)生在選用甜品的飲食習(xí)慣方面有差異”.[解析]將2×2列聯(lián)表中的數(shù)據(jù)代入公式計算,得K2的觀測值k=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(100×60×10-20×102,70×30×80×20)=eq\f(100,21)≈4.762.因為4.762>3.841,所以在犯錯誤的概率不超過0.05的前提下認為“南方學(xué)生和北方學(xué)生在選用甜品的飲食習(xí)慣方面有差異”.方法技巧1.獨立性檢驗的關(guān)注點在2×2列聯(lián)表中,假如兩個分類變量沒有關(guān)系,則應(yīng)滿意ad-bc≈0,因此|ad-bc|越小,關(guān)系越弱;|ad-bc|越大,關(guān)系越強.2.獨立性檢驗的詳細做法(1)依據(jù)實際問題的須要確定允許推斷“兩個分類變量有關(guān)系”犯錯誤的概率的上界α,然后查表確定臨界值k0.(2)利用公式K2=eq\f(nad-bc2,a+bc+da+cb+d)計算隨機變量K2的觀測值k.(3)假如k≥k0,推斷“X與Y有關(guān)系”這種推斷犯錯誤的概率不超過α;否則,就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)覺足夠的證據(jù)支持結(jié)論“X與Y有關(guān)系”.跟蹤探究2.某省進行中學(xué)新課程改革已經(jīng)四年了,為了解老師對新課程教學(xué)模式的運用狀況,某一教化機構(gòu)對某學(xué)校的老師關(guān)于新課程教學(xué)模式的運用狀況進行了問卷調(diào)查,共調(diào)查了50人,其中有老老師20人,青年老師30人.老老師對新課程教學(xué)模式贊同的有10人,不贊同的有10人;青年老師對新課程教學(xué)模式贊同的有24人,不贊同的有6人.(1)依據(jù)以上數(shù)據(jù)建立一個2×2列聯(lián)表;(2)推斷是否有99%的把握說明對新課程教學(xué)模式的贊同狀況與老師年齡有關(guān)系.解析:(1)2×2列聯(lián)表如下所示:贊同不贊同總計老老師101020青年老師24630總計341650(2)假設(shè)“對新課程教學(xué)模式的贊同狀況與老師年齡無關(guān)”.由公式得K2=eq\f(50×10×6-24×102,34×16×20×30)≈4.963<6.635,所以沒有99%的把握認為對新課程教學(xué)模式的贊同狀況與老師年齡有關(guān).探究三獨立性檢驗的綜合應(yīng)用[例3]某高校共有學(xué)生15000人,其中男生10500人,女生4500人.為調(diào)查該校學(xué)生每周平均體育運動時間的狀況,采納分層抽樣的方法,收集300位學(xué)生每周平均體育運動時間(單位:時)的樣本數(shù)據(jù).(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)依據(jù)這300個樣本數(shù)據(jù),得到學(xué)生每周平均體育運動時間的頻率分布直方圖(如圖),其中樣本數(shù)據(jù)的分組區(qū)間為[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學(xué)生每周平均體育運動時間超過4小時的概率.(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與性別列聯(lián)表,并推斷是否認為“該校學(xué)生的每周平均體育運動時間與性別有關(guān)”.[解析](1)由分層抽樣可得300×eq\f(4500,15000)=90,所以應(yīng)收集90位女生的樣本數(shù)據(jù).(2)由頻率分布直方圖得學(xué)生每周平均體育運動超過4小時的頻率為1-2×(0.100+0.025)=0.75,所以該校學(xué)生每周平均體育運動時間超過4小時的概率的估計值為0.75.(3)由(2)知,300位學(xué)生中有300×0.75=225(人)的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時.樣本數(shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的,可得每周平均體育運動時間與性別列聯(lián)表如下:男生女生總計每周平均體育運動時間不超過4小時453075每周平均體育運動時間超過4小時16560225總計21090300結(jié)合列聯(lián)表可算得K2的觀測值k=eq\f(300×45×60-30×1652,75×225×210×90)≈4.762>3.841.所以有95%的把握認為“該校學(xué)生的每周平均體育運動時間與性別有關(guān)”.方法技巧1.解答此類題目的關(guān)鍵在于正確利用K2=eq\f(nad-bc2,a+bc+da+cb+d)計算k的值,再用它與臨界值k0的大小作比較來推斷假設(shè)檢驗是否成立,從而使問題得到解決.2.此類題目規(guī)律性強,解題比較格式化,填表計算分析比較即可,要熟識其計算流程,不難理解駕馭.跟蹤探究3.為了解某班學(xué)生寵愛打籃球是否與性別有關(guān),對本班48人進行了問卷調(diào)查得到了如下的2×2列聯(lián)表:寵愛打籃球不寵愛打籃球合計男生6女生10合計48已知在全班48人中隨機抽取1人,抽到寵愛打籃球的學(xué)生的概率為eq\f(2,3).(1)請將上面的2×2列聯(lián)表補充完整(不用寫計算過程);(2)能否在犯錯誤的概率不超過0.05的前提下認為寵愛打籃球與性別有關(guān)?說明你的理由;(3)現(xiàn)從女生中抽取2人進一步調(diào)查,設(shè)其中寵愛打籃球的女生人數(shù)為X,求X的分布列與均值.解析:(1)列聯(lián)表補充如下:寵愛打籃球不寵愛打籃球合計男生22628女生101020合計321648(2)由K2=eq\f(48×220-602,28×20×32×16)≈4.286.因為4.286>3.841,所以,能在犯錯誤的概率不超過0.05的前提下認為寵愛打籃球與性別有關(guān).(3)寵愛打籃球的女生人數(shù)X的可能取值為0,1,2.其概率分別為P(X=0)=eq\f(C\o\al(2,10),C\o\al(2,20))=eq\f(9,38),P(X=1)=eq\f(C\o\al(1,10)C\o\al(1,10),C\o\al(2,20))=eq\f(10,19),P(X=2)=eq\f(C\o\al(2,10),C\o\al(2,20))=eq\f(9,38),故X的分布列為:X012Peq\f(9,38)eq\f(10,19)eq\f(9,38)X的均值為E(X)=0+eq\f(10,19)+eq\f(9,19)=1.授課提示:對應(yīng)學(xué)生用書第57頁[課后小結(jié)](1)列聯(lián)表與等高條形圖列聯(lián)表由兩個分類變量之間頻率大小差異說明這兩個變量之間是否有相關(guān)關(guān)系,而利用等高條形圖能形象直觀地反映它們之間的差異,進而推斷它們之間是否具有相關(guān)關(guān)系.(2)對獨立性檢驗思想的理解獨立性檢驗的基本思想類似于數(shù)學(xué)中的反證法.先假設(shè)“兩個分類變量沒有關(guān)系”成立,計算隨機變量K2的值,假如K2的值很大,說明假設(shè)不合理.K2越大,兩個分類變量有關(guān)系的可能性越大.[素養(yǎng)培優(yōu)]因?qū)Κ毩⑿詸z驗的基本思想不理解而致錯已知兩個分類變量X和Y的取值分別為{x1,x2},{y1,y2},若其列聯(lián)表為y1y2x1515x24010則()A.X
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國螺旋藻行業(yè)發(fā)展現(xiàn)狀及前景趨勢分析報告
- 2025天津市建筑安全員知識題庫
- 2025-2030年中國航空客運行業(yè)市場發(fā)展現(xiàn)狀及前景趨勢分析報告
- 2025-2030年中國電解錳廢渣處理行業(yè)競爭狀況及發(fā)展趨勢分析報告
- 長江大學(xué)《設(shè)計軟件基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 中國石油大學(xué)(華東)《強化學(xué)習(xí)(雙語)》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安體育學(xué)院《食品分析技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣西衛(wèi)生職業(yè)技術(shù)學(xué)院《食品研究開發(fā)》2023-2024學(xué)年第二學(xué)期期末試卷
- 心理課教案自我認知與情緒管理
- 幼兒園 中班心理健康《我會傾訴》
- GB/T 6553-2024嚴(yán)酷環(huán)境條件下使用的電氣絕緣材料評定耐電痕化和蝕損的試驗方法
- 中職旅游專業(yè)《中國旅游地理》說課稿
- 微積分試卷及規(guī)范標(biāo)準(zhǔn)答案6套
- 【鄉(xiāng)村振興背景下農(nóng)村基層治理問題探究開題報告(含提綱)3000字】
- 藥物警戒管理體系記錄與數(shù)據(jù)管理規(guī)程
- 2024-2029年擴展塢行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃投資研究報告
- SH/T 3003-2024 石油化工合理利用能源設(shè)計導(dǎo)則(正式版)
- 中國人民大學(xué)613衛(wèi)生統(tǒng)計歷年真題12-16
- 人事聘用合同范本標(biāo)準(zhǔn)版
評論
0/150
提交評論