獨立性檢驗的基本思想及其初步應(yīng)用ppt課件_第1頁
獨立性檢驗的基本思想及其初步應(yīng)用ppt課件_第2頁
獨立性檢驗的基本思想及其初步應(yīng)用ppt課件_第3頁
獨立性檢驗的基本思想及其初步應(yīng)用ppt課件_第4頁
獨立性檢驗的基本思想及其初步應(yīng)用ppt課件_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1;問題問題: 數(shù)學(xué)家龐加萊每天都從一家數(shù)學(xué)家龐加萊每天都從一家面包店買一塊面包店買一塊1000g 的面包,并記的面包,并記錄下買回的面包的實際質(zhì)量。一年錄下買回的面包的實際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為的均值為950g。于是龐加萊推斷這。于是龐加萊推斷這家面包店的面包分量不足。家面包店的面包分量不足。 假設(shè)假設(shè)“面包分量足面包分量足”,則一年購買面包的質(zhì)量,則一年購買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于數(shù)據(jù)的平均值應(yīng)該不少于1000g ; “這個平均值不大于這個平均值不大于950g”是一個與假設(shè)是一個與假設(shè)“面包面包分量足分量足”矛盾的小概率事件;

2、矛盾的小概率事件; 這個小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。這個小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。創(chuàng)設(shè)情境創(chuàng)設(shè)情境2;這種變量的不同這種變量的不同“值值”表示個體所屬的表示個體所屬的不同類別,這類變量稱為不同類別,這類變量稱為分類變量分類變量分類變量分類變量 性別變量,取值為:男、女性別變量,取值為:男、女請舉出幾個分類變量的例子請舉出幾個分類變量的例子試一試在日常生活中,我們常常關(guān)心在日常生活中,我們常常關(guān)心分類變量的之間分類變量的之間是否有關(guān)系是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?例如,吸煙是否與患肺癌有關(guān)系? 性別是否對于喜歡數(shù)學(xué)課程有影響?性別是否對于喜歡數(shù)學(xué)課程有影響?探究

3、合作探究合作3; 為了調(diào)查吸煙是否對肺癌有影為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調(diào)查了響,某腫瘤研究所隨機地調(diào)查了99659965人,人,得到如下結(jié)果(單位:人)得到如下結(jié)果(單位:人)那么吸煙是否會對患肺癌有影響?那么吸煙是否會對患肺癌有影響?不患肺癌不患肺癌 患肺癌患肺癌總計總計不吸煙不吸煙77757775424278177817吸煙吸煙20992099494921482148總計總計98749874919199659965吸煙與患肺癌吸煙與患肺癌列聯(lián)表列聯(lián)表(列出兩個分類變量的頻數(shù)(列出兩個分類變量的頻數(shù)表):表):4;在不吸煙者中患肺癌的比重是在不吸煙者中患肺癌的比重是 在

4、吸煙者中患肺癌的比重是在吸煙者中患肺癌的比重是 0.54%0.54%2.28%2.28%直觀上的結(jié)論:吸煙者和不吸煙者患肺癌直觀上的結(jié)論:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能的可能性存在差異,吸煙者患肺癌的可能性大性大不患肺癌不患肺癌 患肺癌患肺癌總計總計不吸煙不吸煙77757775424278177817吸煙吸煙20992099494921482148總計總計987498749191996599651.列聯(lián)表列聯(lián)表5;等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例比例,可以直觀地得出吸煙與患肺癌有關(guān)可以直觀地得出吸煙與患肺癌有關(guān)

5、2.等高條形圖等高條形圖6; 有一個顛撲不破的真理,那就是當(dāng)我們不能確定什么是真的時,我們就應(yīng)該去探求什么是最可能的。笛卡爾我們能有多大把握認(rèn)為“患病與吸煙有關(guān)”呢?7;將問題一般化將問題一般化探究解疑探究解疑獨立性檢驗獨立性檢驗不患肺癌不患肺癌患肺癌患肺癌總計總計不吸煙不吸煙a ab ba+ba+b吸煙吸煙c cd dc+dc+d總計總計a+ca+cb+db+da+b+c+da+b+c+dH0:吸煙與患肺癌沒有關(guān)系吸煙與患肺癌沒有關(guān)系我們假設(shè)我們假設(shè)看看能推出什么樣的結(jié)論看看能推出什么樣的結(jié)論。8;假設(shè)假設(shè)H H0 0:吸煙吸煙和和患肺癌患肺癌之間沒有關(guān)系之間沒有關(guān)系 那么吸煙樣本中不患肺癌

6、的比例應(yīng)該與那么吸煙樣本中不患肺癌的比例應(yīng)該與不吸煙樣本中相應(yīng)的比例差不多,即:不吸煙樣本中相應(yīng)的比例差不多,即:,acabcd()(),a cdc ab0adbca ad d- -b bc c 越越小小,說說明明吸吸煙煙與與患患肺肺癌癌之之間間的的關(guān)關(guān)系系越越弱弱,a ad d- -b bc c 越越大大,說說明明吸吸煙煙與與患患肺肺癌癌之之間間的的關(guān)關(guān)系系越越強強9;作為檢驗在多大程度上可以認(rèn)為作為檢驗在多大程度上可以認(rèn)為“兩個變量有兩個變量有關(guān)系關(guān)系”的標(biāo)準(zhǔn)的標(biāo)準(zhǔn) 。上面這種利用隨機變量上面這種利用隨機變量K2來判斷來判斷“兩個分類變量兩個分類變量有關(guān)系有關(guān)系”的方法稱為的方法稱為獨立性

7、檢驗獨立性檢驗. 為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個隨機變量準(zhǔn),基于上述分析,我們構(gòu)造一個隨機變量22()()()()()()n adbcKab cd ac bdnabcd 其中為樣本容量10;通過公式計算通過公式計算2242 20997817 2148 9874 91 56.632K9965(7775 49)獨立性檢驗獨立性檢驗不患肺癌不患肺癌 患肺癌患肺癌總計總計不吸煙不吸煙77757775424278177817吸煙吸煙20992099494921482148總計總計9874987491919965996522()(

8、)()()()n adbcKab cd ac bd11;故有故有99%99%的把握認(rèn)為的把握認(rèn)為H H0 0不成立,即有不成立,即有99%99%的把的把握認(rèn)為握認(rèn)為“患肺癌與吸煙有關(guān)系患肺癌與吸煙有關(guān)系”。即在即在 成立的情況下,成立的情況下, 大于大于6.6356.635概率非常小,概率非常小,近似為近似為0.0100.0100H2K現(xiàn)在的現(xiàn)在的 =56.632=56.632的觀測值遠(yuǎn)大于的觀測值遠(yuǎn)大于6.6356.635,出現(xiàn)這樣的觀測值的概率不超過出現(xiàn)這樣的觀測值的概率不超過0.0100.010。k010.0)635.6(2KP已知在假設(shè)已知在假設(shè)H H0 0(吸煙吸煙和和患肺癌患肺癌之

9、間沒有關(guān)系)之間沒有關(guān)系)成立的條件下:成立的條件下: 12;獨立性檢驗法的一般步驟獨立性檢驗法的一般步驟22n adbcKabcdacbdnabcd 其中為樣本容量用它的大小可以決定是否拒絕原假設(shè)用它的大小可以決定是否拒絕原假設(shè)H0,如果,如果K2值很值很大,就斷言大,就斷言H0不成立,即認(rèn)為不成立,即認(rèn)為“兩個分類變量有關(guān)兩個分類變量有關(guān)系系”;如果很小,則說明在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠;如果很小,則說明在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)拒絕證據(jù)拒絕H0。具體做法是具體做法是:首先假設(shè)該結(jié)論不成立,即首先假設(shè)該結(jié)論不成立,即 H0:X與與Y沒有關(guān)系沒有關(guān)系根據(jù)觀測數(shù)據(jù)計算卡方統(tǒng)計量的預(yù)測值根據(jù)觀測

10、數(shù)據(jù)計算卡方統(tǒng)計量的預(yù)測值13;10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.5020()P Kk0k(1)10.828,99.9%kXY如果就有的把握認(rèn)為與 有關(guān)系(2)7.879,99.5%kXY如果就有的把握認(rèn)為與 有關(guān)系(3)6.635,99%kXY如果就有的把握認(rèn)為與 有關(guān)系(4)5.024,97.5%kXY如果就有的把握認(rèn)為與 有關(guān)系(5)3.841,95%kXY如果就有的把握認(rèn)為與 有關(guān)系(6)2.706,90%kXY如果就有的把握認(rèn)為與 有

11、關(guān)系(7)2.706,kXY如果就認(rèn)為沒有充分的證據(jù)顯示與 有關(guān)系卡方臨界值表:卡方臨界值表:14;反證法原理與假設(shè)檢驗原理反證法原理: 在一個已知假設(shè)下,如果推出一個矛盾,就證明了這個假設(shè)不成立。假設(shè)檢驗原理:在一個已知假設(shè)下,如果一個與該假設(shè)矛盾的小概率事件發(fā)生,就推斷這個假設(shè)不成立。15;例例1.1.在某醫(yī)院在某醫(yī)院, ,因為患心臟病而住院的因為患心臟病而住院的665665名男性病人中名男性病人中, ,有有214214人禿頂人禿頂, ,而另外而另外772772名名不是因為患心臟病而住院的男性病人中有不是因為患心臟病而住院的男性病人中有175175人禿頂人禿頂. .(1 1)利用圖形判斷禿

12、頂與患心臟病是否有)利用圖形判斷禿頂與患心臟病是否有關(guān)系關(guān)系(2 2)能否在犯錯誤概率不超過)能否在犯錯誤概率不超過0.010.01的前提的前提下認(rèn)為禿頂與患心臟病有關(guān)系?下認(rèn)為禿頂與患心臟病有關(guān)系?典例分析16;解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病患心臟病 不患心臟病不患心臟病總計總計禿頂禿頂214175389不禿頂不禿頂4515971048總計總計6657721437 根據(jù)列聯(lián)表中的數(shù)據(jù),得到根據(jù)列聯(lián)表中的數(shù)據(jù),得到221437 (214 597 175 451)16.3736.635.389 1048 665 772K所以在犯錯誤的概率不超過所

13、以在犯錯誤的概率不超過0.01的前提下認(rèn)為的前提下認(rèn)為“禿頂患心臟病有關(guān)禿頂患心臟病有關(guān)”。鏈接17;(1)在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是 ( )A. 若k=6.635,則有99%的把握認(rèn)為吸煙與患肺病有關(guān),那么100名吸煙者中,有99個患肺病.B. 從獨立性檢驗可知,有99%的把握認(rèn)為吸煙與患肺病有關(guān)時,可以說某人吸煙,那么他有99%的可能性患肺病.C. 若從統(tǒng)計量中求出有95%的把握認(rèn)為吸煙與患肺病有關(guān),是指有5%的可能性使推斷出現(xiàn)錯誤.D. 以上三種說法都不對.c 練習(xí)1:18;2 2(2). 下面是一個 列聯(lián)表不健康 健康總計不優(yōu)秀a2173優(yōu)秀22527總計b

14、46100則表中a,b的值分別是( )A. 94,96 B. 52,50 C. 52,54 D. 54,52c 19; 練習(xí)練習(xí)2:(2010新課標(biāo)全國卷)新課標(biāo)全國卷) 為調(diào)查某地區(qū)老人為調(diào)查某地區(qū)老人是否需要志愿者提供幫助,用簡單隨機抽樣方法是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調(diào)查了從該地區(qū)調(diào)查了500位老年人,結(jié)果如下:位老年人,結(jié)果如下:1.估計該地區(qū)老年人中,需要志愿者提供幫估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例;助的老年人的比例;2.能否有能否有99的把握認(rèn)為該地區(qū)的老年人是的把握認(rèn)為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關(guān)?否需要志愿者提供幫助與

15、性別有關(guān)?男男女女需要需要4030不需要不需要16027020;7014%50022500 (40 27030 160)9.967200 300 70 430K(1)調(diào)查的)調(diào)查的500位老年人中有位老年人中有70位需要志愿者位需要志愿者提供幫助,因此該地區(qū)老年人中,需要幫助的提供幫助,因此該地區(qū)老年人中,需要幫助的老年人的比例的估算值為老年人的比例的估算值為(2)做出列聯(lián)表做出列聯(lián)表。由于由于9.9676.635,所以有所以有99%的把握認(rèn)為該的把握認(rèn)為該地區(qū)的老年人是否需要幫助與性別有關(guān)。地區(qū)的老年人是否需要幫助與性別有關(guān)。男男女女總計總計需要需要403070不需要不需要160270430

16、總計總計20030050021;練習(xí)練習(xí)3 3:為了調(diào)查胃病是否與生活規(guī)律有關(guān),在某地對為了調(diào)查胃病是否與生活規(guī)律有關(guān),在某地對540540名名4040歲以上歲以上的人進(jìn)行了調(diào)查,結(jié)果是:患胃病者生活不規(guī)律的共的人進(jìn)行了調(diào)查,結(jié)果是:患胃病者生活不規(guī)律的共6060人,患胃病者人,患胃病者生活規(guī)律的共生活規(guī)律的共2020人,未患胃病者生活不規(guī)律的共人,未患胃病者生活不規(guī)律的共260260人,未患胃病者生人,未患胃病者生活規(guī)律的共活規(guī)律的共200200人人(1 1)根據(jù)以上數(shù)據(jù)列出)根據(jù)以上數(shù)據(jù)列出2 22 2列聯(lián)表;列聯(lián)表;(2 2)能夠以)能夠以99%99%的把握認(rèn)為的把握認(rèn)為4040歲以上的

17、人患胃病與否和生活規(guī)律有關(guān)歲以上的人患胃病與否和生活規(guī)律有關(guān)系嗎?為什么?系嗎?為什么?解:解:(1 1)由已知可列)由已知可列2 22 2列聯(lián)表得:列聯(lián)表得:22;(2 2)根據(jù)列聯(lián)表中的數(shù)據(jù),由計算公式得)根據(jù)列聯(lián)表中的數(shù)據(jù),由計算公式得K K2 2的觀測值為:的觀測值為:9.6389.6386.6356.635因此,在犯錯誤的概率不超過因此,在犯錯誤的概率不超過0.010.01的前提下認(rèn)為的前提下認(rèn)為4040歲以上的歲以上的人患胃病與否和生活規(guī)律有關(guān)人患胃病與否和生活規(guī)律有關(guān) 254020 260200 60k9.63880 460 220 32023; 1 1、通過頻率比較法,圖、通過頻率比較法,圖形分析法判斷兩個分類形分析法判斷兩個分類變量是否有關(guān)系。(不變量是否有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論