獨(dú)立性檢驗(yàn)的基本思想及其應(yīng)用_第1頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其應(yīng)用_第2頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其應(yīng)用_第3頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其應(yīng)用_第4頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

獨(dú)立性檢驗(yàn)的基本思想在現(xiàn)實(shí)生活中,會(huì)遇到各種各樣的變量,并需要研究它們之間的關(guān)系,觀察下面兩組變量,分析在取不同的“值”時(shí)表示的個(gè)體有何差異?

(1)國(guó)籍、宗教信仰、性別(2)成績(jī)、身高、年齡(1)中的變量每取不同的“值”時(shí),表示不同的類別;(2)中的變量每取不同的“值”時(shí),表示不同的個(gè)體。獨(dú)立性檢驗(yàn)本節(jié)研究的是兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問(wèn)題。在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對(duì)于喜歡數(shù)學(xué)課程有影響?等等。5月31日是世界無(wú)煙日,有關(guān)醫(yī)學(xué)研究表明,許多疾病,如:心臟病、癌癥、腦血管病、慢性阻塞性肺病等都與吸煙有關(guān),吸煙已成為繼高血之后的第二號(hào)全球殺手。這些疾病與吸煙有關(guān)的結(jié)論是怎么得出的呢?我們來(lái)看下面的問(wèn)題為調(diào)查吸煙是否對(duì)患肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人)不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965那么吸煙是否對(duì)肺癌有影響?吸煙與患肺癌列聯(lián)表列出兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965說(shuō)明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān):1.列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)98749199652.等高條形圖y1y2總計(jì)x1aba+bx1cdc+d總計(jì)a+cb+da+b+c+d假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表和登高條形圖如下表所示,試說(shuō)明如何根據(jù)圖表來(lái)判斷分類變量X和Y是否可能有關(guān)系?

上面我們通過(guò)分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要用統(tǒng)計(jì)觀點(diǎn)來(lái)考察這個(gè)問(wèn)題。

現(xiàn)在想要知道能夠以多大的把握認(rèn)為“吸煙與患肺癌有關(guān)”,為此先假設(shè)

H0:吸煙與患肺癌沒(méi)有關(guān)系.不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d把表中的數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒(méi)有關(guān)系”等價(jià)于“吸煙與患肺癌獨(dú)立”,即假設(shè)H0等價(jià)于P(AB)=P(A)P(B).因此|ad-bc|越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng)。不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d在表中,a恰好為事件AB發(fā)生的頻數(shù);a+b和a+c恰好分別為事件A和B發(fā)生的頻數(shù)。由于頻率接近于概率,所以在H0成立的條件下應(yīng)該有

為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量-----卡方統(tǒng)計(jì)量(1)若H0成立,即“吸煙與患肺癌沒(méi)有關(guān)系”,則K2應(yīng)很小。根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計(jì)算得到K2的觀測(cè)值為:那么這個(gè)值到底能告訴我們什么呢?(2)

獨(dú)立性檢驗(yàn)在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率

即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。

也就是說(shuō),在H0成立的情況下,對(duì)隨機(jī)變量K2進(jìn)行多次觀測(cè),觀測(cè)值超過(guò)6.635的頻率約為0.01。思考

答:判斷出錯(cuò)的概率為0.01。判斷是否成立的規(guī)則如果,就判斷不成立,即認(rèn)為吸煙與患肺癌有關(guān)系;否則,就判斷成立,即認(rèn)為吸煙與患肺癌有關(guān)系。獨(dú)立性檢驗(yàn)的定義上面這種利用隨機(jī)變量K2來(lái)確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法,稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)。在該規(guī)則下,把結(jié)論“成立”錯(cuò)判成“不成立”的概率不會(huì)差過(guò)即有99%的把握認(rèn)為不成立。獨(dú)立性檢驗(yàn)的基本思想(類似反證法)(1)假設(shè)結(jié)論不成立,即“兩個(gè)分類變量沒(méi)有關(guān)系”.(2)在此假設(shè)下我們所構(gòu)造的隨機(jī)變量K2應(yīng)該很小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到K2的觀測(cè)值k很大,則在一定可信程度上說(shuō)明不成立.即在一定可信程度上認(rèn)為“兩個(gè)分類變量有關(guān)系”;如果k的值很小,則說(shuō)明由樣本觀測(cè)數(shù)據(jù)沒(méi)有發(fā)現(xiàn)反對(duì)的充分證據(jù)。(3)根據(jù)隨機(jī)變量K2的含義,可以通過(guò)評(píng)價(jià)該假設(shè)不合理的程度,由實(shí)際計(jì)算出的,說(shuō)明假設(shè)不合理的程度為1%,即“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信度為約為99%.怎樣判斷K2的觀測(cè)值k是大還是小呢?這僅需要確定一個(gè)正數(shù),當(dāng)時(shí)就認(rèn)為K2的觀測(cè)值k大。此時(shí)相應(yīng)于的判斷規(guī)則為:如果,就認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;否則就認(rèn)為“兩個(gè)分類變量之間沒(méi)有關(guān)系”。----臨界值按照上述規(guī)則,把“兩個(gè)分類變量之間沒(méi)有關(guān)系”錯(cuò)誤的判斷為“兩個(gè)分類變量之間有關(guān)系”的概率為P().在實(shí)際應(yīng)用中,我們把解釋為有的把握認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;把解釋為不能以的把握認(rèn)為“兩個(gè)分類變量之間有關(guān)系”,或者樣本觀測(cè)數(shù)據(jù)沒(méi)有提供“兩個(gè)分類變量之間有關(guān)系”的充分證據(jù)。表1-112x2聯(lián)表

一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d在實(shí)際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過(guò)下表確定臨界值:0.500.400.250.150.100.4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6367.87910.828具體作法是:(1)根據(jù)實(shí)際問(wèn)題需要的可信程度確定臨界值;(2)利用公式(1),由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量的觀測(cè)值;(3)如果,就以的把握認(rèn)為“X與Y有關(guān)系”;否則就說(shuō)樣本觀測(cè)數(shù)據(jù)沒(méi)有提供“X與Y有關(guān)系”的充分證據(jù)。0.50.40.250.150.10.050.0250.010.0050.001xo0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828卡方臨界值表:則有99.9%的把握認(rèn)為“Ⅰ與Ⅱ有關(guān)系”;(1)若觀測(cè)值χ2>10.828.(3)若觀測(cè)值χ2>2.706,則(4)若觀測(cè)值χ2<2.706,則(2)若觀測(cè)值χ2>6.635,則有99%的把握認(rèn)為“Ⅰ與Ⅱ有關(guān)系”;則有90%的把握認(rèn)為“Ⅰ與Ⅱ有關(guān)系”;則沒(méi)有充分的證據(jù)顯示“Ⅰ與Ⅱ有關(guān)系”,但也不能作出結(jié)論“H0成立”,即Ⅰ與Ⅱ沒(méi)有關(guān)系。例1為了探究學(xué)生選報(bào)文、理科是否與對(duì)外語(yǔ)的興趣有關(guān),某同學(xué)調(diào)查了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科對(duì)外語(yǔ)有興趣的有138人,無(wú)興趣的有98人,文科對(duì)外語(yǔ)有興趣的有73人,無(wú)興趣的有52人.試分析學(xué)生選報(bào)文、理科與對(duì)外語(yǔ)的興趣是否有關(guān)?【解】列出2×2列聯(lián)表獨(dú)立性檢驗(yàn)理文合計(jì)有興趣13873211無(wú)興趣9852150合計(jì)236125361【名師點(diǎn)評(píng)】運(yùn)用獨(dú)立檢驗(yàn)的方法:(1)列出2×2列聯(lián)表,根據(jù)公式計(jì)算K2的觀測(cè)值k.(2)比較k與k0的大小作出結(jié)論.特別注意本題類型的無(wú)關(guān)問(wèn)題.跟蹤訓(xùn)練1.研究人員選取170名青年男女大學(xué)生作為樣本,對(duì)他們進(jìn)行一種心理測(cè)驗(yàn),發(fā)現(xiàn)60名女生對(duì)該心理測(cè)驗(yàn)中的最后一個(gè)題目的反應(yīng)是:作肯定的有22名,作否定的有38名;男生110名在相同的題目上作肯定的有22名,作否定的有88名,問(wèn):性別與態(tài)度之間是否存在某種關(guān)系?試用獨(dú)立性檢驗(yàn)的方法判斷.解:根據(jù)題意,得如下2×2列聯(lián)表:肯定否定合計(jì)男生2288110女生223860合計(jì)441261701.K2的計(jì)算公式中字母取值勿取錯(cuò);在2×2列聯(lián)表中,a,b,c,d是有順序的,因此在計(jì)算K2的值時(shí)容易取錯(cuò)字母a,b,c,d的值.2.只有當(dāng)K2的值大于或等于k0時(shí),我們才說(shuō)兩個(gè)變量“有關(guān)系”;否則就說(shuō)“沒(méi)有充分的證據(jù)顯示兩個(gè)變量有關(guān)系”,即認(rèn)為兩個(gè)變量無(wú)關(guān)系.方法感悟精彩推薦典例展示獨(dú)立性檢驗(yàn)中的易誤點(diǎn)對(duì)196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過(guò)心臟病,調(diào)查結(jié)果如下表所示:試根據(jù)上述數(shù)據(jù),比較這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有沒(méi)有差別.例2易錯(cuò)警示又發(fā)作過(guò)心臟病未發(fā)作過(guò)心臟病合計(jì)心臟搭橋手術(shù)39157196血管清障手術(shù)29167196合計(jì)68324392【常見(jiàn)錯(cuò)誤】

在獨(dú)立性檢驗(yàn)中當(dāng)K2≤2.706時(shí),得出結(jié)論:“我們判定又發(fā)作過(guò)心臟病和他是否做過(guò)這兩種手術(shù)無(wú)關(guān)”,這里的錯(cuò)誤主要是結(jié)論下的太過(guò)武斷.【防范措施】

在利用2×2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn)時(shí),如果K2≤2.706,并不是表示兩個(gè)分類變量沒(méi)有關(guān)系,只是沒(méi)有充分證據(jù)表明它們有關(guān)系而已,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論