




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
8.3.2獨(dú)立性檢驗(yàn)
人教A版(2019)選擇性必修三素養(yǎng)目標(biāo)
1.通過(guò)實(shí)例了解獨(dú)立性檢驗(yàn)的基本思想,提高邏輯推理能力(重點(diǎn))2.掌握獨(dú)立性檢驗(yàn)的基本思想,會(huì)用獨(dú)立性檢驗(yàn)解決簡(jiǎn)單的實(shí)際問(wèn)題,提升數(shù)學(xué)運(yùn)算能力(難點(diǎn))新課導(dǎo)入前面我們通過(guò)2×2列聯(lián)表整理成對(duì)分類變量的樣本觀測(cè)數(shù)據(jù),并根據(jù)隨機(jī)事件頻率的穩(wěn)定性推斷兩個(gè)分類變量之間是否有關(guān)聯(lián).對(duì)于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯(cuò)誤,而且在樣本容量較小時(shí),犯錯(cuò)誤的可能性會(huì)較大.因此,需要找到一種更為合理的推斷方法,同時(shí)也希望能對(duì)出現(xiàn)錯(cuò)誤推斷的概率有一定的控制或估算.新課學(xué)習(xí)零假設(shè)或原假設(shè)的概念我們需要判斷下面的假定關(guān)系H0:P(Y=1∣X=0)=P(Y=1∣X=1)是否成立,通常稱H0為零假設(shè)或原假設(shè).這里,P(Y=1∣X=0)表示從{X=0}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=0,Y=1}的概率;而P(Y=1∣X=1)表示從{X=1}中隨機(jī)選取一個(gè)樣本點(diǎn),該樣本點(diǎn)屬于{X=1,Y=1}的概率.新課學(xué)習(xí)思考一下:請(qǐng)用條件概率的知識(shí),分析零假設(shè),給出分類變量X和Y獨(dú)立的定義.由條件概率的定義可知,零假設(shè)H0
等價(jià)于或
P(X=0,Y=1)P(X=1)=P(X=1,Y=1)P(X=0).(1)注意到{X=0}和{X=1}為對(duì)立事件,于是P(X=0)=1-P(X=1).再由概率的性質(zhì),我們有P(X=0,Y=1)=P(Y=1)-P(X=1,Y=1).由此推得(1)式等價(jià)于新課學(xué)習(xí)P(X=1)P(Y=1)=P(X=1,Y=1).因此,零假設(shè)H0等價(jià)于{X=1}與{Y=1}獨(dú)立.根據(jù)已經(jīng)學(xué)過(guò)的概率知識(shí),下面的四條性質(zhì)彼此等價(jià):{X=0}與{Y=0}獨(dú)立;{X=0}與{Y=1}獨(dú)立;{X=1}與{Y=0}獨(dú)立;{X=1}與{Y=1}獨(dú)立.
如果這些性質(zhì)成立,我們就稱分類變量X
和Y獨(dú)立.這相當(dāng)于下面四個(gè)等式成立:P(X=0,Y=0)=P(X=0)P(Y=0);P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0);P(X=1,Y=1)=P(X=1)P(Y=1).因此,我們可以用概率語(yǔ)言,將零假設(shè)改述為(2)H0:分類變量X和Y獨(dú)立.新課學(xué)習(xí)思考一下:給出下面的列聯(lián)表,你可以說(shuō)出里面的數(shù)據(jù)代表的含義嗎?XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d表中的數(shù)據(jù)是關(guān)于分類變X和
Y
的抽樣數(shù)據(jù)的2×2列聯(lián)表:最后一行的前兩個(gè)數(shù)分別是事件{Y=0}和{Y=1}的頻數(shù);最后一列的前兩個(gè)數(shù)分別是事件{X=0}和{X=1}的頻數(shù);中間的四個(gè)數(shù)a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的頻數(shù);右下角格中的數(shù)
n
是樣本容量.事件{Y=0}和{Y=1}的頻數(shù)事件{X=0}和{X=1}的頻數(shù)n是樣本容量事件{X=x,Y=y}(x,y=0,1)的頻數(shù)新課學(xué)習(xí)思考一下:如何基于(2)中的四個(gè)等式及上面列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)成對(duì)分類變量
X
和
Y
是否相互獨(dú)立作出推斷?在零假設(shè)H0
成立的條件下,根據(jù)頻率穩(wěn)定于概率的原理,由(2)中的第一個(gè)等式,我們可以用概率
P(X=0)和
P(Y=0)對(duì)應(yīng)的頻率的乘積估計(jì)概率
P(X=0,Y=0),而把視為事件{X=0,Y=0}發(fā)生的頻數(shù)的期望值(或預(yù)期值).新課學(xué)習(xí)綜合(2)中的四個(gè)式子,如果零假設(shè)H0成立,下面四個(gè)量的取值都不應(yīng)該太大:反之,當(dāng)這些量的取值較大時(shí),就可以推斷H0
不成立.(3)但是,我們并不能直接用(3)中的值的大小來(lái)推斷H0是否成立.為此需要找到一個(gè)既合理又能夠計(jì)算分布的統(tǒng)計(jì)量.一般來(lái)說(shuō),若頻數(shù)的期望值較大,則(3)中相應(yīng)的差的絕對(duì)值也會(huì)較大;而若頻數(shù)的期望值較小,則(3)中相應(yīng)的差的絕對(duì)值也會(huì)較?。疄榱撕侠淼仄胶膺@種影響,我們將四個(gè)差的絕對(duì)值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計(jì)量:新課學(xué)習(xí)該表達(dá)式可化簡(jiǎn)為新課學(xué)習(xí)思考一下:用隨機(jī)變量χ2
取值的大小作為判斷零假設(shè)H0
是否成立的依據(jù),當(dāng)它比較大時(shí)推斷H0
不成立,否則認(rèn)為H0
成立.那么,究竟χ2
大到什么程度,可以推斷H0
不成立呢?或者說(shuō),怎樣確定判斷χ2
大小的標(biāo)準(zhǔn)呢?根據(jù)小概率事件在一次試驗(yàn)中不大可能發(fā)生的規(guī)律,上面的想法可以通過(guò)確定一個(gè)與H0相矛盾的小概率事件來(lái)實(shí)現(xiàn).在假定H0
的條件下,對(duì)于有放回簡(jiǎn)單隨機(jī)抽樣,當(dāng)樣本容量n充分大時(shí),統(tǒng)計(jì)學(xué)家得到了χ2
的近似分布.忽略χ2
的實(shí)際分布與該近似分布的誤差后,對(duì)于任何小概率值α
,可以找到相應(yīng)的正實(shí)數(shù)xα
,使得下面關(guān)系成立:(4)新課學(xué)習(xí)臨界值的概念對(duì)于任何小概率值α
,可以找到相應(yīng)的正實(shí)數(shù)
xα
,使得下面關(guān)系成立:我們稱xα為α的臨界值,這個(gè)臨界值就可作為判斷χ2大小的標(biāo)準(zhǔn).概率值
α越小,臨界值xα
越大.當(dāng)總體很大時(shí),抽樣有、無(wú)放回對(duì)χ2
的分布影響較小.由(4)式可知,只要把概率值α取得充分小,在假設(shè)H0
成立的情況下,事件{χ2?xα}是不大可能發(fā)生的.根據(jù)這個(gè)規(guī)律,如果該事件發(fā)生,我們就可以推斷
H0不成立.新課學(xué)習(xí)獨(dú)立性檢驗(yàn)的概念基于小概率值
α的檢驗(yàn)規(guī)則是:當(dāng)χ2?xα
時(shí),我們就推斷H0
不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα
時(shí),我們沒(méi)有充分證據(jù)推斷H0
不成立,可以認(rèn)為
X
和
Y
獨(dú)立.這種利用χ2
的取值推斷分類變量
X
和
Y
是否獨(dú)立的方法稱為
χ2
獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).新課學(xué)習(xí)5個(gè)常用的小概率值和相應(yīng)的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例如,對(duì)于小概率值
α=0.05,我們有如下的具體檢驗(yàn)規(guī)則:(1)當(dāng)χ2?x0.05=3.841時(shí),我們推斷H0
不成立,即認(rèn)為X和
Y
不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)0.05;(2)當(dāng)χ2<x0.05=3.841時(shí),我們沒(méi)有充分證據(jù)推斷
H0
不成立,可以認(rèn)為
X
和
Y獨(dú)立.新課學(xué)習(xí)例2
依據(jù)小概率值
α=0.1的χ2
獨(dú)立性檢驗(yàn),分析例1中的抽樣數(shù)據(jù),能否據(jù)此推斷兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異?零假設(shè)為H0
:分類變量
X與
Y
相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率無(wú)差異.根據(jù)例1中表中的數(shù)據(jù),計(jì)算得到根據(jù)小概率值α=0.1的χ2獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為兩校的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有差異.新課學(xué)習(xí)思考一下:例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說(shuō)明其中的原因嗎?例1只是根據(jù)一個(gè)樣本的兩個(gè)頻率間存在差異得出兩校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論,并沒(méi)有考慮由樣本隨機(jī)性可能導(dǎo)致的錯(cuò)誤,所以那里的推斷依據(jù)不太充分.例2中,我們用χ2獨(dú)立性檢驗(yàn)對(duì)零假設(shè)H0進(jìn)行了檢驗(yàn).通過(guò)計(jì)算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對(duì)應(yīng)的臨界值2.706,因此認(rèn)為沒(méi)有充分證據(jù)推斷H0不成立,所以接受H0
,推斷出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率沒(méi)有顯著差異的結(jié)論.這個(gè)檢驗(yàn)結(jié)果意味著,抽樣數(shù)據(jù)中兩個(gè)頻率的差異很有可能是由樣本隨機(jī)性導(dǎo)致的.因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率有差異的結(jié)論是不可靠的.新課學(xué)習(xí)例3
某兒童醫(yī)院用甲,乙兩種療法治療小兒消化不良.采用有放回簡(jiǎn)單隨機(jī)抽樣的方法對(duì)治療情況進(jìn)行檢查,得到了如下數(shù)據(jù):抽到接受甲種療法的患兒67名,其中未治愈15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),分析乙種療法的效果是否比甲種療法好.零假設(shè)為H0
:療法與療效獨(dú)立,即兩種療法效果沒(méi)有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,如下表所示新課學(xué)習(xí)療法療效合計(jì)未治愈治愈甲155267乙66369合計(jì)21115136根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0
成立,即認(rèn)為兩種療法效果沒(méi)有差異.新課學(xué)習(xí)例4
為研究吸煙是否與肺癌有關(guān),某腫瘤研究所采取有放回簡(jiǎn)單隨機(jī)抽樣的方法,調(diào)查了9965人,得到成對(duì)樣本觀測(cè)數(shù)據(jù)的分類統(tǒng)計(jì)結(jié)果,如下表所示.依據(jù)小概率值
α=0.001的獨(dú)立性檢驗(yàn),分析吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn).吸煙肺癌合計(jì)非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計(jì)9874919965新課學(xué)習(xí)零假設(shè)為H0
:吸煙與患肺癌之間無(wú)關(guān)聯(lián).根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為吸煙與患肺癌有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001.根據(jù)上表中的數(shù)據(jù)計(jì)算,不吸煙者中不患肺癌和患肺癌的頻率分別為根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到新課學(xué)習(xí)由可見(jiàn),在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的4倍以上.于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌的概率,即吸煙更容易引發(fā)肺癌.吸煙者中不患肺癌和患肺癌的頻率分別為新課學(xué)習(xí)應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):(1)提出零假設(shè)H0:X
和Y相互獨(dú)立,并給出在問(wèn)題中的解釋;(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較;(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論;(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.新課學(xué)習(xí)思考一下:獨(dú)立性檢驗(yàn)的思想類似于我們常用的反證法,你能指出二者之間的相同和不同之處嗎?反證法是在某種假設(shè)H0
之下,推出一個(gè)矛盾結(jié)論,從而證明H0
不成立;而獨(dú)立性檢驗(yàn)是在零假設(shè)H0
之下,如果出現(xiàn)一個(gè)與H0
相矛盾的小概率事件,就推斷H0
不成立,且該推斷犯錯(cuò)誤的概率不大
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年金華市教育局所屬金華第一中學(xué)招聘考試真題
- 大田流轉(zhuǎn)合同范本
- 影院裝修合同標(biāo)準(zhǔn)樣本
- 2024年大理州巍山縣南詔鎮(zhèn)社區(qū)衛(wèi)生服務(wù)中心招聘職工考試真題
- 2025年養(yǎng)雞場(chǎng)租賃及養(yǎng)殖廢棄物資源化利用合同
- 二零二五年度法院裁決離婚協(xié)議書(shū)及共同債務(wù)承擔(dān)與子女撫養(yǎng)協(xié)議
- 2025年度科技創(chuàng)新大賽贊助冠名權(quán)協(xié)議
- 2025年度人美容院與心理咨詢師聯(lián)合心理美容服務(wù)合同
- 2025年度房屋買(mǎi)賣合同涉及產(chǎn)權(quán)登記及過(guò)戶流程
- 2025年度個(gè)人股份期權(quán)授予合同模板(科技初創(chuàng))
- 2025年中國(guó)工程建設(shè)行業(yè)現(xiàn)狀、發(fā)展環(huán)境及投資前景分析報(bào)告
- 《海瀾之家公司績(jī)效管理現(xiàn)狀、問(wèn)題及優(yōu)化對(duì)策(7600字論文)》
- 小學(xué)四年級(jí)英語(yǔ)教學(xué)反思3篇
- DB1509T 0025-2024 肉牛舍設(shè)計(jì)與建筑技術(shù)規(guī)范
- 上海室內(nèi)裝飾施工合同示范文本2024年
- 2024版2024年《汽車文化》全套教案
- 房地產(chǎn) -中建科工五大類型項(xiàng)目成本指標(biāo)庫(kù)
- 2024小紅書(shū)保健品行業(yè)營(yíng)銷通案
- 未來(lái)網(wǎng)絡(luò)支撐下的數(shù)字身份體系:產(chǎn)業(yè)和技術(shù)發(fā)展趨勢(shì)(2024年)定稿版本
- 新《卷煙營(yíng)銷》理論知識(shí)考試題庫(kù)(附答案)
- 中考英語(yǔ)688高頻詞大綱詞頻表
評(píng)論
0/150
提交評(píng)論