![高中數(shù)學 獨立性檢驗 課件_第1頁](http://file4.renrendoc.com/view/df957a0657f44fc687d87338ff0f36f2/df957a0657f44fc687d87338ff0f36f21.gif)
![高中數(shù)學 獨立性檢驗 課件_第2頁](http://file4.renrendoc.com/view/df957a0657f44fc687d87338ff0f36f2/df957a0657f44fc687d87338ff0f36f22.gif)
![高中數(shù)學 獨立性檢驗 課件_第3頁](http://file4.renrendoc.com/view/df957a0657f44fc687d87338ff0f36f2/df957a0657f44fc687d87338ff0f36f23.gif)
![高中數(shù)學 獨立性檢驗 課件_第4頁](http://file4.renrendoc.com/view/df957a0657f44fc687d87338ff0f36f2/df957a0657f44fc687d87338ff0f36f24.gif)
![高中數(shù)學 獨立性檢驗 課件_第5頁](http://file4.renrendoc.com/view/df957a0657f44fc687d87338ff0f36f2/df957a0657f44fc687d87338ff0f36f25.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、8.3.2獨立性檢驗問題引入22列聯(lián)表隨機事件頻率的穩(wěn)定性兩個分類變量是否有關聯(lián)用頻率推斷兩個分類變量是否獨立有什么缺點?頻率具有隨機性,與概率之間存在差異樣本容量較小時,犯錯誤的概率較大問題回溯有沒有更合理的推斷方法,同時也希望對出現(xiàn)的錯誤推斷的概率一定的控制或估算?A與B相互獨立(簡稱為獨立)的充要條件是抽象簡化列聯(lián)表X=0X=1Y=0X=0,Y=0X=1,Y=0Y=1X=0,Y=1X=1,Y=1x=1與y=1是否有關聯(lián)呢?前方高能如何判斷x=1與y=1是否有關聯(lián)呢?x=0與x=1對立, y=0與y=1對立原(零)假設!進一步由條件概率獨立含義的全解X=0與Y=0獨立X=0與Y=1獨立X=
2、1與Y=0獨立X=1與Y=1獨立具體的列聯(lián)表頻數(shù)的期望值與實際值P(X=0)和P(Y=0)對應的頻率的乘積X=0,Y=0發(fā)生的頻率的期望值兩者應當相差不大如何衡量差別呢原假設成立,下面四個量值不應該太大是不是有點麻煩?構造一個方便科學的統(tǒng)計量看起來好一點了卡方統(tǒng)計量卡方統(tǒng)計量有什么用呢? 統(tǒng)計學家建議,用卡方的大小作為判斷零假設是否成立的依據(jù),當它比較大時推斷不成立,否則認為成立。 那么,究竟大到什么程度,可以推斷不成立呢? 或者說,怎樣確定判斷卡方大小的標準呢?卡方統(tǒng)計量有什么用呢? 在假定的條件下,對于有放回簡單隨機抽樣,當樣本容量充分大時,統(tǒng)計學家得到了卡方的近似分布。忽略卡方的實際分布
3、與該近似分布的誤差后,對于任何小概率值,可以找到相應的正實數(shù),使得下面關系成立:臨界值基于小概率值的檢驗規(guī)則(小概率值)臨界值表0.10.050.010.0050.001x2.7063.8416.6357.87910.828紙上得來終覺淺,絕知此事要躬行例2:為比較甲、乙兩所學校學生的數(shù)學水平,采用簡單隨機抽樣的方法抽取88名學生,通過測驗得到了如下數(shù)據(jù):甲校43名學生中有10名數(shù)學成績優(yōu)秀;乙校45名學生中有7名數(shù)學成績優(yōu)秀。依據(jù)=0.1的卡方獨立性檢驗,試分析兩校學生中數(shù)學成績優(yōu)秀率之間是否存在差異?具體的列聯(lián)表學校數(shù)學成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(
4、X=1)38745合計711788解:零假設H0:分類變量X與Y相互獨立,即兩校學生的數(shù)學成績優(yōu)秀率無差異根據(jù)表中的數(shù)據(jù),計算得到根據(jù)小概率值=0.1的卡方獨立性檢驗,沒有允分證據(jù)推斷H0不成立,因此可以認為H0成立,即認為兩校的數(shù)學成績優(yōu)秀率沒有差異思考:例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結論,你能說明其中的原因嗎? 例1事實上是根據(jù)兩個頻率的差異進行推斷的,沒有考慮隨機性的影響。但事實上,即便兩個樣本來自同一個總體,也會因為隨機性使得頻率產(chǎn)生差異,因此需要用概率的方法進行推斷,由于樣本具有隨機性,依據(jù)頻率所作的推斷可能會犯錯誤.例3: 為研究吸煙是否與肺癌有關, 某腫瘤研
5、究所采取有放回簡單隨機抽樣的方法, 調查了9965人, 得到成對樣本觀測數(shù)據(jù)的分類統(tǒng)計結果, 如下表所示. 依據(jù)小概率值=0.001的獨立性檢驗, 分析吸煙是否會增加患肺癌的風險.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965解:零假設H0:吸煙與患肺癌之間無關聯(lián)根據(jù)小概率值=0.001的卡方獨立性檢驗,推斷H0不成立,因此可以吸煙與患肺癌之間有關聯(lián),此推斷犯錯誤的概率不大于 0.001用頻率計算再次進行比較:不吸煙者中患肺癌的頻率:吸煙者中患肺癌的頻率:其中兩者的比值為:在被調查者中, 吸煙者患肺癌的頻率是不吸煙者患肺癌的頻率的 4 倍以上總結獨立性檢驗的步驟應用獨立性檢驗解決實際問題主要環(huán)節(jié):(1) 提出零假設H0:X和Y相互獨立, 并給出在問題中的解釋.(2) 根據(jù)抽樣數(shù)據(jù)整理出22列聯(lián)表, 計算2的值, 并與臨界值比較.(3) 根據(jù)檢驗規(guī)則得出推斷結論.(4) 在 X和Y不獨立的情況下, 根據(jù)需要, 通過比較相應的頻率, 分析 X和Y間的 影響規(guī)律.思考1:列聯(lián)表中,對換行或列的值,會影響卡方的取值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工會開展三八節(jié)活動總結
- 客服個人工作總結
- 社區(qū)志愿者雷鋒日活動總結
- 企業(yè)行政人員工作總結
- 保險公司年終總結
- 2022-2023學年第二期高一中職數(shù)學期中考試模擬測試題答案解析
- 軟件外包開發(fā)合同范本
- 扶貧公益性崗位人員聘用協(xié)議書范本
- 停車棚施工合同范本
- 用媽媽車抵押合同范本
- 藥品集采培訓課件
- 股骨干骨折教學演示課件
- 高中物理考試成績分析報告
- 動靜脈內瘺血栓
- 部編版小學語文三年級上冊同步練習試題含答案(全冊)
- 朗誦《詩頌風華》
- 血性胸水的護理課件
- 醫(yī)共體人財物管理系統(tǒng)需求說明
- 臨時占用城市道路申請表
- 四年級數(shù)學下冊口算天天練45
- 雕塑采購投標方案(技術標)
評論
0/150
提交評論