




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
8.3列聯(lián)表與獨(dú)立性檢驗(yàn)8.3.1分類變量與列聯(lián)表
第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析1|分類變量與列聯(lián)表1.分類變量為了表述方便,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這
類隨機(jī)變量稱為分類變量.分類變量的取值可以用實(shí)數(shù)表示.2.列聯(lián)表假設(shè)兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為XY合計(jì)y1y2x1aba+bx2cdc+d合計(jì)a+cb+da+b+c+d第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析2×2列聯(lián)表給出了成對(duì)分類變量數(shù)據(jù)的交叉分類頻數(shù).3.兩個(gè)分類變量之間關(guān)聯(lián)關(guān)系的定性分析方法(1)頻率分析法:通過對(duì)樣本的每個(gè)分類變量的不同類別事件發(fā)生的頻率大小進(jìn)行
比較來分析分類變量之間是否有關(guān)聯(lián)關(guān)系.通常通過列聯(lián)表列出兩個(gè)分類變量的
頻數(shù)表來進(jìn)行分析.(2)圖形分析法:與表格相比,圖形更能直觀地反映兩個(gè)分類變量間是否互相影響,常
用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析2|獨(dú)立性檢驗(yàn)1.假定通過簡(jiǎn)單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,如表所示.XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d則χ2=①
.2.利用χ2的取值推斷分類變量X和Y是否②
獨(dú)立
的方法稱為χ2獨(dú)立性檢驗(yàn),讀作
“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).
第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析3.χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
1.分類變量中的變量與函數(shù)中的變量是同一概念.
(
?)變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量,有時(shí)可
以把分類變量的不同取值用數(shù)字表示,但這時(shí)的數(shù)字除了分類以外沒有其他含義,
而函數(shù)中的變量分為自變量與因變量,都是數(shù)的集合,有它們各自的意義.2.2×2列聯(lián)表中的數(shù)據(jù)是兩個(gè)分類變量的頻數(shù).
(√)3.事件A和B的獨(dú)立性檢驗(yàn)無關(guān),即兩個(gè)事件互不影響.
(
?)4.χ2的大小是判斷事件A和B是否相關(guān)的統(tǒng)計(jì)量.
(√)5.若計(jì)算得χ2=7.197,則認(rèn)為兩個(gè)變量間有關(guān)系的出錯(cuò)概率不超過0.01.
(√)6.在2×2列聯(lián)表中,若|ad-bc|越小,則說明兩個(gè)分類變量之間關(guān)系越強(qiáng).
(
?)判斷正誤,正確的畫“√”,錯(cuò)誤的畫“?”.第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析1|由χ2進(jìn)行獨(dú)立性檢驗(yàn)“人機(jī)大戰(zhàn),柯潔哭了,機(jī)器贏了”,2017年5月27日,19歲的世界圍棋第一人柯潔0∶
3不敵人工智能系統(tǒng)AlphaGo,落淚離席.許多人認(rèn)為這場(chǎng)比賽是人類的勝利,也有許
多人持反對(duì)意見,有網(wǎng)友為此進(jìn)行了調(diào)查.在參與調(diào)查的2600名男性中,有1560人
持反對(duì)意見,2400名女性中,有1118人持反對(duì)意見.第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析1.在運(yùn)用這些數(shù)據(jù)判斷“性別”與“人機(jī)大戰(zhàn)是不是人類的勝利”的關(guān)系時(shí),應(yīng)采
用哪種統(tǒng)計(jì)方法?提示:判斷“性別”與“人機(jī)大戰(zhàn)是不是人類的勝利”這兩個(gè)變量的關(guān)系,符合獨(dú)
立性檢驗(yàn)的基本思想.2.如何根據(jù)問題中的數(shù)據(jù)對(duì)分類變量作出分析?提示:列出2×2列聯(lián)表,計(jì)算χ2,將求得的χ2與臨界值比較,即可得相應(yīng)結(jié)論.第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋;(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較;(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論;(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)
律.注意,上述幾個(gè)環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進(jìn)行調(diào)整.例如,在有些時(shí)候,分類變量
的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的.
第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析手機(jī)給人們的生活帶來便捷,但同時(shí)也對(duì)中學(xué)生的生活和學(xué)習(xí)造成了嚴(yán)重的影響,
某校高一幾個(gè)學(xué)生成立研究性學(xué)習(xí)小組,就使用手機(jī)對(duì)學(xué)習(xí)成績(jī)的影響隨機(jī)抽取
了該校100名學(xué)生的期末考試成績(jī)并制成如下的表格,則下列說法正確的是()單位:人
成績(jī)優(yōu)秀成績(jī)不優(yōu)秀合計(jì)不使用手機(jī)401050使用手機(jī)54550合計(jì)4555100第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析A.在犯錯(cuò)誤的概率不超過0.001的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績(jī)有關(guān)B.在犯錯(cuò)誤的概率不超過0.001的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績(jī)無關(guān)C.有99.5%的把握認(rèn)為使用手機(jī)對(duì)學(xué)習(xí)成績(jī)沒有影響D.沒有99%的把握認(rèn)為使用手機(jī)對(duì)學(xué)習(xí)成績(jī)有影響解析
由題中表格得,χ2=
≈49.495>10.828=x0.001,所以在犯錯(cuò)誤的概率不超過0.001的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績(jī)有關(guān).故選A.答案
A第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析2|獨(dú)立性檢驗(yàn)與統(tǒng)計(jì)、概率的綜合應(yīng)用
通過頻率分布直方圖中的統(tǒng)計(jì)功能完善2×2列聯(lián)表,從而對(duì)事件進(jìn)行獨(dú)立性檢
驗(yàn),準(zhǔn)確讀取頻率分布直方圖中的數(shù)據(jù),進(jìn)行分組統(tǒng)計(jì)是解題的關(guān)鍵.解決獨(dú)立性檢
驗(yàn)的問題要注意明確兩類主體,明確研究的兩類問題,再就是準(zhǔn)確列出2×2列聯(lián)表,
準(zhǔn)確計(jì)算χ2.在寫出2×2列聯(lián)表中a,b,c,d的值時(shí),注意一定要按順序.
第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
隨著智能手機(jī)的普及,手機(jī)計(jì)步軟件迅速流行開來,這類軟件能自動(dòng)記載每個(gè)人每
日健步走的步數(shù),從而為科學(xué)健身提供一定的幫助.某市工會(huì)為了解該市市民每日
健步走的情況,從本市市民中隨機(jī)抽取了2000名(其中不超過40歲的市民恰好有10
00名),利用手機(jī)計(jì)步軟件統(tǒng)計(jì)了他們某天健步走的步數(shù)(單位:千步),并將樣本數(shù)據(jù)
分為[3,5),[5,7),[7,9),[9,11),[11,13),[13,15),[15,17),[17,19),[19,21]九組,將抽取的不超過40歲的市民的樣本數(shù)據(jù)繪制成頻率分布直方圖,將40歲以上的市民的樣本數(shù)據(jù)
繪制成頻數(shù)分布表,并利用該樣本的頻率分布估計(jì)總體的概率分布.第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析分組(單
位:千
步)[3,5)[5,7)[7,9)[9,11)[11,13)[13,15)[15,17)[17,19)[19,21]頻數(shù)1020203040020020010020第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(1)現(xiàn)規(guī)定,日健步走步數(shù)不低于13000步的為“健步達(dá)人”,填寫下面列聯(lián)表,
依據(jù)α=0.001的獨(dú)立性檢驗(yàn),分析是不是“健步達(dá)人”是否與年齡有關(guān);單位:人
健步達(dá)人非健步達(dá)人合計(jì)40歲以上的市民
不超過40歲的市民
合計(jì)
第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(2)(i)利用樣本平均數(shù)和中位數(shù)估計(jì)該市不超過40歲的市民日健步走步數(shù)(單
位:千步)的平均數(shù)和中位數(shù);(ii)由頻率分布直方圖可以認(rèn)為,不超過40歲的市民日健步走步數(shù)Z(單位:千步)近似
地服從正態(tài)分布N(μ,σ2),其中μ近似為樣本平均數(shù)
(每組數(shù)據(jù)取區(qū)間的中點(diǎn)值),σ的值已求出約為3.64.現(xiàn)從該市不超過40歲的市民中隨機(jī)抽取5人,記其中日健步走步
數(shù)Z位于[4.88,15.8]的人數(shù)為X,求X的數(shù)學(xué)期望.參考公式:χ2=
,其中n=a+b+c+d.參考數(shù)據(jù):α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828若Z~N(μ,σ2),則P(μ-σ≤Z≤μ+σ)≈0.6827,P(μ-2σ≤Z≤μ+2σ)≈0.9545.第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析解析
(1)列聯(lián)表為單位:人
健步達(dá)人非健步達(dá)人合計(jì)40歲以上的市民5204801000不超過40歲的市民4006001000合計(jì)92010802000第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析零假設(shè)為H0:是不是“健步達(dá)人”與年齡無關(guān).計(jì)算可得χ2=
≈28.986>10.828=x0.001,依據(jù)α=0.001的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為是不是“健步達(dá)人”與年齡有關(guān).(2)(i)樣本平均數(shù)為
=4×0.04+6×0.06+8×0.10+10×0.10+12×0.30+14×0.20+16×0.10+18×0.08+20×0.02=12.16.由前4組的頻率之和為0.04+0.06+0.10+0.10=0.30,前5組的頻率之和為0.30+0.30=0.
6,知樣本中位數(shù)落在第5組,設(shè)樣本中位數(shù)為t,則(t-11)×0.15=0.5-0.3,所以t=
.故可以估計(jì)該市不超過40歲的市民日健步走步數(shù)的平均數(shù)為12.16,中位數(shù)為
.(ii)[μ-2σ,μ+σ]=[4.88,15.8],而P(μ-2σ≤Z≤μ+σ)=
P(μ-2σ≤Z≤μ+2σ)+
P(μ-σ≤Z
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度醫(yī)院藥品采購與藥品不良反應(yīng)監(jiān)測(cè)合作合同
- 2025年度班組包工服務(wù)合同樣本(市政工程領(lǐng)域)
- 二零二五年度智能交通系統(tǒng)注資合作協(xié)議
- 2025年度企業(yè)信息化采購合同安全保密要求
- 二零二五年度土地調(diào)換與旅游地產(chǎn)項(xiàng)目開發(fā)協(xié)議
- 2025年度住宅租賃押金管理及退還合同范本
- 二零二五年度高端商務(wù)區(qū)寫字樓租賃管理合同
- 二零二五年度自然人創(chuàng)業(yè)扶持貸款合同范本
- 交通運(yùn)輸居間協(xié)調(diào)提成協(xié)議
- 旅游業(yè)務(wù)居間合同樣本
- 2024年山東藥品食品職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫含答案
- 《行政倫理學(xué)教程(第四版)》課件 張康之 第8-13章 行政組織倫理-技術(shù)時(shí)代的行政倫理
- 進(jìn)出潔凈室培訓(xùn)
- 《提案與方案優(yōu)化設(shè)計(jì)》課件-第一部分 常見戶型問題解析及平面布局優(yōu)化
- MOOC 跨文化交際通識(shí)通論-揚(yáng)州大學(xué) 中國大學(xué)慕課答案
- (正式版)SHT 3078-2024 立式圓筒形料倉工程設(shè)計(jì)規(guī)范
- 2024年高考語文標(biāo)點(diǎn)符號(hào)的基本用法大全(新標(biāo)準(zhǔn))
- 2024ABB IRB IRB6700Inv IRB6700I產(chǎn)品手冊(cè)指南
- 正弦函數(shù)圖像與性質(zhì).課件
- 認(rèn)識(shí)職業(yè):醫(yī)生
- 外貿(mào)進(jìn)出口基礎(chǔ)知識(shí)培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論