版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第3節(jié)變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例
知識(shí)分類落實(shí)回扣知識(shí)?夯實(shí)基礎(chǔ)
知識(shí)梳理
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系
兩個(gè)變量有關(guān)系,但又沒(méi)有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,
這種關(guān)系稱為相關(guān)關(guān)系.
(2)正相關(guān)、負(fù)相關(guān)
從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨勢(shì),
我們就稱這兩個(gè)變量正相關(guān);如果一個(gè)變量值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)
減少的趨勢(shì),則稱這兩個(gè)變量負(fù)相關(guān).
(3)線性相關(guān)
一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條線附近,
我們就稱這兩個(gè)變量線性相關(guān).
一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量
非線性相關(guān)或曲線相關(guān).
2.樣本相關(guān)系數(shù)
⑴相關(guān)系數(shù)r的計(jì)算
變量x和變量y的樣本相關(guān)系數(shù)r的計(jì)算公式如下:
n__
£(x(—JC)(y(—y)
①當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān);當(dāng)/<0時(shí),成對(duì)樣本數(shù)據(jù)魚相關(guān);當(dāng)/?=()
時(shí),成對(duì)樣本數(shù)據(jù)間沒(méi)有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)r的取值范圍為f—1,11.
當(dāng)|r|越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)卜|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱.
3.一元線性回歸模型
(1)線性回歸方程與最小二乘法
我們將j=£+聯(lián)稱為y關(guān)于x的線性回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公
式,其圖形稱為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求
得的2,展叫做。,。的最小二乘估計(jì),
其中
"〃-?―
£(XLX)(?-y)S.w一欣)
Z(X/_x)2
i=1i=l
A—A—
<a=y-bx.
⑵利用相關(guān)指數(shù)W刻畫回歸效果
n
£(W)2
i=1
R2=l----------,心越大,即擬合效果越好,N越小,模型擬合效果越
n_——
£(y_y)2
z=l
差.
4.列聯(lián)表與獨(dú)立性檢驗(yàn)
⑴2X2列聯(lián)表
一般地,假設(shè)有兩個(gè)分類變量X和K它們的取值分別為{xi,及}和{6,"},其
2X2列聯(lián)表為
合計(jì)
X\aba+b
X2Cdc+d
合計(jì)a+cb+do+b+c+d
(2)臨界值
H(nd—be)2
尸(工八,、萬(wàn)?忽略/的實(shí)際分布與該近似分布的誤
A<a+b)J\c+a)(a4+c)\“b4+d)A
差后,對(duì)于任何小概率值a,可以找到相應(yīng)的正實(shí)數(shù)%,使得Pdexa):。成立.
我們稱均為a的臨界值,這個(gè)臨界值就可作為判斷Z2大小的標(biāo)準(zhǔn).
(3)獨(dú)立性檢驗(yàn)
基于小概率值a的檢驗(yàn)規(guī)則是:
當(dāng)爐2刈時(shí),我們就推斷法不成立,即認(rèn)為X和丫不獨(dú)立,該推斷犯錯(cuò)誤的概
率不超過(guò)a;
當(dāng)/〈玄時(shí),我們沒(méi)有充分證據(jù)推斷從不成立,可以認(rèn)為X和丫獨(dú)立.
這種利用Z2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為Z2獨(dú)立性檢驗(yàn),讀
作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).
下表給出了Z2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
?—常用結(jié)論與微點(diǎn)提醒
1.求解回歸方程的關(guān)鍵是確定回歸系數(shù)展,Z,應(yīng)充分利用回歸直線過(guò)樣本點(diǎn)的中
心(尤,y).
2.根據(jù)回歸方程計(jì)算的;值,僅是一個(gè)預(yù)報(bào)值,不是真實(shí)發(fā)生的值.
3.根據(jù)爐的值可以判斷兩個(gè)分類變量有關(guān)的可信程度,若/越大,則兩分類變
量有關(guān)的把握越大.
診斷自測(cè)
??思考辨析
1.判斷下列結(jié)論正誤(在括號(hào)內(nèi)打“J”或“義”)
⑴“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)
系.()
(2)通過(guò)回歸直線方程;=晨+2可以估計(jì)預(yù)報(bào)變量的取值和變化趨勢(shì).()
(3)只有兩個(gè)變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測(cè)價(jià)值.()
(4)事件X,V關(guān)系越密切,則由觀測(cè)數(shù)據(jù)計(jì)算得到的蜉的觀測(cè)值越大.()
答案(1”(2)7(3)7(4)7
〉教材衍化
2.為調(diào)查中學(xué)生近視情況,測(cè)得某校在150名男生中有80名近視,在140名女
生中有70名近視.在檢驗(yàn)這些學(xué)生眼睛近視是否與性別有關(guān)時(shí),用下列哪種方
法最有說(shuō)服力()
A.回歸分析B.均值與方差
C.獨(dú)立性檢驗(yàn)D.概率
答案C
解析“近視”與“性別”是兩類變量,其是否有關(guān),應(yīng)用獨(dú)立性檢驗(yàn)判斷.
3.(多選題)在統(tǒng)計(jì)中,由一組樣本數(shù)據(jù)(*[,>1),。2,>2),…,(X",力)利用最小
二乘法得到兩個(gè)變量的線性回歸方程為:=£+;那么下列說(shuō)法正確的是()
A.相關(guān)系數(shù)r不可能等于1
AAA——
B.直線y=bx+a必經(jīng)過(guò)點(diǎn)(x,y)
C.直線(=£+)表示最接近y與x之間真實(shí)關(guān)系的一條直線
D.相關(guān)系數(shù)為「,且|r|越接近于1,相關(guān)程度越大;田越接近于0,相關(guān)程度越
小
答案BCD
解析相關(guān)系數(shù)的取值范圍是|r|Wl,故A錯(cuò)誤;直線;=£+:必過(guò)樣本點(diǎn)中心
即點(diǎn)(;,y),故B正確;直線;=£+聯(lián)是采用最小二乘法求解出的直線方程,接
近真實(shí)關(guān)系,故C正確;相關(guān)系數(shù)r的絕對(duì)值越接近于1,表示相關(guān)程度越強(qiáng),
越接近于0,相關(guān)程度越弱,故D正確.故選BCD.
>考題體驗(yàn)
4.(2020?貴陽(yáng)期末)已知關(guān)于變量x,y的線性回歸方程為<=0.25x+0.55,且x,
y的相關(guān)數(shù)據(jù)如下表所示,則表格中加的值為()
X1234
y0.8m1.41.5
A.lB.1.05C.1.2D.2
答案A
解析由題意知;="27+4=2.5,
O.8+/71+1.4+1.53.7+用
尸4,
所以樣本點(diǎn)的中心為(2.5,安竺),
3.7+機(jī)
代入線性回歸方程y=0.25x+0.55,得J—=0.25X2.5+0.55,解得m=l.
5.(2020.全國(guó)I卷)某校一個(gè)課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度
x(單位:℃)的關(guān)系,在20個(gè)不同的溫度條件下進(jìn)行種子發(fā)芽實(shí)驗(yàn),由實(shí)驗(yàn)數(shù)據(jù)
(Xi,yi)(i=l,2,…,20)得到下面的散點(diǎn)圖:
100%
80%
出60%
孤40%
203()40
由此散點(diǎn)圖,在10℃至40℃之間,下面四個(gè)回歸方程類型中最適宜作為發(fā)芽率
y和溫度x的回歸方程類型的是()
A.y=a-\~bxB.y=a+bx1
C.y=a+beD.y=a+b\nx
答案D
解析由散點(diǎn)圖可以看出,這些點(diǎn)大致分布在對(duì)數(shù)型函數(shù)的圖象附近.故選D.
6.(2020.聊城模擬)某校為了研究“學(xué)生的性別”和“對(duì)待某一活動(dòng)的態(tài)度”是
2
否有關(guān),運(yùn)用2X2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn),經(jīng)計(jì)算/=7.069,則認(rèn)為“學(xué)生性
別與支持某項(xiàng)活動(dòng)有關(guān)系”的犯錯(cuò)誤的概率不超過(guò)()
A.0.1%B.1%
C.99%D.99.9%
答案B
2
解析V/=7.O69>6.635=XO.OI,
???認(rèn)為“學(xué)生性別與支持某項(xiàng)活動(dòng)有關(guān)系”的犯錯(cuò)誤的概率不超過(guò)1%.
考點(diǎn)分層突破考點(diǎn)聚焦?題型剖析
考點(diǎn)一相關(guān)關(guān)系的判斷自主演練
1.下列四個(gè)散點(diǎn)圖中,變量x與y之間具有負(fù)的線性相關(guān)關(guān)系的是()
xO
AB
CD
答案D
解析觀察散點(diǎn)圖可知,只有D選項(xiàng)的散點(diǎn)圖表示的是變量x與y之間具有負(fù)
的線性相關(guān)關(guān)系.故選D.
2.(2020.重慶診斷)某商家今年上半年各月的人均銷售額(單位:千元)與利潤(rùn)率
統(tǒng)計(jì)表如下:
月份123456
人均銷售額658347
利潤(rùn)率(%)12.610.418.53.08.116.3
根據(jù)表中數(shù)據(jù),下列說(shuō)法正確的是()
A.利潤(rùn)率與人均銷售額成正相關(guān)關(guān)系
B.利潤(rùn)率與人均銷售額成負(fù)相關(guān)關(guān)系
C.利潤(rùn)率與人均銷售額成正比例函數(shù)關(guān)系
D.利潤(rùn)率與人均銷售額成反比例函數(shù)關(guān)系
答案A
解析由統(tǒng)計(jì)表可得利潤(rùn)率與人均銷售額不是正比例關(guān)系,也不是反比例關(guān)系,
排除C和D;其屬于正相關(guān)關(guān)系,A正確,B錯(cuò)誤.
3.(多選題)(2020?淄博模擬)2019年女排世界杯是由國(guó)際排聯(lián)(FIVB)舉辦的第13
屆世界杯賽事,比賽于2019年9月14日至9月29日在日本舉行,共有12支參
賽隊(duì)伍.最終,中國(guó)女排以11戰(zhàn)全勝且只丟3局的成績(jī)成功衛(wèi)冕本屆世界杯冠
軍.中國(guó)女排的影響力早已超越體育本身的意義,不僅是時(shí)代的集體記憶,更是
激勵(lì)國(guó)人持續(xù)奮斗、自強(qiáng)不息的精神符號(hào).以下是本屆世界杯比賽最終結(jié)果的相
關(guān)數(shù)據(jù),記每個(gè)隊(duì)的勝場(chǎng)數(shù)為變量x,積分為變量y(只列出了前6名).
排名123456
勝場(chǎng)數(shù)X11108766
積分y322823211918
若y與X之間具有線性相關(guān)關(guān)系,根據(jù)表中數(shù)據(jù)可求得y關(guān)于X的回歸直線方程
為;=2.59x+聯(lián),則下列說(shuō)法正確的有()
A.a的值為2.78
B.a的值為2.14
C.若整隊(duì)在此次比賽中獲勝的場(chǎng)數(shù)是4,根據(jù)線性回歸方程其得分為13分(精
確到整數(shù))
D.由線性回歸方程可知,當(dāng)某個(gè)隊(duì)伍勝場(chǎng)增加1時(shí),其積分約增加2.59分
答案ACD
——AAA
解析由題知,x=8,y=23.5,代入方程y=2.59x+a,計(jì)算得a=2.78,故A正
AA
確,B不正確;將x=4代入方程y=2.59x+2.78,計(jì)算得y=13.14仁13,故C正
確;回歸方程中x的系數(shù)是2.59,故D正確.
感悟升華判斷相關(guān)關(guān)系的兩種方法:
(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就
有相關(guān)關(guān)系;如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有
線性相關(guān)關(guān)系.
(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,川越趨近于1,相關(guān)性越強(qiáng).
考點(diǎn)二回歸分析多維探究
角度1線性回歸方程及應(yīng)用
【例1】下面給出了根據(jù)我國(guó)2012?2018年水果人均占有量y(單位:kg)和年份
代碼x繪制的散點(diǎn)圖和線性回歸方程的殘差圖.(2012年?2018年的年份代碼x
分別為1?7)
(
W
B我國(guó)2012年~2018年水果人均占有量散點(diǎn)圖
.1
_1?(
7(
sr1
.=16(
間15(
工14(
3(
叼1
2(
XY-1234567
年份代碼K
(
胃2我國(guó)2012年~2018年水果人均占有量殘差圖
包1
外0
1
嬴2
望1234567
年份代碼1
⑴根據(jù)散點(diǎn)圖分析y與光之間的相關(guān)關(guān)系;
77
⑵根據(jù)散點(diǎn)圖相應(yīng)數(shù)據(jù)計(jì)算得£?=1074,£X?=4517,求y關(guān)于元的線性回歸
方程;(精確到0.01)
(3)根據(jù)線性回歸方程的殘差圖,分析線性回歸方程的擬合效果.
附:回歸方程;=:+&中斜率和截距的最小二乘估計(jì)公式分別為,=
n--n—
高(為一無(wú))(%一))Y^Xiyi—nxy人_A_
-,ci~y-bx.
玄(%,—%)2Y^—nx1
解(1)從散點(diǎn)圖可以看出,這些點(diǎn)的分布整體上在一條直線附近,且當(dāng)x由小
變大時(shí),y也由小變大,
所以y與x之間具有線性相關(guān)關(guān)系,且是正相關(guān).
1+2+3+4+5+6+7.
(2)由題意可知,x==4,
1工1074
y書y尸〒,
7
£斤=12+22+32+42+52+62+72=140,
7.,、1074
人石孫一7xy4517-7X4X722J_
否_俁=-140—7X42—=而“7.89,
/=!
'-"1074
一氏r=-y—7.89X4^121.87,
A
關(guān)于x的線性回歸方程為y=7.89x+121.87.
(3)由殘差圖可以看出歷年數(shù)據(jù)的殘差均分布在一2?2之間,且圖中各點(diǎn)比較均
勻地分布在數(shù)值0所在直線附近,帶狀區(qū)域很窄,說(shuō)明對(duì)應(yīng)的回歸直線擬合效果
較好.
角度2非線性回歸方程及應(yīng)用
【例2】(2021?四川七市一診)已知某地區(qū)某種昆蟲產(chǎn)卵數(shù)和溫度有關(guān).現(xiàn)收集了
一只該品種昆蟲的產(chǎn)卵數(shù)y(個(gè))和溫度式℃)的7組觀測(cè)數(shù)據(jù),其散點(diǎn)圖如圖所示:
產(chǎn)卵數(shù)“個(gè))
30()
250
200
150*
100
-..?
5()
oL.一—::.........
1820222426283()3?23436溫度*(七)
根據(jù)散點(diǎn)圖,結(jié)合函數(shù)知識(shí),可以發(fā)現(xiàn)產(chǎn)卵數(shù)y和溫度x可用方程y=芭'+。來(lái)擬
合,令z=lny,結(jié)合樣本數(shù)據(jù)可知z與溫度x可用線性回歸方程來(lái)擬合.
根據(jù)收集到的數(shù)據(jù),計(jì)算得到如下值:
7-7一一
2£⑵-Z)2
Xyz石(Xi-X)高(X,—x)(z,—Z)
27743.53718211.946.418
表中Zj=lny”z=
⑴求z和溫度x的回歸方程(回歸系數(shù)結(jié)果準(zhǔn)確到0.001);
(2)求產(chǎn)卵數(shù)y關(guān)于溫度x的回歸方程;若該地區(qū)一段時(shí)間內(nèi)的氣溫在26℃~36℃
之間(包括26℃與36℃),估計(jì)該品種一只昆蟲的產(chǎn)卵數(shù)的范圍.(參考數(shù)據(jù)
37925832:60876342
e3.282g27,e^44fe=?341,e^440,e?=568)
AAA
附:對(duì)于一組數(shù)據(jù)(o1,Vl),(692,02),....,{(On,Vn),其回歸直線0=a+伙0
〃一一
A11((Di—CD)(Vi-V)A-A-
的斜率和截距的最小二乘估計(jì)分別為尸----------2------------,a=v-/3co.
(如一①)2
zE^l.
解(1)由題意,z和溫度尤可以用線性回歸方程擬合,設(shè);=£+;則2=
7
(X/-X)(Z/-Z)
石46.418
7心0.2550,
N(X;—X)2182
a=z-/?x=3.537—0.2550X27=-3.348,
故z關(guān)于x的線性回歸方程為z=0.255x-3.348.
(2)由(1)可得,lny=0.255x-3.348,
于是產(chǎn)卵數(shù)y關(guān)于溫度X的回歸方程為y=eO255L3.348.
當(dāng)X=26時(shí),y=e°255X26-3.348=e3282心27;
當(dāng)X=36時(shí),y=e0255x36-3.348=e5.832心341.
函數(shù)y=2255廠3.348為增函數(shù),
二氣溫在26℃?36c之間時(shí),估計(jì)該品種一只昆蟲的產(chǎn)卵數(shù)的范圍是[27,341]
內(nèi)的正整數(shù).
感悟升華回歸分析問(wèn)題的類型及解題方法
(1)求回歸方程
①根據(jù)散點(diǎn)圖判斷兩變量是否線性相關(guān),如不是,應(yīng)通過(guò)換元構(gòu)造線性相關(guān).
②利用公式,求出回歸系數(shù)
③待定系數(shù)法:利用回歸直線過(guò)樣本點(diǎn)的中心求系數(shù)。
(2)利用回歸方程進(jìn)行預(yù)測(cè),把線性回歸方程看作一次函數(shù),求函數(shù)值.
(3)利用回歸直線判斷正、負(fù)相關(guān),決定正相關(guān)還是負(fù)相關(guān)的是系數(shù)江
(4)回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)川越趨近于1時(shí),兩變量的
線性相關(guān)性越強(qiáng).
【訓(xùn)練1】(2021.榆林模擬)根據(jù)統(tǒng)計(jì),某蔬菜基地西紅柿畝產(chǎn)量的增加量y(百千
克)與某種液體肥料每畝使用量M千克)之間的對(duì)應(yīng)數(shù)據(jù)的散點(diǎn)圖如圖所示:
>(百千克)
7---------------------------?
6------------------?;
5----------------;;
4-------?;::
3------?:::;
°2456?支(千克)
(1)依據(jù)數(shù)據(jù)的散點(diǎn)圖可以看出,可用線性回歸模型擬合y與X的關(guān)系,請(qǐng)計(jì)算相
關(guān)系數(shù)并加以說(shuō)明(若力>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合);
(2)求y關(guān)于x的回歸方程,并預(yù)測(cè)液體肥料每畝使用量為12千克時(shí),西紅柿畝
產(chǎn)量的增加量約為多少.
t(xi—x)(y-y)
附:相關(guān)系數(shù)/■二歸工2圖%一旅
n
回歸直線(=Z*+2的斜率和截距的最小二乘估計(jì)分別為,=
a=y-bx.
占Cxi-x)2
2+4+5+6+8-34-4+5+6+7
解(l)x==5,y==5.
石(x,—x)(y/-y)=(-3)X(-2)+(-1)X(-1)+OXO+1X1+3X2=14,
£(x,—X)2=(-3)2+(-1)2+02+12+32=20,
5一
玄(y1—y)2=(-2)2+(-I)2+O2+I2+22=IO.
14_7J2
._:?(電一五)2,£(沙一()2V20XVw10
,.r—7m「i>0.75,
...可用線性回歸模型擬合y與x的關(guān)系.
5-
八g(為—x)(?一?。?4
(2)A—5~~on-0.7,
2
目11(劉一x)
則。=了一"=5—0.7義5=1.5,
Ay=0.7x+1.5.
A
當(dāng)x=12時(shí),y=0.7X12+1.5=9.9,
???預(yù)測(cè)液體肥料每畝使用量為12千克時(shí),西紅柿畝產(chǎn)量的增加量約為9.9百千
克.
考點(diǎn)三獨(dú)立性檢驗(yàn)師生共研
【例31(2020.全國(guó)III卷)某學(xué)生興趣小組隨機(jī)調(diào)查了某市100天中每天的空氣
質(zhì)量等級(jí)和當(dāng)天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):
煉人次
空氣質(zhì)量等^[0,200](200,400](400,600]
1(優(yōu))21625
2(良)51012
3(輕度污染)678
4(中度污染)720
(1)分別估計(jì)該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率;
(2)求一天中到該公園鍛煉的平均人次的估計(jì)值(同一組中的數(shù)據(jù)用該組區(qū)間的中
點(diǎn)值為代表);
(3)若某天的空氣質(zhì)量等級(jí)為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)
量等級(jí)為3或4,則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的2X2
列聯(lián)表,并根據(jù)列聯(lián)表,能否在犯錯(cuò)誤的概率不超過(guò)0.05的前提下,認(rèn)為一天
中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān)?
人次近400人次>400
空氣質(zhì)量好
空氣質(zhì)量不好
n(ad-be)2
(a+Z?)(c+d)(a+c)(b+d)'
a0.0500.0100.001
Xa3.8416.63510.828
解(1)由所給數(shù)據(jù),得該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率的估計(jì)值
如下表:
空氣質(zhì)量等級(jí)1234
概率的估計(jì)值0.430.270.210.09
(2)一天中到該公園鍛煉的平均人次的估計(jì)值為
?^(100X20+300X35+500X45)=350.
(3)根據(jù)所給數(shù)據(jù),可得2X2列聯(lián)表:
人次W400人次>400
空氣質(zhì)量好3337
空氣質(zhì)量不好228
零假設(shè)為Ho:
一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量無(wú)關(guān).
根據(jù)列聯(lián)表得
,100X(33X8-22X37)2
工=55X45X70X30^5.820>3.841=%.
根據(jù)小概率值a=0.050的/獨(dú)立性檢驗(yàn),可推斷Ho不成立,所以在犯錯(cuò)誤的概
率不超過(guò)0.05的前提下,可認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣
質(zhì)量有關(guān).
感悟升華1.在2X2列聯(lián)表中,如果兩個(gè)變量沒(méi)有關(guān)系,則應(yīng)滿足"一次七0.園
一反|越小,說(shuō)明兩個(gè)變量之間關(guān)系越弱;園一陽(yáng)越大,說(shuō)明兩個(gè)變量之間關(guān)系
越強(qiáng).
2.解決獨(dú)立性檢驗(yàn)的應(yīng)用問(wèn)題,一定要按照獨(dú)立性檢驗(yàn)的步驟得出結(jié)論.獨(dú)立性檢
驗(yàn)的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表:
-2,〃(ad-be)-_
(2)根據(jù)么式/=Q+MQ+C)(b+d)(c+d)計(jì)算/;
(3)通過(guò)比較/與臨界值的大小關(guān)系來(lái)作統(tǒng)計(jì)推斷.
【訓(xùn)練2]為了探究學(xué)生選報(bào)文、理科是否與對(duì)外語(yǔ)的興趣有關(guān),某同學(xué)調(diào)查
了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科生對(duì)外語(yǔ)有興趣的有138人,無(wú)興
趣的有98人,文科生對(duì)外語(yǔ)有興趣的有73人,無(wú)興趣的有52人.試分析學(xué)生選
報(bào)文、理科與對(duì)外語(yǔ)的興趣是否有關(guān)?
解零假設(shè)為法:選報(bào)文、理科與對(duì)外語(yǔ)的興趣無(wú)關(guān).
列出2X2列聯(lián)表
理文合計(jì)
有興趣13873211
無(wú)興趣9852150
合計(jì)236125361
代入公式得
,361X(138X52—73X98)】
工=236X125X211X150
V1.871X1O^4<2.7O6=XO.I,
根據(jù)小概率值a=0.1的三獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷“o不成立,即選報(bào)文、
理科與對(duì)外語(yǔ)的興趣無(wú)關(guān).
課后鞏固作業(yè)分層訓(xùn)練?提升能力
A級(jí)基礎(chǔ)鞏固
一、選擇題
1.對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正
確的是()
()51()1520253()35°51()1520253035
相關(guān)系數(shù)為。相關(guān)系數(shù)為七
(1)(2)
051()1520253035051()1520253035
相關(guān)系數(shù)為匚1相關(guān)系數(shù)為口
(3)(4)
A.-2<-4<0<r3<〃B.r4<f2<0<n<r3
C-r4<r2<0<r3<nD.r2<^4<0<n<r3
答案A
解析由散點(diǎn)圖知圖(1)與圖(3)是正相關(guān),故n>0,r3>0,圖(2)與圖(4)是負(fù)相關(guān),
故r2<0,r4<0,且圖⑴與圖(2)的樣本點(diǎn)集中在一條直線附近,因此r2<r4<0<r3<n,
故選A.
2.有下列說(shuō)法:①在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說(shuō)
明選用的模型比較合適;②用相關(guān)指數(shù)R2來(lái)刻畫回歸的效果,火2值越接近于1,
說(shuō)明模型的擬合效果越好;③比較兩個(gè)模型的擬合效果,可以比較殘差平方和的
大小,殘差平方和越小的模型,擬合效果越好.正確的是()
A.①②B.②③C.①③D.①②③
答案D
3.(多選題)(2020.棗莊模擬)某大學(xué)為了解學(xué)生對(duì)學(xué)校食堂服務(wù)的滿意度,隨機(jī)調(diào)
查了50名男生和50名女生,每位學(xué)生對(duì)食堂的服務(wù)給出滿意或不滿意的評(píng)價(jià),
得到如下所示的列聯(lián)表,經(jīng)計(jì)算小心4.762,則可以推斷出()
滿意不滿意
男3020
女4010
a0.1000.0500.010
Xa2.7063.8416.635
3
A.該學(xué)校男生對(duì)食堂服務(wù)滿意的概率的估計(jì)值為;
B.調(diào)研結(jié)果顯示,該學(xué)校男生比女生對(duì)食堂服務(wù)更滿意
C.認(rèn)為男、女生對(duì)該食堂服務(wù)的評(píng)價(jià)有差異此推斷犯錯(cuò)誤的概率不超過(guò)0.05
D.認(rèn)為男、女生對(duì)該食堂服務(wù)的評(píng)價(jià)有差異此推斷犯錯(cuò)誤的概率不超過(guò)0.01
答案AC
303
解析對(duì)于選項(xiàng)A,該學(xué)校男生對(duì)食堂服務(wù)滿意的概率的估計(jì)值為就用=巳
INV/J
故A正確;
對(duì)于選項(xiàng)B,該學(xué)校女生對(duì)食堂服務(wù)滿意的概率的估計(jì)值為4常0行=々4>與3,故B
錯(cuò)誤;
因?yàn)?心4.762>3.841=處05,認(rèn)為男、女生對(duì)該食堂服務(wù)的評(píng)價(jià)有差異,此推
斷犯錯(cuò)誤的概率不超過(guò)0.05,故C正確,D錯(cuò)誤.
4.(多選題)(2021.武漢調(diào)研)已知某產(chǎn)品的銷售額y(單位:萬(wàn)元)與廣告費(fèi)用x(單
位:萬(wàn)元)之間的關(guān)系如下表:
x(單位:萬(wàn)元)01234
y(單位:萬(wàn)元)1015m3035
若根據(jù)表中的數(shù)據(jù)用最小二乘法求得),與x的回歸直線方程為;=6.5x+9,則下
列說(shuō)法中正確的是()
A.產(chǎn)品的銷售額與廣告費(fèi)用成正相關(guān)
B.該回歸直線過(guò)點(diǎn)(2,22)
C.當(dāng)廣告費(fèi)用為10萬(wàn)元時(shí),銷售額一定為74萬(wàn)元
D.初的值是20
答案ABD
解析由線性回歸方程;=6.5尤+9中的回歸系數(shù)6.5〉0,可知產(chǎn)品的銷售額與廣
告費(fèi)用成正相關(guān),故A中的說(shuō)法正確;
0+1+2+3+4-10+15+ni+30+3590+mA
尤=5=2,y=5=——代入y=6.5x+9,得
90|YY\.
-^―=6.5X2+9,解得加=20,故D中的說(shuō)法正確;
90+加90+20
不一=—?—=22,則該回歸直線過(guò)點(diǎn)(2,22),故B中的說(shuō)法正確A;
當(dāng)x=10時(shí),>=6.5X10+9=74,說(shuō)明當(dāng)廣告費(fèi)用為10萬(wàn)元時(shí),銷售額預(yù)計(jì)為
74萬(wàn)元,故C中的說(shuō)法錯(cuò)誤.故選ABD.
5.(多選題)(2021.廣東百校聯(lián)考)下表是我國(guó)某城市在2019年1月份至10月份
期間各月最低溫度與最高溫度(單位:。C)的數(shù)據(jù)一覽表.
月份12345678910
最高溫
59911172427303121
度/℃
最低溫
-12-31-271719232510
度/℃
已知該城市的各月最低溫度與最高溫度具有相關(guān)關(guān)系,根據(jù)該一覽表,則下列結(jié)
論正確的是()
A.最低溫度與最高溫度為正相關(guān)
B.每月最高溫度與最低溫度的平均值在前8個(gè)月逐月增加
C.月溫差(最高溫度減最低溫度)的最大值出現(xiàn)在1月
D.1月至4月的月溫差(最高溫度減最低溫度)相對(duì)于7月至10月,波動(dòng)性更大
答案ACD
解析將最高溫度、最低溫度、溫差列表如下:
月份12345678910
最高溫
59911172427303121
度/℃
最低溫-12-31-271719232510
度/℃
溫差
171281310787611
度/℃
由表格可知,最低溫度大致隨最高溫度的升高而升高,A正確;
每月最高溫度與最低溫度的平均值在前8個(gè)月不是逐月增加,B錯(cuò)誤;
月溫差的最大值出現(xiàn)在1月,C正確;
1月至4月的月溫差相對(duì)于7月至10月,波動(dòng)性更大,D正確.
6.2018世界特色魅力城市200強(qiáng)新鮮出爐,包括黃山市在內(nèi)的28個(gè)中國(guó)城市入
選,美麗的黃山風(fēng)景和人文景觀迎來(lái)眾多賓客.現(xiàn)在很多人喜歡“自助游”,某
調(diào)查機(jī)構(gòu)為了了解“自助游”是否與性別有關(guān),在黃山旅游節(jié)期間,隨機(jī)抽取了
100人,得如下所示的列聯(lián)表:
贊成“自助游”不贊成“自助游”總計(jì)
男性301545
女性451055
總計(jì)7525100
公上八a,nQad-bc)2
參考公式:兄=(c++(〃+c)(b+d),其中〃=a+,+c+”
a0.150.100.050.0250.0100.0050.001
2.0722.7063.8415.0246.6357.87910.828
Xa
參照公式,得到的正確結(jié)論是()
A.有99.5%以上的把握認(rèn)為“贊成'自助游'與性別無(wú)關(guān)”
B.有99.5%以上的把握認(rèn)為“贊成'自助游'與性別有關(guān)”
C.在犯錯(cuò)誤的概率不超過(guò)0.1的前提下,認(rèn)為“贊成'自助游'與性別無(wú)關(guān)”
D.在犯錯(cuò)誤的概率不超過(guò)0.1的前提下,認(rèn)為“贊成‘自助游'與性別有關(guān)”
答案D
解析將2X2列聯(lián)表中的數(shù)據(jù)代入計(jì)算,得
43zxJJ/J/XZD
^3.030>2.706=X()J,
...在犯錯(cuò)誤的概率不超過(guò)0.1的前提下,可以認(rèn)為“贊成‘自助游’與性別有
二'填空題
7.已知x和y的散點(diǎn)圖如圖所示,在相關(guān)關(guān)系中,若用y=ciec2X擬合時(shí)的相關(guān)
指數(shù)為品用;=£+聯(lián)擬合時(shí)的相關(guān)指數(shù)為臉則冊(cè)虺中較大的是.
y
3(XX)"■
2500?
2000*
15(X)?
1(XX)??.
5(X),..
012345678910x
答案/?T
解析由散點(diǎn)圖知,用y=aec>擬合的效果比擬合的效果要好,所以
7?T>/?2,故較大者為此.
8.在一次對(duì)人體脂肪含量和年齡的關(guān)系的研究中,研究人員獲得了一組樣本數(shù)
據(jù),并制成如圖所示的人體脂肪含量與年齡的關(guān)系的散點(diǎn)圖,下列結(jié)論中正確的
是(填序號(hào)).
脂肪含量/%
35
30■??
25■??
2()?
10?
一?
5?
口1520253()3540455()5560年齡/歲
①人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)等于20%;
②人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于20%;
③人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)等于20%;
④人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)小于20%.
答案②
解析觀察圖形,可知人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于
20%.
9.某醫(yī)療研究所為了檢驗(yàn)?zāi)撤N血清預(yù)防感冒的作用,把500名使用血清的人與另
外500名未使用血清的人一年中的感冒記錄作比較,提出假設(shè)”0:“這種血清
不能起到預(yù)防感冒的作用”,利用2X2列聯(lián)表計(jì)算得三q3.918,經(jīng)查臨界值表
知孫.05=3.841.則下列結(jié)論中,正確結(jié)論的序號(hào)是.
①認(rèn)為“這種血清能起到預(yù)防感冒的作用”犯錯(cuò)誤的概率不超過(guò)0.05;②若某人
未使用該血清,那么他在一年中有95%的可能性得感冒;③這種血清預(yù)防感冒的
有效率為95%;④這種血清預(yù)防感冒的有效率為5%.
答案①
解析Z2^3.918^3.841=X(),()5,所以認(rèn)為“這種血清能起到預(yù)防感冒的作用”,
這種推斷犯錯(cuò)誤的概率不超過(guò)0.05.要注意我們檢驗(yàn)的是假設(shè)是否成立和該血清
預(yù)防感冒的有效率是沒(méi)有關(guān)系的,不是同一個(gè)問(wèn)題,不要混淆.
三'解答題
10.(2020.全國(guó)H卷)某沙漠地區(qū)經(jīng)過(guò)治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)
量有所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地
塊,從這些地塊中用簡(jiǎn)單隨機(jī)抽樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)
據(jù)⑶,y)(i=l,2,…,20),其中劉和y?分別表示第i個(gè)樣區(qū)的植物覆蓋面積(單
202020
位:公頃)和這種野生動(dòng)物的數(shù)量,并計(jì)算得£為=60,£?=1200,£(Xi-X)2
20-20--
2
=80,£(y(—y)=9000,E.(x,—x)(y/—y)=800.
(1)求該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值(這種野生動(dòng)物數(shù)量的估計(jì)值等于樣區(qū)這
種野生動(dòng)物數(shù)量的平均數(shù)乘以地塊數(shù));
(2)求樣本?,y,)(z=l,2,…,20)的相關(guān)系數(shù)(精確到0.01);
(3)根據(jù)現(xiàn)有統(tǒng)計(jì)資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性
以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì),請(qǐng)給出一種你認(rèn)為更合理的抽樣
方法,并說(shuō)明理由.
n一
X(即一x)(y—y)
附:相關(guān)系數(shù)r=j:.,:.一,6七1.414.
(XLX)(%一丁)2
-120
解(1)由已知得樣本平均數(shù)曠=m1>=60,從而該地區(qū)這種野生動(dòng)物數(shù)量的估
計(jì)值為60X200=12000.
(2)樣本⑶,%)(i=l,2,…,20)的相關(guān)系數(shù)
20--
石(為一x)(M—y)8002/八、
?2y(工一^80X900?!?七?4.
2高(為一》)(y,一y)丫
(3)分層抽樣:根據(jù)植物覆蓋面積的大小對(duì)地塊分層,再對(duì)200個(gè)地塊進(jìn)行分層
抽樣.
理由如下:由(2)知各樣區(qū)的這種野生動(dòng)物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān)
性.由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動(dòng)物數(shù)量差異
也很大,采用分層抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高
了樣本的代表性,從而可以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì).
11.某公司為了準(zhǔn)確地把握市場(chǎng),做好產(chǎn)品生產(chǎn)計(jì)劃,對(duì)過(guò)去四年的數(shù)據(jù)進(jìn)行整
理得到了第x年與年銷售量y(單位:萬(wàn)件)之間的關(guān)系如下表:
X1234
y12284256
(1)在圖中畫出表中數(shù)據(jù)的散點(diǎn)缸
tw萬(wàn)件
60
5()
40
30
20
1()
o\i234
(2)根據(jù)散點(diǎn)圖選擇合適的回歸模型擬合y與x的關(guān)系(不必說(shuō)明理由);
(3)建立y關(guān)于x的回歸方程,預(yù)測(cè)第5年的銷售量.
參考公式:回歸直線x的斜率和截距的最小二乘估計(jì)分別為
2(看一工)(y-亍)£①3i—nxy
?=I1
A—x)2*—TlNa-a-
b=i=1i=ia=y-bx.
解(1)作出的散點(diǎn)圖如圖:
t"萬(wàn)件
6().
50-
40■,
20-
10-,
"O|~1234
(2)根據(jù)散點(diǎn)圖觀察,可以用線性回歸模型擬合y與x的關(guān)系.
(3)觀察(1)中散點(diǎn)圖可知各點(diǎn)大致分布在一條直線附近,列出表格:,
iXiXi孫
1112112
2228456
33429126
445616224
E1013830418
可得尤-=宗569
產(chǎn)不
4)亍
i=l569
418-4X^Xy_
AS7^—4T273
所以方=i1'
30-4蜀25
片『屋增‘義|=—2.
A73
故回歸直線方程為y=下一2.
A73
當(dāng)尸5時(shí),尸亍X5—2=7L
故預(yù)測(cè)第5年的銷售量大約為71萬(wàn)件.
B級(jí)能力提升
12.在吸煙與患肺癌這兩個(gè)分類變量的獨(dú)立性檢驗(yàn)的計(jì)算中,下列說(shuō)法正確的是
()
A.若/=6.635,在犯錯(cuò)誤的概率不超過(guò)0.01的前提下認(rèn)為吸煙與患肺癌有關(guān)系,
那么在100個(gè)吸煙的人中必有99人患有肺癌
B.由獨(dú)立性檢驗(yàn)可知,在犯錯(cuò)誤的概率不超過(guò)0.01的前提下認(rèn)為吸煙與患肺癌
有關(guān)系時(shí),我們說(shuō)某人吸煙,那么他有99%的可能患有肺癌
C.若從統(tǒng)計(jì)量中求出在犯錯(cuò)誤的概率不超過(guò)0.01的前提下認(rèn)為吸
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司并購(gòu)案例分析 吉利 沃爾沃
- 學(xué)練優(yōu)秋季版七年級(jí)道德與法治下冊(cè)1.3.2青
- 古詩(shī)詞誦讀《靜女》課件 2024-2025學(xué)年統(tǒng)編版高中語(yǔ)文必修上冊(cè)
- 2025屆河南省新鄉(xiāng)市第三中學(xué)高考語(yǔ)文五模試卷含解析
- 2025屆四川省成都外國(guó)語(yǔ)高級(jí)中學(xué)高三第一次調(diào)研測(cè)試英語(yǔ)試卷含解析
- 2025屆內(nèi)蒙古包頭六中高三下學(xué)期第五次調(diào)研考試數(shù)學(xué)試題含解析
- 北京海淀外國(guó)語(yǔ)2025屆高三考前熱身英語(yǔ)試卷含解析
- 廣東省廣州市番禺區(qū)禺山中學(xué)2025屆高三二診模擬考試英語(yǔ)試卷含解析
- 廣東省五校2025屆高三適應(yīng)性調(diào)研考試語(yǔ)文試題含解析
- 八年級(jí)政治回眸傳統(tǒng)課件
- DB43-T 2955-2024 等值反磁通瞬變電磁法探測(cè)技術(shù)規(guī)范
- 湖南省矢量地圖課件模板(各市、區(qū)縣地圖-可編輯、配色)
- 二手房買賣中介服務(wù)合同
- 2024年北京大學(xué)強(qiáng)基計(jì)劃數(shù)學(xué)試卷試題真題(含答案詳解)
- 2024年二級(jí)建造師繼續(xù)教育題庫(kù)及答案(500題)
- 施工監(jiān)理工作程序方法和制度(含流程圖)
- 人教部編統(tǒng)編版小學(xué)二年級(jí)上冊(cè)道德與法治知識(shí)點(diǎn)歸納
- 《食品營(yíng)銷學(xué)》期末考試復(fù)習(xí)題庫(kù)(含答案)
- 公安警察工作匯報(bào)模板下載
- 確認(rèn)親子關(guān)系起訴狀范本合集
- 網(wǎng)絡(luò)新聞評(píng)論智慧樹知到期末考試答案章節(jié)答案2024年西南交通大學(xué)
評(píng)論
0/150
提交評(píng)論