2023版 大一輪 數(shù)學(xué) 人教A版 新教材(京津瓊魯鄂渝湘閩粵冀浙)第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第1頁(yè)
2023版 大一輪 數(shù)學(xué) 人教A版 新教材(京津瓊魯鄂渝湘閩粵冀浙)第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第2頁(yè)
2023版 大一輪 數(shù)學(xué) 人教A版 新教材(京津瓊魯鄂渝湘閩粵冀浙)第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第3頁(yè)
2023版 大一輪 數(shù)學(xué) 人教A版 新教材(京津瓊魯鄂渝湘閩粵冀浙)第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第4頁(yè)
2023版 大一輪 數(shù)學(xué) 人教A版 新教材(京津瓊魯鄂渝湘閩粵冀浙)第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第3節(jié)變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例

知識(shí)分類落實(shí)回扣知識(shí)?夯實(shí)基礎(chǔ)

知識(shí)梳理

1.變量的相關(guān)關(guān)系

(1)相關(guān)關(guān)系

兩個(gè)變量有關(guān)系,但又沒(méi)有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,

這種關(guān)系稱為相關(guān)關(guān)系.

(2)正相關(guān)、負(fù)相關(guān)

從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨勢(shì),

我們就稱這兩個(gè)變量正相關(guān);如果一個(gè)變量值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)

減少的趨勢(shì),則稱這兩個(gè)變量負(fù)相關(guān).

(3)線性相關(guān)

一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條線附近,

我們就稱這兩個(gè)變量線性相關(guān).

一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量

非線性相關(guān)或曲線相關(guān).

2.樣本相關(guān)系數(shù)

⑴相關(guān)系數(shù)r的計(jì)算

變量x和變量y的樣本相關(guān)系數(shù)r的計(jì)算公式如下:

n__

£(x(—JC)(y(—y)

①當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān);當(dāng)/<0時(shí),成對(duì)樣本數(shù)據(jù)魚相關(guān);當(dāng)/?=()

時(shí),成對(duì)樣本數(shù)據(jù)間沒(méi)有線性相關(guān)關(guān)系.

②樣本相關(guān)系數(shù)r的取值范圍為f—1,11.

當(dāng)|r|越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);

當(dāng)卜|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱.

3.一元線性回歸模型

(1)線性回歸方程與最小二乘法

我們將j=£+聯(lián)稱為y關(guān)于x的線性回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公

式,其圖形稱為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求

得的2,展叫做。,。的最小二乘估計(jì),

其中

"〃-?―

£(XLX)(?-y)S.w一欣)

Z(X/_x)2

i=1i=l

A—A—

<a=y-bx.

⑵利用相關(guān)指數(shù)W刻畫回歸效果

n

£(W)2

i=1

R2=l----------,心越大,即擬合效果越好,N越小,模型擬合效果越

n_——

£(y_y)2

z=l

差.

4.列聯(lián)表與獨(dú)立性檢驗(yàn)

⑴2X2列聯(lián)表

一般地,假設(shè)有兩個(gè)分類變量X和K它們的取值分別為{xi,及}和{6,"},其

2X2列聯(lián)表為

合計(jì)

X\aba+b

X2Cdc+d

合計(jì)a+cb+do+b+c+d

(2)臨界值

H(nd—be)2

尸(工八,、萬(wàn)?忽略/的實(shí)際分布與該近似分布的誤

A<a+b)J\c+a)(a4+c)\“b4+d)A

差后,對(duì)于任何小概率值a,可以找到相應(yīng)的正實(shí)數(shù)%,使得Pdexa):。成立.

我們稱均為a的臨界值,這個(gè)臨界值就可作為判斷Z2大小的標(biāo)準(zhǔn).

(3)獨(dú)立性檢驗(yàn)

基于小概率值a的檢驗(yàn)規(guī)則是:

當(dāng)爐2刈時(shí),我們就推斷法不成立,即認(rèn)為X和丫不獨(dú)立,該推斷犯錯(cuò)誤的概

率不超過(guò)a;

當(dāng)/〈玄時(shí),我們沒(méi)有充分證據(jù)推斷從不成立,可以認(rèn)為X和丫獨(dú)立.

這種利用Z2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為Z2獨(dú)立性檢驗(yàn),讀

作“卡方獨(dú)立性檢驗(yàn)”,簡(jiǎn)稱獨(dú)立性檢驗(yàn).

下表給出了Z2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

?—常用結(jié)論與微點(diǎn)提醒

1.求解回歸方程的關(guān)鍵是確定回歸系數(shù)展,Z,應(yīng)充分利用回歸直線過(guò)樣本點(diǎn)的中

心(尤,y).

2.根據(jù)回歸方程計(jì)算的;值,僅是一個(gè)預(yù)報(bào)值,不是真實(shí)發(fā)生的值.

3.根據(jù)爐的值可以判斷兩個(gè)分類變量有關(guān)的可信程度,若/越大,則兩分類變

量有關(guān)的把握越大.

診斷自測(cè)

??思考辨析

1.判斷下列結(jié)論正誤(在括號(hào)內(nèi)打“J”或“義”)

⑴“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)

系.()

(2)通過(guò)回歸直線方程;=晨+2可以估計(jì)預(yù)報(bào)變量的取值和變化趨勢(shì).()

(3)只有兩個(gè)變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測(cè)價(jià)值.()

(4)事件X,V關(guān)系越密切,則由觀測(cè)數(shù)據(jù)計(jì)算得到的蜉的觀測(cè)值越大.()

答案(1”(2)7(3)7(4)7

〉教材衍化

2.為調(diào)查中學(xué)生近視情況,測(cè)得某校在150名男生中有80名近視,在140名女

生中有70名近視.在檢驗(yàn)這些學(xué)生眼睛近視是否與性別有關(guān)時(shí),用下列哪種方

法最有說(shuō)服力()

A.回歸分析B.均值與方差

C.獨(dú)立性檢驗(yàn)D.概率

答案C

解析“近視”與“性別”是兩類變量,其是否有關(guān),應(yīng)用獨(dú)立性檢驗(yàn)判斷.

3.(多選題)在統(tǒng)計(jì)中,由一組樣本數(shù)據(jù)(*[,>1),。2,>2),…,(X",力)利用最小

二乘法得到兩個(gè)變量的線性回歸方程為:=£+;那么下列說(shuō)法正確的是()

A.相關(guān)系數(shù)r不可能等于1

AAA——

B.直線y=bx+a必經(jīng)過(guò)點(diǎn)(x,y)

C.直線(=£+)表示最接近y與x之間真實(shí)關(guān)系的一條直線

D.相關(guān)系數(shù)為「,且|r|越接近于1,相關(guān)程度越大;田越接近于0,相關(guān)程度越

答案BCD

解析相關(guān)系數(shù)的取值范圍是|r|Wl,故A錯(cuò)誤;直線;=£+:必過(guò)樣本點(diǎn)中心

即點(diǎn)(;,y),故B正確;直線;=£+聯(lián)是采用最小二乘法求解出的直線方程,接

近真實(shí)關(guān)系,故C正確;相關(guān)系數(shù)r的絕對(duì)值越接近于1,表示相關(guān)程度越強(qiáng),

越接近于0,相關(guān)程度越弱,故D正確.故選BCD.

>考題體驗(yàn)

4.(2020?貴陽(yáng)期末)已知關(guān)于變量x,y的線性回歸方程為<=0.25x+0.55,且x,

y的相關(guān)數(shù)據(jù)如下表所示,則表格中加的值為()

X1234

y0.8m1.41.5

A.lB.1.05C.1.2D.2

答案A

解析由題意知;="27+4=2.5,

O.8+/71+1.4+1.53.7+用

尸4,

所以樣本點(diǎn)的中心為(2.5,安竺),

3.7+機(jī)

代入線性回歸方程y=0.25x+0.55,得J—=0.25X2.5+0.55,解得m=l.

5.(2020.全國(guó)I卷)某校一個(gè)課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度

x(單位:℃)的關(guān)系,在20個(gè)不同的溫度條件下進(jìn)行種子發(fā)芽實(shí)驗(yàn),由實(shí)驗(yàn)數(shù)據(jù)

(Xi,yi)(i=l,2,…,20)得到下面的散點(diǎn)圖:

100%

80%

出60%

孤40%

203()40

由此散點(diǎn)圖,在10℃至40℃之間,下面四個(gè)回歸方程類型中最適宜作為發(fā)芽率

y和溫度x的回歸方程類型的是()

A.y=a-\~bxB.y=a+bx1

C.y=a+beD.y=a+b\nx

答案D

解析由散點(diǎn)圖可以看出,這些點(diǎn)大致分布在對(duì)數(shù)型函數(shù)的圖象附近.故選D.

6.(2020.聊城模擬)某校為了研究“學(xué)生的性別”和“對(duì)待某一活動(dòng)的態(tài)度”是

2

否有關(guān),運(yùn)用2X2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn),經(jīng)計(jì)算/=7.069,則認(rèn)為“學(xué)生性

別與支持某項(xiàng)活動(dòng)有關(guān)系”的犯錯(cuò)誤的概率不超過(guò)()

A.0.1%B.1%

C.99%D.99.9%

答案B

2

解析V/=7.O69>6.635=XO.OI,

???認(rèn)為“學(xué)生性別與支持某項(xiàng)活動(dòng)有關(guān)系”的犯錯(cuò)誤的概率不超過(guò)1%.

考點(diǎn)分層突破考點(diǎn)聚焦?題型剖析

考點(diǎn)一相關(guān)關(guān)系的判斷自主演練

1.下列四個(gè)散點(diǎn)圖中,變量x與y之間具有負(fù)的線性相關(guān)關(guān)系的是()

xO

AB

CD

答案D

解析觀察散點(diǎn)圖可知,只有D選項(xiàng)的散點(diǎn)圖表示的是變量x與y之間具有負(fù)

的線性相關(guān)關(guān)系.故選D.

2.(2020.重慶診斷)某商家今年上半年各月的人均銷售額(單位:千元)與利潤(rùn)率

統(tǒng)計(jì)表如下:

月份123456

人均銷售額658347

利潤(rùn)率(%)12.610.418.53.08.116.3

根據(jù)表中數(shù)據(jù),下列說(shuō)法正確的是()

A.利潤(rùn)率與人均銷售額成正相關(guān)關(guān)系

B.利潤(rùn)率與人均銷售額成負(fù)相關(guān)關(guān)系

C.利潤(rùn)率與人均銷售額成正比例函數(shù)關(guān)系

D.利潤(rùn)率與人均銷售額成反比例函數(shù)關(guān)系

答案A

解析由統(tǒng)計(jì)表可得利潤(rùn)率與人均銷售額不是正比例關(guān)系,也不是反比例關(guān)系,

排除C和D;其屬于正相關(guān)關(guān)系,A正確,B錯(cuò)誤.

3.(多選題)(2020?淄博模擬)2019年女排世界杯是由國(guó)際排聯(lián)(FIVB)舉辦的第13

屆世界杯賽事,比賽于2019年9月14日至9月29日在日本舉行,共有12支參

賽隊(duì)伍.最終,中國(guó)女排以11戰(zhàn)全勝且只丟3局的成績(jī)成功衛(wèi)冕本屆世界杯冠

軍.中國(guó)女排的影響力早已超越體育本身的意義,不僅是時(shí)代的集體記憶,更是

激勵(lì)國(guó)人持續(xù)奮斗、自強(qiáng)不息的精神符號(hào).以下是本屆世界杯比賽最終結(jié)果的相

關(guān)數(shù)據(jù),記每個(gè)隊(duì)的勝場(chǎng)數(shù)為變量x,積分為變量y(只列出了前6名).

排名123456

勝場(chǎng)數(shù)X11108766

積分y322823211918

若y與X之間具有線性相關(guān)關(guān)系,根據(jù)表中數(shù)據(jù)可求得y關(guān)于X的回歸直線方程

為;=2.59x+聯(lián),則下列說(shuō)法正確的有()

A.a的值為2.78

B.a的值為2.14

C.若整隊(duì)在此次比賽中獲勝的場(chǎng)數(shù)是4,根據(jù)線性回歸方程其得分為13分(精

確到整數(shù))

D.由線性回歸方程可知,當(dāng)某個(gè)隊(duì)伍勝場(chǎng)增加1時(shí),其積分約增加2.59分

答案ACD

——AAA

解析由題知,x=8,y=23.5,代入方程y=2.59x+a,計(jì)算得a=2.78,故A正

AA

確,B不正確;將x=4代入方程y=2.59x+2.78,計(jì)算得y=13.14仁13,故C正

確;回歸方程中x的系數(shù)是2.59,故D正確.

感悟升華判斷相關(guān)關(guān)系的兩種方法:

(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就

有相關(guān)關(guān)系;如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有

線性相關(guān)關(guān)系.

(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,川越趨近于1,相關(guān)性越強(qiáng).

考點(diǎn)二回歸分析多維探究

角度1線性回歸方程及應(yīng)用

【例1】下面給出了根據(jù)我國(guó)2012?2018年水果人均占有量y(單位:kg)和年份

代碼x繪制的散點(diǎn)圖和線性回歸方程的殘差圖.(2012年?2018年的年份代碼x

分別為1?7)

(

W

B我國(guó)2012年~2018年水果人均占有量散點(diǎn)圖

.1

_1?(

7(

sr1

.=16(

間15(

工14(

3(

叼1

2(

XY-1234567

年份代碼K

(

胃2我國(guó)2012年~2018年水果人均占有量殘差圖

包1

外0

1

嬴2

望1234567

年份代碼1

⑴根據(jù)散點(diǎn)圖分析y與光之間的相關(guān)關(guān)系;

77

⑵根據(jù)散點(diǎn)圖相應(yīng)數(shù)據(jù)計(jì)算得£?=1074,£X?=4517,求y關(guān)于元的線性回歸

方程;(精確到0.01)

(3)根據(jù)線性回歸方程的殘差圖,分析線性回歸方程的擬合效果.

附:回歸方程;=:+&中斜率和截距的最小二乘估計(jì)公式分別為,=

n--n—

高(為一無(wú))(%一))Y^Xiyi—nxy人_A_

-,ci~y-bx.

玄(%,—%)2Y^—nx1

解(1)從散點(diǎn)圖可以看出,這些點(diǎn)的分布整體上在一條直線附近,且當(dāng)x由小

變大時(shí),y也由小變大,

所以y與x之間具有線性相關(guān)關(guān)系,且是正相關(guān).

1+2+3+4+5+6+7.

(2)由題意可知,x==4,

1工1074

y書y尸〒,

7

£斤=12+22+32+42+52+62+72=140,

7.,、1074

人石孫一7xy4517-7X4X722J_

否_俁=-140—7X42—=而“7.89,

/=!

'-"1074

一氏r=-y—7.89X4^121.87,

A

關(guān)于x的線性回歸方程為y=7.89x+121.87.

(3)由殘差圖可以看出歷年數(shù)據(jù)的殘差均分布在一2?2之間,且圖中各點(diǎn)比較均

勻地分布在數(shù)值0所在直線附近,帶狀區(qū)域很窄,說(shuō)明對(duì)應(yīng)的回歸直線擬合效果

較好.

角度2非線性回歸方程及應(yīng)用

【例2】(2021?四川七市一診)已知某地區(qū)某種昆蟲產(chǎn)卵數(shù)和溫度有關(guān).現(xiàn)收集了

一只該品種昆蟲的產(chǎn)卵數(shù)y(個(gè))和溫度式℃)的7組觀測(cè)數(shù)據(jù),其散點(diǎn)圖如圖所示:

產(chǎn)卵數(shù)“個(gè))

30()

250

200

150*

100

-..?

5()

oL.一—::.........

1820222426283()3?23436溫度*(七)

根據(jù)散點(diǎn)圖,結(jié)合函數(shù)知識(shí),可以發(fā)現(xiàn)產(chǎn)卵數(shù)y和溫度x可用方程y=芭'+。來(lái)擬

合,令z=lny,結(jié)合樣本數(shù)據(jù)可知z與溫度x可用線性回歸方程來(lái)擬合.

根據(jù)收集到的數(shù)據(jù),計(jì)算得到如下值:

7-7一一

2£⑵-Z)2

Xyz石(Xi-X)高(X,—x)(z,—Z)

27743.53718211.946.418

表中Zj=lny”z=

⑴求z和溫度x的回歸方程(回歸系數(shù)結(jié)果準(zhǔn)確到0.001);

(2)求產(chǎn)卵數(shù)y關(guān)于溫度x的回歸方程;若該地區(qū)一段時(shí)間內(nèi)的氣溫在26℃~36℃

之間(包括26℃與36℃),估計(jì)該品種一只昆蟲的產(chǎn)卵數(shù)的范圍.(參考數(shù)據(jù)

37925832:60876342

e3.282g27,e^44fe=?341,e^440,e?=568)

AAA

附:對(duì)于一組數(shù)據(jù)(o1,Vl),(692,02),....,{(On,Vn),其回歸直線0=a+伙0

〃一一

A11((Di—CD)(Vi-V)A-A-

的斜率和截距的最小二乘估計(jì)分別為尸----------2------------,a=v-/3co.

(如一①)2

zE^l.

解(1)由題意,z和溫度尤可以用線性回歸方程擬合,設(shè);=£+;則2=

7

(X/-X)(Z/-Z)

石46.418

7心0.2550,

N(X;—X)2182

a=z-/?x=3.537—0.2550X27=-3.348,

故z關(guān)于x的線性回歸方程為z=0.255x-3.348.

(2)由(1)可得,lny=0.255x-3.348,

于是產(chǎn)卵數(shù)y關(guān)于溫度X的回歸方程為y=eO255L3.348.

當(dāng)X=26時(shí),y=e°255X26-3.348=e3282心27;

當(dāng)X=36時(shí),y=e0255x36-3.348=e5.832心341.

函數(shù)y=2255廠3.348為增函數(shù),

二氣溫在26℃?36c之間時(shí),估計(jì)該品種一只昆蟲的產(chǎn)卵數(shù)的范圍是[27,341]

內(nèi)的正整數(shù).

感悟升華回歸分析問(wèn)題的類型及解題方法

(1)求回歸方程

①根據(jù)散點(diǎn)圖判斷兩變量是否線性相關(guān),如不是,應(yīng)通過(guò)換元構(gòu)造線性相關(guān).

②利用公式,求出回歸系數(shù)

③待定系數(shù)法:利用回歸直線過(guò)樣本點(diǎn)的中心求系數(shù)。

(2)利用回歸方程進(jìn)行預(yù)測(cè),把線性回歸方程看作一次函數(shù),求函數(shù)值.

(3)利用回歸直線判斷正、負(fù)相關(guān),決定正相關(guān)還是負(fù)相關(guān)的是系數(shù)江

(4)回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)川越趨近于1時(shí),兩變量的

線性相關(guān)性越強(qiáng).

【訓(xùn)練1】(2021.榆林模擬)根據(jù)統(tǒng)計(jì),某蔬菜基地西紅柿畝產(chǎn)量的增加量y(百千

克)與某種液體肥料每畝使用量M千克)之間的對(duì)應(yīng)數(shù)據(jù)的散點(diǎn)圖如圖所示:

>(百千克)

7---------------------------?

6------------------?;

5----------------;;

4-------?;::

3------?:::;

°2456?支(千克)

(1)依據(jù)數(shù)據(jù)的散點(diǎn)圖可以看出,可用線性回歸模型擬合y與X的關(guān)系,請(qǐng)計(jì)算相

關(guān)系數(shù)并加以說(shuō)明(若力>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合);

(2)求y關(guān)于x的回歸方程,并預(yù)測(cè)液體肥料每畝使用量為12千克時(shí),西紅柿畝

產(chǎn)量的增加量約為多少.

t(xi—x)(y-y)

附:相關(guān)系數(shù)/■二歸工2圖%一旅

n

回歸直線(=Z*+2的斜率和截距的最小二乘估計(jì)分別為,=

a=y-bx.

占Cxi-x)2

2+4+5+6+8-34-4+5+6+7

解(l)x==5,y==5.

石(x,—x)(y/-y)=(-3)X(-2)+(-1)X(-1)+OXO+1X1+3X2=14,

£(x,—X)2=(-3)2+(-1)2+02+12+32=20,

5一

玄(y1—y)2=(-2)2+(-I)2+O2+I2+22=IO.

14_7J2

._:?(電一五)2,£(沙一()2V20XVw10

,.r—7m「i>0.75,

...可用線性回歸模型擬合y與x的關(guān)系.

5-

八g(為—x)(?一?。?4

(2)A—5~~on-0.7,

2

目11(劉一x)

則。=了一"=5—0.7義5=1.5,

Ay=0.7x+1.5.

A

當(dāng)x=12時(shí),y=0.7X12+1.5=9.9,

???預(yù)測(cè)液體肥料每畝使用量為12千克時(shí),西紅柿畝產(chǎn)量的增加量約為9.9百千

克.

考點(diǎn)三獨(dú)立性檢驗(yàn)師生共研

【例31(2020.全國(guó)III卷)某學(xué)生興趣小組隨機(jī)調(diào)查了某市100天中每天的空氣

質(zhì)量等級(jí)和當(dāng)天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):

煉人次

空氣質(zhì)量等^[0,200](200,400](400,600]

1(優(yōu))21625

2(良)51012

3(輕度污染)678

4(中度污染)720

(1)分別估計(jì)該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率;

(2)求一天中到該公園鍛煉的平均人次的估計(jì)值(同一組中的數(shù)據(jù)用該組區(qū)間的中

點(diǎn)值為代表);

(3)若某天的空氣質(zhì)量等級(jí)為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)

量等級(jí)為3或4,則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的2X2

列聯(lián)表,并根據(jù)列聯(lián)表,能否在犯錯(cuò)誤的概率不超過(guò)0.05的前提下,認(rèn)為一天

中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān)?

人次近400人次>400

空氣質(zhì)量好

空氣質(zhì)量不好

n(ad-be)2

(a+Z?)(c+d)(a+c)(b+d)'

a0.0500.0100.001

Xa3.8416.63510.828

解(1)由所給數(shù)據(jù),得該市一天的空氣質(zhì)量等級(jí)為1,2,3,4的概率的估計(jì)值

如下表:

空氣質(zhì)量等級(jí)1234

概率的估計(jì)值0.430.270.210.09

(2)一天中到該公園鍛煉的平均人次的估計(jì)值為

?^(100X20+300X35+500X45)=350.

(3)根據(jù)所給數(shù)據(jù),可得2X2列聯(lián)表:

人次W400人次>400

空氣質(zhì)量好3337

空氣質(zhì)量不好228

零假設(shè)為Ho:

一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量無(wú)關(guān).

根據(jù)列聯(lián)表得

,100X(33X8-22X37)2

工=55X45X70X30^5.820>3.841=%.

根據(jù)小概率值a=0.050的/獨(dú)立性檢驗(yàn),可推斷Ho不成立,所以在犯錯(cuò)誤的概

率不超過(guò)0.05的前提下,可認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣

質(zhì)量有關(guān).

感悟升華1.在2X2列聯(lián)表中,如果兩個(gè)變量沒(méi)有關(guān)系,則應(yīng)滿足"一次七0.園

一反|越小,說(shuō)明兩個(gè)變量之間關(guān)系越弱;園一陽(yáng)越大,說(shuō)明兩個(gè)變量之間關(guān)系

越強(qiáng).

2.解決獨(dú)立性檢驗(yàn)的應(yīng)用問(wèn)題,一定要按照獨(dú)立性檢驗(yàn)的步驟得出結(jié)論.獨(dú)立性檢

驗(yàn)的一般步驟:

(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表:

-2,〃(ad-be)-_

(2)根據(jù)么式/=Q+MQ+C)(b+d)(c+d)計(jì)算/;

(3)通過(guò)比較/與臨界值的大小關(guān)系來(lái)作統(tǒng)計(jì)推斷.

【訓(xùn)練2]為了探究學(xué)生選報(bào)文、理科是否與對(duì)外語(yǔ)的興趣有關(guān),某同學(xué)調(diào)查

了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科生對(duì)外語(yǔ)有興趣的有138人,無(wú)興

趣的有98人,文科生對(duì)外語(yǔ)有興趣的有73人,無(wú)興趣的有52人.試分析學(xué)生選

報(bào)文、理科與對(duì)外語(yǔ)的興趣是否有關(guān)?

解零假設(shè)為法:選報(bào)文、理科與對(duì)外語(yǔ)的興趣無(wú)關(guān).

列出2X2列聯(lián)表

理文合計(jì)

有興趣13873211

無(wú)興趣9852150

合計(jì)236125361

代入公式得

,361X(138X52—73X98)】

工=236X125X211X150

V1.871X1O^4<2.7O6=XO.I,

根據(jù)小概率值a=0.1的三獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷“o不成立,即選報(bào)文、

理科與對(duì)外語(yǔ)的興趣無(wú)關(guān).

課后鞏固作業(yè)分層訓(xùn)練?提升能力

A級(jí)基礎(chǔ)鞏固

一、選擇題

1.對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正

確的是()

()51()1520253()35°51()1520253035

相關(guān)系數(shù)為。相關(guān)系數(shù)為七

(1)(2)

051()1520253035051()1520253035

相關(guān)系數(shù)為匚1相關(guān)系數(shù)為口

(3)(4)

A.-2<-4<0<r3<〃B.r4<f2<0<n<r3

C-r4<r2<0<r3<nD.r2<^4<0<n<r3

答案A

解析由散點(diǎn)圖知圖(1)與圖(3)是正相關(guān),故n>0,r3>0,圖(2)與圖(4)是負(fù)相關(guān),

故r2<0,r4<0,且圖⑴與圖(2)的樣本點(diǎn)集中在一條直線附近,因此r2<r4<0<r3<n,

故選A.

2.有下列說(shuō)法:①在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說(shuō)

明選用的模型比較合適;②用相關(guān)指數(shù)R2來(lái)刻畫回歸的效果,火2值越接近于1,

說(shuō)明模型的擬合效果越好;③比較兩個(gè)模型的擬合效果,可以比較殘差平方和的

大小,殘差平方和越小的模型,擬合效果越好.正確的是()

A.①②B.②③C.①③D.①②③

答案D

3.(多選題)(2020.棗莊模擬)某大學(xué)為了解學(xué)生對(duì)學(xué)校食堂服務(wù)的滿意度,隨機(jī)調(diào)

查了50名男生和50名女生,每位學(xué)生對(duì)食堂的服務(wù)給出滿意或不滿意的評(píng)價(jià),

得到如下所示的列聯(lián)表,經(jīng)計(jì)算小心4.762,則可以推斷出()

滿意不滿意

男3020

女4010

a0.1000.0500.010

Xa2.7063.8416.635

3

A.該學(xué)校男生對(duì)食堂服務(wù)滿意的概率的估計(jì)值為;

B.調(diào)研結(jié)果顯示,該學(xué)校男生比女生對(duì)食堂服務(wù)更滿意

C.認(rèn)為男、女生對(duì)該食堂服務(wù)的評(píng)價(jià)有差異此推斷犯錯(cuò)誤的概率不超過(guò)0.05

D.認(rèn)為男、女生對(duì)該食堂服務(wù)的評(píng)價(jià)有差異此推斷犯錯(cuò)誤的概率不超過(guò)0.01

答案AC

303

解析對(duì)于選項(xiàng)A,該學(xué)校男生對(duì)食堂服務(wù)滿意的概率的估計(jì)值為就用=巳

INV/J

故A正確;

對(duì)于選項(xiàng)B,該學(xué)校女生對(duì)食堂服務(wù)滿意的概率的估計(jì)值為4常0行=々4>與3,故B

錯(cuò)誤;

因?yàn)?心4.762>3.841=處05,認(rèn)為男、女生對(duì)該食堂服務(wù)的評(píng)價(jià)有差異,此推

斷犯錯(cuò)誤的概率不超過(guò)0.05,故C正確,D錯(cuò)誤.

4.(多選題)(2021.武漢調(diào)研)已知某產(chǎn)品的銷售額y(單位:萬(wàn)元)與廣告費(fèi)用x(單

位:萬(wàn)元)之間的關(guān)系如下表:

x(單位:萬(wàn)元)01234

y(單位:萬(wàn)元)1015m3035

若根據(jù)表中的數(shù)據(jù)用最小二乘法求得),與x的回歸直線方程為;=6.5x+9,則下

列說(shuō)法中正確的是()

A.產(chǎn)品的銷售額與廣告費(fèi)用成正相關(guān)

B.該回歸直線過(guò)點(diǎn)(2,22)

C.當(dāng)廣告費(fèi)用為10萬(wàn)元時(shí),銷售額一定為74萬(wàn)元

D.初的值是20

答案ABD

解析由線性回歸方程;=6.5尤+9中的回歸系數(shù)6.5〉0,可知產(chǎn)品的銷售額與廣

告費(fèi)用成正相關(guān),故A中的說(shuō)法正確;

0+1+2+3+4-10+15+ni+30+3590+mA

尤=5=2,y=5=——代入y=6.5x+9,得

90|YY\.

-^―=6.5X2+9,解得加=20,故D中的說(shuō)法正確;

90+加90+20

不一=—?—=22,則該回歸直線過(guò)點(diǎn)(2,22),故B中的說(shuō)法正確A;

當(dāng)x=10時(shí),>=6.5X10+9=74,說(shuō)明當(dāng)廣告費(fèi)用為10萬(wàn)元時(shí),銷售額預(yù)計(jì)為

74萬(wàn)元,故C中的說(shuō)法錯(cuò)誤.故選ABD.

5.(多選題)(2021.廣東百校聯(lián)考)下表是我國(guó)某城市在2019年1月份至10月份

期間各月最低溫度與最高溫度(單位:。C)的數(shù)據(jù)一覽表.

月份12345678910

最高溫

59911172427303121

度/℃

最低溫

-12-31-271719232510

度/℃

已知該城市的各月最低溫度與最高溫度具有相關(guān)關(guān)系,根據(jù)該一覽表,則下列結(jié)

論正確的是()

A.最低溫度與最高溫度為正相關(guān)

B.每月最高溫度與最低溫度的平均值在前8個(gè)月逐月增加

C.月溫差(最高溫度減最低溫度)的最大值出現(xiàn)在1月

D.1月至4月的月溫差(最高溫度減最低溫度)相對(duì)于7月至10月,波動(dòng)性更大

答案ACD

解析將最高溫度、最低溫度、溫差列表如下:

月份12345678910

最高溫

59911172427303121

度/℃

最低溫-12-31-271719232510

度/℃

溫差

171281310787611

度/℃

由表格可知,最低溫度大致隨最高溫度的升高而升高,A正確;

每月最高溫度與最低溫度的平均值在前8個(gè)月不是逐月增加,B錯(cuò)誤;

月溫差的最大值出現(xiàn)在1月,C正確;

1月至4月的月溫差相對(duì)于7月至10月,波動(dòng)性更大,D正確.

6.2018世界特色魅力城市200強(qiáng)新鮮出爐,包括黃山市在內(nèi)的28個(gè)中國(guó)城市入

選,美麗的黃山風(fēng)景和人文景觀迎來(lái)眾多賓客.現(xiàn)在很多人喜歡“自助游”,某

調(diào)查機(jī)構(gòu)為了了解“自助游”是否與性別有關(guān),在黃山旅游節(jié)期間,隨機(jī)抽取了

100人,得如下所示的列聯(lián)表:

贊成“自助游”不贊成“自助游”總計(jì)

男性301545

女性451055

總計(jì)7525100

公上八a,nQad-bc)2

參考公式:兄=(c++(〃+c)(b+d),其中〃=a+,+c+”

a0.150.100.050.0250.0100.0050.001

2.0722.7063.8415.0246.6357.87910.828

Xa

參照公式,得到的正確結(jié)論是()

A.有99.5%以上的把握認(rèn)為“贊成'自助游'與性別無(wú)關(guān)”

B.有99.5%以上的把握認(rèn)為“贊成'自助游'與性別有關(guān)”

C.在犯錯(cuò)誤的概率不超過(guò)0.1的前提下,認(rèn)為“贊成'自助游'與性別無(wú)關(guān)”

D.在犯錯(cuò)誤的概率不超過(guò)0.1的前提下,認(rèn)為“贊成‘自助游'與性別有關(guān)”

答案D

解析將2X2列聯(lián)表中的數(shù)據(jù)代入計(jì)算,得

43zxJJ/J/XZD

^3.030>2.706=X()J,

...在犯錯(cuò)誤的概率不超過(guò)0.1的前提下,可以認(rèn)為“贊成‘自助游’與性別有

二'填空題

7.已知x和y的散點(diǎn)圖如圖所示,在相關(guān)關(guān)系中,若用y=ciec2X擬合時(shí)的相關(guān)

指數(shù)為品用;=£+聯(lián)擬合時(shí)的相關(guān)指數(shù)為臉則冊(cè)虺中較大的是.

y

3(XX)"■

2500?

2000*

15(X)?

1(XX)??.

5(X),..

012345678910x

答案/?T

解析由散點(diǎn)圖知,用y=aec>擬合的效果比擬合的效果要好,所以

7?T>/?2,故較大者為此.

8.在一次對(duì)人體脂肪含量和年齡的關(guān)系的研究中,研究人員獲得了一組樣本數(shù)

據(jù),并制成如圖所示的人體脂肪含量與年齡的關(guān)系的散點(diǎn)圖,下列結(jié)論中正確的

是(填序號(hào)).

脂肪含量/%

35

30■??

25■??

2()?

10?

一?

5?

口1520253()3540455()5560年齡/歲

①人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)等于20%;

②人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于20%;

③人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)等于20%;

④人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)小于20%.

答案②

解析觀察圖形,可知人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于

20%.

9.某醫(yī)療研究所為了檢驗(yàn)?zāi)撤N血清預(yù)防感冒的作用,把500名使用血清的人與另

外500名未使用血清的人一年中的感冒記錄作比較,提出假設(shè)”0:“這種血清

不能起到預(yù)防感冒的作用”,利用2X2列聯(lián)表計(jì)算得三q3.918,經(jīng)查臨界值表

知孫.05=3.841.則下列結(jié)論中,正確結(jié)論的序號(hào)是.

①認(rèn)為“這種血清能起到預(yù)防感冒的作用”犯錯(cuò)誤的概率不超過(guò)0.05;②若某人

未使用該血清,那么他在一年中有95%的可能性得感冒;③這種血清預(yù)防感冒的

有效率為95%;④這種血清預(yù)防感冒的有效率為5%.

答案①

解析Z2^3.918^3.841=X(),()5,所以認(rèn)為“這種血清能起到預(yù)防感冒的作用”,

這種推斷犯錯(cuò)誤的概率不超過(guò)0.05.要注意我們檢驗(yàn)的是假設(shè)是否成立和該血清

預(yù)防感冒的有效率是沒(méi)有關(guān)系的,不是同一個(gè)問(wèn)題,不要混淆.

三'解答題

10.(2020.全國(guó)H卷)某沙漠地區(qū)經(jīng)過(guò)治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)

量有所增加.為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地

塊,從這些地塊中用簡(jiǎn)單隨機(jī)抽樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)

據(jù)⑶,y)(i=l,2,…,20),其中劉和y?分別表示第i個(gè)樣區(qū)的植物覆蓋面積(單

202020

位:公頃)和這種野生動(dòng)物的數(shù)量,并計(jì)算得£為=60,£?=1200,£(Xi-X)2

20-20--

2

=80,£(y(—y)=9000,E.(x,—x)(y/—y)=800.

(1)求該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值(這種野生動(dòng)物數(shù)量的估計(jì)值等于樣區(qū)這

種野生動(dòng)物數(shù)量的平均數(shù)乘以地塊數(shù));

(2)求樣本?,y,)(z=l,2,…,20)的相關(guān)系數(shù)(精確到0.01);

(3)根據(jù)現(xiàn)有統(tǒng)計(jì)資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性

以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì),請(qǐng)給出一種你認(rèn)為更合理的抽樣

方法,并說(shuō)明理由.

n一

X(即一x)(y—y)

附:相關(guān)系數(shù)r=j:.,:.一,6七1.414.

(XLX)(%一丁)2

-120

解(1)由已知得樣本平均數(shù)曠=m1>=60,從而該地區(qū)這種野生動(dòng)物數(shù)量的估

計(jì)值為60X200=12000.

(2)樣本⑶,%)(i=l,2,…,20)的相關(guān)系數(shù)

20--

石(為一x)(M—y)8002/八、

?2y(工一^80X900?!?七?4.

2高(為一》)(y,一y)丫

(3)分層抽樣:根據(jù)植物覆蓋面積的大小對(duì)地塊分層,再對(duì)200個(gè)地塊進(jìn)行分層

抽樣.

理由如下:由(2)知各樣區(qū)的這種野生動(dòng)物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān)

性.由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動(dòng)物數(shù)量差異

也很大,采用分層抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高

了樣本的代表性,從而可以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì).

11.某公司為了準(zhǔn)確地把握市場(chǎng),做好產(chǎn)品生產(chǎn)計(jì)劃,對(duì)過(guò)去四年的數(shù)據(jù)進(jìn)行整

理得到了第x年與年銷售量y(單位:萬(wàn)件)之間的關(guān)系如下表:

X1234

y12284256

(1)在圖中畫出表中數(shù)據(jù)的散點(diǎn)缸

tw萬(wàn)件

60

5()

40

30

20

1()

o\i234

(2)根據(jù)散點(diǎn)圖選擇合適的回歸模型擬合y與x的關(guān)系(不必說(shuō)明理由);

(3)建立y關(guān)于x的回歸方程,預(yù)測(cè)第5年的銷售量.

參考公式:回歸直線x的斜率和截距的最小二乘估計(jì)分別為

2(看一工)(y-亍)£①3i—nxy

?=I1

A—x)2*—TlNa-a-

b=i=1i=ia=y-bx.

解(1)作出的散點(diǎn)圖如圖:

t"萬(wàn)件

6().

50-

40■,

20-

10-,

"O|~1234

(2)根據(jù)散點(diǎn)圖觀察,可以用線性回歸模型擬合y與x的關(guān)系.

(3)觀察(1)中散點(diǎn)圖可知各點(diǎn)大致分布在一條直線附近,列出表格:,

iXiXi孫

1112112

2228456

33429126

445616224

E1013830418

可得尤-=宗569

產(chǎn)不

4)亍

i=l569

418-4X^Xy_

AS7^—4T273

所以方=i1'

30-4蜀25

片『屋增‘義|=—2.

A73

故回歸直線方程為y=下一2.

A73

當(dāng)尸5時(shí),尸亍X5—2=7L

故預(yù)測(cè)第5年的銷售量大約為71萬(wàn)件.

B級(jí)能力提升

12.在吸煙與患肺癌這兩個(gè)分類變量的獨(dú)立性檢驗(yàn)的計(jì)算中,下列說(shuō)法正確的是

()

A.若/=6.635,在犯錯(cuò)誤的概率不超過(guò)0.01的前提下認(rèn)為吸煙與患肺癌有關(guān)系,

那么在100個(gè)吸煙的人中必有99人患有肺癌

B.由獨(dú)立性檢驗(yàn)可知,在犯錯(cuò)誤的概率不超過(guò)0.01的前提下認(rèn)為吸煙與患肺癌

有關(guān)系時(shí),我們說(shuō)某人吸煙,那么他有99%的可能患有肺癌

C.若從統(tǒng)計(jì)量中求出在犯錯(cuò)誤的概率不超過(guò)0.01的前提下認(rèn)為吸

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論