2025年高考數(shù)學(xué)必刷題分類:第84講、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(教師版)_第1頁
2025年高考數(shù)學(xué)必刷題分類:第84講、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(教師版)_第2頁
2025年高考數(shù)學(xué)必刷題分類:第84講、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(教師版)_第3頁
2025年高考數(shù)學(xué)必刷題分類:第84講、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(教師版)_第4頁
2025年高考數(shù)學(xué)必刷題分類:第84講、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(教師版)_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第84講成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

知識(shí)梳理

知識(shí)點(diǎn)一、變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相

關(guān)關(guān)系.由于相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重

要的作用.我們可以通過收集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)

律,對(duì)它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種

確定的關(guān)系,而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨

關(guān)系.

2、散點(diǎn)圖

將樣本中的n個(gè)數(shù)據(jù)點(diǎn)(xi,yi)(i1,2,,n)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)

圖.根據(jù)散點(diǎn)圖中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.

(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)

關(guān)系,我們將它稱為正相關(guān),如圖(1)所示;

(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)

關(guān)系,我們將它稱為負(fù)相關(guān),如圖(2)所示.

3、相關(guān)系數(shù)

若相應(yīng)于變量x的取值xi,變量y的觀測(cè)值為yi(1in),則變量x與y的相關(guān)系數(shù)

nn

(xix)(yiy)xiyinxy

ri1i1,通常用r來衡量x與y之間的線性

nnnn

222222

(xix)(yiy)xinxyiny

i1i1i1i1

關(guān)系的強(qiáng)弱,r的范圍為1r1.

(1)當(dāng)r0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r0時(shí),表示兩個(gè)變量負(fù)相關(guān).

(2)r越接近1,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);r越接近0,表示兩個(gè)變量間幾

乎不存在線性相關(guān)關(guān)系.當(dāng)|r|1時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.

(3)通常當(dāng)r0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.

知識(shí)點(diǎn)二、線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程ybxa

的求法為

nn

(xix)(yiy)xiyinxy

i1i1

bnn

222

(xix)xinx

i1i1

aybx

nn

其中,1,1,(,)稱為樣本點(diǎn)的中心.

xxiyyixy

ni1ni1

2、殘差分析

對(duì)于預(yù)報(bào)變量y,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值yi,通過回歸方程得到的y稱為預(yù)

測(cè)值,觀測(cè)值減去預(yù)測(cè)值等于殘差,e?i稱為相應(yīng)于點(diǎn)(xi,yi)的殘差,即有e?iyiy?i.殘差

是隨機(jī)誤差的估計(jì)結(jié)果,通過對(duì)殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)

中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.

(1)殘差圖

通過殘差分析,殘差點(diǎn)xi,e?i比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較

合適,其中這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

n

()通過殘差平方和2分析,如果殘差平方和越小,則說明選用的模型

2Q(yiy?i)

i1

的擬合效果越好;反之,不合適.

(3)相關(guān)指數(shù)

n

2

(yiy?i)

用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:2i1.

R1n

2

(yiy)

i1

R2越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

知識(shí)點(diǎn)三、非線性回歸

解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元

將陌生的非線性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.

求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方

程系數(shù),還原后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測(cè),注意計(jì)算要細(xì)心,

避免計(jì)算錯(cuò)誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;

(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非

線性關(guān)系);

(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用

反比例函數(shù)、二次函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、冪函數(shù)模型等);

(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;

(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型

是否合適等.

知識(shí)點(diǎn)四、獨(dú)立性檢驗(yàn)

1、分類變量和列聯(lián)表

(1)分類變量:

變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.

②2×2列聯(lián)表.

一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣

本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為

y1y2總計(jì)

x1abab

x2cdcd

nabcd

總計(jì)acbd

ac

從22列表中,依據(jù)與的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.

abcd

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等

高條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征.

ac

(2)觀察等高條形圖發(fā)現(xiàn)與相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.

abcd

3、獨(dú)立性檢驗(yàn)

n(adbc)2

計(jì)算隨機(jī)變量2利用2的取值推斷分類變量X和Y是否獨(dú)

(ab)(cd)(ac)(bd)

立的方法稱為χ2獨(dú)立性檢驗(yàn).

0.100.050.0100.0050.001

x2.7063.8416.6357.87910.828

【解題方法總結(jié)】

常見的非線性回歸模型

(1)指數(shù)函數(shù)型ycax(a0且a1,c0)

兩邊取自然對(duì)數(shù),lnylncax,即lnylncxlna,

ylny

令,原方程變?yōu)閥lncxlna,然后按線性回歸模型求出lna,lnc.

xx

(2)對(duì)數(shù)函數(shù)型yblnxa

yy

令,原方程變?yōu)閥bxa,然后按線性回歸模型求出b,a.

xlnx

(3)冪函數(shù)型yaxn

兩邊取常用對(duì)數(shù),lgylgaxn,即lgynlgxlga,

ylgy

令,原方程變?yōu)閥nxlga,然后按線性回歸模型求出n,lga.

xlgx

(4)二次函數(shù)型ybx2a

yy

令,原方程變?yōu)?,然后按線性回歸模型求出,.

2ybxaba

xx

b

(5)反比例函數(shù)型ya型

x

yy

令1,原方程變?yōu)閥bxa,然后按線性回歸模型求出b,a.

x

x

必考題型全歸納

題型一:變量間的相關(guān)關(guān)系

例1.(2024·河北·高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度

最高的是()

A.B.

C.D.

【答案】D

【解析】用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明這

樣的模型比較合適,

帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,顯然D選項(xiàng)的擬合精度最高.

故選:D.

例2.(2024·天津薊州·高三??奸_學(xué)考試)對(duì)兩個(gè)變量x,y進(jìn)行線性相關(guān)檢驗(yàn),得線性相

關(guān)系數(shù)r10.8995,對(duì)兩個(gè)變量u,v進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)r20.9568,則

下列判斷正確的是()

A.變量x與y正相關(guān),變量u與v負(fù)相關(guān),變量x與y的線性相關(guān)性較強(qiáng)

B.變量x與y負(fù)相關(guān),變量u與v正相關(guān),變量x與y的線性相關(guān)性較強(qiáng)

C.變量x與y正相關(guān),變量u與v負(fù)相關(guān),變量u與v的線性相關(guān)性較強(qiáng)

D.變量x與y負(fù)相關(guān),變量u與v正相關(guān),變量u與v的線性相關(guān)性較強(qiáng)

【答案】C

【解析】因?yàn)榫€性相關(guān)系數(shù)r10.89950,所以x,y正相關(guān),

因?yàn)榫€性相關(guān)系數(shù)r20.95680,所以u(píng),v負(fù)相關(guān),

又因?yàn)閞1r2,所以變量u,v的線性相關(guān)性比x,y的線性相關(guān)性強(qiáng),

故A、B、D錯(cuò)誤,C正確.

故選:C.

例3.(2024·寧夏吳忠·高三鹽池高級(jí)中學(xué)??茧A段練習(xí))在如圖所示的散點(diǎn)圖中,若去掉點(diǎn)

P,則下列說法正確的是()

A.樣本相關(guān)系數(shù)r變大

B.變量x與變量y的相關(guān)程度變?nèi)?/p>

C.變量x與變量y呈正相關(guān)

D.變量x與變量y的相關(guān)程度變強(qiáng)

【答案】D

【解析】由散點(diǎn)圖知,自變量x與因變量y呈負(fù)相關(guān),即r0,故C錯(cuò)誤;

去掉點(diǎn)P后,r進(jìn)一步接近1,所以r變小,故A錯(cuò)誤;

去掉點(diǎn)P后,y與x的線性相關(guān)加強(qiáng),即相關(guān)程度變強(qiáng),故B錯(cuò)誤,D正確.

故選:D.

變式1.(2024·四川成都·高三統(tǒng)考階段練習(xí))已知建筑地基沉降預(yù)測(cè)對(duì)于保證施工安全,實(shí)

現(xiàn)信息化監(jiān)控有著重要意義.某工程師建立了四個(gè)函數(shù)模型來模擬建筑地基沉降隨時(shí)間的變

化趨勢(shì),并用相關(guān)指數(shù)、誤差平方和、均方根值三個(gè)指標(biāo)來衡量擬合效果.相關(guān)指數(shù)越接近

1表明模型的擬合效果越好,誤差平方和越小表明誤差越小,均方根值越小越好.依此判斷

下面指標(biāo)對(duì)應(yīng)的模型擬合效果最好的是()

A.

相關(guān)指數(shù)誤差平方和均方根值

0.9498.4910.499

B.

相關(guān)指數(shù)誤差平方和均方根值

0.9334.1790.436

C.

相關(guān)指數(shù)誤差平方和均方根值

0.9971.7010.141

D.

相關(guān)指數(shù)誤差平方和均方根值

0.9972.8990.326

【答案】C

【解析】相關(guān)指數(shù)越接近于1,擬合效果越好,比較相關(guān)指數(shù)知,可選C,D,

誤差平方和及均方根值都越小,擬合效果越好,觀察誤差平方和和均方根值,知C的擬合

效果最好.

故選:C.

變式2.(2024·高三課時(shí)練習(xí))甲、乙、丙、丁四位同學(xué)各自對(duì),A,B兩變量的線性相關(guān)

性做試驗(yàn),并用回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表:

甲乙丙丁

r0.820.780.690.85

m106115124103

則能體現(xiàn)A,B兩變量有更強(qiáng)的線性相關(guān)性的是()

A.甲B.乙C.丙D.丁

【答案】D

【解析】在驗(yàn)證兩個(gè)變量之間的線性相關(guān)關(guān)系中,相關(guān)系數(shù)的絕對(duì)值越接近于1,相關(guān)性越

強(qiáng),

在四個(gè)選項(xiàng)中只有丁的相關(guān)系數(shù)最大,

殘差平方和越小,相關(guān)性越強(qiáng),只有丁的殘差平方和最小,

綜上可知丁的試驗(yàn)結(jié)果體現(xiàn)A、B兩變量有更強(qiáng)的線性相關(guān)性,

故選:D.

變式3.(2024·河北石家莊·統(tǒng)考三模)觀察下列四幅殘差圖,滿足一元線性回歸模型中對(duì)隨

機(jī)誤差的假定的是()

A.

B.

C.

D.

【答案】B

【解析】根據(jù)一元線性回歸模型中對(duì)隨機(jī)誤差e的假定,殘差應(yīng)是均值為0、方差為2的隨

機(jī)變量的觀測(cè)值.

對(duì)于A選項(xiàng),殘差與觀測(cè)時(shí)間有線性關(guān)系,故A錯(cuò);

對(duì)于B選項(xiàng),殘差比較均勻地分布在以取值為0的橫軸為對(duì)稱軸的水平帶狀區(qū)域內(nèi);故B

正確;

對(duì)于C選項(xiàng),殘差與觀測(cè)時(shí)間有非線性關(guān)系,故C錯(cuò);

對(duì)于D選項(xiàng),殘差的方差不是一個(gè)常數(shù),隨著觀測(cè)時(shí)間變大而變大,故D錯(cuò).

故選:B.

變式4.(2024·全國·高三專題練習(xí))甲、乙、丙、丁四位同學(xué)分別對(duì)一組變量進(jìn)行線性相關(guān)

試驗(yàn),并分別計(jì)算出相關(guān)系數(shù)r,則線性相關(guān)程度最高的是()

甲乙丙丁

r0.870.910.580.83

A.甲B.乙C.丙D.丁

【答案】B

【解析】因?yàn)橄嚓P(guān)系數(shù)r越大,線性相關(guān)程度越強(qiáng),

所以線性相關(guān)程度最高的是乙.

故選:B

變式5.(2024·全國·高三專題練習(xí))給出下列有關(guān)線性回歸分析的四個(gè)命題:

①線性回歸直線未必過樣本數(shù)據(jù)點(diǎn)的中心(x,y);

②回歸直線就是散點(diǎn)圖中經(jīng)過樣本數(shù)據(jù)點(diǎn)最多的那條直線;

③當(dāng)相關(guān)系數(shù)r0時(shí),兩個(gè)變量正相關(guān);

④如果兩個(gè)變量的相關(guān)性越強(qiáng),則相關(guān)系數(shù)r就越接近于1.

其中真命題的個(gè)數(shù)為()

A.1B.2C.3D.4

【答案】A

【解析】對(duì)于①,線性回歸直線一定過樣本數(shù)據(jù)點(diǎn)的中心(x,y),故①錯(cuò)誤;

對(duì)于②,回歸直線在散點(diǎn)圖中可能不經(jīng)過任何一個(gè)樣本數(shù)據(jù)點(diǎn),故②錯(cuò)誤;

對(duì)于③,當(dāng)相關(guān)系數(shù)r0時(shí),兩個(gè)變量正相關(guān),故③正確;

對(duì)于④,如果兩個(gè)變量的相關(guān)性越強(qiáng),則相關(guān)性系數(shù)r就越接近于1或1,故④錯(cuò)誤.

故真命題的個(gè)數(shù)為1,

故選:A.

【解題方法總結(jié)】

判定兩個(gè)變量相關(guān)性的方法

(1)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到

右下角,兩個(gè)變量負(fù)相關(guān).

(2)樣本相關(guān)系數(shù):當(dāng)r>0時(shí),正相關(guān);當(dāng)r<0時(shí),負(fù)相關(guān);|r|越接近于1,相關(guān)性越

強(qiáng).

(3)經(jīng)驗(yàn)回歸方程:當(dāng)b?>0時(shí),正相關(guān);當(dāng)b?<0時(shí),負(fù)相關(guān).

題型二:一元線性回歸模型

例4.(2024·天津薊州·高三校考開學(xué)考試)為研究某種細(xì)菌在特定環(huán)境下,隨時(shí)間變化的繁

殖情況,得到如下實(shí)驗(yàn)數(shù)據(jù):

天數(shù)x(天)3456

繁殖個(gè)數(shù)y(千個(gè))2.5344.5

由最小二乘法得y與x的線性回歸方程為y0.7xa,則當(dāng)x7時(shí),繁殖個(gè)數(shù)y的預(yù)測(cè)值

為()

A.4.9B.5.25C.5.95D.6.15

【答案】B

11

【解析】由題中數(shù)據(jù)可得:x34564.5,y2.5344.53.5,

44

因?yàn)榛貧w直線必過樣本中心,

所以ay0.7x3.50.74.50.35,

所以y0.7x0.35,

所以當(dāng)x7時(shí),y0.770.355.25,

故選:B

例5.(2024·湖南長沙·高三長郡中學(xué)校聯(lián)考階段練習(xí))某社區(qū)為了豐富退休人員的業(yè)余文化

生活,自2018年以來,始終堅(jiān)持開展“悅讀小屋讀書活動(dòng)”.下表是對(duì)2018年以來近5年該

社區(qū)退休人員的年人均借閱量的數(shù)據(jù)統(tǒng)計(jì):

年份20182019202020212022

年份代碼x12345

年人均借閱量y(冊(cè))y1y2162228

5

(參考數(shù)據(jù):yi90)通過分析散點(diǎn)圖的特征后,年人均借閱量y關(guān)于年份代碼x的回

i1

歸分析模型為y5xm,則2024年的年人均借閱量約為()

A.31B.32C.33D.34

【答案】C

5

12345y

【解析】因?yàn)閤3,i90,所以1853m,即m3.

5yi118

55

所以回歸方程為y5x3,當(dāng)x6時(shí),y56333.

故選:C.

例6.(2024·遼寧·遼寧實(shí)驗(yàn)中學(xué)??寄M預(yù)測(cè))已知x,y的對(duì)應(yīng)值如下表所示:

x02468

y1m12m13m311

若y與x線性相關(guān),且回歸直線方程為y1.6x0.6,則m()

A.2B.3C.4D.5

【答案】B

024681m12m13m311

【解析】x4,y1.2m3.4,

55

又回歸直線方程為y1.6x0.6,

所以1.2m3.41.640.6,解得m3.

故選:B.

變式6.(2024·廣西南寧·南寧二中校聯(lián)考模擬預(yù)測(cè))某單位在當(dāng)?shù)囟c(diǎn)幫扶某村種植一種草

莓,并把這種原本露天種植的草莓搬到了大棚里,獲得了很好的經(jīng)濟(jì)效益.根據(jù)資料顯示,

產(chǎn)出的草莓的箱數(shù)x(單位:箱)與成本y(單位:千元)的關(guān)系如下:

x102030406080

yy1y2y3y4y5y6

(1)根據(jù)散點(diǎn)圖可以認(rèn)為x與y之間存在線性相關(guān)關(guān)系,請(qǐng)用最小二乘法求出線性回歸方程

y?b?xa?(a?,b?用分?jǐn)?shù)表示)

(2)某農(nóng)戶種植的草莓主要以300元/箱的價(jià)格給當(dāng)?shù)卮笮蜕坛┴?,多余的草莓全部?00

元/箱的價(jià)格銷售給當(dāng)?shù)匦∩特湥畵?jù)統(tǒng)計(jì),往年1月份當(dāng)?shù)卮笮蜕坛葺男枨罅繛?0箱、

1111

100箱、150箱、200箱的概率分別為,,,,根據(jù)回歸方程以及往年商超草莓的

10525

需求情況進(jìn)行預(yù)測(cè),求今年1月份農(nóng)戶草莓的種植量為200箱時(shí)所獲得的利潤情況.(最后

結(jié)果精確到個(gè)位)

66

?

附:xixyiy790,yi54,在線性回歸直線方程y?bxa?中

i1i1

n

xixyiy

?i1?

bn,a?ybx.

2

xix

i1

10203040608054

【解析】(1)因?yàn)閤40,y9,

66

6

2

所以xix900400100040016003400,

i1

6

由題意可知xixyiy790,

i1

n

xixyiy

?i179079

所以bn,

23400340

xix

i1

795

又因?yàn)閍?940,

34017

795

所以回歸方程為y?x.

34017

795785

(2)由回歸方程知,若農(nóng)戶草莓的種植量為200箱,則成本為y?200(千

3401717

元).

設(shè)農(nóng)戶草莓的種植量為200箱時(shí)的收入為Y元,200箱草莓供給大型商超和小商販分別x箱

和y,顯然xy200,

由題意Y300x200y,因此x,y以及Y的可能取值如下表:

x50100150200

y150100500

Y300x200y45000500005500060000

所以Y的分布列為:

Y45000500005500060000

1111

P

10525

1111

所以EY4500050000550006000054000,

10525

785

所以預(yù)測(cè)所獲利潤約為5400010007824元.

17

變式7.(2024·江西·高三統(tǒng)考開學(xué)考試)某新能源汽車銷售部對(duì)今年1月至7月的銷售量進(jìn)

行統(tǒng)計(jì)與分析,因不慎丟失一些數(shù)據(jù),現(xiàn)整理出如下統(tǒng)計(jì)表與一些分析數(shù)據(jù):

月份1月2月3月4月5月6月7月

月份代號(hào)x1234567

銷售量y(單位:萬輛)15.6mns37.739.644.5

其中y31.2.

(1)若m,n,s成遞增的等差數(shù)列,求從7個(gè)月的銷售量中任取1個(gè),月銷售量不高于27

萬輛的概率;

7

2

(2)若yiy670.48,x與y的樣本相關(guān)系數(shù)r0.99,求y關(guān)于x的線性回歸方程

i1

y?b?xa?,并預(yù)測(cè)今年8月份的銷售量(b?精確到0.1).

n

xixyiy

i1

附:相關(guān)系數(shù)r,線性回歸方程y?b?xa?中斜率和截距的最小二

n2n2

xixyiy

i1i1

n

xixyiy

乘估計(jì)公式分別為b?i1,a?yb?x.

n2

xix

i1

參考數(shù)據(jù):72.65,670.4825.89.

15.6mns37.739.644.5

【解析】(1)因?yàn)閥31.2.所以31.2,

7

所以mns81,

又m,n,s成遞增的等差數(shù)列,所以ms2n且mns,

所以n27,且m27s,

所以月銷售量不高于27萬輛的有15.6,m,n共3個(gè),又基本事件總數(shù)為7,

3

故所求概率為.

7

1772

(2)由表中數(shù)據(jù)可知,xxi4,xix28

7i1i1

77

xxyy

iixixyiy

ri10.99?i1

由和b7,

72722

xixyiyxix

i1i1i1

72

yiy

b670.4825.89

得i14.88,

r722822.65

xix

i1

所以b?4.88r4.880.994.8,

由x4,y31.2,得a?yb?x31.24.8412.0,

故y關(guān)于x的線性回歸方程為y?4.8x12.0.

當(dāng)x8時(shí),y?4.881250.4,

所以預(yù)測(cè)今年8月份的銷售量大約為50.4萬輛.

變式8.(2024·四川成都·高三石室中學(xué)??奸_學(xué)考試)已知某綠豆新品種發(fā)芽的適宜溫度在

6℃~22℃之間,一農(nóng)學(xué)實(shí)驗(yàn)室研究人員為研究溫度x(℃)與綠豆新品種發(fā)芽數(shù)y(顆)之

間的關(guān)系,每組選取了成熟種子50顆,分別在對(duì)應(yīng)的8℃~14℃的溫度環(huán)境下進(jìn)行實(shí)驗(yàn),得

到如下散點(diǎn)圖:

77

2

其中y24,(xix)(yiy)70,(yiy)=176.

i1i1

(1)運(yùn)用相關(guān)系數(shù)進(jìn)行分析說明,是否可以用線性回歸模型擬合y與x的關(guān)系?

$$$

(2)求出y關(guān)于x的線性回歸方程ybxa,并預(yù)測(cè)在19℃的溫度下,種子的發(fā)芽的顆數(shù).

n

(xix)(yiy)

參考公式:相關(guān)系數(shù)ri1,回歸直線方程$$$,其中

nnybxa

22

(xix)(yiy)

i1i1

n

(xix)(yiy)

i1$$

bn,aybx.參考數(shù)據(jù):778.77.

2

(xix)

i1

1

【解析】(1)根據(jù)題意,得x89101112131411.

7

7

22222222

xix811+911+1011+1111+1211+1311+141128,

i1

77

22.

xixyiy2817687770.16

i1i1

7

xixyiy

70

因而相關(guān)系數(shù)ri10.998.

7770.16

22

xixyiy

i1i1

由于r0.998很接近1,∴可以用線性回歸方程模型擬合y與x的關(guān)系.

7

xixyiy

705

(2)b?i1,

7282

2

xix

i1

57

a?2411,

22

57

∴y關(guān)于的回歸方程為y?x.

x22

57

若x19,則y?1944顆.

22

∴在19℃的溫度下,預(yù)測(cè)種子的發(fā)芽顆數(shù)為44.

變式9.(2024·安徽亳州·蒙城第一中學(xué)校聯(lián)考模擬預(yù)測(cè))為調(diào)查某地區(qū)植被覆蓋面積x(單

位:公頃)和野生動(dòng)物數(shù)量y的關(guān)系,某研究小組將該地區(qū)等面積花分為400個(gè)區(qū)塊,從中

隨機(jī)抽取40個(gè)區(qū)塊,得到樣本數(shù)據(jù)xi,yi(i1,2,,40),部分?jǐn)?shù)據(jù)如下:

x…2.73.63.23.9…

y…50.663.752.154.3…

40404040

2

經(jīng)計(jì)算得:xi160,yi2400,xix160,xixyiy1280.

i1i1i1i1

(1)利用最小二乘估計(jì)建立y關(guān)于x的線性回歸方程;

(2)該小組又利用這組數(shù)據(jù)建立了x關(guān)于y的線性回歸方程,并把這兩條擬合直線畫在同一坐

標(biāo)系xOy下,橫坐標(biāo)x,縱坐標(biāo)y的意義與植被覆蓋面積x和野生動(dòng)物數(shù)量y一致.設(shè)前者與

后者的斜率分別為k1,k2,比較k1,k2的大小關(guān)系,并證明.

附:y關(guān)于x的回歸方程yabx中,斜率和截距的最小二乘估計(jì)公式分別為:

nn

xynxy

xiyinxyii

?i1,$$,ri1

bnaybxnn

222

222

xinxxinxyiny

i1i1i1

16024001280

【解析】(1)x4,y60,b8,a603228,

4040160

故回歸方程為y8x28;

n

xixyiy

?i1

(2)x關(guān)于y的線性回歸方程為xa1b1y,b1n

2

yiy

i1

40402

xixyiyyiy

1

kbi1,ki1,

1402240

b1

xixxixyiy

i1i1

2

40

xixyiy

ki12

則1r,r為y與x的相關(guān)系數(shù),

4022

k2

xixyiy

i1

k

1

又r1,k1,k20,故1,即k1k2,

k2

下證:k1k2,

若k1k2,則r1,即yi8xi28i1,2,,40恒成立,

代入表格中的一組數(shù)據(jù)得:50.682.728,矛盾,

故k1k2.

綜上,y關(guān)于x的回歸方程為y8x28.

【解題方法總結(jié)】

求經(jīng)驗(yàn)回歸方程的步驟

題型三:非線性回歸

例7.(2024·湖南·校聯(lián)考模擬預(yù)測(cè))若需要刻畫預(yù)報(bào)變量w和解釋變量x的相關(guān)關(guān)系,且從

已知數(shù)據(jù)中知道預(yù)報(bào)變量w隨著解釋變量x的增大而減小,并且隨著解釋變量x的增大,預(yù)

報(bào)變量w大致趨于一個(gè)確定的值,為擬合w和x之間的關(guān)系,應(yīng)使用以下回歸方程中的

(b0,e為自然對(duì)數(shù)的底數(shù))()

A.wbxaB.wblnxaC.wbxaD.wbexa

【答案】D

【解析】對(duì)于A:因?yàn)閥x在定義域內(nèi)單調(diào)遞增且b0,所以w隨著x的增大而增大,不

合題意,故A錯(cuò)誤;

對(duì)于B:因?yàn)閥lnx在定義域內(nèi)單調(diào)遞增且b0,所以w隨著x的增大而減小,當(dāng)解釋變

量x,w,不合題意,故B錯(cuò)誤;

對(duì)于C:因?yàn)閥x在定義域內(nèi)單調(diào)遞增且b0,所以w隨著x的增大而減小,當(dāng)解釋變

量x,w,不合題意,故C錯(cuò)誤;

1

對(duì)于D:因?yàn)閥ex()x在定義域內(nèi)單調(diào)遞減且b0,所以w隨著x的增大而減小,當(dāng)解

e

釋變量x,wa,故D錯(cuò)誤;

故選:D.

例8.(2024·全國·高三專題練習(xí))云計(jì)算是信息技術(shù)發(fā)展的集中體現(xiàn),近年來,我國云計(jì)算

市場(chǎng)規(guī)模持續(xù)增長.已知某科技公司2018年至2022年云計(jì)算市場(chǎng)規(guī)模數(shù)據(jù),且市場(chǎng)規(guī)模y

c2x

與年份代碼x的關(guān)系可以用模型yc1e(其中e為自然對(duì)數(shù)的底數(shù))擬合,設(shè)zlny,

得到數(shù)據(jù)統(tǒng)計(jì)表如下:

年份2018年2019年2020年2021年2022年

年份代碼x12345

云計(jì)算市場(chǎng)規(guī)模y/千萬元7.4112036.666.7

zlny22.433.64

由上表可得經(jīng)驗(yàn)回歸方程z0.52xa,則2025年該科技公司云計(jì)算市場(chǎng)規(guī)模y的估計(jì)值為

()

A.e5.08B.e5.6C.e6.12D.e6.5

【答案】B

【解析】因?yàn)閤3,z3,

所以az0.52x330.521.44,

即經(jīng)驗(yàn)回歸方程z0.52x1.44,

當(dāng)x8時(shí),z0.5281.445.6,

所以yeze5.6,

即2025年該科技公司云計(jì)算市場(chǎng)規(guī)模y的估計(jì)值為e5.6,

故選:B

例9.(多選題)(2024·福建廈門·廈門一中校考三模)在對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回

歸分析時(shí),若兩個(gè)變量不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入

中間變量將其轉(zhuǎn)化為線性關(guān)系,再利用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)

根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中

可以根據(jù)上述方法進(jìn)行回歸分析的模型有()

xc

21

A.yc1xc2xB.y

xc2

xc2

C.yc1lnxc2D.yc1e

【答案】ABC

yy

【解析】對(duì)于選項(xiàng)A:ycx2cxcxc,令u則ucxc;

12x12x12

對(duì)于選項(xiàng)B:

xccccc1xc1c

y1112y1122x2

xc2xc2xc2y1c1c2c1c2c1c2

11c

令uux2;

y1c1c2c1c2

yc1

對(duì)于選項(xiàng)C:yc1lnxc2yc1lnxc2exc2

yc1yc1c1c1

即ee(xc2)令ue則ue(xc2)exc2e;

xc2

對(duì)于選項(xiàng)D:yc1elnylnc1xc2令ulny則uxlnc1c2

此時(shí)斜率為1,與最小二乘法不符.

故選:ABC

變式10.(2024·全國·高三專題練習(xí))已知變量的關(guān)系可以用模型ykemx擬合,設(shè)zlny,

其變換后得到一組數(shù)據(jù)如下.由上表可得線性回歸方程z3xa,則k()

x12345

z2451014

A.e3B.e2C.e2D.e3

【答案】B

【解析】由表格數(shù)據(jù)知x3,z7.即樣本中心點(diǎn)為3,7,

由z3xa,得a7332,

即z3x2,

所以zlnylnkmx3x2,即lnk2,可得ke2,

故選:B.

變式11.(2024·全國·高三專題練習(xí))某校課外學(xué)習(xí)小組研究某作物種子的發(fā)芽率y和溫度x

(單位:C)的關(guān)系,由實(shí)驗(yàn)數(shù)據(jù)得到如圖所示的散點(diǎn)圖.由此散點(diǎn)圖判斷,最適宜作為發(fā)

芽率y和溫度x的回歸方程類型的是()

A.yabxB.yabx2b0

C.yabexD.yablnx

【答案】D

【解析】由散點(diǎn)圖可見,數(shù)據(jù)分布成遞增趨勢(shì),但是呈現(xiàn)上凸效果,即增加緩慢.

A中,yabx是直線型,均勻增長,不符合要求;

B中,yabx2b0是二次函數(shù)型,圖象呈現(xiàn)下凸,增長也較快,不符合要求;

C中,yabex是指數(shù)型,爆炸式增長,增長快,不符合要求;

D中,yablnx是對(duì)數(shù)型,增長緩慢,符合要求.

故對(duì)數(shù)型最適宜該回歸模型.

故選:D.

變式12.(2024·全國·高二專題練習(xí))蘭溪楊梅從5月15日起開始陸續(xù)上市,據(jù)調(diào)查統(tǒng)計(jì),

得到楊梅銷售價(jià)格(單位:Q元/千克)與上市時(shí)間t(單位:天)的數(shù)據(jù)如下表所示:

時(shí)間t/(單位:天)102070

銷售價(jià)格Q(單位:元/千克)10050100

根據(jù)上表數(shù)據(jù),從下列函數(shù)模型中選取一個(gè)描述楊梅銷售價(jià)格Q與上市時(shí)間t的變化關(guān)系:

2t

Qatb,Qatbtc,Qab,Qalogbt.利用你選取的函數(shù)模型,在以下四個(gè)日期中,

楊梅銷售價(jià)格最低的日期為()

A.6月5日B.6月15日C.6月25日D.7月5日

【答案】C

【解析】根據(jù)表中數(shù)據(jù),描述楊梅銷售價(jià)格Q與上市時(shí)間Q的變化關(guān)系不可能是常數(shù)函數(shù)、

也不可能是單調(diào)函數(shù),

t

函數(shù)Qatb,Qab,Qalogbt在a0時(shí)均為單調(diào)函數(shù),這與表格中的數(shù)據(jù)不吻合,

所以應(yīng)選取Qat2btc進(jìn)行描述,

將表中數(shù)據(jù)10,100,20,50,70,100代入Qat2btc可得

100100a10bca0.1

50400a20bc,解得b8,所以Q0.1t28t170,

1004900a70bcc170

2

Q0.1t40154,所以當(dāng)t40時(shí)楊梅銷售價(jià)格最低,

而6月5日時(shí)t22,6月15日時(shí)t32,6月25日時(shí)t42,7月5日時(shí)t52,

所以t42時(shí)楊梅銷售價(jià)格最低.

故選:C.

變式13.(2024·四川瀘州·高三四川省瀘縣第四中學(xué)校考開學(xué)考試)抗體藥物的研發(fā)是生物

技術(shù)制藥領(lǐng)域的一個(gè)重要組成部分,抗體藥物的攝入量與體內(nèi)抗體數(shù)量的關(guān)系成為研究抗體

藥物的一個(gè)重要方面.某研究團(tuán)隊(duì)收集了10組抗體藥物的攝入量與體內(nèi)抗體數(shù)量的數(shù)據(jù),并

對(duì)這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值,抗體藥物攝入量為

x(單位:mg),體內(nèi)抗體數(shù)量為y(單位:AU/mL).

10101010

2

tizitiziti

i1i1i1i1

29.2121634.4

(1)根據(jù)經(jīng)驗(yàn),我們選擇ycxd作為體內(nèi)抗體數(shù)量y關(guān)于抗體藥物攝入量x的回歸方程,將

ycxd兩邊取對(duì)數(shù),得lnylncdlnx,可以看出lnx與lny具有線性相關(guān)關(guān)系,試根據(jù)

參考數(shù)據(jù)建立y關(guān)于x的回歸方程,并預(yù)測(cè)抗體藥物攝入量為25mg時(shí),體內(nèi)抗體數(shù)量y的

值;

(2)經(jīng)技術(shù)改造后,該抗體藥物的有效率z大幅提高,經(jīng)試驗(yàn)統(tǒng)計(jì)得z服從正態(tài)分布

N:0.48,0.032,那這種抗體藥物的有效率z超過0.54的概率約為多少?

L

附:①對(duì)于一組數(shù)據(jù)ui,vii1,2,,10,其回歸直線vua的斜率和截距的最小二乘

n

uivinuv

μi1

估計(jì)分別為n,avu;

22

uinu

i1

②若隨機(jī)變量Z~N,2,則有P(Z)0.6826,

P(2Z2)0.9544,P(3Z3)0.9974;

③取e2.7.

【解析】(1)將ycxd兩邊取對(duì)數(shù),得lnylncdlnx,

設(shè)zlny,tlnx,則回歸方程變?yōu)閦lncdt,

110110

由表中數(shù)據(jù)可知,zzi1.6,tti1.2,

10i110i1

10

tz10t·z

ii29.2101.21.6

所以?i1,$$,

d1020.5lnczdt1.60.51.21

34.4101.2

22

ti10t

i1

$0.50.5

所以z10.5t,即lny?10.5lnxlnelnxlnex,

故y關(guān)于x的回歸方程為yex0.5,

當(dāng)x25mg時(shí),y?e250.52.7513.5AU/mL.

(2)因?yàn)閦服從正態(tài)分布N0.48,0.032,其中0.48,0.03,

所以P2z2P0.42z0.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論