專題52統(tǒng)計案例_第1頁
專題52統(tǒng)計案例_第2頁
專題52統(tǒng)計案例_第3頁
專題52統(tǒng)計案例_第4頁
專題52統(tǒng)計案例_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

專題52統(tǒng)計案例

【題型歸納目錄】

題型一:變量間的相關(guān)關(guān)系

題型二:線性回歸

題型三:非線性回歸

題型四:獨立性檢驗

題型五:誤差分析

【考點預(yù)測】

知識點一、變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關(guān)系叫相關(guān)關(guān)系.由于

相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計發(fā)揮著非常重要的作用.我們可以通過收

集大量的數(shù)據(jù),在對數(shù)據(jù)進行統(tǒng)計分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,

而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

2、散點圖

將樣本中的〃個數(shù)據(jù)點(毛,凹.)(,=1,2,…描在平面直角坐標系中,所得圖形叫做散點圖.根據(jù)散點圖

中點的分布可以直觀地判斷兩個變量之間的關(guān)系.

(1)如果散點圖中的點散布在從左下角到右上角的區(qū)域內(nèi):對于兩個變量的這種相關(guān)關(guān)系,我們將它

稱為正相關(guān),如圖(1)所示;

(2)如果散點圖中的點散布在從左上角到右下角的區(qū)域內(nèi):對于兩個變量的這種相關(guān)關(guān)系,我們將它

稱為負相關(guān),如圖(2)所示.

(I)(2)

3、相關(guān)系數(shù)

若相應(yīng)于變量X的取值W,變量),的觀測值為丫.(Iqy〃),則變晟.,與y的相關(guān)系數(shù)

〃__n_

Z(E-x)(y-y)-〃抄

/?=「=一,通常用,?來衡量k與y之間的線性關(guān)系的強弱,r

的范圍為TW/W1.

(1)當廠>0時,表示兩個變量正相關(guān):當尸v0時,表示兩個變量負相關(guān).

(2)卜|越接近i,表示兩個變審的線性相關(guān)性越強;卜|越接近o,表示兩個變量間幾乎不存在線性相

關(guān)關(guān)系.當|”=1時,所有數(shù)據(jù)點都在一條直線上.

(3)通常當川>0.75時,認為兩個變量具有很強的線性相關(guān)關(guān)系.

知識點二、線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(制,“),(念,以),…,(?%”)3,其回歸方程),=/?+〃的

求法為

〃__〃__

Z(x,-X)(y.-y)^X,y^nxy

b=J---------——...........—

£(七7)2次

i=l/=l

a=y-bx

其中,x="!?£%.,y=-Xy,?(x,y)稱為樣本點的口心.

〃/=i

2、殘差分析

對于預(yù)報變量y,通過觀測得到的數(shù)據(jù)稱為觀測值£,通過回歸方程得到的),稱為預(yù)測值,觀測值減

去預(yù)測值等于殘差,自稱為相應(yīng)于點(七,£)的殘差,即有自=¥「1??殘差是隨機誤差的估計結(jié)果,通過對

殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差

分析.

(1)殘差圖

通過殘差分析,殘差點(冷日)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這

樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

(2)通過殘差平方和。=£(M-力)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;

/=1

反之,不合適.

(3)相關(guān)指數(shù)

£(X_”2

用相關(guān)指數(shù)來刻畫回歸的效果,其計算公式是:?=]_?」’.

Z(z--y)2

r=l

戶越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

知識點三、非線性回歸

解答非線性擬合問題,要先根據(jù)散點圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線

性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.

求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計算方法計算變換后的線性回歸方程系數(shù),還原

后即可求出非線性回歸方程,再利用回歸方程進行預(yù)報預(yù)測,注意計算要細心,避免計算錯誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對象,明確哪個是解釋變量,哪個是預(yù)報變量;

(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);

(3)由經(jīng)驗確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二

次函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、號函數(shù)模型等);

(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型:

(5)按照公式計算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則殮查數(shù)據(jù)是否有誤,或模型是否合適等.

知識點四、獨立性檢驗

I、分類變量和列聯(lián)表

<1)分類變量:

變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.

②2x2列聯(lián)表.

一般地,假設(shè)有兩個分類變量X和匕它們的取值分別為{川,戈2}和{),1,),2),其樣本頻數(shù)列聯(lián)表(稱

為2x2列聯(lián)表)為

>1為總計

aba+b

工2Cdc+d

總計a+cb+da+b+c+d

從2x2列表中,依據(jù),—與二—的值可直觀得出結(jié)論:兩個變量是否有關(guān)系.

a±bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示

列聯(lián)表數(shù)據(jù)的頻率特征.

(2)觀察等高條形圖發(fā)現(xiàn),-與工相差很大,就判斷兩個分類變量之間有關(guān)系.

a+bc+d

3、獨立性檢驗

(1)定義:利用獨立性假設(shè)、隨機變量Y來確定是否有定把握認為“兩個分類變量有關(guān)系”的方法

稱為兩個分類變量的獨立性檢驗.

⑵公式:…一屋鬻露…,其中…+F+”為樣本容量.

(3)獨立性檢驗的具體步驟如下:

①計算隨機變量K2的觀測值3查下表確定臨界值勺:

尸(片次)0.50.400.250.150.100.050.0250.0100.0050.001

k。0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

②如果上2々0,就推斷“X與V有關(guān)系”,這種推斷犯錯誤的概率不超過〃(六2&);否則,就認為在犯

錯誤的概率不超過〃(尺22片)的前提下不能推斷“X與丫有關(guān)系”.

(2)兩個分類變量x和y是否有關(guān)系的判斷標準:

統(tǒng)計學(xué)研究表明:

當K2K3.841時,認為X與y無關(guān);

當六>3.841時,有95/的把握說X與y有關(guān);

當六>6.635時\有99/的把握說X與V有關(guān);

當犬>10.828時,有99.9/的把握說X與V有關(guān).

【方法技巧與總結(jié)】

常見的非線性回歸模型

(1)指數(shù)函數(shù)型y=c優(yōu)(。>0且1,c>0)

兩邊取自然對數(shù),lny=ln(cav),即Iny=lnc+xlna,

令P'7",原方程變?yōu)閥,=lnc、+flna,然后按線性回歸模型求出Ina,Inc.

x=x

(2)對數(shù)函數(shù)型),=Z?lnx+a

令=:,原方程變?yōu)閥'=〃x'+。,然后按線性回歸模型求出〃,〃.

x=Inx

(3)尋函數(shù)型)、=辦"

兩邊取常用對數(shù),lgy=lg(ar"),即Igy=〃lgx+lga,

令,原方程變?yōu)镻'=/*+lg。,然后按線性回歸模型求出〃,Iga.

X=IgA:

(4)二次函數(shù)型),=>「+〃

令卜:=5,原方程變?yōu)椋?=法'+。,然后按線性回歸模型求出力,a.

x=

(5)反比例函數(shù)型),=〃+2型

x

y,=y

令,1,原方程變?yōu)椋?=區(qū)'+。,然后按線性回歸模型求出力,a.

x=—

X

【題型歸納目錄】

題型一:變量間的相關(guān)關(guān)系

題型二;線性回歸

題型三:非線性回歸

題型四:獨立性檢驗

題型五:誤差分析

【典例例題】

題型一:變量間的相關(guān)關(guān)系

例1.(2022?上海嘉定?高三階段練習)通過抽樣調(diào)研發(fā)現(xiàn),當?shù)氐谌径鹊尼t(yī)院心腦血管疾病的人數(shù)和便利

店購買冷飲的人數(shù)的相關(guān)系數(shù)很高,甲認為這是巧合,兩者其實沒有關(guān)系:乙認為冷飲的某種攝入成分導(dǎo)

致了疾?。罕J為病人對冷飲會有特別需求:丁認為兩者的相關(guān)關(guān)系是存在的,但不能視為因果,請判斷

哪位成員的意見最可能成立()

A.甲B.乙C.丙D.T

【答案】D

【解析】當?shù)氐谌径鹊尼t(yī)院心腦血管疾病的人數(shù)和便利店購買冷飲的人數(shù)的相關(guān)系數(shù)很高,但相關(guān)關(guān)系

是一種非確定性關(guān)系,相關(guān)關(guān)系不等于因果關(guān)系,丁的意見最可能成立.

故選:D.

例2.(2022.四川.成都七中高三階段練習(理))某統(tǒng)計部門對四組數(shù)據(jù)進行統(tǒng)計分析后,獲得如圖所示的

散點圖.

35

3530

3025

2520

2015

15I0

105

50

0

51015202530355101520253035

相關(guān)系數(shù)為勺相關(guān)系數(shù)為,2

3535

3030

2525

2020

1515

1010

55

0

5101520253035

相關(guān)系數(shù)為勺相關(guān)系數(shù)為々

下面關(guān)于相關(guān)系數(shù)的比較,正確的是()

A.r,</;</;<B.r2<r4<r]<r3C.r2<rA<r3<rxD.r4<r2<r3<rt

【答案】C

【解析】由圖可知:々/所對應(yīng)的圖中的散點呈現(xiàn)正相關(guān),而且5對應(yīng)的相關(guān)性比G對應(yīng)的相關(guān)性要強,

故0<4<*aG所對應(yīng)的圖中的散點呈現(xiàn)負相關(guān),且根據(jù)散點的分布情況可知4<。,因此

4<G”4,

故選:C

例3.(2022?上海交大附中高三階段練習)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有

所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽

樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(4y)(i=l,2,,20),其中巧和H分別表示第,個樣區(qū)的

2020

植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量(單位:頭),并計算得£玉=60,Z)'i=1200,

i=Ir=l

2020_220__

2卜7)=80,£(M—.V)=9000,—y)=800.

r=li=l

⑴估計該地區(qū)這種野生動物的數(shù)最;

⑵求樣本(4y)(i=l,2,,20)的相關(guān)系數(shù).(精確到)

120I

y=—yyr.=—x1200=600

【解析】(1)由已知得樣本平均數(shù)20鵬20,

從而該地區(qū)這種野生動物數(shù)量的估計值為20x600=12000.

Z177)--802L(>7->-)2-90002卜;-K)(y-y)-800

(2)由I,*->,*->,

可得樣本(七,.%)"=12,20)的相關(guān)系數(shù)為

20

Z(x,7)(y—F)

8008002&…

—_________—______-____、()94

2020-780x9000-60072~3

一寸

i=l;=l

變式1.(2022.陜西?寶雞市陳倉高級中學(xué)高三開學(xué)考試(理))對兩個變量x,y進行線性相關(guān)檢驗,得線性

相關(guān)系數(shù)門=,對兩個變量〃,-進行線性相關(guān)檢驗,得線性相關(guān)系數(shù)/2=-,則下列判斷正確的是()

A.變量x與),正相關(guān),變量〃與I,負相關(guān),變量工與),的線性相關(guān)性較強

B.變量x與),負相關(guān),變量〃與】,正相關(guān),變量x與y的線性相關(guān)性較強

C.變量x與),正相關(guān),變量〃與U負相關(guān),變量〃與u的線性相關(guān)性較強

D.變量x與),負相關(guān),變量〃與u正相關(guān),變量〃與u的線性相關(guān)性較強

【答案】C

【解析】依題意:[=0.8995歷=-0.9568,

所以x,y正相關(guān),〃?負相關(guān),

間<用<1,所以〃力的線性相關(guān)性較強.

故選:C

變式2.(2022?全國?高三專題練習)甲、乙、丙、丁四位同學(xué)各自對尤丁兩變量的線性相關(guān)性做試驗,分別求

得樣本相關(guān)系數(shù)小如下表:

甲乙丙T

/?0.20-0.95-0.120.85

則試驗結(jié)果中元),兩變量有更強線性相關(guān)性的是()

A.甲B.乙C.丙D.丁

【答案】B

【解析】由已知,乙的相關(guān)系數(shù)的絕對值為|r|=“95,是四人中最大的,因此乙同學(xué)有更強的相關(guān)性.

故選:B.

變式3.(2022?江蘇?南京市第一中學(xué)高三階段練習)某網(wǎng)絡(luò)電視劇已開播一段時間,其每口播放量有如下統(tǒng)

計表:

開播天數(shù)工(單

12345

位:天)

當天播放量),

(單位:百萬335910

次)

(1)請用線性回歸模型擬合),與工的關(guān)系,并用相關(guān)系數(shù)加以說明;

(2)假設(shè)開播后的兩周內(nèi)(除前5天),當天播放量),與開播天數(shù)x服從(I)中的線性關(guān)系.若每百萬播放量

可為制作方帶來萬元的收益,且每開播一天需支出1萬元的廣告費,估計制作方在該劇開播兩周內(nèi)獲得的

利潤.

方(內(nèi)-可(凹-田°汽住-三)(另一刃,

r,=,

參考公式;=In------------------上J--------------;—,a=y-bx.

心(為-,)2曲-丫

555____

參考數(shù)據(jù):^xiyi=110,2X=55,=224,Vi~i0-10.5.

1=1r-l/=!

注:①一般地,相關(guān)系數(shù)r的絕對值在以上(含)認為線性相關(guān)性較強;否則,線性相關(guān)性較弱.②利潤=

收益一廣告費.

-|-1

x=-(l+2+3+4+5)=3,y=-(3+3+5+9+10)=6

【解析】(1)由題得5?5

£(—)(一)

6+3+3+8

所以〃二------------

£(%一可2(1-3)2+(2-3)2+(4-3)2+(5-3)2

所以力=》一位=6—2x3=0.

所以線性回歸方程為y=2r.

£(%-可(另一到

20_10、10

相關(guān)系數(shù)”式許?0.952>0.95

x/10xx/44-x/Ho10.5

所以每日的播放量和開播天數(shù)線性相關(guān)性較強.

(2)設(shè)利潤為〃,則〃=[30+2(6+7+8+9+10+11+12+13+14)卜0.7-14=133

所以估計制作方在該劇開播兩周內(nèi)獲得的利潤為133萬元..

答:估計制作方在該劇開播兩周內(nèi)獲得的利潤為133萬元..

題型二;線性回歸

例4.(2022?重慶南開中學(xué)高三階段練習)重慶位于北半球亞熱帶內(nèi)陸地區(qū),其氣候特征恰如幾句俗諺:春

早氣溫不穩(wěn)定,夏長酷熱多伏旱,秋涼綿綿陰雨天,冬暖少雪云霧多.尤其是10月份,晝夜溫差很大,某

數(shù)學(xué)興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少之間的關(guān)系,他們分別到氣象局與某醫(yī)院抄錄了2021

年10月某六天的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資料:

日期第一日第三日第五日第四日第二日第六日

晝夜溫差X(℃)47891214

就診人數(shù)〉(個)X%>14兒

其中:yeN*,』,2,3,4,5,6,參考數(shù)據(jù):£>7=2658,£(另一丁=258,7258?16.

⑴根據(jù)散點圖可以認為x與)'之間存在線性相關(guān)關(guān)系,且相關(guān)系數(shù),?==,請用最小二乘法求出線性回歸

方程y=+a(a,用分數(shù)表示);

(2)分析數(shù)據(jù)發(fā)現(xiàn):第六日就診人數(shù)%=30,第一日就診患者中有3個小孩,其他患者全是大人,現(xiàn)隨機的

Q

從第一日所有就診患者中選出2人,若2人中至少有一個小孩的概率為會;

①求M的值;

②若%<%<”<%,求%,為,筋,乃的值(只寫結(jié)果,不要求過程).

Z(y-J=258

【解析】(1)因為",

2

所以靖+%2+…+y6-2(x+%+…+乂)y+6.F=258,

6_

因為=2658,y+%+…+)k=6)3

21

所以2658—129+6^=258,得不=20,

-1

因為x=-x(4+7+8+9+12+14)=9,

6

所以之(毛=(4-9)2+(9-9)2+L+(14_9y=64,

127八2。-二9=也

所以〃手,

6464

即線性回歸方程上瑞力胃

⑵①由題意可得:2人中至少有一個小孩的概率為%15,得:4才-49,+90=0

9

所以y=10或y=*(舍)

②由⑴得亍=20,

因為M-10,y6-30,

所以10+%+,3+尤+)'5+3。=120,得必+),3+居+為=8().

因為Z.V;=2658,

/-I

所以100+必2+W+H+W+900=2658,

所以W+W+y;+>52=1658,

因為必,必,乂,兌€N",y2<y3<y4<y5,

所以X=15,)3=18,j4=22,y5=25.

例S.(2022?全國?高三專題練習)已知X,丁的取值如表:

X0134

ya

若x,具有線性相關(guān)關(guān)系,且回歸方程為3=0.95X+2.6,貝心=.

【答案】2.2

【解析】將X=——-——=Zy=---------------=---代入回歸方程為y=0.95x+2.6,可得

444

空泗=4.5=4=22,應(yīng)填答案2.2.

例6.(2022?河北衡水?高三階段練習)已知一組樣本數(shù)據(jù)(為,乂),(為均,…,(玉,%)(〃22,芯,演,…,

互不相等),若這組數(shù)據(jù)的樣本相關(guān)系數(shù)為-1,則在這組樣本數(shù)據(jù)的散點圖中,所有樣本點(£,y)(;=1,

2,…,〃)所在的曲線可能是()

A.y=-2x+3B.y=x+3C.y=-x2+3D.y=?+3

【答案】A

【解析】樣本相關(guān)系數(shù)「的絕對值越接近于1,樣本數(shù)據(jù)的散點圖越接近于?條直線.因為該組數(shù)據(jù)的樣本

相關(guān)系數(shù)〃=-1,故樣本數(shù)據(jù)呈負相關(guān),所以所有樣本點(七,y)(i=l,2,…,〃)所在的曲線可能在直線

y=-2x+3上,

故選:A.

變式4.(2022.仝國.高三專題練習(文))給出下列說法:①回歸直線§,=八+右恒過樣本點的中心正5),

且至少過一個樣本點;②兩個變量相關(guān)性越強,則相關(guān)系數(shù)1川就越接近1;③將一組數(shù)據(jù)的每個數(shù)據(jù)都加

一個相同的常數(shù)后,方差不變;④在回歸直線方程亍=2-0.5%中,當解釋變量1增加一個單位時,預(yù)報變量

》平均減少個單位.其中說法正確的是()

A.①②?B.②??C.①③④D.②④

【答案】B

【解析】對于①中,回歸直線$,=最+4恒過樣本點的中心丘,?。灰欢ㄟ^一個樣本點,所以不正確;

對于②中,根據(jù)相關(guān)系數(shù)的意義,可得兩個變量相關(guān)性越強,則相關(guān)系數(shù)就越接近1,所以是正確的;

對于③中,根據(jù)方差的計算公式,可得將一組數(shù)據(jù)的每個數(shù)據(jù)都加一個相同的常數(shù)后,方差是不變的,所

以是正確的:

對于④中,根據(jù)回歸系數(shù)的含義,可得在回歸直線方程3=2-0.5X中,當解釋變量x增加一人單位時,預(yù)

報變量貧平均減少個單位,所以是正確的.

故選:B.

變式工(2022.全國?高三專題練習)對于數(shù)據(jù)組(七,),,.)?=1,2,3,…,〃),如果由線性回歸方程得到的對應(yīng)于自

變量者的估計值是先,那么將y-y.稱為相應(yīng)于點(七,£)的殘差.某工廠為研究某種產(chǎn)品產(chǎn)量x(噸)與

所需某種原材料了噸)的相關(guān)性,在生產(chǎn)過程中收集4組灼應(yīng)數(shù)據(jù)(尤力如下表所示:

X3456

y34ni

根據(jù)表中數(shù)據(jù),得出)關(guān)于x的線性回歸方程為y=0.7x+a,據(jù)此計算出樣本點(4,3)處的殘差為一,則

表中加的值為()

A.B.C.5D.

【答案】B

【解析】由題意可知,在樣本(4,3)處的殘差一,則y=3.15,即3.15=0.71+〃,

解得〃=0.35,即y=0.7x+0.35,

-3+4+5+6

又”=:=4.5,且線性方程過樣本中心點(工,于),

4

mi—八,門1―2?5+3+4+"z今「

貝ljv=().7X4.5+().35=3.5,則y=--------------------=3.5,

4

解得〃?=45

故答案為:B

變式6.(2022?全國?高三專題練月)已知兩個變量%和N之間有線性相關(guān)關(guān)系,經(jīng)調(diào)查得到如下樣本數(shù)據(jù),

X34567

y

根據(jù)表格中的數(shù)據(jù)求得同歸方程?=幾+6,則下列說法正確的是()

A.?>0,Z?>0B.?>0,/?<0

C.?<0,b>0D.a<0,b<0

【答案】B

【解析】由已知數(shù)據(jù),可知》隨著工的增大而減小,

則變量工和變量y之間存在負相關(guān)的關(guān)系,二〃<o,

當”=0時,則a=y>3.5>0,

即:a>0,b<0.

故選:B.

變式7.(2022?全國?高三專題練習)為研究某種細菌在特定環(huán)境下,隨時間變化的繁殖情況,得到如下實驗

數(shù)據(jù):

天數(shù)X(天)3456

繁殖個數(shù))’(千個)34

由最小二乘法得V與x的線性回歸方程為a=0.7x+2,則當x=7時,繁殖個數(shù)V的預(yù)測值為()

A.B.

C.D.

【答案】B

-3+4+54-69-25+3+4+457

【解析】由題意,根據(jù)表格中的數(shù)據(jù),可得X;

9779

即樣本中心為弓,5),代入回歸直線方程?=0.7x+/BP^=0.7x|+?,

解得a=0.35,BP回歸直線的方程為>'=0.7x+0.35,

當工=7時,>-=0.7x7+0.35=5.25,故選B.

變式8.(2022?北京師大附中高三階段練習(文))為了規(guī)定工時定額,需要確定加工某種零件所需的時間,

為此進行了5次試驗,得到5組數(shù)據(jù):(內(nèi)/),小,%),(七,)’3),(4”),(0%),由最小二乘法求得回歸直線

方程為),=0.67x+54.9?若已知玉十期+$+~+%=150,則y十%十)3+X+K=

A.75B.155.4C.375D.466.2

【答案】C

一150

【解析】由題意,可得x=(=30,代入回歸直線的方程,可得?=0.67x30+54.9=75,

所以y+義+、3+尤+*=5X$,=375,故選C.

變式9.(2022?廣東?順德-中高三階段練習)據(jù)一組樣本數(shù)據(jù)(不'),(乙,為),…,(天,”),求得經(jīng)驗回歸

方程為S,=1.5x+0.5,且;=3.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個樣本點(122.2)和(4.8,7.8)誤差較大,去除后

重新求得的經(jīng)驗回歸直線/的斜率為,則()

A.去除兩個誤差較大的樣本點后,)'的估計值增加速度變快

B.去除兩個誤差較大的樣本點后,重新求得的回歸方程一定過點(3,4)

C.去除兩個誤差較大的樣本點后,重新求得的回歸方程為5=L2x+1.4

D.去除兩個誤差較大的樣本點后,相應(yīng)于樣本點(2,3.75)的殘差為

【答案】C

【解析】對A,因為1.5>1.2,所以去除兩個誤差較大的樣本點后y的估計值增加速度變慢,放A錯誤;

對B,當7=3時,7=3XL5+O.5=5,設(shè)去掉兩個誤差較大的樣本點后,橫坐標的平均值為■縱坐標的

平均值為7,

則7=%+*+…+/-6=口=3,y=yl+y2+-+X,-10=5H-10=5>故B錯誤;

fi-2n-2n-2n-2

對C,因為去除兩個誤差較大的樣本點后,重新求得回歸直線/的斜率為,

所以5=3x12+。,解得5=1.4,

所以去除兩個誤差較大的樣本點后的經(jīng)驗回歸方程為S,=12r+L4,故C正確;

對D,因為§,=L2x2+1.4=3.8,所以)」?=3.75—3.8=-0.05,故D錯誤.

故選:C.

變式10.(2022?全國?高三專題練習)新冠肺炎疫情發(fā)生以來,中醫(yī)藥全面參與疫情防控救治,做出了重要

貢獻.某中醫(yī)藥企業(yè)根據(jù)市場調(diào)研與模擬,得到研發(fā)投入x(億元)與產(chǎn)品收益),(億元)的數(shù)據(jù)統(tǒng)計如下:

研發(fā)投入X(億元)12345

產(chǎn)品收益y(億元)3791011

(1)計算x,),的相關(guān)系數(shù)〃并判析是否可以認為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若

O.36KO.75,則線性相關(guān)程度一股,若I小0.75,則線性相關(guān)程度較高)

(2)求出),關(guān)于x的線性回歸方程,并預(yù)測研發(fā)投入20(億元)時產(chǎn)品的收益.

參考數(shù)據(jù):力(—)2=10,£(M-刃、40,次仁-可(必-刃=19.

i=lc-1M

-可(V-同之(z-可(£-百

附:相關(guān)系數(shù)公式:,=―------------------,回歸直線方程的斜率方=-------------,截距

£(再-“

1-1

A

a=y-bx.

2a-可2=io£(%-y)2=40E(a-x)(v..-y)=i9

【解析】⑴V

期EE=-=22=0,5>0,75,

710x5/4020

???該中醫(yī)藥企業(yè)的研發(fā)投入x與產(chǎn)品收益),具有較高的線性相關(guān)程度.

A2(*一)5-方19

b=—―7-----------=—=1.9

ZU-X)210

(2),/E

x=-(l+2+3+4+5)=3,y=-(34-7+9+10+ll)=8,

=8—1.9x3=2.3.

?4關(guān)于x的線性回歸方程為y=1.9A+2.3,

將工=20代入線性回歸方程可得,y=1.9x20+2.3=40.3,

,預(yù)測研發(fā)投入20(億元)時產(chǎn)品的收益為(億元).

變式U.(2022?全國?模擬預(yù)測(文))2020年,國慶“遇上”中秋,中國人把這個“超長黃金周''過出了年味.

假期期間,全國各大旅游景點、車站、機場人頭攢動的景象也吸引了世界的目光.外國媒體、專家和網(wǎng)友“實

名羨慕“,這一派熱鬧景象證明了抗疫的成功,也展示了中國經(jīng)濟復(fù)蘇的勁頭.抗疫的成功離不開國家強大的

醫(yī)療衛(wèi)生體系,下表是某省2013年至2019年醫(yī)療衛(wèi)生機構(gòu)數(shù)),(單位:萬個):

年份2013201420152016201720182019

年份代號,1234567

醫(yī)療衛(wèi)生機構(gòu)數(shù))’

(1)求了關(guān)于/的線性回歸方程)、=百+4(4,B保留兩位小數(shù));

(2)規(guī)定若某年的實際醫(yī)療衛(wèi)生機構(gòu)數(shù)與估計值的差的絕對值不超過500個,則稱該年是“吻合”年.利用(1)

的結(jié)果,假設(shè)2020年該省醫(yī)療衛(wèi)生機構(gòu)數(shù)的估計值為實際值,現(xiàn)從2013年至2020年這8年中任選3年,

其中,,吻合”年的個數(shù)為X,求X的分布列與數(shù)學(xué)期望.

參考數(shù)據(jù):±*=132.2,晨4.6.

1-1

參考公式:線性回歸方程中斜率和截距的最小二乘估計公式分別為:b=m---------,

熱可

a=y-bt.

【解析】(1)由題意得7=4,=(-3)2+(-2)2+(-1)2+0+12+22+32=28,

1=1

打“…)(£”=自/一7%]32.2—7、4、4.6=織、0/2

£"丫£")'2828

1=11=1

貝必="而會4.6-0.12x4=4.12,

所以)'關(guān)于,的線性回歸方程為y=0.12/+4.12.

(2)2013年至2019年這7年該省醫(yī)療衛(wèi)生機構(gòu)數(shù)的估計值與實際值(單位:萬個)如下表所示:

年份2013201420152016201720182019

實際值

估計值

則2013年至2020年這8年中“吻合”年有2013年,2015年,2018年,2020年,共4年,

故X的所有可能取值為0,123,

且P(X=k)=^^~,A:=0,1,2.3,

J

故X的分布列為

X0123

1331

P

147714

133

巨斤以E(X)=0x—+lx3+2x3+3x—=3.

'J1477142

變式12.(2022?全國?高三專題練習)在我國抗疫期間,素有“南抖音,北快手”之說的小視頻除了給人們帶

來生活中的快樂外,更在于傳遞了一種正能量,為抗疫起到了積極的作用,但一個優(yōu)秀的作品除了需要有

很好的素材外,更要有制作上的技術(shù)要求,某同學(xué)學(xué)習利用“快影”軟件將己拍攝的素材進行制作,每次制作

分三個環(huán)節(jié)來進行,其中每個環(huán)節(jié)制作合格的概率分別為;3,4?彳,只有當每個環(huán)節(jié)制作都合格才認為一

453

次成功制作,該小視頻視為合格作品.

(1)求該同學(xué)進行3次制作,恰有一次合格作品的概率;

(2)若該同學(xué)制作10次,其中合格作品數(shù)為X,求X的數(shù)學(xué)期望與方差;

(3)該同學(xué)掌握技術(shù)后制作的小視頻被某廣告公司看中,聘其為公司做廣告宣傳,決定試用一段時間,每

天制作小視頻(注:每天可提供素材制作個數(shù)至多40個),其中前7天制作合格作品數(shù)》與時間/如下表:(第

/天用數(shù)字/表示)

時間(,)1234567

合格作品數(shù)()')343468

其中合格作品數(shù)()')與時間(1)具有線性相關(guān)關(guān)系,求)'關(guān)于,的線性回歸方程(精確到0.01),并估算第14天

能制作多少個合格作品(四舍五入收整)?

之內(nèi)一兒盯'£(工7心一)')

(參考公式〃=月--------=---------;—,》=3-猿,參考數(shù)據(jù):1?/=163.)

/=1r=l

3422

【解析】⑴由題意知:制作一次視頻成功的概率為

3丫54

所以該同學(xué)進行3次制作,恰有一次合格作品的概率C;xx

S5)125

(2)根據(jù)題意可得:x

2、2312

所以E(X)=/?〃=10xg=4,0(X)=H/?(1-/?v)=10x—x—=—,

(3)根據(jù)表格數(shù)據(jù)可計算出:

I+2+3+4+5+6+73+4+34-4+7+6+8

=4,y5,

77

163-7x4x5233?

所以方=耳一-----------=一?0.821,

-2140-7x1628

-nx

r=l

所以§=]切=50.821x4=1.72,

所以)'關(guān)于/的線性回歸方程為5=0.82,+1.72,

令1=14,得§,=0.82xl4+1.72=13.2al3,

即估計第14天能制作13個合格作品.

題型三:非線性回歸

例7.(2022?廣東?順德一中高三階段練習)在國家大力發(fā)展新能源汽車產(chǎn)業(yè)的政策下,我國新隹源汽車的產(chǎn)

銷量高速增長.已知某地區(qū)2014年底到2021年底新能源汽車保有量的數(shù)據(jù)統(tǒng)計表如下:

年份(年)20142015201620172018201920202021

年份代碼X12345678

保有量W千輛

參考數(shù)據(jù):9=12.1了=2.1,Z%;=204,ZX/=613.7.ZM=924,其中

r=1c=1r=l

。=In)】,lg2h(),30/g3x0.48Jg^=0.43.

⑴根據(jù)統(tǒng)計表中的數(shù)據(jù)畫出散點圖(如圖),請判斷a=/;x+d與哪一個更適合作為y關(guān)于X的經(jīng)驗

1可歸方程(給出判斷即可,不必說明理由),并根據(jù)你的判斷結(jié)果建立),關(guān)于x的經(jīng)驗【可歸方程:

(2)假設(shè)每年新能源汽車保有量按(1)中求得的函數(shù)模型增長,且傳統(tǒng)能源汽車保有量每年下降的百分比相

同.若2021年底該地區(qū)傳統(tǒng)能源汽車保有量為500千輛,預(yù)計到2026年底傳統(tǒng)能源汽車保有星將下降10%.

試估計到哪一年底新能源汽車保有量將超過傳統(tǒng)能源汽車保有量.

參考公式:而于一組數(shù)據(jù)(%,v/),(%,匕),…,(〃”,匕),其經(jīng)驗回歸直線0=£〃+々的斜率和截距的最小

Z(w(-萬)(4-v)Z-V

二乘估計公式分別為------------------------,&=9-流;;

-")2名”疝2

/=1r=l

【解析】(1)根據(jù)該地區(qū)新能源汽車保有量的增長趨勢知,應(yīng)選擇的函數(shù)模型是y=e"“,令,=lny,則

A

I=cx+d

因為工=4.5,£x;=204,Zx/.=92.4,t=2.1,

8

Vx/.-8x-7

92.4-8x4.5x2.116.8

所以,£二9---------=0.4,

204-8x4.5?42

1=1

J=7-^=2.1-0.4x4.5=03,所以丁=e°4"+"3

(2)設(shè)傳統(tǒng)能源汽車保有量每年下降的百分比為八依題意得,500(l-r)$=500(1-10%),解得1--=0.9

y=500(1-rX=5000.於

IZr,設(shè)從2021

設(shè)從2021年底起經(jīng)過x年后的傳統(tǒng)能源汽車保有量為},千輛,則有

年底起經(jīng)過x年后新能源汽車的數(shù)量將超過傳統(tǒng)能源汽車,則有

嚴川)+0.3>50()o.於,所以(0.4x+3.5)lge>3-lg2+0.2M21g3-l),

解得x>:二片一生警=6.64,故從2021年底起經(jīng)過7年后,即2028年底新能源汽車的數(shù)量將超過

0.2+0.4Ige-0.4lg3

傳統(tǒng)能源汽車.

例8.(2022?全國?高三專題練習)2020年的“金九銀十”變成“銅九鐵十”,全國各地房價“跳水”嚴重,但某地

二手房交易卻“逆市”而行.下圖是該地某小區(qū)2019年11月至2020年11月間,當月在售二手房均價(單位:

萬元/平方米)的散點圖.(圖中月份代碼1至13分別對應(yīng)2019年11月至2020年11月)()

A當月在手二手房

1?°4-均價1,....

1.02-????

1.00-??

0.98-?.

0.96-

?

0.94■

°12345678910111213月份代碼;v

根據(jù)散點圖選擇〉,=。+〃△和y=c+,〃nx兩個模型進行擬合,經(jīng)過數(shù)據(jù)處理得到的兩個回歸方程分別為

y=0.9369+0.02856和),=0.9554+0.0306Inx,并得至U以下一些統(tǒng)計量的值:

),=0.9369+0.0285Ay=0.9554+0.0306Inx

R2

注:"是樣本數(shù)據(jù)中X的平均數(shù),亍是樣本數(shù)據(jù)中y的平均數(shù),則于列說法不一定成立的是()

A.當月在售二手房均價)與月份代碼工呈正相關(guān)關(guān)系

B.根據(jù)),=0.9369+0.0285人可以預(yù)測2021年2月在售二手房均價約為萬元/平方米

C.曲線尸0.9369+0.0285&與y=0.9554

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論