高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計案例新課標(biāo)試卷_第1頁
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計案例新課標(biāo)試卷_第2頁
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計案例新課標(biāo)試卷_第3頁
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計案例新課標(biāo)試卷_第4頁
高考專題復(fù)習(xí)第三節(jié) 統(tǒng)計案例新課標(biāo)試卷_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三節(jié)統(tǒng)計案例

學(xué)習(xí)要求-公眾號:新課標(biāo)試卷:1,會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,會利用散點圖認(rèn)識變

量間的相關(guān)關(guān)系,

2,了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.

3.了解獨(dú)立性檢驗(只要求2X2列聯(lián)表)的基本思想、方法及其簡單應(yīng)用,了解回歸分析的

基本思想、方法及其簡單應(yīng)用,在本小節(jié)中,需要了解一些常見的統(tǒng)計方法,并能應(yīng)用這些方法

解決一些實際問題.

必備知識?整合

L兩個變量的線性相關(guān)

(1)正相關(guān):

在散點圖中,點散布在從①左下角到②右上角的區(qū)域,對于兩個變量的這種相關(guān)關(guān)

系,我們將它稱為正相關(guān).

(2)負(fù)相關(guān):

在散點圖中,點散布在從③左二角到⑷右下角的區(qū)域,對于兩個變量的這種相關(guān)關(guān)

系,我們將它稱為負(fù)相關(guān).

(3)線性相關(guān)關(guān)系、回歸直線:

如果散點圖中點的分布從整體上看大致在⑤.一條直線附近,那么就稱這兩個變量之間

具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.

(4)最小二乘法:

求回歸直線,使得樣本數(shù)據(jù)的點到它的⑥.距離的平方和最小的方法叫做最小二乘法.

(5)回歸方程:

方程y功肝。是具有線性相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)(打%),(心④,…,(即人)的回歸

方程,其中a”是待定參數(shù).

n

E(xrx)(yry)

b=

nQ

L(片9)2MJ卜戒

1=1

a=?y-bx,

2.回歸分析

⑴回歸分析是對具有⑧」的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法.

(2)樣本點的中心:

nn

對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(為加,(勒必),…,(及外茂工£孫歹二工£如⑨

^i=ii=i

為樣本點的中心.

Zxiyrnxy

(3)相關(guān)系數(shù):r=

當(dāng)r>0時,表明兩個變量⑩正相關(guān);

當(dāng)2<0時,表明兩個變量?負(fù)相關(guān),

廠的絕對值越接近于1,表明兩個變量的線性相關(guān)性?越強(qiáng).2的絕對值越接近于0,表明

兩個變量之間?幾乎不存在線性相關(guān)關(guān)系,通常如大于或等于?0.75時,認(rèn)為兩個變量

有很強(qiáng)的線性相關(guān)性,

3.獨(dú)立性檢驗

⑴分類變量:變量的不同“值”表示個體所屬的?不同類別,像這樣的變量稱為分類變

量.

⑵列聯(lián)表:列出的兩個分類變量的?頻數(shù)表,稱為列聯(lián)表,一般地,假設(shè)有兩個分類變量

才和K它們的可能取值分別為{打而}和{y.,同,其樣本頻數(shù)列聯(lián)表(稱為2X2列聯(lián)表)為

總計

X\ab升b

照Cdc^d

總計卅CKd

則可構(gòu)造一個隨機(jī)變量〃=?,…,其中爐?外加Nd.

一(a+b)(c+d)(a+c)(b+d)-----------

(3)獨(dú)立性檢驗:

利用獨(dú)立性假設(shè)、隨機(jī)變帚?K來確定是否有一定的把握認(rèn)為“兩個分類變量?有

關(guān)系”的方法稱為兩個分類變量的獨(dú)立性檢驗.

OSM

1,判斷正誤(正確的打“J”,錯誤的打“X”),

(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的成績成正相關(guān)關(guān)系.()

(2)通過回歸直線方程y%戶a可以估計預(yù)報變量的取值和變化趨勢.()

(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進(jìn)行相關(guān)性檢驗.

()

⑷事件4關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的尤的觀測值越大.()

答案⑴J⑵J(3)X⑷J

2.根據(jù)如下樣本數(shù)據(jù);

X34567

y4.02.5-0.50.5-2.0

得到的回歸方程為尸力代出若折7.9,則x每增加一個單位,y就()

A.增加1.4個單位B.減少1.4個單位

C.增加1.2個單位D.減少1.2個單位

答案B根據(jù)樣本數(shù)據(jù)可得,專5,聲0.9,由于樣本點的中心伉力滿足尸6代&,所以

0.9二6X5+7.9,可得IF-\.4.故選B.

3.(人教A版選修2-3P97習(xí)題3.2T1改編)在研究吸煙是否對患肺癌有影響的案例中,通過

對列聯(lián)表的數(shù)據(jù)進(jìn)行處理,計算得到隨機(jī)變量『的觀測值左056,632,在犯錯誤的概率不超過

0.0C1的前提下,下面說法正確的是()

下表供參考:

P/2睛0.0250.0100.0050.001

標(biāo)5.0246.6357.87910.828

A.由于隨機(jī)變量V的觀測值力10.828,所以“吸煙與患肺癌有關(guān)系并且這個結(jié)論犯錯誤的

概率不超過0.001

B.由于隨機(jī)變量斤的觀測值828,所以“吸煙與患肺癌有關(guān)系”:并且這個結(jié)論犯錯誤的

概率不低于0.001

C.由于隨機(jī)變量^的觀測值力10.828,所以“吸煙與患肺癌沒有關(guān)系”,并且這個結(jié)論犯錯誤

的概率不超過0.001

D.由于隨機(jī)變量/的觀測值010.828,所以“吸煙與患肺癌沒有關(guān)系”,并且這個結(jié)論犯錯誤

的概率不低于0.001

答案A因為隨機(jī)變量〃的觀測值妗56.632〉10.828,

所以在犯錯誤的概率不超過0.001的前提下,認(rèn)為“吸煙與患肺癌有關(guān)系”.

故選A.

4.(人教B版選修2-3P94A5改編)己知兩個變量為y的關(guān)系可以近似地用函數(shù)萬a爐來表示,

通過兩邊取自然對數(shù)變換后得到一個線性函數(shù),利用最小二乘法得到的線性回歸方程為

下2+0.5匕則乂y的近似函數(shù)關(guān)系式為.

答案y=exi

解析令z=ln7=ln(a/)=lna+Mnx,

對照回歸方程r2+0.5右

毗/"礙

???My的近似函數(shù)關(guān)系式為片。小.

5,(易錯題)為了考察某種病毒疫苗的效果,現(xiàn)隨機(jī)抽取100只小鼠進(jìn)行試驗,得到如下列聯(lián)表:

感染未感染合計

服用104050

未服用203050

合計3070100

附,OK?

P(冷L)0.1000.0500.0250.010

k02.7063.8415.0246.635

根據(jù)上表,有的把握認(rèn)為“小鼠是否被感染與服用疫苗有關(guān)”.

答案95舟

解析根據(jù)列聯(lián)表中數(shù)據(jù),計算出駕端哼*4.762>3.841,

對照數(shù)表知,有95微把握認(rèn)為“小最是否被感染與服用疫苗有關(guān)”.

。易錯分析由于對2X2列聯(lián)表中國Ac、d的位置不清楚,在代入公式時代錯了數(shù)值導(dǎo)致計

算結(jié)果錯誤.

關(guān)鍵能力,突破

考點=相關(guān)關(guān)系的判斷值既

1.在一組樣本數(shù)據(jù)(鳥凹),(羯血,…,(島%)(廬2,xh及,…,兒不全相等)的散點圖中,若

所有樣本點(居7.)(7=1,2,…,〃)都在直線吁戶1上,則這組樣本數(shù)據(jù)的相關(guān)系數(shù)為()

A.-lB.0

C.-D.1

2

答案I)所有樣本點均在同一條斜率為正數(shù)的直線上,則樣本的相關(guān)系數(shù)最大,為1,所以

選D.

2.(2020湖南張家界月考)對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其相關(guān)系數(shù)的

比較,正確的是)

35

30

25

20

15

105

0

相關(guān)系敢為。相關(guān)系數(shù)為,:

(D②

相關(guān)系數(shù)為。和關(guān)系數(shù)為。

③④

A.打<匕<0<舄<丁1

B.司5<0"1您

C.水水0〈水石

D.冰水0<水舄

答案A易知題中圖①與圖③是正相關(guān),圖②與圖④是負(fù)相關(guān),且圖①與圖②中的樣本點

集中分布在一條直線附近,則小水0(費(fèi)",故選A.

3.某公司的科研人員在7塊并排、形狀和大小相同的試驗田上對某棉花的新品種進(jìn)行施化

肥量>對產(chǎn)量y影響的試驗,得到如下表所示的一組數(shù)據(jù)(單位:kg):

施化肥量X15202530354045

棉花產(chǎn)量y330345365405445450455

⑴畫出散點圖;

(2)判斷施化肥量x與棉花產(chǎn)量y是否具有相關(guān)關(guān)系.

解析(D散點圖如圖所示:

梅花產(chǎn)餐”kg

500

450

400

200

01020304050隨化肥fitx/ka

(2)由散點圖知,各組數(shù)據(jù)的對應(yīng)點大致都在一條直線附近,所以施化肥量x與棉花產(chǎn)量y

具有線性相關(guān)關(guān)系.

名師點評

判斷相關(guān)關(guān)系的方法:

(1)回歸方程法:利用回歸方程中x的系數(shù)b的正負(fù)判斷.

(2)散點圖法;如果所有的樣本點都落在某一曲線附近,那么變量之間就有相關(guān)關(guān)系;如果所

有的樣本點都落在某一直線附近,那么變量之間就有線性相關(guān)關(guān)系.

(3)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判斷,|「越趨近于1,相關(guān)性越強(qiáng).

考點且回歸分析,多元分析‘

角度一線性回歸方程及應(yīng)用

典例1(2020山西長治模擬)《中國詩詞大會》是中央電視臺于2016年推出的原創(chuàng)文化

類電視節(jié)目,中央電視臺為了解該節(jié)目的收視情況,抽查北方與南方各5個城市,得到觀看該節(jié)

目的人數(shù)(單位:千人)如莖葉圖所示,但其中一個數(shù)字被污損.

北方南方

897378

210806

(1)若將被污損的數(shù)字視為0十中10個數(shù)字中的一個,求北方觀眾平均人數(shù)超過南方觀眾

平均人數(shù)的概率;

(2)該節(jié)目的播出極大激發(fā)了觀眾學(xué)習(xí)詩詞的熱情,現(xiàn)在隨機(jī)統(tǒng)計了4位觀眾每周學(xué)習(xí)詩詞

的平均時間y(單位:小時)與年齡爪單位:歲),并制作了對照表(如表所示):

年齡x(單位:歲)20304050

每周學(xué)習(xí)詩詞的

33.53.54

平均時間y(單位:小時)

由表中數(shù)據(jù)分析,x與y成線性相關(guān)關(guān)系,試求線性回歸方程,并預(yù)測年齡為60歲的觀眾每

周學(xué)習(xí)詩詞的平均時間.

£位

1

Qb

n

22=y-

E-_

X.一nX

I1

=l

解析(1)設(shè)被污損的數(shù)字為X,由北方觀眾平均人數(shù)超過南方觀眾平均人數(shù)得

78+79+82+81+80.73+77+78+86+80+X”

〉=>Kb,

5--------------5

即A=0,1,2,3,4,5,

二所求概率嘮

(2)x=ix(20+30+40+50)=35,

4

歹[x(3+3.5+3.5+4)=3.5,

A4r升490,

44

又£xy=20X3+30X3.5+40X3.5+50X4=505,£x?=202+302+402+502=5400,

i=ii=i

?,?1b=--5-0-5-4-9-0-r=0.03,

5400-4x35?

Aa=3.5-0.03X35=2.45,

Ay=0.03外2,45,

.當(dāng)戶60時,y二4.25.

故年齡為60歲的觀眾每周學(xué)習(xí)誓詞的平均時間大約為4.25小時,

角度二非線性回歸方程及應(yīng)用

典例2(2020安徽黃山二模)某苗圃基地擬選用某種植物支援荒山綠化,在相同種植條件

下,對該種植物幼苗從種植之日起,第x天的高度y(單位:cm)進(jìn)行觀測,下表是某株幼苗的觀測

數(shù)據(jù):

第才/p>

高度y/fem0479111213

作出如下散點圖:

⑴請根據(jù)散點圖判斷尸3戶人與尸6&+d中哪一個更適宜作為幼苗高度/關(guān)于時間x的回

歸方程類型;(給出判斷即可,不必說明理由)

(2)根據(jù)⑴的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程.已知幼苗的高度達(dá)到29cm

才可以移植,預(yù)測苗圃基地需要培育多長時間.

777777

Ex:

EXjEXiYiE同

rJ1

i=l營湎1?=1中<=i1=1i=i

140285615674676283

解析(1)由散點圖可知,產(chǎn)Sr更適宜作為幼苗高度y關(guān)于時間x的回歸方程類型.

⑵令〃二爪,則尸川G+d構(gòu)造新的成對數(shù)據(jù),如下表所示:

/p>

P=Vx1234567

y0479111213

求得百4,7=8.

£-

M〃

-r

iy埠UV

-283-7X4X859

i=7l-2U

£-1407X1628,

』17rg

3

平-

.

r-c-7

,?.y關(guān)于〃的回歸方程為蟾

Zo7

則y關(guān)于x的回歸方程為胃岳年

3

-

取尸29,可得29二?7解得g195天.

Zb

???預(yù)測苗圃基地需要培育195天.

角度三相關(guān)系數(shù)及其應(yīng)用

典例3(2020課標(biāo)全國〃,18,12分)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動

物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些

地塊中用簡單隨機(jī)抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)3,z)(;=1,2,…,20),其

中>和乂分別表示第/個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得

2020202020

Zx=60,Zyp\200,£(J-X)2=80,£(必-歹尸二9000,Z(y-y)=800.

i=li=li=li=li=l

(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動

物數(shù)量的平均數(shù)乘地塊數(shù));

⑵求樣本u,yj(7=1,2,…,20)的相關(guān)系數(shù)(精確到求01);

(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地

區(qū)這種野生動物數(shù)量更準(zhǔn)確的估計,請給出一種你認(rèn)為更合理的抽樣方法,并說明理由.

n

附:相關(guān)系數(shù)廣2n2,V2^1.414.

££心

-X)

=l(=1

20

解析⑴由己知得樣本平均數(shù)方1卷與匕*。,從而該地區(qū)這種野生動物數(shù)量的估計值為

60X200=12000.

⑵樣本(檢入)(凡2,…,20)的相關(guān)系數(shù)

20

廠¥產(chǎn)田(力爭____2*o94

J2020V80X90003

(3)分層抽樣:根據(jù)植物覆蓋面積的大小對地塊分層,再對200個地塊進(jìn)行分層抽樣.

理由如下:由⑵知各樣區(qū)的這種野生動物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān).由于各地塊間

植物覆蓋面積差異很大,從而各地塊間這種野生動物數(shù)量差異也很大,采用分層抽樣的方法較好

地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致也提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動

物數(shù)量更準(zhǔn)確的估計,

名師點評

L線性回歸分析問題:

(1)求線性回歸方程:

結(jié)合公式和已知數(shù)據(jù),求出取歹等數(shù)據(jù),再求回歸系數(shù)b,a.

(2)利用回歸方程進(jìn)行預(yù)測,把線性回歸方程看作一次函數(shù),求函數(shù)值.

(3)利用回歸直線判斷正、負(fù)相關(guān),系數(shù)匕決定是正相關(guān)還是負(fù)相關(guān),

2.模型擬合效果的判斷:

⑴殘差平方和越小,模型的擬合效果越好.

(2)相關(guān)指數(shù)〃越大,模型的擬合效果越好.

3,非線性回歸方程的求法:

⑴根據(jù)原始數(shù)據(jù)(>/)作出散點圖,

(2)根據(jù)散點圖選擇恰當(dāng)?shù)臄M合函數(shù).

(3)作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程.

(4)在(3)的基礎(chǔ)上通過相應(yīng)變換,即可得到非線性回歸方程.

哥對訓(xùn)練

1.已知某企業(yè)近3年的前7個月的月利潤(單位:百萬元)如下面的折線圖所示:

⑴試問這3年的前7個月中哪個月的月平均利潤最高;

⑵通過計算判斷這3年的前7個月的總利潤的發(fā)展趨勢;

⑶第3年的前4個月的數(shù)據(jù)如'F表,用線性回歸的擬合模型估計第3年8月份的利潤.

月份x1234

利潤y(單位:百萬元)4466

由?八Tu£蟲㈤仇-y)^xnxy

相關(guān)公式:b土、----廣寧--i-y-r---1

ET廠后2£%卜府2

1=1i=i1

a=y-bx.

解析(1)由折線圖可知這3年的5月和6月的平均利潤最高.

(2)第1年的前7個月的總利潤為

1+2+3+5+6+7+4=28(百萬元),

第2年的前7個月的總利潤為2+5+5+4+5+5+5=31(百萬元),

第3年的前7個月的總利澗為4+4+6+6+7+6+8=41(百萬元),

故這3年的前7個月的總利潤呈上升趨勢.

2222

(3)Vx=2.5,y=5,,Sx?=l+2+3+4=30,X4+2X4+3X6+4X6=54,二吟治簧。8,

a-5-2.5X0.8=3,/.y=0.8x+3,

當(dāng)齊8時,y=0,8X8+3=9,4.

,估計第3年8月份的利潤為9.4百萬元.

2.(2019廣西聯(lián)考)某公司為了準(zhǔn)確地把握市場,做好產(chǎn)品生產(chǎn)計劃,對過去四年的數(shù)據(jù)進(jìn)行整理

得到了第x年與年銷售量「(單位:萬件)之間的關(guān)系如表:

X1234

y12284256

⑴在圖中畫出表中數(shù)據(jù)的散點圖;

兩件

60

50

40

30

20

10

―01~123^1/4

(2)根據(jù)(1)中的散點圖判斷y與x的回歸模型的類型,并用相關(guān)系數(shù)加以說明;

⑶建立y關(guān)于>的回歸方程,預(yù)測第5年的銷售量約為多少.

I44£(x--x)(y.-y)

附力r(y廣力2^327,遙石2.24,£幾片418.相關(guān)系數(shù)「"藍(lán)'{回歸方程飛出

N1=11=1

£片力中才y_—

的斜率和截距的最小二乘估計分別為如二---------,spy-bx.

Lxf-nx2

解析(1)作出的散點圖如圖:

0I234〃年

(2)由⑴散點圖可知,各點大致分布在一條直線附近,故可用線性回歸模型擬合y與x的關(guān)系.

又打,爐*£*=30,

//i=i

£](后動(必-歹)二*0=&y=418-4x|Xy=73,

J?]?療)2=Jg*4.2=卜0-4乂(|)二帆、2,24,

4

S(xrx)(yry)

一i=i73

1_r二七一--七0.9966.

2.24X32.7

2

_E(xrx).L(yry)

,?)與》的相關(guān)系數(shù)近似為0.9966,說明y與丫的線性相關(guān)程度相當(dāng)強(qiáng),,可以用線性回歸模

型擬合y與x的關(guān)系.

..4____

£XiVi-4xy

⑶由⑵知設(shè)y=b^Q,b=氣-----=-

£備4連5

i=i123

a于位:2.故y關(guān)于*的回歸方程為y號尸2,當(dāng)尸5時,y—X5-2二71,

預(yù)測第5年的銷售量約為71萬件.

3.(2020福建南平三模)千百年來,人們一直在通過不同的方式傳遞信息.在古代,烽火狼煙、飛

鴿傳書、快馬驛站等通信方式被人們廣泛傳知;第二次工業(yè)革命后,科技的進(jìn)步帶動了電訊事業(yè)

的發(fā)展,電報、電話的發(fā)明讓通信領(lǐng)域發(fā)生了翻天覆地的變化;之后,計算機(jī)和互聯(lián)網(wǎng)的出現(xiàn)則

使得“千里眼”“順風(fēng)耳”變?yōu)楝F(xiàn)實,……,此時此刻,5G的到來即將給人們的生活帶來顛覆性

的變革.某科技創(chuàng)新公司基于領(lǐng)先的技術(shù)水平,豐富的移動互聯(lián)網(wǎng)應(yīng)用等明顯優(yōu)勢,該公司的5G

經(jīng)濟(jì)收入在短期內(nèi)逐月攀升,業(yè)內(nèi)預(yù)測,該創(chuàng)新公司在第1個月至第7個月的5G經(jīng)濟(jì)收入y(單

(1)為了更充分運(yùn)用大數(shù)據(jù)、人工智能、5G等技術(shù),公司需要派出員工實地考察,檢測產(chǎn)品性能

和使用狀況,公司領(lǐng)導(dǎo)要從報名的五名科技人員從B、C、D、£中隨機(jī)抽取3個人前往,則/、B

同時被抽到的概率為多少?

⑵根據(jù)散點圖判斷,尸己盧6與片c?人由c,d均為大于零的常數(shù))哪一個更適宜作為5G經(jīng)濟(jì)

收入y關(guān)于月份x的回歸方程類型?(給出判斷即可,不必說明理由)并根據(jù)你的判斷結(jié)果及表中

的數(shù)據(jù),求出y關(guān)于x的回歸方程;

⑶請你預(yù)測該公司8月份的5G經(jīng)濟(jì)收入.

參考數(shù)據(jù):

其中設(shè)v=igy,右igy(-

參考公式:對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(檢匕)(41,2,3,…,力,其回歸直線〃邛ea的斜率

.n_八

Lx;v;-n5cv?

和截距的最小二乘估計公式分別為用耳「廣a行邛x.

a/,nx

解析(1)從爾氏C、〃、£中隨機(jī)抽取3個人,其基本事件為

(44。,(44〃),(4氐£),(4C〃),(4C£),(4〃£),(&C;鹵,(&CQ,(4〃"),匕〃£),共

10個,48同時被抽到的事件為(45,0,UB,。),(4&£),共3個,則48同時被抽到的概率為

3

10,

⑵根據(jù)散點圖判斷,產(chǎn)。?"更適宜作為5G經(jīng)濟(jì)收入y關(guān)于月份x的回歸方程類型.

對六c,〃兩邊同時取常用對數(shù),得1g片lg(c?(/)=lgc+xlgd./.rigc+jlgd,

Vx=y=4,萬二產(chǎn)?L54,_£xf=140,

.7

J^V_50-12-7X4X1.54,^^

d2

.L?-7X140-7X4228

把樣本中心點(4,1.54)代入尸1gc+0,25?茍得1g北0.54,

,折0.54+0.25*,即1g發(fā)0.54+0.25*,?'.y關(guān)于》的回歸方程為

y二1嚴(yán)電25n0°"X(IO025)-3.47X10*25;

⑶由⑵得力二3.47X10產(chǎn)

把年8代入上式得,y=3.47X10°25XM47,

故預(yù)測該公司8月份的5G經(jīng)濟(jì)收入為347百萬元.

整直目獨(dú)立性檢驗葡頻

典例4某工廠有25周歲以上(含25周歲)的工人300名,25周歲以下的工人200名,為研

究工人的日平均生產(chǎn)件數(shù)是否與年齡有關(guān),現(xiàn)采用分層抽樣的方法,從中選取了100名工人,先

統(tǒng)計了他們某月的日平均生產(chǎn)件數(shù),然后按工人的年齡分為“25周歲以上(含25周歲)”和“25

周歲以下”兩組,再將兩組工人的日平均生產(chǎn)件數(shù)分成5

組:[50,60),[60,70),[70,80),[80,90),[90,100],分別加以統(tǒng)計,得到如圖所示的頻率分布直

方圖.

典率

組距

0.0330.....................[―

0.0200.....................

QXX1S0----------?

<)-1mloo.4的0平

25則歲以的25周歲聞均生產(chǎn)的k

⑴根據(jù)“25周歲以上(含25周歲)組”的頻率分布直方圖,求25周歲以上(含25周歲)組

的工人的日平均生產(chǎn)件數(shù)的中位數(shù)的估計值(四舍五入保留整數(shù));

(2)規(guī)定日平均生產(chǎn)件數(shù)不少于80的工人為生產(chǎn)能手,請你根據(jù)己知條件完成2X2列聯(lián)表,

并判斷是否有90黜把握認(rèn)為“生產(chǎn)能手與工人所在的年齡組有關(guān)”.

生產(chǎn)能手非生產(chǎn)能手合計

25周歲以上(含25周歲)組

25周歲以下組

合計

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

P(儲]%)0.1000.0500.0100.001

kn2.7063.8416.63510.828

解析采用分層抽樣的方法,從“25周歲以上(含25周歲)組”應(yīng)選取工人

100X正抵=60(名),從“25周歲以下組”應(yīng)選取工人100X正巖:40(名).

(1)由“25周歲以上(含25周歲〕組”的頻率分布直方圖可知,其中位數(shù)為

70+iox空牌吧三73(件),

綜上,25周歲以上(含25周歲)組的工人日平均生產(chǎn)件數(shù)的中位數(shù)的估計值為73件.

(2)由頻率分布直方圖可知,25周歲以上(含25周歲)組的生產(chǎn)能手共有60X[(0,020

0+0,0050)X10kl5(名),25周歲以下組的生產(chǎn)能手共有40X[(0,0325+0,005

0)X10]=15(名),則2X2列聯(lián)表如下:

生產(chǎn)非生產(chǎn)

合計

能手能手

25周歲以上

154560

(含25周歲)組

25周歲以下組152540

合計3070100

冰型蒜絮手書司.786〈2.706,所以沒有90嫡把握認(rèn)為“生產(chǎn)能手與工人所在的

年齡組有關(guān)”.

方法技巧

獨(dú)立性檢驗的一般步驟

1.求“有多大把握”“犯錯誤的概率”的題型:

(1)根據(jù)樣本數(shù)據(jù)列出2X2列聯(lián)表;

(2)計算隨機(jī)變量片的觀測值k,查表確定臨界值心(符合42外的最大Ab);

(3)推斷有口-戶(筋X100軸)把握認(rèn)為有關(guān)系,或在犯錯誤的概率不超過P(r2禽)的前

提下認(rèn)為有關(guān)系,

2.判斷是否有回舶<)把握的題型:

(1)根據(jù)樣本數(shù)據(jù)列出2X2列聯(lián)表;

⑵計算隨機(jī)變量尸的觀測值k,根據(jù)川粉[1-尸(/》左)]X100%求產(chǎn)(左2%)),查表確定臨界

值均,比較北與4的大小;

(3)判斷是否有用轆]把握認(rèn)為有關(guān)系.

哥對訓(xùn)練

(202()課標(biāo)〃健,18,12分)某學(xué)生興趣小組隨機(jī)調(diào)查了某市100天中每天的空氣質(zhì)量等級和當(dāng)

天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):

鍛煉人次

[0,200](200,400](400,600]

空氣質(zhì)量等級

1(優(yōu))21625

2(良)51012

3(輕度污染)678

4(中度污染)720

(1)分別估計該市一天的空氣質(zhì)量等級為1,2,3,4的概率;

(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表);

⑶若某天的空氣質(zhì)量等級為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)量等級為3或4,

則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的2X2列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否

有95輛把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān).

人次W400人次》400

空氣質(zhì)量好

空氣質(zhì)量不好

附?/二____…兒)_____

叩…(a+b)(c+d)(a+c)(b+d)'

0.0500.0100.001

Ao3.8416.63510,828

彳解析(1)由所給數(shù)據(jù),該市一天的空氣質(zhì)量等級為1,2,3,4的概率的估計值如下表:

空氣質(zhì)量等級1234

概率的估計值0.430.270.210.09

(2)一天中到該公園鍛煉的平均人次的估計值為京X(100X20+300X35+500X45),350.

⑶根據(jù)所給數(shù)據(jù),可得2X2列聯(lián)表:

人次W400人次>400

空氣質(zhì)量好3337

空氣質(zhì)量不好228

根據(jù)列聯(lián)表得“00X(33X8-22X37)工£

55x45x70x30

由于5.820〉3,841,故有95舶勺把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān).

I夯基提能作亞|

A組基礎(chǔ)達(dá)標(biāo)

1.(2020安徽淮南月考)變量X與y相對應(yīng)的一組數(shù)據(jù)為

(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量〃與『相對應(yīng)的一組數(shù)據(jù)為

(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).△表示變量?與X之間的線性相關(guān)系數(shù),不表示

變量/與〃之間的線性相關(guān)系數(shù),則()

A.涼水0B.0<*QC."0"D.r2=r1

答案C對于變量Y與4而言,HfiX的增大而增大,故Y與X成正相關(guān),即石〉0;對于變量「與

〃而言"/隨〃的增大而減小,故,與U成負(fù)相關(guān),即水0,故選C.

2.(2020課標(biāo)全國I,5,5分)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單

位:t)的關(guān)系,在20個不同的溫度條件下進(jìn)行種子發(fā)芽實驗,由實驗數(shù)據(jù)(必必)(;=1,2,…,20)

得到下面的散點圖;

由此散點圖,在10℃至4(TC之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度X的

回歸方程類型的是()

A.y=a^bxB.六肝加C.片行6e'D.y=a^blnx

答案D觀察題中散點圖可知,散點圖用光滑曲線連接起來比較接近對數(shù)型函數(shù)的圖象,故選D.

3.(2020江西南昌大學(xué)附中模擬)某公司在2015-2019年的收入與支出情況如下表所示:

收入4億元)2.22.64.05.35.9

支出y(億元)0.21.52.02.53.8

根據(jù)表中數(shù)據(jù)可得回歸方程為尸0.8Ha,依此估計該公司收入為8億元時的支出為()

A.4.2億元B.4.4億元C.5.2億元口.5.4億元

答案C

4.為了解某社區(qū)居民購買水果和牛奶的年支出費(fèi)用與購買食品的年支出費(fèi)用的關(guān)系,隨機(jī)調(diào)查

了該社區(qū)5戶家庭,得到如下統(tǒng)計表:

購買食品的年支

2.092.152.502.842.92

出費(fèi)用"萬元

購買水果和牛奶的

1.251.301.501.701.75

年支出費(fèi)用"萬元

根據(jù)上表可得回歸方程y%戶Q,其中加0.59,a-y-bxf據(jù)此估計,該社區(qū)一戶購買食品的年支出

費(fèi)用為3.00萬元的家庭購買水果和牛奶的年支出費(fèi)用約為()

A.1.795萬元B.2.555萬元

C.1.915萬元D.1.945萬元

2,09十2,15十2,50十2,84+2.92_250(萬元)

答案AX'

-1.25+1.30+1.50+1.70+1.75.「“十一、

y=---------------------=L50(77兀)

匕二0.59,則好片加口).025,y=0.59Ao.025,故該社區(qū)購買食品的年支出費(fèi)用為3.00萬元的家庭

購買水果和牛奶的年支出費(fèi)用約為y=0.59X3.00+0.025=1.795(萬元).

5.為了研究某班學(xué)生的腳長x(單位:用米)和身高y(單位:厘米)的關(guān)系,從該班隨機(jī)抽取10名

學(xué)生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與>之間有線性相關(guān)關(guān)系,設(shè)其回歸直線方程為點

1010

已知E出=225,Ey尸1600,加4.該班某學(xué)生的腳長為24,據(jù)此估計其身高為()

i=li=l

A.ieoB.163C.166D.170

答案C由題意可知工二22.5,尸160,?',160=4X22.5+a,解得Q=70,?',尸4肝70,?'.當(dāng)產(chǎn)24

時,發(fā)4X24+70=166,故選C.

6.某單位為了了解用電量y(千瓦時)與氣溫x(C)之間的關(guān)系,隨機(jī)統(tǒng)計了某4天的用電量與當(dāng)

天氣溫,并制作了如下對照表:

氣溫(℃)181310-1

用電量(千瓦時)24343864

由表中數(shù)據(jù)得回歸直線方程度從葉。中的爐-2,預(yù)測當(dāng)氣溫為-4c時,用電量為千瓦

時.

答案68

解析回歸直線過樣本點的中心區(qū)》),由已知得*吧產(chǎn)二10,歹二2.34:38+64二10,將(4,物)

代入y二-2戶a,解得a=60,則/-2m'60、當(dāng)行-4時,盧(-2)X(-4)+60=68,即當(dāng)氣溫為-4℃時,用

電量約為68千瓦時.

7.一個車間為了規(guī)定工時,需要確定加工零件所花費(fèi)的時間,為此進(jìn)行了10次試驗來收集數(shù)據(jù),

由第,.次試驗零件個數(shù)元(單位:個)與加工零件所花費(fèi)的時間匕(單位:小時)的數(shù)據(jù)資料,得

10101010

L%r80,Z%二20,Lx^=184,X壯二720,那么加工零件所花費(fèi)的時向y與零件個數(shù)¥之間的線

i=li=li=li=l

性回歸方程為.

答案y=0.3六0.4

解析爐10,所以工二二£々=£=8,歹=二£=個=2,又Exf-/]J2=720-

nf=i10"i=l10[=i

n*

10X82=80,E即%-麗=184-10X8X2=24,由此得b=-=0.3,a=y-hx=2-0,3X8=-0,4,

i=l80

故所求線性回歸方程為y=0.3J-0.4.

8.(2019河北名校聯(lián)考)某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在

[29.94,30.06)內(nèi)的零件為優(yōu)質(zhì)品,從兩個分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得

如下統(tǒng)計表:

甲廠:

分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)

頻數(shù)126386182

分組[30.02,30.06)[30.06,30.10)[30.10,30.14]

頻數(shù)92614

乙廠:

分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)

頻數(shù)297185159

分組[30.02,30.06)[30.06,30.10)[30.10,30.14]

頻數(shù)766218

(1)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;

⑵由以上統(tǒng)計數(shù)據(jù)完成下面2X2列聯(lián)表,并判斷是否有99血把握認(rèn)為“兩個分廠生產(chǎn)的零件

的質(zhì)量有差異”.

甲廠乙廠總計

優(yōu)質(zhì)品

非優(yōu)質(zhì)品

總計

附:鼠宙窗然

0.0500.0250.0100.0050.001

k3.8415.0246.6357.87910.828

解析⑴從甲廠抽查的500件產(chǎn)品中有360件優(yōu)質(zhì)品,從而估計甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率為

夢1。眸72%;

從乙廠抽查的500件產(chǎn)品中有320件優(yōu)質(zhì)品,從而估計乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率為

320

薪X10。依64%

(2)完成的2X2列聯(lián)表如下:

甲廠乙廠總計

優(yōu)質(zhì)品360320680

非優(yōu)質(zhì)品140180320

總計5005001000

由表得禰號恐鬻等?,353>6,635,所以有9網(wǎng)把握認(rèn)為“兩個分廠生產(chǎn)的零件

的質(zhì)量有差異”.

B組能力拔高

9.某公司為了了解廣告投入對銷售收益的影響,在若干地區(qū)各投入4萬元廣告費(fèi)用,并將各地的

銷售收益繪制成頻率分布直方圖(如圖所示).由于工作人員操作失誤,橫軸的數(shù)據(jù)丟失,但可以

確定橫軸是從0開始計數(shù)的.

(1)根據(jù)頻率分布直方圖計算圖中各小長方形的寬度;

(2)估計該公司投入4萬元廣告費(fèi)用之后,對應(yīng)的銷售收益的平均值(以各組的區(qū)間中點值代表

該組的取值);

(3)該公司按照類似的研究方法,測得另外一些數(shù)據(jù),并整理得到下表:

廣告投入>(單位:萬元)12345

銷售收益y(單位:萬元)2327

表中的數(shù)據(jù)顯示,X與y之間存在線性相關(guān)關(guān)系,請將⑵中的結(jié)果填入空白欄,并求出y關(guān)于

彳的線性回歸方程.

_n__n__

£(xrx)(yry)£x^-nxy

相關(guān)公式:加3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論