版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第三節(jié)統(tǒng)計案例
學(xué)習(xí)要求-公眾號:新課標(biāo)試卷:1,會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,會利用散點圖認(rèn)識變
量間的相關(guān)關(guān)系,
2,了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.
3.了解獨(dú)立性檢驗(只要求2X2列聯(lián)表)的基本思想、方法及其簡單應(yīng)用,了解回歸分析的
基本思想、方法及其簡單應(yīng)用,在本小節(jié)中,需要了解一些常見的統(tǒng)計方法,并能應(yīng)用這些方法
解決一些實際問題.
必備知識?整合
L兩個變量的線性相關(guān)
(1)正相關(guān):
在散點圖中,點散布在從①左下角到②右上角的區(qū)域,對于兩個變量的這種相關(guān)關(guān)
系,我們將它稱為正相關(guān).
(2)負(fù)相關(guān):
在散點圖中,點散布在從③左二角到⑷右下角的區(qū)域,對于兩個變量的這種相關(guān)關(guān)
系,我們將它稱為負(fù)相關(guān).
(3)線性相關(guān)關(guān)系、回歸直線:
如果散點圖中點的分布從整體上看大致在⑤.一條直線附近,那么就稱這兩個變量之間
具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.
(4)最小二乘法:
求回歸直線,使得樣本數(shù)據(jù)的點到它的⑥.距離的平方和最小的方法叫做最小二乘法.
(5)回歸方程:
方程y功肝。是具有線性相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)(打%),(心④,…,(即人)的回歸
方程,其中a”是待定參數(shù).
n
E(xrx)(yry)
b=
nQ
L(片9)2MJ卜戒
1=1
a=?y-bx,
2.回歸分析
⑴回歸分析是對具有⑧」的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法.
(2)樣本點的中心:
nn
對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(為加,(勒必),…,(及外茂工£孫歹二工£如⑨
^i=ii=i
為樣本點的中心.
Zxiyrnxy
(3)相關(guān)系數(shù):r=
當(dāng)r>0時,表明兩個變量⑩正相關(guān);
當(dāng)2<0時,表明兩個變量?負(fù)相關(guān),
廠的絕對值越接近于1,表明兩個變量的線性相關(guān)性?越強(qiáng).2的絕對值越接近于0,表明
兩個變量之間?幾乎不存在線性相關(guān)關(guān)系,通常如大于或等于?0.75時,認(rèn)為兩個變量
有很強(qiáng)的線性相關(guān)性,
3.獨(dú)立性檢驗
⑴分類變量:變量的不同“值”表示個體所屬的?不同類別,像這樣的變量稱為分類變
量.
⑵列聯(lián)表:列出的兩個分類變量的?頻數(shù)表,稱為列聯(lián)表,一般地,假設(shè)有兩個分類變量
才和K它們的可能取值分別為{打而}和{y.,同,其樣本頻數(shù)列聯(lián)表(稱為2X2列聯(lián)表)為
總計
X\ab升b
照Cdc^d
總計卅CKd
則可構(gòu)造一個隨機(jī)變量〃=?,…,其中爐?外加Nd.
一(a+b)(c+d)(a+c)(b+d)-----------
(3)獨(dú)立性檢驗:
利用獨(dú)立性假設(shè)、隨機(jī)變帚?K來確定是否有一定的把握認(rèn)為“兩個分類變量?有
關(guān)系”的方法稱為兩個分類變量的獨(dú)立性檢驗.
OSM
1,判斷正誤(正確的打“J”,錯誤的打“X”),
(1)“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的成績成正相關(guān)關(guān)系.()
(2)通過回歸直線方程y%戶a可以估計預(yù)報變量的取值和變化趨勢.()
(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進(jìn)行相關(guān)性檢驗.
()
⑷事件4關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的尤的觀測值越大.()
答案⑴J⑵J(3)X⑷J
2.根據(jù)如下樣本數(shù)據(jù);
X34567
y4.02.5-0.50.5-2.0
得到的回歸方程為尸力代出若折7.9,則x每增加一個單位,y就()
A.增加1.4個單位B.減少1.4個單位
C.增加1.2個單位D.減少1.2個單位
答案B根據(jù)樣本數(shù)據(jù)可得,專5,聲0.9,由于樣本點的中心伉力滿足尸6代&,所以
0.9二6X5+7.9,可得IF-\.4.故選B.
3.(人教A版選修2-3P97習(xí)題3.2T1改編)在研究吸煙是否對患肺癌有影響的案例中,通過
對列聯(lián)表的數(shù)據(jù)進(jìn)行處理,計算得到隨機(jī)變量『的觀測值左056,632,在犯錯誤的概率不超過
0.0C1的前提下,下面說法正確的是()
下表供參考:
P/2睛0.0250.0100.0050.001
標(biāo)5.0246.6357.87910.828
A.由于隨機(jī)變量V的觀測值力10.828,所以“吸煙與患肺癌有關(guān)系并且這個結(jié)論犯錯誤的
概率不超過0.001
B.由于隨機(jī)變量斤的觀測值828,所以“吸煙與患肺癌有關(guān)系”:并且這個結(jié)論犯錯誤的
概率不低于0.001
C.由于隨機(jī)變量^的觀測值力10.828,所以“吸煙與患肺癌沒有關(guān)系”,并且這個結(jié)論犯錯誤
的概率不超過0.001
D.由于隨機(jī)變量/的觀測值010.828,所以“吸煙與患肺癌沒有關(guān)系”,并且這個結(jié)論犯錯誤
的概率不低于0.001
答案A因為隨機(jī)變量〃的觀測值妗56.632〉10.828,
所以在犯錯誤的概率不超過0.001的前提下,認(rèn)為“吸煙與患肺癌有關(guān)系”.
故選A.
4.(人教B版選修2-3P94A5改編)己知兩個變量為y的關(guān)系可以近似地用函數(shù)萬a爐來表示,
通過兩邊取自然對數(shù)變換后得到一個線性函數(shù),利用最小二乘法得到的線性回歸方程為
下2+0.5匕則乂y的近似函數(shù)關(guān)系式為.
答案y=exi
解析令z=ln7=ln(a/)=lna+Mnx,
對照回歸方程r2+0.5右
毗/"礙
???My的近似函數(shù)關(guān)系式為片。小.
5,(易錯題)為了考察某種病毒疫苗的效果,現(xiàn)隨機(jī)抽取100只小鼠進(jìn)行試驗,得到如下列聯(lián)表:
感染未感染合計
服用104050
未服用203050
合計3070100
附,OK?
P(冷L)0.1000.0500.0250.010
k02.7063.8415.0246.635
根據(jù)上表,有的把握認(rèn)為“小鼠是否被感染與服用疫苗有關(guān)”.
答案95舟
解析根據(jù)列聯(lián)表中數(shù)據(jù),計算出駕端哼*4.762>3.841,
對照數(shù)表知,有95微把握認(rèn)為“小最是否被感染與服用疫苗有關(guān)”.
。易錯分析由于對2X2列聯(lián)表中國Ac、d的位置不清楚,在代入公式時代錯了數(shù)值導(dǎo)致計
算結(jié)果錯誤.
關(guān)鍵能力,突破
考點=相關(guān)關(guān)系的判斷值既
1.在一組樣本數(shù)據(jù)(鳥凹),(羯血,…,(島%)(廬2,xh及,…,兒不全相等)的散點圖中,若
所有樣本點(居7.)(7=1,2,…,〃)都在直線吁戶1上,則這組樣本數(shù)據(jù)的相關(guān)系數(shù)為()
A.-lB.0
C.-D.1
2
答案I)所有樣本點均在同一條斜率為正數(shù)的直線上,則樣本的相關(guān)系數(shù)最大,為1,所以
選D.
2.(2020湖南張家界月考)對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其相關(guān)系數(shù)的
比較,正確的是)
35
30
25
20
15
105
0
相關(guān)系敢為。相關(guān)系數(shù)為,:
(D②
相關(guān)系數(shù)為。和關(guān)系數(shù)為。
③④
A.打<匕<0<舄<丁1
B.司5<0"1您
C.水水0〈水石
D.冰水0<水舄
答案A易知題中圖①與圖③是正相關(guān),圖②與圖④是負(fù)相關(guān),且圖①與圖②中的樣本點
集中分布在一條直線附近,則小水0(費(fèi)",故選A.
3.某公司的科研人員在7塊并排、形狀和大小相同的試驗田上對某棉花的新品種進(jìn)行施化
肥量>對產(chǎn)量y影響的試驗,得到如下表所示的一組數(shù)據(jù)(單位:kg):
施化肥量X15202530354045
棉花產(chǎn)量y330345365405445450455
⑴畫出散點圖;
(2)判斷施化肥量x與棉花產(chǎn)量y是否具有相關(guān)關(guān)系.
解析(D散點圖如圖所示:
梅花產(chǎn)餐”kg
500
450
400
200
01020304050隨化肥fitx/ka
(2)由散點圖知,各組數(shù)據(jù)的對應(yīng)點大致都在一條直線附近,所以施化肥量x與棉花產(chǎn)量y
具有線性相關(guān)關(guān)系.
名師點評
判斷相關(guān)關(guān)系的方法:
(1)回歸方程法:利用回歸方程中x的系數(shù)b的正負(fù)判斷.
(2)散點圖法;如果所有的樣本點都落在某一曲線附近,那么變量之間就有相關(guān)關(guān)系;如果所
有的樣本點都落在某一直線附近,那么變量之間就有線性相關(guān)關(guān)系.
(3)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判斷,|「越趨近于1,相關(guān)性越強(qiáng).
考點且回歸分析,多元分析‘
角度一線性回歸方程及應(yīng)用
典例1(2020山西長治模擬)《中國詩詞大會》是中央電視臺于2016年推出的原創(chuàng)文化
類電視節(jié)目,中央電視臺為了解該節(jié)目的收視情況,抽查北方與南方各5個城市,得到觀看該節(jié)
目的人數(shù)(單位:千人)如莖葉圖所示,但其中一個數(shù)字被污損.
北方南方
897378
210806
(1)若將被污損的數(shù)字視為0十中10個數(shù)字中的一個,求北方觀眾平均人數(shù)超過南方觀眾
平均人數(shù)的概率;
(2)該節(jié)目的播出極大激發(fā)了觀眾學(xué)習(xí)詩詞的熱情,現(xiàn)在隨機(jī)統(tǒng)計了4位觀眾每周學(xué)習(xí)詩詞
的平均時間y(單位:小時)與年齡爪單位:歲),并制作了對照表(如表所示):
年齡x(單位:歲)20304050
每周學(xué)習(xí)詩詞的
33.53.54
平均時間y(單位:小時)
由表中數(shù)據(jù)分析,x與y成線性相關(guān)關(guān)系,試求線性回歸方程,并預(yù)測年齡為60歲的觀眾每
周學(xué)習(xí)詩詞的平均時間.
“
£位
1
Qb
n
22=y-
E-_
X.一nX
I1
=l
解析(1)設(shè)被污損的數(shù)字為X,由北方觀眾平均人數(shù)超過南方觀眾平均人數(shù)得
78+79+82+81+80.73+77+78+86+80+X”
〉=>Kb,
5--------------5
即A=0,1,2,3,4,5,
二所求概率嘮
(2)x=ix(20+30+40+50)=35,
4
歹[x(3+3.5+3.5+4)=3.5,
A4r升490,
44
又£xy=20X3+30X3.5+40X3.5+50X4=505,£x?=202+302+402+502=5400,
i=ii=i
八
?,?1b=--5-0-5-4-9-0-r=0.03,
5400-4x35?
Aa=3.5-0.03X35=2.45,
Ay=0.03外2,45,
.當(dāng)戶60時,y二4.25.
故年齡為60歲的觀眾每周學(xué)習(xí)誓詞的平均時間大約為4.25小時,
角度二非線性回歸方程及應(yīng)用
典例2(2020安徽黃山二模)某苗圃基地擬選用某種植物支援荒山綠化,在相同種植條件
下,對該種植物幼苗從種植之日起,第x天的高度y(單位:cm)進(jìn)行觀測,下表是某株幼苗的觀測
數(shù)據(jù):
第才/p>
高度y/fem0479111213
作出如下散點圖:
⑴請根據(jù)散點圖判斷尸3戶人與尸6&+d中哪一個更適宜作為幼苗高度/關(guān)于時間x的回
歸方程類型;(給出判斷即可,不必說明理由)
(2)根據(jù)⑴的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程.已知幼苗的高度達(dá)到29cm
才可以移植,預(yù)測苗圃基地需要培育多長時間.
777777
Ex:
EXjEXiYiE同
rJ1
i=l營湎1?=1中<=i1=1i=i
140285615674676283
解析(1)由散點圖可知,產(chǎn)Sr更適宜作為幼苗高度y關(guān)于時間x的回歸方程類型.
⑵令〃二爪,則尸川G+d構(gòu)造新的成對數(shù)據(jù),如下表所示:
/p>
P=Vx1234567
y0479111213
求得百4,7=8.
£-
M〃
-r
iy埠UV
-283-7X4X859
i=7l-2U
£-1407X1628,
』17rg
3
一
平-
.
r-c-7
,?.y關(guān)于〃的回歸方程為蟾
Zo7
則y關(guān)于x的回歸方程為胃岳年
3
-
取尸29,可得29二?7解得g195天.
Zb
???預(yù)測苗圃基地需要培育195天.
角度三相關(guān)系數(shù)及其應(yīng)用
典例3(2020課標(biāo)全國〃,18,12分)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動
物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些
地塊中用簡單隨機(jī)抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)3,z)(;=1,2,…,20),其
中>和乂分別表示第/個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得
2020202020
Zx=60,Zyp\200,£(J-X)2=80,£(必-歹尸二9000,Z(y-y)=800.
i=li=li=li=li=l
(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動
物數(shù)量的平均數(shù)乘地塊數(shù));
⑵求樣本u,yj(7=1,2,…,20)的相關(guān)系數(shù)(精確到求01);
(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地
區(qū)這種野生動物數(shù)量更準(zhǔn)確的估計,請給出一種你認(rèn)為更合理的抽樣方法,并說明理由.
n
附:相關(guān)系數(shù)廣2n2,V2^1.414.
££心
-X)
=l(=1
20
解析⑴由己知得樣本平均數(shù)方1卷與匕*。,從而該地區(qū)這種野生動物數(shù)量的估計值為
60X200=12000.
⑵樣本(檢入)(凡2,…,20)的相關(guān)系數(shù)
20
廠¥產(chǎn)田(力爭____2*o94
J2020V80X90003
(3)分層抽樣:根據(jù)植物覆蓋面積的大小對地塊分層,再對200個地塊進(jìn)行分層抽樣.
理由如下:由⑵知各樣區(qū)的這種野生動物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān).由于各地塊間
植物覆蓋面積差異很大,從而各地塊間這種野生動物數(shù)量差異也很大,采用分層抽樣的方法較好
地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致也提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動
物數(shù)量更準(zhǔn)確的估計,
名師點評
L線性回歸分析問題:
(1)求線性回歸方程:
結(jié)合公式和已知數(shù)據(jù),求出取歹等數(shù)據(jù),再求回歸系數(shù)b,a.
(2)利用回歸方程進(jìn)行預(yù)測,把線性回歸方程看作一次函數(shù),求函數(shù)值.
(3)利用回歸直線判斷正、負(fù)相關(guān),系數(shù)匕決定是正相關(guān)還是負(fù)相關(guān),
2.模型擬合效果的判斷:
⑴殘差平方和越小,模型的擬合效果越好.
(2)相關(guān)指數(shù)〃越大,模型的擬合效果越好.
3,非線性回歸方程的求法:
⑴根據(jù)原始數(shù)據(jù)(>/)作出散點圖,
(2)根據(jù)散點圖選擇恰當(dāng)?shù)臄M合函數(shù).
(3)作恰當(dāng)?shù)淖儞Q,將其轉(zhuǎn)化成線性函數(shù),求線性回歸方程.
(4)在(3)的基礎(chǔ)上通過相應(yīng)變換,即可得到非線性回歸方程.
哥對訓(xùn)練
1.已知某企業(yè)近3年的前7個月的月利潤(單位:百萬元)如下面的折線圖所示:
⑴試問這3年的前7個月中哪個月的月平均利潤最高;
⑵通過計算判斷這3年的前7個月的總利潤的發(fā)展趨勢;
⑶第3年的前4個月的數(shù)據(jù)如'F表,用線性回歸的擬合模型估計第3年8月份的利潤.
月份x1234
利潤y(單位:百萬元)4466
由?八Tu£蟲㈤仇-y)^xnxy
相關(guān)公式:b土、----廣寧--i-y-r---1
ET廠后2£%卜府2
1=1i=i1
a=y-bx.
解析(1)由折線圖可知這3年的5月和6月的平均利潤最高.
(2)第1年的前7個月的總利潤為
1+2+3+5+6+7+4=28(百萬元),
第2年的前7個月的總利潤為2+5+5+4+5+5+5=31(百萬元),
第3年的前7個月的總利澗為4+4+6+6+7+6+8=41(百萬元),
故這3年的前7個月的總利潤呈上升趨勢.
2222
(3)Vx=2.5,y=5,,Sx?=l+2+3+4=30,X4+2X4+3X6+4X6=54,二吟治簧。8,
a-5-2.5X0.8=3,/.y=0.8x+3,
當(dāng)齊8時,y=0,8X8+3=9,4.
,估計第3年8月份的利潤為9.4百萬元.
2.(2019廣西聯(lián)考)某公司為了準(zhǔn)確地把握市場,做好產(chǎn)品生產(chǎn)計劃,對過去四年的數(shù)據(jù)進(jìn)行整理
得到了第x年與年銷售量「(單位:萬件)之間的關(guān)系如表:
X1234
y12284256
⑴在圖中畫出表中數(shù)據(jù)的散點圖;
兩件
60
50
40
30
20
10
―01~123^1/4
(2)根據(jù)(1)中的散點圖判斷y與x的回歸模型的類型,并用相關(guān)系數(shù)加以說明;
⑶建立y關(guān)于>的回歸方程,預(yù)測第5年的銷售量約為多少.
I44£(x--x)(y.-y)
附力r(y廣力2^327,遙石2.24,£幾片418.相關(guān)系數(shù)「"藍(lán)'{回歸方程飛出
N1=11=1
£片力中才y_—
的斜率和截距的最小二乘估計分別為如二---------,spy-bx.
Lxf-nx2
解析(1)作出的散點圖如圖:
0I234〃年
(2)由⑴散點圖可知,各點大致分布在一條直線附近,故可用線性回歸模型擬合y與x的關(guān)系.
又打,爐*£*=30,
//i=i
£](后動(必-歹)二*0=&y=418-4x|Xy=73,
J?]?療)2=Jg*4.2=卜0-4乂(|)二帆、2,24,
4
S(xrx)(yry)
一i=i73
1_r二七一--七0.9966.
2.24X32.7
2
_E(xrx).L(yry)
,?)與》的相關(guān)系數(shù)近似為0.9966,說明y與丫的線性相關(guān)程度相當(dāng)強(qiáng),,可以用線性回歸模
型擬合y與x的關(guān)系.
..4____
£XiVi-4xy
⑶由⑵知設(shè)y=b^Q,b=氣-----=-
£備4連5
i=i123
a于位:2.故y關(guān)于*的回歸方程為y號尸2,當(dāng)尸5時,y—X5-2二71,
預(yù)測第5年的銷售量約為71萬件.
3.(2020福建南平三模)千百年來,人們一直在通過不同的方式傳遞信息.在古代,烽火狼煙、飛
鴿傳書、快馬驛站等通信方式被人們廣泛傳知;第二次工業(yè)革命后,科技的進(jìn)步帶動了電訊事業(yè)
的發(fā)展,電報、電話的發(fā)明讓通信領(lǐng)域發(fā)生了翻天覆地的變化;之后,計算機(jī)和互聯(lián)網(wǎng)的出現(xiàn)則
使得“千里眼”“順風(fēng)耳”變?yōu)楝F(xiàn)實,……,此時此刻,5G的到來即將給人們的生活帶來顛覆性
的變革.某科技創(chuàng)新公司基于領(lǐng)先的技術(shù)水平,豐富的移動互聯(lián)網(wǎng)應(yīng)用等明顯優(yōu)勢,該公司的5G
經(jīng)濟(jì)收入在短期內(nèi)逐月攀升,業(yè)內(nèi)預(yù)測,該創(chuàng)新公司在第1個月至第7個月的5G經(jīng)濟(jì)收入y(單
(1)為了更充分運(yùn)用大數(shù)據(jù)、人工智能、5G等技術(shù),公司需要派出員工實地考察,檢測產(chǎn)品性能
和使用狀況,公司領(lǐng)導(dǎo)要從報名的五名科技人員從B、C、D、£中隨機(jī)抽取3個人前往,則/、B
同時被抽到的概率為多少?
⑵根據(jù)散點圖判斷,尸己盧6與片c?人由c,d均為大于零的常數(shù))哪一個更適宜作為5G經(jīng)濟(jì)
收入y關(guān)于月份x的回歸方程類型?(給出判斷即可,不必說明理由)并根據(jù)你的判斷結(jié)果及表中
的數(shù)據(jù),求出y關(guān)于x的回歸方程;
⑶請你預(yù)測該公司8月份的5G經(jīng)濟(jì)收入.
參考數(shù)據(jù):
其中設(shè)v=igy,右igy(-
參考公式:對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(檢匕)(41,2,3,…,力,其回歸直線〃邛ea的斜率
.n_八
Lx;v;-n5cv?
和截距的最小二乘估計公式分別為用耳「廣a行邛x.
a/,nx
解析(1)從爾氏C、〃、£中隨機(jī)抽取3個人,其基本事件為
(44。,(44〃),(4氐£),(4C〃),(4C£),(4〃£),(&C;鹵,(&CQ,(4〃"),匕〃£),共
10個,48同時被抽到的事件為(45,0,UB,。),(4&£),共3個,則48同時被抽到的概率為
3
10,
⑵根據(jù)散點圖判斷,產(chǎn)。?"更適宜作為5G經(jīng)濟(jì)收入y關(guān)于月份x的回歸方程類型.
對六c,〃兩邊同時取常用對數(shù),得1g片lg(c?(/)=lgc+xlgd./.rigc+jlgd,
Vx=y=4,萬二產(chǎn)?L54,_£xf=140,
.7
J^V_50-12-7X4X1.54,^^
d2
.L?-7X140-7X4228
把樣本中心點(4,1.54)代入尸1gc+0,25?茍得1g北0.54,
,折0.54+0.25*,即1g發(fā)0.54+0.25*,?'.y關(guān)于》的回歸方程為
y二1嚴(yán)電25n0°"X(IO025)-3.47X10*25;
⑶由⑵得力二3.47X10產(chǎn)
把年8代入上式得,y=3.47X10°25XM47,
故預(yù)測該公司8月份的5G經(jīng)濟(jì)收入為347百萬元.
整直目獨(dú)立性檢驗葡頻
典例4某工廠有25周歲以上(含25周歲)的工人300名,25周歲以下的工人200名,為研
究工人的日平均生產(chǎn)件數(shù)是否與年齡有關(guān),現(xiàn)采用分層抽樣的方法,從中選取了100名工人,先
統(tǒng)計了他們某月的日平均生產(chǎn)件數(shù),然后按工人的年齡分為“25周歲以上(含25周歲)”和“25
周歲以下”兩組,再將兩組工人的日平均生產(chǎn)件數(shù)分成5
組:[50,60),[60,70),[70,80),[80,90),[90,100],分別加以統(tǒng)計,得到如圖所示的頻率分布直
方圖.
典率
組距
0.0330.....................[―
0.0200.....................
QXX1S0----------?
<)-1mloo.4的0平
25則歲以的25周歲聞均生產(chǎn)的k
⑴根據(jù)“25周歲以上(含25周歲)組”的頻率分布直方圖,求25周歲以上(含25周歲)組
的工人的日平均生產(chǎn)件數(shù)的中位數(shù)的估計值(四舍五入保留整數(shù));
(2)規(guī)定日平均生產(chǎn)件數(shù)不少于80的工人為生產(chǎn)能手,請你根據(jù)己知條件完成2X2列聯(lián)表,
并判斷是否有90黜把握認(rèn)為“生產(chǎn)能手與工人所在的年齡組有關(guān)”.
生產(chǎn)能手非生產(chǎn)能手合計
25周歲以上(含25周歲)組
25周歲以下組
合計
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
P(儲]%)0.1000.0500.0100.001
kn2.7063.8416.63510.828
解析采用分層抽樣的方法,從“25周歲以上(含25周歲)組”應(yīng)選取工人
100X正抵=60(名),從“25周歲以下組”應(yīng)選取工人100X正巖:40(名).
(1)由“25周歲以上(含25周歲〕組”的頻率分布直方圖可知,其中位數(shù)為
70+iox空牌吧三73(件),
綜上,25周歲以上(含25周歲)組的工人日平均生產(chǎn)件數(shù)的中位數(shù)的估計值為73件.
(2)由頻率分布直方圖可知,25周歲以上(含25周歲)組的生產(chǎn)能手共有60X[(0,020
0+0,0050)X10kl5(名),25周歲以下組的生產(chǎn)能手共有40X[(0,0325+0,005
0)X10]=15(名),則2X2列聯(lián)表如下:
生產(chǎn)非生產(chǎn)
合計
能手能手
25周歲以上
154560
(含25周歲)組
25周歲以下組152540
合計3070100
冰型蒜絮手書司.786〈2.706,所以沒有90嫡把握認(rèn)為“生產(chǎn)能手與工人所在的
年齡組有關(guān)”.
方法技巧
獨(dú)立性檢驗的一般步驟
1.求“有多大把握”“犯錯誤的概率”的題型:
(1)根據(jù)樣本數(shù)據(jù)列出2X2列聯(lián)表;
(2)計算隨機(jī)變量片的觀測值k,查表確定臨界值心(符合42外的最大Ab);
(3)推斷有口-戶(筋X100軸)把握認(rèn)為有關(guān)系,或在犯錯誤的概率不超過P(r2禽)的前
提下認(rèn)為有關(guān)系,
2.判斷是否有回舶<)把握的題型:
(1)根據(jù)樣本數(shù)據(jù)列出2X2列聯(lián)表;
⑵計算隨機(jī)變量尸的觀測值k,根據(jù)川粉[1-尸(/》左)]X100%求產(chǎn)(左2%)),查表確定臨界
值均,比較北與4的大小;
(3)判斷是否有用轆]把握認(rèn)為有關(guān)系.
哥對訓(xùn)練
(202()課標(biāo)〃健,18,12分)某學(xué)生興趣小組隨機(jī)調(diào)查了某市100天中每天的空氣質(zhì)量等級和當(dāng)
天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):
鍛煉人次
[0,200](200,400](400,600]
空氣質(zhì)量等級
1(優(yōu))21625
2(良)51012
3(輕度污染)678
4(中度污染)720
(1)分別估計該市一天的空氣質(zhì)量等級為1,2,3,4的概率;
(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表);
⑶若某天的空氣質(zhì)量等級為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)量等級為3或4,
則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的2X2列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否
有95輛把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān).
人次W400人次》400
空氣質(zhì)量好
空氣質(zhì)量不好
附?/二____…兒)_____
叩…(a+b)(c+d)(a+c)(b+d)'
0.0500.0100.001
Ao3.8416.63510,828
彳解析(1)由所給數(shù)據(jù),該市一天的空氣質(zhì)量等級為1,2,3,4的概率的估計值如下表:
空氣質(zhì)量等級1234
概率的估計值0.430.270.210.09
(2)一天中到該公園鍛煉的平均人次的估計值為京X(100X20+300X35+500X45),350.
⑶根據(jù)所給數(shù)據(jù),可得2X2列聯(lián)表:
人次W400人次>400
空氣質(zhì)量好3337
空氣質(zhì)量不好228
根據(jù)列聯(lián)表得“00X(33X8-22X37)工£
55x45x70x30
由于5.820〉3,841,故有95舶勺把握認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān).
I夯基提能作亞|
A組基礎(chǔ)達(dá)標(biāo)
1.(2020安徽淮南月考)變量X與y相對應(yīng)的一組數(shù)據(jù)為
(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量〃與『相對應(yīng)的一組數(shù)據(jù)為
(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).△表示變量?與X之間的線性相關(guān)系數(shù),不表示
變量/與〃之間的線性相關(guān)系數(shù),則()
A.涼水0B.0<*QC."0"D.r2=r1
答案C對于變量Y與4而言,HfiX的增大而增大,故Y與X成正相關(guān),即石〉0;對于變量「與
〃而言"/隨〃的增大而減小,故,與U成負(fù)相關(guān),即水0,故選C.
2.(2020課標(biāo)全國I,5,5分)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單
位:t)的關(guān)系,在20個不同的溫度條件下進(jìn)行種子發(fā)芽實驗,由實驗數(shù)據(jù)(必必)(;=1,2,…,20)
得到下面的散點圖;
由此散點圖,在10℃至4(TC之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度X的
回歸方程類型的是()
A.y=a^bxB.六肝加C.片行6e'D.y=a^blnx
答案D觀察題中散點圖可知,散點圖用光滑曲線連接起來比較接近對數(shù)型函數(shù)的圖象,故選D.
3.(2020江西南昌大學(xué)附中模擬)某公司在2015-2019年的收入與支出情況如下表所示:
收入4億元)2.22.64.05.35.9
支出y(億元)0.21.52.02.53.8
根據(jù)表中數(shù)據(jù)可得回歸方程為尸0.8Ha,依此估計該公司收入為8億元時的支出為()
A.4.2億元B.4.4億元C.5.2億元口.5.4億元
答案C
4.為了解某社區(qū)居民購買水果和牛奶的年支出費(fèi)用與購買食品的年支出費(fèi)用的關(guān)系,隨機(jī)調(diào)查
了該社區(qū)5戶家庭,得到如下統(tǒng)計表:
購買食品的年支
2.092.152.502.842.92
出費(fèi)用"萬元
購買水果和牛奶的
1.251.301.501.701.75
年支出費(fèi)用"萬元
根據(jù)上表可得回歸方程y%戶Q,其中加0.59,a-y-bxf據(jù)此估計,該社區(qū)一戶購買食品的年支出
費(fèi)用為3.00萬元的家庭購買水果和牛奶的年支出費(fèi)用約為()
A.1.795萬元B.2.555萬元
C.1.915萬元D.1.945萬元
2,09十2,15十2,50十2,84+2.92_250(萬元)
答案AX'
-1.25+1.30+1.50+1.70+1.75.「“十一、
y=---------------------=L50(77兀)
匕二0.59,則好片加口).025,y=0.59Ao.025,故該社區(qū)購買食品的年支出費(fèi)用為3.00萬元的家庭
購買水果和牛奶的年支出費(fèi)用約為y=0.59X3.00+0.025=1.795(萬元).
5.為了研究某班學(xué)生的腳長x(單位:用米)和身高y(單位:厘米)的關(guān)系,從該班隨機(jī)抽取10名
學(xué)生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與>之間有線性相關(guān)關(guān)系,設(shè)其回歸直線方程為點
1010
已知E出=225,Ey尸1600,加4.該班某學(xué)生的腳長為24,據(jù)此估計其身高為()
i=li=l
A.ieoB.163C.166D.170
答案C由題意可知工二22.5,尸160,?',160=4X22.5+a,解得Q=70,?',尸4肝70,?'.當(dāng)產(chǎn)24
時,發(fā)4X24+70=166,故選C.
6.某單位為了了解用電量y(千瓦時)與氣溫x(C)之間的關(guān)系,隨機(jī)統(tǒng)計了某4天的用電量與當(dāng)
天氣溫,并制作了如下對照表:
氣溫(℃)181310-1
用電量(千瓦時)24343864
由表中數(shù)據(jù)得回歸直線方程度從葉。中的爐-2,預(yù)測當(dāng)氣溫為-4c時,用電量為千瓦
時.
答案68
解析回歸直線過樣本點的中心區(qū)》),由已知得*吧產(chǎn)二10,歹二2.34:38+64二10,將(4,物)
代入y二-2戶a,解得a=60,則/-2m'60、當(dāng)行-4時,盧(-2)X(-4)+60=68,即當(dāng)氣溫為-4℃時,用
電量約為68千瓦時.
7.一個車間為了規(guī)定工時,需要確定加工零件所花費(fèi)的時間,為此進(jìn)行了10次試驗來收集數(shù)據(jù),
由第,.次試驗零件個數(shù)元(單位:個)與加工零件所花費(fèi)的時間匕(單位:小時)的數(shù)據(jù)資料,得
10101010
L%r80,Z%二20,Lx^=184,X壯二720,那么加工零件所花費(fèi)的時向y與零件個數(shù)¥之間的線
i=li=li=li=l
性回歸方程為.
答案y=0.3六0.4
解析爐10,所以工二二£々=£=8,歹=二£=個=2,又Exf-/]J2=720-
nf=i10"i=l10[=i
n*
10X82=80,E即%-麗=184-10X8X2=24,由此得b=-=0.3,a=y-hx=2-0,3X8=-0,4,
i=l80
故所求線性回歸方程為y=0.3J-0.4.
8.(2019河北名校聯(lián)考)某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在
[29.94,30.06)內(nèi)的零件為優(yōu)質(zhì)品,從兩個分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得
如下統(tǒng)計表:
甲廠:
分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)
頻數(shù)126386182
分組[30.02,30.06)[30.06,30.10)[30.10,30.14]
頻數(shù)92614
乙廠:
分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)
頻數(shù)297185159
分組[30.02,30.06)[30.06,30.10)[30.10,30.14]
頻數(shù)766218
(1)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;
⑵由以上統(tǒng)計數(shù)據(jù)完成下面2X2列聯(lián)表,并判斷是否有99血把握認(rèn)為“兩個分廠生產(chǎn)的零件
的質(zhì)量有差異”.
甲廠乙廠總計
優(yōu)質(zhì)品
非優(yōu)質(zhì)品
總計
附:鼠宙窗然
0.0500.0250.0100.0050.001
k3.8415.0246.6357.87910.828
解析⑴從甲廠抽查的500件產(chǎn)品中有360件優(yōu)質(zhì)品,從而估計甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率為
夢1。眸72%;
從乙廠抽查的500件產(chǎn)品中有320件優(yōu)質(zhì)品,從而估計乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率為
320
薪X10。依64%
(2)完成的2X2列聯(lián)表如下:
甲廠乙廠總計
優(yōu)質(zhì)品360320680
非優(yōu)質(zhì)品140180320
總計5005001000
由表得禰號恐鬻等?,353>6,635,所以有9網(wǎng)把握認(rèn)為“兩個分廠生產(chǎn)的零件
的質(zhì)量有差異”.
B組能力拔高
9.某公司為了了解廣告投入對銷售收益的影響,在若干地區(qū)各投入4萬元廣告費(fèi)用,并將各地的
銷售收益繪制成頻率分布直方圖(如圖所示).由于工作人員操作失誤,橫軸的數(shù)據(jù)丟失,但可以
確定橫軸是從0開始計數(shù)的.
(1)根據(jù)頻率分布直方圖計算圖中各小長方形的寬度;
(2)估計該公司投入4萬元廣告費(fèi)用之后,對應(yīng)的銷售收益的平均值(以各組的區(qū)間中點值代表
該組的取值);
(3)該公司按照類似的研究方法,測得另外一些數(shù)據(jù),并整理得到下表:
廣告投入>(單位:萬元)12345
銷售收益y(單位:萬元)2327
表中的數(shù)據(jù)顯示,X與y之間存在線性相關(guān)關(guān)系,請將⑵中的結(jié)果填入空白欄,并求出y關(guān)于
彳的線性回歸方程.
_n__n__
£(xrx)(yry)£x^-nxy
相關(guān)公式:加3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年五年級上學(xué)期英語教師工作總結(jié)范例(二篇)
- 2025年產(chǎn)品銷售運(yùn)輸三方協(xié)議(2篇)
- 2025年亮化工程施工合同標(biāo)準(zhǔn)版本(4篇)
- 2025年臨時人員勞動合同常用版(2篇)
- 2025年個人購買墓地協(xié)議(2篇)
- 旗艦店鋪內(nèi)墻裝修工程協(xié)議
- 2025年度安全生產(chǎn)費(fèi)用使用監(jiān)督合同
- 2025年度城市綜合體安全保衛(wèi)服務(wù)合同范本
- 化妝品運(yùn)輸保險協(xié)議樣本
- 繩鋸切割樓板施工方案
- 內(nèi)地居民前往香港或者澳門定居申請表
- DB43-T 2612-2023林下竹蓀栽培技術(shù)規(guī)程
- (完整版)園藝產(chǎn)品貯藏與加工
- 高中體育與健康-足球踢墻式“二過一”戰(zhàn)術(shù)教學(xué)課件設(shè)計
- 三下《動物的一生》教材解讀
- 神木市孫家岔鎮(zhèn)神能乾安煤礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 非煤礦山安全應(yīng)急預(yù)案
- 高一英語閱讀理解專練20篇
- 浙江省公安民警心理測驗考試題目
- 一圖看懂《診所備案管理暫行辦法》學(xué)習(xí)解讀課件
- 工作票與安全施工作業(yè)票培訓(xùn)
評論
0/150
提交評論