版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
專題57成對數(shù)據(jù)的統(tǒng)計(jì)分析(新高考專用)
目錄
【知識(shí)梳理】................................................................2
【真題自測】................................................................4
【考點(diǎn)突破】................................................................9
【考點(diǎn)1】成對數(shù)據(jù)的相關(guān)性..................................................9
【考點(diǎn)2】回歸分析..........................................................11
【考點(diǎn)3】獨(dú)立性檢驗(yàn)........................................................14
【分層檢測】...............................................................18
【基礎(chǔ)篇】.................................................................18
【能力篇】.................................................................22
考試要求:
1.了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.
2.了解一元線性回歸模型和2X2列聯(lián)表,會(huì)運(yùn)用這些方法解決簡單的實(shí)際問題.
3.會(huì)利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析.
■“知識(shí)梳理
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系
兩個(gè)變量有關(guān)系,但又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱為
相關(guān)關(guān)系.
(2)相關(guān)關(guān)系的分類:正相關(guān)和負(fù)相關(guān).
(3)線性相關(guān)
一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,我們就稱這
兩個(gè)變量線性相關(guān).
一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量非線性相關(guān)或
曲線相關(guān).
2.樣本相關(guān)系數(shù)
⑴相關(guān)系數(shù)廠的計(jì)算
變量x和變量y的樣本相關(guān)系數(shù)r的計(jì)算公式如下:
11
S一M-y)
?=1
(2)相關(guān)系數(shù)r的性質(zhì)
①當(dāng)r>0時(shí),稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時(shí),成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)r=0時(shí),成對樣
本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)r的取值范圍為「一1,11
當(dāng)|r|越接近1時(shí),成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)|r|越接近0時(shí),成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
3.一元線性回歸模型
(1)經(jīng)驗(yàn)回歸方程與最小二乘法
我們將〈=£+:稱為y關(guān)于%的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱
為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的3二叫做。的最小二
2
乘估計(jì),
其中
nn
y
—?一1)(”?—J)Hx,yl,~ln^Jc~y
-i=i=1
b=—n
2v2
S(JC,—JC)ZJ/i-nx
=1i=i
a=y-bx.
(2)利用決定系數(shù)F刻畫回歸效果
(乂一3,尸
z
J?=l-—n
\、
:=1,收越大,即擬合效果越好,F(xiàn)越小,模型擬合效果越差.
4.列聯(lián)表與獨(dú)立性檢驗(yàn)
(1)2X2列聯(lián)表
一般地,假設(shè)有兩個(gè)分類變量X和匕它們的取值分別為{xi,基}和{”,"},其2X2列聯(lián)表
為
y
X合計(jì)
尸券
X~X\aba+b
X~X2cdc~\~d
合計(jì)a~\~cb+dn—a~\~b~\~c~\~d
⑵臨界值
H(nd-be")2
/=(小)(c+d)Q+c)?忽略/的實(shí)際分布與該近似分布的誤差后,對于任何
小概率值a,可以找到相應(yīng)的正實(shí)數(shù)Xa,使得「&三發(fā))=&成立.我們稱Xa為a的臨界值,這
個(gè)臨界值就可作為判斷H大小的標(biāo)準(zhǔn).
(3)獨(dú)立性檢驗(yàn)
基于小概率值a的檢驗(yàn)規(guī)則是:
當(dāng)三、我時(shí),我們就推斷Ho不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過a;
當(dāng)/2<羽時(shí),我們沒有充分證據(jù)推斷Ho不成立,可以認(rèn)為X和y獨(dú)立.
這種利用X2的取值推斷分類變量X和y是否獨(dú)立的方法稱為X2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立
性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).
下表給出了X2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值
3
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
I常用結(jié)論
1.求解經(jīng)驗(yàn)回歸方程的關(guān)鍵是確定回歸系數(shù):,b,應(yīng)充分利用回歸直線過樣本點(diǎn)的中心(x,y).
2.根據(jù)經(jīng)驗(yàn)回歸方程計(jì)算的(值,僅是一個(gè)預(yù)報(bào)值,不是真實(shí)發(fā)生的值.
3.根據(jù)/的值可以判斷兩個(gè)分類變量有關(guān)的可信程度,若/越大,則兩分類變量有關(guān)的把握越
大.
真題自測
一、單選題
1.(2024?全國?高考真題)某農(nóng)業(yè)研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的
畝產(chǎn)量(單位:kg)并整理如下表
畝產(chǎn)
[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)
量
頻數(shù)61218302410
根據(jù)表中數(shù)據(jù),下列結(jié)論中正確的是()
A.100塊稻田畝產(chǎn)量的中位數(shù)小于1050kg
B.100塊稻田中畝產(chǎn)量低于1100kg的稻田所占比例超過80%
C.100塊稻田畝產(chǎn)量的極差介于200kg至300kg之間
D.100塊稻田畝產(chǎn)量的平均值介于900kg至1000kg之間
2.(2023?全國?高考真題)某學(xué)校為了解學(xué)生參加體育運(yùn)動(dòng)的情況,用比例分配的分層隨機(jī)抽樣方法作抽樣
調(diào)查,擬從初中部和高中部兩層共抽取60名學(xué)生,已知該校初中部和高中部分別有400名和200名學(xué)生,
則不同的抽樣結(jié)果共有().
A.C-C短種B.CMC鼠種
C.CQC禽種D.C%c北種
二、多選題
3.(2023?全國?高考真題)有一組樣本數(shù)據(jù)%,%,…,%,其中4是最小值,%是最大值,則()
A.無2,無3,羽,無5的平均數(shù)等于不,%,…,%的平均數(shù)
B.毛,尤3,4尤5的中位數(shù)等于百,%,1%的中位數(shù)
4
C.x2,x3,x4,x5的標(biāo)準(zhǔn)差不小于占,馬,…,毛的標(biāo)準(zhǔn)差
D.尤3,%毛的極差不大于百,…,毛的極差
三、解答題
4.(2024?全國?高考真題)某工廠進(jìn)行生產(chǎn)線智能化升級改造,升級改造后,從該工廠甲、乙兩個(gè)車間的產(chǎn)
品中隨機(jī)抽取150件進(jìn)行檢驗(yàn),數(shù)據(jù)如下:
優(yōu)級品合格品不合格品總計(jì)
甲車間2624050
乙車間70282100
總計(jì)96522150
⑴填寫如下列聯(lián)表:
優(yōu)級品非優(yōu)級品
甲車間
乙車間
能否有95%的把握認(rèn)為甲、乙兩車間產(chǎn)品的優(yōu)級品率存在差異?能否有99%的把握認(rèn)為甲,乙兩車間產(chǎn)品
的優(yōu)級品率存在差異?
(2)已知升級改造前該工廠產(chǎn)品的優(yōu)級品率p=0.5,設(shè)萬為升級改造后抽取的n件產(chǎn)品的優(yōu)級品率.如果
萬>P+1.65J約二",則認(rèn)為該工廠產(chǎn)品的優(yōu)級品率提高了,根據(jù)抽取的150件產(chǎn)品的數(shù)據(jù),能否認(rèn)為生
產(chǎn)線智能化升級改造后,該工廠產(chǎn)品的優(yōu)級品率提高了?(麗之2.247)
n(ad-bc)2
(〃+Z?)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
5.(2023?全國?高考真題)一項(xiàng)試驗(yàn)旨在研究臭氧效應(yīng),試驗(yàn)方案如下:選40只小白鼠,隨機(jī)地將其中20
只分配到試驗(yàn)組,另外20只分配到對照組,試驗(yàn)組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)
在正常環(huán)境,一段時(shí)間后統(tǒng)計(jì)每只小白鼠體重的增加量(單位:g).試驗(yàn)結(jié)果如下:
5
對照組的小白鼠體重的增加量從小到大排序?yàn)?/p>
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
試驗(yàn)組的小白鼠體重的增加量從小到大排序?yàn)?/p>
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
⑴計(jì)算試驗(yàn)組的樣本平均數(shù);
(2)(回)求40只小白鼠體重的增加量的中位數(shù)加,再分別統(tǒng)計(jì)兩樣本中小于,"與不小于機(jī)的數(shù)據(jù)的個(gè)數(shù),
完成如下列聯(lián)表
n<m>m
對照組□□
試驗(yàn)組□□
(回)根據(jù)G)中的列聯(lián)表,能否有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加
量有差異?
n(ad-bc)2
(a+6)(c+d)(a+c)(6+d),
P(K2>k]0.1000.0500.010
k2.7063.8416.635
6.(2023?全國,高考真題)一項(xiàng)試驗(yàn)旨在研究臭氧效應(yīng).實(shí)驗(yàn)方案如下:選40只小白鼠,隨機(jī)地將其中20
只分配到實(shí)驗(yàn)組,另外20只分配到對照組,實(shí)驗(yàn)組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)
在正常環(huán)境,一段時(shí)間后統(tǒng)計(jì)每只小白鼠體重的增加量(單位:g).
⑴設(shè)X表示指定的兩只小白鼠中分配到對照組的只數(shù),求X的分布列和數(shù)學(xué)期望;
⑵實(shí)驗(yàn)結(jié)果如下:
對照組的小白鼠體重的增加量從小到大排序?yàn)椋?/p>
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
實(shí)驗(yàn)組的小白鼠體重的增加量從小到大排序?yàn)椋?/p>
6
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
(i)求40只小鼠體重的增加量的中位數(shù)機(jī),再分別統(tǒng)計(jì)兩樣本中小于機(jī)與不小于的數(shù)據(jù)的個(gè)數(shù),完成如下
列聯(lián)表:
n<m>m
對照組□□
實(shí)驗(yàn)組U□
(ii)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量
有差異.
n(ad-bc)2
附:K2=
(a+6)(c+d)(a+c)(b+d))
0.1000.0500.010
2
P(K>k0)2.7063.8416.635
7.(2023?全國?高考真題)某廠為比較甲乙兩種工藝對橡膠產(chǎn)品伸縮率的處理效應(yīng),進(jìn)行10次配對試驗(yàn),
每次配對試驗(yàn)選用材質(zhì)相同的兩個(gè)橡膠產(chǎn)品,隨機(jī)地選其中一個(gè)用甲工藝處理,另一個(gè)用乙工藝處理,測
量處理后的橡膠產(chǎn)品的伸縮率.甲、乙兩種工藝處理后的橡膠產(chǎn)品的伸縮率分別記為%,%(7=1,2,…,10).試
驗(yàn)結(jié)果如下:
試驗(yàn)序號i12345678910
伸縮率看545533551522575544541568596548
伸縮率力536527543530560533522550576536
記%記的樣本平均數(shù)為樣本方差為?.
=1,2,…,10),4,Z?,z10z,
⑴求1/;
(2)判斷甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率是否有顯著提高(如果
z>2.£,則認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高,否
V10
7
則不認(rèn)為有顯著提高)
8.(2023?全國?高考真題)某研究小組經(jīng)過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某項(xiàng)醫(yī)學(xué)指標(biāo)有明顯差
利用該指標(biāo)制定一個(gè)檢測標(biāo)準(zhǔn),需要確定臨界值c,將該指標(biāo)大于。的人判定為陽性,小于或等于c的人判
定為陰性.此檢測標(biāo)準(zhǔn)的漏診率是將患病者判定為陰性的概率,記為。9);誤診率是將未患病者判定為陽
性的概率,記為我。).假設(shè)數(shù)據(jù)在組內(nèi)均勻分布,以事件發(fā)生的頻率作為相應(yīng)事件發(fā)生的概率.
⑴當(dāng)漏診率p(c)=0.5%時(shí),求臨界值c和誤診率4(c);
(2)設(shè)函數(shù)〃c)=p(c)+q(c),當(dāng)ce[95,105]時(shí),求/(c)的解析式,并求/(c)在區(qū)間[95,105]的最小值.
考點(diǎn)突破
【考點(diǎn)1]成對數(shù)據(jù)的相關(guān)性
一、單選題
1.(2024?四川成都?二模)對變量蒼丁有觀測數(shù)據(jù)Q,yJ(ieN*),得散點(diǎn)圖1;對變量”#有觀測數(shù)據(jù)
(M;,V;)(ZGN*),得散點(diǎn)圖24表示變量彳,丫之間的線性相關(guān)系數(shù),4表示變量以v之間的線性相關(guān)系數(shù),則
A.變量X與y呈現(xiàn)正相關(guān),且用〈閭B.變量X與y呈現(xiàn)負(fù)相關(guān),且用〉同
8
C.變量尤與y呈現(xiàn)正相關(guān),且間>團(tuán)D.變量X與y呈現(xiàn)負(fù)相關(guān),且用〈同
2.(2024?四川涼山?三模)調(diào)查某校高三學(xué)生的身高X和體重y得到如圖所示散點(diǎn)圖,其中身高X和體重V相
B.學(xué)生身高和體重呈正相關(guān)
C.學(xué)生身高和體重呈負(fù)相關(guān)
D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8255
二、多選題
3.(22-23高三上?江蘇無錫?期末)已知由樣本數(shù)據(jù)(4%)[=1,2,3,…,10)組成的一個(gè)樣本,得到經(jīng)驗(yàn)回歸方
程為夕=2x-0.4,且元=2,去除兩個(gè)樣本點(diǎn)(-2,1)和(2,-1)后,得到新的經(jīng)驗(yàn)回歸方程為$=3x+g.在余
下的8個(gè)樣本數(shù)據(jù)和新的經(jīng)驗(yàn)回歸方程中().
A.相關(guān)變量x,y具有正相關(guān)關(guān)系
B.新的經(jīng)驗(yàn)回歸方程為9=3X-3
C.隨著自變量x值增加,因變量y值增加速度變小
D.樣本(4,8.9)的殘差為-0.1
4.(2024?湖南衡陽?模擬預(yù)測)為了研發(fā)某種流感疫苗,某研究團(tuán)隊(duì)收集了10組抗體藥物的攝入量與體內(nèi)
抗體數(shù)量的數(shù)據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值,抗體藥物攝
入量為x(單位:mg),體內(nèi)抗體數(shù)量為y(單位:AU/mL).根據(jù)散點(diǎn)圖,可以得到回歸直線方程為:
y=0.34x+0.05.下列說法正確的是()
^
12
1
11
1
7
9
1
1
8
1
1
7
1
1
6
1
15
1
1
48.84949.249.449.649.85050.250.4*
9
A.回歸直線方程表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的線性相關(guān)關(guān)系
B.回歸直線方程表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的函數(shù)關(guān)系
C.回歸直線方程可以精確反映體內(nèi)抗體數(shù)量與抗體藥物攝入量的變化趨勢
D.回歸直線方程可以用來預(yù)測攝入抗體藥物后體內(nèi)抗體數(shù)量的變化
三、填空題
5.(23-24高三上?浙江,開學(xué)考試)已知成對樣本數(shù)據(jù)(4%),(%,%),…,(五,”)(北3)中士,馬,…,當(dāng)互不相等,
且所有樣本點(diǎn)(4%)(7=1,2,…㈤都在直線y=-gx+l上,則這組成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù)r=
反思提升:
判斷相關(guān)關(guān)系的兩種方法:
(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;
如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.
(2)決定系數(shù)法:利用決定系數(shù)判定,F(xiàn)越趨近1,擬合效果越好,相關(guān)性越強(qiáng).
【考點(diǎn)2】回歸分析
一、單選題
1.(2024?四川綿陽?二模)已知變量x,y之間的線性回歸方程為9=2x+l,且變量x,y之間的一組相關(guān)數(shù)
據(jù)如表所示,
X2468
y58.213m
則下列說法正確的是()
A.〃?=17
B.變量y與x是負(fù)相關(guān)關(guān)系
C.該回歸直線必過點(diǎn)(5,11)
D.x增加1個(gè)單位,y一定增加2個(gè)單位
2.(2024?全國?模擬預(yù)測)2023年第19屆亞運(yùn)會(huì)在杭州舉行,亞運(yùn)會(huì)的吉祥物琮琮、蓮蓮、宸宸深受大家
喜愛,某商家統(tǒng)計(jì)了最近5個(gè)月銷量,如表所示:若y與x線性相關(guān),且線性回歸方程為?=-。6元+0,則
下列說法不正確的是()
時(shí)間X12345
銷售量W萬只54.543.52.5
A.由題中數(shù)據(jù)可知,變量y與無負(fù)相關(guān)
10
B.當(dāng)x=5時(shí),殘差為0.2
C.可以預(yù)測當(dāng)x=6時(shí)銷量約為2.1萬只
D.線性回歸方程9=-0.6x+d中4=5.7
二、多選題
3.(23-24高三上?廣東揭陽,期末)2023年入冬以來,流感高發(fā),某醫(yī)院統(tǒng)計(jì)了一周中連續(xù)5天的流感就診
人數(shù)y與第%(%=1,2,3,4,5)天的數(shù)據(jù)如表所示.
X12345
y21IQa15a90109
根據(jù)表中數(shù)據(jù)可知尤,y具有較強(qiáng)的線性相關(guān)關(guān)系,其經(jīng)驗(yàn)回歸方程為y=20尤+10,則()
A.樣本相關(guān)系數(shù)在(0』內(nèi)B.當(dāng)x=2時(shí),殘差為-2
C.點(diǎn)(3,15a)一定在經(jīng)驗(yàn)回歸直線上D.第6天到該醫(yī)院就診人數(shù)的預(yù)測值為130
4.(2024?全國?模擬預(yù)測)為了預(yù)測某地的經(jīng)濟(jì)增長情況,某經(jīng)濟(jì)學(xué)專家根據(jù)該地2023年1?6月的GDP
的數(shù)據(jù)y(單位:百億元)建立了線性回歸模型,得到的經(jīng)驗(yàn)回歸方程為y=0.42x+a,其中自變量x指的
是1?6月的編號,其中部分?jǐn)?shù)據(jù)如表所示:
時(shí)間2023年)月2023年2月2023年3月2023年4月2023年5月2023年6月
編號X123456
W百億元為%11.107%線
參考數(shù)據(jù):£W=796,-?2=70.
i=li=l
則下列說法正確的是()
A.經(jīng)驗(yàn)回歸直線經(jīng)過點(diǎn)(3511)
B.<7=10.255
C.根據(jù)該模型,該地2023年12月的GDP的預(yù)測值為14.57百億元
D.相應(yīng)于點(diǎn)(%,%)的殘差為0二03
三、填空題
5.(2024?江蘇?一模)已知變量x,y的統(tǒng)計(jì)數(shù)據(jù)如下表,對表中數(shù)據(jù)作分析,發(fā)現(xiàn)y與X之間具有線性相關(guān)
關(guān)系,利用最小二乘法,計(jì)算得到經(jīng)驗(yàn)回歸直線方程為9=0.8尤+&,據(jù)此模型預(yù)測當(dāng)x=10時(shí)亍的值
為.
11
X56789
y3.54566.5
6.(2024?陜西渭南?一模)已知一組數(shù)據(jù)點(diǎn)(4%)(,=1,2,,7),用最小二乘法得到其線性回歸方程為
77
y——2x+4,若Z玉=7,則£%=?
i=l?=1
四、解答題
7.(2024?山東日照?二模)某公司為考核員工,采用某方案對員工進(jìn)行業(yè)務(wù)技能測試,并統(tǒng)計(jì)分析測試成績
以確定員工績效等級.
⑴已知該公司甲部門有3名負(fù)責(zé)人,乙部門有4名負(fù)責(zé)人,該公司從甲、乙兩部門中隨機(jī)選取3名負(fù)責(zé)人
做測試分析,記負(fù)責(zé)人來自甲部門的人數(shù)為X,求X的最有可能的取值:
-7xz
------------x0.02
(0)已知某部門測試的平均成績?yōu)?0分,估計(jì)其績效等級優(yōu)秀率;
5)根據(jù)統(tǒng)計(jì)分析,大致認(rèn)為各部門測試平均成績尤?其中〃近似為樣本平均數(shù)元,/近似為
樣本方差經(jīng)計(jì)算s。20,求某個(gè)部門績效等級優(yōu)秀率不低于0.78的概率.
參考公式與數(shù)據(jù):①ln0.15工-1.9,e1'2?3.32,ln5.2a1.66.
n__
八Y^-nxy
②線性回歸方程9=加+6中,》=弓--------,d=y-bx.
2—2
2^xi-nx
i=i
③若隨機(jī)變量X?,貝P(〃-cr<X<〃+cr)=0.6826,P(〃—2b<X<〃+2cr)=0.9544,
P(〃-3cr<X<〃+3b)=0.9974.
8.(22-23高三上?山東青島?期末)由相〃個(gè)小正方形構(gòu)成長方形網(wǎng)格有機(jī)行和〃列.每次將一個(gè)小球放到一個(gè)
小正方形內(nèi),放滿為止,記為一輪.每次放白球的頻率為P,放紅球的概率為q,P+4=l.
12
⑴若根=2,P=q=;,記y表示100輪放球試驗(yàn)中"每一列至少一個(gè)紅球”的輪數(shù),統(tǒng)計(jì)數(shù)據(jù)如表:
n12345
y7656423026
求y關(guān)于〃的回歸方程Iny=加+。,并預(yù)測〃=10時(shí),y的值;(精確到1)
1?
(2)若m=2,n=2,p=~,q=~,記在每列都有白球的條件下,含紅球的行數(shù)為隨機(jī)變量X,求X的分
布列和數(shù)學(xué)期望;
⑶求事件〃不是每一列都至少一個(gè)紅球〃發(fā)生的概率,并證明:(i-yw)n+(i-^f>1.
k
-X七%-反守5_
附:經(jīng)驗(yàn)回歸方程系數(shù):5=37--------------,a=y-bx,2%/ny,=53,百]=3.8.
_居2i=l
z=l
反思提升:
n——
A^^.XiyiYLJQyAA—A—A
(1)求經(jīng)驗(yàn)回歸方程:利用公式,二.求0;利用a=y一以求a,寫出經(jīng)驗(yàn)回歸方程.
Y^Xi—nx2
(2)經(jīng)驗(yàn)回歸方程的擬合效果,可以利用相關(guān)系數(shù)卜|判斷,當(dāng)|r|越趨近于1時(shí),兩變量的線性相
關(guān)性越強(qiáng).或利用決定系數(shù)K判斷,F(xiàn)越大,擬合效果越好.
⑶非線性經(jīng)驗(yàn)回歸方程轉(zhuǎn)化為線性經(jīng)驗(yàn)回歸方程的方法
AAAAAAAAAAA
①若y=a+by[x,設(shè)£=疝,則y=a+初;②若滿足對數(shù)式:y=a+blnx,設(shè),=ln%,則y=a+
A
bt-,③若滿足指數(shù)式:y=ciec2x,兩邊取對數(shù)解Iny=lnci+czx,設(shè)z=lny,a=lnci,b=ci,
貝Uz=a+bx.
【考點(diǎn)3】獨(dú)立性檢驗(yàn)
一、單選題
1.(2024?黑龍江哈爾濱?二模)針對2025年第九屆亞冬會(huì)在哈爾濱舉辦,校團(tuán)委對"是否喜歡冰雪運(yùn)動(dòng)與學(xué)
生性別的關(guān)系”進(jìn)行了一次調(diào)查,其中被調(diào)查的男、女生人數(shù)相同,男生中喜歡冰雪運(yùn)動(dòng)的人數(shù)占男生人數(shù)
的三,女生中喜歡冰雪運(yùn)動(dòng)的人數(shù)占女生人數(shù)的;,若依據(jù)&=0.05的獨(dú)立性檢驗(yàn),認(rèn)為是否喜歡冰雪運(yùn)動(dòng)
63
與學(xué)生性別有關(guān),則被調(diào)查的學(xué)生中男生的人數(shù)不可能是()
2_n{ad-be)2
(a+b)(c+d)(a+c)(b+d)
a0.10.050.010.0050.001
13
%2.7063.8416.6357.87910.828
A.48B.54C.60D.66
2.(2024?寧夏銀川?一模)有甲、乙兩個(gè)班級進(jìn)行數(shù)學(xué)考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)
秀統(tǒng)計(jì)成績,得到如下所示的列聯(lián)表:
優(yōu)秀非優(yōu)秀總計(jì)
甲班10b
乙班C30
合計(jì)
A.列聯(lián)表中c的值為30,6的值為35
B.列聯(lián)表中c的值為15,b的值為50
C.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,能認(rèn)為"成績與班級有關(guān)系”
D.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,不能認(rèn)為"成績與班級有關(guān)系”
二、多選題
3.(2024?山東臨沂?一模)下列結(jié)論正確的是()
A.一組樣本數(shù)據(jù)的散點(diǎn)圖中,若所有樣本點(diǎn)a,%)都在直線^=0.95%+1上,則這組樣本數(shù)據(jù)的樣本相
關(guān)系數(shù)為0.95
B.已知隨機(jī)變量,N(3,4),若J=2〃+l,則
C.在2x2列聯(lián)表中,若每個(gè)數(shù)據(jù)a,》,c,d均變成原來的2倍,則/也變成原來的2倍
2
,2n(ad-be)_,、
CX-7i/\/j,其中〃=a+6+c+d)
(a+b)(c+d)(a+c)[b+d)
D.分別拋擲2枚質(zhì)地均勻的骰子,若事件A="第一枚骰子正面向上的點(diǎn)數(shù)是奇數(shù)",3="2枚骰子正面
向上的點(diǎn)數(shù)相同",則A2互為獨(dú)立事件
4.(22-23高三下?浙江?開學(xué)考試)下列結(jié)論中,正確的有()
14
A.數(shù)據(jù)4,1,6,2,9,5,8的第60百分位數(shù)為5
B.若隨機(jī)變量舁"(1,4),尸(空一2)=0.21,則尸(公4)=0.79
C.己知經(jīng)驗(yàn)回歸方程為夕=Bx+1.8,B.x=2,y=20,則B=9.1
D.根據(jù)分類變量X與¥的成對樣本數(shù)據(jù),計(jì)算得到f=9.632,依據(jù)小概率值a=0.001的/獨(dú)立性檢
驗(yàn)(%0m=10.828),可判斷X與Y有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001
三、填空題
5.(21-22高二下?福建福州?期末)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下列聯(lián)表:
疾病
藥物合計(jì)
未患病患病
服用a50—a50
未服用80—。a—3050
合計(jì)8020100
若在本次考察中得出"在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為藥物有效”的結(jié)論,則a的最小值
為.(其中心40且aeN*)(參考數(shù)據(jù):76.635?2.58,J10.828—3.29)
2n(ad-bc]
附:%=-,---------77—^~77——------------7,ll=a+b+C+d
(a+6)(c+d)(a+c)(6+d)
a0.10.050.010.0050.001
xa2.7063.8416.6357.87910.828
6.(2024?上海金山?二模)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下圖所示列聯(lián)表:
疾病
藥物合計(jì)
未患病患病
服用m50-m50
未服用80—mm—3050
合計(jì)8020100
取顯著性水平a=0.05,若本次考察結(jié)果支持“藥物對疾病預(yù)防有顯著效果",則加(〃二40,meN)的最小值
為_________
15
n(ad-be)2
(參考公式:/=;參考值:P(Z2>3.841)?0.05)
(a+b)(c+d)(a+c)(b+d)
四、解答題
7.(2023,廣東深圳?二模)飛盤運(yùn)動(dòng)是一項(xiàng)入門簡單,又具有極強(qiáng)的趣味性和社交性的體育運(yùn)動(dòng),目前已經(jīng)
成為了年輕人運(yùn)動(dòng)的新潮流.某俱樂部為了解年輕人愛好飛盤運(yùn)動(dòng)是否與性別有關(guān),對該地區(qū)的年輕人進(jìn)行
了簡單隨機(jī)抽樣,得到如下列聯(lián)表:
飛盤運(yùn)動(dòng)
性別合計(jì)
不愛好愛好
男61622
女42428
合計(jì)104050
⑴在上述愛好飛盤運(yùn)動(dòng)的年輕人中按照性別采用分層抽樣的方法抽取10人,再從這10人中隨機(jī)選取3人
訪談,記參與訪談的男性人數(shù)為X,求X的分布列和數(shù)學(xué)期望;
(2)依據(jù)小概率值。=0.01的獨(dú)立性檢驗(yàn),能否認(rèn)為愛好飛盤運(yùn)動(dòng)與性別有關(guān)聯(lián)?如果把上表中所有數(shù)據(jù)都擴(kuò)
大到原來的10倍,在相同的檢驗(yàn)標(biāo)準(zhǔn)下,再用獨(dú)立性檢驗(yàn)推斷愛好飛盤運(yùn)動(dòng)與性別之間的關(guān)聯(lián)性,結(jié)論還
一樣嗎?請解釋其中的原因.
附./_"(ad-bc》
其中“=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
a0.10.010.001
Xa2.7066.63510.828
8.(2024?吉林?模擬預(yù)測)短視頻已成為當(dāng)下宣傳的重要手段,東北某著名景點(diǎn)利用短視頻宣傳增加旅游熱
度,為調(diào)查某天南北方游客來此景點(diǎn)旅游是否與收看短視頻有關(guān),該景點(diǎn)對當(dāng)天前來旅游的500名游客調(diào)
查得知,南方游客有300人,因收看短視頻而來的280名游客中南方游客有200人.
⑴依據(jù)調(diào)查數(shù)據(jù)完成如下列聯(lián)表,根據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),分析南北方游客來此景點(diǎn)旅游是
否與收看短視潁有關(guān)聯(lián):單位:人
短視頻
游客合計(jì)
收看未看
16
南方游客
北方游客
合計(jì)
⑵為了增加游客的旅游樂趣,該景點(diǎn)設(shè)置一款5人傳球游戲,每個(gè)人得到球后都等可能地傳給其余4人之
一,現(xiàn)有甲、乙等5人參加此游戲,球首先由甲傳出.
(i)求經(jīng)過,次傳遞后球回到甲的概率;
(ii)記前機(jī)次傳遞中球傳到乙的次數(shù)為X,求X的數(shù)學(xué)期望.
n(ad-be,f_tn\jn_
參考公式:z2=其中〃=a+/?+c+d;E\=ZE(Xj
(a+b)(c+d)(Q+c)(Z?+d)VZ=17z=l
附表:
a0.10.050.010.0050.001
2.7063.8416.6357.87910.828
反思提升:
L在2X2列聯(lián)表中,如果兩個(gè)變量沒有關(guān)系,則應(yīng)滿足ad—尻心0.|〃一陽越小,說明兩個(gè)變
量之間關(guān)系越弱;|ad一尻|越大,說明兩個(gè)變量之間關(guān)系越強(qiáng).
2.解決獨(dú)立性檢驗(yàn)的應(yīng)用問題,一定要按照獨(dú)立性檢驗(yàn)的步驟得出結(jié)論.獨(dú)立性檢驗(yàn)的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表:
(2)根據(jù)公式/=
〃(ad-bc)之
計(jì)算X2;
(a+6)(a+c)(b+d)(c+d)
(3)通過比較/與臨界值的大小關(guān)系來作統(tǒng)計(jì)推斷.
分層檢測
【基礎(chǔ)篇】
一、單選題
1.(2024?浙江寧波?二模)某校數(shù)學(xué)建模興趣小組為研究本地區(qū)兒子身高y(cm)與父親身高x(cm)之間的關(guān)
系,抽樣調(diào)查后得出'與x線性相關(guān),且經(jīng)驗(yàn)回歸方程為9=O.85X+29.5.調(diào)查所得的部分樣本數(shù)據(jù)如下:
父親身高x(cm)164166170173173174180
兒子身高y(cm)165168176170172176178
17
則下列說法正確的是()
A.兒子身高了(cm)是關(guān)于父親身高x(cm)的函數(shù)
B.當(dāng)父親身高增加1cm時(shí),兒子身高增加0.85cm
C.兒子身高為172cm時(shí),父親身高一定為173cm
D.父親身高為170cm時(shí),兒子身高的均值為174cm
2.(2024?天津河西?一模)隨著居民家庭收入的不斷提高,人們對居住條件的改善的需求也在逐漸升溫.某
城市統(tǒng)計(jì)了最近5個(gè)月的房屋交易量,如下表所示:
時(shí)間尤12345
交易量y(萬套)0.50.81.01.21.5
若丫與尤滿足一元線性回歸模型,且經(jīng)驗(yàn)回歸方程為a=o-24x+e,則下列說法錯(cuò)誤的是()
A.根據(jù)表中數(shù)據(jù)可知,變量'與x正相關(guān)
B.經(jīng)驗(yàn)回歸方程f=0.24x+C中&=0.28
C.可以預(yù)測x=6時(shí)房屋交易量約為1.72(萬套)
D.x=5時(shí),殘差為-0.02
3.(2024?天津?一模)下列說法正確的是()
A.一組數(shù)據(jù)7,8,8,9,11/3,15,17,20,22的第80百分位數(shù)為17;
B.根據(jù)分類變量X與丫的成對樣本數(shù)據(jù),計(jì)算得到力2=4.712,根據(jù)小概率值a=Q05的獨(dú)立性檢驗(yàn)
(馬05=3.841),可判斷X與y有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.05;
C.兩個(gè)隨機(jī)變量的線性相關(guān)性越強(qiáng),相關(guān)系數(shù)的絕對值越接近于0;
D.若隨機(jī)變量。,〃滿足〃=3。-2,則。⑻=3。0-2.
4.(23-24高三上?天津北辰?期中)下列結(jié)論中,錯(cuò)誤的是()
A.數(shù)據(jù)4,1,6,2,9,5,8的第60百分位數(shù)為6
B.若隨機(jī)變量尸偌4-2)=0.21,則P(JW4)=0.79
C.已知經(jīng)驗(yàn)回歸方程為y=〃x+1.8,且x=2,y=20,貝心=9.1
D.根據(jù)分類變量X與丫成對樣本數(shù)據(jù),計(jì)算得到*2=9.632,依據(jù)小概率值a=0.001的/獨(dú)立性檢驗(yàn)
(^0,001=10.828),可判斷x與y有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.001
二、多選題
5.(2023?湖北?模擬預(yù)測)下列命題中正確的是()
18
A.若樣本數(shù)據(jù)耳,々,L,尤20的樣本方差為3,則數(shù)據(jù)25+1,2X2+1,L,2X20+1的方差為7
B.經(jīng)驗(yàn)回歸方程為a=0.3-0.7x時(shí),變量x和y負(fù)相關(guān)
C.對于隨機(jī)事件A與'P(A)>0,P(B)>0,若P(A|B)=P(A),則事件A與B相互獨(dú)立
D.若乂~《7,£|,則P(X=L)取最大值時(shí)左=4
6.(2024?山東棗莊?模擬預(yù)測)已知兩個(gè)變量y與尤對應(yīng)關(guān)系如下表:
X12345
y5m8910.5
若y與無滿足一元線性回歸模型,且經(jīng)驗(yàn)回歸方程為9=L25x+4.25,則()
A.y與尤正相關(guān)B.m=7
C.樣本數(shù)據(jù)y的第60百分位數(shù)為8D.各組數(shù)據(jù)的殘差和為0
7.(2024?湖北武漢?二模)下列結(jié)論正確的是()
A.一組數(shù)據(jù)7,8,8,9,11,13,15,17,20,22的第80百分位數(shù)為17
B.若隨機(jī)變量機(jī)〃滿足〃=3”2,則。(〃)=3。?-2
C.若隨機(jī)變量tN(4,(T2),且尸C<6)=0.8,貝。2(2<4<6)=。.6
D.根據(jù)分類變量X與V的成對樣本數(shù)據(jù),計(jì)算得到力2=4.712.依據(jù)e=0.05的獨(dú)立性檢驗(yàn)(xo,o5=3-841),
可判斷x與y有關(guān)
三、填空題
8.(23-24高三下?上海嘉定?階段練習(xí))某產(chǎn)品的廣告支出費(fèi)用無(單位:萬元)與銷售額y(單位:萬元)
的數(shù)據(jù)如下表:
X24568
y3040a5070
已知y關(guān)于x的線性回歸方程為y=6.5x+15.1,則表格中實(shí)數(shù)a的值為.
9.(23-24高二下?江西贛州?期中)甲、乙、丙、丁各自研究兩個(gè)隨機(jī)變量的數(shù)據(jù),若甲、乙、丙、丁計(jì)算
得到各自研究的兩個(gè)隨機(jī)變量的線性相關(guān)系數(shù)分別為4=066,々=-0.97,4=092,〃=0.89,則這四人
中,研究的兩個(gè)隨機(jī)變量的線性相關(guān)程度最高.
10.(2024?上海長寧?二模)收集數(shù)據(jù),利用2x2列聯(lián)表,分析學(xué)習(xí)成績好與上課注意力集中是否有關(guān)時(shí),
提出的零假設(shè)為:學(xué)習(xí)成績好與上課注意力集中(填:有關(guān)或無關(guān))
19
四、解答題
11.(2024?四川成都?模擬預(yù)測)數(shù)據(jù)顯示,中國在線直播用戶規(guī)模及在線直播購物規(guī)模近幾年都保持高速
增長態(tài)勢,某線下家電商場為提升人氣和提高營業(yè)額也開通了在線直播,下表統(tǒng)計(jì)了該商場開通在線直播
⑵根據(jù)第1至第5天的數(shù)據(jù)分析,可用線性回歸模型擬合y與尤的關(guān)系,試求出該線性回歸方程并估計(jì)該商
場開通在線直播的第10天的線下顧客人數(shù).
n
(參考公式:相關(guān)系數(shù)7=I,TI,_,參考數(shù)據(jù):同。13.038
店(x廠方區(qū)(%-丫)2
Vi=lVi=l
£(%一元)(外一歹)£七y一"無》
回歸方程:y=bx+a^其中匕=3-,a=y-bx)
方(占-可2h位2
1=11=1
12.(2024,四川內(nèi)江?三模)2024年2月10日至17日(正月初一至初八),"2024?內(nèi)江市中區(qū)新春極光焰火
草地狂歡節(jié)"在川南大草原舉行,共舉行了8場精彩的煙花秀節(jié)目.前5場的觀眾人數(shù)(單位:萬人)與場
次的統(tǒng)計(jì)數(shù)據(jù)如表所示:
場次編號X12345
觀眾人數(shù)y0.70.811.21.3
⑴已知可用線性回歸模型擬合y與尤的關(guān)系,請建立V關(guān)于X的線性回歸方程;
(2)若該煙花秀節(jié)目分A、B、C三個(gè)等次的票價(jià),某機(jī)構(gòu)隨機(jī)調(diào)查了該煙花秀節(jié)目現(xiàn)場200位觀眾的性別與
購票情況,得到的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 寵物店店員工作總結(jié)
- 黑龍江省哈爾濱市道里區(qū)2023-2024學(xué)年九年級上學(xué)期化學(xué)期末測試題
- 大型活動(dòng)銷售總結(jié)
- 婚慶策劃師的工作總結(jié)
- 2025年云南省八省聯(lián)考高考地理模擬試卷
- 《胡蘿卜素的提取定》課件
- 《怎樣做品牌規(guī)劃》課件
- 2023年江西省上饒市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2022年湖北省黃岡市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2024年江蘇省無錫市公開招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 中國陰離子交換膜行業(yè)調(diào)研分析報(bào)告2024年
- 絨毛下血腫保胎方案
- 醫(yī)美行業(yè)監(jiān)管政策與競爭環(huán)境
- 2024年02月湖北武漢市公安局招考聘用輔警267人筆試歷年高頻考題(難、易錯(cuò)點(diǎn)薈萃)答案帶詳解附后
- 房屋移交的時(shí)間和方式
- 北京市西城區(qū)2022-2023學(xué)年七年級(上)期末數(shù)學(xué)試卷(人教版 含答案)
- 2024年福建寧德城市建設(shè)投資開發(fā)公司招聘筆試參考題庫含答案解析
- 電焊的安全防護(hù)技術(shù)模版
- 低值易耗品明細(xì)表
- 金礦投資可行性方案
- 山東省濟(jì)南市2023-2024學(xué)年高三上學(xué)期期末學(xué)習(xí)質(zhì)量檢測生物試題(原卷版)
評論
0/150
提交評論