版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Page專題57成對數(shù)據(jù)的統(tǒng)計分析(新高考專用)目錄目錄【知識梳理】 2【真題自測】 4【考點突破】 14【考點1】成對數(shù)據(jù)的相關(guān)性 14【考點2】回歸分析 17【考點3】獨立性檢驗 25【分層檢測】 35【基礎篇】 35【能力篇】 43考試要求:1.了解樣本相關(guān)系數(shù)的統(tǒng)計含義.2.了解一元線性回歸模型和2×2列聯(lián)表,會運用這些方法解決簡單的實際問題.3.會利用統(tǒng)計軟件進行數(shù)據(jù)分析.知識梳理知識梳理1.變量的相關(guān)關(guān)系(1)相關(guān)關(guān)系兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.(2)相關(guān)關(guān)系的分類:正相關(guān)和負相關(guān).(3)線性相關(guān)一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在一條直線附近,我們就稱這兩個變量線性相關(guān).一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相關(guān).2.樣本相關(guān)系數(shù)(1)相關(guān)系數(shù)r的計算變量x和變量y的樣本相關(guān)系數(shù)r的計算公式如下:(2)相關(guān)系數(shù)r的性質(zhì)①當r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當r<0時,成對樣本數(shù)據(jù)負相關(guān);當r=0時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.②樣本相關(guān)系數(shù)r的取值范圍為[-1,1].當|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;當|r|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.3.一元線性回歸模型(1)經(jīng)驗回歸方程與最小二乘法我們將eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估計,其中(2)利用決定系數(shù)R2刻畫回歸效果,R2越大,即擬合效果越好,R2越小,模型擬合效果越差.4.列聯(lián)表與獨立性檢驗(1)2×2列聯(lián)表一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為xy合計y=y(tǒng)1y=y(tǒng)2x=x1aba+bx=x2cdc+d合計a+cb+dn=a+b+c+d(2)臨界值χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).忽略χ2的實際分布與該近似分布的誤差后,對于任何小概率值α,可以找到相應的正實數(shù)xα,使得P(χ2≥xα)=α成立.我們稱xα為α的臨界值,這個臨界值就可作為判斷χ2大小的標準.(3)獨立性檢驗基于小概率值α的檢驗規(guī)則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8281.求解經(jīng)驗回歸方程的關(guān)鍵是確定回歸系數(shù)eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),應充分利用回歸直線過樣本點的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).2.根據(jù)經(jīng)驗回歸方程計算的eq\o(y,\s\up6(^))值,僅是一個預報值,不是真實發(fā)生的值.3.根據(jù)χ2的值可以判斷兩個分類變量有關(guān)的可信程度,若χ2越大,則兩分類變量有關(guān)的把握越大.真題自測真題自測一、單選題1.(2024·全國·高考真題)某農(nóng)業(yè)研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的畝產(chǎn)量(單位:kg)并整理如下表畝產(chǎn)量[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)頻數(shù)61218302410根據(jù)表中數(shù)據(jù),下列結(jié)論中正確的是(
)A.100塊稻田畝產(chǎn)量的中位數(shù)小于1050kgB.100塊稻田中畝產(chǎn)量低于1100kg的稻田所占比例超過80%C.100塊稻田畝產(chǎn)量的極差介于200kg至300kg之間D.100塊稻田畝產(chǎn)量的平均值介于900kg至1000kg之間2.(2023·全國·高考真題)某學校為了解學生參加體育運動的情況,用比例分配的分層隨機抽樣方法作抽樣調(diào)查,擬從初中部和高中部兩層共抽取60名學生,已知該校初中部和高中部分別有400名和200名學生,則不同的抽樣結(jié)果共有(
).A.種 B.種C.種 D.種二、多選題3.(2023·全國·高考真題)有一組樣本數(shù)據(jù),其中是最小值,是最大值,則(
)A.的平均數(shù)等于的平均數(shù)B.的中位數(shù)等于的中位數(shù)C.的標準差不小于的標準差D.的極差不大于的極差三、解答題4.(2024·全國·高考真題)某工廠進行生產(chǎn)線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產(chǎn)品中隨機抽取150件進行檢驗,數(shù)據(jù)如下:優(yōu)級品合格品不合格品總計甲車間2624050乙車間70282100總計96522150(1)填寫如下列聯(lián)表:優(yōu)級品非優(yōu)級品甲車間乙車間能否有的把握認為甲、乙兩車間產(chǎn)品的優(yōu)級品率存在差異?能否有的把握認為甲,乙兩車間產(chǎn)品的優(yōu)級品率存在差異?(2)已知升級改造前該工廠產(chǎn)品的優(yōu)級品率,設為升級改造后抽取的n件產(chǎn)品的優(yōu)級品率.如果,則認為該工廠產(chǎn)品的優(yōu)級品率提高了,根據(jù)抽取的150件產(chǎn)品的數(shù)據(jù),能否認為生產(chǎn)線智能化升級改造后,該工廠產(chǎn)品的優(yōu)級品率提高了?()附:0.0500.0100.001k3.8416.63510.8285.(2023·全國·高考真題)一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中20只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).試驗結(jié)果如下:對照組的小白鼠體重的增加量從小到大排序為15.2
18.8
20.2
21.3
22.5
23.2
25.8
26.5
27.5
30.132.6
34.3
34.8
35.6
35.6
35.8
36.2
37.3
40.5
43.2試驗組的小白鼠體重的增加量從小到大排序為7.8
9.2
11.4
12.4
13.2
15.5
16.5
18.0
18.8
19.219.8
20.2
21.6
22.8
23.6
23.9
25.1
28.2
32.3
36.5(1)計算試驗組的樣本平均數(shù);(2)(?。┣?0只小白鼠體重的增加量的中位數(shù)m,再分別統(tǒng)計兩樣本中小于m與不小于m的數(shù)據(jù)的個數(shù),完成如下列聯(lián)表對照組試驗組(ⅱ)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異?附:,0.1000.0500.0102.7063.8416.6356.(2023·全國·高考真題)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).(1)設表示指定的兩只小白鼠中分配到對照組的只數(shù),求的分布列和數(shù)學期望;(2)實驗結(jié)果如下:對照組的小白鼠體重的增加量從小到大排序為:15.2
18.8
20.2
21.3
22.5
23.2
25.8
26.5
27.5
30.132.6
34.3
34.8
35.6
35.6
35.8
36.2
37.3
40.5
43.2實驗組的小白鼠體重的增加量從小到大排序為:7.8
9.2
11.4
12.4
13.2
15.5
16.5
18.0
18.8
19.219.8
20.2
21.6
22.8
23.6
23.9
25.1
28.2
32.3
36.5(i)求40只小鼠體重的增加量的中位數(shù)m,再分別統(tǒng)計兩樣本中小于m與不小于的數(shù)據(jù)的個數(shù),完成如下列聯(lián)表:對照組實驗組(ii)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量有差異.附:0.1000.0500.0102.7063.8416.6357.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產(chǎn)品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質(zhì)相同的兩個橡膠產(chǎn)品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產(chǎn)品的伸縮率.甲、乙兩種工藝處理后的橡膠產(chǎn)品的伸縮率分別記為,.試驗結(jié)果如下:試驗序號12345678910伸縮率545533551522575544541568596548伸縮率536527543530560533522550576536記,記的樣本平均數(shù)為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高,否則不認為有顯著提高)8.(2023·全國·高考真題)某研究小組經(jīng)過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某項醫(yī)學指標有明顯差異,經(jīng)過大量調(diào)查,得到如下的患病者和未患病者該指標的頻率分布直方圖:
利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數(shù)據(jù)在組內(nèi)均勻分布,以事件發(fā)生的頻率作為相應事件發(fā)生的概率.(1)當漏診率%時,求臨界值c和誤診率;(2)設函數(shù),當時,求的解析式,并求在區(qū)間的最小值.參考答案:題號123答案CDBD1.C【分析】計算出前三段頻數(shù)即可判斷A;計算出低于1100kg的頻數(shù),再計算比例即可判斷B;根據(jù)極差計算方法即可判斷C;根據(jù)平均值計算公式即可判斷D.【詳解】對于A,根據(jù)頻數(shù)分布表可知,,所以畝產(chǎn)量的中位數(shù)不小于,故A錯誤;對于B,畝產(chǎn)量不低于的頻數(shù)為,所以低于的稻田占比為,故B錯誤;對于C,稻田畝產(chǎn)量的極差最大為,最小為,故C正確;對于D,由頻數(shù)分布表可得,平均值為,故D錯誤.故選;C.2.D【分析】利用分層抽樣的原理和組合公式即可得到答案.【詳解】根據(jù)分層抽樣的定義知初中部共抽取人,高中部共抽取,根據(jù)組合公式和分步計數(shù)原理則不同的抽樣結(jié)果共有種.故選:D.3.BD【分析】根據(jù)題意結(jié)合平均數(shù)、中位數(shù)、標準差以及極差的概念逐項分析判斷.【詳解】對于選項A:設的平均數(shù)為,的平均數(shù)為,則,因為沒有確定的大小關(guān)系,所以無法判斷的大小,例如:,可得;例如,可得;例如,可得;故A錯誤;對于選項B:不妨設,可知的中位數(shù)等于的中位數(shù)均為,故B正確;對于選項C:因為是最小值,是最大值,則的波動性不大于的波動性,即的標準差不大于的標準差,例如:,則平均數(shù),標準差,,則平均數(shù),標準差,顯然,即;故C錯誤;對于選項D:不妨設,則,當且僅當時,等號成立,故D正確;故選:BD.4.(1)答案見詳解(2)答案見詳解【分析】(1)根據(jù)題中數(shù)據(jù)完善列聯(lián)表,計算,并與臨界值對比分析;(2)用頻率估計概率可得,根據(jù)題意計算,結(jié)合題意分析判斷.【詳解】(1)根據(jù)題意可得列聯(lián)表:優(yōu)級品非優(yōu)級品甲車間2624乙車間7030可得,因為,所以有的把握認為甲、乙兩車間產(chǎn)品的優(yōu)級品率存在差異,沒有的把握認為甲,乙兩車間產(chǎn)品的優(yōu)級品率存在差異.(2)由題意可知:生產(chǎn)線智能化升級改造后,該工廠產(chǎn)品的優(yōu)級品的頻率為,用頻率估計概率可得,又因為升級改造前該工廠產(chǎn)品的優(yōu)級品率,則,可知,所以可以認為生產(chǎn)線智能化升級改造后,該工廠產(chǎn)品的優(yōu)級品率提高了.5.(1)(2)(i);列聯(lián)表見解析,(ii)能【分析】(1)直接根據(jù)均值定義求解;(2)(i)根據(jù)中位數(shù)的定義即可求得,從而求得列聯(lián)表;(ii)利用獨立性檢驗的卡方計算進行檢驗,即可得解.【詳解】(1)試驗組樣本平均數(shù)為:(2)(i)依題意,可知這40只小鼠體重的中位數(shù)是將兩組數(shù)據(jù)合在一起,從小到大排后第20位與第21位數(shù)據(jù)的平均數(shù),由原數(shù)據(jù)可得第11位數(shù)據(jù)為,后續(xù)依次為,故第20位為,第21位數(shù)據(jù)為,所以,故列聯(lián)表為:合計對照組61420試驗組14620合計202040(ii)由(i)可得,,所以能有的把握認為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異.6.(1)分布列見解析,(2)(i);列聯(lián)表見解析,(ii)能【分析】(1)利用超幾何分布的知識即可求得分布列及數(shù)學期望;(2)(i)根據(jù)中位數(shù)的定義即可求得,從而求得列聯(lián)表;(ii)利用獨立性檢驗的卡方計算進行檢驗,即可得解.【詳解】(1)依題意,的可能取值為,則,,,所以的分布列為:故.(2)(i)依題意,可知這40只小白鼠體重增量的中位數(shù)是將兩組數(shù)據(jù)合在一起,從小到大排后第20位與第21位數(shù)據(jù)的平均數(shù),觀察數(shù)據(jù)可得第20位為,第21位數(shù)據(jù)為,所以,故列聯(lián)表為:合計對照組61420實驗組14620合計202040(ii)由(i)可得,,所以能有的把握認為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量有差異.7.(1),;(2)認為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高.【分析】(1)直接利用平均數(shù)公式即可計算出,再得到所有的值,最后計算出方差即可;(2)根據(jù)公式計算出的值,和比較大小即可.【詳解】(1),,,的值分別為:,故(2)由(1)知:,,故有,所以認為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高.8.(1),;(2),最小值為.【分析】(1)根據(jù)題意由第一個圖可先求出,再根據(jù)第二個圖求出的矩形面積即可解出;(2)根據(jù)題意確定分段點,即可得出的解析式,再根據(jù)分段函數(shù)的最值求法即可解出.【詳解】(1)依題可知,左邊圖形第一個小矩形的面積為,所以,所以,解得:,.(2)當時,;當時,,故,所以在區(qū)間的最小值為.考點突破考點突破【考點1】成對數(shù)據(jù)的相關(guān)性一、單選題1.(2024·四川成都·二模)對變量有觀測數(shù)據(jù),得散點圖1;對變量有觀測數(shù)據(jù),得散點圖2.表示變量之間的線性相關(guān)系數(shù),表示變量之間的線性相關(guān)系數(shù),則下列說法正確的是(
)A.變量與呈現(xiàn)正相關(guān),且 B.變量與呈現(xiàn)負相關(guān),且C.變量與呈現(xiàn)正相關(guān),且 D.變量與呈現(xiàn)負相關(guān),且2.(2024·四川涼山·三模)調(diào)查某校高三學生的身高和體重得到如圖所示散點圖,其中身高和體重相關(guān)系數(shù),則下列說法正確的是(
)A.學生身高和體重沒有相關(guān)性B.學生身高和體重呈正相關(guān)C.學生身高和體重呈負相關(guān)D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是二、多選題3.(22-23高三上·江蘇無錫·期末)已知由樣本數(shù)據(jù)組成的一個樣本,得到經(jīng)驗回歸方程為,且,去除兩個樣本點和后,得到新的經(jīng)驗回歸方程為.在余下的8個樣本數(shù)據(jù)和新的經(jīng)驗回歸方程中(
).A.相關(guān)變量x,y具有正相關(guān)關(guān)系B.新的經(jīng)驗回歸方程為C.隨著自變量x值增加,因變量y值增加速度變小D.樣本的殘差為4.(2024·湖南衡陽·模擬預測)為了研發(fā)某種流感疫苗,某研究團隊收集了10組抗體藥物的攝入量與體內(nèi)抗體數(shù)量的數(shù)據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點圖及一些統(tǒng)計量的值,抗體藥物攝入量為x(單位:mg),體內(nèi)抗體數(shù)量為y(單位:AU/mL).根據(jù)散點圖,可以得到回歸直線方程為:.下列說法正確的是(
)A.回歸直線方程表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的線性相關(guān)關(guān)系B.回歸直線方程表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的函數(shù)關(guān)系C.回歸直線方程可以精確反映體內(nèi)抗體數(shù)量與抗體藥物攝入量的變化趨勢D.回歸直線方程可以用來預測攝入抗體藥物后體內(nèi)抗體數(shù)量的變化三、填空題5.(23-24高三上·浙江·開學考試)已知成對樣本數(shù)據(jù)中互不相等,且所有樣本點都在直線上,則這組成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù).參考答案:題號1234答案CBABDAD1.C【分析】利用散點圖,結(jié)合相關(guān)系數(shù)的知識可得答案.【詳解】由題意可知,變量的散點圖中,隨的增大而增大,所以變量與呈現(xiàn)正相關(guān);再分別觀察兩個散點圖,圖比圖點更加集中,相關(guān)性更好,所以線性相關(guān)系數(shù).故選:C.2.B【分析】由散點圖的特點可分析相關(guān)性的問題,從而判斷選項,根據(jù)相關(guān)系數(shù)的定義可判斷選項.【詳解】由散點圖可知,散點的分布集中在一條直線附近,所以學生身高和體重具有相關(guān)性,不正確;又身高和體重的相關(guān)系數(shù)為,相關(guān)系數(shù),所以學生身高和體重呈正相關(guān),正確,不正確;從樣本中抽取一部分,相關(guān)性可能變強,也可能變?nèi)?,所以這部分的相關(guān)系數(shù)不一定是,不正確.故選:.3.ABD【分析】根據(jù)線性回歸方程的求法、意義可判斷ABC,再由殘差的概念判斷D.【詳解】,x新平均數(shù),.y新平均數(shù),∴,∴.新的線性回歸方程,x,y具有正相關(guān)關(guān)系,A對.新的線性回歸方程:,B對.由線性回歸方程知,隨著自變量x值增加,因變量y值增加速度恒定,C錯;,,,D對.故選:ABD.4.AD【分析】根據(jù)回歸方程的意義判斷即可.【詳解】回歸直線方程只能表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的線性相關(guān)關(guān)系,不是函數(shù)關(guān)系,A正確,B錯誤,回歸直線方程不能精確反映體內(nèi)抗體數(shù)量與抗體藥物攝入量的變化趨勢,但可以用來預測攝入抗體藥物后體內(nèi)抗體數(shù)量的變化,C錯誤,D正確.故選:AD.5.【分析】根據(jù)給定條件,利用相關(guān)系數(shù)的定義求解作答.【詳解】因為所有樣本點都在直線上,顯然直線的斜率,所以樣本數(shù)據(jù)成負相關(guān),相關(guān)系數(shù)為.故答案為:反思提升:判斷相關(guān)關(guān)系的兩種方法:(1)散點圖法:如果樣本點的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;如果樣本點的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.(2)決定系數(shù)法:利用決定系數(shù)判定,R2越趨近1,擬合效果越好,相關(guān)性越強.【考點2】回歸分析一、單選題1.(2024·四川綿陽·二模)已知變量x,y之間的線性回歸方程為,且變量x,y之間的一組相關(guān)數(shù)據(jù)如表所示,x2468y58.213m則下列說法正確的是(
)A.B.變量y與x是負相關(guān)關(guān)系C.該回歸直線必過點D.x增加1個單位,y一定增加2個單位2.(2024·全國·模擬預測)2023年第19屆亞運會在杭州舉行,亞運會的吉祥物琮琮、蓮蓮、宸宸深受大家喜愛,某商家統(tǒng)計了最近5個月銷量,如表所示:若y與x線性相關(guān),且線性回歸方程為,則下列說法不正確的是(
)時間x12345銷售量y/萬只54.543.52.5A.由題中數(shù)據(jù)可知,變量y與x負相關(guān)B.當時,殘差為0.2C.可以預測當時銷量約為2.1萬只D.線性回歸方程中二、多選題3.(23-24高三上·廣東揭陽·期末)2023年入冬以來,流感高發(fā),某醫(yī)院統(tǒng)計了一周中連續(xù)5天的流感就診人數(shù)y與第天的數(shù)據(jù)如表所示.x12345y2110a15a90109根據(jù)表中數(shù)據(jù)可知x,y具有較強的線性相關(guān)關(guān)系,其經(jīng)驗回歸方程為,則(
)A.樣本相關(guān)系數(shù)在內(nèi) B.當時,殘差為-2C.點一定在經(jīng)驗回歸直線上 D.第6天到該醫(yī)院就診人數(shù)的預測值為1304.(2024·全國·模擬預測)為了預測某地的經(jīng)濟增長情況,某經(jīng)濟學專家根據(jù)該地2023年1~6月的GDP的數(shù)據(jù)y(單位:百億元)建立了線性回歸模型,得到的經(jīng)驗回歸方程為,其中自變量x指的是1~6月的編號,其中部分數(shù)據(jù)如表所示:時間2023年1月2023年2月2023年3月2023年4月2023年5月2023年6月編號x123456y/百億元11.107參考數(shù)據(jù):.則下列說法正確的是(
)A.經(jīng)驗回歸直線經(jīng)過點B.C.根據(jù)該模型,該地2023年12月的GDP的預測值為14.57百億元D.相應于點的殘差為0.103三、填空題5.(2024·江蘇·一模)已知變量的統(tǒng)計數(shù)據(jù)如下表,對表中數(shù)據(jù)作分析,發(fā)現(xiàn)與之間具有線性相關(guān)關(guān)系,利用最小二乘法,計算得到經(jīng)驗回歸直線方程為,據(jù)此模型預測當時的值為.567893.54566.56.(2024·陜西渭南·一模)已知一組數(shù)據(jù)點,用最小二乘法得到其線性回歸方程為,若,則.四、解答題7.(2024·山東日照·二模)某公司為考核員工,采用某方案對員工進行業(yè)務技能測試,并統(tǒng)計分析測試成績以確定員工績效等級.(1)已知該公司甲部門有3名負責人,乙部門有4名負責人,該公司從甲、乙兩部門中隨機選取3名負責人做測試分析,記負責人來自甲部門的人數(shù)為,求的最有可能的取值:(2)該公司統(tǒng)計了七個部門測試的平均成績(滿分100分)與績效等級優(yōu)秀率,如下表所示:324154687480920.280.340.440.580.660.740.94根據(jù)數(shù)據(jù)繪制散點圖,初步判斷,選用作為回歸方程.令,經(jīng)計算得,(ⅰ)已知某部門測試的平均成績?yōu)?0分,估計其績效等級優(yōu)秀率;(ⅱ)根據(jù)統(tǒng)計分析,大致認為各部門測試平均成績,其中近似為樣本平均數(shù),近似為樣本方差.經(jīng)計算,求某個部門績效等級優(yōu)秀率不低于的概率.參考公式與數(shù)據(jù):①.②線性回歸方程中,,.③若隨機變量,則,,.8.(22-23高三上·山東青島·期末)由個小正方形構(gòu)成長方形網(wǎng)格有行和列.每次將一個小球放到一個小正方形內(nèi),放滿為止,記為一輪.每次放白球的頻率為,放紅球的概率為q,.(1)若,,記表示100輪放球試驗中“每一列至少一個紅球”的輪數(shù),統(tǒng)計數(shù)據(jù)如表:n12345y7656423026求y關(guān)于n的回歸方程,并預測時,y的值;(精確到1)(2)若,,,,記在每列都有白球的條件下,含紅球的行數(shù)為隨機變量,求的分布列和數(shù)學期望;(3)求事件“不是每一列都至少一個紅球”發(fā)生的概率,并證明:.附:經(jīng)驗回歸方程系數(shù):,,,.參考答案:題號1234答案CBADAC1.C【分析】根據(jù)給定數(shù)據(jù)及回歸方程求出樣本中心點,再逐項判斷即可得解.【詳解】依題意,,由,解得,A錯誤;回歸方程中,,則變量y與x是正相關(guān)關(guān)系,B錯誤;由于樣本中心點為,因此該回歸直線必過點,C正確;由回歸方程知,x增加1個單位,y大約增加2個單位,D錯誤.故選:C2.B【分析】對于選項A,利用表中數(shù)據(jù)變化情況或看回歸方程的正負均可求解;對于選項B,利用樣本中心點求出線性回歸方程,再利用回歸方程即可求出預測值,進而可求出殘差;對于選項C,利用回歸方程即可求出預測值;對于選項D,利用回歸方程一定過樣本中心點即可求解.【詳解】對于選項A,從數(shù)據(jù)看,隨的增大而減小,所以變量與負相關(guān),故A正確;對于選項B,由表中數(shù)據(jù)知,,所以樣本中心點為,將樣本中心點代入中得,所以線性回歸方程為,所以,殘差,故B錯誤;對于選項C,當時銷量約為(萬只),故C正確.對于選項D,由B選項可知,故D正確.故選:B.3.AD【分析】x,y具有較強的正相關(guān)關(guān)系,可判斷相關(guān)系數(shù)的范圍,判斷A;計算x,y的平均值,代入回歸直線方程求出a的值,即可求出時的預測值,求得殘差,判斷B;看是否適合回歸直線方程,判斷C;將代入回歸直線方程,求出預測值,判斷D.【詳解】由題意可知x,y具有較強的正相關(guān)關(guān)系,故樣本相關(guān)系數(shù)在內(nèi),A正確;根據(jù)題意得,故,解得,故當時,,殘差為,B錯誤;點即點,當時,,即點不在經(jīng)驗回歸直線上,C錯誤;當時,,即第6天到該醫(yī)院就診人數(shù)的預測值為130,D正確,故選:AD4.AC【分析】求得數(shù)據(jù)的樣本中心點,即可判斷A;結(jié)合回歸直線方程求出可判斷B;將代入回歸直線方程求得預測值,可判斷C;根據(jù)殘差的計算可判斷D.【詳解】選項A:由題意得:,因為,,所以,得,因此該經(jīng)驗回歸直線經(jīng)過樣本點的中心,故A正確;選項B:由A知,,得,故B錯誤;選項C:由B得,則當時,,故該地2023年12月的GDP的預測值為14.57百億元,故C正確;選項D:當時,,相應于點的殘差為,(相應于點的殘差),故D錯誤,故選:AC5.7.4【分析】經(jīng)驗回歸直線方程過樣本點的中心,所以把代入求得的值,再代入求解即可.【詳解】由已知得,即樣本點中心,因為經(jīng)驗回歸直線方程過樣本點的中心,所以,解得.所以,當時,.故答案為:.6.【分析】根據(jù)回歸方程必過樣本中心點,即可得到答案.【詳解】根據(jù)題意可知該組數(shù)據(jù)點,所以,所以,故答案為:7.(1)(2)(?。áⅲ痉治觥浚?)依題意的可能取值為,,,,求出所對應的概率,即可判斷;(2)(?。蛇吶?shù),由參考數(shù)據(jù)可知,根據(jù)樣本中心點求出,即可求出回歸方程,再將代入計算可得;(ⅱ)依題意可得,,再令,求出的取值范圍,再由正態(tài)分布的性質(zhì)計算可得.【詳解】(1)依題意,隨機變量服從超幾何分布,且的可能取值為,,,,則,,,.由此可得最大,即的可能性最大,故最有可能的取值為;(2)(?。┮李}意,兩邊取對數(shù),得,即,其中,由提供的參考數(shù)據(jù),可知,又,故,所以,由提供的參考數(shù)據(jù),可得,故,當時,,即估計其績效等級優(yōu)秀率為;(ⅱ)由(?。┘疤峁┑膮⒖紨?shù)據(jù)可知,,,又,即,可得,即.又,且,由正態(tài)分布的性質(zhì),得,記“績效等級優(yōu)秀率不低于”為事件,則,所以績效等級優(yōu)秀率不低于的概率等于.8.(1);3.(2)分布列見解析;.(3);證明見解析.【分析】(1)根據(jù)所給數(shù)據(jù),結(jié)合經(jīng)驗回歸方程系數(shù)公式,即可求得回歸方程,繼而求得預測值;(2)確定X的取值可能為,根據(jù)條件概率的概率公式求得每一個值對應的概率,即可得分布列,繼而求得期望;(3)求得每一列都至少一個紅球的概率,根據(jù)對立事件的概率公式可得事件“不是每一列都至少一個紅球”發(fā)生的概率,再求得“每一行都至少一個白球”的概率,結(jié)合兩事件的關(guān)系可得其概率大小關(guān)系,即可證明結(jié)論.【詳解】(1)由題意知,故,所以,所以線性回歸方程為:,所以,估計時,.(2)由題意知:,,,,則X的取值可能為,記“含紅球的行數(shù)為k”為事件,記“每列都有白球”為事件B,所以,,,所以X的分布列為:012所以數(shù)學期望為.(3)證明:因為每一列至少一個紅球的概率為,記“不是每一列都至少一個紅球”為事件A,所以,記“每一行都至少一個白球”為事件B,所以,顯然,,所以,即,所以.【點睛】關(guān)鍵點點睛:解答要首先能正確的理解題意,弄清楚題目的要求是什么,比如第二文中的條件概率的計算,要弄清每種情況的含義,第三問難點在于正確計算出“不是每一列都至少一個紅球”以及“每一行都至少一個白球”的概率,并能進行判斷二者之間的關(guān)系,從而比較概率大小,證明結(jié)論.反思提升:(1)求經(jīng)驗回歸方程:利用公式eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)求eq\o(b,\s\up6(^));利用eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))求eq\o(a,\s\up6(^)),寫出經(jīng)驗回歸方程.(2)經(jīng)驗回歸方程的擬合效果,可以利用相關(guān)系數(shù)|r|判斷,當|r|越趨近于1時,兩變量的線性相關(guān)性越強.或利用決定系數(shù)R2判斷,R2越大,擬合效果越好.(3)非線性經(jīng)驗回歸方程轉(zhuǎn)化為線性經(jīng)驗回歸方程的方法①若eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))eq\r(x),設t=eq\r(x),則eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t;②若滿足對數(shù)式:eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))lnx,設t=lnx,則eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t;③若滿足指數(shù)式:y=c1ec2x,兩邊取對數(shù)解lny=lnc1+c2x,設z=lny,a=lnc1,b=c2,則z=a+bx.【考點3】獨立性檢驗一、單選題1.(2024·黑龍江哈爾濱·二模)針對2025年第九屆亞冬會在哈爾濱舉辦,校團委對“是否喜歡冰雪運動與學生性別的關(guān)系”進行了一次調(diào)查,其中被調(diào)查的男、女生人數(shù)相同,男生中喜歡冰雪運動的人數(shù)占男生人數(shù)的,女生中喜歡冰雪運動的人數(shù)占女生人數(shù)的,若依據(jù)的獨立性檢驗,認為是否喜歡冰雪運動與學生性別有關(guān),則被調(diào)查的學生中男生的人數(shù)不可能是(
)附:.0.10.050.010.0050.0012.7063.8416.6357.87910.828A.48 B.54 C.60 D.662.(2024·寧夏銀川·一模)有甲、乙兩個班級進行數(shù)學考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)秀統(tǒng)計成績,得到如下所示的列聯(lián)表:優(yōu)秀非優(yōu)秀總計甲班10b乙班c30合計附:P(K2≥k0)0.050.0250.0100.005k03.8415.0246.6357.879已知在全部105人中隨機抽取1人,成績優(yōu)秀的概率為,則下列說法正確的是(
)A.列聯(lián)表中c的值為30,b的值為35B.列聯(lián)表中c的值為15,b的值為50C.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,能認為“成績與班級有關(guān)系”D.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,不能認為“成績與班級有關(guān)系”二、多選題3.(2024·山東臨沂·一模)下列結(jié)論正確的是(
)A.一組樣本數(shù)據(jù)的散點圖中,若所有樣本點都在直線上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為B.已知隨機變量,若,則C.在列聯(lián)表中,若每個數(shù)據(jù)均變成原來的2倍,則也變成原來的2倍(,其中)D.分別拋擲2枚質(zhì)地均勻的骰子,若事件“第一枚骰子正面向上的點數(shù)是奇數(shù)”,“2枚骰子正面向上的點數(shù)相同”,則互為獨立事件4.(22-23高三下·浙江·開學考試)下列結(jié)論中,正確的有(
)A.數(shù)據(jù)4,1,6,2,9,5,8的第60百分位數(shù)為5B.若隨機變量,則C.已知經(jīng)驗回歸方程為y=bx+1.8,且D.根據(jù)分類變量X與Y的成對樣本數(shù)據(jù),計算得到χ2=9.632,依據(jù)小概率值的獨立性檢驗,可判斷X與Y有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.001三、填空題5.(21-22高二下·福建福州·期末)為了考察某種藥物預防疾病的效果,進行動物試驗,得到如下列聯(lián)表:藥物疾病合計未患病患病服用a50未服用50合計8020100若在本次考察中得出“在犯錯誤的概率不超過0.01的前提下認為藥物有效”的結(jié)論,則a的最小值為.(其中且)(參考數(shù)據(jù):,)附:,α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8286.(2024·上海金山·二模)為了考察某種藥物預防疾病的效果,進行動物試驗,得到如下圖所示列聯(lián)表:藥物疾病合計未患病患病服用50未服用50合計8020100取顯著性水平,若本次考察結(jié)果支持“藥物對疾病預防有顯著效果”,則()的最小值為.(參考公式:;參考值:)四、解答題7.(2023·廣東深圳·二模)飛盤運動是一項入門簡單,又具有極強的趣味性和社交性的體育運動,目前已經(jīng)成為了年輕人運動的新潮流.某俱樂部為了解年輕人愛好飛盤運動是否與性別有關(guān),對該地區(qū)的年輕人進行了簡單隨機抽樣,得到如下列聯(lián)表:性別飛盤運動合計不愛好愛好男61622女42428合計104050(1)在上述愛好飛盤運動的年輕人中按照性別采用分層抽樣的方法抽取10人,再從這10人中隨機選取3人訪談,記參與訪談的男性人數(shù)為X,求X的分布列和數(shù)學期望;(2)依據(jù)小概率值的獨立性檢驗,能否認為愛好飛盤運動與性別有關(guān)聯(lián)?如果把上表中所有數(shù)據(jù)都擴大到原來的10倍,在相同的檢驗標準下,再用獨立性檢驗推斷愛好飛盤運動與性別之間的關(guān)聯(lián)性,結(jié)論還一樣嗎?請解釋其中的原因.附:,其中.0.10.010.0012.7066.63510.8288.(2024·吉林·模擬預測)短視頻已成為當下宣傳的重要手段,東北某著名景點利用短視頻宣傳增加旅游熱度,為調(diào)查某天南北方游客來此景點旅游是否與收看短視頻有關(guān),該景點對當天前來旅游的500名游客調(diào)查得知,南方游客有300人,因收看短視頻而來的280名游客中南方游客有200人.(1)依據(jù)調(diào)查數(shù)據(jù)完成如下列聯(lián)表,根據(jù)小概率值的獨立性檢驗,分析南北方游客來此景點旅游是否與收看短視潁有關(guān)聯(lián):單位:人游客短視頻合計收看未看南方游客北方游客合計(2)為了增加游客的旅游樂趣,該景點設置一款5人傳球游戲,每個人得到球后都等可能地傳給其余4人之一,現(xiàn)有甲、乙等5人參加此游戲,球首先由甲傳出.(i)求經(jīng)過次傳遞后球回到甲的概率;(ii)記前次傳遞中球傳到乙的次數(shù)為,求的數(shù)學期望.參考公式:,其中;附表:0.10.050.010.0050.0012.7063.8416.6357.87910.828參考答案:題號1234答案ACBCDBC1.A【分析】根據(jù)已知條件設男生人數(shù)為,結(jié)合獨立性檢驗公式得出不等式,根據(jù)的取值,即可求解.【詳解】設男生人數(shù)為,因為被調(diào)查的男、女生人數(shù)相同,所以女生人數(shù)也為,根據(jù)題意列出列聯(lián)表:男生女生合計喜歡冰雪運動不喜歡冰雪運動合計則,因為依據(jù)的獨立性檢驗,認為是否喜歡冰雪運動與學生性別有關(guān),所以,即,解得,又,所以B、C、D正確,A錯誤.故選:A2.C【分析】根據(jù)題中條件計算可判斷選項A、B;根據(jù)列聯(lián)表計算出的值,即可判斷選項C,D.【詳解】由題意知,成績優(yōu)秀的學生數(shù)是,成績非優(yōu)秀的學生數(shù)是75,所以,選項A、B錯誤;根據(jù)列聯(lián)表中的數(shù)據(jù),得到因此有97.5%的把握認為“成績與班級有關(guān)系”.故C正確,D錯誤,故選:C.3.BCD【分析】根據(jù)相關(guān)系數(shù)的概念判斷A,根據(jù)正態(tài)分布的方差公式及方差的性質(zhì)判斷B,根據(jù)卡方公式判斷C,根據(jù)相互獨立事件的定義判斷D.【詳解】對于A:若所有樣本點都在直線上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為,故A錯誤;對于B:如,則,又,即則,故B正確;對于C:在列聯(lián)表中,若每個數(shù)據(jù)均變成原來的2倍,則,即也變成原來的倍,故C正確;對于D:分別拋擲2枚質(zhì)地均勻的骰子,基本事件總數(shù)為個,事件“第一枚骰子正面向上的點數(shù)是奇數(shù)”,則事件包含的基本事件數(shù)為個,事件“2枚骰子正面向上的點數(shù)相同”,則事件包含的基本事件數(shù)為個,所以,,又包含的基本事件有個,所以,所以,則、互為獨立事件,故D正確;故選:BCD4.BC【分析】第60百分位數(shù)為第五位數(shù)據(jù)6,所以選項A錯誤:,所以選項B正確;,所以選項C正確;此推斷犯錯誤的概率大于0.001,所以選項D錯誤.【詳解】解:數(shù)據(jù)4,1,6,2,9,5,8整理為1,2,4,5,6,8,9,,則數(shù)據(jù)4,1,6,2,9,5,8的第60百分位數(shù)為第五位數(shù)據(jù)6,所以選項A錯誤:隨機變量,則,所以選項B正確;經(jīng)驗回歸方程為y=bx+1.8,且,則,所以選項C根據(jù)分類變量X與Y的成對樣本數(shù)據(jù),計算得到χ2=9.632,依據(jù)小概率值的獨立性檢驗,可判斷X與Y有關(guān)聯(lián),此推斷犯錯誤的概率大于0.001,所以選項D錯誤.故選:BC.5.46【分析】根據(jù)公式列不等式求解.【詳解】由題意可得,整理得,所以或,解得或,又因為且,所以,所以a的最小值為46.故答案為:46.6.【分析】由題意列出不等式,結(jié)合近似計算求出m的取值范圍,即可得答案.【詳解】由題意可知,則,解得或,而,故m的最小值為44.故答案為:44.7.(1)答案見解析(2)答案見解析【分析】(1)分別寫出對相應概率列分布列求數(shù)學期望即可;(2)先求再根據(jù)數(shù)表對應判斷相關(guān)性即可,對比兩次的值可以得出結(jié)論說明原因.【詳解】(1)樣本中愛好飛盤運動的年輕人中男性16人,女性24人,比例為,按照性別采用分層抽樣的方法抽取10人,則抽取男性4人,女性6人.隨機變量的取值為:.,,隨機變量的分布列為隨機變量的數(shù)學期望.(2)零假設為:愛好飛盤運動與性別無關(guān)聯(lián).根據(jù)列聯(lián)表重的數(shù)據(jù),經(jīng)計算得到根據(jù)小概率值的獨立性檢驗,沒有充分證據(jù)推斷不成立,因此可以認為成立,即認為愛好飛盤運動與性別無關(guān)聯(lián).列聯(lián)表中所有數(shù)據(jù)都擴大到原來的10倍后,根據(jù)小概率值的獨立性檢驗,推斷不成立,即認為愛好飛盤運動與性別有關(guān)聯(lián).所以結(jié)論不一樣,原因是每個數(shù)據(jù)都擴大為原來的10倍,相當于樣本量變大為原來的10倍,導致推斷結(jié)論發(fā)生了變化.8.(1)列聯(lián)表見解析,無關(guān)(2)(i);(ii)【分析】(1)利用已知條件,完成列聯(lián)表,利用獨立性檢驗公式求解判斷即可;(2)(i)設經(jīng)過次傳遞后回到甲的概率為,求出關(guān)系式,得到通項公式;(ii)方法一:設第次傳遞時甲接到球的次數(shù)為,則服從兩點分布,,設前次傳遞中球傳到甲的次數(shù)為,利用公式求期望即可.方法二:設第次傳遞時,乙接到球的概率和次數(shù)分別為與,則服從兩點分布,,利用公式求期望即可.【詳解】(1)將所給數(shù)據(jù)進行整理,得到如下列聯(lián)表:游客短視頻合計收看未看南方游客200100300北方游客80120200合計280220500零假設:南北方游客來此景點旅游與短視頻無關(guān)聯(lián).根據(jù)小概率值的獨立性檢驗,我們推斷不成立,即認為南北方游客來此景點旅游與收看短視頻有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.001(2)(i)設經(jīng)過次傳遞后回到甲的概率為,,,又,所以是首項為,公比為的等比數(shù)列,所以.(ii)(方法一)設第次傳遞時甲接到球的次數(shù)為,則服從兩點分布,,設前次傳遞中球傳到甲的次數(shù)為,,因為,所以.(方法二)設第次傳遞時,乙接到球的概率和次數(shù)分別為與,則服從兩點分布,,由題可知,,又,所以,所以是首項為,公比為的等比數(shù)列,,,,故.【點睛】關(guān)鍵點點睛:本題第2問(ii)的解決關(guān)鍵是,根據(jù)題意得到的關(guān)系,利用構(gòu)造法分析出是首項為,公比為的等比數(shù)列,由此得解.反思提升:1.在2×2列聯(lián)表中,如果兩個變量沒有關(guān)系,則應滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關(guān)系越弱;|ad-bc|越大,說明兩個變量之間關(guān)系越強.2.解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟得出結(jié)論.獨立性檢驗的一般步驟:(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表:(2)根據(jù)公式χ2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d))計算χ2;(3)通過比較χ2與臨界值的大小關(guān)系來作統(tǒng)計推斷.分層分層檢測【基礎篇】一、單選題1.(2024·浙江寧波·二模)某校數(shù)學建模興趣小組為研究本地區(qū)兒子身高與父親身高之間的關(guān)系,抽樣調(diào)查后得出與線性相關(guān),且經(jīng)驗回歸方程為.調(diào)查所得的部分樣本數(shù)據(jù)如下:父親身高164166170173173174180兒子身高165168176170172176178則下列說法正確的是(
)A.兒子身高是關(guān)于父親身高的函數(shù)B.當父親身高增加時,兒子身高增加C.兒子身高為時,父親身高一定為D.父親身高為時,兒子身高的均值為2.(2024·天津河西·一模)隨著居民家庭收入的不斷提高,人們對居住條件的改善的需求也在逐漸升溫.某城市統(tǒng)計了最近5個月的房屋交易量,如下表所示:時間12345交易量(萬套)0.81.01.21.5若與滿足一元線性回歸模型,且經(jīng)驗回歸方程為,則下列說法錯誤的是(
)A.根據(jù)表中數(shù)據(jù)可知,變量與正相關(guān)B.經(jīng)驗回歸方程中C.可以預測時房屋交易量約為(萬套)D.時,殘差為3.(2024·天津·一模)下列說法正確的是(
)A.一組數(shù)據(jù)的第80百分位數(shù)為17;B.根據(jù)分類變量與的成對樣本數(shù)據(jù),計算得到,根據(jù)小概率值的獨立性檢驗,可判斷與有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.05;C.兩個隨機變量的線性相關(guān)性越強,相關(guān)系數(shù)的絕對值越接近于0;D.若隨機變量滿足,則.4.(23-24高三上·天津北辰·期中)下列結(jié)論中,錯誤的是(
)A.數(shù)據(jù)4,1,6,2,9,5,8的第60百分位數(shù)為6B.若隨機變量,則C.已知經(jīng)驗回歸方程為,且,則D.根據(jù)分類變量與成對樣本數(shù)據(jù),計算得到χ2=9.632,依據(jù)小概率值的獨立性檢驗,可判斷與有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.001二、多選題5.(2023·湖北·模擬預測)下列命題中正確的是(
)A.若樣本數(shù)據(jù),,,的樣本方差為3,則數(shù)據(jù),,,的方差為7B.經(jīng)驗回歸方程為時,變量x和y負相關(guān)C.對于隨機事件A與B,,,若,則事件A與B相互獨立D.若,則取最大值時6.(2024·山東棗莊·模擬預測)已知兩個變量y與x對應關(guān)系如下表:x12345y5m8910.5若y與x滿足一元線性回歸模型,且經(jīng)驗回歸方程為,則(
)A.y與x正相關(guān) B.C.樣本數(shù)據(jù)y的第60百分位數(shù)為8 D.各組數(shù)據(jù)的殘差和為07.(2024·湖北武漢·二模)下列結(jié)論正確的是(
)A.一組數(shù)據(jù)7,8,8,9,11,13,15,17,20,22的第80百分位數(shù)為17B.若隨機變量,滿足,則C.若隨機變量,且,則D.根據(jù)分類變量與的成對樣本數(shù)據(jù),計算得到.依據(jù)的獨立性檢驗,可判斷與有關(guān)三、填空題8.(23-24高三下·上海嘉定·階段練習)某產(chǎn)品的廣告支出費用x(單位:萬元)與銷售額y(單位:萬元)的數(shù)據(jù)如下表:x24568y3040a5070已知y關(guān)于x的線性回歸方程為,則表格中實數(shù)a的值為.9.(23-24高二下·江西贛州·期中)甲、乙、丙、丁各自研究兩個隨機變量的數(shù)據(jù),若甲、乙、丙、丁計算得到各自研究的兩個隨機變量的線性相關(guān)系數(shù)分別為,,,,則這四人中,研究的兩個隨機變量的線性相關(guān)程度最高.10.(2024·上海長寧·二模)收集數(shù)據(jù),利用列聯(lián)表,分析學習成績好與上課注意力集中是否有關(guān)時,提出的零假設為:學習成績好與上課注意力集中(填:有關(guān)或無關(guān))四、解答題11.(2024·四川成都·模擬預測)數(shù)據(jù)顯示,中國在線直播用戶規(guī)模及在線直播購物規(guī)模近幾年都保持高速增長態(tài)勢,某線下家電商場為提升人氣和提高營業(yè)額也開通了在線直播,下表統(tǒng)計了該商場開通在線直播的第x天的線下顧客人數(shù)y(單位:百人)的數(shù)據(jù):x12345y1012151820(1)根據(jù)第1至第5天的數(shù)據(jù)分析,計算變量y與x的相關(guān)系數(shù)r,并用r判斷兩個變量y與x相關(guān)關(guān)系的強弱(精確到小數(shù)點后三位);(2)根據(jù)第1至第5天的數(shù)據(jù)分析,可用線性回歸模型擬合y與x的關(guān)系,試求出該線性回歸方程并估計該商場開通在線直播的第10天的線下顧客人數(shù).(參考公式:相關(guān)系數(shù),參考數(shù)據(jù):回歸方程:,其中,)12.(2024·四川內(nèi)江·三模)2024年2月10日至17日(正月初一至初八),“2024?內(nèi)江市中區(qū)新春極光焰火草地狂歡節(jié)”在川南大草原舉行,共舉行了8場精彩的煙花秀節(jié)目.前5場的觀眾人數(shù)(單位:萬人)與場次的統(tǒng)計數(shù)據(jù)如表所示:場次編號12345觀眾人數(shù)0.70.811.21.3(1)已知可用線性回歸模型擬合與的關(guān)系,請建立關(guān)于的線性回歸方程;(2)若該煙花秀節(jié)目分A、B、C三個等次的票價,某機構(gòu)隨機調(diào)查了該煙花秀節(jié)目現(xiàn)場200位觀眾的性別與購票情況,得到的部分數(shù)據(jù)如表所示,請將列聯(lián)表補充完整,并判斷能否有的把握認為該煙花秀節(jié)目的觀眾是否購買A等票與性別有關(guān).購買A等票購買非A等票總計男性觀眾50女性觀眾60總計100200參考公式及參考數(shù)據(jù):回歸方程中斜率與截距的最小二乘法估計公式分別為,其中.0.1000.0500.0102.7063.8416.635參考答案:題號1234567答案DDBDBCADCD1.D【分析】根據(jù)變量的線性相關(guān)、經(jīng)驗回歸方程特點逐項分析即可得結(jié)論.【詳解】由題意知父親身高與兒子身高具有線性相關(guān)關(guān)系,不是函數(shù)關(guān)系,故A不正確;當父親身高增加時,兒子身高約增加,故B不正確;當兒子身高為時,代入可得,父親身高可能為,故C不正確;若某父親身高為,則其兒子的身高估計為,故D正確.故選:D.2.D【分析】首先求出、,根據(jù)回歸方程必過樣本中心點求出參數(shù),從而得到回歸方程,再一一判斷即可.【詳解】對于B,依題意,,所以,解得,所以,故B正確;對于A,因為經(jīng)驗回歸方程,,所以變量與正相關(guān),故A正確;對于C,當時,,所以可以預測時房屋交易量約為(萬套),故C正確;對于D,當時,,所以時,殘差為,故D錯誤.故選:D3.B【分析】A選項,由百分位數(shù)的定義得到答案;B選項,,得到結(jié)論;C選項,由相關(guān)系數(shù)的性質(zhì)得到C錯誤;D選項,由方差的性質(zhì)得到D錯誤.【詳解】A選項,,故從小到大排列,第8個數(shù)和第9個數(shù)的平均數(shù)作為第80百分位數(shù),即,A錯誤;B選項,由于,得到與有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.05,B正確;C選項,兩個隨機變量的線性相關(guān)性越強,相關(guān)系數(shù)的絕對值越接近于1,C錯誤;D選項,若隨機變量滿足,則,D錯誤.故選:B4.D【分析】A選項,將數(shù)據(jù)排序后,根據(jù)百分位數(shù)的定義得到答案;B選項,由正態(tài)分布的對稱性得到答案;C選項,將樣本中心點代入回歸方程,求出;D選項,由得到D錯誤.【詳解】A選項,數(shù)據(jù)4,1,6,2,9,5,8排序后得到1,2,4,5,6,8,9,,故選取第5個數(shù)據(jù)作為第60百分位數(shù),即為6,A正確;B選項,因為,根據(jù)對稱性可知,故,B正確;C選項,已知經(jīng)驗回歸方程為,且,則,解得,C正確;D選項,,故不能得到此結(jié)論,D錯誤故選:D5.BC【分析】根據(jù)方差的性質(zhì)可判斷A;根據(jù)變量x,y的線性回歸方程的系數(shù),可判斷B;利用條件概率及獨立事件的定義可判斷C;根據(jù)二項分布概率公式可判斷D.【詳解】對于A,數(shù)據(jù),,…,的方差為,所以A錯誤;對于B,回歸方程的直線斜率為負數(shù),所以變量x與y呈負的線性相關(guān)關(guān)系,所以B正確;對于C,由,得,所以事件A與事件B獨立,所以C正確;對于D,由,即,解得或,所以D錯誤.故選:BC.6.AD【分析】利用相關(guān)性的定義及線性回歸直線可判定A,根據(jù)樣本中心點在回歸方程上可判定B,利用百分位數(shù)的計算可判定C,利用回歸方程計算預測值可得殘差即可判定D.【詳解】由回歸直線方程知:,所以y與x正相關(guān),即A正確;由表格數(shù)據(jù)及回歸方程易知,即B錯誤;易知,所以樣本數(shù)據(jù)y的第60百分位數(shù)為,即C錯誤;由回歸直線方程知時對應的預測值分別為,對應殘差分別為,顯然殘差之和為0,即D正確.故選:AD7.CD【分析】A應用百分位數(shù)求法判斷;B由方差性質(zhì)判斷;C根據(jù)正態(tài)分布對稱性求概率判斷
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)產(chǎn)品代加工與農(nóng)業(yè)綠色生產(chǎn)合作合同3篇
- 2025年度全新員工離職保密協(xié)議及知識產(chǎn)權(quán)歸屬合同2篇
- 二零二五年度互聯(lián)網(wǎng)醫(yī)療股東股權(quán)變更及服務協(xié)議3篇
- 二零二五年度文化場館租賃合同范本3篇
- 二零二五年度環(huán)保材料研發(fā)人員勞動合同書(含成果轉(zhuǎn)化)2篇
- 2025年公司法人變更合同審查與合規(guī)性審查專項服務3篇
- 二零二五年度環(huán)保設備檢修及保養(yǎng)協(xié)議3篇
- 二零二五年度農(nóng)產(chǎn)品電商運營委托收購合作協(xié)議3篇
- 2025養(yǎng)生館合伙人生態(tài)養(yǎng)生旅游項目合作協(xié)議3篇
- 二零二五年度農(nóng)機作業(yè)與農(nóng)村環(huán)境保護服務合同3篇
- 2024年安徽省高中學業(yè)水平合格性考試語文試卷真題(含答案詳解)
- 中南大學《創(chuàng)新創(chuàng)業(yè)導論》2023-2024學年第一學期期末試卷
- 2024潞安化工集團有限公司第二批煤礦井下一線生產(chǎn)操作崗位招聘2820人筆試核心備考題庫及答案解析
- 房地產(chǎn)中介業(yè)務管理制度
- 3.2《遵守規(guī)則》-教學設計2024-2025學年統(tǒng)編版道德與法治八年級上冊
- 拆除高空廣告牌的施工方案
- 天津市部分區(qū)2024-2025學年九年級上學期11月期中數(shù)學試題
- 全國職業(yè)院校技能大賽中職(大數(shù)據(jù)應用與服務賽項)考試題及答案
- 審計基礎知識培訓
- DB43 873-2014 箱式暖腳器標準
- 2024年煤礦安全管理人員(機電運輸)考試題庫(濃縮500題)
評論
0/150
提交評論