2023高考真題知識總結(jié)方法總結(jié)題型突破:37 成對數(shù)據(jù)的統(tǒng)計問題(學(xué)生版)_第1頁
2023高考真題知識總結(jié)方法總結(jié)題型突破:37 成對數(shù)據(jù)的統(tǒng)計問題(學(xué)生版)_第2頁
2023高考真題知識總結(jié)方法總結(jié)題型突破:37 成對數(shù)據(jù)的統(tǒng)計問題(學(xué)生版)_第3頁
2023高考真題知識總結(jié)方法總結(jié)題型突破:37 成對數(shù)據(jù)的統(tǒng)計問題(學(xué)生版)_第4頁
2023高考真題知識總結(jié)方法總結(jié)題型突破:37 成對數(shù)據(jù)的統(tǒng)計問題(學(xué)生版)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

專題37成對數(shù)據(jù)的統(tǒng)計問題【高考真題】1.(2022·全國乙理)某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數(shù)據(jù):樣本號i12345678910總和根部橫截面積0.040.060.040.080.080.050.050.070.070.060.6材積量0.250.400.220.540.510.340.360.460.420.403.9并計算得.(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.附:相關(guān)系數(shù).2.(2022·新高考Ⅰ)一醫(yī)療團隊為研究某地的一種地方性疾病與當?shù)鼐用竦男l(wèi)生習慣(衛(wèi)生習慣分為良好和不夠良好兩類)的關(guān)系,在已患該疾病的病例中隨機調(diào)查了100例(稱為病例組),同時在未患該疾病的人群中隨機調(diào)查了100人(稱為對照組),得到如下數(shù)據(jù):不夠良好良好病例組4060對照組1090(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異?(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習慣不夠良好”,B表示事件“選到的人患有該疾病”.與的比值是衛(wèi)生習慣不夠良好對患該疾病風險程度的一項度量指標,記該指標為R.(ⅰ)證明:;(ⅱ)利用該調(diào)查數(shù)據(jù),給出的估計值,并利用(ⅰ)的結(jié)果給出R的估計值.0.0500.0100.001k3.8416.63510.828附,【知識總結(jié)】1.變量的相關(guān)關(guān)系(1)相關(guān)關(guān)系兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.(2)相關(guān)關(guān)系的分類:正相關(guān)和負相關(guān).(3)線性相關(guān)一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在一條直線附近,我們就稱這兩個變量線性相關(guān).一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相關(guān).2.樣本相關(guān)系數(shù)(1)相關(guān)系數(shù)r的計算變量x和變量y的樣本相關(guān)系數(shù)r的計算公式如下:r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2\i\su(i=1,n,)yi-\x\to(y)2))(2)相關(guān)系數(shù)r的性質(zhì)①當r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當r<0時,成對樣本數(shù)據(jù)負相關(guān);當r=0時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.②樣本相關(guān)系數(shù)r的取值范圍為[-1,1].當|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;當|r|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.3.一元線性回歸模型(1)經(jīng)驗回歸方程與最小二乘法我們將eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估計,其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,

)\b\lc\(\rc\)(\a\vs4\al\co1(xi-\x\to(x)))\b\lc\(\rc\)(\a\vs4\al\co1(yi-\x\to(y))),\i\su(i=1,n,

)\b\lc\(\rc\)(\a\vs4\al\co1(xi-\x\to(x)))2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)(2)利用決定系數(shù)R2刻畫回歸效果R2=1-eq\f(\i\su(i=1,n,

)\b\lc\(\rc\)(\a\vs4\al\co1(yi-\o(y,\s\up6(^))i))2,\i\su(i=1,n,

)\b\lc\(\rc\)(\a\vs4\al\co1(yi-\x\to(y)))2),R2越大,即擬合效果越好,R2越小,模型擬合效果越差.4.列聯(lián)表與獨立性檢驗(1)2×2列聯(lián)表一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為xy合計y=y(tǒng)1y=y(tǒng)2x=x1aba+bx=x2cdc+d合計a+cb+dn=a+b+c+d(2)臨界值χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).忽略χ2的實際分布與該近似分布的誤差后,對于任何小概率值α,可以找到相應(yīng)的正實數(shù)xα,使得P(χ2≥xα)=α成立.我們稱xα為α的臨界值,這個臨界值就可作為判斷χ2大小的標準.(3)獨立性檢驗基于小概率值α的檢驗規(guī)則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【題型突破】考向一概率與回歸分析綜合問題1.(2020·全國Ⅱ)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量,并計算得eq\i\su(i=1,20,x)i=60,eq\i\su(i=1,20,y)i=1200,eq\i\su(i=1,20,)(xi-eq\x\to(x))2=80,eq\i\su(i=1,20,)(yi-eq\x\to(y))2=9000,eq\i\su(i=1,20,)(xi-eq\x\to(x))(yi-eq\x\to(y))=800.(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關(guān)系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大,為提高樣本的代表性以獲得該地區(qū)這種野生動物數(shù)量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:樣本相關(guān)系數(shù)r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2\i\su(i=1,n,)yi-\x\to(y)2)),eq\r(2)≈1.414.2.如圖給出了根據(jù)我國2012年~2018年水果人均占有量y(單位:kg)和年份代碼x繪制的散點圖和經(jīng)驗回歸方程的殘差圖(2012年~2018年的年份代碼x為1~7).(1)根據(jù)散點圖分析y與x之間的相關(guān)關(guān)系;(2)根據(jù)散點圖相應(yīng)數(shù)據(jù)計算得eq\i\su(i=1,7,y)i=1074,eq\i\su(i=1,7,x)iyi=4517,求y關(guān)于x的經(jīng)驗回歸方程(精確到0.01);(3)根據(jù)經(jīng)驗回歸方程的殘差圖,分析經(jīng)驗回歸方程的擬合效果.附:經(jīng)驗回歸直線eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x中斜率和截距的最小二乘估計公式分別為eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).3.小區(qū)門口有一個熟食攤位,經(jīng)過一段時間的統(tǒng)計,發(fā)現(xiàn)菜品種類和日銷售收入之間有一定關(guān)系,具體統(tǒng)計數(shù)據(jù)如下表:菜品種類t45678910日銷售收入y147159171184197210221(1)建立y關(guān)于t的線性回歸方程;(eq\x\to(y)保留整數(shù))(2)根據(jù)所求線性回歸方程,預(yù)測如果希望日銷售收入超過300元,則菜品種類至少多少種?附:線性回歸直線的斜率和截距的最小二乘估計公式分別為eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)ti-\x\to(t)yi-\x\to(y),\i\su(i=1,n,

)ti-\x\to(t)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(t),參考數(shù)據(jù):eq\i\su(i=1,7,)(ti-eq\x\to(t))(yi-eq\x\to(y))=350,eq\i\su(i=1,7,)(ti-eq\x\to(t))2=28.4.配速是馬拉松運動中常使用的一個概念,是速度的一種,是指每千米所需要的時間,相比配速,把心率控制在一個合理水平是安全理性跑馬拉松的一個重要策略.圖①是一個馬拉松跑者的心率y(單位:次/分鐘)和配速x(單位:分鐘/千米)的散點圖,圖②是一次馬拉松比賽(全程約42千米)前3000名跑者成績(單位:分鐘)的頻率分布直方圖.(1)由散點圖看出,可用線性回歸模型擬合y與x的關(guān)系,求y與x的線性回歸方程;(2)該跑者如果參加本次比賽,將心率控制在160左右跑完全程,估計他跑完全程花費的時間,并估計他能獲得的名次.參考公式:用最小二乘法求線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的系數(shù):eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))·\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).參考數(shù)據(jù):eq\x\to(y)=135.5.某機構(gòu)為研究某種圖書每冊的成本費y(單位:元)與印刷數(shù)量x(單位:千冊)的關(guān)系,收集了一些數(shù)據(jù)并進行了初步處理,得到了下面的散點圖及一些統(tǒng)計量的值.eq\x\to(x)eq\x\to(y)eq\x\to(u)eq\i\su(i=1,8,)(xi-eq\x\to(x))2eq\i\su(i=1,8,)(xi-eq\x\to(x))·(yi-eq\x\to(y))eq\i\su(i=1,8,)(ui-eq\x\to(u))2eq\i\su(i=1,8,)(ui-eq\x\to(u))·(yi-eq\x\to(y))15.253.630.2692085.5-230.30.7877.049表中ui=eq\f(1,xi),eq\x\to(u)=eq\f(1,8)eq\i\su(i=1,8,u)i.(1)根據(jù)散點圖判斷y=a+bx與y=c+eq\f(d,x)哪一個模型更適合作為該圖書每冊的成本費y(單位:元)與印刷數(shù)量x(單位:千冊)的經(jīng)驗回歸方程?(只要求給出判斷,不必說明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的經(jīng)驗回歸方程(回歸系數(shù)的結(jié)果精確到0.01).(3)若該圖書每冊的定價為10元,則至少應(yīng)該印刷多少冊才能使銷售利潤不低于78840元?(假設(shè)能夠全部售出.結(jié)果精確到1)附:對于一組數(shù)據(jù)(ω1,υ1),(ω2,υ2),…,(ωn,υn),其經(jīng)驗回歸直線eq\o(υ,\s\up6(^))=eq\o(α,\s\up6(^))+eq\o(β,\s\up6(^))ω的斜率和截距的最小二乘估計分別為eq\o(β,\s\up6(^))=eq\f(\i\su(i=1,n,)ωi-\x\to(ω)υi-\x\to(υ),\i\su(i=1,n,)ωi-\x\to(ω)2),eq\o(α,\s\up6(^))=eq\x\to(υ)-eq\o(β,\s\up6(^))eq\x\to(ω).6.艾滋病是一種危害性極大的傳染病,由感染艾滋病病毒(HIV病毒)引起,它把人體免疫系統(tǒng)中最重要的CD4-T淋巴細胞作為主要攻擊目標,使人體喪失免疫功能.下表是近八年來我國艾滋病病毒累計感染人數(shù)統(tǒng)計表:年份20142015201620172018201920202021年份代碼x12345678累計感染者人數(shù)y(單位:萬人)34.338.343.353.857.765.471.885(1)請根據(jù)該統(tǒng)計表,畫出這八年我國艾滋病病毒累計感染人數(shù)的折線圖;(2)請用相關(guān)系數(shù)說明:能用線性回歸模型擬合y與x的關(guān)系;(3)建立y關(guān)于x的回歸方程(系數(shù)精確到0.01),預(yù)測2024年我國艾滋病病毒累計感染人數(shù).參考數(shù)據(jù):eq\r(42)≈6.48;eq\o(∑,\s\up6(8),\s\do4(i=1))yi=449.6,eq\o(∑,\s\up6(8),\s\do4(i=1))xiyi=2319.5,eq\r(\o(∑,\s\up6(8),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)=eq\r(42),eq\r(\o(∑,\s\up6(8),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)=46.2,參考公式:相關(guān)系數(shù)r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),回歸方程:eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).7.近年來,高鐵的發(fā)展逐漸改變了人們的出行方式,我國2016~2020年高鐵運營里程的數(shù)據(jù)如下表所示.年份20162017201820192020年份代碼x12345高鐵運營里程y(萬千米)1.92.22.52.93.5(1)若x與y具有線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程;(2)每一年與前一年的高鐵運營里程之差即為該年新增的里程,根據(jù)這五年的數(shù)據(jù),若用2017~2020年每年新增里程的頻率代替之后每年新增相應(yīng)里程的概率,求2024年中國高鐵運營里程大于或等于5萬千米的概率.附:線性回歸方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x中斜率和截距的最小二乘估計公式分別為:eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).8.每年春天,婺源的油菜花海吸引數(shù)十萬游客紛至沓來,油菜花成為“中國最美鄉(xiāng)村”的特色景觀,三月,婺源篁嶺油菜花海進入最佳觀賞期.現(xiàn)統(tǒng)計了近七年每年(2015年用x=1表示,2016年用x=2表示)來篁嶺旅游的人次y(單位:萬人次)相關(guān)數(shù)據(jù),如下表所示:x1234567y29333644485259(1)若y關(guān)于x具有較強的線性相關(guān)關(guān)系,求y關(guān)于x的線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),并預(yù)測2022年來篁嶺旅游的人次;(2)為維持旅游秩序,今需A,B,C,D四位公務(wù)員去各景區(qū)值班,已知A,B,C去篁嶺值班的概率均為eq\f(2,3),D去篁嶺值班的概率為eq\f(1,3),且每位公務(wù)員是否去篁嶺值班不受影響,用X表示此4人中去篁嶺值班的人數(shù),求X的分布列與均值.參考公式:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,

)xi-\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).參考數(shù)據(jù):eq\i\su(i=1,7,y)i=301,eq\i\su(i=1,7,)(xi-eq\x\to(x))(yi-eq\x\to(y))=140.9.研究機構(gòu)對某校學(xué)生往返校時間的統(tǒng)計資料表明:該校學(xué)生居住地到學(xué)校的距離x(單位:千米)和學(xué)生花費在上學(xué)路上的時間y(單位:分鐘)有如下的統(tǒng)計數(shù)據(jù):到學(xué)校的距離x(千米)1.82.63.14.35.56.1花費的時間y(分鐘)17.819.627.531.336.043.2由統(tǒng)計資料表明y與x具有線性相關(guān)關(guān)系.(1)判斷y與x的相關(guān)程度;(相關(guān)系數(shù)r的絕對值大于0.75時,認為兩個變量相關(guān)程度很強,精確到0.01)(2)求線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))(精確到0.01);(3)將eq\o(y,\s\up6(^))<27的時間數(shù)據(jù)eq\o(y,\s\up6(^))i稱為美麗數(shù)據(jù),現(xiàn)從這6個時間數(shù)據(jù)eq\o(y,\s\up6(^))i中任取2個,求抽取的2個數(shù)據(jù)全部為美麗數(shù)據(jù)的概率.參考公式:用最小二乘法求線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的系數(shù):eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))·\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).參考數(shù)據(jù):eq\i\su(i=1,6,y)i=175.4,eq\i\su(i=1,6,x)iyi=764.36,eq\i\su(i=1,6,)(xi-eq\x\to(x))·(yi-eq\x\to(y))=80.30,eq\i\su(i=1,6,

)(xi-eq\x\to(x))2=14.30,eq\i\su(i=1,6,

)(yi-eq\x\to(y))2=471.65,eq\r(\i\su(i=1,6,

)xi-\x\to(x)2\i\su(i=1,6,

)yi-\x\to(y)2)=82.13.10.隨著中美貿(mào)易戰(zhàn)的不斷升級,越來越多的國家科技巨頭加大了科技研發(fā)投入的力度.中華技術(shù)有限公司擬對“麒麟”手機芯片進行科技升級,根據(jù)市場調(diào)研與模擬,得到科技升級投入x(億元)與科技升級直接收益y(億元)的數(shù)據(jù)統(tǒng)計如下:序號123456789101112x2346810132122232425y1322314250565868.56867.56666當0<x≤17時,建立了y與x的兩個回歸模型:模型①:eq\o(y,\s\up6(^))=4.1x+11.8;模型②:eq\o(y,\s\up6(^))=21.3eq\r(x)-14.4;當x>17時,確定y與x滿足的線性回歸方程為eq\o(y,\s\up6(^))=-0.7x+eq\o(a,\s\up6(^)).(1)根據(jù)下列表格中的數(shù)據(jù),比較當0<x≤17時模型①、②的相關(guān)指數(shù)R2的大小,并選擇擬合精度更高、更可靠的模型,預(yù)測對“麒麟”手機芯片科技升級的投入為17億元時的直接收益回歸模型模型①模型②回歸方程eq\o(y,\s\up6(^))=4.1x+11.8eq\o(y,\s\up6(^))=21.3eq\r(x)-14.4eq\o(∑,\s\up6(7),\s\do4(i=1))(yi-eq\o(y,\s\up6(^))i)2182.479.2(附:刻畫回歸效果的相關(guān)指數(shù)R2=1-eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2),eq\r(17)≈4.1)(2)為鼓勵科技創(chuàng)新,當科技升級的投入不少于20億元時,國家給予公司補貼5億元,以回歸方程為預(yù)測依據(jù),比較科技升級投入17億元與20億元時公司實際收益的大??;(附:用最小二乘法求線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的系數(shù):eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))·\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)))(3)科技升級后,“麒麟”芯片的效率X大幅提高,經(jīng)實際試驗得X大致服從正態(tài)分布N(0.52,0.012).公司對科技升級團隊的獎勵方案如下:若芯片的效率不超過50%,不予獎勵;若芯片的效率超過50%但不超過53%,每部芯片獎勵2元;若芯片的效率超過53%,每部芯片獎勵4元,記Y為每部芯片獲得的獎勵,求E(Y)(精確到0.01).(附:若隨機變量X~N(μ,σ2)(σ>0),則P(μ-σ<X≤μ+σ)=0.6827,P(μ-2σ<X≤μ+2σ)=0.9545)考向二概率與獨立性檢驗綜合問題11.(2021·全國甲)甲、乙兩臺機床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級品和二級品,為了比較兩臺機床產(chǎn)品的質(zhì)量,分別用兩臺機床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)量情況統(tǒng)計如下表:一級品二級品合計甲機床15050200乙機床12080200合計270130400(1)甲機床、乙機床生產(chǎn)的產(chǎn)品中一級品的頻率分別是多少?(2)能否有99%的把握認為甲機床的產(chǎn)品質(zhì)量與乙機床的產(chǎn)品質(zhì)量有差異?附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),P(K2≥k)0.0500.0100.001k3.8416.63510.82812.某社區(qū)管委會積極響應(yīng)正在開展的“創(chuàng)文活動”,特制訂了飼養(yǎng)寵物的管理規(guī)定.為了解社區(qū)住戶對這個規(guī)定的態(tài)度(贊同與不贊同),工作人員隨機調(diào)查了社區(qū)220戶住戶,將他們的態(tài)度和家里是否有寵物的情況進行了統(tǒng)計,得到如下2×2列聯(lián)表(單位:戶):贊同規(guī)定住戶不贊同規(guī)定住戶合計家里有寵物住戶7040110家里沒有寵物住戶9020110合計16060220同時,工作人員還從上述調(diào)查的不贊同管理規(guī)定的住戶中,用分層抽樣的方法按家里有寵物、家里沒有寵物抽取了18戶組成樣本T,進一步研究完善飼養(yǎng)寵物的管理規(guī)定.(1)根據(jù)上述列聯(lián)表,能否在犯錯誤的概率不超過0.001的前提下認為“社區(qū)住戶對飼養(yǎng)寵物的管理規(guī)定的態(tài)度與家里是否有寵物有關(guān)系”?(2)工作人員在樣本T中隨機抽取6戶住戶進行訪談,求這6戶住戶中,至少有1戶家里沒有寵物的概率P(結(jié)果用分數(shù)表示).附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.P(K2≥k0)0.100.0100.001k02.7066.63510.82813.為了了解市民對A,B運營商的5G通信服務(wù)的評價,分別從A,B運營商的用戶中隨機抽取100名用戶對其進行測評,已知測評得分在70分以上的為優(yōu)秀,測評結(jié)果如表:A運營商的100名用戶的測評得分得分[40,50](50,60](60,70](70,80](80,90](90,100]頻率0.180.230.30.240.030.02(1)根據(jù)頻率分布直方圖,求B運營商的100名用戶的測評得分的平均值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表);(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為測評得分是否優(yōu)秀與運營商有關(guān)?優(yōu)秀非優(yōu)秀總計A運營商B運營商總計附:K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.82814.為了響應(yīng)政府“節(jié)能減排”的號召,某知名品牌汽車廠家決定生產(chǎn)一款純電動汽車.生產(chǎn)前,廠家進行了人們對純電動汽車接受程度的調(diào)查.在20~60歲的人群中隨機抽取了100人,調(diào)查數(shù)據(jù)的頻率分布直方圖和接受純電動汽車的人數(shù)與年齡的統(tǒng)計結(jié)果如圖所示:年齡[20,28)[28,36)[36,44)[44,52)[52,60]接受的人數(shù)146152817(1)由以上統(tǒng)計數(shù)據(jù)填2×2列聯(lián)表,并判斷能否有95%的把握認為以44歲為分界點的不同年齡人群對純電動汽車的接受程度有差異?44歲以下44歲及44歲以上總計接受不接受總計(2)若以44歲為分界點,從不接受“純電動汽車”的人群中,按分層抽樣的方法抽取8人調(diào)查不接受“純電動汽車”的原因,現(xiàn)從這8人中隨機抽取2人.記抽到44歲以下的人數(shù)為X,求隨機變量X的分布列及數(shù)學(xué)期望.附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.82815.推進垃圾分類處理,是落實綠色發(fā)展理念的必然選擇,也是打贏污染防治攻堅戰(zhàn)的重要環(huán)節(jié).為了解居民對垃圾分類的了解程度,某社區(qū)居委會隨機抽取1000名社區(qū)居民參與問卷測試,并將問卷得分繪制頻率分布表如下:得分[30,40)[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]男性人數(shù)40901201301106030女性人數(shù)2050801101004020(1)從該社區(qū)隨機抽取一名居民參與問卷測試,試估計其得分不低于60分的概率;(2)將居民對垃圾分類的了解程度分為“比較了解”(得分不低于60分)和“不太了解”(得分低于60分)兩類,完成2×2列聯(lián)表,并判斷是否有95%的把握認為“居民對垃圾分類的了解程度”與“性別”有關(guān)?單位:人性別了解程度合計不太了解比較了解男性女性合計(3)從參與問卷測試且得分不低于80分的居民中,按照性別進行分層抽樣,共抽取10人,連同n(n∈N*)名男性調(diào)查員一起組成3個環(huán)保宣傳隊.若從這n+10中隨機抽取3人作為隊長,且男性隊長人數(shù)占的期望不小于2.求n的最小值.附:K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))(n=a+b+c+d).臨界值表:P(K2>k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.82816.直播帶貨是扶貧助農(nóng)的一種新模式,這種模式是利用主流媒體的公信力,聚合銷售主播的力量助力打通農(nóng)產(chǎn)品產(chǎn)銷鏈條,切實助力貧困地區(qū)農(nóng)民脫貧增收.某貧困地區(qū)有統(tǒng)計數(shù)據(jù)顯示,2020年該地利用網(wǎng)絡(luò)直播形式銷售農(nóng)產(chǎn)品的銷售主播年齡等級分布如圖1所示,一周內(nèi)使用直播銷售的頻率分布扇形圖如圖2所示.若將銷售主播按照年齡分為“年輕人”(20歲~39歲)和“非年輕人”(19歲及以下或者40歲及以上)兩類,將一周內(nèi)使用的次數(shù)為6次或6次以上的稱為“經(jīng)常使用直播銷售用戶”,使用次數(shù)為5次或不足5次的稱為“不常使用直播銷售用戶”,則“經(jīng)常使用直播銷售用戶”中有eq\f(5,6)是“年輕人”.(1)現(xiàn)對該地相關(guān)居民進行“經(jīng)常使用網(wǎng)絡(luò)直播銷售與年齡關(guān)系”的調(diào)查,采用隨機抽樣的方法,抽取一個容量為200的樣本,請你根據(jù)圖表中的數(shù)據(jù),完成2×2列聯(lián)表,并判斷能否有85%的把握認為經(jīng)常使用網(wǎng)絡(luò)直播銷售與年齡有關(guān)?使用直播銷售情況與年齡列聯(lián)表年輕人非年輕人總計經(jīng)常使用直播銷售用戶不常使用直播銷售用戶總計(2)某投資公司在2021年年初準備將1000萬元投資到“銷售該地區(qū)農(nóng)產(chǎn)品”的項目上,現(xiàn)有兩種銷售方案供選擇:方案一:線下銷售.根據(jù)市場調(diào)研,利用傳統(tǒng)的線下銷售,到年底可能獲利30%,可能虧損15%,也可能不賠不賺,且這三種情況發(fā)生的概率分別為eq\f(7,10),eq\f(1,5),eq\f(1,10);方案二:線上直播銷售.根據(jù)市場調(diào)研,利用線上直播銷售,到年底可能獲利50%,可能虧損30%,也可能不賠不賺,且這三種情況發(fā)生的概率分別為eq\f(3,5),eq\f(3,10),eq\f(1,10).針對以上兩種銷售方案,請你從均值和方差的角度為投資公司選擇一個合理的方案,并說明理由.參考數(shù)據(jù):獨立性檢驗臨界值表P(K2≥k0)0.150.100.0500.0250.010k02.0722.7063.8415.0246.635其中,K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.17.電視傳媒公司為了解某地區(qū)電視觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調(diào)查.如圖所示的是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖.將日均收看該體育節(jié)目時間不低于40分鐘的觀眾稱為“體育迷”.(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,據(jù)此資料你是否認為“體育迷”與性別有關(guān)?非體育迷體育迷合計男女1055合計(2)將上述調(diào)查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為X.若每次抽取的結(jié)果是相互獨立的,求X的分布列,均值E(X)和方差D(X).附:χ2=eq\f(nad-bc2,a+bc+da+cb+d)α0.050.01xα3.8416.63518.2018年3月份,上海出臺了《關(guān)于建立完善本市生活垃圾全程分類體系的實施方案》,4月份又出臺了《上海市生活垃圾全程分類體系建設(shè)行動計劃(2018~2020年)》,提出到2020年底,基本實現(xiàn)單位生活垃圾強制分類全覆蓋,居民區(qū)普遍推行生活垃圾分類制度.為加強社區(qū)居民的垃圾分類意識,推動社區(qū)垃圾分類正確投放,某社區(qū)在健身廣場舉辦了“垃圾分類,從我做起”生活垃圾分類大型宣傳活動,號召社區(qū)居民用實際行動為建設(shè)綠色家園貢獻一份力量,為此需要征集一部分垃圾分類志愿者.(1)為調(diào)查社區(qū)居民喜歡擔任垃圾分類志愿者是否與性別有關(guān),現(xiàn)隨機選取了一部分社區(qū)居民進行調(diào)查,其中被調(diào)查的男性居民和女性居民人數(shù)相同,男性居民中不喜歡擔任垃圾分類志愿者占男性居民的eq\f(3,5),女性居民中不喜歡擔任垃圾分類志愿者占女性居民的eq\f(1,5),若研究得到在犯錯誤概率不超過0.010的前提下,認為居民喜歡擔任垃圾分類志愿者與性別有關(guān),則被調(diào)查的女性居民至少多少人?(2)某垃圾站的日垃圾分揀量y(千克)與垃圾分類志愿者人數(shù)x(人)滿足回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),數(shù)據(jù)統(tǒng)計如下:志愿者人數(shù)x(人)23456日垃圾分揀量y(千克)25304045t已知eq\o(y,\s\up6(-))=eq\f(1,5)eq\i\su(i=1,5,y)i=40,eq\i\su(i=1,5,x)eq\o\al(\s\up1(2),\s\do1(i))=90,eq\i\su(i=1,5,x)iyi=885,根據(jù)所給數(shù)據(jù)求t和回歸方程eq\o(y,\s\u

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論