專題25概率與統(tǒng)計(回歸分析獨立性檢驗)(新高考地區(qū)專用)_第1頁
專題25概率與統(tǒng)計(回歸分析獨立性檢驗)(新高考地區(qū)專用)_第2頁
專題25概率與統(tǒng)計(回歸分析獨立性檢驗)(新高考地區(qū)專用)_第3頁
專題25概率與統(tǒng)計(回歸分析獨立性檢驗)(新高考地區(qū)專用)_第4頁
專題25概率與統(tǒng)計(回歸分析獨立性檢驗)(新高考地區(qū)專用)_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

專題2.5概率與統(tǒng)計(回歸分析、獨立性檢驗)1.有關獨立性檢驗的問題,分析如下:(1)利用頻率估計概率;(2)根據(jù)題意,求得的值,對照臨界值得結(jié)果.2.對于非線性回歸方程及其應用,考查將非線性回歸問題轉(zhuǎn)化為線性回歸問題求解,在解題的過程中,要注重回歸方程的公式的正確計算,注意所給數(shù)據(jù)的正確應用.1.(2023·遼寧朝陽·校聯(lián)考一模)秋天的第一杯奶茶是一個網(wǎng)絡詞匯,最早出自四川達州一位當?shù)孛窬?,民警用“秋天的第一杯奶茶”順利救下一名女孩,由此而火爆全網(wǎng).后來很多人開始在秋天里買一杯奶茶送給自己在意的人.某奶茶店主記錄了入秋后前7天每天售出的奶茶數(shù)量(單位:杯)如下:日期第一天第二天第三天第四天第五天第六天第七天日期代碼x1234567杯數(shù)y4152226293132(1)請根據(jù)以上數(shù)據(jù),繪制散點圖,并根據(jù)散點圖判斷,y=a+bx與y=c+dlnx哪一個更適宜作為y關于(2)建立y關于x的回歸方程(結(jié)果保留1位小數(shù)),并根據(jù)建立的回歸方程,試預測要到哪一天售出的奶茶才能超過35杯?(3)若每天售出至少25杯即可盈利,則從第一天至第七天中任選三天,記隨機變量X表示盈利的天數(shù),求隨機變量X的分布列.參考公式和數(shù)據(jù):其中u回歸直線方程y=byui=1i=1i=1e22.71.2759235.113.28.2【解題思路】(1)根據(jù)散點圖趨勢即可判斷;(2)利用非線性回歸方程轉(zhuǎn)化為線性回歸方程的方法求解;(3)根據(jù)超幾何分布求分布列.【解答過程】(1)根據(jù)散點圖,知y=c+dlnx更適宜作為y關于(2)令u=lnx,則由已知數(shù)據(jù)得d=c=所以y=5.7+14.2u故y關于x的回歸方程為y?進而由題意知,令5.7+14.2lnx>35,整理得lnx>2.1故當x=9時,即到第9天才能超過35杯;(3)由題意知,這7天中銷售超過25杯的有4天,則隨機變量X的可能取值為0,1,2,3PX=0=CPX=2=C則隨機變量X的分布列為X0123P1121842.(2023·四川成都·校考二模)2022年12月2日晚,神舟十四號、神舟十五號航天員乘組進行在軌交接儀式,兩個乘組移交了中國空間站的鑰匙,6名航天員分別在確認書上簽字,中國空間站正式開啟長期有人駐留模式.為調(diào)查大學生對中國航天事業(yè)的了解情況,某大學進行了一次抽樣調(diào)查,若被調(diào)查的男女生人數(shù)均為20nn∈男生女生合計了解10n不了解5n合計(1)求n的值.(2)現(xiàn)采用分層抽樣的方法在調(diào)查結(jié)果“了解中國航天事業(yè)”的學生中抽取5人,再從這5人中抽取3人進行第二次調(diào)查,以便了解學生獲得中國航天事業(yè)信息的渠道,則至少有2名男生被第二次調(diào)查的概率.附表:P(0.100.050.0250.010.001k2.7063.8415.0246.63510.828K【解題思路】(1)根據(jù)已知完成列聯(lián)表,結(jié)合K2(2)根據(jù)分層抽樣的比例比,結(jié)合概率加法公式進行求解即可.【解答過程】(1)由已知,完成列聯(lián)表,男生女生合計了解15n10n25n不了解5n10n15n合計20n20n40n將數(shù)值代入公式可得K2的觀測值:K所以5.024≤8n3<6.635,解得1.884≤n<2.488,因為n∈(2)由上可知了解中國航天事業(yè)的男生、女生人數(shù)分別為30、20,所以根據(jù)分層抽樣的性質(zhì)可知:5名學生中男生人數(shù)為5×30女生人數(shù)為5×20設事件A:至少有2名男生被第二次調(diào)查,PA3.(2023·四川南充·統(tǒng)考二模)某甜品屋店慶當天為酬謝顧客,當天顧客每消費滿一百元獲得一次抽獎機會,獎品分別為價值5元,10元,15元的甜品一份,每次抽獎,抽到價值為5元,10元,15元的甜品的概率分別為12(1)若某人當天共獲得兩次抽獎機會,設這兩次抽獎所獲甜品價值之和為X元,求X的分布列與期望.(2)某大學“愛牙協(xié)會”為了解“愛吃甜食”與青少年“蛀牙”情況之間的關系,隨機對200名青少年展開了調(diào)查,得知這200個人中共有120個人“有蛀牙”,其中“不愛吃甜食”且“有蛀牙”的有30人,“不愛吃甜食”且“無蛀牙”的有50人.有2×2列聯(lián)表:有蛀牙無蛀牙合計愛吃甜食不愛吃甜食合計完成上面的列聯(lián)表,根據(jù)獨立性檢驗,能否有99.5%的把握認為“愛吃甜食”與青少年“蛀牙”有關?附:K2=nP0.050.010.005k3.8416.6357.879【解題思路】(1)由題意可得X的所有可能取值為10,15,20,25,30,分別求出對應的概率,即可得X的分布列,再求出數(shù)學期望;(2)由已知填充列聯(lián)表,根據(jù)公式計算出K2【解答過程】(1)由題意,X的所有可能取值為10,15,20,25,30,PX=10=1PX=20=2×1PX=30則X的分布列為X1015202530P11511故EX(2)由題意可得列聯(lián)表如下:有蛀牙無蛀牙合計愛吃甜食9030120不愛吃甜食305080合計12080200所有K2所以有99.5%的把握認為“愛吃甜食”與青少年“蛀牙”有關.4.(2023·寧夏石嘴山·校考一模)2022年卡塔爾世界杯足球賽于11月21日至12月18日在卡塔爾境內(nèi)舉辦,這是第二十二屆世界杯足球賽,是歷史上首次在卡塔爾和中東國家境內(nèi)舉行,也是繼2002年韓日世界杯之后時隔二十年第二次在亞洲舉行的世界杯足球賽,備受矚目,一時間掀起了國內(nèi)外的足球熱潮.某機構為了了解喜愛足球運動是否與性別有關,隨機抽取了男性和女性各120名觀眾進行調(diào)查,統(tǒng)計數(shù)據(jù)如下:喜愛足球運動不喜愛足球運動男性8040女性6060(1)根據(jù)上表說明,能否在犯錯誤概率不超過0.01的前提下認為喜愛足球運動與性別有關?(2)現(xiàn)從參與調(diào)查且喜愛足球運動的觀眾中,采用按性別分層抽樣的方法,選取7人進行有獎競答.①求男、女性觀眾各選取多少人?②若從這7人中隨機抽取4人進行本屆世界杯賽事集錦分享,求抽到男生人數(shù)X的分布列和數(shù)學期望EX附:χ2=nα0.100.050.0250.0100.0050.001x2.7063.8415.0246.6357.87910.828【解題思路】(1)根據(jù)表中數(shù)據(jù)計算χ2(2)①根據(jù)已知條件及分層抽樣的定義即可求解;②根據(jù)①的結(jié)論及已知條件,求出隨機變量的取值,利用古典概型的概率公式求出隨機變量對應取值的概率,寫出隨機變量的分布列,再利用隨機變量的期望公式即可求解.【解答過程】(1)由題意可知,χ2所以能在犯錯誤概率不超過0.01的前提下認為喜愛足球運動與性別有關.(2)①根據(jù)分層抽樣的原理,可知男生觀眾選取80140×7=4人,女生觀眾選取所以男、女性觀眾各選取4,3人.②隨機變量X的可能取值為1,2,3,4,則PX=1PX=2PX=3PX=4所以X的分布列如下表X1234P418121所以EX5.(2023·吉林長春·校聯(lián)考一模)某學校號召學生參加“每天鍛煉1小時”活動,為了了解學生參與活動的情況,隨機調(diào)查了100名學生一個月(30天)完成鍛煉活動的天數(shù),制成如下頻數(shù)分布表:天數(shù)[0,5](5,10](10,15](15,20](20,25](25,30]人數(shù)4153331116(1)由頻數(shù)分布表可以認為,學生參加體育鍛煉天數(shù)X近似服從正態(tài)分布Nμ,σ2,其中μ(2)調(diào)查數(shù)據(jù)表明,參加“每天鍛煉1小時”活動的天數(shù)在(15,30]的學生中有30名男生,天數(shù)在[0,15]的學生中有20名男生,學校對當月參加“每天鍛煉1小時”活動超過15天的學生授予“運動達人”稱號.請?zhí)顚懴旅媪新?lián)表:性別活動天數(shù)合計[0,15](15,30]男生女生合計并依據(jù)小概率值α=0.05的獨立性檢驗,能否認為學生性別與獲得“運動達人”稱號有關聯(lián).如果結(jié)論是有關聯(lián),請解釋它們之間如何相互影響.附:參考數(shù)據(jù):Pμ?σ≤X≤μ+σ=0.6827;Pμ?2σ≤X≤μ+2σ=0.9545α0.10.050.010.0050.001x2.7063.8416.6357.87910.828【解題思路】(1)利用頻數(shù)分布表,求得樣本的平均數(shù),從而寫出X近似服從正態(tài)分布X?N(14.9,6.1),利用參考數(shù)據(jù)求得參加“每天鍛煉1小時”活動超過21天的人數(shù);(2)根據(jù)頻數(shù)分布表和已知條件,完善列聯(lián)表,根據(jù)獨立性檢驗的公式,求出學生性別與獲得“運動達人”稱號是否有關聯(lián)和它們之間如何相互影響.【解答過程】(1)由頻數(shù)分布表知μ=4×2.5+15×7.5+33×12.5+31×17.5+11×22.5+6×27.5100=14.9,則X?N(14.9,6.1)∴P(X>21)=P(X>14.9+6.1)=1?0.6827∴3000×0.15865=475.95≈476,∴參加“每天鍛煉1小時”活動超過21天的人數(shù)約為476人.(2)由頻數(shù)分布表知,鍛煉活動的天數(shù)在[0,15]的人數(shù)為:4+15+33=52,∵參加“每天鍛煉1小時”活動的天數(shù)在[0,15]的學生中有20名男生,∴參加“每天鍛煉1小時”活動的天數(shù)在[0,15]的學生中有女生人數(shù):52?20=32由頻數(shù)分布表知,鍛煉活動的天數(shù)在(15,30]的人數(shù)為31+11+6=48,∵參加“每天鍛煉1小時”活動的天數(shù)在(15,30]的學生中有30名男生,∴參加“每天鍛煉1小時”活動的天數(shù)在[0,15]的學生中有女生人數(shù):48?30=18列聯(lián)表如下:性別活動天數(shù)合計[0,15](15,30]男生203050女生321850合計5248100零假設為H0χ依據(jù)α=0.05的獨立性檢驗,我們推斷H0而且此推斷犯錯誤的概率不大于0.05,根據(jù)列聯(lián)表中的數(shù)據(jù)得到,男生、女生中活動天數(shù)超過15天的頻率分別為:3050=0.6和18506.(2023·內(nèi)蒙古包頭·一模)新型冠狀病毒疫情已經(jīng)嚴重影響了我們正常的學習、工作和生活.某市為了遏制病毒的傳播,利用各種宣傳工具向市民宣傳防治病毒傳播的科學知識.某校為了解學生對新型冠狀病毒的防護認識,對該校學生開展防疫知識有獎競賽活動,并從女生和男生中各隨機抽取30人,統(tǒng)計答題成績分別制成如下頻數(shù)分布表和頻率分布直方圖.規(guī)定:成績在80分及以上的同學成為“防疫標兵”.30名女生成績頻數(shù)分布表:成績60,7070,8080,9090,100頻數(shù)101064(1)根據(jù)以上數(shù)據(jù),完成以下2×2列聯(lián)表,并判斷是否有95%的把握認為“防疫標兵”與性別有關;男生女生合計防疫標兵非防疫標兵合計(2)設男生和女生樣本平均數(shù)分別為x和y,樣本的中位數(shù)分別為x0和y0,求附:KP0.1000.0500.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828【解題思路】(1)利用頻率分布直方圖及頻數(shù)分布表完善2×2列聯(lián)表,再計算K2(2)利用頻率分布直方圖、頻數(shù)分布表求出平均數(shù)、中位數(shù)作答.【解答過程】(1)由頻率分布直方圖,可得30名男生中成績大于等于80分的頻率為(0.035+0.025)×10=0.6,因此30名男生中“防疫標兵”人數(shù)為30×0.6=18人,“非防疫標兵”人數(shù)為12人,由頻數(shù)分布表,可得30名女生中“防疫標兵”人數(shù)為10人,“非防疫標兵”人數(shù)為20人,于是2×2列聯(lián)表為:男生女生合計防疫標兵181028非防疫標兵122032合計303060則K2的觀測值為K所以有95%的把握認為“防疫標兵”與性別有關.(2)由頻率分布直方圖知,x=65×0.1+75×0.3+85×0.35+95×0.25=82.5由頻數(shù)分布表知,y=65×由頻率分布直方圖知,成績在[60,80)的頻率為0.40,成績在[60,90)的頻率為0.75,因此x0則由0.1+0.3+x0?80由頻數(shù)分布表知,成績在[60,70)的頻率為13,成績在[60,80)的頻率為23,因此則由13+y所以x=82.5,y≈76.33,x07.(2023·河南·校聯(lián)考模擬預測)基礎學科招生改革試點,也稱強基計劃,強基計劃是教育部開展的招生改革工作,主要是為了選拔培養(yǎng)有志于服務國家重大戰(zhàn)略需求且綜合素質(zhì)優(yōu)秀或基礎學科拔尖的學生.聚焦高端芯片與軟件?智能科技?新材料?先進制造和國家安全等關鍵領域以及國家人才緊缺的人文社會科學領域.某校在一次強基計劃模擬考試后,從全體考生中隨機抽取52名,獲取他們本次考試的數(shù)學成績(x)和物理成績(y),繪制成如圖散點圖:根據(jù)散點圖可以看出y與x之間有線性相關關系,但圖中有兩個異常點A,B.經(jīng)調(diào)查得知,A考生由于重感冒導致物理考試發(fā)揮失常,B考生因故未能參加物理考試.為了使分析結(jié)果更科學準確,剔除這兩組數(shù)據(jù)后,對剩下的數(shù)據(jù)作處理,得到一些統(tǒng)計的值:i=150xi=5800,i=150yi=3900,i=150xiyi=462770,(1)若不剔除A,B兩名考生的數(shù)據(jù),用52組數(shù)據(jù)作回歸分析,設此時y與x的相關系數(shù)為r0.試判斷r0與(2)求y關于x的線性回歸方程(系數(shù)精確到0.01),并估計如果B考生加了這次物理考試(已知B考生的數(shù)學成績?yōu)?25分),物理成績是多少?(精確到0.1)附:線性回歸方程y=a+【解題思路】(1)根據(jù)已知條件,結(jié)合散點圖,即可求解.(2)根據(jù)已知條件,結(jié)合最小二乘法,以及線性回歸方程的公式,求出線性回歸方程,再將x=125代入,即可求解.【解答過程】(1)r理由如下:由圖可知,y與x成正相關關系,①異常點A,B會降低變量之間的線性相關程度,②52個數(shù)據(jù)點與其回歸直線的總偏差更大,回歸效果更差,所以相關系數(shù)更小,③50個數(shù)據(jù)點與其回歸直線的總偏差更小,回歸效果更好,所以相關系數(shù)更大,④50個數(shù)據(jù)點更貼近其回歸直線l,⑤52個數(shù)據(jù)點與其回歸直線更離散.(2)由題中數(shù)據(jù)可得:x=所以i=150xia=所以y=0.36x+36.24將x=125代入,得y=0.36×125+36.24=81.24≈81.2,所以估計B考生的物理成績約為81.2分.8.(2023·河南·校考模擬預測)造林綠化對生態(tài)發(fā)展特別是在防風固沙、緩解溫室效應、凈化空氣、涵養(yǎng)水源等方面有著重要意義.某苗木培養(yǎng)基地為了對某種樹苗的高度偏差x(單位:cm)與樹干最大直徑偏差y(單位:mm)之間的關系進行分析,隨機挑選了8株該品種的樹苗,得到它們的偏差數(shù)據(jù)(偏差是指個別測定值與測定的平均值之差)如下:樹苗序號12345678高度偏差x20151332?5?10?18直徑偏差y6.53.53.51.50.5?0.5?2.5?3.5(1)若x與y之間具有線性相關關系,求y關于x的線性回歸方程;(2)若這種樹苗的平均高度為120cm,樹干最大直徑平均為31.5mm,試由(1)的結(jié)論預測高度為128cm的這種樹苗的樹干最大直徑為多少毫米.參考數(shù)據(jù):i=18xi參考公式:回歸直線方程y=a+bx【解題思路】(1)根據(jù)最小二乘法公式求出b,(2)利用回歸直線方程代入x=128?120,求解即可.【解答過程】(1)x=y=b=i=1n故y關于x的線性回歸方程為y=(2)當樹干高度為128cm時,高度偏差x=128?120=8(cm),y=所以樹干直徑約為2.5+31.5=34(mm)即預測高度為128cm的這種樹苗的樹干最大直徑為34毫米.9.(2023·全國·模擬預測)為了研究某種細菌隨天數(shù)x變化的繁殖個數(shù)y,收集數(shù)據(jù)如下:天數(shù)x123456繁殖個數(shù)y612254995190(1)在圖中作出繁殖個數(shù)y關于天數(shù)x變化的散點圖,并由散點圖判斷y=bx+a(a,b為常數(shù))與y=c1ec2x(c1,c2為常數(shù),且(2)對于非線性回歸方程y=c1ec2x(c1,c2為常數(shù),且c1xyzi=1i=1i=13.5062.833.5317.50596.5712.9①證明:“對于非線性回歸方程y=c1ec2x,令z=lny,可以得到繁殖個數(shù)的對數(shù)z關于天數(shù)x具有②根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關于x的回歸方程(系數(shù)保留2位小數(shù)).附:對于一組數(shù)據(jù)u1,v1,u2,v2,…,【解題思路】(1)根據(jù)散點圖,結(jié)合一次函數(shù)和指數(shù)型函數(shù)圖象的特征進行判斷即可;(2)①根據(jù)對數(shù)與指數(shù)的互化公式進行求解即可;②利用題中所給的數(shù)據(jù)和公式進行求解即可.【解答過程】(1)作出散點圖如圖所示.由散點圖看出樣本點分布在一條指數(shù)型曲線的周圍,故選擇y=c(2)①由已知,z=lny,則則α=lnc1,β=c2,即z=βx+α②由①知繁殖個數(shù)的對數(shù)z關于天數(shù)x可以用線性回歸方程來擬合.由表中數(shù)據(jù)可得β=α=則z關于x的線性回歸方程為z=0.69x+1.12又z=ln因此細菌的繁殖個數(shù)y關于天數(shù)x的非線性回歸方程為y=10.(2023·遼寧撫順·統(tǒng)考模擬預測)學校為提升高一年級學生自主體育鍛煉的意識,擬稱每周自主進行體育鍛煉的時間不低于6小時的同學稱為“體育迷”并予以獎勵,為了確定獎勵方案,先對學生自主體育鍛煉的情況進行抽樣調(diào)查,學校從高一年級隨機抽取100名學生,將他們分為男生組、女姓組,對每周自主體育鍛煉的時間分段進行統(tǒng)計(單位:小時)第一段0,2,第二段2,4,第三段4,6,第四段6,8,第五段8,10.將男生在各段的頻率及女生在各段的頻數(shù)用折線圖表示如下:(1)求折線圖中m的值,并估計該校高一年級學生中“體育迷”所占的比例;(2)填寫下列2×2列聯(lián)表,并判斷是否有95%的把握認為是否為“體育迷”與學生的性別有關?體育迷非體育迷合計男女合計附:KP0.0500.0100.001K3.8416.63510.828(3)若中學生每周自主體育鍛煉的時間不低于5小時,才能保持身體的良好健康發(fā)展,試估計該校高一年級學生的周平均鍛煉時間是否達到保持身體良好健康發(fā)展的水平?(同一段中的數(shù)據(jù)用該組區(qū)間的中點值代表)【解題思路】(1)由折線圖的性質(zhì)可求m,由頻數(shù)統(tǒng)計圖求女生人數(shù),再求男生人數(shù),和男生和女生中的體育迷的人數(shù),由此可求該校高一年級學生中“體育迷”所占的比例;(2)由已知數(shù)據(jù)填寫列聯(lián)表,由公式求K2(3)由已知數(shù)據(jù)求該校高一年級學生的周平均鍛煉時間的估計值,由此確定結(jié)論.【解答過程】(1)由頻率折線圖可得m=1?0.04?0.20?0.24?0.16=0.36由頻數(shù)折線圖可知女生共有1+4+5+12+3=25人,其中“體育迷”有12+3=15人,故男生共有100?25=75人,其中“體育迷”有75×(0.24+0.16)=30人.因此估計該校高一學生中“體育迷”所占比例約為15+30100(2)體育迷非體育迷合計男304575女151025合計4555100因為K2=100故沒有95%的把握認為是否為“體育迷”與性別有關.(3)由頻率折線圖可知男生的鍛煉時間在每組的頻數(shù)分別為75×0.04=3,75×0.20=15,75×0.36=27,75×0.24=18,75×0.16=12;故這100名學生每周的鍛煉時間在每組的頻率分別為(1+3)÷100=0.04,(4+15)÷100=0.19,(5+27)÷100=0.32,(12+18)÷100=0.30,(3+12)÷100=0.15.所以估計該校高一年級學生的周平均鍛煉時間為:1×0.04+3×0.19+5×0.32+7×0.30+9×0.15=5.66.因為5.66>5,所以估計該校高一年級學生的周平均鍛煉時間達到了保持身體良好健康發(fā)展的水平.11.(2023·陜西咸陽·統(tǒng)考二模)2021年,黨中央、國務院印發(fā)了《關于進一步減輕義務教育階段學生作業(yè)負擔和校外培訓負擔的意見》,也就是我們現(xiàn)在所稱的“雙減”政策.某地為了檢測雙減的落實情況,從某高中選了6名同學,檢測課外學習時長(單位:分鐘),相關數(shù)據(jù)如下表所示.學生序號123456學習時長/分220180210220200230(1)若從被抽中的6名同學中隨機抽出2名,則抽出的2名同學課外學習時長都不小于210分鐘的概率;(2)下表是某班統(tǒng)計了本班同學2022年17月份的人均月課外勞動時間(單位:小時),并建立了人均月課外勞動時間y關于月份x的線性回歸方程y=bx+4,y月份x1234567人均月勞動時間y89m12n1922由于某些原因?qū)е虏糠謹?shù)據(jù)丟失,但已知i=17(i)求m,n的值;(ii)求該班6月份人均月勞動時間數(shù)據(jù)的殘差值(殘差即樣本數(shù)據(jù)與預測值之差).附:y=bx+a,【解題思路】(1)根據(jù)古典概型運算公式,結(jié)合列舉法進行求解即可;(2)(i)根據(jù)題中所給的公式進行求解即可;(ii)利用代入法,結(jié)合殘差的定義進行求解即可.【解答過程】(1)用x,y表示從被抽中的6名同學中隨機抽出2名同學的序號分別為x和y,則基本事件有1,2,1,3,1,4,1,5,1,6,2,3,2,4,2,5,2,6,3,4,3,5,3,6,4,5,4,6,5,6,共15個,將“抽出的2名同學的課外學習時長都不小于210分鐘”記為事件,由已知,序號為1,3,4,6的同學課外學習時長都不小于210分鐘,∴事件A中基本事件有1,3,1,4,1,6,3,4,3,6,4,6,共6個,∴PA(2)(i)由表知x=y=∴i=17∴b=i=17∵回歸直線恒過樣本點的中心x,y,∴70+m+n7由①②,得b=177∵i=17xi由③④,得m=10,n=16.(ii)∵線性回歸方程為y=∴當x=6時,預測值y=17712.(2023·遼寧·校聯(lián)考一模)一所中學組織學生對某線下某實體店2022年部分月份的月利潤情況進行調(diào)查統(tǒng)計,得到的數(shù)據(jù)如下:月份x24681012凈利潤y(萬元)0.92.04.23.95.25.1λ=0.71.41.82.12.32.5μ=1.42.02.42.83.23.5根據(jù)散點圖,準備用①y=alnx+b或②y=cx+d建立(1)用線性相關系數(shù)說明上面的兩種模型哪種適宜作為y關于x的回歸方程?(2)由參考數(shù)據(jù),根據(jù)(1)的判斷結(jié)果,求y關于x的回歸方程(精確到0.1).附:對于一組數(shù)據(jù)ui,vi(i=1,2,3,?,n),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為β=參考數(shù)據(jù):x=7,y=3.55,λ=1.80,μi=16μi?μi=16yi【解題思路】(1)計算相關系數(shù)比較大小即可確定更適宜的模型;(2)利用最小二乘法相關公式即可求解.【解答過程】(1)由題意y=aλ+b的線性相關系數(shù)的相關系數(shù)r1y=cx+d的相關系數(shù)所以1>r(2)根據(jù)(1)的判斷結(jié)果,計算a與b由參考數(shù)據(jù)a=i=16所以b=y于是y關于x的回歸方程①為y=2.5ln13.(2023·四川遂寧·??寄M預測)某高校共有學生15000人,其中男生10500人,女生4500人.為了調(diào)查該校學生每周平均體育運動時間的情況,采用分層抽樣的方法,收集300位學生每周平均體育運動時間(單位:小時)的樣本數(shù)據(jù).(1)應收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個樣本數(shù)據(jù),得到學生每周平均體育運動時間的頻率分布直方圖(如圖),其中樣本數(shù)據(jù)的分組區(qū)間為0,2,(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請給出每周平均體育運動時間與性別的列聯(lián)表,并判斷是否認為“該校學生的每周平均體育運動時間與性別有關”.附:P0.1000.0500.0100.005k2.7063.8416.6357.879參考公式:K2=n【解題思路】(1)利用分層抽樣的定義即可求解;(2)利用頻率分布直方圖中,所有小長方形的面積之和等于1及頻率等于(頻率/組距)乘以組距即可求解;(3)根據(jù)已知條件求出列聯(lián)表,然后計算K2【解答過程】(1)由分層抽樣,得300×4500所以應收集90位女生的樣本數(shù)據(jù).(2)由頻率分布直方圖可得,學生每周平均體育運動時間超過4小時的頻率為1?2×0.100+0.025所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75.(3)由(2)可知,300位學生中有300×0.75=225(人)的每周平均體育運動時間超過4小時,則有300?225=75(人)的每周平均體育運動時間不超過4小時.又樣本數(shù)據(jù)中有90份是關于女生的,210份是關于男生的,所以每周平均體育運動時間與性別列聯(lián)表如下:男生女生總計每周平均體育運動時間不超過4小時453075每周平均體育運動時間超過4小時16560225總計21090300結(jié)合列聯(lián)表可算得,K2的觀測值k=所以有95%14.(2023·全國·模擬預測)第五屆中國國際進口博覽會(以下簡稱進博會)于2022年11月5日至10日在國家會展中心(上海)舉辦.本屆進博會共有284家世界500強和行業(yè)龍頭企業(yè)參展,數(shù)量超過上屆,其中至少參展過兩屆及以上進博會的企業(yè)占比約為90%.本屆進博會首次運用虛擬現(xiàn)實、三維建模等新技術手段,引入了全新的線上展示技術,為參觀者帶來不同以往的觀展體驗.活動結(jié)束后,進博會組委會從參觀者中隨機抽取100人(其中年齡在50周歲及以下的有60人)了解他們對全新的線上展示活動的滿意度,并按年齡(50周歲及以下和50周歲以上)分類統(tǒng)計得到如下不完整的2×2列聯(lián)表:不滿意滿意總計50周歲及以下5550周歲以上15總計100(1)根據(jù)統(tǒng)計數(shù)據(jù)完成以上2×2列聯(lián)表,并根據(jù)小概率值α=0.001的獨立性檢驗,能否認為對全新的線上展示活動是否滿意與年齡有關聯(lián)?(2)從本屆參展的284家世界500強和行業(yè)龍頭企業(yè)中隨機抽取3家了解他們對組委會的組織工作的滿意度,設其中至少參展過兩屆及以上進博會的企業(yè)的個數(shù)為X,若以本屆參展的世界500強和行業(yè)龍頭企業(yè)中至少參展過兩屆及以上進博會的企業(yè)的頻率為概率.①求X的分布列和數(shù)學期望;②求PX?1參考公式及數(shù)據(jù):χ2=nα0.1000.0500.0100.001x2.7063.8416.63510.828【解題思路】(1)根據(jù)題意中的數(shù)據(jù)完成列聯(lián)表,利用卡方公式計算,結(jié)合題意表格中的參照數(shù)據(jù)和獨立性檢驗的思想即可下結(jié)論;(2)由題意可得X~B3,0.9,利用二項分布求概率公式求出PX=0,PX=1,PX=2,【解答過程】(1)由題意,抽取的100名參觀者中年齡在50周歲及以下的有60人,則年齡在50周歲以上的有40人,所以50周歲及以下不滿意的有5人,50周歲以上滿意的有25人,補全的2×2列聯(lián)表如下:不滿意滿意總計50周歲及以下5556050周歲以上152540總計2080100χ2所以認為對全新的線上展示活動是否滿意與年齡有關聯(lián).(2)①由題意可得,一家參展企業(yè)至少參展過兩屆及以上進博會的概率為0.9,則X~B3,0.9,X則PX=0=CPX=2=C所以X的分布列為X0123P0.0010.0270.2430.729數(shù)學期望EX②PX?115.(2023·福建廈門·統(tǒng)考二模)移動物聯(lián)網(wǎng)廣泛應用于生產(chǎn)制造、公共服務、個人消費等領域.截至2022年底,我國移動物聯(lián)網(wǎng)連接數(shù)達18.45億戶,成為全球主要經(jīng)濟體中首個實現(xiàn)“物超人”的國家.右圖是20182022年移動物聯(lián)網(wǎng)連接數(shù)W與年份代碼t的散點圖,其中年份20182022對應的t分別為1~5.(1)根據(jù)散點圖推斷兩個變量是否線性相關.計算樣本相關系數(shù)(精確到0.01),并推斷它們的相關程度;(2)(i)假設變量x與變量Y的n對觀測數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn),兩個變量滿足一元線性回歸模型

Y=bx+eE(e)=0,D(e)=σ2(隨機誤差ei=yi(ii)令變量x=t?t,y=w?w,則變量x與變量Y滿足一元線性回歸模型Y=bx+eE(e)=0,D(e)=σ附:樣本相關系數(shù)r=i=1nti?t(w【解題思路】(1)根據(jù)相關系數(shù)計算,若r>0兩個變量正相關,若r<0兩個變量負相關,r越接近于1說明線性相關越強.(2)(i)整理得Q=b2i=1(ii)根據(jù)b計算公式求得經(jīng)驗回歸方程,并代入t=7可預測2024年移動物聯(lián)網(wǎng)連接數(shù).【解答過程】(1)由散點圖可以看出樣本點都集中在一條直線附近,由此推斷兩個變量線性相關.因為t=所以i=15所以r=i=1所以這兩個變量正線性相關,且相關程度很強.(2)(i)Q==b要使Q取得最小值,當且僅當b=(ii)由(i)知b=i=15所以y關于x的經(jīng)驗回歸方程y=2.72x,又w=所以當t=7時,則x=7?3=4,w=y+w所以預測2024年移動物聯(lián)網(wǎng)連接數(shù)23.04億戶.16.(2023·山西·統(tǒng)考模擬預測)某農(nóng)科所對冬季大棚內(nèi)的晝夜溫差與某反季節(jié)大豆新品種發(fā)芽率之間的關系進行分析研究,記錄了2023年1月1日至1月12日大棚內(nèi)的晝夜溫差與每天每100顆種子的發(fā)芽數(shù),得到如下資料:日期1日2日3日4日5日6日7日8日9日10日11日12日溫差x/℃101113128109111310129發(fā)芽數(shù)y/顆212428281522172230182718i=112xi=128;i=1已知發(fā)芽數(shù)y與溫差x之間線性相關,該農(nóng)科所確定的研究方案是:先從這12組數(shù)據(jù)中選取2組,用剩下的10組數(shù)據(jù)求線性回歸方程,再用被選取的2組數(shù)據(jù)進行檢驗.(1)求選取的2組數(shù)據(jù)恰好是相鄰2天的數(shù)據(jù)的概率;(2)若選取的是1日與6日的兩組數(shù)據(jù),試根據(jù)除這兩日之外的其他數(shù)據(jù),求出y關于x的線性回歸方程y=(3)若由線性回歸方程得到的估計數(shù)據(jù)與所選取的檢驗數(shù)據(jù)的誤差均不超過2顆,則認為求得的線性回歸方程是可靠的,試問:(2)中所得的線性回歸方程是否可靠.參考公式:回歸方程y=bx+a中斜率和截距的最小二乘估計公式分別為【解題思路】(1)利用組合及組合數(shù)公式,結(jié)合古典概型的概率的計算公式即可求解;(2)根據(jù)已知條件及參考數(shù)據(jù),求出b,(3)利用(2)的回歸方程求出x=10時的預報值,結(jié)合已知條件即可求解.【解答過程】(1)從12組數(shù)據(jù)中任選2組,選法數(shù)為C12選取的2組數(shù)據(jù)恰好是相鄰的2天,選法數(shù)為11;所以所求概率為P=11(2)設剩下的10組數(shù)據(jù)分別為u1i=110u=110i=110ui所以b所以a=所以所求回歸方程為y=3x?10(3)當x=10時,y=3×10?10=20因為21?20=1<2;22?20=2,所以根據(jù)所給的研究方案,可以判斷(2)中所得的線性回歸方程是可靠的.17.(2023·浙江·校聯(lián)考三模)大壩是一座具有灌溉、防洪、發(fā)電、航運、養(yǎng)殖和游覽等綜合效益的大型水利樞紐工程.為預測滲壓值和控制庫水位,工程師在水庫選取一支編號為BS3的滲壓計,隨機收集10個該滲壓計管內(nèi)水位和水庫水位監(jiān)測數(shù)據(jù):樣本號i12345678910總和水庫水位x75.6975.7475.7775.7875.8175.8575.6775.8775.975.93758.01BS3滲壓計管內(nèi)水位y72.8872.9072.9272.9272.9372.9472.9472.9572.9672.98729.32并計算得i=110xi2=57457.98(1)估計該水庫中BS3號滲壓計管內(nèi)平均水位與水庫的平均水位;(2)求該水庫BS3號滲壓計管內(nèi)水位與水庫水位的樣本相關系數(shù)(精確到0.01);(3)某天雨后工程師測量了水庫水位,并得到水庫的水位為76m.利用以上數(shù)據(jù)給出此時BS3附:相關系數(shù)r=i=1nxi?xy【解題思路】(1)根據(jù)平均數(shù)的計算方法直接求解即可;(2)根據(jù)表格數(shù)據(jù)計算得到相關系數(shù)公式中的各個數(shù)據(jù),代入公式即可;(3)由最小二乘法可求得經(jīng)驗回歸方程,代入x=76即可求得預估值.【解答過程】(1)水庫的平均水位x=BS3號滲壓計管內(nèi)平均水位y=(2)i=110同理可得:i=110i=110∴r=i=1n(3)∵b=i=1∴BS3號滲壓計管內(nèi)水位關于水庫水位的經(jīng)驗回歸方程為y=0.23x+55.5當x=76時,預測值y=0.23×76+55.5=72.98即水庫的水位為76m時,BS3號滲壓計管內(nèi)水位的估計值為72.9818.(2023·福建漳州·統(tǒng)考三模)2022年11月17日,由工業(yè)和信息化部、安徽省人民政府共同主辦的第十七屆“中國芯”集成電路產(chǎn)業(yè)大會在合肥成功舉辦.此次大會以“強芯固基以質(zhì)為本”為主題,旨在培育壯大我國集成電路產(chǎn)業(yè),夯實產(chǎn)業(yè)基礎、營造良好產(chǎn)業(yè)生態(tài).2022年,全國芯片研發(fā)單位相比2006年增加194家,提交芯片數(shù)量增加299個,均增長超過6倍.某芯片研發(fā)單位用在“A芯片”上研發(fā)費用占本單位總研發(fā)費用的百分比y(%)如表所示.年份2016201720182019202020212022年份代碼1234567y20303239424650(1)根據(jù)表中的數(shù)據(jù),作出相應的折線圖;并結(jié)合相關數(shù)據(jù),計算相關系數(shù)r,并推斷y與t線性相關程度;(已知:0.8≤r≤1,則認為y與t線性相關很強;0.3≤r<0.8,則認為y與t線性相關一般;r<0.3(2)求出y與t的回歸直線方程(保留一位小數(shù));(3)請判斷,若2024年用在“A芯片”上研發(fā)費用不低于295萬元,則該單位2024年芯片研發(fā)的總費用預算為500萬元是否符合研發(fā)要求?附:相關數(shù)據(jù):i=17yi=259,7≈2.65相關計算公式:①相關系數(shù)r=i=1在回歸直線方程y=bx+a中,【解題思路】(1)根據(jù)表格數(shù)據(jù)可繪制折線圖,結(jié)合公式可求得相關系數(shù)r,對比已知線性相關強度判斷依據(jù)即可得到結(jié)論;(2)采

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論