




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1講統(tǒng)計與統(tǒng)計案例專題五內容索引0102必備知識?精要梳理關鍵能力?學案突破必備知識?精要梳理1.抽樣方法(1)從容量為N的總體中抽取容量為n的樣本,則每個個體被抽到的概率都為等可能性,公平性名師點析簡單隨機抽樣、分層抽樣都是等概率抽樣,體現(xiàn)了抽樣的公平性,但又各有其特點和適用范圍.(2)分層抽樣實際上就是按比例抽樣,即按各層個體數(shù)占總體的比確定各層應抽取的樣本容量.2.統(tǒng)計中的四個數(shù)據(jù)特征(1)眾數(shù):在樣本數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個數(shù)據(jù).(2)中位數(shù):在樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,如果數(shù)據(jù)的個數(shù)是奇數(shù),位于最中間的數(shù)據(jù)作為中位數(shù).如果數(shù)據(jù)的個數(shù)為偶數(shù),就取中間兩個數(shù)據(jù)的平均數(shù)作為中位數(shù).探究在頻率分布直方圖中如何確定眾數(shù)、中位數(shù)和平均數(shù)?在頻率分布直方圖中,眾數(shù)是最高小長方形底邊中點的橫坐標;中位數(shù)左邊和右邊的小長方形的面積是相等的;平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和.3.變量間的相關關系(1)一般地,如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一條直線附近,那么我們稱這兩個變量線性相關.當r<0時,稱成對樣本數(shù)據(jù)負相關.當|r|越接近1時,成對樣本數(shù)據(jù)的線性相關程度越強;當|r|越接近0時,成對樣本數(shù)據(jù)的線性相關程度越弱.名師點析根據(jù)經(jīng)驗回歸方程進行預測,得到的僅是一個預測值,而不是真實發(fā)生的值.4.獨立性檢驗對于取值分別是{x1,x2}和{y1,y2}的分類變量X和Y,其樣本頻數(shù)列聯(lián)表如下.XY合計Y=y1Y=y2X=x1aba+bX=x2cdc+d合計a+cb+dn關鍵能力?學案突破突破點一用樣本估計總體[例1](2021·全國乙,理17)某廠研制了一種生產(chǎn)高精產(chǎn)品的設備,為檢驗新設備生產(chǎn)產(chǎn)品的某項指標有無提高,用一臺舊設備和一臺新設備各生產(chǎn)了10件產(chǎn)品,得到各件產(chǎn)品該項指標數(shù)據(jù)如下.舊設備9.810.310.010.29.9新設備10.110.410.110.010.1舊設備9.810.010.110.29.7新設備10.310.610.510.410.5規(guī)律方法用樣本估計總體的解題步驟(1)用樣本的頻率估計總體的步驟①確定樣本容量N;②確定事件發(fā)生的次數(shù)(頻數(shù));③求頻率
;④估計總體.(2)用樣本的數(shù)字特征估計總體的步驟①確定樣本;②求樣本的平均數(shù)、眾數(shù)、中位數(shù)、方差(標準差);③由數(shù)字分析樣本、估計總體.對點練1某家庭記錄了未使用節(jié)水龍頭50天的日用水量數(shù)據(jù)(單位:m3)和使用了節(jié)水龍頭50天的日用水量數(shù)據(jù),得到頻數(shù)分布表如下:未使用節(jié)水龍頭50天的日用水量頻數(shù)分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)頻數(shù)13249265使用了節(jié)水龍頭50天的日用水量頻數(shù)分布表
日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)頻數(shù)151310165(1)在下圖中作出使用了節(jié)水龍頭50天的日用水量數(shù)據(jù)的頻率分布直方圖;(2)估計該家庭使用節(jié)水龍頭后,日用水量小于0.35m3的概率;(3)估計該家庭使用節(jié)水龍頭后,一年能節(jié)省多少水?(一年按365天計算,同一組中的數(shù)據(jù)以這組數(shù)據(jù)所在區(qū)間中點的值作代表)
解
(1)如圖所示.(2)根據(jù)以上數(shù)據(jù),該家庭使用節(jié)水龍頭后50天日用水量小于0.35
m3的頻率為0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此該家庭使用節(jié)水龍頭后,日用水量小于0.35
m3的概率的估計值為0.48.突破點二線性回歸分析
根據(jù)散點圖可以看出y與x之間有線性相關關系,但圖中有兩個異常點,分別為A,B兩名考生的成績.經(jīng)調查得知,A考生由于重感冒導致物理考試發(fā)揮失常,B考生因故未能參加物理考試.為了使分析結果更科學準確,剔除這兩表示這50名考生的數(shù)學成績、物理成績,i=1,2,…,50,y與x的相關系數(shù)r≈0.45.(1)若不剔除A,B兩名考生的數(shù)據(jù),用52組數(shù)據(jù)作回歸分析,設此時y與x的相關系數(shù)為r0.試判斷r0與r的大小關系(不必說明理由);(2)求y關于x的經(jīng)驗回歸方程(系數(shù)精確到0.01),并估計如果B考生參加了這次物理考試(已知B考生的數(shù)學成績?yōu)?25分),物理成績是多少?(精確到1)解
(1)r0<r.(2)由題中數(shù)據(jù)可得:將x=125代入,得y=0.36×125+35.89=80.89≈81,所以估計B考生的物理成績約為81分.規(guī)律方法求經(jīng)驗回歸方程的方法
(2)若所求的經(jīng)驗回歸方程是在解答題中,則求經(jīng)驗回歸方程的一般步驟如下:對點練2(2023·廣西桂林、崇左一模)為促進新能源汽車的推廣,某市逐漸加大充電基礎設施的建設,該市統(tǒng)計了近五年新能源汽車充電站的數(shù)量(單位:個),得到如下表格:年份20182019202020212022年份編號x12345新能源汽車充電站數(shù)量y/個37104147186226(1)已知可用線性回歸模型擬合y與x的關系,請用相關系數(shù)加以說明;(2)求y關于x的線性回歸方程,并預測2026年該市新能源汽車充電站的數(shù)量.因為0.99>0.75,所以可用線性回歸模型擬合y與x的關系.突破點三獨立性檢驗[例3]為了解空氣質量指數(shù)(AQI值)與參加戶外健身運動的人數(shù)之間的關系,某校環(huán)保小組在暑假期間(60天)進行了一項統(tǒng)計活動:每天記錄到體育公園參加戶外健身運動的人數(shù),并與當天AQI值(從氣象部門獲取)構成60組成對數(shù)據(jù)(xi,yi)(i=1,2,…,60),其中xi為當天參加戶外健身運動的人數(shù),yi為當天的AQI值,并制作了如下散點圖:連續(xù)60天參加健身運動人數(shù)與AQI值散點圖
(1)環(huán)保小組準備做y與x的線性回歸分析,算得y與x的樣本相關系數(shù)為r≈-0.58,試分析y與x的線性相關關系.(2)環(huán)保小組還發(fā)現(xiàn)散點有分區(qū)聚集的特點,嘗試做聚類分析.用直線x=100與y=100將散點圖分成Ⅰ、Ⅱ、Ⅲ、Ⅳ四個區(qū)域(如圖),統(tǒng)計得到各區(qū)域的點數(shù)分別為5,10,10,35,試依據(jù)小概率值α=0.005的獨立性檢驗,分析“參加戶外健身運動的人數(shù)不少于100是否與AQI值不大于100之間有關聯(lián)”.α0.0500.0100.0050.001xα3.8416.6357.87910.828AQI值人數(shù)合計人數(shù)<100人數(shù)≥100AQI>10010515AQI≤100103545總計204060解
(1)r≈-0.58,y與x的相關關系為負相關,且|r|<0.75,故線性相關性不強,所以不建議繼續(xù)做線性回歸分析,即使得到經(jīng)驗回歸方程,擬合效果也會不理想.(2)建立2×2列聯(lián)表如下零假設為H0:參加戶外健身運動的人數(shù)不少于100與AQI值不大于100之間無關聯(lián).依據(jù)小概率值α=0.005的獨立性檢驗,推斷H0不成立,即認為參加戶外健身運動的人數(shù)不少于100與AQI值不大于100之間有關聯(lián).規(guī)律方法獨立性檢驗的一般步驟(1)提出零假設H0:X和Y相互獨立.(2)根據(jù)抽樣數(shù)據(jù)列出2×2列聯(lián)表.(3)計算隨機變量χ2的值,查表確定臨界值xα.(4)當χ2≥xα時,就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;否則,就沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.對點練3肥胖人群有很大的健康隱患.目前,國際上常用身體質量指數(shù)(英文為BodyMassIndex,簡稱BMI)來衡量人體胖瘦程度以及是否健康,其計算公式是,中國成人的BMI數(shù)值標準為:BMI<18.5為偏瘦,18.5≤BMI<23.9為正常,24≤BMI<27.9為偏胖,BMI≥28為肥胖.某地區(qū)隨機調查了6000名35歲以上成人的身體健康狀況,其中有1000名高血壓患者,得到被調查者的頻率分布直方圖如圖.高血壓
非高血壓
是否高血壓胖瘦程度合計肥胖不肥胖高血壓
非高血壓
合計
(1)求被調查者中肥胖人群的BMI平均值μ;(2)根據(jù)頻率分布直方圖,完成下面的2×2列聯(lián)表,依據(jù)小概率值α=0.001的獨立性檢驗,分析35歲以上成人患高血壓是否與肥胖有關.α0.100.0500.0100.0050.001xα2.7063.8416.6357.87910.828解
(1)由題圖可知,1
000名高血壓患者的肥胖情況如下表所示.
BMI[28,30)[30,32)[32,34)人數(shù)0.100×2×1
000=2000.050×2×1
000=1000.025×2×1
000=505
000名非高血壓患者的肥胖情況如下表所示.
BMI[28,30)[30,32)[32,34)人數(shù)0.080×2×5
000=8000.030×2×5
000=3000.005×2×5
000=50被調查者中肥胖人群的BMI平均值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 以技術引領創(chuàng)新推動制造業(yè)數(shù)字化和智能化升級的實踐研究
- 醫(yī)療科技的創(chuàng)新與發(fā)展個性化健康APP的設計與實施
- 醫(yī)療大數(shù)據(jù)庫建設中的隱私問題和知識產(chǎn)權管理策略研究報告
- 區(qū)塊鏈技術推動零售業(yè)融資模式創(chuàng)新
- 2025年《義務教育數(shù)學課程標準(2025年版)》學習心得體會模版
- 住房空間設計合同范例
- 區(qū)塊鏈技術在商業(yè)領域的原理與實戰(zhàn)策略
- 醫(yī)療設備質量監(jiān)管的法規(guī)與政策分析
- 醫(yī)療AI在慢性病管理中的輔助決策作用
- 辦公自動化中如何利用區(qū)塊鏈技術實現(xiàn)高效的數(shù)據(jù)管理與協(xié)作
- 投標貨物的包裝、運輸方案
- 2022年山東省青島一中自主招生化學模擬試卷一(附答案詳解)
- 表C.1.1 工程概況表(例)
- E3X-ZD11型光纖放大器
- 點穴保健DIY智慧樹知到課后章節(jié)答案2023年下江西中醫(yī)藥大學
- 項目進度計劃排期表EXCEL模板
- 供應商質量事故索賠單
- PLC智能排號系統(tǒng)
- 基于負荷模型分析的電力系統(tǒng)電壓穩(wěn)定性研究的開題報告
- 給水處理廠凈水構筑物設計計算示例
- (全冊完整16份)北師大版五年級下冊100道口算題大全
評論
0/150
提交評論