




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3講成對數(shù)據(jù)的統(tǒng)計分析課標要求命題點五年考情命題分析預測1.了解樣本相關系數(shù)的統(tǒng)計含義,了解樣本相關關系與標準化數(shù)據(jù)向量夾角的關系;會通過相關系數(shù)比較多組成對數(shù)據(jù)的相關性.2.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法;針對實際問題,會用一元線性回歸模型進行預測.3.理解2×2列聯(lián)表的統(tǒng)計意義;了解2×2列聯(lián)表獨立性檢驗及其應用.成對數(shù)據(jù)的相關性2023天津T7,2022全國卷乙T19;2020全國卷ⅡT18本講是高考命題熱點.對于回歸分析,主要考查散點圖,回歸方程類型的識別,求相關系數(shù)和回歸方程,利用回歸方程進行預測等;對于獨立性檢驗,主要考查列聯(lián)表和依據(jù)小概率值的獨立性檢驗,常與概率綜合命題.題型以解答題為主,難度中等.預計2025年高考會以創(chuàng)新生產生活實踐情境為載體考查回歸分析和獨立性檢驗.回歸模型及其應用2020全國卷ⅠT5列聯(lián)表與獨立性檢驗2023全國卷甲T19;2022新高考卷ⅠT20;2022全國卷甲T17;2021全國卷甲T17;2020新高考卷ⅠT19;2020全國卷ⅢT181.變量的相關關系(1)正相關和負相關:從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)①增加的趨勢,我們就稱這兩個變量②正相關;當一個變量的值增加時,另一個變量的相應值呈現(xiàn)③減小的趨勢,則稱這兩個變量④負相關.(2)線性相關:一般地,如果兩個變量的取值呈現(xiàn)⑤正相關或⑥負相關,而且散點落在⑦一條直線附近,我們就稱這兩個變量線性相關.(3)非線性相關或曲線相關:一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.2.樣本相關系數(shù)(1)樣本相關系數(shù)r=∑i(2)樣本相關系數(shù)r的性質①當r>0時,稱成對樣本數(shù)據(jù)⑧正相關;當r<0時,稱成對樣本數(shù)據(jù)⑨負相關;當r=0時,只表明成對樣本數(shù)據(jù)間沒有線性相關關系,但不排除它們之間有其他相關關系.②|r|≤1.當|r|越接近于1,成對樣本數(shù)據(jù)的線性相關性越⑩強;|r|越接近于0,成對樣本數(shù)據(jù)線性相關性越?弱.3.一元線性回歸模型(1)一元線性回歸模型我們稱Y=bx+a+e,E(e)=0,D(e)=σ2為Y關于x的一元線性回歸模型.其中,Y稱為因變量或(2)經驗回歸方程與最小二乘估計經驗回歸方程:y=b^x+a最小二乘估計:b^=∑ni=1(xi-x)(yi說明經驗回歸方程,也稱經驗回歸函數(shù)或經驗回歸公式,其圖形稱為經驗回歸直線.經驗回歸直線過點(x,y).(3)殘差對于響應變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經驗回歸方程得到的y稱為預測值,觀測值減去?預測值稱為殘差.(4)決定系數(shù)決定系數(shù)R2用來比較兩個模型的擬合效果,R2=1-∑i=1n(yi-yi)2∑i=1n(yi-y4.列聯(lián)表與獨立性檢驗(1)2×2列聯(lián)表一般地,假設有兩個分類變量X和Y,它們的取值為{0,1},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d(2)獨立性檢驗χ2=n(ad-bc)2(a+b)(c+(3)臨界值對于任何小概率值α,可以找到相應的正實數(shù)xα,使得P(χ2≥xα)=α成立,我們稱xα為α的臨界值,這個臨界值可作為判斷χ2大小的標準.概率值α越小,臨界值xα?下表給出了2獨立性檢驗中5個常用的小概率值和相應的臨界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(4)基于小概率值α的檢驗規(guī)則當χ2≥xα時,我們就推斷H0?不成立,即認為X和Y?不獨立,該推斷犯錯誤的概率不超過α當χ2<xα時,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y?獨立說明若2越大,則兩個分類變量有關的把握越大.1.下列四個散點圖中,變量x與y之間具有負的線性相關關系的是(D)2.下列說法正確的是(D)A.在經驗回歸方程y=-0.85x+2.3中,當解釋變量x每增加1個單位時,響應變量平均減少2.3個單位B.若兩個變量的相關性越強,則r越接近于1C.在回歸分析中,決定系數(shù)R2=0.80的模型比決定系數(shù)R2=0.98的模型擬合的效果要好D.殘差平方和越小的模型,擬合的效果越好解析對于A,根據(jù)經驗回歸方程,當解釋變量x每增加1個單位時,響應變量y平均減少0.85個單位,故A錯誤;對于B,若兩個變量的相關性越強,則|r|越接近于1,故B錯誤;對于C,用決定系數(shù)R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越好,所以C錯誤;對于D,由殘差的統(tǒng)計學意義知,D正確.3.為考查某種營養(yǎng)品對兒童身高增長的影響,選取部分兒童進行試驗,根據(jù)100個有放回簡單隨機樣本的數(shù)據(jù),得到如下列聯(lián)表,由表可知下列說法正確的是(D)營養(yǎng)品身高合計有明顯增長無明顯增長食用a1050未食用b3050合計6040100A.a=b=30B.χ2≈C.從樣本中隨機抽取1名兒童,抽到食用該營養(yǎng)品且身高有明顯增長的兒童的概率是3D.根據(jù)小概率值α=0.001的獨立性檢驗,可以認為該營養(yǎng)品對兒童身高增長有影響解析由題可知a=50-10=40,b=50-30=20,所以A錯誤;χ2=100×(40×30-10×20)250×50×60×40≈16.667>10.828=x4.[2023福州5月質檢]已知變量x和y的統(tǒng)計數(shù)據(jù)如下表:x678910y3.54566.5若由表中數(shù)據(jù)得到經驗回歸方程為y=0.8x+a,則x=10時的殘差為-0.1.(注:觀測值減去預測值稱為殘差)解析易知x=8,y=5,∴a=5-0.8×8=-1.4,∴x=10時,y=8-1.4=6.6,∴x=10時的殘差為6.5-6.6=-0.1.研透高考明確方向命題點1成對數(shù)據(jù)的相關性角度1判斷兩個變量的相關性例1(1)已知變量x和y近似滿足關系式y(tǒng)=-0.1x+1,變量y與z正相關.下列結論中正確的是(C)A.x與y正相關,x與z負相關B.x與y正相關,x與z正相關C.x與y負相關,x與z負相關D.x與y負相關,x與z正相關解析由y=-0.1x+1,知x與y負相關,即y隨x的增大而減小,又y與z正相關,所以z隨y的增大而增大,隨y的減小而減小,所以z隨x的增大而減小,x與z負相關.(2)[2023湖北仙桃中學模擬]對四組數(shù)據(jù)進行統(tǒng)計后,獲得了如圖所示的散點圖,四組數(shù)據(jù)的相關系數(shù)分別為r1,r2,r3,r4,對各組的相關系數(shù)進行比較,正確的是(C) 第一組 第二組 第三組 第四組A.r3<r2<0<r1<r4 B.r4<r1<0<r2<r3C.r2<r3<0<r4<r1 D.r1<r4<0<r3<r2解析由題圖可知,第一、四組數(shù)據(jù)均正相關,第二、三組數(shù)據(jù)均負相關,當相關系數(shù)的絕對值越大時,數(shù)據(jù)的線性相關性越強.第一組數(shù)據(jù)的線性相關性較第四組強,則r1>r4>0,第二組數(shù)據(jù)的線性相關性較第三組強,則|r2|>|r3|,且r2<0,r3<0,則r2<r3<0.因此,r2<r3<0<r4<r1.故選C.方法技巧判斷兩個變量相關性的3種方法畫散點圖若點的分布從左下角到右上角,則兩個變量正相關;若點的分布從左上角到右下角,則兩個變量負相關.利用樣本相關系數(shù)r>0時,正相關;r<0時,負相關;|r|越接近于1,線性相關性越強.利用經驗回歸方程b^>0時,正相關;b^<0角度2相關系數(shù)的計算例2[2022全國卷乙]某地經過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數(shù)據(jù):樣本號i12345678910總和根部橫截面積xi0.040.060.040.080.080.050.050.070.070.060.6材積量yi0.250.400.220.540.510.340.360.460.420.403.9并計算得∑10i=1xi2=0.038,∑10i=1y(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量.(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關系數(shù)(精確到0.01).(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186m2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.附:相關系數(shù)r=∑ni=1(解析(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積x=∑i=110xi10=0.610=(2)∑i=110(xi-x)(yi-y)=∑i=110xiyi∑i=110(xi-x∑i=110(yi-y所以∑i=110(xi-x)2∑i=110(yi-(3)設該林區(qū)這種樹木的總材積量的估計值為Ym3,由題意可知,該種樹木的材積量與其根部橫截面積近似成正比,所以0.390.06=Y186,所以即該林區(qū)這種樹木的總材積量的估計值為1209m3.訓練1變量X與Y相對應的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的線性相關系數(shù),r2表示變量V與U之間的線性相關系數(shù),則(C)A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r2=r1解析由題中的數(shù)據(jù)可知,變量Y與X正相關,相關系數(shù)r1>0,變量V與U負相關,相關系數(shù)r2<0,即r2<0<r1.故選C.命題點2回歸模型及其應用角度1一元線性回歸模型例3[2023廣西聯(lián)考]某省為調查北部城鎮(zhèn)2022年GDP,抽取了20個城鎮(zhèn)進行分析,得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個城鎮(zhèn)的人口(單位:萬人)和該城鎮(zhèn)2022年GDP(單位:億元),計算得∑i=120xi=100,∑i=120yi=800,∑i=120(xi-x)2=70,∑i=120(yi-y)2=280,∑(1)請用相關系數(shù)r判斷該組數(shù)據(jù)中y與x之間線性相關關系的強弱(若|r|∈[0.75,1],相關性較強;若|r|∈[0.30,0.75),相關性一般;若r∈[-0.25,0.25],相關性較弱).(2)求y關于x的線性回歸方程.(3)若該省北部某城鎮(zhèn)2024年的人口約為5萬人,根據(jù)(2)中的線性回歸方程估計該城鎮(zhèn)2024年的GDP.參考公式:相關系數(shù)r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)解析(1)由題意知,相關系數(shù)r=∑i=120(xi-因為y與x的相關系數(shù)r滿足|r|∈[0.75,1],所以y與x之間具有較強的線性相關關系.(2)b^=∑i=120(a=y(tǒng)-b^x=80020-127×10020=2207,所以y(3)由(2)可估計該城鎮(zhèn)2024年的GDPy=127×5+2207=40方法技巧回歸模型問題的類型及解題方法(1)求經驗回歸方程:①利用數(shù)據(jù),求出x,y;②利用公式,求出回歸系數(shù)b^③利用經驗回歸直線過樣本點的中心(x,y),求a.(2)利用經驗回歸方程進行預測:直接將已知的自變量的某個數(shù)值代入經驗回歸方程求得特定要求下的預測值.(3)判斷回歸模型的擬合效果:利用殘差平方和或決定系數(shù)R2判斷,R2越大,表示殘差平方和越小,即模型的擬合效果越好.角度2非線性回歸模型例4[2023重慶市三檢]已知變量y關于x的經驗回歸方程為y=ebx-0.6,若對y=x12345yee3e4e6e7則當x=6時,預測y的值為(C)A.9 B.8 C.e9 D.e8解析對y=ebx-0.6兩邊取自然對數(shù),得lny=bx-0.6,令z=lny,則z=bx-0.6,數(shù)據(jù)為x12345yee3e4e6e7z13467由表格數(shù)據(jù),得x=1+2+3+4+55=3,z=1+3+4+6+75=4.2.將(3,4.2)代入z=bx-0.6,得4.2=3b-0.6,(方法技巧:經驗回歸方程只含一個未知數(shù)問題主要是依據(jù)經驗回歸直線y解得b=1.6,所以z=1.6x-0.6,即y=e1.6x-0.6.方法技巧1.解決非線性回歸模型問題的思路:根據(jù)數(shù)據(jù)的散點圖,選擇恰當?shù)臄M合函數(shù),用適當?shù)淖兞窟M行轉換,如通過換元或取對數(shù)等方法,把問題化為線性回歸模型問題,使之得到解決.2.常見的非線性回歸模型及轉換技巧(1)y=a+bx,令v=1x(2)y=a+blnxb≠0,令v=ln(3)y=axb(a>0,b≠0),令c=lna,v=lnx,u=lny,則u=c+bv;(4)y=aebx(a>0,b≠0),令c=lna,u=lny,則u=c+bx.訓練2[2023合肥市質檢]研究表明,溫度的突然變化會引起機體產生呼吸道上皮組織的生理不良反應,從而導致呼吸系統(tǒng)疾病的發(fā)生或惡化.某中學數(shù)學建模社團成員欲研究晝夜溫差大小與該校高三學生患感冒人數(shù)多少之間的關系,他們記錄了某周連續(xù)六天的晝夜溫差,并到校醫(yī)務室查閱了這六天中每天高三學生新增患感冒而就診的人數(shù)(假設患感冒必到校醫(yī)務室就診),得到資料如下:日期第一天第二天第三天第四天第五天第六天晝夜溫差x/℃47891412新增就診人數(shù)y/位y1y2y3y4y5y6參考數(shù)據(jù):∑i=16yi2=3160,∑i=16(1)已知第一天新增患感冒而就診的學生中有7位女生,從第一天新增患感冒而就診的學生中隨機抽取3位,若抽取的3人中至少有一位男生的概率為1724,求y1(2)已知兩個變量x與y之間的樣本相關系數(shù)r=1516,試用最小二乘法求出y關于x的經驗回歸方程y=b^x+a,據(jù)此估計晝夜溫差為15℃參考公式:b^=∑r=∑i解析(1)∵1-C73C∴7×6×∴y1(y1-1)(y1-2)=720=10×9×8,∴y1=10.(2)∵∑i=16xi=54,∴x=9,∴∑i=16(xi∵r=∑i=16(xi-x)(yi-y)∑i=16(xi-∴b^=∑i=16(又∑i=16(yi-y)2=∑i=16yi2-2y·∑i=16yi+6y2=∑i=16yi2-6y2=256∴y^=418+158x,當x=15時,y^=418+15故可以估計晝夜溫差為15℃時,該校高三新增患感冒而就診的學生數(shù)為33.命題點3列聯(lián)表與獨立性檢驗例5[2022全國卷甲改編]甲、乙兩城之間的長途客車均由A和B兩家公司運營.為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯(lián)表:準點班次數(shù)未準點班次數(shù)A24020B21030(1)根據(jù)上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)依據(jù)小概率值α=0.1的獨立性檢驗,分析甲、乙兩城之間的長途客車是否準點與客車所屬公司有關.附:χ2=n(ad-bc)2(a+bα0.10.0500.0100.001xα2.7063.8416.63510.828解析(1)由題表可得A公司甲、乙兩城之間的長途客車準點的概率為240240+20=12B公司甲、乙兩城之間的長途客車準點的概率為210210+30=7(2)零假設為H0:甲、乙兩城之間的長途
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學校教學成果表格
- 農學作物種植技術測試題及答案解析
- 高效辦公數(shù)字化解決方案實踐指南
- 財務人員擔保協(xié)議書
- 水資源智能監(jiān)控與管理合同
- 金融科技反欺詐技術合作協(xié)議
- 基于人工智能的智能種植管理系統(tǒng)優(yōu)化實踐
- 月子中心月嫂服務合同
- 建筑裝修行業(yè)施工安全責任書
- 西方童話格林童話讀后感和兒童成長影響
- 地理-浙江省強基聯(lián)盟2025年2月高三年級聯(lián)考試題和答案
- (必刷)湖南省醫(yī)學院校高職單招職業(yè)技能測試必會題庫(含往年真題)
- 2025《醫(yī)藥企業(yè)防范商業(yè)賄賂風險合規(guī)指引》解讀課件
- 血透病人皮膚瘙癢課件
- 2025年度船舶焊接維修工程合同范本資料下載
- 貴州茅臺課程設計
- 工業(yè)攝像頭知識培訓課件
- 2024-2025學年六年級數(shù)學人教版上冊寒假作業(yè)(綜合基礎復習篇含答案)
- DB33T 1134-2017 靜鉆根植樁基礎技術規(guī)程
- 樓梯塑料滴水線施工方案
- 《用電檢查與稽查》課件
評論
0/150
提交評論