版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.2一元線性回歸模型及其應用必備學問·自主學習導思1.什么是一元線性回歸模型?如何求閱歷回歸方程?2.如何進行回歸分析?一元線性回歸模型的完整表達式為eq\b\lc\{(\a\vs4\al\co1(Y=bx+a+e,E〔e〕=0,D〔e〕=σ2)),其中Y稱為因變量或響應變量,x稱為自變量或解釋變量,a,b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù),e是Y與bx+a之間的隨機誤差.具有相關(guān)關(guān)系的兩個變量,其樣本點散布在某一條直線y=bx+a的四周,可以用一次函數(shù)y=bx+a來描述兩個變量之間的關(guān)系嗎?提示:不能.2.閱歷回歸方程(1)最小二乘法我們將=x+稱為Y關(guān)于x的閱歷回歸方程,也稱閱歷回歸函數(shù)或閱歷回歸公式,其圖形稱為閱歷回歸直線.這種求閱歷回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估量.(2)閱歷回歸方程的系數(shù)計算公式(3)閱歷回歸方程的性質(zhì)①閱歷回歸方程肯定過點;②一次函數(shù)=x+的單調(diào)性由的符號打算,函數(shù)遞增的充要條件是__>0__;③的實際意義:當x增大一個單位時,增大個單位.正相關(guān)、負相關(guān)與的符號有何關(guān)系?提示:Y與x正相關(guān)的充要條件是>0,Y與x負相關(guān)的充要條件是<0.3.殘差(1)殘差:對于響應變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過閱歷回歸方程得到的稱為猜測值,觀測值減去猜測值稱為殘差.(2)打算系數(shù):R2=1-越接近1,表示回歸的效果越好.1.辨析記憶(對的打“√〞,錯的打“×〞).(1)閱歷回歸方程肯定過樣本中的某一個點.(×)提示:閱歷回歸方程肯定過點(eq\x\to(x),eq\x\to(y)),可能過樣本中的某個或某些點,也可能不過樣本中的任何一個點.(2)選取一組數(shù)據(jù)中的局部點得到的閱歷回歸方程與由整組數(shù)據(jù)得到的閱歷回歸方程是同一個方程.(×)提示:選取一組數(shù)據(jù)中的局部點得到的閱歷回歸方程與由整組數(shù)據(jù)得到的閱歷回歸方程不肯定是同一個方程.(3)在閱歷回歸模型中,R2越接近于1,表示解釋變量和響應變量的線性相關(guān)性越強.(√)(4)在畫兩個變量的散點圖時,響應變量在x軸上,解釋變量在y軸上.(×)提示:在畫兩個變量的散點圖時,解釋變量在x軸上,響應變量在y軸上.2.假如記錄了x,y的幾組數(shù)據(jù)分別為(0,1),(1,3),(2,5),(3,7),那么y關(guān)于x的閱歷回歸直線必過點()A.(2,2)B.(1.5,2)C.(1,2)D.(1.5,4)【解析】eq\x\to(x)=eq\f(0+1+2+3,4)=1.5,eq\x\to(y)=eq\f(1+3+5+7,4)=4,所以閱歷回歸直線必過點(1.5,4).3.假設(shè)一個樣本的總偏差平方和為80,殘差平方和為60,那么R2為________.【解析】R2=1-eq\f(60,80)=0.25.答案:關(guān)鍵力量·合作學習類型一閱歷回歸方程及其應用(數(shù)學建模、數(shù)學運算)1.四名同學依據(jù)各自的樣本數(shù)據(jù)討論變量x,y之間的相關(guān)關(guān)系,并求得閱歷回歸方程,分別得到以下四個結(jié)論:①y與x負相關(guān)且x-6.423;②y與x負相關(guān)且x+5.648;③y與x正相關(guān)且x+8.493;④y與x正相關(guān)且x-4.578.其中肯定不正確的結(jié)論的序號是()A.①②B.②③C.③④D.①④【解析】>0,負相關(guān)時<0,故①④肯定不正確.2.某產(chǎn)品的廣告費用x(單位:萬元)與銷售額y(單位:萬元)的統(tǒng)計數(shù)據(jù)如下表:廣告費用x4235銷售額y49263954依據(jù)上表可得閱歷回歸方程=x+中的為9.4,據(jù)此模型猜測廣告費用為6萬元時銷售額為()A.63.6萬 【解析】選B.eq\x\to(x)=eq\f(4+2+3+5,4)=3.5,eq\x\to(y)=eq\f(49+26+39+54,4)=42.由于回歸直線過點(eq\x\to(x),eq\x\to(y)),所以42=9.4×3.5+,解得=9.1,故回歸方程為xx=6時=6×9.4+9.1=65.5.3.某商店統(tǒng)計了最近6個月商品的進價x與售價y(單位:元)的對應數(shù)據(jù)如下:x3528912y46391214那么閱歷回歸方程為________.【解析】eq\x\to(x)=eq\f(3+5+2+8+9+12,6)=6.5,eq\x\to(y)=eq\f(4+6+3+9+12+14,6)=8,eq\i\su(i=1,6,x)eq\o\al(\s\up1(2),\s\do1(i))=32+52+22+82+92+122=327,eq\i\su(i=1,6,x)iyi=3×4+5×6+2×3+8×9+9×12+12×14=396,=eq\f(\i\su(i=1,6,x)iyi-6\x\to(x)\x\to(y),\i\su(i=1,6,x)eq\o\al(\s\up1(2),\s\do1(i))-6\x\to(x)2)≈1.143,=eq\x\to(y)-eq\x\to(x)≈0.571.故閱歷回歸方程為x+0.571.答案:x1.求閱歷回歸方程的方法(1)公式法:求出b,a的最小二乘估量,.(2)待定系數(shù)法:利用閱歷回歸直線過(eq\x\to(x),eq\x\to(y))求,.2.閱歷回歸方程的應用(1)進行猜測:把閱歷回歸方程看作一次函數(shù),求函數(shù)值.(2)推斷正、負相關(guān):打算正相關(guān)還是負相關(guān)的是參數(shù).【加練·固】依據(jù)?中國統(tǒng)計年鑒?計算整理某城市最近十年蔬菜需求量的統(tǒng)計數(shù)據(jù),截取局部統(tǒng)計數(shù)據(jù)如下表:年份20092011201320152017需求量(萬噸)336346357376386(1)畫出散點圖;(2)依據(jù)(1)畫出的散點圖推斷需求量與年份是否線性相關(guān),假設(shè)相關(guān),求出閱歷回歸方程,假設(shè)不相關(guān),說明理由;(3)利用(2)中所求的閱歷回歸方程猜測該市2020年的蔬菜需求量.附:參考公式=eq\f(\i\su(i=1,n,)〔ti-\x\to(t)〕〔mi-\x\to(m)〕,\i\su(i=1,n,)〔ti-\x\to(t)〕2)=eq\x\to(m)-eq\x\to(t)【解析】(1)畫出散點圖如圖.(2)由散點圖可知,需求量與年份線性相關(guān).將所給表格中的數(shù)據(jù)進行處理如下表:t(年份-2013)-4-2024m(需求量-357)-21-1101929由表可知eq\x\to(t)=eq\f(1,5)(-4-2+0+2+4)=0,eq\x\to(m)=eq\f(1,5)(-21-11+0+19+29)=3.2.所以=[(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2]÷(42+22+22+42-5×02)=6.5,所以=3.2-0×6.5=3.2,所以t+3.2,所以線性回歸方程是-357=6.5(x-2013)+3.2,即x-12724.3.(3)當x=2020時,=6.5×2020-12724.3=405.7,即猜測該市2020年蔬菜需求量是405.7萬噸.類型二線性回歸分析(數(shù)據(jù)分析、數(shù)學運算)【典例】某運發(fā)動訓練次數(shù)與訓練成果之間的數(shù)據(jù)關(guān)系如表:次數(shù)(x)3033353739444650成果(Y)3034373942464851(1)作出散點圖;(2)求出閱歷回歸方程;(3)作出殘差圖;(4)計算R2,并說明運發(fā)動的訓練次數(shù)對成果的影響占百分之幾.【解析】(1)作出該運發(fā)動訓練次數(shù)x與成果Y的散點圖,如下圖.由散點圖可知,它們之間具有相關(guān)關(guān)系.(2)eq\x\to(x)=39.25,eq\x\to(y)=40.875,eq\i\su(i=1,8,x)eq\o\al(\s\up1(2),\s\do1(i))=12656,eq\i\su(i=1,8,x)iyi=13180,所以≈1.0415,=eq\x\to(y)-eq\x\to(x)=-0.003875,所以閱歷回歸方程為=1.0415x-0.003875.(3)殘差分析:下面的表格列出了運發(fā)動訓練次數(shù)和成果的原始數(shù)據(jù)以及相應的殘差數(shù)據(jù).xY3030-1.24113334-0.365635370.551437390.468439421.385444460.177946480.09495051-1.0711作殘差圖如下圖.由圖可知,殘差點比擬勻稱地分布在水平帶狀區(qū)域內(nèi),說明選擇的模型比擬適宜.(4)計算R2≈0.9855,說明白該運發(fā)動的訓練次數(shù)對成果的影響占98.55%.“R2、殘差圖〞在回歸分析中的作用(1)R2是用來刻畫回歸效果的,由R2=1-可知R2越大,意味著殘差平方和越小,也就是說模型的擬合效果就越好.(2)殘差圖也是用來刻畫回歸效果的,推斷依據(jù)是:殘差點比擬勻稱地分布在水平帶狀區(qū)域中,帶狀區(qū)域越窄,說明模型擬合精度越高,回歸方程預報精度越高.為討論質(zhì)量x(單位:g)對彈簧長度Y(單位:cm)的影響,對不同質(zhì)量的6個物體進行測量,數(shù)據(jù)如表所示:x51015202530Y(1)作出散點圖并求閱歷回歸方程;(2)求出R2并說明回歸模型擬合的程度;(3)進行殘差分析.【解析】(1)散點圖如圖.eq\x\to(x)=eq\f(1,6)×(5+10+15+20+25+30)=17.5,eq\x\to(y)=eq\f(1,6)×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,計算得≈0.183,≈6.285.故所求閱歷回歸方程為x.(2)列出殘差表為yi-iyi-eq\x\to(y)yi-iyi-eq\x\to(y)所以i)2≈0.01318,eq\x\to(y))2=14.6783.所以,R2=1-eq\f(0.01318,14.6783)≈0.9991,回歸模型的擬合效果較好.(3)由殘差表中的數(shù)值可以看出第3個樣本點的殘差比擬大,需要確認在采集這個樣本點的時候是否有人為的錯誤,假如有的話,需要訂正,重新建立回歸模型;由表中數(shù)據(jù)可以看出殘差點比擬勻稱地落在狹窄的水平帶狀區(qū)域中,說明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長度與所掛物體的質(zhì)量成線性關(guān)系.類型三求非線性閱歷回歸方程(數(shù)據(jù)分析、數(shù)學運算)【典例】在一化學反響過程中,某化學物質(zhì)的反響速度y(g/min)與一種催化劑的量x(g)有關(guān),現(xiàn)收集了如表所示的8組數(shù)據(jù),求y與x的閱歷回歸方程.催化劑量x(g)1518212427303336化學物質(zhì)反響速度y(g/min)6830277020565350【解析】依據(jù)收集的數(shù)據(jù)作散點圖,如下圖.依據(jù)樣本點的分布狀況,可選用指數(shù)型函數(shù)模型y=c1ec2x(c1,c2為待定的參數(shù)),令z=lny,那么z=c2x+lnc1,即變換后樣本點應當分布在直線z=bx+a(a=lnc1,b=c2)的四周,由y與x的數(shù)據(jù)表得z與x的數(shù)據(jù)表如下:x1518212427303336z作出z與x的散點圖,如下圖,由圖可以看出變換后的樣本點分布在一條直線四周,所以可用線性回歸方程來擬合.由表中數(shù)據(jù)可得≈0.1812,≈-0.8492,故=0.1812x-0.8492,所以=e0.1812x-0.8492,因此該化學物質(zhì)的反響速度與催化劑的量的非線性回歸方程為=e0.1812x-0.8492.求非線性閱歷回歸方程常見轉(zhuǎn)化類型:(1)反比例函數(shù)y=a+eq\f(b,x)可作變換t=eq\f(1,x),得y=a+bt.(2)冪函數(shù)型y=axb(a>0)可作變換Y=lny,m=lna,t=lnx,那么有Y=m+bt.(3)指數(shù)型函數(shù)y=kabx(a>0且a≠1,k>0)可作變換Y=lny,m=lnk,那么有:Y=m+(blna)x生物學家認為,睡眠中的恒溫動物依舊會消耗體內(nèi)能量,主要是為了保持體溫.脈搏率f是單位時間心跳的次數(shù),醫(yī)學討論發(fā)覺,動物的體重W(單位:g)與脈搏率f存在著肯定的關(guān)系.如表給出一些動物體重與脈搏率對應的數(shù)據(jù),圖1畫出了體重W與脈搏率f的散點圖,圖2畫出了lgW與lgf的散點圖.動物名體重脈搏率鼠25670大鼠200420豚鼠300300兔2000200小狗5000120大狗3000085羊5000070為了較好地描述體重和脈搏率的關(guān)系,現(xiàn)有以下兩種模型供選擇:①f=kW+b②lgf=klgW+b(1)選出你認為最符合實際的函數(shù)模型,并說明理由;(2)不妨取表中豚鼠和兔的體重脈搏率數(shù)據(jù)代入所選函數(shù)模型,求出f關(guān)于W的函數(shù)解析式;(3)假設(shè)馬的體重是兔的256倍,依據(jù)(2)的結(jié)論,估計馬的脈搏率.(參考數(shù)據(jù):lg2≈0.3,lg3≈0.5.)【解析】(1)模型②lgf=klgW+b最符合實際.依據(jù)散點圖的特征,圖2根本上呈直線形式,所以可選擇一次函數(shù)來刻畫lgW和lgf的關(guān)系.(2)lg200=2+lg2≈2.3,lg2000=3+lg2≈3.3,lg300=2+lg3≈2.5,由題意知eq\b\lc\{(\a\vs4\al\co1(lg300=klg300+b,lg200=klg2000+b)),解得eq\b\lc\{(\a\vs4\al\co1(k=-\f(1,4),b=\f(25,8))),所以lgf=-eq\f(1,4)lgW+eq\f(25,8),所以f關(guān)于W的函數(shù)解析式為f=·.(3)設(shè)馬的體重和脈搏率分別為W1,f1,兔的體重和脈搏率分別為W2,f2,由題意知,eq\f(W1,W2)=256,所以eq\f(f1,f2)=====eq\f(1,4).由于f2=200,所以f1=50,即馬的脈搏率為50.課堂檢測·素養(yǎng)達標1.關(guān)于回歸分析,以下說法錯誤的選項是()A.回歸分析是討論兩個具有相關(guān)關(guān)系的變量的方法B.散點圖中,解釋變量在x軸,響應變量在y軸C.回歸模型中肯定存在隨機誤差D.散點圖能明確反映變量間的關(guān)系【解析】選D.用散點
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中歷史之歷史百科50年代周恩來傳話蔣介石別殺誰否則將來不好見面素材
- 2024-2025學年新教材高中化學專題8有機化合物的獲得與應用第2單元第5課時蛋白質(zhì)和氨基酸教案蘇教版必修2
- 戰(zhàn)斗地形分析報告范文
- 2025路基施工合同公司版
- 2025年廣州貨運從業(yè)資格證摸擬考試試題答案解析
- 2025保管合同書范文
- 2025年佛山道路客貨運輸從業(yè)資格證b2考試題庫
- 2025年昌吉道路運輸從業(yè)資格考試系統(tǒng)
- 2025年綿陽b2貨運資格證模擬考試
- 2025年內(nèi)蒙古貨運資格證題庫在線練習
- 小學體育教案《50米快速跑(途中跑)》
- 第六單元測試卷(單元卷)-2024-2025學年六年級上冊統(tǒng)編版語文
- 公路工程設(shè)計規(guī)范
- 2024年人教版小學四年級英語(上冊)期末試卷附答案
- 第9課《創(chuàng)新增才干》第2框《積極投身創(chuàng)新實踐》【中職專用】中職思想政治《哲學與人生》(高教版2023基礎(chǔ)模塊)
- 食品經(jīng)營安全管理制度目錄
- DB4406-T 23-2023 地理標志產(chǎn)品 倫教糕
- 2024-2030年中國工業(yè)遠程終端裝置(RTU)行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 耕作學智慧樹知到期末考試答案章節(jié)答案2024年中國農(nóng)業(yè)大學
- 餐廳實習協(xié)議書
- QCT1067.5-2023汽車電線束和電器設(shè)備用連接器第5部分:設(shè)備連接器(插座)的型式和尺寸
評論
0/150
提交評論