




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第十二講回歸分析2023/4/151第1頁,共46頁,2023年,2月20日,星期二回歸分析在一組數據的基礎上研究這樣幾個問題:(i)建立因變量y與自變量x,x,,xm
之間的回歸模型(經驗公式);(ii)對回歸模型的可信度進行檢驗;(iii)判斷每個自變量x(i=1,2,…,m)對y的影響是否顯著;(iv)診斷回歸模型是否適合這組數據;(v)利用回歸模型對y進行預報或控制。2023/4/152第2頁,共46頁,2023年,2月20日,星期二一元線性回歸多元線性回歸回歸分析數學模型及定義*模型參數估計*檢驗、預測與控制可線性化的一元非線性回歸(曲線回歸)數學模型及定義*模型參數估計*多元線性回歸中的檢驗與預測逐步回歸分析2023/4/153第3頁,共46頁,2023年,2月20日,星期二一、數學模型例1
測16名成年女子的身高與腿長所得數據如下:以身高x為橫坐標,以腿長y為縱坐標將這些數據點(xI,yi)在平面直角坐標系上標出.散點圖2023/4/154第4頁,共46頁,2023年,2月20日,星期二一元線性回歸分析的主要任務是:2023/4/155第5頁,共46頁,2023年,2月20日,星期二二、模型參數估計1、回歸系數的最小二乘估計2023/4/156第6頁,共46頁,2023年,2月20日,星期二其中
2023/4/157第7頁,共46頁,2023年,2月20日,星期二一個好的擬合方程,其殘差應越小越好。殘差越小,擬合值與觀測值越接近,各觀測點在擬合直線周圍聚集的緊密程度越高,也就是說,擬合方程解釋y的能力越強。另外,當剩余標準差越小時,還說明殘差值的變異程度越小。由于殘差的樣本均值為零。所以,其離散范圍越小,擬合的模型就越為精確。2023/4/158第8頁,共46頁,2023年,2月20日,星期二三、檢驗、預測與控制1、顯著性檢驗一般地,回歸方程的假設檢驗包括兩個方面:一個是對模型的檢驗,即檢驗自變量與因變量之間的關系能否用一個線性模型來表示,這是由F檢驗來完成的;另一個檢驗是關于回歸參數的檢驗,即當模型檢驗通過后,還要具體檢驗每一個自變量對因變量的影響程度是否顯著。這是由t檢驗完成。在一元線性分析中,由于自變量的個數只有一個,這兩種檢驗是統(tǒng)一的,它們的效果完全是等價的。但是,在多元線性回歸分析中,這兩個檢驗的意義是不同的。從邏輯上說,一般常在F檢驗通過后,再進一步進行t檢驗。2023/4/159第9頁,共46頁,2023年,2月20日,星期二(Ⅰ)F檢驗法
(Ⅱ)t檢驗法2023/4/1510第10頁,共46頁,2023年,2月20日,星期二(Ⅲ)r檢驗法2023/4/1511第11頁,共46頁,2023年,2月20日,星期二2、回歸系數的置信區(qū)間2023/4/1512第12頁,共46頁,2023年,2月20日,星期二3、預測與控制(1)預測2023/4/1513第13頁,共46頁,2023年,2月20日,星期二(2)控制2023/4/1514第14頁,共46頁,2023年,2月20日,星期二四、可線性化的一元非線性回歸(曲線回歸)例2出鋼時所用的盛鋼水的鋼包,由于鋼水對耐火材料的侵蝕,容積不斷增大.我們希望知道使用次數與增大的容積之間的關系.對一鋼包作試驗,測得的數據列于下表:2023/4/1515第15頁,共46頁,2023年,2月20日,星期二散點圖此即非線性回歸或曲線回歸
問題(需要配曲線)配曲線的一般方法是:2023/4/1516第16頁,共46頁,2023年,2月20日,星期二通常選擇的六類曲線如下:2023/4/1517第17頁,共46頁,2023年,2月20日,星期二一、數學模型及定義多元線性回歸2023/4/1518第18頁,共46頁,2023年,2月20日,星期二二、模型參數估計解得估計值2023/4/1519第19頁,共46頁,2023年,2月20日,星期二2023/4/1520第20頁,共46頁,2023年,2月20日,星期二三、多元線性回歸中的檢驗與預測
(Ⅰ)線性模型檢驗——F檢驗法(Ⅱ)回歸系數檢驗——t檢驗法(殘差平方和)2023/4/1521第21頁,共46頁,2023年,2月20日,星期二2、預測(1)點預測(2)區(qū)間預測2023/4/1522第22頁,共46頁,2023年,2月20日,星期二四、逐步回歸分析(4)“有進有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個變量開始,把變量逐個引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法:
“最優(yōu)”的回歸方程就是包含所有對Y有影響的變量,而不包含對Y影響不顯著的變量回歸方程。以第四種方法,即逐步回歸分析法在篩選變量方面較為理想.2023/4/1523第23頁,共46頁,2023年,2月20日,星期二這個過程反復進行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止。逐步回歸分析法的思想:從一個自變量開始,視自變量Y作用的顯著程度,從大到地依次逐個引入回歸方程。當引入的自變量由于后面變量的引入而變得不顯著時,要將其剔除掉。引入一個自變量或從回歸方程中剔除一個自變量,為逐步回歸的一步。對于每一步都要進行Y值檢驗,以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量。2023/4/1524第24頁,共46頁,2023年,2月20日,星期二統(tǒng)計工具箱中的回歸分析命令1、多元線性回歸2、多項式回歸3、非線性回歸4、逐步回歸2023/4/1525第25頁,共46頁,2023年,2月20日,星期二多元線性回歸
b=regress(Y,X)1、確定回歸系數的點估計值:2023/4/1526第26頁,共46頁,2023年,2月20日,星期二3、畫出殘差及其置信區(qū)間:
rcoplot(r,rint)2、求回歸系數的點估計和區(qū)間估計、并檢驗回歸模型:
[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數的區(qū)間估計殘差用于檢驗回歸模型的統(tǒng)計量,有三個數值:相關系數r2、F值、與F對應的概率p置信區(qū)間顯著性水平(缺省時為0.05)2023/4/1527第27頁,共46頁,2023年,2月20日,星期二例1解:1、輸入數據:
x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2、回歸分析及檢驗:
[b,bint,r,rint,stats]=regress(Y,X)b,bint,stats2023/4/1528第28頁,共46頁,2023年,2月20日,星期二3、殘差分析,作殘差圖:
rcoplot(r,rint)從殘差圖可以看出,除第二個數據外,其余數據的殘差離零點均較近,且殘差的置信區(qū)間均包含零點,這說明回歸模型y=-16.073+0.7194x能較好的符合原始數據,而第二個數據可視為異常點.4、預測及作圖:z=b(1)+b(2)*xplot(x,Y,'k+',x,z,'r')2023/4/1529第29頁,共46頁,2023年,2月20日,星期二多項式回歸(一)一元多項式回歸
(1)確定多項式系數的命令:[p,S]=polyfit(x,y,m)(2)一元多項式回歸命令:polytool(x,y,m)1、回歸:y=a1xm+a2xm-1+…+amx+am+12、預測和預測誤差估計:(1)Y=polyval(p,x)求polyfit所得的回歸多項式在x處的預測值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回歸多項式在x處的預測值Y及預測值的顯著性為1-alpha的置信區(qū)間YDELTA;alpha缺省時為0.5.2023/4/1530第30頁,共46頁,2023年,2月20日,星期二法一直接作二次多項式回歸:
t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];
[p,S]=polyfit(t,s,2)得回歸模型為:2023/4/1531第31頁,共46頁,2023年,2月20日,星期二法二化為多元線性回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,stats得回歸模型為:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')預測及作圖2023/4/1532第32頁,共46頁,2023年,2月20日,星期二(二)多元二項式回歸命令:rstool(x,y,’model’,alpha)nm矩陣顯著性水平(缺省時為0.05)n維列向量2023/4/1533第33頁,共46頁,2023年,2月20日,星期二例3
設某商品的需求量與消費者的平均收入、商品價格的統(tǒng)計數據如下,建立回歸模型,預測平均收入為1000、價格為6時的商品需求量.法一直接用多元二項式回歸:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')2023/4/1534第34頁,共46頁,2023年,2月20日,星期二在畫面左下方的下拉式菜單中選”all”,則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。則畫面左邊的“PredictedY”下方的數據變?yōu)?8.47981,即預測出平均收入為1000、價格為6時的商品需求量為88.4791.2023/4/1535第35頁,共46頁,2023年,2月20日,星期二在Matlab工作區(qū)中輸入命令:beta,rmse2023/4/1536第36頁,共46頁,2023年,2月20日,星期二結果為:b=110.53130.1464-26.5709-0.00011.8475stats=0.970240.66560.0005法二將化為多元線性回歸:2023/4/1537第37頁,共46頁,2023年,2月20日,星期二非線性回歸(1)確定回歸系數的命令:
[beta,r,J]=nlinfit(x,y,’model’,beta0)(2)非線性回歸命令:nlintool(x,y,’model’,beta0,alpha)1、回歸:殘差Jacobian矩陣回歸系數的初值是事先用m-文件定義的非線性函數估計出的回歸系數輸入數據x、y分別為矩陣和n維列向量,對一元非線性回歸,x為n維列向量。2、預測和預測誤差估計:[Y,DELTA]=nlpredci(’model’,x,beta,r,J)求nlinfit或nlintool所得的回歸函數在x處的預測值Y及預測值的顯著性為1-alpha的置信區(qū)間YDELTA.2023/4/1538第38頁,共46頁,2023年,2月20日,星期二例4
對第一節(jié)例2,求解如下:2、輸入數據:x=2:16;y=[6.428.209.589.59.7109.939.9910.4910.5910.6010.8010.6010.9010.76];beta0=[82]';3、求回歸系數:
[beta,r,J]=nlinfit(x',y','volum',beta0);
beta得結果:beta=11.6036-1.0641即得回歸模型為:2023/4/1539第39頁,共46頁,2023年,2月20日,星期二逐步回歸逐步回歸的命令是:
stepwise(x,y,inmodel,alpha)運行stepwise命令時產生三個圖形窗口:StepwisePlot,StepwiseTable,StepwiseHistory.在StepwisePlot窗口,顯示出各項的回歸系數及其置信區(qū)間.
StepwiseTable窗口中列出了一個統(tǒng)計表,包括回歸系數及其置信區(qū)間,以及模型的統(tǒng)計量剩余標準差(RMSE)、相關系數(R-square)、F值、與F對應的概率P.矩陣的列數的指標,給出初始模型中包括的子集(缺省時設定為全部自變量)顯著性水平(缺省時為0.5)自變量數據,
階矩陣因變量數據,階矩陣2023/4/1540第40頁,共46頁,2023年,2月20日,星期二例6
水泥凝固時放出的熱量y與水泥中4種化學成分x1、x2、x3、x4
有關,今測得一組數據如下,試用逐步回歸法確定一個線性模型.1、數據輸入:x1=[7111117113122111110]';x2=[26295631525571315447406668]';x3=[615886917221842398]';x4=[6052204733226442226341212]';y=[78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.4]';x=[x1x2x3x4];2023/4/1541第41頁,共46頁,2023年,2月20日,星期二2、逐步回歸:(1)先在初始模型中取全部自變量:
stepwise(x,y)得圖StepwisePlot和表Stepwise
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新疆兵團八師一四三團一中2025年高二物理第二學期期末教學質量檢測模擬試題含解析
- 長沙市重點中學2025屆高二下物理期末綜合測試試題含解析
- 創(chuàng)新型綠色住宅買賣合同范本:環(huán)保生活承諾
- 食品企業(yè)食品安全應急處理采購合同
- 2025幼兒園后勤年度工作總結(17篇)
- 2025小學教師述職報告怎么寫(15篇)
- 公路養(yǎng)護稽查管理制度
- 醫(yī)院院外器械管理制度
- 電子屏合同(3篇)
- 出讓國有土地使用權合同書(4篇)
- 村衛(wèi)生室醫(yī)療質量相關管理制度
- 2025年全國碩士研究生入學統(tǒng)一考試 (數學三) 真題及答案
- 預防食品藥品誤食
- 新媒體編輯面試題及答案
- 2025年上海市高考英語熱點復習:六選四句子還原之說明文(上)
- 2025年gmp 基礎知識培訓試題及答案
- 軟件工程監(jiān)理實施細則10
- 2024年認證行業(yè)法律法規(guī)及認證基礎知識答案
- (一模)2025年深圳市高三年級第一次調研考試 英語試卷(含標準答案)
- 越南投資環(huán)境評價與重點投資區(qū)域研究
- 神經內科緊急護理人力資源調配演練記錄
評論
0/150
提交評論