第十二講回歸分析課件_第1頁(yè)
第十二講回歸分析課件_第2頁(yè)
第十二講回歸分析課件_第3頁(yè)
第十二講回歸分析課件_第4頁(yè)
第十二講回歸分析課件_第5頁(yè)
已閱讀5頁(yè),還剩89頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

回歸分析1/4/20231回歸分析12/11/20221回歸分析在一組數(shù)據(jù)的基礎(chǔ)上研究這樣幾個(gè)問題:(i)建立因變量y與自變量x,x,,xm

之間的回歸模型(經(jīng)驗(yàn)公式);(ii)對(duì)回歸模型的可信度進(jìn)行檢驗(yàn);(iii)判斷每個(gè)自變量x(i=1,2,…,m)對(duì)y的影響是否顯著;(iv)診斷回歸模型是否適合這組數(shù)據(jù);(v)利用回歸模型對(duì)y進(jìn)行預(yù)報(bào)或控制。1/4/20232回歸分析在一組數(shù)據(jù)的基礎(chǔ)上研究這樣幾個(gè)問題:12/11/20一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*檢驗(yàn)、預(yù)測(cè)與控制可線性化的一元非線性回歸(曲線回歸)數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*多元線性回歸中的檢驗(yàn)與預(yù)測(cè)逐步回歸分析1/4/20233一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)一、數(shù)學(xué)模型例1測(cè)16名成年女子的身高與腿長(zhǎng)所得數(shù)據(jù)如下:以身高x為橫坐標(biāo),以腿長(zhǎng)y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)(xI,yi)在平面直角坐標(biāo)系上標(biāo)出.散點(diǎn)圖1/4/20234一、數(shù)學(xué)模型例1測(cè)16名成年女子的身高與腿長(zhǎng)所得數(shù)據(jù)如下:一元線性回歸分析的主要任務(wù)是:1/4/20235一元線性回歸分析的主要任務(wù)是:12/11/20225二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)1/4/20236二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)12/11/202其中

1/4/20237其中12/11/20227一個(gè)好的擬合方程,其殘差應(yīng)越小越好。殘差越小,擬合值與觀測(cè)值越接近,各觀測(cè)點(diǎn)在擬合直線周圍聚集的緊密程度越高,也就是說(shuō),擬合方程解釋y的能力越強(qiáng)。另外,當(dāng)剩余標(biāo)準(zhǔn)差越小時(shí),還說(shuō)明殘差值的變異程度越小。由于殘差的樣本均值為零。所以,其離散范圍越小,擬合的模型就越為精確。1/4/20238一個(gè)好的擬合方程,其殘差應(yīng)越小越好。殘差越小,擬合值與觀測(cè)值三、檢驗(yàn)、預(yù)測(cè)與控制1、顯著性檢驗(yàn)一般地,回歸方程的假設(shè)檢驗(yàn)包括兩個(gè)方面:一個(gè)是對(duì)模型的檢驗(yàn),即檢驗(yàn)自變量與因變量之間的關(guān)系能否用一個(gè)線性模型來(lái)表示,這是由F檢驗(yàn)來(lái)完成的;另一個(gè)檢驗(yàn)是關(guān)于回歸參數(shù)的檢驗(yàn),即當(dāng)模型檢驗(yàn)通過(guò)后,還要具體檢驗(yàn)每一個(gè)自變量對(duì)因變量的影響程度是否顯著。這是由t檢驗(yàn)完成。在一元線性分析中,由于自變量的個(gè)數(shù)只有一個(gè),這兩種檢驗(yàn)是統(tǒng)一的,它們的效果完全是等價(jià)的。但是,在多元線性回歸分析中,這兩個(gè)檢驗(yàn)的意義是不同的。從邏輯上說(shuō),一般常在F檢驗(yàn)通過(guò)后,再進(jìn)一步進(jìn)行t檢驗(yàn)。1/4/20239三、檢驗(yàn)、預(yù)測(cè)與控制1、顯著性檢驗(yàn)一般地,回歸方程的假設(shè)檢驗(yàn)(Ⅰ)F檢驗(yàn)法

(Ⅱ)t檢驗(yàn)法1/4/202310(Ⅰ)F檢驗(yàn)法(Ⅱ)t檢驗(yàn)法12/11/202210(Ⅲ)r檢驗(yàn)法1/4/202311(Ⅲ)r檢驗(yàn)法12/11/2022112、回歸系數(shù)的置信區(qū)間1/4/2023122、回歸系數(shù)的置信區(qū)間12/11/2022123、預(yù)測(cè)與控制(1)預(yù)測(cè)1/4/2023133、預(yù)測(cè)與控制(1)預(yù)測(cè)12/11/202213(2)控制1/4/202314(2)控制12/11/202214四、可線性化的一元非線性回歸(曲線回歸)例2出鋼時(shí)所用的盛鋼水的鋼包,由于鋼水對(duì)耐火材料的侵蝕,容積不斷增大.我們希望知道使用次數(shù)與增大的容積之間的關(guān)系.對(duì)一鋼包作試驗(yàn),測(cè)得的數(shù)據(jù)列于下表:1/4/202315四、可線性化的一元非線性回歸例2出鋼時(shí)所用的盛鋼水的鋼包,散點(diǎn)圖此即非線性回歸或曲線回歸

問題(需要配曲線)配曲線的一般方法是:1/4/202316散此即非線性回歸或曲線回歸問題(需要配曲線)配曲通常選擇的六類曲線如下:1/4/202317通常選擇的六類曲線如下:12/11/202217一、數(shù)學(xué)模型及定義多元線性回歸1/4/202318一、數(shù)學(xué)模型及定義多元線性回歸12/11/202218二、模型參數(shù)估計(jì)解得估計(jì)值1/4/202319二、模型參數(shù)估計(jì)解得估計(jì)值12/11/2022191/4/20232012/11/202220三、多元線性回歸中的檢驗(yàn)與預(yù)測(cè)

(Ⅰ)線性模型檢驗(yàn)——F檢驗(yàn)法(Ⅱ)回歸系數(shù)檢驗(yàn)——t檢驗(yàn)法(殘差平方和)1/4/202321三、多元線性回歸中的檢驗(yàn)與預(yù)測(cè)(Ⅰ)線性模型檢驗(yàn)——F檢驗(yàn)2、預(yù)測(cè)(1)點(diǎn)預(yù)測(cè)(2)區(qū)間預(yù)測(cè)1/4/2023222、預(yù)測(cè)(1)點(diǎn)預(yù)測(cè)(2)區(qū)間預(yù)測(cè)12/11/202222四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個(gè)變量開始,把變量逐個(gè)引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法:

“最優(yōu)”的回歸方程就是包含所有對(duì)Y有影響的變量,而不包含對(duì)Y影響不顯著的變量回歸方程。以第四種方法,即逐步回歸分析法在篩選變量方面較為理想.1/4/202323四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所這個(gè)過(guò)程反復(fù)進(jìn)行,直至既無(wú)不顯著的變量從回歸方程中剔除,又無(wú)顯著變量可引入回歸方程時(shí)為止。逐步回歸分析法的思想:從一個(gè)自變量開始,視自變量Y作用的顯著程度,從大到地依次逐個(gè)引入回歸方程。當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。引入一個(gè)自變量或從回歸方程中剔除一個(gè)自變量,為逐步回歸的一步。對(duì)于每一步都要進(jìn)行Y值檢驗(yàn),以確保每次引入新的顯著性變量前回歸方程中只包含對(duì)Y作用顯著的變量。1/4/202324這個(gè)過(guò)程反復(fù)進(jìn)行,直至既無(wú)不顯著的變量從回歸方程中剔除,統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線性回歸2、多項(xiàng)式回歸3、非線性回歸4、逐步回歸1/4/202325統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線性回歸2、多項(xiàng)式回歸3、多元線性回歸

b=regress(Y,X)1、確定回歸系數(shù)的點(diǎn)估計(jì)值:1/4/202326多元線性回歸1、確定回歸系數(shù)的點(diǎn)估計(jì)值:12/11/20223、畫出殘差及其置信區(qū)間:rcoplot(r,rint)2、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:

[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:相關(guān)系數(shù)r2、F值、與F對(duì)應(yīng)的概率p置信區(qū)間顯著性水平(缺省時(shí)為0.05)1/4/2023272、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:回歸系數(shù)的例1解:1、輸入數(shù)據(jù):x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2、回歸分析及檢驗(yàn):[b,bint,r,rint,stats]=regress(Y,X)b,bint,stats1/4/202328例1解:1、輸入數(shù)據(jù):2、回歸分析及檢驗(yàn):12/11/2023、殘差分析,作殘差圖:rcoplot(r,rint)從殘差圖可以看出,除第二個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說(shuō)明回歸模型y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個(gè)數(shù)據(jù)可視為異常點(diǎn).4、預(yù)測(cè)及作圖:z=b(1)+b(2)*xplot(x,Y,'k+',x,z,'r')1/4/2023293、殘差分析,作殘差圖:從殘差圖可以看出,除多項(xiàng)式回歸(一)一元多項(xiàng)式回歸

(1)確定多項(xiàng)式系數(shù)的命令:[p,S]=polyfit(x,y,m)(2)一元多項(xiàng)式回歸命令:polytool(x,y,m)1、回歸:y=a1xm+a2xm-1+…+amx+am+12、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):(1)Y=polyval(p,x)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測(cè)值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1-alpha的置信區(qū)間YDELTA;alpha缺省時(shí)為0.5.1/4/202330多項(xiàng)式回歸(一)一元多項(xiàng)式回歸(1)確定多項(xiàng)式系法一直接作二次多項(xiàng)式回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];

[p,S]=polyfit(t,s,2)得回歸模型為:1/4/202331法一直接作二次多項(xiàng)式回歸:得回歸模型為:12/法二化為多元線性回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,stats得回歸模型為:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')預(yù)測(cè)及作圖1/4/202332法二化為多元線性回歸:得回歸模型為:Y=polyconf((二)多元二項(xiàng)式回歸命令:rstool(x,y,’model’,alpha)nm矩陣顯著性水平(缺省時(shí)為0.05)n維列向量1/4/202333(二)多元二項(xiàng)式回歸命令:rstool(x,y,’model例3設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù)據(jù)如下,建立回歸模型,預(yù)測(cè)平均收入為1000、價(jià)格為6時(shí)的商品需求量.法一直接用多元二項(xiàng)式回歸:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')1/4/202334例3設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)在畫面左下方的下拉式菜單中選”all”,則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。則畫面左邊的“PredictedY”下方的數(shù)據(jù)變?yōu)?8.47981,即預(yù)測(cè)出平均收入為1000、價(jià)格為6時(shí)的商品需求量為88.4791.1/4/202335在畫面左下方的下拉式菜單中選”all”,則beta在Matlab工作區(qū)中輸入命令:beta,rmse1/4/202336在Matlab工作區(qū)中輸入命令:beta,rmse12/結(jié)果為:b=110.53130.1464-26.5709-0.00011.8475stats=0.970240.66560.0005法二將化為多元線性回歸:1/4/202337結(jié)果為:b=法二將化為多元線性回歸:12/11/20非線性回歸(1)確定回歸系數(shù)的命令:

[beta,r,J]=nlinfit(x,y,’model’,beta0)(2)非線性回歸命令:nlintool(x,y,’model’,beta0,alpha)1、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計(jì)出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為矩陣和n維列向量,對(duì)一元非線性回歸,x為n維列向量。2、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):[Y,DELTA]=nlpredci(’model’,x,beta,r,J)求nlinfit或nlintool所得的回歸函數(shù)在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1-alpha的置信區(qū)間YDELTA.1/4/202338非線性回歸(1)確定回歸系數(shù)的命令:(2)非線性回歸命令例4對(duì)第一節(jié)例2,求解如下:2、輸入數(shù)據(jù):x=2:16;y=[6.428.209.589.59.7109.939.9910.4910.5910.6010.8010.6010.9010.76];beta0=[82]';3、求回歸系數(shù):[beta,r,J]=nlinfit(x',y','volum',beta0);beta得結(jié)果:beta=11.6036-1.0641即得回歸模型為:1/4/202339例4對(duì)第一節(jié)例2,求解如下:2、輸入數(shù)據(jù):3、求回歸系逐步回歸逐步回歸的命令是:stepwise(x,y,inmodel,alpha)運(yùn)行stepwise命令時(shí)產(chǎn)生三個(gè)圖形窗口:StepwisePlot,StepwiseTable,StepwiseHistory.在StepwisePlot窗口,顯示出各項(xiàng)的回歸系數(shù)及其置信區(qū)間.StepwiseTable窗口中列出了一個(gè)統(tǒng)計(jì)表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計(jì)量剩余標(biāo)準(zhǔn)差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對(duì)應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),給出初始模型中包括的子集(缺省時(shí)設(shè)定為全部自變量)顯著性水平(缺省時(shí)為0.5)自變量數(shù)據(jù),階矩陣因變量數(shù)據(jù),階矩陣1/4/202340逐步回歸逐步回歸的命令是:運(yùn)行step例6水泥凝固時(shí)放出的熱量y與水泥中4種化學(xué)成分x1、x2、x3、x4

有關(guān),今測(cè)得一組數(shù)據(jù)如下,試用逐步回歸法確定一個(gè)線性模型.1、數(shù)據(jù)輸入:x1=[7111117113122111110]';x2=[26295631525571315447406668]';x3=[615886917221842398]';x4=[6052204733226442226341212]';y=[78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.4]';x=[x1x2x3x4];1/4/202341例6水泥凝固時(shí)放出的熱量y與水泥中4種化學(xué)成分x1、x2、2、逐步回歸:(1)先在初始模型中取全部自變量:stepwise(x,y)得圖StepwisePlot和表StepwiseTable圖StepwisePlot中四條直線都是虛線,說(shuō)明模型的顯著性不好從表StepwiseTable中看出變量x3和x4的顯著性最差.1/4/2023422、逐步回歸:圖StepwisePlot中四條直線都是虛線(2)在圖StepwisePlot中點(diǎn)擊直線3和直線4,移去變量x3和x4移去變量x3和x4后模型具有顯著性.

雖然剩余標(biāo)準(zhǔn)差(RMSE)沒有太大的變化,但是統(tǒng)計(jì)量F的值明顯增大,因此新的回歸模型更好.1/4/202343(2)在圖StepwisePlot中點(diǎn)擊直線3和直線4,移(3)對(duì)變量y和x1、x2作線性回歸:X=[ones(13,1)x1x2];b=regress(y,X)得結(jié)果:b=52.57731.46830.6623故最終模型為:y=52.5773+1.4683x1+0.6623x21/4/202344(3)對(duì)變量y和x1、x2作線性回歸:得結(jié)果:b=12/1作業(yè)1、考察溫度x對(duì)產(chǎn)量y的影響,測(cè)得下列10組數(shù)據(jù):求y關(guān)于x的線性回歸方程,檢驗(yàn)回歸效果是否顯著,并預(yù)測(cè)x=42℃時(shí)產(chǎn)量的估值及預(yù)測(cè)區(qū)間(置信度95%).2、某零件上有一段曲線,為了在程序控制機(jī)床上加工這一零件,需要求這段曲線的解析表達(dá)式,在曲線橫坐標(biāo)xi處測(cè)得縱坐標(biāo)yi共11對(duì)數(shù)據(jù)如下:求這段曲線的縱坐標(biāo)y關(guān)于橫坐標(biāo)x的二次多項(xiàng)式回歸方程.1/4/202345作業(yè)1、考察溫度x對(duì)產(chǎn)量y的影響,測(cè)得下列10組數(shù)據(jù):求經(jīng)常不斷地學(xué)習(xí),你就什么都知道。你知道得越多,你就越有力量StudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe寫在最后經(jīng)常不斷地學(xué)習(xí),你就什么都知道。你知道得越多,你就越有力量寫謝謝你的到來(lái)學(xué)習(xí)并沒有結(jié)束,希望大家繼續(xù)努力LearningIsNotOver.IHopeYouWillContinueToWorkHard演講人:XXXXXX時(shí)間:XX年XX月XX日

謝謝你的到來(lái)演講人:XXXXXX回歸分析1/4/202348回歸分析12/11/20221回歸分析在一組數(shù)據(jù)的基礎(chǔ)上研究這樣幾個(gè)問題:(i)建立因變量y與自變量x,x,,xm

之間的回歸模型(經(jīng)驗(yàn)公式);(ii)對(duì)回歸模型的可信度進(jìn)行檢驗(yàn);(iii)判斷每個(gè)自變量x(i=1,2,…,m)對(duì)y的影響是否顯著;(iv)診斷回歸模型是否適合這組數(shù)據(jù);(v)利用回歸模型對(duì)y進(jìn)行預(yù)報(bào)或控制。1/4/202349回歸分析在一組數(shù)據(jù)的基礎(chǔ)上研究這樣幾個(gè)問題:12/11/20一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*檢驗(yàn)、預(yù)測(cè)與控制可線性化的一元非線性回歸(曲線回歸)數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*多元線性回歸中的檢驗(yàn)與預(yù)測(cè)逐步回歸分析1/4/202350一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)一、數(shù)學(xué)模型例1測(cè)16名成年女子的身高與腿長(zhǎng)所得數(shù)據(jù)如下:以身高x為橫坐標(biāo),以腿長(zhǎng)y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)(xI,yi)在平面直角坐標(biāo)系上標(biāo)出.散點(diǎn)圖1/4/202351一、數(shù)學(xué)模型例1測(cè)16名成年女子的身高與腿長(zhǎng)所得數(shù)據(jù)如下:一元線性回歸分析的主要任務(wù)是:1/4/202352一元線性回歸分析的主要任務(wù)是:12/11/20225二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)1/4/202353二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)12/11/202其中

1/4/202354其中12/11/20227一個(gè)好的擬合方程,其殘差應(yīng)越小越好。殘差越小,擬合值與觀測(cè)值越接近,各觀測(cè)點(diǎn)在擬合直線周圍聚集的緊密程度越高,也就是說(shuō),擬合方程解釋y的能力越強(qiáng)。另外,當(dāng)剩余標(biāo)準(zhǔn)差越小時(shí),還說(shuō)明殘差值的變異程度越小。由于殘差的樣本均值為零。所以,其離散范圍越小,擬合的模型就越為精確。1/4/202355一個(gè)好的擬合方程,其殘差應(yīng)越小越好。殘差越小,擬合值與觀測(cè)值三、檢驗(yàn)、預(yù)測(cè)與控制1、顯著性檢驗(yàn)一般地,回歸方程的假設(shè)檢驗(yàn)包括兩個(gè)方面:一個(gè)是對(duì)模型的檢驗(yàn),即檢驗(yàn)自變量與因變量之間的關(guān)系能否用一個(gè)線性模型來(lái)表示,這是由F檢驗(yàn)來(lái)完成的;另一個(gè)檢驗(yàn)是關(guān)于回歸參數(shù)的檢驗(yàn),即當(dāng)模型檢驗(yàn)通過(guò)后,還要具體檢驗(yàn)每一個(gè)自變量對(duì)因變量的影響程度是否顯著。這是由t檢驗(yàn)完成。在一元線性分析中,由于自變量的個(gè)數(shù)只有一個(gè),這兩種檢驗(yàn)是統(tǒng)一的,它們的效果完全是等價(jià)的。但是,在多元線性回歸分析中,這兩個(gè)檢驗(yàn)的意義是不同的。從邏輯上說(shuō),一般常在F檢驗(yàn)通過(guò)后,再進(jìn)一步進(jìn)行t檢驗(yàn)。1/4/202356三、檢驗(yàn)、預(yù)測(cè)與控制1、顯著性檢驗(yàn)一般地,回歸方程的假設(shè)檢驗(yàn)(Ⅰ)F檢驗(yàn)法

(Ⅱ)t檢驗(yàn)法1/4/202357(Ⅰ)F檢驗(yàn)法(Ⅱ)t檢驗(yàn)法12/11/202210(Ⅲ)r檢驗(yàn)法1/4/202358(Ⅲ)r檢驗(yàn)法12/11/2022112、回歸系數(shù)的置信區(qū)間1/4/2023592、回歸系數(shù)的置信區(qū)間12/11/2022123、預(yù)測(cè)與控制(1)預(yù)測(cè)1/4/2023603、預(yù)測(cè)與控制(1)預(yù)測(cè)12/11/202213(2)控制1/4/202361(2)控制12/11/202214四、可線性化的一元非線性回歸(曲線回歸)例2出鋼時(shí)所用的盛鋼水的鋼包,由于鋼水對(duì)耐火材料的侵蝕,容積不斷增大.我們希望知道使用次數(shù)與增大的容積之間的關(guān)系.對(duì)一鋼包作試驗(yàn),測(cè)得的數(shù)據(jù)列于下表:1/4/202362四、可線性化的一元非線性回歸例2出鋼時(shí)所用的盛鋼水的鋼包,散點(diǎn)圖此即非線性回歸或曲線回歸

問題(需要配曲線)配曲線的一般方法是:1/4/202363散此即非線性回歸或曲線回歸問題(需要配曲線)配曲通常選擇的六類曲線如下:1/4/202364通常選擇的六類曲線如下:12/11/202217一、數(shù)學(xué)模型及定義多元線性回歸1/4/202365一、數(shù)學(xué)模型及定義多元線性回歸12/11/202218二、模型參數(shù)估計(jì)解得估計(jì)值1/4/202366二、模型參數(shù)估計(jì)解得估計(jì)值12/11/2022191/4/20236712/11/202220三、多元線性回歸中的檢驗(yàn)與預(yù)測(cè)

(Ⅰ)線性模型檢驗(yàn)——F檢驗(yàn)法(Ⅱ)回歸系數(shù)檢驗(yàn)——t檢驗(yàn)法(殘差平方和)1/4/202368三、多元線性回歸中的檢驗(yàn)與預(yù)測(cè)(Ⅰ)線性模型檢驗(yàn)——F檢驗(yàn)2、預(yù)測(cè)(1)點(diǎn)預(yù)測(cè)(2)區(qū)間預(yù)測(cè)1/4/2023692、預(yù)測(cè)(1)點(diǎn)預(yù)測(cè)(2)區(qū)間預(yù)測(cè)12/11/202222四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個(gè)變量開始,把變量逐個(gè)引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法:

“最優(yōu)”的回歸方程就是包含所有對(duì)Y有影響的變量,而不包含對(duì)Y影響不顯著的變量回歸方程。以第四種方法,即逐步回歸分析法在篩選變量方面較為理想.1/4/202370四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所這個(gè)過(guò)程反復(fù)進(jìn)行,直至既無(wú)不顯著的變量從回歸方程中剔除,又無(wú)顯著變量可引入回歸方程時(shí)為止。逐步回歸分析法的思想:從一個(gè)自變量開始,視自變量Y作用的顯著程度,從大到地依次逐個(gè)引入回歸方程。當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。引入一個(gè)自變量或從回歸方程中剔除一個(gè)自變量,為逐步回歸的一步。對(duì)于每一步都要進(jìn)行Y值檢驗(yàn),以確保每次引入新的顯著性變量前回歸方程中只包含對(duì)Y作用顯著的變量。1/4/202371這個(gè)過(guò)程反復(fù)進(jìn)行,直至既無(wú)不顯著的變量從回歸方程中剔除,統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線性回歸2、多項(xiàng)式回歸3、非線性回歸4、逐步回歸1/4/202372統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線性回歸2、多項(xiàng)式回歸3、多元線性回歸

b=regress(Y,X)1、確定回歸系數(shù)的點(diǎn)估計(jì)值:1/4/202373多元線性回歸1、確定回歸系數(shù)的點(diǎn)估計(jì)值:12/11/20223、畫出殘差及其置信區(qū)間:rcoplot(r,rint)2、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:

[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:相關(guān)系數(shù)r2、F值、與F對(duì)應(yīng)的概率p置信區(qū)間顯著性水平(缺省時(shí)為0.05)1/4/2023742、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:回歸系數(shù)的例1解:1、輸入數(shù)據(jù):x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2、回歸分析及檢驗(yàn):[b,bint,r,rint,stats]=regress(Y,X)b,bint,stats1/4/202375例1解:1、輸入數(shù)據(jù):2、回歸分析及檢驗(yàn):12/11/2023、殘差分析,作殘差圖:rcoplot(r,rint)從殘差圖可以看出,除第二個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說(shuō)明回歸模型y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個(gè)數(shù)據(jù)可視為異常點(diǎn).4、預(yù)測(cè)及作圖:z=b(1)+b(2)*xplot(x,Y,'k+',x,z,'r')1/4/2023763、殘差分析,作殘差圖:從殘差圖可以看出,除多項(xiàng)式回歸(一)一元多項(xiàng)式回歸

(1)確定多項(xiàng)式系數(shù)的命令:[p,S]=polyfit(x,y,m)(2)一元多項(xiàng)式回歸命令:polytool(x,y,m)1、回歸:y=a1xm+a2xm-1+…+amx+am+12、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):(1)Y=polyval(p,x)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測(cè)值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1-alpha的置信區(qū)間YDELTA;alpha缺省時(shí)為0.5.1/4/202377多項(xiàng)式回歸(一)一元多項(xiàng)式回歸(1)確定多項(xiàng)式系法一直接作二次多項(xiàng)式回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];

[p,S]=polyfit(t,s,2)得回歸模型為:1/4/202378法一直接作二次多項(xiàng)式回歸:得回歸模型為:12/法二化為多元線性回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,stats得回歸模型為:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')預(yù)測(cè)及作圖1/4/202379法二化為多元線性回歸:得回歸模型為:Y=polyconf((二)多元二項(xiàng)式回歸命令:rstool(x,y,’model’,alpha)nm矩陣顯著性水平(缺省時(shí)為0.05)n維列向量1/4/202380(二)多元二項(xiàng)式回歸命令:rstool(x,y,’model例3設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù)據(jù)如下,建立回歸模型,預(yù)測(cè)平均收入為1000、價(jià)格為6時(shí)的商品需求量.法一直接用多元二項(xiàng)式回歸:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')1/4/202381例3設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)在畫面左下方的下拉式菜單中選”all”,則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。則畫面左邊的“PredictedY”下方的數(shù)據(jù)變?yōu)?8.47981,即預(yù)測(cè)出平均收入為1000、價(jià)格為6時(shí)的商品需求量為88.4791.1/4/202382在畫面左下方的下拉式菜單中選”all”,則beta在Matlab工作區(qū)中輸入命令:beta,rmse1/4/202383在Matlab工作區(qū)中輸入命令:beta,rmse12/結(jié)果為:b=110.53130.1464-26.5709-0.00011.8475stats=0.970240.66560.0005法二將化為多元線性回歸:1/4/202384結(jié)果為:b=法二將化為多元線性回歸:12/11/20非線性回歸(1)確定回歸系數(shù)的命令:

[beta,r,J]=nlinfit(x,y,’model’,beta0)(2)非線性回歸命令:nlintool(x,y,’model’,beta0,alpha)1、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計(jì)出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為矩陣和n維列向量,對(duì)一元非線性回歸,x為n維列向量。2、預(yù)測(cè)和預(yù)測(cè)誤差估計(jì):[Y,DELTA]=nlpredci(’model’,x,beta,r,J)求nlinfit或nlintool所得的回歸函數(shù)在x處的預(yù)測(cè)值Y及預(yù)測(cè)值的顯著性為1-alpha的置信區(qū)間YDELTA.1/4/202385非線性回歸(1)確定回歸系數(shù)的命令:(2)非線性回歸命令例4對(duì)第一節(jié)例2,求解如下:2、輸入數(shù)據(jù):x=2:16;y=[6.428.209.589.59.7109.939.9910.4910.5910.6010.8010.6010.9010.76];beta0=[82]';3、求回歸系數(shù):[beta,r,J]=nlinfit(x',y','volum',beta0);beta得結(jié)果:beta=11.6036-1.0641即得回歸模型為:1/4/202386例4對(duì)第一節(jié)例2,求解如下:2、輸入數(shù)據(jù):3、求回歸系逐步回歸逐步回歸的命令是:stepwise(x,y,inmodel,alpha)運(yùn)行stepwise命令時(shí)產(chǎn)生三個(gè)圖形窗口:StepwisePlot,StepwiseTable,StepwiseHistory.在StepwisePlot窗口,顯示出各項(xiàng)的回歸系數(shù)及其置信區(qū)間.StepwiseTable窗口中列出了一個(gè)統(tǒng)計(jì)表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計(jì)量剩余標(biāo)準(zhǔn)差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對(duì)應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),給出初始模型中包括的子集(缺省時(shí)設(shè)定為全部自變量)顯著性水平(缺省時(shí)為0.5)自變量數(shù)據(jù),

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論