淺談回歸分析_第1頁
淺談回歸分析_第2頁
淺談回歸分析_第3頁
淺談回歸分析_第4頁
淺談回歸分析_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

淺談回歸分析第1頁,課件共79頁,創(chuàng)作于2023年2月8/25/20231實驗?zāi)康膶嶒瀮?nèi)容2、掌握用數(shù)學(xué)軟件求解回歸分析問題。1、直觀了解回歸分析基本內(nèi)容。1、回歸分析的基本理論。3、實驗作業(yè)。2、用數(shù)學(xué)軟件求解回歸分析問題。第2頁,課件共79頁,創(chuàng)作于2023年2月8/25/20232一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模型及定義*模型參數(shù)估計*檢驗、預(yù)測與控制可線性化的一元非線性回歸(曲線回歸)數(shù)學(xué)模型及定義*模型參數(shù)估計*多元線性回歸中的檢驗與預(yù)測逐步回歸分析第3頁,課件共79頁,創(chuàng)作于2023年2月8/25/20233一、數(shù)學(xué)模型例1測16名成年女子的身高與腿長所得數(shù)據(jù)如下:以身高x為橫坐標,以腿長y為縱坐標將這些數(shù)據(jù)點(xI,yi)在平面直角坐標系上標出.散點圖解答第4頁,課件共79頁,創(chuàng)作于2023年2月8/25/20234一元線性回歸分析的主要任務(wù)是:返回第5頁,課件共79頁,創(chuàng)作于2023年2月8/25/20235二、模型參數(shù)估計1、回歸系數(shù)的最小二乘估計第6頁,課件共79頁,創(chuàng)作于2023年2月8/25/20236返回第7頁,課件共79頁,創(chuàng)作于2023年2月8/25/20237三、檢驗、預(yù)測與控制1、回歸方程的顯著性檢驗第8頁,課件共79頁,創(chuàng)作于2023年2月8/25/20238(Ⅰ)F檢驗法

(Ⅱ)t檢驗法第9頁,課件共79頁,創(chuàng)作于2023年2月8/25/20239(Ⅲ)r檢驗法第10頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023102、回歸系數(shù)的置信區(qū)間第11頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023113、預(yù)測與控制(1)預(yù)測第12頁,課件共79頁,創(chuàng)作于2023年2月8/25/202312(2)控制返回第13頁,課件共79頁,創(chuàng)作于2023年2月8/25/202313四、可線性化的一元非線性回歸(曲線回歸)例2出鋼時所用的盛鋼水的鋼包,由于鋼水對耐火材料的侵蝕,容積不斷增大.我們希望知道使用次數(shù)與增大的容積之間的關(guān)系.對一鋼包作試驗,測得的數(shù)據(jù)列于下表:解答第14頁,課件共79頁,創(chuàng)作于2023年2月8/25/202314散點圖此即非線性回歸或曲線回歸

問題(需要配曲線)配曲線的一般方法是:第15頁,課件共79頁,創(chuàng)作于2023年2月8/25/202315通常選擇的六類曲線如下:返回第16頁,課件共79頁,創(chuàng)作于2023年2月8/25/202316一、數(shù)學(xué)模型及定義返回第17頁,課件共79頁,創(chuàng)作于2023年2月8/25/202317二、模型參數(shù)估計第18頁,課件共79頁,創(chuàng)作于2023年2月8/25/202318返回第19頁,課件共79頁,創(chuàng)作于2023年2月8/25/202319三、多元線性回歸中的檢驗與預(yù)測

(Ⅰ)F檢驗法(Ⅱ)r檢驗法(殘差平方和)第20頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023202、預(yù)測(1)點預(yù)測(2)區(qū)間預(yù)測返回第21頁,課件共79頁,創(chuàng)作于2023年2月8/25/202321四、逐步回歸分析(4)“有進有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個變量開始,把變量逐個引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法:

“最優(yōu)”的回歸方程就是包含所有對Y有影響的變量,而不包含對Y影響不顯著的變量回歸方程。以第四種方法,即逐步回歸分析法在篩選變量方面較為理想.第22頁,課件共79頁,創(chuàng)作于2023年2月8/25/202322這個過程反復(fù)進行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止。逐步回歸分析法的思想:從一個自變量開始,視自變量Y作用的顯著程度,從大到地依次逐個引入回歸方程。當引入的自變量由于后面變量的引入而變得不顯著時,要將其剔除掉。引入一個自變量或從回歸方程中剔除一個自變量,為逐步回歸的一步。對于每一步都要進行Y值檢驗,以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量。返回第23頁,課件共79頁,創(chuàng)作于2023年2月8/25/202323統(tǒng)計工具箱中的回歸分析命令1、多元線性回歸2、多項式回歸3、非線性回歸4、逐步回歸返回第24頁,課件共79頁,創(chuàng)作于2023年2月8/25/202324多元線性回歸

b=regress(Y,X)1、確定回歸系數(shù)的點估計值:第25頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023253、畫出殘差及其置信區(qū)間:rcoplot(r,rint)2、求回歸系數(shù)的點估計和區(qū)間估計、并檢驗回歸模型:

[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計殘差用于檢驗回歸模型的統(tǒng)計量,有三個數(shù)值:相關(guān)系數(shù)r2、F值、與F對應(yīng)的概率p置信區(qū)間顯著性水平(缺省時為0.05)第26頁,課件共79頁,創(chuàng)作于2023年2月8/25/202326例1解:1、輸入數(shù)據(jù):x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2、回歸分析及檢驗:[b,bint,r,rint,stats]=regress(Y,X)b,bint,statsToMATLAB(liti11)題目第27頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023273、殘差分析,作殘差圖:rcoplot(r,rint)從殘差圖可以看出,除第二個數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點均較近,且殘差的置信區(qū)間均包含零點,這說明回歸模型y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個數(shù)據(jù)可視為異常點.4、預(yù)測及作圖:z=b(1)+b(2)*xplot(x,Y,'k+',x,z,'r')返回ToMATLAB(liti12)第28頁,課件共79頁,創(chuàng)作于2023年2月8/25/202328多項式回歸(一)一元多項式回歸

(1)確定多項式系數(shù)的命令:[p,S]=polyfit(x,y,m)(2)一元多項式回歸命令:polytool(x,y,m)1、回歸:y=a1xm+a2xm-1+…+amx+am+12、預(yù)測和預(yù)測誤差估計:(1)Y=polyval(p,x)求polyfit所得的回歸多項式在x處的預(yù)測值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回歸多項式在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間YDELTA;alpha缺省時為0.5.第29頁,課件共79頁,創(chuàng)作于2023年2月8/25/202329法一直接作二次多項式回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];

[p,S]=polyfit(t,s,2)ToMATLAB(liti21)得回歸模型為:第30頁,課件共79頁,創(chuàng)作于2023年2月8/25/202330法二化為多元線性回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,statsToMATLAB(liti22)得回歸模型為:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')預(yù)測及作圖ToMATLAB(liti23)第31頁,課件共79頁,創(chuàng)作于2023年2月8/25/202331(二)多元二項式回歸命令:rstool(x,y,’model’,alpha)nm矩陣顯著性水平(缺省時為0.05)n維列向量第32頁,課件共79頁,創(chuàng)作于2023年2月8/25/202332例3設(shè)某商品的需求量與消費者的平均收入、商品價格的統(tǒng)計數(shù)據(jù)如下,建立回歸模型,預(yù)測平均收入為1000、價格為6時的商品需求量.法一直接用多元二項式回歸:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')第33頁,課件共79頁,創(chuàng)作于2023年2月8/25/202333在畫面左下方的下拉式菜單中選”all”,則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。則畫面左邊的“PredictedY”下方的數(shù)據(jù)變?yōu)?8.47981,即預(yù)測出平均收入為1000、價格為6時的商品需求量為88.4791.第34頁,課件共79頁,創(chuàng)作于2023年2月8/25/202334在Matlab工作區(qū)中輸入命令:beta,rmseToMATLAB(liti31)為剩余標準差,表示應(yīng)變量Y值對于回歸直線的離散程度。第35頁,課件共79頁,創(chuàng)作于2023年2月8/25/202335結(jié)果為:b=110.53130.1464-26.5709-0.00011.8475stats=0.970240.66560.0005法二ToMATLAB(liti32)返回將化為多元線性回歸:第36頁,課件共79頁,創(chuàng)作于2023年2月8/25/202336非線性回歸(1)確定回歸系數(shù)的命令:

[beta,r,J]=nlinfit(x,y,’model’,beta0)(2)非線性回歸命令:nlintool(x,y,’model’,beta0,alpha)1、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為矩陣和n維列向量,對一元非線性回歸,x為n維列向量。2、預(yù)測和預(yù)測誤差估計:[Y,DELTA]=nlpredci(’model’,x,beta,r,J)求nlinfit或nlintool所得的回歸函數(shù)在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間YDELTA.第37頁,課件共79頁,創(chuàng)作于2023年2月8/25/202337例4對第一節(jié)例2,求解如下:2、輸入數(shù)據(jù):x=2:16;y=[6.428.209.589.59.7109.939.9910.4910.5910.6010.8010.6010.9010.76];beta0=[82]';3、求回歸系數(shù):[beta,r,J]=nlinfit(x',y','volum',beta0);beta得結(jié)果:beta=11.6036-1.0641即得回歸模型為:ToMATLAB(liti41)題目第38頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023384、預(yù)測及作圖:[YY,delta]=nlpredci('volum',x',beta,r,J);plot(x,y,'k+',x,YY,'r')ToMATLAB(liti42)第39頁,課件共79頁,創(chuàng)作于2023年2月8/25/202339例5財政收入預(yù)測問題:財政收入與國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝凇⒕蜆I(yè)人口、固定資產(chǎn)投資等因素有關(guān)。下表列出了1952-1981年的原始數(shù)據(jù),試構(gòu)造預(yù)測模型。

解設(shè)國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資分別為x1、x2、x3、x4、x5、x6,財政收入為y,設(shè)變量之間的關(guān)系為:y=ax1+bx2+cx3+dx4+ex5+fx6使用非線性回歸方法求解。第40頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023401.

對回歸模型建立M文件model.m如下:functionyy=model(beta0,X)a=beta0(1);b=beta0(2);c=beta0(3);d=beta0(4);e=beta0(5);f=beta0(6);x1=X(:,1);x2=X(:,2);x3=X(:,3);x4=X(:,4);x5=X(:,5);x6=X(:,6);yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6;

第41頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023412.

主程序liti6.m如下:X=[598.00349.00461.0057482.0020729.0044.00…………..2927.006862.001273.00100072.043280.00496.00];y=[184.00216.00248.00254.00268.00286.00357.00444.00506.00...271.00230.00266.00323.00393.00466.00352.00303.00447.00...564.00638.00658.00691.00655.00692.00657.00723.00922.00...890.00826.00810.0]';beta0=[0.50-0.03-0.600.01-0.020.35];betafit=nlinfit(X,y,'model',beta0)ToMATLAB(liti6)第42頁,課件共79頁,創(chuàng)作于2023年2月8/25/202342betafit=0.5243-0.0294-0.63040.0112-0.02300.3658即y=0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230x5+0.3658x6結(jié)果為:返回第43頁,課件共79頁,創(chuàng)作于2023年2月8/25/202343逐步回歸逐步回歸的命令是:stepwise(x,y,inmodel,alpha)運行stepwise命令時產(chǎn)生三個圖形窗口:StepwisePlot,StepwiseTable,StepwiseHistory.在StepwisePlot窗口,顯示出各項的回歸系數(shù)及其置信區(qū)間.StepwiseTable窗口中列出了一個統(tǒng)計表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計量剩余標準差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對應(yīng)的概率P.矩陣的列數(shù)的指標,給出初始模型中包括的子集(缺省時設(shè)定為全部自變量)顯著性水平(缺省時為0.5)自變量數(shù)據(jù),階矩陣因變量數(shù)據(jù),階矩陣第44頁,課件共79頁,創(chuàng)作于2023年2月8/25/202344例6水泥凝固時放出的熱量y與水泥中4種化學(xué)成分x1、x2、x3、x4

有關(guān),今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一個線性模型.1、數(shù)據(jù)輸入:x1=[7111117113122111110]';x2=[26295631525571315447406668]';x3=[615886917221842398]';x4=[6052204733226442226341212]';y=[78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.4]';x=[x1x2x3x4];第45頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023452、逐步回歸:(1)先在初始模型中取全部自變量:stepwise(x,y)得圖StepwisePlot和表StepwiseTable圖StepwisePlot中四條直線都是虛線,說明模型的顯著性不好從表StepwiseTable中看出變量x3和x4的顯著性最差.第46頁,課件共79頁,創(chuàng)作于2023年2月8/25/202346(2)在圖StepwisePlot中點擊直線3和直線4,移去變量x3和x4移去變量x3和x4后模型具有顯著性.

雖然剩余標準差(RMSE)沒有太大的變化,但是統(tǒng)計量F的值明顯增大,因此新的回歸模型更好.ToMATLAB(liti51)第47頁,課件共79頁,創(chuàng)作于2023年2月8/25/202347(3)對變量y和x1、x2作線性回歸:X=[ones(13,1)x1x2];b=regress(y,X)得結(jié)果:b=52.57731.46830.6623故最終模型為:y=52.5773+1.4683x1+0.6623x2ToMATLAB(liti52)返回第48頁,課件共79頁,創(chuàng)作于2023年2月8/25/202348作業(yè)1、考察溫度x對產(chǎn)量y的影響,測得下列10組數(shù)據(jù):求y關(guān)于x的線性回歸方程,檢驗回歸效果是否顯著,并預(yù)測x=42℃時產(chǎn)量的估值及預(yù)測區(qū)間(置信度95%).2、某零件上有一段曲線,為了在程序控制機床上加工這一零件,需要求這段曲線的解析表達式,在曲線橫坐標xi處測得縱坐標yi共11對數(shù)據(jù)如下:求這段曲線的縱坐標y關(guān)于橫坐標x的二次多項式回歸方程.第49頁,課件共79頁,創(chuàng)作于2023年2月8/25/202349第50頁,課件共79頁,創(chuàng)作于2023年2月8/25/2023504、混凝土的抗壓強度隨養(yǎng)護時間的延長而增加,現(xiàn)將一批混凝土作成12個試塊,記錄了養(yǎng)護日期x(日)及抗壓強度y(kg/cm2)的數(shù)據(jù):第51頁,課件共79頁,創(chuàng)作于2023年2月8/25/202351謝謝大家第52頁,課件共79頁,創(chuàng)作于2023年2月8/25/202352四軟件開發(fā)人員的薪金問題:一家高技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與他們的資歷、管理責任、教育程度等因素之間的關(guān)系,要建立一個數(shù)學(xué)模型,以便分析公司人士策略的合理性,并作為新聘用人員工資的參考。他們認為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于是調(diào)查了46名開發(fā)人員的檔案資料,如表。其中資歷一列指從事專業(yè)工作的年數(shù),管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學(xué)程度,2表示大學(xué)程度,3表示更高程度(研究生)第53頁,課件共79頁,創(chuàng)作于2023年2月8/25/202353編號薪金資歷管理教育編號薪金資歷管理教育011387611113198003130211608103141141740103187011131520263413041128310216132314030511767103171284440206208722121813245502071177220219136775030810535201201596551109121952032112366601101231330222213526131114975311231383960212213713122422884612第54頁,課件共79頁,創(chuàng)作于2023年2月8/25/202354編號薪金資歷管理教育編號薪金資歷管理教育251697871136168821202261480380237241701213271740481138159901301282218481339263301312291354880140179491402301446710014125685151331159421002422783716123223174101343188381602332378010124417483160134254101112451920717023514861110146193462001開發(fā)人員的薪金與他們的資歷、管理責任、教育程度第55頁,課件共79頁,創(chuàng)作于2023年2月8/25/202355分析與假設(shè):按照常識,薪金自然按照資歷(年)的增長而增加,管理人員的薪金高于非管理人員,教育程度越高薪金越高。薪金記作,資歷(年)記作,為了表示是否為管理人員定義1,管理人員0,非管理人員為了表示三種教育程度,定義1,中學(xué)0,其它1,大學(xué)0,其它這樣,中學(xué)用表示,大學(xué)用表示,研究生則用表示。第56頁,課件共79頁,創(chuàng)作于2023年2月8/25/202356為了簡單起見,我們假定資歷(年)對薪金的作用是線性的,即資歷每加一年,薪金的增長是常數(shù);管理責任、教育程度、資歷諸因素之間沒有交互作用,建立線性回歸模型?;灸P停盒浇鹋c資歷,管理責任,教育程度之間的多元線性回歸模型為其中,是待估計的回歸系數(shù),是隨機誤差。利用MATLAB的系統(tǒng)工具箱可以得到回歸系數(shù)及其置信區(qū)間(置信水平)、檢驗統(tǒng)計量的結(jié)果,見表。第57頁,課件共79頁,創(chuàng)作于2023年2月8/25/202357參數(shù)參數(shù)估計值置信區(qū)間11032[1025811807]546[484608]6883[62487517]-2994[-3826-2162]148[-636931]第58頁,課件共79頁,創(chuàng)作于2023年2月8/25/202358結(jié)果分析:從表中,,即因變量(薪金)的95.7%可由模型確定,值超過檢驗的臨界值,遠小于,因而模型從整體來看是可用的。比如,利用模型可以估計(或估計)一個大學(xué)畢業(yè)、有2年資歷、管理人員的薪金為模型中各個回歸系數(shù)的含義可初步解釋如下:的系數(shù)為546,說明資歷每增加一年,薪金增長546;的系數(shù)為6883,說明管理人員的薪金比非管理人員多6883;的系數(shù)為-2994,說明中學(xué)程度的薪金比研究生少2994;的系數(shù)為148,說明大學(xué)程度的薪金比研究生多148,但是應(yīng)該注意到的置信區(qū)間包含零點,所以這個系數(shù)的解釋是不可靠的。注意:上述解釋是就平均值來說的,并且,一個因素改變引起的因變量的變化量,都是在其它因素不變的條件下才成立的。第59頁,課件共79頁,創(chuàng)作于2023年2月8/25/202359進一步討論:的置信區(qū)間包含零點,說明上述基本模型存在缺點。為了尋找改進的方向,常用殘差分析法(殘差指薪金的實際值與模型估計的薪金之差,是基本模型中隨機誤差的估計值,這里用同一個符號)。我們將影響因素分成資歷與管理—教育組合兩類,管理--教育組合定義如表。組合123456管理010101教育112233管理—教育組合第60頁,課件共79頁,創(chuàng)作于2023年2月8/25/202360為了對殘差進行分析,下圖給出與資歷的關(guān)系,及與管理--教育組合間的關(guān)系。與資歷的關(guān)系與組合的關(guān)系從左圖看,殘差大概分成3個水平,這是由于6種管理—教育組合混在一起,在模型中未被正確反映的結(jié)果;從右圖看,對于前4個管理—教育組合,殘差或者全為正,或者全為負,也表明管理--教育組合在模型中處理不當。在模型中,管理責任和教育程度是分別起作用的,事實上,二者可能起著交互作用,如大學(xué)程度的管理人員的薪金會比二者分別的薪金之和高一點。第61頁,課件共79頁,創(chuàng)作于2023年2月8/25/202361以上分析提示我們,應(yīng)在基本模型中增加管理更好的模型:與教育的交互項,建立新的回歸模型。增加與的交互項后,模型記作利用MATLAB的統(tǒng)計工具箱得到的結(jié)果如表:第62頁,課件共79頁,創(chuàng)作于2023年2月8/25/202362參數(shù)參數(shù)估計值置信區(qū)間11204[1104411363]497[486508]7048[68417255]-1727[-1939-1514]-348[-545-152]-3071[-3372-2769]1836[15712101]第63頁,課件共79頁,創(chuàng)作于2023年2月8/25/202363由上表可知,這個模型的做該模型的兩個殘差分析圖,可以看出,已經(jīng)消除了不正?,F(xiàn)象,這也說明了模型的適用性。和值都比上一個模型有所改進,并且所有回歸系數(shù)的置信區(qū)間都不含零點,表明這個模型完全可用。與的關(guān)系與組合的關(guān)系第64頁,課件共79頁,創(chuàng)作于2023年2月8/25/202364從上圖,還可以發(fā)現(xiàn)一個異常點:具有10年資歷、大學(xué)程度的管理人員(編號33)的實際薪金明顯低于模型的估計值,也明顯低于與他有類似經(jīng)歷的其他人的薪金。這可能是由我們未知的原因造成的。為了使個別數(shù)據(jù)不致影響整個模型,應(yīng)該將這個異常數(shù)據(jù)去掉,對模型重新估計回歸系數(shù),得到的結(jié)果如表。殘差分析見圖??梢钥吹?,去掉異常數(shù)據(jù)后結(jié)果又有改善。第65頁,課件共79頁,創(chuàng)作于2023年2月8/25/202365參數(shù)參數(shù)估計值置信區(qū)間11200[1113911261]498[494503]7041[69627120]-1737[-1818-1656]-356[-431-281]-3056[-3171-2942]1997[18942100]第66頁,課件共79頁,創(chuàng)作于2023年2月8/25/202366與的關(guān)系與組合的關(guān)系模型的應(yīng)用:對于第二個模型,用去掉異常數(shù)據(jù)(33號)后估計出的系數(shù)得到的結(jié)果是滿意的。模型的應(yīng)用之一,可以用來“制訂”6種管理—教育組合人員的“基礎(chǔ)”薪金(即資歷為零的薪金),這是平均意義上的。利用第二個模型和去掉異常數(shù)據(jù)后得到的回歸系數(shù),可以得到如下結(jié)果:第67頁,課件共79頁,創(chuàng)作于2023年2月8/25/202367組合管理教育系數(shù)“基礎(chǔ)”薪金10194632111344830210844412198825031120061318241第68頁,課件共79頁,創(chuàng)作于2023年2月8/25/202368可以看出,大學(xué)程度的管理人員薪金比研究生程度管理人員

薪金高,而大學(xué)程度的非管理人員薪金比研究生程度非管理

人員薪金略低。當然,這是根據(jù)這家公司實際數(shù)據(jù)建立的模

型得到的結(jié)果,并不具普遍性。評注:從建立回歸模型的角度,通過這個問題的求解我們學(xué)習了:1)對于影響因變量的定性因素(管理、教育),可以引入0—1變量來處理,0—1變量的個數(shù)比定性因素的水平少1(如教育程度有3個水平,引入2個0—1變量)。2)用殘差分析法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項常??梢缘玫礁纳啤?)若發(fā)現(xiàn)異常值應(yīng)剔除,有助于結(jié)果的合理性。思考:在這里我們由簡到繁,先分別引進管理和教育因素,再引入交互項。試直接對6種管理-教育組合引入5個0—1變量,建立模型,看結(jié)果如何。第69頁,課件共79頁,創(chuàng)作于2023年2月8/25/202369五教學(xué)評估為了考評教師的教學(xué)質(zhì)量,教學(xué)研究部門設(shè)計了一個教學(xué)評估表,對學(xué)生進行一次問卷調(diào)查,要求學(xué)生對12位教師的15門課程(其中3為教師有兩門課程)按以下7項內(nèi)容打分,分值為1—5分(5分最好,1分最差):問題:~課程內(nèi)容組織的合理性;~主要問題展開的邏輯性;~回答學(xué)生問題的有效性;~課下交流的有助性;~教科書的幫助性;~考試評分的公正性;~對教師的總體評價。第70頁,課件共79頁,創(chuàng)作于2023年2月8/25/202370收回問卷調(diào)查表后,得到了學(xué)生對12為教師、15門課程各項評分的平均值,見表。

教師編號課程編號12014.464.424.234.104.564.374.1122244.113.823.293.603.993.823.3833013.583.313.243.764.393.753.1743014.424.374.344.403.634.274.3953014.624.474.534.674.634.574.69第71頁,課件共79頁,創(chuàng)作于2023年2月8/25/202371教師編號課程編號63093.183.823.923.623.504.143.2573112.472.793.583.502.843.842.8483114.293.924.053.762.764.113.9593124.414.364.274.754.594.114.18103124.594.344.244.392.644.384.44113334.554.454.434.574.454.404.47124244.674.644.524.393.484.214.6133513.713.413.394.184.064.063.1744114.284.454.104.073.764.434.1594244.244.384.354.484.154.504.33第72頁,課件共79頁,創(chuàng)作于2023年2月8/25/202372不一定每項都對教師總體評價有顯著影響,并且各項內(nèi)容之間也可能存在很強的相關(guān)性,他們希望得到一個總體評價與各項具體內(nèi)容之間的模型,模型應(yīng)盡量簡單和有效,并且由此能給教師一些合理的建議,以提高總體評價。準備知識:逐步回歸這個問題給出了6個自變量,但我們希望從中選出對因變量影響顯著的那些來建立回歸模型。變量選擇的標準應(yīng)該是將所有對因變量影響顯著的自變量都選入模型,而影響不顯著的自變量都不選入模型,從便于應(yīng)用的角度,應(yīng)使模型中的自變量個數(shù)盡量少。逐步回歸就是一種從眾多自變量中有效的選擇重要變量的方法。教學(xué)研究部門認為,所列各項具體內(nèi)容第73頁,課件共79頁,創(chuàng)作于2023年2月8/25/202373逐步回歸的基本思路是,先確定一個包含若干自變量的初始集合,然后每次從集合外的變量中引入一個對因變量影響最大的,再對集合中的變量進行檢驗,從變得不顯著的變量中移出一個影響最小的,依次進行,直到不能引入和移出為止。引入和移出都以給定的顯著性水平為標準。利用MATLAB系統(tǒng)工具箱中的逐步回歸命令stepwise可以實現(xiàn)逐步回歸。Stepwise提供人機交互式畫面,可以在畫面上自由引入和移出變量,進行統(tǒng)計分析。具體用法參見MATLAB叢書回歸模型的建立與求解:我們利用MATLAB命令得到各個變量的回歸系數(shù),置信區(qū)間,及剩余標準差(RMSE),決定系數(shù)(R-square),值,值。見表。第74頁,課件共79頁,創(chuàng)作于2023年2月8/25/202374參數(shù)參數(shù)估計值置信區(qū)間10.5162[0.01

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論