《預(yù)測與決策技術(shù)應(yīng)用》第3章多元線性規(guī)劃預(yù)測作業(yè)_第1頁
《預(yù)測與決策技術(shù)應(yīng)用》第3章多元線性規(guī)劃預(yù)測作業(yè)_第2頁
《預(yù)測與決策技術(shù)應(yīng)用》第3章多元線性規(guī)劃預(yù)測作業(yè)_第3頁
《預(yù)測與決策技術(shù)應(yīng)用》第3章多元線性規(guī)劃預(yù)測作業(yè)_第4頁
《預(yù)測與決策技術(shù)應(yīng)用》第3章多元線性規(guī)劃預(yù)測作業(yè)_第5頁
已閱讀5頁,還剩147頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第3章回歸預(yù)測方法3.1引言

3.1.1相關(guān)分析變量之間的關(guān)系:確定性(函數(shù))關(guān)系、非確定性(相關(guān))關(guān)系1.函數(shù)關(guān)系:變量之間存在的確定性的數(shù)量依存關(guān)系。在這種關(guān)系中,當(dāng)其中一個變量的值確定后,另一個變量的值就會完全確定。2.相關(guān)關(guān)系:變量之間存在的非確定性的數(shù)量依存關(guān)系。當(dāng)一個變量發(fā)生變化時(shí),另一個變量也會隨之發(fā)生變化,但這種數(shù)量變化關(guān)系并不是嚴(yán)格的一一對應(yīng)。家庭收入————家庭消費(fèi)支出身高————體重相關(guān)關(guān)系商品價(jià)格————商品需求量

圓的面積————圓的半徑函數(shù)關(guān)系物體的質(zhì)量————物體的體積3.相關(guān)關(guān)系分類:(1)按變量間的相關(guān)程度:完全相關(guān)(函數(shù)關(guān)系)、不完全相關(guān)、不相關(guān)(2)按變量間數(shù)量的變化方向:正相關(guān)(變動方向一致)、負(fù)相關(guān)(變動方向相反)(3)按變量間相關(guān)關(guān)系的表現(xiàn)形式:線性相關(guān)、非線性相關(guān)(4)按相關(guān)關(guān)系包括的影響因素的多少:單相關(guān)(一個變量對另一個變量的相關(guān)影響)和復(fù)相關(guān)(或多元相關(guān),若干個變量對另一個變量的相關(guān)影響)散點(diǎn)圖形態(tài):d.完全正相關(guān)

e.正相關(guān)

f.非線性相關(guān)a.完全負(fù)相關(guān)

b.負(fù)相關(guān)

c.不相關(guān)d.完全正相關(guān)e.正相關(guān)f.非線性相關(guān)散點(diǎn)圖形態(tài):4.相關(guān)分析:研究兩個或兩個以上變量之間不確定性依存關(guān)系的方法,其目的在于探求變量之間是否存在相關(guān)關(guān)系,以及相關(guān)關(guān)系的密切程度。5.相關(guān)分析的步驟:(1)根據(jù)一定的經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)對現(xiàn)象進(jìn)行定性分析;(2)繪制散點(diǎn)圖來判斷變量之間的關(guān)系形態(tài);(3)如果兩個變量之間是線性關(guān)系(即出現(xiàn)圖a.b.d.e的形態(tài)),用樣本相關(guān)系數(shù)來測度兩個變量之間的關(guān)系強(qiáng)度,對相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn),判斷樣本所反映的關(guān)系能夠用來代表兩個變量總體上的關(guān)系(多個變量間的相關(guān)性通過復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)度量)。

6.樣本相關(guān)系數(shù)設(shè)已經(jīng)觀察記錄得到了兩個變量的一組觀察值()(),則變量之間的樣本相關(guān)系數(shù)的計(jì)算公式為:其中,————樣本協(xié)方差,

————樣本方差簡化公式:r的取值范圍:。r=1:X和Y完全正相關(guān),X與Y是函數(shù)關(guān)系;r=-1:X和Y完全負(fù)相關(guān),X與Y是函數(shù)關(guān)系;r=0:X和Y之間不存在線性關(guān)系,但可能存在非線性關(guān)系;0<|r|<1:Y與X之間存在普通的線性相關(guān)關(guān)系;|r|越大,X與Y之間的線性相關(guān)程度越高。|r|≥0.8:高度相關(guān);0.5≤|r|≤0.8:中度相關(guān);

0.3≤|r|≤0.5:低度相關(guān);|r|<0.3:近似不相關(guān)。7.樣本相關(guān)系數(shù)的檢驗(yàn)樣本相關(guān)系數(shù)是根據(jù)樣本得到的統(tǒng)計(jì)量,因此具有隨機(jī)性,只有對樣本相關(guān)系數(shù)進(jìn)行檢驗(yàn)后才能下結(jié)論。檢驗(yàn)統(tǒng)計(jì)量:,總體相關(guān)系數(shù)提出假設(shè):對于給定的顯著水平,計(jì)算t的估計(jì)量,

——X與Y之間存在線性相關(guān)關(guān)系;

——X與Y之間不存在線性相關(guān)關(guān)系。注意:(1)相關(guān)分析只表明兩個變量之間的相關(guān)程度和方向,它并不能說明兩個變量間是否有因果關(guān)系。(2)相關(guān)關(guān)系成立的數(shù)據(jù)范圍之內(nèi)應(yīng)用這種相關(guān)關(guān)系,不能隨意外推。eg.雨量和農(nóng)作物的長勢。3.1.2回歸分析在相關(guān)分析的基礎(chǔ)上進(jìn)行回歸分析,進(jìn)一步探討變量之間的因果關(guān)系和具體的數(shù)量變動關(guān)系。

1.回歸分析:研究某一隨機(jī)變量(因變量)與其他一個或幾個普通變量(自變量)之間數(shù)量變動關(guān)系的一種方法。2.回歸分析的主要內(nèi)容:

(1)根據(jù)研究現(xiàn)象之間的內(nèi)在聯(lián)系,確定自變量和因變量。

(2)確定回歸分析模型的類型及表達(dá)式(參數(shù))。

(3)

對回歸模型進(jìn)行檢驗(yàn)。包括:擬合度檢驗(yàn)、回歸系數(shù)的顯著性檢驗(yàn)、回歸方程的顯著性檢驗(yàn)等。

(4)對因變量進(jìn)行預(yù)測。利用回歸模型,根據(jù)自變量的數(shù)值去估計(jì)、預(yù)測因變量的取值及置信區(qū)間,也可利用回歸模型進(jìn)行控制。

3.回歸模型的分類

(1)一元回歸模型和多元回歸模型——模型中包含自變量的個數(shù)。

(2)線性回歸模型和非線性回歸模型——回歸模型的形式。

(3)普通回歸模型和帶虛擬變量的回歸模型——模型是否帶有虛擬變量。3.1.3相關(guān)分析與回歸分析的主要區(qū)別(1)相關(guān)分析的任務(wù)是確定兩個變量之間相關(guān)的方向和密切程度?;貧w分析的任務(wù)是尋找因變量對自變量依賴關(guān)系的數(shù)學(xué)表達(dá)式。(2)相關(guān)分析中,兩個變量要求都是隨機(jī)變量,并且不必區(qū)分自變量和因變量;而回歸分析中自變量是普通變量,因變量是隨機(jī)變量,并且必須明確哪個是因變量,哪些是自變量;(3)相關(guān)分析中兩變量是對等的,改變兩者的地位,并不影響相關(guān)系數(shù)的數(shù)值,只有一個相關(guān)系數(shù)。而在回歸分析中,改變兩個變量的位置會得到兩個不同的回歸方程。3.2一元線性回歸預(yù)測方法

一元線性回歸預(yù)測法:當(dāng)兩個變量的數(shù)據(jù)分布大體呈直線趨勢時(shí),通過建立一元線性回歸模型,從而根據(jù)自變量的變化來預(yù)測因變量的平均變化。3.2.1一元線性回歸模型Y:因變量;X:自變量;a,b:回歸系數(shù);:剩余殘差項(xiàng)(或隨機(jī)擾動項(xiàng))

(1)參數(shù)a,b估計(jì)利用最小二乘法進(jìn)行參數(shù)估計(jì),得到a,b表達(dá)式:(2)回歸方程或3.2.2一元線性回歸模型的顯著性檢驗(yàn)1.模型擬合優(yōu)度的檢驗(yàn)擬合優(yōu)度:由樣本數(shù)據(jù)擬合回歸直線的優(yōu)劣程度。判定系數(shù)(決定系數(shù))是衡量模型擬合優(yōu)度的重要指標(biāo)。(1)判定系數(shù):

,總離差平方和,回歸利差平方和,剩余平方和,越接近1,回歸直線的擬合優(yōu)度越高,如果的取值超過0.8,認(rèn)為模型的擬合優(yōu)度比較高。判定系數(shù)的平方根就是相關(guān)系數(shù)r。2.回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))利用統(tǒng)計(jì)方法檢驗(yàn)所建立的回歸方程是否有意義。檢驗(yàn)步驟:(1)建立假說。(2)構(gòu)造F統(tǒng)計(jì)量

F服從F(1,n-2)分布。對給定的顯著水平,查F分布表可得臨界值。(3)根據(jù)觀察值計(jì)算統(tǒng)計(jì)量F的估計(jì)值,若,拒絕原假設(shè),認(rèn)為兩個變量Y與x間線性關(guān)系顯著;若,則兩個變量Y與x間線性關(guān)系不顯著,回歸模型不能用于預(yù)測與控制。3.回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))(一元線性回歸中F檢驗(yàn)與t檢驗(yàn)結(jié)果相同)

用于判斷每一個自變量與因變量的線性關(guān)系是否顯著,主要檢驗(yàn)參數(shù)是否顯著異于0。檢驗(yàn)步驟:(1)建立假說。(2)構(gòu)造t統(tǒng)計(jì)量,其中t服從t(n-2)分布。對給定的顯著水平,查t分布表可得臨界值。(3)根據(jù)觀察值計(jì)算統(tǒng)計(jì)量t的估計(jì)值,若,拒絕原假設(shè),認(rèn)為b顯著異于0;若,則意味著方程中的自變量對于回歸模型是不顯著的或不重要的。3.2.3一元線性回歸預(yù)測回歸預(yù)測:利用回歸方程,對于自變量x的一個給定值x0,求出,稱為點(diǎn)估計(jì)值。對于給定的顯著水平,預(yù)測區(qū)間為:其中,,例題某省1978-1989年國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資完成額如表所示。試配合適當(dāng)?shù)幕貧w模型進(jìn)行顯著性檢驗(yàn)。若1990年該省固定資產(chǎn)投資完成額為249億元,當(dāng)顯著水平為0.05時(shí),試估計(jì)1990年國內(nèi)生產(chǎn)總值的預(yù)測區(qū)間。年份國內(nèi)生產(chǎn)總值yi固定資產(chǎn)投資完成額xixiyixi2yi219781952039004003802519792102042004004410019802442663446765953619812643592401225696961982294521528827048643619833145617584313698596198436081291606561129600198543213156592171611866241986481149716992220123136119875671639242126569321489198865523215196053824429025198970420214220840804495616合計(jì)472011676005661756612190104解題過程1.繪制散點(diǎn)圖兩者近似呈線性關(guān)系。計(jì)算相關(guān)系數(shù)r2.設(shè)一元線性回歸方程為:3.計(jì)算回歸系數(shù):

則回歸方程為:4.回歸模型的顯著性檢驗(yàn)(1)模型擬合優(yōu)度的檢驗(yàn)

計(jì)算可決系數(shù),說明回歸平方和占總離差平方和的96.4%,回歸直線的擬合程度很高,從而可用x的變動來解釋Y的變動。(2)回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))<1>建立假說。

<2>構(gòu)造F統(tǒng)計(jì)量

取顯著水平,查表得臨界值。拒絕原假設(shè),即認(rèn)為兩個變量Y與x之間線性關(guān)系顯著,回歸方程在統(tǒng)計(jì)意義上是顯著的。(3)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))<1>建立假說。<2>構(gòu)造t統(tǒng)計(jì)量,取顯著水平,查t分布表可得臨界值。,拒絕原假設(shè),即認(rèn)為b顯著異于0,說明方程中的自變量對于回歸模型是顯著的。5.預(yù)測當(dāng)x0=249億元時(shí),帶入回歸方程得到Y(jié)的點(diǎn)估計(jì)值為億元。預(yù)測區(qū)間為一元線性回歸預(yù)測

Eviews

運(yùn)算演示1.輸入數(shù)據(jù)(1)建立工作文件:File/New/Workfile(2)輸入起止年(3)工作文件初始狀態(tài)(4)新建對象:Object/NewObject(5)在對象中選擇Series,為對象起名字(6)在文件中雙擊對象名,輸入數(shù)據(jù)edit+/-

(7)數(shù)據(jù)輸入后的結(jié)果2.繪制散點(diǎn)圖(1)選擇Quick/Graph(2)輸入繪制散點(diǎn)圖的數(shù)列(3)選擇scatter(4)生成的散點(diǎn)圖3.簡單相關(guān)分析r(1)Quick/GroupStatistics/Correlations(2)輸入序列名(3)相關(guān)系數(shù)計(jì)算結(jié)果Eviews軟件不提供r的檢驗(yàn),因此需要手工處理t分布表1n0.250.20.150.10.050.0250.010.0050.00250.0010.000511.0001.3761.9633.0786.31412.7131.8263.66127.3318.3636.620.8161.0611.3861.8862.9204.3036.9659.92514.0922.3331.6030.7650.9781.2501.6382.3533.1824.5415.8417.45310.2112.9240.7410.9411.1901.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.1561.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.1341.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.1191.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.1081.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.1001.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.0931.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.0881.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.0831.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.0791.3501.7712.1602.6503.0123.3723.8524.221140.6920.8681.0761.3451.7612.1452.6242.9773.3263.7874.140150.6910.8661.0741.3411.7532.1312.6022.9473.2863.7334.073160.6900.8651.0711.3371.7462.1202.5832.9213.2523.6864.015170.6890.8631.0691.3331.7402.1102.5672.8983.2223.6463.965180.6880.8621.0671.3301.7342.1012.5522.8783.1973.6103.922t分布表2n0.250.20.150.10.050.0250.010.0050.00250.0010.0005190.6880.8611.0661.3281.7292.0932.5392.8613.1743.5793.883200.6870.8601.0641.3251.7252.0862.5282.8453.1533.5523.850210.6860.8591.0631.3231.7212.0802.5182.8313.1353.5273.819220.6860.8581.0611.3211.7172.0742.5082.8193.1193.5053.792230.6850.8581.0601.3191.7142.0692.5002.8073.1043.4853.767240.6850.8571.0591.3181.7112.0642.4922.7973.0913.4673.745250.6840.8561.0581.3161.7082.0602.4852.7873.0783.4503.725260.6840.8561.0581.3151.7062.0562.4792.7793.0673.4353.707270.6840.8551.0571.3141.7032.0522.4732.7713.0573.4213.690280.6830.8551.0561.3131.7012.0482.4672.7633.0473.4083.674290.6830.8541.0551.3111.6992.0452.4622.7563.0383.3963.659300.6830.8541.0551.3101.6972.0422.4572.7503.0303.3853.646400.6810.8511.0501.3031.6842.0212.4232.7042.9713.3073.551500.6790.8491.0471.2991.6762.0092.4032.6782.9373.2613.496600.6790.8481.0451.2961.6712.0002.3902.6602.9153.2323.460800.6780.8461.0431.2921.6641.9902.3742.6392.8873.1953.4161000.6770.8451.0421.2901.6601.9842.3642.6262.8713.1743.3901200.6770.8451.0411.2891.6581.9802.3582.6172.8603.1603.373infty0.6740.8421.0361.2821.6451.9602.3262.5762.8074.計(jì)算回歸系數(shù)(1)Quick/EstimateEquation(2)輸入模型(3)計(jì)算結(jié)果5.模型擬合優(yōu)度的檢驗(yàn)(1)系數(shù)計(jì)算結(jié)果中R-squared判定系數(shù)R2=0.9661066.回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))

F檢驗(yàn)值F-statistic=285.0366為了方便,Eviews中給出了拒絕零假設(shè)時(shí)犯錯誤的概率,稱為收尾概率或相伴概率Prob(F-statistic)。若此概率值低于事先確定的顯著水平,則可拒絕零假設(shè),否則不能拒絕。7.回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))t檢驗(yàn)值t-Statisticb:16.88303當(dāng)收尾概率小于規(guī)定的顯著水平,則檢驗(yàn)通過,否則檢驗(yàn)未通過。8.預(yù)測雙擊,改變數(shù)據(jù)區(qū)間雙擊數(shù)據(jù)序列g(shù)d,添加1990年數(shù)據(jù),249億元在計(jì)算結(jié)果界面上單擊Forecast,修改預(yù)測樣本區(qū)間預(yù)測結(jié)果雙擊gnf,1990年gn的預(yù)測結(jié)果為738.8299區(qū)間估計(jì):Sumsquaredresid作業(yè)某飲料公司經(jīng)過長期的觀察發(fā)現(xiàn):飲料的銷售量與氣溫之間存在著一定的關(guān)系,即氣溫越高,人們對飲料的需求量越大,從而使得飲料的銷售量越大。為此該飲料公司記錄了10次不同溫度下的飲料銷售量,如圖。序號12345678910氣溫/oC3021354237208173525銷售量/箱430335520490470210195270400480根據(jù)這些數(shù)據(jù)能夠得到結(jié)論:飲料的銷售量與氣溫之間一定存在著某種關(guān)系?這種關(guān)系可否通過數(shù)學(xué)模型來描述?是否可以根據(jù)建立的數(shù)學(xué)模型預(yù)測氣溫為32

oC時(shí),飲料的銷售量。社會經(jīng)濟(jì)現(xiàn)象的變化往往受到多個因素的影響,因此,一般要進(jìn)行多元回歸分析,研究某一因變量與多個自變量之間相互關(guān)系的理論和方法就是多元線性回歸預(yù)測法。3.3多元線性回歸預(yù)測法3.3.1多元線性回歸模型1.參數(shù)估計(jì)多元回歸與一元回歸類似,可以用最小二乘法估計(jì)模型參數(shù)。也需對模型及模型參數(shù)進(jìn)行統(tǒng)計(jì)檢驗(yàn)。設(shè)序列的觀測值與估計(jì)值之間的離差平方和為Q,則為使Q達(dá)到最小,分別令Q關(guān)于的偏導(dǎo)數(shù)等于零。的估計(jì)值為

回歸系數(shù)向量的性質(zhì)(1)是的無偏估計(jì),即(2)的協(xié)方差3.3.2多元線性回歸模型的顯著性檢驗(yàn)1.模型擬合優(yōu)度的檢驗(yàn)

多重判定系數(shù)

為了消除自變量數(shù)目的影響,采用一個經(jīng)過校正的判定系數(shù)來判斷模型的擬合優(yōu)度越接近于1,則說明模型的擬合程度越高?!獜?fù)相關(guān)系數(shù)說明的是在總的離差平方和中,由一組自變量的變動所引起的離差占總離差的百分比;則描述一組自變量與因變量Y之間的線性相關(guān)程度。2.回歸方程的顯著性檢驗(yàn)多元線性回歸方程效果不顯著的原因:(1)影響Y的因素除了一組自變量x1,x2,…,xm之外,還有其他不可忽略的因素;(2)Y與一組自變量x1,x2,…,xm之間的關(guān)系不是線性的;(3)Y與一組自變量x1,x2,…,xm之間無關(guān)。這時(shí)回歸模型不能用來預(yù)測,應(yīng)分析原因,另選自變量或改變預(yù)測模型的形式。3.回歸系數(shù)的顯著性檢驗(yàn)Cjj為矩陣(XTX)-1主對角線上的第j個元素。3.3.3多元線性回歸預(yù)測2.點(diǎn)預(yù)測值3.預(yù)測區(qū)間因變量的點(diǎn)預(yù)測值和預(yù)測區(qū)間的計(jì)算步驟:3.3.3多元線性回歸預(yù)測因變量的點(diǎn)預(yù)測值和預(yù)測區(qū)間的計(jì)算步驟:1.計(jì)算估計(jì)標(biāo)準(zhǔn)誤差2.對任意給定的,因變量的點(diǎn)預(yù)測值為,預(yù)測誤差的樣本方差為

3.給定顯著性水平,則當(dāng)預(yù)測值為時(shí),其預(yù)測區(qū)間為在實(shí)際預(yù)測中,一般可以用SY代替S0近似的估計(jì)預(yù)測區(qū)間。3.3.4多元線性回歸分析中的多重共線性

所謂多重共線性是指自變量之間存在著線性關(guān)系或接近線性的關(guān)系。如果自變量之間共線性的程度很高(相關(guān)系數(shù)接近于1),將使最小二乘法原理失效,從而使得回歸方程中參數(shù)變得不確定從而無法求出參數(shù)的估計(jì)值。因此自變量之間不能存在線性相關(guān)關(guān)系是應(yīng)用最小二乘法原理的先決條件。檢驗(yàn)多重共線性的方法(1)

經(jīng)驗(yàn)法:一般的,如果模型的R2很大,F(xiàn)檢驗(yàn)通過,但有些系數(shù)不能通過參數(shù)t檢驗(yàn),模型的自變量之間簡單相關(guān)系數(shù)很高,回歸系數(shù)的符號與簡單相關(guān)系數(shù)的符號相反,都有理由懷疑存在多重共線性。檢驗(yàn)多重共線性的方法(2)

常用的克服多重共線性的方法(1)省略不重要的自變量。(2)差分法。(3)增加樣本信息或利用已知信息。對于時(shí)間序列數(shù)據(jù)資料和橫剖面數(shù)據(jù)資料,增大樣本容量都回提高參數(shù)估計(jì)值得精度。將兩者結(jié)合起來(將歷史統(tǒng)計(jì)數(shù)據(jù)和抽樣調(diào)查數(shù)據(jù)結(jié)合)使用也有助于消除嚴(yán)重的多重共線性。

(4)構(gòu)造新的自變量。將兩個高度相關(guān)的自變量,變成一個自變量xi/xj。(5)放棄原有樣本,尋求新的樣本。注:對于模型的估計(jì)是否容許多重共線性的自變量存在,要根據(jù)建立模型的具體目的確定。若目的是為了預(yù)測,那么只要保證自變量之間相關(guān)的類型在預(yù)測期內(nèi)不變,對預(yù)測精度的影響就不大。但是,若自變量之間相關(guān)類型在預(yù)期內(nèi)發(fā)生了變化,如果想得到精確地預(yù)測值,就必須克服自變量之間的而嚴(yán)重共線性關(guān)系問題。3.3.5多元線性回歸分析中的序列相關(guān)序列相關(guān)的檢驗(yàn)法1.圖示檢驗(yàn)法2.德賓—沃森統(tǒng)計(jì)量(D—W)適合隨機(jī)誤差項(xiàng)具有一階自相關(guān)的情況,即與它前一期相關(guān)。步驟:

1)建立回歸方程并利用最小二乘法求出回歸方程的系數(shù),從而求出剩余項(xiàng)ei(i=1~n)

2)計(jì)算DW統(tǒng)計(jì)量

3)建立假設(shè)H0:ρ1=0,H1:ρ1≠0。

4)根據(jù)給定的顯著性水平α及自變量個數(shù)m從DW檢驗(yàn)表中查得相應(yīng)臨界值dL,dU,并利用規(guī)則判別檢驗(yàn)結(jié)論。D—W的取值域在0~4之間。

檢驗(yàn)法則:在D—W小于等于2時(shí),D—W檢驗(yàn)法則規(guī)定:如認(rèn)為,存在正自相關(guān);如認(rèn)為,無自相關(guān)。在D—W大于2時(shí),D—W檢驗(yàn)法則規(guī)定:如存在負(fù)自相關(guān);如無自相關(guān);如,不能確定是否有自相關(guān);補(bǔ)救的方法(1)把略去的重要影響因素引入到回歸模型中來。(2)重新選擇符合實(shí)際的回歸模型形式。(3)增加樣本容量,改善數(shù)據(jù)的準(zhǔn)確性。異方差如果回歸模型中的隨機(jī)誤差項(xiàng)不滿足假設(shè)條件中的同方差性,即對不同的樣本點(diǎn)有:則稱存在異方差性。當(dāng)存在異方差時(shí),如果采用OLS法估計(jì)模型參數(shù),可能出現(xiàn):參數(shù)估計(jì)值雖然是無偏的,但不是有效的;參數(shù)的顯著性檢驗(yàn)失去意義;預(yù)測失效等。異方差的檢驗(yàn)法1.圖示檢驗(yàn)法以某一變量(通常取自變量或因變量的預(yù)測值)作為橫坐標(biāo),以模型的殘差e作為縱坐標(biāo),根據(jù)做出的散點(diǎn)圖直觀的判斷是否存在相關(guān)性。如果存在相關(guān)性,則存在異方差。2.懷特檢驗(yàn)法把e2作為因變量,原先的自變量和自變量的平方作為新自變量建立線性回歸模型(還可以加上任意兩個變量的交叉項(xiàng)xixj),通過這個模型的擬合情況來檢驗(yàn)是否有異方差性。檢驗(yàn)的零假設(shè)時(shí)殘差不存在異方差。如對兩個自變量的情況,則可建立如下輔助回歸模型:懷特檢驗(yàn)的統(tǒng)計(jì)量:LM=n*R2,m近似服從自由度為k的分布,可又收尾概率作出是否拒絕原假設(shè)的結(jié)論。異方差的處理加權(quán)最小二乘法(WLS)基本思路:殘差平方和中的每個觀測值的權(quán)數(shù)不同,從而使新模型的隨機(jī)誤差具有同方差性。以一元回歸方程為例,WLS的殘差平方和變?yōu)椋?/p>

多元線性回歸預(yù)測

Eviews

運(yùn)算演示美國機(jī)動車汽油消費(fèi)量研究

年份obs消費(fèi)量QMG汽車保有量MOB汽油價(jià)格PMG人口數(shù)POP國民生產(chǎn)總值GNP195040617285491952120.2721522711090.4195143896887519487960.2761548781179.2195246428148533013290.2871575531226.1195349374047563132810.291601841282.1195451107135586225470.2911630261252.1195554333255626887920.2991659311356.7195656022406651538100.311689031383.5195757415622671249040.3041719841410.2195859154330682965940.3051748821384.7195961596548713544200.3111778301481196062811854738686820.3081806711517.2196163978489759582150.3061836911547.9196262531373791733290.3041865381647.9196364779104827137170.3041892421711.6196467663848863012070.3121918891806.9196570337126903607210.3211943031918.5196673638812939620300.3321965602048.9196776139326969309490.3371987122100.31968807726571010391130.3482007062195.41969854160841035620180.3572026772260.71970886840501068076290.3642050522250.71971921946201112974590.36120766123321972953489041170516380.3882098962465.51973998046001238117410.5242119092602.819741002122101279512540.5722138542564.219751023277501309189180.5952159732530.919761069727401363339340.6312180352680.519771100234101415231970.6572202392822.419781136259601464843360.6782225853115.219791078312201494222050.8572250553192.419801008560701533578761.1912277573187.819811009940401559074731.3112301383248.819821002428701569936941.222232520316619831015152601610179261.1572347993279.119841026036901634329441.292370013489.919851047192301687438171.1152392793585.219861078312201732558500.8572416133676.519871104679801779220000.8972439153847一、數(shù)據(jù)的預(yù)處理預(yù)處理是指在正式建模之前運(yùn)用一些初等方法探討變量之間的關(guān)系,為正式建模做準(zhǔn)備。常用的預(yù)處理方法包括繪制動態(tài)曲線圖、繪制散點(diǎn)圖、計(jì)算變量之間的相關(guān)系數(shù)等。1.繪制動態(tài)曲線圖步驟:(1)Quick/Graph(2)輸入序列名稱輸入序列名稱參數(shù)設(shè)置各個變量的動態(tài)曲線2.繪制散點(diǎn)圖步驟:(1)Quick/Graph(2)輸入序列名稱3.簡單相關(guān)分析步驟:(1)Quick/GroupStatistic/Correlation(2)輸入序列名稱輸入序列名樣本相關(guān)系數(shù)計(jì)算結(jié)果二、最小二乘估計(jì)步驟:(1)Quick/EstimateEquation

(2)輸入回歸方程完整型

QMG=c(1)*+c(2)*MOB+c(3)*PMG+c(4)*POP+c(5)*GNP簡單型QMGcMOBPMGPOPGNP注:只有線性模型才可以以簡化形式書寫。方程對象窗口各統(tǒng)計(jì)量的解釋:DependentVariable:QMG(因變量)Method:LeastSquares (參數(shù)估計(jì)方法)Date:10/02/14Time:19:14 Sample:19501987 (樣本范圍)Includedobservations:38(樣本容量)Variable(自變量)Coefficient(參數(shù)估計(jì)值)Std.Error(參數(shù)估計(jì)量的樣本標(biāo)準(zhǔn)差)t-Statistic(t統(tǒng)計(jì)量)Prob.(t統(tǒng)計(jì)量的收尾概率)C24553723250796700.9790290.3347MOB1.4185200.2668915.3149770.0000PMG-279957625027085.-5.5689850.0000POP-59.87480198.5517-0.3015580.7649GNP-30540.889557.981-3.1953280.0031R-squared(決定系數(shù))0.966951Meandependentvar(因變量的樣本均值)80901846AdjustedR-squared(修正的決定系數(shù))0.962945S.D.dependentvar(因變量的樣本標(biāo)準(zhǔn)差)22972717S.E.ofregression(回歸標(biāo)準(zhǔn)差)4422197.Akaikeinfocriterion(AIC,赤池信息量準(zhǔn)則)33.56425Sumsquaredresid(殘差平方和)6.45E+14Schwarzcriterion(SC,施瓦茨準(zhǔn)則)33.77972Loglikelihood(對數(shù)似然函數(shù))-632.7208Hannan-Quinncriter.(HQC,漢南-奎因準(zhǔn)則)33.64091F-statistic(F-統(tǒng)計(jì)量)241.3763Durbin-Watsonstat(D.W.統(tǒng)計(jì)量)0.626584Prob(F-statistic)(F-統(tǒng)計(jì)量的收尾概率)0.000000Loglikelihood(對數(shù)似然函數(shù)):L取值越大說明模型越精確。但受自變量數(shù)目的影響,變量越多L越大,導(dǎo)致不合理,需要改進(jìn)。Akaikeinfocriterion(AIC,赤池信息量準(zhǔn)則):對對數(shù)似然函數(shù)的改進(jìn),取值越小越好。Schwarzcriterion(SC,施瓦茨準(zhǔn)則):對對數(shù)似然函數(shù)的改進(jìn),取值越小越好。Hannan-Quinncriter.(HQC,漢南-奎因準(zhǔn)則):對對數(shù)似然函數(shù)的改進(jìn),取值越小越好。三、自變量的選擇1、t檢驗(yàn)法Variable(自變量)t-Statistic(t統(tǒng)計(jì)量)Prob.(t統(tǒng)計(jì)量的收尾概率)C0.9790290.3347MOB5.3149770.0000PMG-5.5689850.0000POP-0.3015580.7649GNP-3.1953280.0031POP變量的收尾概率為0.7649,可以考慮從模型中刪除掉。

2、刪除變量POP后,再次回歸刪除POP后模型的參數(shù)估計(jì)注:最好一次只檢驗(yàn)一個變量;要求原模型與檢驗(yàn)?zāi)P偷臉颖救萘恳恢拢?959-1987)。四、多重共線性

1、多重共線性的診斷(1)觀察個別偏回歸系數(shù)估計(jì)值的符號回歸結(jié)果盡管方程整體線性回歸擬合較好,但GNP系數(shù)的符號與經(jīng)濟(jì)意義相悖,MOB的系數(shù)估計(jì)值很小。表明模型存在多重共線性。(2)簡單相關(guān)系數(shù)法相關(guān)系數(shù)相關(guān)系數(shù)都在0.8以上,解釋變量之間存在高度線性相關(guān)性。(3)輔助回歸法

作每一解釋變量對其他解釋變量的回歸,(F檢驗(yàn))F檢驗(yàn)值的收尾概率p都很小,因此,每個解釋變量都與其余解釋變量至少有一個具有多重共線性。2、多重共線性的補(bǔ)救(1)逐步回歸法

1)用因變量對每一個解釋變量做回歸,并將解釋變量的重要性按R2大小排序,R2越大,重要性越高,結(jié)合經(jīng)濟(jì)意義和統(tǒng)計(jì)檢驗(yàn)選出擬合效果最好的一元線性回歸方程。根據(jù)上述對解釋變量重要性排序如下:R2MOB>R2GNP>R2PMG2)以對因變量貢獻(xiàn)最大的解釋變量所對應(yīng)的回歸方程為基礎(chǔ)方程,并按解釋變量重要性的大小為順序逐個引入其余的解釋變量,該新模型的基礎(chǔ)方程QMG=22038951+0.546879*MOB,入解釋變量GNP與基礎(chǔ)方程QMG=22038951+0.546879*MOB相比,該模型的估計(jì)結(jié)果中R2有所提高(基礎(chǔ)方程R2=0.917016),而且P值很小,但GNP系數(shù)前面的符號為負(fù),不符合實(shí)際,所以變量GNP在模型中不予以保留。加入解釋變量PMG與基礎(chǔ)方程QMG=22038951+0.546879*MOB相比,該模型的估計(jì)結(jié)果中R2有所提高(基礎(chǔ)方程R2=0.917016),而且P值很小,且MOB系數(shù)前面的符號為正,PMG系數(shù)前面的符號為負(fù),符合實(shí)際,所以變量GNP在模型中予以保留。樣本模型

:Se=(2592695)(0.040936)(4834044.)t=(5.906098)(18.29326)(-5.662563)p=(0.0000)(0.0000)(0.0000)

F=386.5829(2)剔除法設(shè)法找到引起共線性的變量并予以剔除。通常剔除未通過系數(shù)顯著性檢驗(yàn)的變量。(3)差分法差分法會帶來擬合效果變差,常常丟失一些信息等問題。(4)重新定義方程考慮用人均汽油消費(fèi)量、人均機(jī)動車數(shù)量、人均國民生產(chǎn)總值和油價(jià)這四個變量建模,取消原模型中的人口數(shù)量。減少變量,降低發(fā)生共線性的可能。采用逐步回歸法(5)有偏估計(jì),如主成分回歸、嶺回歸等。五、序列相關(guān)

1、自相關(guān)的診斷(1)圖示檢驗(yàn)法(模型只考慮MOB、PMG兩個變量的自相關(guān)性)

法一:繪制et和et-1散點(diǎn)圖。et和et-1散點(diǎn)圖et和et-1的相關(guān)性不明朗法二:按時(shí)間順序繪制殘差項(xiàng)et的圖形。et

時(shí)間變化圖按時(shí)間順序,et變化有規(guī)律,存在自相關(guān)性(2)DW檢驗(yàn)法DW=0.236393k=2T=38dL=1.37dU=1.59DW<dL,存在正相關(guān)附表DW檢驗(yàn)臨界值表(a=0.05)

Tk=1k=2k=3k=4

k=5

dL

dU

dL

dU

dL

dU

dL

dU

dL

dU

151.081.360.951.540.821.750.691.970.562.21

161.101.370.981.540.861.730.741.930.622.15

171.131.381.021.540.901.710.781.900.672.10

181.161.391.051.530.931.690.821.870.712.06

191.181.401.081.530.971.680.861.850.752.02

201.201.411.101.541.001.680.901.830.791.99

211.221.421.131.541.031.670.931.810.831.96

221.241.431.151.541.051.660.961.800.861.94

231.261.441.171.541.081.660.991.790.901.92

241.271.451.191.551.101.661.011.780.931.90

251.291.451.211.551.121.661.041.770.951.89

261.301.461.221.551.141.651.061.760.981.88

271.321.471.241.561.161.651.081.761.011.86

281.331.481.261.561.181.651.101.751.031.85

291.341.481.271.561.201.651.121.741.051.84

301.351.491.281.571.211.651.141.741.071.83

311.361.501.301.571.231.651.161.741.091.83

321.371.501.311.571.241.651.181.731.111.82

331.381.511.321.581.261.651.191.731.131.81

341.391.511.331.581.271.651.211.731.151.81

351.401.521.341.581.281.651.221.731.161.80

361.411.521.351.591.291.651.241.731.181.80

371.421.531.361.591.311.661.251.721.191.80

381.431.541.371.591.321.661.261.721.211.79

391.431.541.381.601.331.661.271.721.221.79

401.441.541.391.601.341.661.291.721.231.79

451.481.571.431.621.381.671.341.721.291.78

501.501.591.461.631.421.671.381.721.341.77

551.531.601.491.641.451.681.411.721.381.77

601.551.621.511.651.481.691.441.731.411.77

651.571.631.541.661.501.701.471.731.441.77

701.581.641.551.671.521.701.491.741.461.77

751.601.651.571.681.541.711.511.741.491.77

801.611.661.591.691.561.721.531.741.511.77

851.621.671.601.701.571.721.551.751.521.77

901.631.681.611.701.591.731.571.751.541.78

951.641.691.621.711.601.731.581.751.561.781001.651.691.631.721.611.741.591.761.571.78注:1.

表示檢驗(yàn)水平,T表示樣本容量,

k表示回歸模型中解釋變量個數(shù)(不包括常數(shù)項(xiàng))。2.dU和dL分別表示DW檢驗(yàn)上臨界值和下臨界值。3.摘自Dubrin-Watson(1951)。

D.W.檢驗(yàn)法的不足:適合隨機(jī)誤差項(xiàng)具有一階自相關(guān)的情況,不能檢驗(yàn)是否有高階自相關(guān)。(3)LM檢驗(yàn)法——可以檢驗(yàn)是否有高階自相關(guān)原假設(shè):殘差不存在從一階到p階的自相關(guān)。方法一:View/ResidualTests/correlogram-Q-statistics。EViews將顯示殘差的自相關(guān)和偏自相關(guān)函數(shù)以及對應(yīng)于高階序列相關(guān)的Ljung-BoxQ統(tǒng)計(jì)量。如果殘差不存在序列相關(guān),在各階滯后的自相關(guān)和偏自相關(guān)值都接近于零。所有的Q-統(tǒng)計(jì)量不顯著,并且有大的P值。方法二:View/ResidualTests/SerialcorrelationLMTest,一般地對高階序列相關(guān)的情況執(zhí)行SerialcorrelationLM(Lagrangemultiplier,拉格朗日乘數(shù)檢驗(yàn))。在滯后定義對話框,輸入要檢驗(yàn)序列的最高階數(shù)。可根據(jù)統(tǒng)計(jì)量的收尾概率的大小決定原假設(shè)的舍去。1階2階3階存在1階自相關(guān)2、自相關(guān)的克服方法(1)Cochrane-Orcutt(科克倫‐奧科特)迭代法1)在QUICK-ESTIMATEEQUATION項(xiàng),在對話框中輸入:QMG

C

MOBPMG

AR(1)后得如下結(jié)果:DW=1.367840k=2T=38dL=1.37dU=1.59,DW<DL,存在正相關(guān)。2)在QUICK-ESTIMATEEQUATION項(xiàng),在對話框中輸入:QMG

C

MOBPMG

AR(1)AR(2)后得如下結(jié)果:DW=2.030970k=2T=38dL=1.37dU=1.594-dU=2.41,dU<DW<4-dU,無自相關(guān)。,(2)重新定義模型將因變量和自變量重新定義為各變量的年度增長率:DQMGDMOBDPMG,然后建立如下模型,參數(shù)估計(jì)如下,DW=1.475915,dL=1.36dU=1.59,不能確定是否相關(guān)。LM檢驗(yàn)View/ResidualTests/correlogram-Q-statistics殘差無序列相關(guān)。六、異方差1、異方差的診斷(1)圖示檢驗(yàn)法以某一變量(通常取自變量或因變量的預(yù)測值)作為橫坐標(biāo),以模型的殘差e作為縱坐標(biāo),根據(jù)做出的散點(diǎn)圖直觀的判斷是否存在相關(guān)性。如果存在相關(guān)性,則存在異方差性。

殘差分布圖隨著自變量MOB、取值得增大,殘差e的波動幅度也逐漸增大,這是異方差的典型特征。(2)懷特(White)檢驗(yàn)Eviews操作:View/ResidualTests/HeteroskedasticityTests異方差其他檢驗(yàn):格力瑟爾檢驗(yàn)(Glejser-test)、哈維檢驗(yàn)(Harvey-test)、布羅什-帕甘-古德弗雷檢驗(yàn)(Breush-Pagan-Godfrey-test(BPG))收尾概率小于顯著水平,存在異方差2、異方差性的處理(1)加權(quán)最小二乘法方差擴(kuò)大的趨勢與GNP有關(guān),可用如下函數(shù)定義權(quán)數(shù):W=GNP^m,m分別取-2,-1.5,-1,-0.5,0,0.5,1,1.5,2。建立九個模型。通過R2的比較,找到表現(xiàn)最好的模型作為選中的模型。加權(quán)最小二乘估計(jì)的實(shí)現(xiàn)與普通最小二乘估計(jì)基本相同,只是需要在方程定義對話框中按下Options按鈕,在Options欄中選WeightedLs項(xiàng),并在Weight項(xiàng)中輸入權(quán)數(shù)序列名即可。通過R2的比較,m=-1.5時(shí),模型表現(xiàn)最好最優(yōu)模型(m=-1.5)的參數(shù)估計(jì)結(jié)果WLS建立的模型的哈維檢驗(yàn)結(jié)果(2)異方差和自相關(guān)相容協(xié)方差估計(jì)(適用于異方差的形式未知,不能適用WLS來消除異方差)操作:在普通的建模過程中選方程定義對話框的Options按鈕;在新對話框選擇HeteroskedasticityConsistentCovariances;再從White和Newey-West選擇一種,開始估計(jì)。White和Newey-WestHAC都不改變參數(shù)的點(diǎn)估計(jì),改變的只是估計(jì)標(biāo)準(zhǔn)差??梢詫⑵浣Y(jié)合其他針對異方差或自相關(guān)的方法使用,如可伴隨WLS一起估計(jì)。七

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論