版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2011-2012學(xué)年第二學(xué)期數(shù)據(jù)分析期末論文題 目影響成品鋼材需求量的回歸分析姓 名學(xué) 號(hào)系(院)數(shù)學(xué)系專 業(yè)2012年6月19日題目:影響成品鋼材需求量的回歸分析摘要:隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,科學(xué)技術(shù)的不斷進(jìn)步,統(tǒng)計(jì)方法越來(lái)越成為人們必不 可收的工具盒手段。應(yīng)用回歸分析是其中的一個(gè)重要分支,本著國(guó)家經(jīng)濟(jì)水平的不斷提高, 我們采用回歸分析的方法對(duì)我國(guó)成品鋼材的需求量進(jìn)行分析應(yīng)用。為了使分析的模型具有社 會(huì)實(shí)際意義,我們引用了 19801998年的成品鋼材、原油、生鐵、原煤、發(fā)電量、鐵路 貨運(yùn)量、固定資產(chǎn)投資額、居民消費(fèi)、政府消費(fèi)9個(gè)不同的量來(lái)進(jìn)行回歸分析。通過(guò)建立回 歸模型充分說(shuō)明成品鋼材需
2、求量與其他8個(gè)變量的關(guān)系,以及我國(guó)社會(huì)經(jīng)濟(jì)的實(shí)際發(fā)展情況 和意義。關(guān)鍵子:線性回歸回歸分析社會(huì)經(jīng)濟(jì)回歸模型 成品鋼材 多元回歸國(guó)家經(jīng)濟(jì) 社會(huì)發(fā)展 TOC o 1-5 h z HYPERLINK l bookmark14 o Current Document 第1章題目敘述1 HYPERLINK l bookmark17 o Current Document 第2章問(wèn)題假設(shè)1 HYPERLINK l bookmark20 o Current Document 第3章問(wèn)題分析2 HYPERLINK l bookmark35 o Current Document 第4章 數(shù)據(jù)的預(yù)處理34.1曲線統(tǒng)計(jì)
3、圖3 HYPERLINK l bookmark38 o Current Document 4.2散點(diǎn)統(tǒng)計(jì)圖4 HYPERLINK l bookmark41 o Current Document 4.3樣本的相關(guān)系數(shù)4 HYPERLINK l bookmark44 o Current Document 第5章回歸模型的建立5第6章 回歸模型的檢驗(yàn)6F檢驗(yàn)6 HYPERLINK l bookmark55 o Current Document T檢驗(yàn)6T檢驗(yàn)分析6 HYPERLINK l bookmark62 o Current Document Chow 斷點(diǎn)檢驗(yàn)8 HYPERLINK l boo
4、kmark66 o Current Document Chow 預(yù)測(cè)檢驗(yàn)8第7章違背模型基本假設(shè)的情況97.1異方差性的檢驗(yàn)97.1.1殘差圖示檢驗(yàn)97.1.2 懷特(White)檢驗(yàn)9 HYPERLINK l bookmark74 o Current Document 7.2自相關(guān)性的檢驗(yàn)10LM 檢驗(yàn)10DW 檢驗(yàn)10第8章 自變量選擇與逐步回歸108.1前進(jìn)逐步回歸法108.1.1前進(jìn)逐步回歸108.1.2前進(jìn)逐步回歸模型預(yù)測(cè)11 HYPERLINK l bookmark84 o Current Document 8.2后退逐步回歸法128.2.1后退逐步回歸128.2.2后退逐步回歸模
5、型預(yù)測(cè)13 HYPERLINK l bookmark90 o Current Document 第9章 多重共線性的診斷及消除14 HYPERLINK l bookmark93 o Current Document 9.1多重共線性的診斷149.2消除多重共線性15 HYPERLINK l bookmark105 o Current Document 第10章 回歸模型總結(jié)17 HYPERLINK l bookmark108 o Current Document 參考文獻(xiàn)18附錄:19影響成品鋼材需求量的回歸分析第1章題目敘述理論上認(rèn)為影響成品鋼材的需求量的因素主要有經(jīng)濟(jì)發(fā)展水平、收入水平、產(chǎn)
6、業(yè)發(fā)展、 人民生活水平提高、能源轉(zhuǎn)換技術(shù)等因素。為此,收集了我國(guó)成品鋼材的需求量,選擇與其 相關(guān)的八個(gè)因素:原油產(chǎn)量、生鐵產(chǎn)量、原煤產(chǎn)量、發(fā)電量、鐵路貨運(yùn)量、固定資產(chǎn)投資額、 居民消費(fèi)、政府消費(fèi)作為影響變量,19801998年的有關(guān)數(shù)據(jù)如下表。本題旨在通過(guò)建 立這些經(jīng)濟(jì)變量的線性模型來(lái)說(shuō)明影響成品鋼材需求量的原因。數(shù)據(jù)來(lái)源:易丹輝.數(shù)據(jù)分析與EViews應(yīng)用.中國(guó)人民大學(xué)出版社.2008(教材第85頁(yè))。 原始數(shù)據(jù)(中國(guó)統(tǒng)計(jì)年鑒):年份成品鋼材(萬(wàn)噸)原油(萬(wàn) 噸)生鐵(萬(wàn) 噸)原煤(億 噸)發(fā)電量(億千瓦時(shí))鐵路貨 運(yùn)量(萬(wàn) 噸)固定資 產(chǎn)投資 額(億 元)居民消 費(fèi)(億 元)1980271
7、6.2105953802.46.23006.2111279910.92317.119812670.1101223416.66.23092.71076739612604.1198229021021235516.6632771134951230.42867.9198330721060737387.1535141187841430.13182.51984337211461.340017.8937701240741832.93674.51985369312489.543848.7241071307092543.245891986405813068.850648.9444951356353120.651
8、75198743561341455039.2849731406533791.75961.21988468913704.657049.854521449484753.87633.11989485913764.1582010.5458481514894410.48523.51990515313830.6623810.8621215068145179113.21991563814009.2676510.8767751528935594.510315.91992669714209.7758911.1675391576278080.112459.81993771614523.7873911.518395
9、16266313072.315682.41994848214608.2974112.4928116309317042.120809.819958979.815004.9410529.2713.6110070.316588520019.326944.519969338.0215733.3910722.513.9710813.11688032297432152.319979978.9316074.1411511.4113.7311355.5316973422913.534854.6說(shuō)明:由于數(shù)據(jù)是經(jīng)過(guò)人工錄入的,經(jīng)反復(fù)對(duì)照沒(méi)有發(fā)現(xiàn)錯(cuò)誤,因此就采用了此數(shù)據(jù)做 回歸模型。但是也不能排除在錄入過(guò)程中會(huì)出
10、現(xiàn)一些小的錯(cuò)誤,所以回歸模型僅滿足上表數(shù) 據(jù)。第2章問(wèn)題假設(shè)為了問(wèn)題的簡(jiǎn)潔明了,現(xiàn)對(duì)題目中的變量給出以下假設(shè):中國(guó)成品鋼材的需求量為y(萬(wàn)噸)、原油產(chǎn)量尤(萬(wàn)噸)、生鐵產(chǎn)量尤(萬(wàn)噸)、原煤產(chǎn)量x (億噸)、發(fā)電量x (億 1234 TOC o 1-5 h z 千瓦時(shí))、鐵路貨運(yùn)量尤(萬(wàn)噸)、固定資產(chǎn)投資額X (億元)、居民消費(fèi)X (億元)、政府 567消費(fèi)X8 (億元)作為影響變量,而且本題收集的數(shù)據(jù)均為定量變量,其符號(hào)和經(jīng)濟(jì)意義如卜表:變量符號(hào)代表意義中國(guó)成品鋼材的需求量為(萬(wàn)噸)y成品鋼材需求總量原油產(chǎn)量(萬(wàn)噸)X1原油工業(yè)發(fā)展水平生鐵產(chǎn)量(萬(wàn)噸)X2生鐵工業(yè)發(fā)展水平原煤產(chǎn)量(億噸)X3原
11、煤工業(yè)發(fā)展水平發(fā)電量(億千瓦時(shí))X4發(fā)電技術(shù)水平鐵路貨運(yùn)量(萬(wàn)噸)X5運(yùn)輸產(chǎn)業(yè)水平固定資產(chǎn)投資額(億元)X6固定資產(chǎn)支出水平居民消費(fèi)(億元)X7居民支出水平政府消費(fèi)(億元)X8政府支出水平 TOC o 1-5 h z 第3章問(wèn)題分析在上述問(wèn)題中,中國(guó)成品鋼材的需求量y (萬(wàn)噸)的影響因素不只是原油產(chǎn)量X1 (萬(wàn)噸),還有生鐵產(chǎn)量x (萬(wàn)噸)、原煤產(chǎn)量X (億噸)、發(fā)電量X (億千瓦時(shí))、鐵路貨運(yùn)量 234X (萬(wàn)噸)、固定資產(chǎn)投資額X (億元)、居民消費(fèi)X (億元)、政府消費(fèi)X (億元)等, 5678這樣因變量y就與多個(gè)自變量X , X , X , X , X , X , X , X有關(guān)。因此
12、,我們就可以采用多元12345678線性回歸進(jìn)行問(wèn)題的分析。多元線性回歸模型的基本形式:設(shè)隨機(jī)變量y與一般變量x ,x,,x的理論線性回歸 12p模型為:y P + P X + P X + + P X + 801 12 2p p其中,P ,P,P是p +1個(gè)未知參數(shù),以稱為回歸常數(shù),P ,P,p稱為回歸系數(shù)。 01p001py稱為被解釋變量(因變量),而x1,x2,xp是p個(gè)可以精確測(cè)量并可控制的一般變量,稱為解釋變量(自變量)。8是隨機(jī)誤差,與一元線性回歸一樣,對(duì)隨機(jī)誤差項(xiàng)我們常假定E(8) = 0var(8) =。2E(y) = g +g x + g x + +g x + 801 12 2
13、p p為理論回歸方程。第4章數(shù)據(jù)的預(yù)處理24678年到1986年的增長(zhǎng)速度都相對(duì)平穩(wěn)沒(méi)有明顯的增勢(shì);從1986年到1993年,個(gè)變量開(kāi)始緩慢增長(zhǎng);從1993年到1998年,增長(zhǎng)的幅度開(kāi)始加大了。氣,七的曲線近似為一條水平的直 線,這兩個(gè)變量分別表示原油和原煤的量,可能受到資源和政策的限制,因而增長(zhǎng)的速度非 常緩慢。從圖中可以明顯看到隨著年限的增加,我國(guó)的各種產(chǎn)業(yè)和支出水平都隨之逐漸增長(zhǎng)。4.2散點(diǎn)統(tǒng)計(jì)圖200,000160,000X1120,00080,000X2X3 + X4X5 + X6 -X7 口 X8Y40,00001,975電蕓吉二宿 T 裕宿點(diǎn)1,9851,9800 Q 口 旱古
14、哭1,9901,9952,000分析:從散點(diǎn)統(tǒng)計(jì)圖上我們可以細(xì)致的來(lái)看,變量 (鐵路運(yùn)貨量)的變化最為明顯, 還可以清楚的看到1981年,1991年,1998年,因?yàn)橐恍┨厥馐录鴮?dǎo)致的鐵路運(yùn)輸量降低。X ,x ,x ,x ,x與y在1980年到1986年的增長(zhǎng)速度都相對(duì)平穩(wěn)沒(méi)有明顯的增勢(shì),從1986 24678年到1993年,個(gè)變量開(kāi)始緩慢增長(zhǎng);從1993年到1998年,增長(zhǎng)的幅度開(kāi)始加大了。但是x1(原油)與x3 (原煤)的產(chǎn)量卻始終保持相對(duì)平穩(wěn)的增長(zhǎng)趨勢(shì),而卻增長(zhǎng)速度非常的緩慢, 這可能是受到了資源的限制和國(guó)家政策的影響。從散點(diǎn)圖中可以很明顯的看到各年的真是數(shù) 據(jù),還可以看出隨著年限的增
15、加,我國(guó)的各種產(chǎn)業(yè)和支出水平都隨之逐漸增長(zhǎng)。4.3樣本的相關(guān)系數(shù)CorrelationYX1X2X3*X5X6Y1.080000d.9164970.9981250.93825Q0.9971770.9023110.979158X10.916971.0300000 9215320.96771 S。物570.974785O.04M62X2D.938125)9216321.0000000.9445420.9972170.9071050.9733S1X30.938250:.9677180.9445421.0000000 9540410 9825350.姍 53X40.997-77&9286570.597
16、2-170.9540411.&0C0000 9176S70.973374X50.92311&S74TS50.9071050.9S25350.5176871.DDOOOD0.3W47JX6D.9TO15e0.S474520.5735810.SS62510 5733740E194731.000000X7Q.9721B3D.S53985D.S72N7叩822350.9715490.&117270J99122DX80.9S2Q710.8552710.9S01640.88335(0,9730730.S198850J994M0分析:從樣本的相關(guān)系數(shù)表來(lái)看,各變量的相關(guān)系數(shù)都在0.9以上,說(shuō)明自變量與因變
17、量J有高度的線性相關(guān)性,適合做J與8個(gè)自變量的多元線性回歸。(說(shuō)明:本表格是由 EViews軟件計(jì)算得出,但由于不能導(dǎo)出,所以通過(guò)保存成圖片后經(jīng)WPS截圖工具截得。)第5章回歸模型的建立將原始數(shù)據(jù)導(dǎo)入到Eviews6.0(破解版)的數(shù)據(jù)框中,然后用Eviews軟件做線性回歸分 析如下:在Eviews主窗口菜單單擊Quick/Estimate Equation,彈出方程估計(jì)窗口,再在彈出的窗 口清單內(nèi)填入以下回歸方程的書(shū)寫形式。整形式:y=c(1)+c(2)*x1+c(3)*x2+c(4)*x3+c(5)*x4+c(6)*x5+c(7)*x6+c(8)*x7+c(9)*x8 簡(jiǎn)化形式:y c x
18、1 x2 x3 x4 x5 x6 x7 x8這里我們采用簡(jiǎn)化形式執(zhí)行后得到輸出結(jié)果為:VariableCoefficientStd. Errort-StatisticProb.C-381.4846912.1465-0.4182270.6846X10.1218180.1074241.1339930.2833X20.1248840.1870620.6676070.5195X3-149.1537121.3537-1.2290830.2472X40.6533660.2769372.3592600.0400X50.0030580.0233490.1309590.8984X60.0813780.04212
19、41.9318700.0822X7-0.1201280.046747-2.5697230.0279X80.3939660.2394131.6455520.1309R-squared0.999009Mean dependent var5742.518Adjusted R-squared0.998215S.D. dependent var2679.609S.E. of regression113.1993Akaikeinfo criterion12.60169Sum squared resid128140.8Schwarzcriterion13.04906Log likelihood-110.71
20、61Hannan-Quinn criter.12.67740F-statistic1259.526Durbin-Watson stat2.245475Prob(F-statistic)0.000000分析:從模型匯總表中可以看出,決定系數(shù)R2 = 0.999009,由決定系數(shù)看回歸模型 高度顯著。又由F = 1259.526,P值=0.000000,回歸模型通過(guò)7F檢驗(yàn),表明8個(gè)自變量 整體對(duì)因變量y產(chǎn)生顯著線性影響的判斷所犯錯(cuò)誤的概率僅為0.000000。說(shuō)明 X ,x ,x ,x ,x ,x ,x ,x整體上對(duì)y有高度顯著的線性影響。12345678表中第二列是我們的回歸方程參數(shù)估計(jì)值,由
21、此可以得到y(tǒng)對(duì)8個(gè)自變量的線性回歸方程為:y = 381.4846 + 0.121818氣 + 0.124884七-149.1537% + 0.653366七+ 0.003058% + 0.081378七0.120128x7 + 0.393966x8從回歸方程中可以看到,x、x、x、x、x、x對(duì)成品鋼材需求量起正影響,x、x12456837對(duì)成品鋼材需求量起負(fù)影響。從實(shí)際社會(huì)生活來(lái)看,原煤生產(chǎn)水平和居民的消費(fèi)水平提高, 都會(huì)促進(jìn)成品鋼材的需求量,應(yīng)該和成品鋼材的需求量成正相關(guān),這與定性分析的結(jié)果不一 致。為此,我們對(duì)它進(jìn)行更深層次的分析。第6章回歸模型的檢驗(yàn)6.1 F檢驗(yàn)F-statistic
22、1259.526Prob(F-statistic)0.000000分析:從表中結(jié)果可以看出,Prob(F-statistic)即相伴概率P值,由F = 1259.526,P 值=0.0000000.05,可知此回歸方程拒絕零假設(shè),即做出8個(gè)自變量整體對(duì)因變量y產(chǎn)生顯 著線性影響的判斷所犯錯(cuò)誤的概率僅為0.000000,回歸方程通過(guò)了 F檢驗(yàn)。6.2 T檢驗(yàn)Variablet-StatisticProb.C-0.4182270.6846X11.1339930.2833X20.6676070.5195X3-1.2290830.2472X42.3592600.0400X50.1309590.8984
23、X61.9318700.0822X7-2.5697230.0279X81.6455520.1309分析:通過(guò)看上面的T檢驗(yàn)表可以發(fā)現(xiàn),在顯著性水平a = 0.05時(shí),只有x4,x7,的Prob (收尾概率)小于0.05,通過(guò)了顯著性檢驗(yàn)。T檢驗(yàn)分析為了盡可能的保留合理變量,我們就針對(duì)逐個(gè)變量給以T檢驗(yàn)分析,逐步剔除不合理的 變量,使回歸模型更完善。因此我們首先剔除Prob最大的變量x5,再做回歸分析的T檢驗(yàn) 如下:VariableCoefficientStd. Errort-StatisticProb.C-274.5262387.5811-0.7083070.4935X10.1326010.0
24、658382.0140550.0691X20.1205290.1756660.6861250.5068X3-137.533579.00025-1.7409250.1096X40.6775700.1968143.4426930.0055X60.0823610.0395552.0822050.0615X7-0.1235670.036909-3.3479080.0065X80.3877850.2239831.7313140.1113分析:剔除X后,在顯著性水平a = 0.05時(shí),有X ,X ,X ,的Prob (收尾概率)小于 51470.05,通過(guò)了顯著性檢驗(yàn)。此時(shí)我們發(fā)現(xiàn),剔除了X5后,通過(guò)T檢
25、驗(yàn)的變量增多了,這是一個(gè)很好的結(jié)果。因此我們?cè)偬蕹齈rob最大的變量x2,再做回歸分析的T檢驗(yàn)如下:VariableCoefficientStd. Errort-StatisticProb.C-279.1420378.8809-0.7367540.4754X10.1539610.0567192.7144740.0188X3-151.034474.80430-2.0190610.0664X40.7722020.1372735.6253070.0001X60.0995120.0299723.3202070.0061X7-0.1345920.032486-4.1430960.0014X80.4029
26、940.2179131.8493320.0892分析:剔除X ,X后,在顯著性水平a = 0.05時(shí),有X ,X ,X ,X ,的Prob(收尾概率) 521467小于0.05,通過(guò)了顯著性檢驗(yàn)。此時(shí)我們發(fā)現(xiàn),剔除叫,X2后,通過(guò)T檢驗(yàn)的變量又增多個(gè)。因此我們?cè)偬蕹齈rob最大的變量X8,再做回歸分析的T檢驗(yàn)如下:VariableCoefficientStd. Errort-StatisticProb.C-108.8183400.2650-0.2718660.7900X10.1495260.0617182.4227510.0307X3-248.800057.63980-4.3164630.00
27、08X40.9775440.08790711.120200.0000X60.1267900.0284164.4620050.0006X7-0.0840690.019143-4.3914990.0007R-squared0.998669Meandependent var5742.518Adjusted R-squared0.998157S.D.7dependent var2679.609S.E. of regression115.0260Akaike info criterion12.58028Log likelihood-113.5127Hannan-Quinn criter.12.63076
28、F-statistic1951.080Durbin-Watson stat1.886506Prob(F-statistic)0.000000分析:剔除x5, x2,x后,在顯著性水平a8=0.05時(shí),剩余變量x , x , x ,134x6, x7,的 Prob(收尾概率)都小于0.05,全部通過(guò)了顯著性T檢驗(yàn)。以x , x , x , x , x,做回歸分析的輸 13467出表來(lái)看,決定系數(shù)R2 = 0.998669,由決定系數(shù)看回歸模型仍然具有高度的顯著性。又 由F = 1951.080, P值=0.000000,回歸模型通過(guò)7F檢驗(yàn),表明8個(gè)自變量整體對(duì)因變量 y產(chǎn)生顯著線性影響的判斷所
29、犯錯(cuò)誤的概率僅為0.000000。說(shuō)明x, x , x , x , x ,整體上對(duì)y13467有高度顯著的線性影響。表中第二列是我們的回歸方程參數(shù)估計(jì)值,由此可以得到y(tǒng)對(duì)5個(gè)自變量的線性回歸方 程為:y = 108.8183 + 0.149526x - 248.8000 x + 0.977544x + 0.126790 x -0.084069x13467從回歸方程中可以看到,x ,x ,x對(duì)成品鋼材需求量起正影響,x ,x對(duì)成品鋼材需求 14637量起負(fù)影響。此時(shí)回歸方程雖然通過(guò)7F,T檢驗(yàn),但是增加了不合理變量x3, x7所占回歸方 程的比重,這也是不合社會(huì)實(shí)際的。Chow斷點(diǎn)檢驗(yàn)該檢驗(yàn)的思
30、想是對(duì)每個(gè)子樣本單獨(dú)擬合方程來(lái)觀察估計(jì)方程是否有顯著差異。零假設(shè)是 兩個(gè)子樣本擬合的方程無(wú)顯著差異。Chow Breakpoint Test: 1990Equation Sample: 1980 1998F-statistic7992.972Prob.F(9,1)0.0087Log likelihood ratio212.4876Prob.Chi-Square(9)0.0000Wald Statistic71936.75Prob.Chi-Square(9)0.0000分析:從檢驗(yàn)表中可以看出,由于,檢驗(yàn)量的收尾概率分別是0.0087, 0.0000,0.0000 ,所以回歸模型接受原假設(shè),說(shuō)明
31、模型參數(shù)有超樣本特性,回歸方程沒(méi)有顯著差異,回歸模 型具有穩(wěn)定性。Chow預(yù)測(cè)檢驗(yàn)該檢驗(yàn)的思想,Chow預(yù)測(cè)檢驗(yàn)先對(duì)包含前T個(gè)觀測(cè)值的子樣本建立模型,然后用這個(gè) 1模型對(duì)后T個(gè)觀測(cè)值的自變量進(jìn)行預(yù)測(cè),若實(shí)際值與預(yù)測(cè)值有很大變動(dòng),就可以懷疑這兩 2個(gè)子樣本估計(jì)關(guān)系的穩(wěn)定性。Chow Forecast Test: Forecast from 1990 to 1998F-statistic7992.972 Prob. F(9,1)0.0087Log likelihood ratio 212.4876 Prob. Chi-Square(9)0.0000分析:從Chow預(yù)測(cè)檢驗(yàn)表中可以看出,檢驗(yàn)量的收尾
32、概率分別為0.0087,0.0000,說(shuō)明回歸模型的預(yù)測(cè)值和實(shí)際值沒(méi)有很大的波動(dòng),所以就可以認(rèn)為回歸模型是穩(wěn)定的。第7章違背模型基本假設(shè)的情況7.1異方差性的檢驗(yàn)7.1.1殘差圖示檢驗(yàn)我們分別以回歸標(biāo)準(zhǔn)化殘差和因變量y來(lái)繪制殘差圖分析模型是否存在異方差。150 q TOC o 1-5 h z 100 -=50 -口D 0 -* o-50 -。*-100 -o-150 -I11111,9751,9801,9851,9901,9952,000分析:從殘差的散點(diǎn)圖上我們可以看出,回歸的標(biāo)準(zhǔn)化殘差隨因變量y的表變化并沒(méi)有 明顯的規(guī)律性分布,殘差圖上的點(diǎn)都是隨機(jī)散布的,無(wú)任何規(guī)律,因此我們可以初步判定回
33、 歸模型不存在異方差。7.1.2懷特(White)檢驗(yàn)懷特檢驗(yàn),是把。2作為因變量,原先的自變量和自變量的平方項(xiàng)作為新自變量建立線 性回歸模型,通過(guò)這個(gè)模型的擬合情況來(lái)檢驗(yàn)是否有異方差性,檢驗(yàn)的零假設(shè)是殘差不存在 異方差性。懷特檢驗(yàn)的統(tǒng)計(jì)量是LM = nx R2,n是樣本觀測(cè)量,R 2是輔助回歸的擬合優(yōu) 度。本題的懷特檢驗(yàn)如下:Heteroskedasticity Test: WhiteF-statistic1.958884Prob. F(8,10)0.1579Obs*R-squared11.59867Prob.Chi-Square(8)0.1700Scaled explained SS 1.
34、445422Prob.Chi-Square(8) 0.9936分析:上表中Obs*R-squared即為L(zhǎng)M = nxR2,檢驗(yàn)結(jié)果中由于收尾概率遠(yuǎn)大于顯著 性水平0.1,0.05或0.01,接收原假設(shè),殘差不存在異方差。7.2自相關(guān)性的檢驗(yàn)7.2.1 LM檢驗(yàn)LM檢驗(yàn)是根據(jù)決定系數(shù)R 2和F檢驗(yàn)值的收尾概率大小來(lái)判斷是否存在自相關(guān)性。原假設(shè):殘差不存在從一階到p階的自相關(guān)。檢驗(yàn)統(tǒng)計(jì)量為L(zhǎng)M = nxR2。Breusch-Godfrey Serial Correlation LM Test:F-statistic3.174716Prob. F(2,8)0.0966Obs*R-squared8.
35、407246Prob.Chi-Square(2)0.0149分析:從LM檢驗(yàn)表的收尾概率來(lái)看,prob (收尾概率)都大于0.01,F(xiàn)檢驗(yàn)的收尾概率 大于0.05,但是都小于0.1,。由此來(lái)看檢驗(yàn)?zāi)P痛嬖谧韵嚓P(guān)。7.2.2 DW 檢驗(yàn)對(duì)于自相關(guān)性我們用DW檢驗(yàn)來(lái)判斷,已知回歸估計(jì)式的殘差et來(lái)定義DW統(tǒng)計(jì)量,假設(shè)有H 0: P = 0,通過(guò)化簡(jiǎn)后DW值與。的關(guān)系式為DW牝2(1 -p ),在Eviews中運(yùn)行結(jié)果如下 表(只選取了??傻慕y(tǒng)計(jì)值):Durbin-Watson stat2.245475分析:從表中的數(shù)據(jù)我們可以看到,DW * 2(1-d) =2.245475,因而可以近似的計(jì)算出d
36、 =-0.1227375,通過(guò)查表可以判斷出誤差項(xiàng)的自相關(guān)性成輕微的負(fù)自相關(guān)(由于自相 關(guān)性不是很明顯,所以在這里就不做自相關(guān)性的消除)。第8章自變量選擇與逐步回歸8.1前進(jìn)逐步回歸法8.1.1前進(jìn)逐步回歸取顯著性水平a 叫二0.10, a心胴=0.15進(jìn)行逐步回歸檢驗(yàn)選變量。VariableCoefficientStd. Error t-StatisticProb.*C196.0980259.59320.7554050.4617X20.4999330.1595893.1326320.0068X40.5035810.1709542.9457050.0100X3-110.542945.39905
37、-2.4349170.0279R-squared0.997746Mean dependent var5742.518Adjusted R-squared0.997296S.D. dependent var2679.609S.E. of regression139.3449Akaike info criterion12.89644Sum squared resid291254.9Schwarz criterion13.09527Log likelihood-118.5162Hannan-Quinn criter.12.93009F-statistic2213.770Durbin-Watson s
38、tat1.041553Prob(F-statistic)0.000000Selection SummaryAdded X2Added X4Added X3分析:從逐步回歸模型的匯總表中我們可以看出,逐步回歸最終選取的變量為x2,x4,x3,逐步回歸后模型決定系數(shù)R2 = 0.997746。逐步回歸后的模型保持著回歸方程高 度的顯著性。從表中我們可以看到,F(xiàn)的檢驗(yàn)值為2213.770,P值始終是0.000000不變, 由此可見(jiàn)模型犯錯(cuò)的概率始終為0.000000不變,故逐步回歸后的回歸方程同樣具有高度的 顯著性。從上述表中結(jié)果可以看到逐步回歸后的回歸方程為y = 196.0980 + 0.499
39、933x -110.5429x + 0.503529x234由回歸方程可以看出,X2生鐵的產(chǎn)量和X4發(fā)電量的系數(shù)都是正數(shù),對(duì)因變量y起正相 關(guān)作用,X3原煤量的系數(shù)為負(fù)值,對(duì)因變量y起負(fù)相關(guān)作用,而卻從數(shù)值上看是-11.0543, 對(duì)y的影響很大,這與實(shí)際情況不符,這可能是因變量x3與x4之間有較強(qiáng)的相關(guān)性。同時(shí) 從表中還可以看出,用逐步回歸法的選元過(guò)程為第一步引入x2,第二步引入x4,第三步引 入x3再形成一個(gè)符合要求的線性回歸方程。8.1.2前進(jìn)逐步回歸模型預(yù)測(cè)Forecast: YFActual: YForecast sample: 1980 1998Included observati
40、ons: 19Root Mean Squared Ert(23.8112 Mean Absolute Error 107.1899 Mean Abs. Percent Err2r218047 Theil Inequality CoefficGh0D9816Bias Proportion 0.00000Variance Proportion0.000564Covariance Proporti0u999436分析:如圖所示是前進(jìn)逐步回歸的模型預(yù)測(cè),左邊是預(yù)測(cè)圖,兩條細(xì)線表示預(yù)測(cè)值的兩 倍標(biāo)準(zhǔn)誤差帶,右邊是有關(guān)預(yù)測(cè)的一些評(píng)價(jià)指標(biāo)。從他的誤差帶我們可以看出回歸模型較為 精確,誤差帶緊隨實(shí)際曲線變動(dòng),
41、再?gòu)挠疫叺腗APE值為2.218047可以判定模型的預(yù)測(cè)精度 較高。8.2后退逐步回歸法8.2.1后退逐步回歸取顯著性水平aentryremoval=0.10進(jìn)行逐步回歸檢驗(yàn)選變量。VariableCoefficientStd. Errort-StatisticProb.*C-279.1420378.8809-0.7367540.4754X10.1539610.0567192.7144740.0188X40.7722020.1372735.6253070.0001X3-151.034474.80430-2.0190610.0664X7-0.1345920.032486-4.1430960.00
42、14X80.4029940.2179131.8493320.0892X60.0995120.0299723.3202070.0061R-squared0.998964Meandependent var5742.518Adjusted R-squared0.998447S.D.dependent var2679.609S.E. of regression105.6149Akaike info criterion12.43479Sum squared resid133854.0Schwarz criterion12.78274Log likelihood-111.1305Hannan-Quinn
43、criter.12.49367F-statistic1929.141Durbin-Watson stat2.584581Prob(F-statistic)0.000000Selection SummaryRemoved X5Removed X2分析:采用后退逐步回歸法最后選擇的變量有七,七,從后退逐步回歸后模型決定系數(shù)R2 = 0.998964,調(diào)整決定系數(shù)R2 = 0.998447,可知模型仍然具有高度的顯著性。表中F 的檢驗(yàn)值為1929.141,P值始終為0.000000不變,由此可見(jiàn)模型犯錯(cuò)的概率始終為0.000000 不變。綜合考慮后退逐步回歸得到的模型比前進(jìn)逐步回歸得到的模型要好一些
44、。對(duì)變量 %,七與因變量y做線性回歸得:VariableCoefficientStd. Errort-StatisticProb.C-278.8229476.6925-0.5849120.5668X20.9369830.03335228.093350.0000X5-0.0022580.004663-0.4842950.6347由此我們可以寫出關(guān)于,七的線性回歸方程為:y = -278.8229 + 0.936983% - 0.002258%從回歸的最終模型來(lái)看,此回歸方程剔除了一些變量后反而變得更加顯著,并且更有實(shí) 際的社會(huì)意義,它消除了不合理的變量X3和X7。在回歸方程中又新出現(xiàn)了負(fù)變量X5
45、 (鐵路 運(yùn)貨量),雖然也是不合實(shí)際的,但是它占回歸方程的比重很小因此可以不做處理。8.2.2后退逐步回歸模型預(yù)測(cè)YF 士 2 S.E.Forecast: YFActual: YForecast sample: 1980 1998Included observations: 19Root Mean Squared Erro83.93419 Mean Absolute Error 67.52228 Mean Abs. Percent Error1.320141 Theil Inequality Coefficier0L006654Bias Proportion 0.000000 Variance
46、 Proportion 0.000259 Covariance Proportior0.999741分析:如圖所示是后退逐步回歸的模型預(yù)測(cè),左邊是預(yù)測(cè)圖,兩條細(xì)線表示預(yù)測(cè)值的 兩倍標(biāo)準(zhǔn)誤差帶,右邊是有關(guān)預(yù)測(cè)的一些評(píng)價(jià)指標(biāo)。從他的誤差帶我們可以看出回歸模型同 樣較為精確,誤差帶緊隨實(shí)際曲線變動(dòng),而卻緊隨的效果要比前進(jìn)回歸模型的要好,貼近實(shí) 際曲線的效果也前進(jìn)逐步回歸模型的好,再?gòu)挠疫叺脑u(píng)價(jià)指標(biāo)RMSE值為83.93419, MAE值 為67.52228, MAPE值為1.320141,都比前進(jìn)逐步回歸模型的數(shù)值小,從而可以判定模型的 預(yù)測(cè)能力比前進(jìn)逐步回歸模型的預(yù)測(cè)好,精度高。第9章多重共線性的
47、診斷及消除9.1多重共線性的診斷由于Eviews軟件無(wú)法對(duì)模型多重共線作出診斷,因此這里我們就用spss19.0軟件對(duì)模 型做共線性診斷,關(guān)鍵的輸出結(jié)果見(jiàn)下表(限于篇幅就對(duì)表格做出調(diào)整,只輸出關(guān)鍵的結(jié)果)。模型常量X1X2X3X4X5X6X7X8VIF61.091413.326133.044947.996329.438182.413416.185701.38 0分析:從表中的輸出結(jié)果可以看出,XX ,X ,X ,X的方差擴(kuò)大因子VIF都很大,遠(yuǎn)遠(yuǎn)2, 4578的超過(guò)了 10,說(shuō)明成品鋼材需求量的回歸方程存在著嚴(yán)重的多重共線性。又因?yàn)閄 ,XX ,X ,X ,X ,X ,X的方差擴(kuò)大因子都是大于
48、10的,說(shuō)明回歸方程的多重共線性就是 12, 345678由自變量間的多重共線性引起的。共線性診斷a模型維數(shù)特征值條件索 引方差比例(常量)x1x2x3x4x5x6x7x8118.3211.000.00.00.00.00.00.00.00.00.002.6593.553.00.00.00.00.00.00.00.00.003.01127.458.04.00.00.01.00.00.00.01.004.00443.444.01.00.00.00.00.00.31.08.005.00357.552.00.00.02.04.01.00.11.06.056.001106.541.12.26.02.08
49、.02.00.05.00.027.000157.928.05.07.30.05.02.00.03.50.698.000213.430.01.02.53.39.36.03.41.01.1894.043E-5453.668.78.65.11.43.60.97.09.35.05a.因變量:y分析:從條件數(shù)可以看到,最大的條件數(shù)k9 453.668,說(shuō)明自變量間存在嚴(yán)重的多 重共線性,這一判斷與上面的方差擴(kuò)大因子法判斷結(jié)果一致。表中的方差比例是按從小到大 的順序排列的,不是按自變量順序排列的,這與方差擴(kuò)大因子不同。在維數(shù)為9的時(shí)候,我們可以看到X ,X ,X ,X的系數(shù)都很快的增大要接近1,這也可以說(shuō)
50、明X ,X ,X ,X之間存在 12561256較強(qiáng)的多重共線性。9.2消除多重共線性在前面多重共線性的診斷中我們看到X4的方差擴(kuò)大因子VIF4 = 947.996為最大,因此剔除x,建立y與x ,x x ,x ,x ,x ,x的回歸方程。關(guān)鍵的輸出結(jié)果見(jiàn)下表(限于篇幅就 TOC o 1-5 h z 12, 35678對(duì)表格做出調(diào)整,只輸出關(guān)鍵的結(jié)果)。模型常量X1X2X3X5X6X7X8VIF38.881248.129130.88 0174.51 0133.668372.202525.92 0分析:從剔除了自變量X4的回歸模型中我們可以看到X8的方差擴(kuò)大因子 TOC o 1-5 h z VI
51、F = 525.920為最大,卻遠(yuǎn)大于10,因此再剔除X,建立y與x ,x x ,x ,x ,x的回歸8812, 3567方程。關(guān)鍵的輸出結(jié)果見(jiàn)下表(限于篇幅就對(duì)表格做出調(diào)整,只輸出關(guān)鍵的VIF結(jié)果)。模型常量X1X2X3X5X6X7VIF35.514169.934108.057174.510132.017101.870分析:從剔除了自變量XJ %的回歸系數(shù)表中我們可以看到X5的方差擴(kuò)大因子 TOC o 1-5 h z VIF = 174.510為最大,卻遠(yuǎn)大于10,因此再剔除X,建立y與x ,x x ,x ,x的回歸方512, 367程。相關(guān)輸出結(jié)果如下:模型常量X1X2X3X6X7VIF2
52、3.17893.59023.358124.08464.691 TOC o 1-5 h z 分析:從剔除了自變量X , X , X的回歸系數(shù)表中我們可以看到X的方差擴(kuò)大因子 4856VIF = 124.084為最大,還是遠(yuǎn)大于10,因此再剔除X,建立y與X ,x x ,X的回歸方程。612, 37相關(guān)輸出結(jié)果如下:模型常量X1X2X3X7VIF16.42549.76623.10124.008 TOC o 1-5 h z 分析:從剔除了自變量X , X , X , X的回歸系數(shù)表中我們可以看到X的方差擴(kuò)大因子48562VIF = 49.766為最大,還是大于10,因此再剔除X,建立y與x ,x ,
53、X的回歸方程。相 22137關(guān)輸出結(jié)果如下:模型常量X1X3X7VIF15.74319.2264.511 TOC o 1-5 h z 分析:從剔除了自變量X , X , X , X , X的回歸系數(shù)表中我們可以看到X的方差擴(kuò)大因485623子VIF = 19.226為最大,還是大于10,因此再剔除七,建立y與x ,x的回歸方程。相關(guān)3317輸出結(jié)果如下:模型常量X1X7VIF3.6943.694分析:從剔除了自變量x , x , x , x , x , x的回歸系數(shù)表中我們可以看到,剩下的自變485623量xi,x7的方差擴(kuò)大因子分別為VIF = 3.694,VIF= 3.694,都是小于10
54、的,而卻回歸系 數(shù)也都有合理的社會(huì)經(jīng)濟(jì)解釋,說(shuō)明此回歸模型不存在較強(qiáng)的多重共線性了,可以作為最終 的回歸模型?,F(xiàn)在我們用Eviews軟件建立y與氣,x7的回歸模型:VariableCoefficientStd. Errort-StatisticProb.C-2210.9341272.616-1.7373140.1015X10.4398630.1097244.0088110.0010X70.1611030.0182948.8064060.0000R-squared0.972630Mean dependent var5742.518Adjusted R-squared0.969209S.D. de
55、pendent var2679.609S.E. of regression470.2027Akaike info criterion15.28814Sum squared resid3537450.Schwarz criterion15.43727Log likelihood-142.2374Hannan-Quinn criter.15.31338F-statisticProb(F-statistic)284.29090.000000Durbin-Watson stat0.568156y與, x7的回歸方程為y = -2210.934 + 0.439863x + 0.161103x17由標(biāo)準(zhǔn)化的回歸方程我們可以看到,對(duì)成品鋼材需求量影響較大的事原油產(chǎn)量和居民消 費(fèi),從社會(huì)經(jīng)濟(jì)角度來(lái)考慮,這是貼近人民生活的兩個(gè)量,其中居民消費(fèi)的系數(shù)較大,影響 也就較大。從整體上來(lái)看,消除多重共線性影響后得回歸方程更較為符合社會(huì)實(shí)際。R-squared0.972630Adjusted R-squared0.969209F-statistic284.2909Prob(F-statistic)0.000000分析:從表中輸出結(jié)果可以看出,Prob即顯著性P值,由F = 284.2909,P值=0.000, 可知此
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 甲周疣的臨床護(hù)理
- 產(chǎn)后風(fēng)濕的健康宣教
- 緩慢型心律失常的護(hù)理
- 《設(shè)計(jì)你的人生》課件
- 《單片機(jī)原理及應(yīng)用 》課件-第5章
- 嘴巴里長(zhǎng)泡的臨床護(hù)理
- 闊韌帶妊娠的健康宣教
- 皮脂腺增生的臨床護(hù)理
- JJF(陜) 116-2024 直流數(shù)字功率表校準(zhǔn)規(guī)范
- 比較線段的長(zhǎng)短課件西西模
- 全球及中國(guó)光纖偏振器行業(yè)市場(chǎng)發(fā)展分析及前景趨勢(shì)與投資發(fā)展研究報(bào)告2024-2029版
- 手機(jī)硬件測(cè)試介紹
- 商品總監(jiān)述職報(bào)告
- 述職報(bào)告及工作思路(四篇合集)
- 2023-2024學(xué)年云南省昆明市盤龍區(qū)九年級(jí)上學(xué)期期末物理試卷及答案
- 福建省廈門市2023-2024學(xué)年九年級(jí)上學(xué)期化學(xué)用語(yǔ)教學(xué)質(zhì)量監(jiān)測(cè)試題(無(wú)答案)
- 導(dǎo)醫(yī)接待中的患者滿意度調(diào)查
- 國(guó)開(kāi)電大可編程控制器應(yīng)用實(shí)訓(xùn)形考任務(wù)5
- pmc年終總結(jié)報(bào)告
- 上海話劇藝術(shù)中心崗位設(shè)置實(shí)施方案
- 龔舉成GE戰(zhàn)略變革歷程案例
評(píng)論
0/150
提交評(píng)論