多元回歸分析的步驟知識分享_第1頁
多元回歸分析的步驟知識分享_第2頁
多元回歸分析的步驟知識分享_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、多元回歸分析的步驟三、研究方法本文采取多元線性回歸的方法來設定并建立模型,再利用逐步回歸來對變量予以確認和剔除。逐步回歸是通過篩選,挑選偏回歸平方和貢獻最大的因子 建立回歸方程,在決定是否引入一個新的因素時,回歸方程要用方差比進行顯 著性檢驗。如果判別該影響因子通過顯著性檢驗 ,那么可選入方程中,否則就 不應該進入到回歸方程,回歸方程中剔除一個變量的標準也是用方差比進行顯 著性檢驗 剔除偏回歸平方和貢獻最小的變量,無論是入選回歸方程還是從回歸 方程中剔除 符合條件的選入項和剔除項為止,逐步回歸的方法剔除了對因變量 影響小的因素 減小了分析問題的難度,提高了計算效率和回歸方程的穩(wěn)定性有 較好的預

2、測精度。運用多元線性回歸預測的基本思路是在確定因變量和多個自變量以及它們 之間的關系后,通過設定自變量參數(shù)的回歸方程對因變量進行預測。具體如下:Y = C + aiXi+a2X2+ + a nX n式中:丫表示為糧食總產(chǎn)量,C和a為回歸系數(shù),C、a是待定參數(shù),X為 所選取的影響因素多元線性回歸方法可分為強行進入法、消去法、向前選擇 法、向后剔除法和逐步進入法等,本文運用SPSS22.0軟件,對選擇的自變量全部進入回歸模型,即強行進入法進行預測。該模型的優(yōu)點是方法簡單、預測 速度快、外推性好等。四、分析與結果本文選取6個解釋變量,研究河南省糧食產(chǎn)量y,解釋變量為:X1糧食播種 面積,X2農(nóng)業(yè)從業(yè)

3、人,X3農(nóng)用機械總動力,X4農(nóng)田有效灌溉面積,X5化肥施 用折純量,X6農(nóng)村用電量。以河南省糧食產(chǎn)量為因變量,以如上6個解釋變量 為自變量做多元線性回歸(數(shù)據(jù)選取 2014年河南統(tǒng)計年鑒,見附錄一)。用SPSS做變量的相關分析,從相關矩陣(表 4-1 )中可以看出y與自變量 的相關系數(shù)大多都在0.9以上,說明所選擇變量與y高度線性相關,用y與自 變量做多元線性回歸是合適的。表4-1相關X1X2X3X4X5X6yX11.687.965.918.927.970.978X2.6871.686.456.448.731.616X3.965.6861.946.930.990.985X4.918.456.9

4、461.961.921.960X5.927.448.930.9611.901.965X6.970.731.990.921.9011.979y.978.616.985.960.965.9791用SPSS做變量系數(shù)分析(表 4-2)表4-2系數(shù)B標準錯誤BetaT顯著性(常數(shù))-6733.2683146.969-2.140.041X18.3152.765.2623.007.006X2.155.296.121.524.604X3-.199.105-.607-1.901.068X42.6192.687.169.974.338X55.7702.4921.0472.315.028X61.0865.174.

5、089.210.835從(表4-2)中可以得到解釋變量與因變量之間的方程為:y 6733.268 8.315&0.155 卷0.199x32.619x4577X51.086X6表4-3 變異數(shù)分析平方和df平均值平方F顯著性回歸40712064.12666785344.021165.292.000殘差1149417.6792841050.631估計41861481.80534從(表4-3)中發(fā)現(xiàn)F=165.292,說明6個自變量整體對因變量y產(chǎn)生顯著線性影響。但從表(4-2)中不難發(fā)現(xiàn)農(nóng)業(yè)從業(yè)人員、農(nóng)田有效灌溉面積、農(nóng)村用 電量的P值較大,說明方程某些解釋變量并不顯著,對沒有通過檢驗的

6、回歸系 數(shù),在一定程度上說明他們對應的自變量在方程中可有可無,一般為了使模型簡化,需要剔除不顯著的自變量,重新建立回歸方程。而且糧食播種面積、農(nóng) 業(yè)從業(yè)人員、農(nóng)田有效灌溉面積、化肥施用折純量、農(nóng)村用電量對國民總收入起正影響,農(nóng)用機械總動力卻對國民總收入起負影響,與常識相違背,可能存 在多重共線性。應用SPSS進行異方差性檢驗。用斯皮爾曼相關系數(shù)檢驗異方差性也就是檢驗隨機誤差項的方差與解釋變量觀測值之間的相關性若相關系數(shù)較高,則存在異方差性,則不能通過 異方差性檢驗,此時可能會導致參數(shù) OLS估計的方差增大,t檢驗失效,預測精度降低。表4-4 相關Stan dard Error ofX1X2X3

7、X4X5X6Predicted ValueSpeX11.000.441.439.377.434.439-.090armX2.4411.000.993.952.991.993-.303anX3.439.9931.000.951.9981.000-.277的X4.377.952.9511.000.950.951-.258rhoX5.434.991.998.9501.000.998-.294X6.439.9931.000.951.9981.000-.277Stan dard Errorof Predicted-.090-.303-.277-.258-.294-.2771.000Value從表4-4中

8、發(fā)現(xiàn)殘差絕對值預與解釋變量的皮爾遜相關系數(shù)最高為0.303,不能認為殘差絕對值與解釋變量顯著相關。所以不存在異方差性。應用SPSS進行自相關檢驗。檢驗自相關性就是檢驗針對不同的樣本點與隨 機誤差項之間是否不相關。如果存在某種相關性,貝U認為出現(xiàn)了序列相關性。 若存在自相關性,參數(shù)估計量仍然是線性的、無偏的,但非有效;OLS估計量的被估方差是有偏的且會被低估,因而會使相應的t值變大;甚至模型的t和F統(tǒng)計檢驗失效;導致最小二乘估計量對抽樣波動非常敏感。首先用杜賓和沃特 森檢驗法來判斷其是否存在自相關性。表4-5模型摘要RR平方調整后R平方標準偏斜度錯誤Durbi n-Wats on.986a.97

9、3.967202.609551.616由表4-5得到DW檢驗為1.616。查表可知在1%勺上下界中k=6, n=36的 dl=0.99,du=1.59,可知du<DW<4-du該模型不存在一階自相關性。從上述已知數(shù)據(jù)不存在異方差性和一階自相關性,用SPSS進行多重共線性檢驗。若存在多重共線性,將會引起參數(shù)估計量不存在;近似共線性下OLS估計量非有效;參數(shù)估計量經(jīng)濟含義不合理;變量的顯著性檢驗失去意義,可能 將重要的解釋變量排除在模型之外;模型的預測功能失效。B標準錯誤Beta允差VIF(常數(shù))-6733.2683146.969-2.140.041X18.3152.765.2623.

10、007.006.1297.731X2.155.296.121.524.604.01854.325X3-.199.105-.607-1.901.068.010103.768X42.6192.687.169.974.338.03230.852X55.7702.4921.0472.315.028.005208.612X61.0865.174.089.210.835.005182.444從表4-6中可以發(fā)現(xiàn)X1糧食播種面積的VIF明顯小于10,說明存在共線 性。由于模型存在多重共線性,我們對模型進行調整,應用SPSS!行逐步回歸來消除多重共線性。表4-7系數(shù)模型B標準錯誤BetaT顯著性(常數(shù))-1945.9211136.720-1.712.097X14.921.223.89322.038.000X54.3601.287.1373.388.002剔除變量x2, x3, x4, x6后的R2 0.984可知解釋變量與因變量x1糧食播種 面積,x5化肥施用折純量之間的相關系數(shù) R2 0.967 ,兩者高度相關,說明擬合 程度很高。從表4-7中發(fā)現(xiàn)P值都小于0.5,說明通過顯著性檢驗。最終得到 最優(yōu)回歸方程為:y 1945.921 4.921& 4.36x5通過影響糧食產(chǎn)量因素的多元線性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論