應(yīng)用回歸分析結(jié)課論文_第1頁(yè)
應(yīng)用回歸分析結(jié)課論文_第2頁(yè)
應(yīng)用回歸分析結(jié)課論文_第3頁(yè)
應(yīng)用回歸分析結(jié)課論文_第4頁(yè)
應(yīng)用回歸分析結(jié)課論文_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、應(yīng)用回歸分析結(jié)課論文 影響財(cái)政收入的相關(guān)因素的分析班級(jí): 姓名: 學(xué)號(hào):目 錄1.問題的提出42.數(shù)據(jù)來(lái)源43.回歸分析的模型方法介紹和總結(jié)53.1多元線性回歸模型53.1.1多元線性回歸模型的一般形式53.1.2多元線性回歸模型的基本假定63.2.多元線性回歸參數(shù)的最小二乘估計(jì)74.SAS程序及結(jié)果輸出84.1.建立數(shù)據(jù)集,進(jìn)行相關(guān)分析84.2.將數(shù)據(jù)做標(biāo)準(zhǔn)化處理,建立回歸方程104.3.異方差檢驗(yàn)114.4自相關(guān)檢驗(yàn)134.5. 多重共線性檢驗(yàn)144.5.1方差擴(kuò)大因子法144.5.2特征根判定法144.6消除多重共線性154.6.1后退法154.6.2.逐步回歸194.7最佳子集回歸22

2、4.8嶺回歸224.9主成分回歸254.10偏最小二乘回歸265.結(jié)論27參考文獻(xiàn)28摘要本文選1985-2003年的農(nóng)業(yè)增加值,工業(yè)增加值,建筑業(yè)增加值,社會(huì)消費(fèi)總額,人口數(shù),受災(zāi)面積六個(gè)因素通過多元線性回歸分析和嶺回歸對(duì)國(guó)家財(cái)政收入行分析,主要分析分析影響財(cái)政收入的主要原因,并聯(lián)系實(shí)際進(jìn)行分析,以供參考。關(guān)鍵詞:財(cái)政收入 多元線性回歸 多重共線性 嶺回歸1.問題的提出財(cái)政參與分配社會(huì)產(chǎn)品,在一國(guó)經(jīng)濟(jì)發(fā)展和分配體系中占有重要地位和作用??梢杂辛Φ卮龠M(jìn)經(jīng)濟(jì)的發(fā)展促進(jìn)科學(xué)、教育、文化、衛(wèi)生事業(yè)的發(fā)展,促進(jìn)人民生活水平的提高,為鞏固國(guó)防提供可靠的物質(zhì)保障。且可調(diào)節(jié)資源配置,促進(jìn)社會(huì)公平,改善人民生

3、活。促進(jìn)經(jīng)濟(jì)機(jī)構(gòu)的優(yōu)化和經(jīng)濟(jì)發(fā)展方式的轉(zhuǎn)變。在我國(guó),財(cái)政收入的主體是稅收收入,因此在稅收體制及政策不變的條件下,財(cái)政收入會(huì)隨著經(jīng)濟(jì)繁榮而增加,隨著經(jīng)濟(jì)衰退而下降。本文利用回歸分析,確定影響我國(guó)財(cái)政收入主要因素。2.數(shù)據(jù)來(lái)源在研究國(guó)家收入時(shí),我們把財(cái)政收入按形式分為:各項(xiàng)稅收收入,企業(yè)收入,債務(wù)收入,國(guó)家能源交通重點(diǎn)建設(shè)基金收入,基本建設(shè)貸款歸還收入,國(guó)家調(diào)節(jié)基金收入,其他收入等。為了建立國(guó)家財(cái)政收入回歸模型,我們以財(cái)政收入y(億元)為因變量,自變量如下:x1為農(nóng)業(yè)增加值(億元);x2為工業(yè)增加值(億元);x3為建筑業(yè)增加值(億元);x4為人口數(shù)(萬(wàn)人);X5為社會(huì)消費(fèi)總額(億元);x6為 受災(zāi)

4、面積(萬(wàn)公頃)。根據(jù)中國(guó)統(tǒng)計(jì)年鑒,得到1985-2003年數(shù)據(jù),如圖:3.回歸分析的模型方法介紹和總結(jié)3.1多元線性回歸模型3.1.1多元線性回歸模型的一般形式 設(shè)隨機(jī)變量與一般變量, ,的線性回歸模型為: (3.1)式中,是個(gè)未知參數(shù),稱為回歸常數(shù),稱為回歸系數(shù)。稱為被解釋變量(因變量),是個(gè)可以精確測(cè)量并控制的一般變量。稱為解釋變量(自變量)。時(shí),式(3.1)為一元線性回歸模型;時(shí),我們就稱式(3.1)為多元線性回歸模型。是隨機(jī)誤差,與一元線性回歸一樣,對(duì)隨機(jī)誤差項(xiàng)我們常假定 (3.2) 稱 (3.3)為理論回歸方程。 對(duì)一個(gè)實(shí)際問題,如果我們獲得組觀測(cè)數(shù),則線性回歸模型式(3.1)可表示

5、為: (3.4) 寫成矩陣形式為: (3.5) 是一個(gè)階矩陣,稱為回歸設(shè)計(jì)矩陣或資料矩陣。在實(shí)驗(yàn)設(shè)計(jì)中,的元素是預(yù)先設(shè)定并可以控制的,人的主觀因素可作用其中,因而稱為設(shè)計(jì)矩陣。3.1.2多元線性回歸模型的基本假定 為了方便地進(jìn)行模型的參數(shù)估計(jì),對(duì)回歸方程式(3.4)有如下一些基本假定 (1)解釋變量, ,是確定性變量,不是隨機(jī)變量,且要求。這里的,表明設(shè)計(jì)矩陣中的自變量列之間不相關(guān),樣本量的個(gè)數(shù)應(yīng)大于解釋變量的個(gè)數(shù),是一滿秩矩陣。 (2)隨機(jī)誤差性具有零均值和等方差,即 , , 這個(gè)假定通常稱為高斯馬爾柯夫條件。,即假設(shè)觀測(cè)值沒有系統(tǒng)誤差,隨機(jī)誤差項(xiàng)的平均值為零,隨機(jī)誤差項(xiàng)的協(xié)方差為零,表明隨

6、機(jī)誤差項(xiàng)在不同的樣本點(diǎn)之間是不相關(guān)的(在正態(tài)假定下即為獨(dú)立的),不存在序列相關(guān),并且有相同的精度。 (3)正態(tài)分布的假定條件為: 相互獨(dú)立對(duì)于多元線性回歸的矩陣模型式(3.5),這個(gè)條件便可表示為: 由上述假定和多元正態(tài)分布的性質(zhì)可知,隨機(jī)變量服從維正態(tài)分布,回歸模型式(3.5)的期望向量 因此 3.2.多元線性回歸參數(shù)的最小二乘估計(jì)多元線性回歸模型未知參數(shù),的估計(jì)與一元線性回歸方程的參數(shù)估計(jì)原理一樣,仍可采用最小二乘估計(jì)。對(duì)于,所謂最小二乘法,就是尋找參數(shù),的估計(jì)值,使離差平方和Q(,)極小,即: 4.SAS程序及結(jié)果輸出4.1.建立數(shù)據(jù)集,進(jìn)行相關(guān)分析程序1data a;input yea

7、r y x1-x6;cards;19852004.823619.59716675.11058.513801.4443.6519862122.01401311194808.071075.074374471.419872199.354675.713813954.6510935115420.919882357.245865.3182251131.651110.266534.6508.719892664.96534.7220171282.981127.047074.2469.9119902937.17662.1239241345.011143.337250.3384.7419913149.488157

8、266251564.331158.238245.7554.7219923483.379084.7345992174.441171.719704.8513.3319934348.9510995.5484023253.51185.1712462.1488.2919945218.115750.5701764653.321198.516264.7550.4319956242.220340.9918945793.751267.4320620546.8819967407.9922353.7995958282.251211.2124774.1458.2119978651.1423788.4113733912

9、6.481223.8927298.9469.8919989875.9524542.911904810061.991276.2729152.5521.55199911444.0824519.112611111152.861236.2631134.7534.29200013395.2324915.885673.712497.61284.53334152.6471.19200116386.0426179.69548.9815361.561247.6137595.2501.45200218903.6427390.811076.518527.181257.8642027.1499.81200321715

10、.2529691.814771.223083.871292.2745842545.06;run;proc print;run;proc corr data=a noprob;var y x1-x6;run;結(jié)果:表一分析:從相關(guān)陣看出,y與x2的相關(guān)系數(shù)偏小,x2是工業(yè)增加值,這說明工業(yè)增加值對(duì)財(cái)政收入無(wú)顯著影響。4.2.將數(shù)據(jù)做標(biāo)準(zhǔn)化處理,建立回歸方程程序2:proc standard data=a mean=0 std=1 out=out1;var y x1-x6;run;proc print data=out1;run;proc reg data=out1;model y=x1-x6;r

11、un;結(jié)果:表二因?yàn)閿?shù)據(jù)為標(biāo)準(zhǔn)化數(shù)據(jù),所以方程中不含有常數(shù)項(xiàng)。所以有回歸方程為:Y=0.117.8x1-0.11696x2+0.87288x3+0.01659x+0.04690x5+0.01022x6由決定系數(shù)R方=0.9957,調(diào)整R方=0.9936,得回歸方程高度顯著。又有F=463.63,P<0.0001,表明回歸方程高度顯著,說明x1,x2,x3,x4,x5,x6整體上對(duì)y高度顯著。在顯著性水平時(shí)只有x2,x3通過了顯著性檢驗(yàn),模型需要進(jìn)一步檢驗(yàn)。4.3.異方差檢驗(yàn)采用等級(jí)相關(guān)系數(shù)法程序3:proc reg data=out1;model y=x1-x6/ r;output ou

12、t=z1 r=residual;run;proc gplot data=z1;plot residual*y;run; data z2;set z1;absr=abs(residual);run;proc corr data=z2 spearman; var absr x1-x6 ;run; 圖一從殘差圖可看出,誤差項(xiàng)沒有呈現(xiàn)任何趨勢(shì)以及規(guī)律初步判斷不存在異方差。表三程序4data z3;n=19 ;do rs=0.0072,0.3910,0.0053,0.0372,0.0174 ,0.3364;T=sqrt(n-2)*rs/sqrt(1-rs*rs);t1=tinv(0.975,n-2);o

13、utput;end;run;proc print data=z3;run;表4可知模型存在異方差問題.4.4自相關(guān)檢驗(yàn)程序5:proc reg data=out1;model y=x1-x6/dw;run;結(jié)果:表5DW值為1.521 查表不能判斷是否存在自相關(guān)4.5. 多重共線性檢驗(yàn)4.5.1方差擴(kuò)大因子法程序6proc reg data=out1;model y=x1-x6/vif ;run;結(jié)果:表6可以看到x1 x3 x4的方差擴(kuò)大因子很大,分別為67.41892 34.00697 14.54580,超過10,說明財(cái)政收入回歸方程存在多重共線性。4.5.2特征根判定法程序7proc r

14、eg data=out1;model y=x1-x6/collinoint;run; 表7由上圖可知,條件數(shù)19.45707在x1 x2和x3上的方差比率分別為0.99279 0.71723和0.90472,遠(yuǎn)超過50%,說明兩變量高度共線。4.6消除多重共線性4.6.1后退法程序8proc reg data=a;model y=x1-x6/selection=backward;run;結(jié)果向后消除: 第 0 步所有變量已輸入: R 方 = 0.9957 和 C(p) = 7.0000    方差分析源自由度平方和均方F 值Pr >

15、60;F模型6674884516112480753463.63<.0001誤差122911275242606  校正合#160;  變量參數(shù)估計(jì)值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept-733.030475750.126543942.677580.020.9007x10.076530.101541378050.570.4656x2-0.016860.0070214010785.780.0333x30.797380.100781518587662.59<

16、.0001x41.377495.99041128280.050.8220x50.003910.001989449613.900.0719x61.353713.25216420350.170.6846條件數(shù)字的邊界: 67.419, 755.1 向后消除: 第 1 步變量 x4 已刪除: R 方 = 0.9957 和 C(p) = 5.0529    方差分析源自由度平方和均方F 值Pr > F模型5674871688134974338600.07<.0001誤差132924103224931  

17、;校正合#160;  變量參數(shù)估計(jì)值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept553.063221285.69944416220.190.6741x10.091750.074123447241.530.2376x2-0.017240.0065715516386.900.0209x30.789040.090551707971875.93<.0001x50.004110.0017212757425.670.0332x61.725692.71657907680.400.5363條件數(shù)字的

18、邊界: 38.744, 385.77 向后消除: 第 2 步變量 x6 已刪除: R 方 = 0.9956 和 C(p) = 3.4270    方差分析源自由度平方和均方F 值Pr > F模型4674780920168695230783.36<.0001誤差143014872215348  校正合#160;  變量參數(shù)估計(jì)值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept1343.77319

19、315.04852391776018.190.0008x10.095490.072293757341.740.2077x2-0.017100.0064215269657.090.0186x30.789280.088601709027979.36<.0001x50.003850.0016411862445.510.0342條件數(shù)字的邊界: 38.5, 302.25 向后消除: 第 3 步變量 x1 已刪除: R 方 = 0.9950 和 C(p) = 2.9758    方差分析源自由度平方和均方F 值Pr > F

20、模型3674405186224801729994.52<.0001誤差153390606226040  校正合#160;  變量參數(shù)估計(jì)值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept1674.73790195.668761655910073.26<.0001x2-0.009380.00273266647511.800.0037x30.903970.018055668094812507.56<.0001x50.003740.0016811241594.9

21、70.0414條件數(shù)字的邊界: 1.2135, 10.382 留在模型中的所有變量的顯著性水平都為 0.1000。   “向后消除”的匯總步刪除的變量引入變量數(shù)偏R 方模型R 方C(p)F 值Pr > F1x450.00000.99575.05290.050.82202x640.00010.99563.42700.400.53633x130.00060.99502.97581.740.2077表8 參數(shù)都具有顯著性意義,最優(yōu)回歸子集模型的回歸模型為:Y=2.1435.4E-16-0.06508x2+0.98957x3+0.448

22、6x54.6.2.逐步回歸程序9:proc reg data=out1;model y=x1-x6/selection=stepwise vif;run;結(jié)果:表9參數(shù)都具有顯著性意義,最優(yōu)回歸子集模型的回歸模型為: Y=2.1435.4E-16-0.06508x2+0.98957x3+0.4486x54.7最佳子集回歸程序10proc reg data=out1;model y=x1-x6/selection=cp aic adjrsq;run;結(jié)果:表10基于統(tǒng)計(jì)量x2 x3 x5是最優(yōu)子集,與逐步回歸選元結(jié)果相同。4.8嶺回歸程序11 :proc reg data=out1 outest

23、=z4 outvif;model y=x1-x6/ridge=0 to 1 by 0.1;plot/ridgeplot;run;proc print data=z4;run;結(jié)果:Obs_MODEL_TYPE_DEPVAR_RIDGE_PCOMIT_RMSE_Interceptx1x2x3x4x5x6y1MODEL1PARMSy. .0.080272.5314E-160.1171-0.116960.87290.01660.046900.01022-12MODEL1RIDGEVIFy0.0. .67.41896.6176134.007014.54581.577741.68305-13MODEL1

24、RIDGEy0.0.0.080272.5314E-160.1171-0.116960.87290.01660.046900.01022-14MODEL1RIDGEVIFy0.1. .0.71850.985051.08671.77061.002331.01258-15MODEL1RIDGEy0.1.0.136524.4927E-160.3201-0.200940.56310.11370.051920.00836-16MODEL1RIDGEVIFy0.2. .0.30930.720400.55920.75250.781260.77951-17MODEL1RIDGEy0.2.0.186665.191

25、8E-160.3065-0.187670.49610.15130.056040.01346-18MODEL1RIDGEVIFy0.3. .0.20620.578220.38520.43290.632760.62890-19MODEL1RIDGEy0.3.0.230945.4633E-160.29250.016990.45360.16580.059910.01932-110MODEL1RIDGEVIFy0.4. .0.15940.481310.29680.29140.525590.52161-111MODEL1RIDGEy0.4.0.270395.5797E-160.2800-0.153130.

26、42180.17180.062850.02439-112MODEL1RIDGEVIFy0.5. .0.13190.409380.24220.21570.444950.44131-113MODEL1RIDGEy0.5.0.305755.625E-160.2688-0.138000.39600.17400.064940.02853-114MODEL1RIDGEVIFy0.6. .0.11350.353580.20460.17010.382410.37921-115MODEL1RIDGEy0.6.0.337675.6332E-160.2589-0.124660.37440.17420.066360.

27、03187-116MODEL1RIDGEVIFy0.7. .0.10010.309080.17680.14010.332750.32996-117MODEL1RIDGEy0.7.0.366675.6204E-160.2499-0.112930.35580.17320.067270.03453-118MODEL1RIDGEVIFy0.8. .0.08990.272860.15540.11910.292560.29014-119MODEL1RIDGEy0.8.0.393215.5953E-160.2417-0.102620.33950.17150.067780.03665-120MODEL1RID

28、GEVIFy0.9. .0.08160.242890.13840.10360.259520.25741-121MODEL1RIDGEy0.9.0.417635.5626E-160.2342-0.093530.32500.16940.067990.03833-122MODEL1RIDGEVIFy1.0. .0.07490.217780.12450.09180.231970.23013-123MODEL1RIDGEy1.0.0.440245.5253E-160.2272-0.085480.31200.16710.067970.03966-1表11圖2由嶺跡圖,當(dāng)K>=0.3,嶺跡曲線趨于穩(wěn)定

29、,說明K=0.3即可以滿足嶺回歸參數(shù)估計(jì)的均方誤差較小的要求,對(duì)應(yīng)的嶺回歸估計(jì)的回歸方程:Y=0.2925x1+0.01699x2+0.4536x3+0.1658x4+0.05991x5+0.01932x64.9主成分回歸程序12:proc reg data=out1 outest=z5 outvif;model y=x1-x6/pcomit=1;run;proc print data=z5;run;結(jié)果:圖 12Y=1.1814E-16+0.39282x1-0.19039x2+0.68593x3-0.06196x4+0.06018x5+0.02238x6由方差擴(kuò)大因子可知,模型不存在多重共線性。4.10偏最小二乘回歸程序13proc

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論