




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
《應用回歸分析結課論文》影響財政收入的相關因素的分析班級:姓名:學號:
目錄1.問題的提出 42.數(shù)據(jù)來源 43.回歸分析的模型方法介紹和總結 53.1多元線性回歸模型 53.1.1多元線性回歸模型的一般形式 53.1.2多元線性回歸模型的基本假定 63.2.多元線性回歸參數(shù)的最小二乘估計 74.SAS程序及結果輸出 84.1.建立數(shù)據(jù)集,進行相關分析 84.2.將數(shù)據(jù)做標準化處理,建立回歸方程 104.3.異方差檢驗 114.4自相關檢驗 134.5.多重共線性檢驗 144.5.1方差擴大因子法 144.5.2特征根判定法 144.6消除多重共線性 154.6.1后退法 154.6.2.逐步回歸 194.7最佳子集回歸 224.8嶺回歸 224.9主成分回歸 254.10偏最小二乘回歸 265.結論 27參考文獻 28
摘要六個因素通過多元線性回歸分析和嶺回歸對國家財政收入行分析,主要分析分析影響財政收入的主要原因,并聯(lián)系實際進行分析,以供關鍵詞:財政收入多元線性回歸多重共線性嶺回歸1.問題的提出財政參與分配社會產(chǎn)品,在一國經(jīng)濟發(fā)展和分配體系中占有重要地位和作用??梢杂辛Φ卮龠M經(jīng)濟的發(fā)展促進科學、教育、文化、衛(wèi)生事業(yè)的發(fā)展,促進人民生活水平的提高,為鞏固國防提供可靠的物質(zhì)保障。且可調(diào)節(jié)資源配置,促進社會公平,改善人民生活。促進經(jīng)濟機構的優(yōu)化和經(jīng)濟發(fā)展方式的轉(zhuǎn)變。在我國,財政收入的主體是稅收收入,因此在稅收體制及政策不變的條件下,財政收入會隨著經(jīng)濟繁榮而增加,隨著經(jīng)濟衰退而下降。本文利用回歸分析,確定影響我國財政收入主要因素。2.數(shù)據(jù)來源在研究國家收入時,我們把財政收入按形式分為:各項稅收收入,企業(yè)收入,債務收入,國家能源交通重點建設基金收入,基本建設貸款歸還收入,國家調(diào)節(jié)基金收入,其他收入等。為了建立國家財政收入回歸模型,我們以財政收入y(億元)為因變量,自變量如下:x1為農(nóng)業(yè)增加值(億元);x2為工業(yè)增加值(億元);x3為建筑業(yè)增加值(億元);x4為人口數(shù)(萬人);X5為社會消費總額(億元);x6為受災面積(萬公頃)。根據(jù)中國統(tǒng)計年鑒,得到1985-2003年數(shù)據(jù),如圖:3.回歸分析的模型方法介紹和總結3.1多元線性回歸模型3.1.1多元線性回歸模型的一般形式設隨機變量與一般變量,,…,的線性回歸模型為:(3.1)式中,,,…,是個未知參數(shù),稱為回歸常數(shù),,…,稱為回歸系數(shù)。稱為被解釋變量(因變量),是個可以精確測量并控制的一般變量。稱為解釋變量(自變量)。時,式(3.1)為一元線性回歸模型;時,我們就稱式(3.1)為多元線性回歸模型。是隨機誤差,與一元線性回歸一樣,對隨機誤差項我們常假定(3.2)稱(3.3)為理論回歸方程。對一個實際問題,如果我們獲得組觀測數(shù),則線性回歸模型式(3.1)可表示為:(3.4) 寫成矩陣形式為: (3.5)是一個階矩陣,稱為回歸設計矩陣或資料矩陣。在實驗設計中,的元素是預先設定并可以控制的,人的主觀因素可作用其中,因而稱為設計矩陣。3.1.2多元線性回歸模型的基本假定為了方便地進行模型的參數(shù)估計,對回歸方程式(3.4)有如下一些基本假定(1)解釋變量,,…,是確定性變量,不是隨機變量,且要求。這里的,表明設計矩陣中的自變量列之間不相關,樣本量的個數(shù)應大于解釋變量的個數(shù),是一滿秩矩陣。(2)隨機誤差性具有零均值和等方差,即, ,這個假定通常稱為高斯—馬爾柯夫條件。,即假設觀測值沒有系統(tǒng)誤差,隨機誤差項的平均值為零,隨機誤差項的協(xié)方差為零,表明隨機誤差項在不同的樣本點之間是不相關的(在正態(tài)假定下即為獨立的),不存在序列相關,并且有相同的精度。(3)正態(tài)分布的假定條件為:相互獨立對于多元線性回歸的矩陣模型式(3.5),這個條件便可表示為:由上述假定和多元正態(tài)分布的性質(zhì)可知,隨機變量服從維正態(tài)分布,回歸模型式(3.5)的期望向量 因此3.2.多元線性回歸參數(shù)的最小二乘估計多元線性回歸模型未知參數(shù),,…,,的估計與一元線性回歸方程的參數(shù)估計原理一樣,仍可采用最小二乘估計。對于,所謂最小二乘法,就是尋找參數(shù),,…,的估計值,使離差平方和Q(,,…,)極小,即:4.SAS程序及結果輸出4.1.建立數(shù)據(jù)集,進行相關分析程序1dataa;inputyearyx1-x6@@;cards;1985 2004.82 3619.5 9716 675.1 1058.51 3801.4 443.651986 2122.01 4013 11194 808.07 1075.07 4374 471.41987 2199.35 4675.7 13813 954.65 1093 5115 420.91988 2357.24 5865.3 18225 1131.65 1110.26 6534.6 508.71989 2664.9 6534.7 22017 1282.98 1127.04 7074.2 469.911990 2937.1 7662.1 23924 1345.01 1143.33 7250.3 384.741991 3149.48 8157 26625 1564.33 1158.23 8245.7 554.721992 3483.37 9084.7 34599 2174.44 1171.71 9704.8 513.331993 4348.95 10995.5 48402 3253.5 1185.17 12462.1 488.291994 5218.1 15750.5 70176 4653.32 1198.5 16264.7 550.431995 6242.2 20340.9 91894 5793.75 1267.43 20620 546.881996 7407.99 22353.7 99595 8282.25 1211.21 24774.1 458.211997 8651.14 23788.4 113733 9126.48 1223.89 27298.9 469.891998 9875.95 24542.9 119048 10061.99 1276.27 29152.5 521.551999 11444.08 24519.1 126111 11152.86 1236.26 31134.7 534.292000 13395.23 24915.8 85673.7 12497.6 1284.53 334152.6 471.192001 16386.04 26179.6 9548.98 15361.56 1247.61 37595.2 501.452002 18903.64 27390.8 11076.5 18527.18 1257.86 42027.1 499.812003 21715.25 29691.8 14771.2 23083.87 1292.27 45842 545.06;run;procprint;run;proccorrdata=anoprob;varyx1-x6;run;結果:表一分析:從相關陣看出,y與x2的相關系數(shù)偏小,x2是工業(yè)增加值,這說明工業(yè)增加值對財政收入無顯著影響。4.2.將數(shù)據(jù)做標準化處理,建立回歸方程程序2:procstandarddata=amean=0std=1out=out1;varyx1-x6;run;procprintdata=out1;run;procregdata=out1;modely=x1-x6;run;結果:表二因為數(shù)據(jù)為標準化數(shù)據(jù),所以方程中不含有常數(shù)項。所以有回歸方程為:Y=0.117.8x1-0.11696x2+0.87288x3+0.01659x+0.04690x5+0.01022x6由決定系數(shù)R方=0.9957,調(diào)整R方=0.9936,得回歸方程高度顯著。又有F=463.63,P<0.0001,表明回歸方程高度顯著,說明x1,x2,x3,x4,x5,x6整體上對y高度顯著。在顯著性水平時只有x2,x3通過了顯著性檢驗,模型需要進一步檢驗。4.3.異方差檢驗采用等級相關系數(shù)法程序3:procregdata=out1;modely=x1-x6/r;outputout=z1r=residual;run;procgplotdata=z1;plotresidual*y;run;dataz2;setz1;absr=abs(residual);run;proccorrdata=z2spearman;varabsrx1-x6;run;圖一從殘差圖可看出,誤差項沒有呈現(xiàn)任何趨勢以及規(guī)律初步判斷不存在異方差。表三程序4dataz3;n=19;dors=0.0072,0.3910,0.0053,0.0372,0.0174,0.3364;T=sqrt(n-2)*rs/sqrt(1-rs*rs);t1=tinv(0.975,n-2);output;end;run;procprintdata=z3;run;表4可知模型存在異方差問題.4.4自相關檢驗程序5:procregdata=out1;modely=x1-x6/dw;run;結果:表5DW值為1.521查表不能判斷是否存在自相關4.5.多重共線性檢驗4.5.1方差擴大因子法程序6procregdata=out1;modely=x1-x6/vif;run;結果:表6可以看到x1x3x4的方差擴大因子很大,分別為67.4189234.0069714.54580,超過10,說明財政收入回歸方程存在多重共線性。4.5.2特征根判定法程序7procregdata=out1;modely=x1-x6/collinoint;run;表7由上圖可知,條件數(shù)19.45707在x1x2和x3上的方差比率分別為0.992790.71723和0.90472,遠超過50%,說明兩變量高度共線。4.6消除多重共線性4.6.1后退法程序8procregdata=a;modely=x1-x6/selection=backward;run;結果向后消除:第0步所有變量已輸入:R方=0.9957和C(p)=7.0000
方差分析源自由度平方
和均方F值Pr
>
F模型6674884516112480753463.63<.0001誤差122911275242606
校正合/p>
變量參數(shù)
估計值標準
誤差II
型
SSF值Pr
>
FIntercept-733.030475750.126543942.677580.020.9007x10.076530.101541378050.570.4656x2-0.016860.0070214010785.780.0333x30.797380.100781518587662.59<.0001x41.377495.99041128280.050.8220x50.003910.001989449613.900.0719x61.353713.25216420350.170.6846條件數(shù)字的邊界:67.419,755.1
向后消除:第1步變量x4已刪除:R方=0.9957和C(p)=5.0529
方差分析源自由度平方
和均方F值Pr
>
F模型5674871688134974338600.07<.0001誤差132924103224931
校正合/p>
變量參數(shù)
估計值標準
誤差II
型
SSF值Pr
>
FIntercept553.063221285.69944416220.190.6741x10.091750.074123447241.530.2376x2-0.017240.0065715516386.900.0209x30.789040.090551707971875.93<.0001x50.004110.0017212757425.670.0332x61.725692.71657907680.400.5363條件數(shù)字的邊界:38.744,385.77
向后消除:第2步變量x6已刪除:R方=0.9956和C(p)=3.4270
方差分析源自由度平方
和均方F值Pr
>
F模型4674780920168695230783.36<.0001誤差143014872215348
校正合/p>
變量參數(shù)
估計值標準
誤差II
型
SSF值Pr
>
FIntercept1343.77319315.04852391776018.190.0008x10.095490.072293757341.740.2077x2-0.017100.0064215269657.090.0186x30.789280.088601709027979.36<.0001x50.003850.0016411862445.510.0342條件數(shù)字的邊界:38.5,302.25
向后消除:第3步變量x1已刪除:R方=0.9950和C(p)=2.9758
方差分析源自由度平方
和均方F值Pr
>
F模型3674405186224801729994.52<.0001誤差153390606226040
校正合/p>
變量參數(shù)
估計值標準
誤差II
型
SSF值Pr
>
FIntercept1674.73790195.668761655910073.26<.0001x2-0.009380.00273266647511.800.0037x30.903970.018055668094812507.56<.0001x50.003740.0016811241594.970.0414條件數(shù)字的邊界:1.2135,10.382
留在模型中的所有變量的顯著性水平都為0.1000。
“向后消除”的匯總步刪除的
變量引入
變量數(shù)偏
R方模型
R方C(p)F值Pr
>
F1x450.00000.99575.05290.050.82202x640.00010.99563.42700.400.53633x130.00060.99502.97581.740.2077表8參數(shù)都具有顯著性意義,最優(yōu)回歸子集模型的回歸模型為:Y=2.1435.4E-16-0.06508x2+0.98957x3+0.4486x54.6.2.逐步回歸程序9:procregdata=out1;modely=x1-x6/selection=stepwisevif;run;結果:表9參數(shù)都具有顯著性意義,最優(yōu)回歸子集模型的回歸模型為:Y=2.1435.4E-16-0.06508x2+0.98957x3+0.4486x54.7最佳子集回歸程序10procregdata=out1;modely=x1-x6/selection=cpaicadjrsq;run;結果:表10基于統(tǒng)計量x2x3x5是最優(yōu)子集,與逐步回歸選元結果相同。4.8嶺回歸程序11:procregdata=out1outest=z4outvif;modely=x1-x6/ridge=0to1by0.1;plot/ridgeplot;run;procprintdata=z4;run;結果:Obs_MODEL__TYPE__DEPVAR__RIDGE__PCOMIT__RMSE_Interceptx1x2x3x4x5x6y1MODEL1PARMSy..0.080272.5314E-160.1171-0.116960.87290.01660.046900.01022-12MODEL1RIDGEVIFy0.0...67.41896.6176134.007014.54581.577741.68305-13MODEL1RIDGEy80272.5314E-160.1171-0.116960.87290.01660.046900.01022-14MODEL1RIDGEVIFy0.1...0.71850.985051.08671.77061.002331.01258-15MODEL1RIDGEy36524.4927E-160.3201-0.200940.56310.11370.051920.00836-16MODEL1RIDGEVIFy0.2...0.30930.720400.55920.75250.781260.77951-17MODEL1RIDGEy86665.1918E-160.3065-0.187670.49610.15130.056040.01346-18MODEL1RIDGEVIFy0.3...0.20620.578220.38520.43290.632760.62890-19MODEL1RIDGEy30945.4633E-160.29250.016990.45360.16580.059910.01932-110MODEL1RIDGEVIFy0.4...0.15940.481310.29680.29140.525590.52161-111MODEL1RIDGEy70395.5797E-160.2800-0.153130.42180.17180.062850.02439-112MODEL1RIDGEVIFy0.5...0.13190.409380.24220.21570.444950.44131-113MODEL1RIDGEy05755.625E-160.2688-0.138000.39600.17400.064940.02853-114MODEL1RIDGEVIFy0.6...0.11350.353580.20460.17010.382410.37921-115MODEL1RIDGEy37675.6332E-160.2589-0.124660.37440.17420.066360.03187-116MODEL1RIDGEVIFy0.7...0.10010.309080.17680.14010.332750.32996-117MODEL1RIDGEy66675.6204E-160.2499-0.112930.35580.17320.067270.03453-118MODEL1RIDGEVIFy0.8...0.08990.272860.15540.11910.292560.29014-119MODEL1RIDGEy93215.5953E-160.2417-0.102620.33950.17150.067780.03665-120MODEL1RIDGEVIFy0.9...0.08160.242890.13840.10360.259520.25741-121MODEL1RIDGEy17635.5626E-160.2342-0.093530.32500.16940.067990.03833-122MODEL1RIDGEVIFy1.0...0.07490.217780.12450.09180.231970.23013-123MODEL1RIDGEy40245.5253E-160.2272-0.085480.31200.16710.067970.03966-1表11圖2由嶺跡圖,當K>=0.3,嶺跡曲線趨于穩(wěn)定,說明K=0.3即可以滿足嶺回歸參數(shù)估計的均方誤差較小的要求,對應的嶺回歸估計的回歸方程:Y=0.2925x1+0.01699x2+0.4536x3+0.1658x4+0.05991x5+0.01932x64.9主成分回歸程序12:procregdata=out1outest=z5outvif;modely=x1-x6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)課題申報書范例
- 區(qū)級教師課題申報書
- 合同范本修訂
- 合伙分紅合同范本
- 微課題申報書
- 教改課題申報書怎么填
- 銜接課題申報書范文
- 員工持股合同范本
- 國家申報書課題名稱結構
- 個人購酒合同范本
- GB/T 42828.1-2023鹽堿地改良通用技術第1部分:鐵尾砂改良
- 工資條(標準模版)
- 第四講 搜索引擎檢索
- 法語的發(fā)音規(guī)則及法語單詞分類記憶
- 水庫移民安置檔案分類大綱與編號方案
- 衛(wèi)生和微生物基礎知識培訓-
- 外徑千分尺檢定證書
- ICU輪轉(zhuǎn)護士培訓計劃和手冊
- GB/T 9787-1988熱軋等邊角鋼尺寸、外形、重量及允許偏差
- GB/T 17614.1-2015工業(yè)過程控制系統(tǒng)用變送器第1部分:性能評定方法
- 財務工作督導檢查記錄表
評論
0/150
提交評論