




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、應(yīng)用回歸分析結(jié)課論文 影響財政收入的相關(guān)因素的分析班級: 姓名: 學(xué)號:目 錄1.問題的提出42.數(shù)據(jù)來源43.回歸分析的模型方法介紹和總結(jié)53.1多元線性回歸模型5多元線性回歸模型的一般形式5多元線性回歸模型的基本假定63.2.多元線性回歸參數(shù)的最小二乘估計74.SAS程序及結(jié)果輸出84.1.建立數(shù)據(jù)集,進行相關(guān)分析84.2.將數(shù)據(jù)做標(biāo)準(zhǔn)化處理,建立回歸方程104.3.異方差檢驗114.4自相關(guān)檢驗134.5. 多重共線性檢驗14方差擴大因子法14特征根判定法144.6消除多重共線性15后退法154.6.2.逐步回歸194.7最佳子集回歸224.8嶺回歸224.9主成分回歸254.10偏最小
2、二乘回歸265.結(jié)論27參考文獻28摘要本文選1985-2003年的農(nóng)業(yè)增加值,工業(yè)增加值,建筑業(yè)增加值,社會消費總額,人口數(shù),受災(zāi)面積六個因素通過多元線性回歸分析和嶺回歸對國家財政收入行分析,主要分析分析影響財政收入的主要原因,并聯(lián)系實際進行分析,以供參考。關(guān)鍵詞:財政收入 多元線性回歸 多重共線性 嶺回歸1.問題的提出財政參與分配社會產(chǎn)品,在一國經(jīng)濟發(fā)展和分配體系中占有重要地位和作用??梢杂辛Φ卮龠M經(jīng)濟的發(fā)展促進科學(xué)、教育、文化、衛(wèi)生事業(yè)的發(fā)展,促進人民生活水平的提高,為鞏固國防提供可靠的物質(zhì)保障。且可調(diào)節(jié)資源配置,促進社會公平,改善人民生活。促進經(jīng)濟機構(gòu)的優(yōu)化和經(jīng)濟發(fā)展方式的轉(zhuǎn)變。在我國
3、,財政收入的主體是稅收收入,因此在稅收體制及政策不變的條件下,財政收入會隨著經(jīng)濟繁榮而增加,隨著經(jīng)濟衰退而下降。本文利用回歸分析,確定影響我國財政收入主要因素。2.數(shù)據(jù)來源在研究國家收入時,我們把財政收入按形式分為:各項稅收收入,企業(yè)收入,債務(wù)收入,國家能源交通重點建設(shè)基金收入,基本建設(shè)貸款歸還收入,國家調(diào)節(jié)基金收入,其他收入等。為了建立國家財政收入回歸模型,我們以財政收入y(億元)為因變量,自變量如下:x1為農(nóng)業(yè)增加值(億元);x2為工業(yè)增加值(億元);x3為建筑業(yè)增加值(億元);x4為人口數(shù)(萬人);X5為社會消費總額(億元);x6為 受災(zāi)面積(萬公頃)。根據(jù)中國統(tǒng)計年鑒,得到1985-2
4、003年數(shù)據(jù),如圖:3.回歸分析的模型方法介紹和總結(jié)3.1多元線性回歸模型3.1.1多元線性回歸模型的一般形式 設(shè)隨機變量與一般變量, ,的線性回歸模型為: (3.1)式中,是個未知參數(shù),稱為回歸常數(shù),稱為回歸系數(shù)。稱為被解釋變量(因變量),是個可以精確測量并控制的一般變量。稱為解釋變量(自變量)。時,式(3.1)為一元線性回歸模型;時,我們就稱式(3.1)為多元線性回歸模型。是隨機誤差,與一元線性回歸一樣,對隨機誤差項我們常假定 (3.2) 稱 (3.3)為理論回歸方程。 對一個實際問題,如果我們獲得組觀測數(shù),則線性回歸模型式(3.1)可表示為: (3.4) 寫成矩陣形式為: (3.5) 是
5、一個階矩陣,稱為回歸設(shè)計矩陣或資料矩陣。在實驗設(shè)計中,的元素是預(yù)先設(shè)定并可以控制的,人的主觀因素可作用其中,因而稱為設(shè)計矩陣。3.1.2多元線性回歸模型的基本假定 為了方便地進行模型的參數(shù)估計,對回歸方程式(3.4)有如下一些基本假定 (1)解釋變量, ,是確定性變量,不是隨機變量,且要求。這里的,表明設(shè)計矩陣中的自變量列之間不相關(guān),樣本量的個數(shù)應(yīng)大于解釋變量的個數(shù),是一滿秩矩陣。 (2)隨機誤差性具有零均值和等方差,即 , , 這個假定通常稱為高斯馬爾柯夫條件。,即假設(shè)觀測值沒有系統(tǒng)誤差,隨機誤差項的平均值為零,隨機誤差項的協(xié)方差為零,表明隨機誤差項在不同的樣本點之間是不相關(guān)的(在正態(tài)假定下
6、即為獨立的),不存在序列相關(guān),并且有相同的精度。 (3)正態(tài)分布的假定條件為: 相互獨立對于多元線性回歸的矩陣模型式(3.5),這個條件便可表示為: 由上述假定和多元正態(tài)分布的性質(zhì)可知,隨機變量服從維正態(tài)分布,回歸模型式(3.5)的期望向量 因此 3.2.多元線性回歸參數(shù)的最小二乘估計多元線性回歸模型未知參數(shù),的估計與一元線性回歸方程的參數(shù)估計原理一樣,仍可采用最小二乘估計。對于,所謂最小二乘法,就是尋找參數(shù),的估計值,使離差平方和Q(,)極小,即: 4.SAS程序及結(jié)果輸出4.1.建立數(shù)據(jù)集,進行相關(guān)分析程序1data a;input year y x1-x6;cards;19852004.
7、823619.59716675.11058.513801.4443.6519862122.01401311194808.071075.074374471.419872199.354675.713813954.6510935115420.919882357.245865.3182251131.651110.266534.6508.719892664.96534.7220171282.981127.047074.2469.9119902937.17662.1239241345.011143.337250.3384.7419913149.488157266251564.331158.238245.7
8、554.7219923483.379084.7345992174.441171.719704.8513.3319934348.9510995.5484023253.51185.1712462.1488.2919945218.115750.5701764653.321198.516264.7550.4319956242.220340.9918945793.751267.4320620546.8819967407.9922353.7995958282.251211.2124774.1458.2119978651.1423788.41137339126.481223.8927298.9469.891
9、9989875.9524542.911904810061.991276.2729152.5521.55199911444.0824519.112611111152.861236.2631134.7534.29200013395.2324915.885673.712497.61284.53334152.6471.19200116386.0426179.69548.9815361.561247.6137595.2501.45200218903.6427390.811076.518527.181257.8642027.1499.81200321715.2529691.814771.223083.87
10、1292.2745842545.06;run;proc print;run;proc corr data=a noprob;var y x1-x6;run;結(jié)果:表一分析:從相關(guān)陣看出,y與x2的相關(guān)系數(shù)偏小,x2是工業(yè)增加值,這說明工業(yè)增加值對財政收入無顯著影響。4.2.將數(shù)據(jù)做標(biāo)準(zhǔn)化處理,建立回歸方程程序2:proc standard data=a mean=0 std=1 out=out1;var y x1-x6;run;proc print data=out1;run;proc reg data=out1;model y=x1-x6;run;結(jié)果:表二因為數(shù)據(jù)為標(biāo)準(zhǔn)化數(shù)據(jù),所以方程中不
11、含有常數(shù)項。所以有回歸方程為:Yx1-0.11696x2+0.87288x3+0.01659x+0.04690x5+0.01022x6由決定系數(shù)R方=0.9957,調(diào)整R方=0.9936,得回歸方程高度顯著。又有F=463.63,P<0.0001,表明回歸方程高度顯著,說明x1,x2,x3,x4,x5,x6整體上對y高度顯著。在顯著性水平時只有x2,x3通過了顯著性檢驗,模型需要進一步檢驗。4.3.異方差檢驗采用等級相關(guān)系數(shù)法程序3:proc reg data=out1;model y=x1-x6/ r;output out=z1 r=residual;run;proc gplot da
12、ta=z1;plot residual*y;run; data z2;set z1;absr=abs(residual);run;proc corr data=z2 spearman; var absr x1-x6 ;run; 圖一從殘差圖可看出,誤差項沒有呈現(xiàn)任何趨勢以及規(guī)律初步判斷不存在異方差。表三程序4data z3;n=19 ;do rs=0.0072,0.3910,0.0053,0.0372,0.0174 ,0.3364;T=sqrt(n-2)*rs/sqrt(1-rs*rs);t1=tinv(0.975,n-2);output;end;run;proc print data=z3;
13、run;表4可知模型存在異方差問題.4.4自相關(guān)檢驗程序5:proc reg data=out1;model y=x1-x6/dw;run;結(jié)果:表5DW值為1.521 查表不能判斷是否存在自相關(guān)4.5. 多重共線性檢驗4.5.1方差擴大因子法程序6proc reg data=out1;model y=x1-x6/vif ;run;結(jié)果:表6可以看到x1 x3 x4的方差擴大因子很大,分別為67.41892 34.00697 14.54580,超過10,說明財政收入回歸方程存在多重共線性。4.5.2特征根判定法程序7proc reg data=out1;model y=x1-x6/collin
14、oint;run; 表7由上圖可知,條件數(shù)19.45707在x1 x2和x3上的方差比率分別為0.99279 0.71723和0.90472,遠超過50%,說明兩變量高度共線。4.6消除多重共線性4.6.1后退法程序8proc reg data=a;model y=x1-x6/selection=backward;run;結(jié)果向后消除: 第 0 步所有變量已輸入: R 方 = 0.9957 和 C(p) = 7.0000 方差分析源自由度平方和均方F 值Pr > F模型6674884516112480753463.63&l
15、t;.0001誤差122911275242606 校正合#160; 變量參數(shù)估計值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept-733.030475750.126543942.677580.020.9007x10.076530.101541378050.570.4656x2-0.016860.0070214010785.780.0333x30.797380.100781518587662.59<.0001x41.377495.99041128280.050.8
16、220x50.003910.001989449613.900.0719x61.353713.25216420350.170.6846條件數(shù)字的邊界: 67.419, 755.1 向后消除: 第 1 步變量 x4 已刪除: R 方 = 0.9957 和 C(p) = 5.0529 方差分析源自由度平方和均方F 值Pr > F模型5674871688134974338600.07<.0001誤差132924103224931 校正合#160;
17、;變量參數(shù)估計值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept553.063221285.69944416220.190.6741x10.091750.074123447241.530.2376x2-0.017240.0065715516386.900.0209x30.789040.090551707971875.93<.0001x50.004110.0017212757425.670.0332x61.725692.71657907680.400.5363條件數(shù)字的邊界: 38.744, 385.77 向后消除: 第 2
18、 步變量 x6 已刪除: R 方 = 0.9956 和 C(p) = 3.4270 方差分析源自由度平方和均方F 值Pr > F模型4674780920168695230783.36<.0001誤差143014872215348 校正合#160; 變量參數(shù)估計值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept1343.77319315.04852391776018.190.0008x10.09
19、5490.072293757341.740.2077x2-0.017100.0064215269657.090.0186x30.789280.088601709027979.36<.0001x50.003850.0016411862445.510.0342條件數(shù)字的邊界: 38.5, 302.25 向后消除: 第 3 步變量 x1 已刪除: R 方 = 0.9950 和 C(p) = 2.9758 方差分析源自由度平方和均方F 值Pr > F模型3674405186224801729994.52<.0
20、001誤差153390606226040 校正合#160; 變量參數(shù)估計值標(biāo)準(zhǔn)誤差I(lǐng)I 型 SSF 值Pr > FIntercept1674.73790195.668761655910073.26<.0001x2-0.009380.00273266647511.800.0037x30.903970.018055668094812507.56<.0001x50.003740.0016811241594.970.0414條件數(shù)字的邊界: 1.2135, 10.382
21、60;留在模型中的所有變量的顯著性水平都為 0.1000。 “向后消除”的匯總步刪除的變量引入變量數(shù)偏R 方模型R 方C(p)F 值Pr > F1x450.00000.99575.05290.050.82202x640.00010.99563.42700.400.53633x130.00060.99502.97581.740.2077表8 參數(shù)都具有顯著性意義,最優(yōu)回歸子集模型的回歸模型為:Y=-0.06508x2+0.98957x3+0.4486x5.逐步回歸程序9:proc reg data=out1;model y=x1-x6/
22、selection=stepwise vif;run;結(jié)果:表9參數(shù)都具有顯著性意義,最優(yōu)回歸子集模型的回歸模型為: Y=-0.06508x2+0.98957x3+0.4486x54.7最佳子集回歸程序10proc reg data=out1;model y=x1-x6/selection=cp aic adjrsq;run;結(jié)果:表10基于統(tǒng)計量x2 x3 x5是最優(yōu)子集,與逐步回歸選元結(jié)果相同。4.8嶺回歸程序11 :proc reg data=out1 outest=z4 outvif;model y=x1-x6/ridge=0 to 1 by 0.1;plot/ridgeplot;ru
23、n;proc print data=z4;run;結(jié)果:Obs_MODEL_TYPE_DEPVAR_RIDGE_PCOMIT_RMSE_Interceptx1x2x3x4x5x6y1MODEL1PARMSy. .0.080272.5314E-160.1171-0.116960.87290.01660.046900.01022-12MODEL1RIDGEVIFy0.0. .67.41896.6176134.007014.54581.577741.68305-13MODEL1RIDGEy0.0.0.080272.5314E-160.1171-0.116960.87290.01660.046900.
24、01022-14MODEL1RIDGEVIFy0.1. .0.71850.985051.08671.77061.002331.01258-15MODEL1RIDGEy0.1.0.136524.4927E-160.3201-0.200940.56310.11370.051920.00836-16MODEL1RIDGEVIFy0.2. .0.30930.720400.55920.75250.781260.77951-17MODEL1RIDGEy0.2.0.186665.1918E-160.3065-0.187670.49610.15130.056040.01346-18MODEL1RIDGEVIF
25、y0.3. .0.20620.578220.38520.43290.632760.62890-19MODEL1RIDGEy0.3.0.230945.4633E-160.29250.016990.45360.16580.059910.01932-110MODEL1RIDGEVIFy0.4. .0.15940.481310.29680.29140.525590.52161-111MODEL1RIDGEy0.4.0.270395.5797E-160.2800-0.153130.42180.17180.062850.02439-112MODEL1RIDGEVIFy0.5. .0.13190.40938
26、0.24220.21570.444950.44131-113MODEL1RIDGEy0.5.0.305755.625E-160.2688-0.138000.39600.17400.064940.02853-114MODEL1RIDGEVIFy0.6. .0.11350.353580.20460.17010.382410.37921-115MODEL1RIDGEy0.6.0.337675.6332E-160.2589-0.124660.37440.17420.066360.03187-116MODEL1RIDGEVIFy0.7. .0.10010.309080.17680.14010.33275
27、0.32996-117MODEL1RIDGEy0.7.0.366675.6204E-160.2499-0.112930.35580.17320.067270.03453-118MODEL1RIDGEVIFy0.8. .0.08990.272860.15540.11910.292560.29014-119MODEL1RIDGEy0.8.0.393215.5953E-160.2417-0.102620.33950.17150.067780.03665-120MODEL1RIDGEVIFy0.9. .0.08160.242890.13840.10360.259520.25741-121MODEL1R
28、IDGEy0.9.0.417635.5626E-160.2342-0.093530.32500.16940.067990.03833-122MODEL1RIDGEVIFy1.0. .0.07490.217780.12450.09180.231970.23013-123MODEL1RIDGEy1.0.0.440245.5253E-160.2272-0.085480.31200.16710.067970.03966-1表11圖2由嶺跡圖,當(dāng)K>=0.3,嶺跡曲線趨于穩(wěn)定,說明K=0.3即可以滿足嶺回歸參數(shù)估計的均方誤差較小的要求,對應(yīng)的嶺回歸估計的回歸方程:Y=0.2925x1+0.01699x2+0.4536x3+0.1658x4+0.05991x5+0.01932x64.9主成分回歸程序12:proc reg data=out1 outest=z5 outvif;model y=x1-x6/pcomit=1;run;proc print data=z5;run;結(jié)果:圖 12Y=1.1814E-16+0.39282x1-0.19039x2+0.68593x3-0.06196x4+0.06018x5+0.02238x6由方差擴大因子可知,模型不存在多重共線性。4.10偏最小二乘回歸程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 芭蕾舞教學(xué)設(shè)計
- 質(zhì)量回溯流程
- 2025年度音樂著作權(quán)在線直播平臺使用許可協(xié)議
- 二零二五年度生物制藥合伙人股權(quán)配置與臨床試驗協(xié)議
- 醫(yī)療設(shè)備售后工作總結(jié)
- 二零二五年度建材租賃與施工進度監(jiān)控合同
- 二零二五年度社區(qū)籃球友誼賽免責(zé)協(xié)議書
- 2025年度花店花卉電商直播帶貨合作合同
- 二零二五年度塔吊設(shè)備買賣與施工期間保險責(zé)任劃分協(xié)議
- 二零二五年度消防工程竣工驗收合同固定價協(xié)議
- 胸腔閉式引流護理
- 2025年興湘集團全資子公司招聘筆試參考題庫含答案解析
- 蒙醫(yī)學(xué)中的推拿暖宮療法與婦科保健技巧
- 湖北省生態(tài)環(huán)保有限公司招聘筆試沖刺題2025
- 西門子自動化培訓(xùn)
- DB51T 2722-2020 四川省行政執(zhí)法文書標(biāo)準(zhǔn)
- 壓力測試報告
- 廣告牌的制作安裝及售后服務(wù)方案
- 船舶建造流程
- 減鹽防控高血壓培訓(xùn)課件
- 2025屆廣東省廣州市實驗中學(xué)高三第一次調(diào)研測試數(shù)學(xué)試卷含解析
評論
0/150
提交評論