




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、藪北京航堂就太大拳 /BEIHANGUNIVERSITY 數(shù)理統(tǒng)計(jì) (課程大作業(yè)1) 逐步回歸分析 學(xué)院:機(jī)械工程學(xué)院 專業(yè):材料加工工程 日期:2014 年 12 月 7 日摘要:本文介紹多元線性回歸分析方法以及逐步回歸法,然后結(jié)合實(shí)際,以我國 1995-2012年的財政收入為因變量,選取了8個可能的影響因素,選用逐步回歸 法對各影響因素進(jìn)行了篩選分析,最終確定了其“最優(yōu)”回歸方程。 關(guān)鍵字:多元線性回歸逐步回歸法財政收入SPSS 1 引言 自然界中任何事物都是普遍聯(lián)系的,客觀事物之間往往都存在著某種程度的關(guān)聯(lián)關(guān)系。為了研究變量之間的相關(guān)關(guān)系,人們常用回歸分析的方法,而回歸分析是數(shù)理統(tǒng)計(jì)中一
2、種常用方法。數(shù)理統(tǒng)計(jì)作為一種實(shí)用有效的工具,廣泛應(yīng)用于國民經(jīng)濟(jì)的各個方面,在解決實(shí)際問題中發(fā)揮了巨大的作用,是一種理論聯(lián)系實(shí)踐、指導(dǎo)實(shí)踐的科學(xué)方法。 財政收入,是指政府為履行其職能、實(shí)施公共政策和提供公共物品與服務(wù)需要而籌集的一切資金的總和。財政收入表現(xiàn)為政府部門在一定時期內(nèi)(一般為一個財政年度)所取得的貨幣收入。財政收入是衡量一國政府財力的重要指標(biāo),政 府在社會經(jīng)濟(jì)活動中提供公共物品和服務(wù)的范圍和數(shù)量,在很大程度上決定于財 政收入的充裕狀況。 本文將以回歸分析為方法,運(yùn)用數(shù)理統(tǒng)計(jì)工具探求財政收入與各種統(tǒng)計(jì)指標(biāo)之間的關(guān)系,總結(jié)主要影響因素,并對其作用、前景進(jìn)行分析和展望。 2 多元線性回歸 2
3、.1多元線性回歸簡介 在實(shí)際問題中,某一因素的變化往往受到許多因素的影響,多元回歸分析的任務(wù)就是要找出這些因素之間的某種聯(lián)系。由于許多非線性的情形都可以通過變 換轉(zhuǎn)化為線性回歸來處理,因此,一般的實(shí)際問題都是基于多元線性回歸問題進(jìn)行處理的。對多元線性回歸模型簡要介紹如下: 如果隨機(jī)變量y與m(m22)個普通變量”?2Xm有關(guān),且滿足關(guān)系式: y=:0,桂:mXm.; E名=0,D名=仃2(2.1) 其中,432Pm產(chǎn)2是與X1,X2Xm無關(guān)的未知參數(shù),齒是不可觀測的 隨機(jī)變量,N(0產(chǎn) IN)。 式(2.1)為m元理論線性回歸模型,其中P。,再,比Pm為回歸系數(shù), Xi,X2Xm為回歸因子或設(shè)
4、計(jì)因子。Pi(i=1,2,m)實(shí)際上反映了因子 Xi(i=1,2,,m)對觀測值y的作用,因此也稱由(i=1,2,m)為因子 X(i=1,2,,m)的效應(yīng) 通過對回歸系數(shù)由(i=1,2,m)進(jìn)行最小二乘估計(jì)后,可以得到m元經(jīng)驗(yàn)回歸方程為: ?=?0ZX?2乂2?mXm (2.(2) 也稱式(2.2)為m元線性回歸方程。咒為回歸常數(shù),也稱回歸系數(shù),凡因2著稱為回歸系數(shù)。 2.2逐步回歸法 在多元線性回歸分析中,由于有多個自變量,回歸自變量的選擇成為建立回歸模型的重要問題。通常,一方面,為獲取全面信息總希望模型中包括的自變量盡可能多;另一方面,考慮到獲取很多自變量的觀測值的費(fèi)用和實(shí)際困難,則希 望
5、模型中包含盡可能少而且重要的變量。因此,人們常根據(jù)某種規(guī)則對自變量進(jìn) 行篩選。本次選用的方法是逐步回歸法。 1)回歸效果的顯著性檢驗(yàn) y與變量X1,X2Xm線性相關(guān)的密切程度可以用回歸平方和U在總平方和Lyy R2=土為樣本決定系數(shù)。在多元線性回歸的實(shí)際應(yīng)用中,用復(fù)相關(guān)系數(shù)來表示Lyy 回歸方程對原有數(shù)據(jù)擬合程度的好壞。顯然0MR21,其越接近1,回歸方程擬合程度越高。 2)偏F檢驗(yàn) 檢驗(yàn)?zāi)硞€自變量對y的影響是否顯著的正規(guī)方法是偏F檢驗(yàn)。 設(shè)原回歸方程(全模型)為: 尸?0?X1號X2彳Xy彳XN1X1%Xm 去掉變量 Xi后的新回歸方程(減模型)為: ?二3ZxiZx2?iXi彳Xi1,?m
6、Xm 全模型的復(fù)相關(guān)系數(shù)的平方為R2,減模型的復(fù)相關(guān)系數(shù)的平方為R2,定義 R:=R2-R2o若AR;幾乎為零,則說明x對y沒有顯著影響,反之則表示x對y有其它變量不可替代的顯著影響。 中所占的比例來衡量。稱 檢驗(yàn)假設(shè): H0:R2=0;H1:.R::0 當(dāng)H。為真時,檢驗(yàn)統(tǒng)計(jì)量為 lRi2?:八 Fi=2=-F(1,n-m-1) (1-R2)/(n-m-1)S2 對于給定顯著性水平a,由樣本計(jì)算出Fi的值, 若Fi之Fi也(1,n-m-1),則拒絕H。,說明x對y有顯著影響,應(yīng)在減模型中引入自變量x;反之則應(yīng)剔除x,使之成為減模型。 偏F檢驗(yàn)通常被用作變量篩選的依據(jù)。 逐步回歸法中就是對各變
7、量采用偏F法進(jìn)行檢驗(yàn)的。 3)逐步回歸法的步驟 逐步回歸法的基本思想是:將變量逐個引入,引入條件是該變量的偏F檢驗(yàn)是顯著的。同時,每引入一個新變量后又對老變量逐個檢驗(yàn),將變得不顯著的變量從回歸模型中剔除。 具體步驟如下: 1、對m個自變量分別與y建立回歸模型夕=f?,十片0)為,對它們分別計(jì)算 E,得Fi中最大的那個值,比如口 (I)如果 F1F 進(jìn),則計(jì)算結(jié)束,即 y 與所有自變量均線性無關(guān); (H)如果 FL1之 F 進(jìn),則引入 XL1,建立回歸方程 夕川1)+甲 Xi(2 2、建立y與自變量子集xL1,Xi(i#Li)的二元回歸模型 (2.4) 以式(2.4)為全模型,式(2.3)為減模
8、型求Fi值,并取得Fi中最大的那個值,比 如說 FL2。 (1如果 FLlr wMitn- (8) (1)財政收入與國內(nèi)生產(chǎn)總值散點(diǎn)圖;(2)財政收入與人口數(shù)散點(diǎn)圖; (3)財政收入與能源生產(chǎn)總量;(4)財政收入與農(nóng)作物總播種面積散點(diǎn)圖; (5)財政收入與貨運(yùn)量散點(diǎn)圖;(6)財政收入與出口總額散點(diǎn)圖; (7)財政收入與進(jìn)口總額散點(diǎn)圖;(8)財政收入與建筑業(yè)總產(chǎn)值散點(diǎn)圖 圖 1 財政收入與各種因素散點(diǎn)圖 由于多元逐步回歸分析方法是一種多元線性回歸方法,指標(biāo)變量若呈非線性關(guān)系則會影響模型精度。所以首先判斷因變量和自變量是否存在非線性關(guān)系。從 圖1可以看出,人口數(shù)X2與財政收入Y之間大致呈指數(shù)關(guān)系,
9、而農(nóng)作物總播種面積X4與財政收入Y之間的線性關(guān)系很不顯著,都是可以首先剔除的變量。其余變量錯誤!未找到引用源。都與財政收入Y具有線性作用且正相關(guān),需要通過逐步分析方法進(jìn)行進(jìn)一步的顯著性判斷。 線性回歸的結(jié)果及分析 利用統(tǒng)計(jì)數(shù)據(jù)建立回歸模型,用SPSS軟件的線性回歸分析功能,得到以下數(shù)據(jù)。由表3可以看出貨運(yùn)量、國內(nèi)生產(chǎn)總值和能源生產(chǎn)總量這三個自變量經(jīng)過逐步回歸過程被選擇進(jìn)入了回歸方程。被選擇的判據(jù)是變量進(jìn)入回歸方程的F 的概率不大于0.05,被剔除的判據(jù)是變量進(jìn)入回歸方程的F的概率不小于0.10。lgMOXiTr Kixciaxoj 跡總翻 rojjnivr- SfiHHsuxa7HKU00iK
10、HCOUiI包時弧 望就業(yè)總產(chǎn)越 表 3 輸入/移去的變量 模型 輸入的變量 移去的變量 方法 1 貨運(yùn)量(萬噸 步進(jìn)(準(zhǔn)則: F-to-enter 的概率=.100)。 2 國內(nèi)生產(chǎn)總值 (億元) 步進(jìn)(準(zhǔn)則: F-to-enter 的概率=.100)。 3 能源生產(chǎn)總量 (萬噸) 步進(jìn)(準(zhǔn)則: F-to-enter 的概率=.100)。 a.因變量:財政收入 表4顯示三個模型的擬合情況,模型3的復(fù)相關(guān)系數(shù)R=1.000,可決系數(shù) R2=0.999,調(diào)整可決系數(shù)為0.999,估計(jì)值的標(biāo)準(zhǔn)差為916.74710,可見模型3的擬合度較高。 表 4 模型匯總 模型 R R2 調(diào)整 R2 標(biāo)準(zhǔn)估計(jì)的
11、誤差 1 .999a .998 .998 1615.37929 2 1.000b .999 .999 1163.51991 3 1.000c .999 .999 916.74710 a.預(yù)測變量:(常量),貨運(yùn)量(萬噸) b.預(yù)測變量:(常量),貨運(yùn)量(萬噸),國內(nèi)生產(chǎn)總值(億元) c.預(yù)測變量:(常量),貨運(yùn)量(萬噸),國內(nèi)生產(chǎn)總值(億元),能源生產(chǎn)總量(萬噸) d.因變量:財政收入(億元) 從表5中看出方差分析結(jié)果可以看出,三個模型的F值檢驗(yàn)Sig值遠(yuǎn)小于0.01,可見,最終模型的整體線性關(guān)系是成立的。 表 5ANOVAd 模型 平方和 df 均方 F Sig. 1 回歸 2.044E10
12、 1 2.044E10 7832.197 .000a 殘差 41751204.003 16 2609450.250 總計(jì) 2.048E10 17 2 回歸 2.046E10 2 1.023E10 7556.322 .000b 殘差 20306678.791 15 1353778.586 總計(jì) 2.048E10 17 3 回歸 2.047E10 3 6.823E9 8117.999 .000c 殘差 11765953.531 14 840425.252 總計(jì) 2.048E10. 17 a.預(yù)測變量:(常量),貨運(yùn)量(萬噸) b.預(yù)測變量:(常量),貨運(yùn)量(萬噸),國內(nèi)生產(chǎn)總值(億元) c.預(yù)測變
13、量:(常量),貨運(yùn)量(萬噸),國內(nèi)生產(chǎn)總值(億元),能源生產(chǎn)總量(萬噸)d.因變量:財政收入(億元) 如表6所示,包含的是進(jìn)入模型的變量,主要描述模型的參數(shù)估計(jì)值,以及每個變量的系數(shù)估計(jì)值的顯著性檢驗(yàn)和共線性檢驗(yàn)。結(jié)果模型中所有變量系數(shù)的 t檢驗(yàn)Sig值都接近或小于0.01,說明這些系數(shù)都顯著的不為0,因此,最終的回歸方程應(yīng)當(dāng)包含貨運(yùn)量、國內(nèi)生產(chǎn)總值和能源生產(chǎn)總量這三個自變量,且方程擬和效果很好。 表 6 系數(shù) 模型 非標(biāo)準(zhǔn)化系數(shù) 標(biāo)準(zhǔn)系數(shù) t Sig. B 標(biāo)準(zhǔn)誤差 試用版 1 (常量) -39148.932 958.303 -40.852 .000 貨運(yùn)量(萬噸) .038 .000 .9
14、99 88.500 .000 2 (常量) -26904.767 3152.897 -8.533 .000 貨運(yùn)量(萬噸) .022 .004 .568 5.233 .000 國內(nèi)生產(chǎn)總值 (億元) .103 .026 .432 3.980 .001 3 (常量) -15515.418 4351.514 -3.566 .003 貨運(yùn)量(萬噸) .015 .004 .385 3.731 .002. 國內(nèi)生產(chǎn)總值 (億元) .176 .031 .737 5.744 .000 能源生產(chǎn)總量 (萬噸) -.060 .019 -.124 -3.188 .007 表 6 系數(shù) 模型 非標(biāo)準(zhǔn)化系數(shù) 標(biāo)準(zhǔn)系數(shù)
15、 t Sig. B 標(biāo)準(zhǔn)誤差 試用版 1 (常量) -39148.932 958.303 -40.852 .000 貨運(yùn)量(萬噸) .038 .000 .999 88.500 .000 2 (常量) -26904.767 3152.897 -8.533 .000 貨運(yùn)量(萬噸) .022 .004 .568 5.233 .000 國內(nèi)生產(chǎn)總值 (億元) .103 .026 .432 3.980 .001 3 (常量) -15515.418 4351.514 -3.566 .003 貨運(yùn)量(萬噸) .015 .004 .385 3.731 .002 國內(nèi)生產(chǎn)總值 (億元) .176 .031 .
16、737 5.744 .000 能源生產(chǎn)總量 (萬噸) -.060 .019 -.124 -3.188 .007 a.因變量:財政收入(億元) 如表7所示,給出的是所有未進(jìn)入最終模型的變量檢驗(yàn)信息,由t檢驗(yàn)的Sig 值都大于0.1,這些變量對模型的貢獻(xiàn)都不明顯,所以它們都不包含在最終方程中。 表 7 排除的變量 Model BetaIn t Sig. 偏相關(guān) 共線性統(tǒng)計(jì)量 容差 1 國內(nèi)生產(chǎn)總值 (億元) .432a 3.980 .001 .717 .006 能源生產(chǎn)總量 (萬噸) .043a .926 .369 .233 .061 出口總額(億元) .066a 1.929 .073 .446
17、.092 進(jìn)口總額(億 元) .076a 1.828 .088 .427 .064 建筑業(yè)總產(chǎn)值 (億元) -.051a -.195 .848 -.050 .002 2 能源生產(chǎn)總量 (萬噸) -.124b -3.188 .007 -.649 .027 出口總額(億 元) -.049b -1.117 .283 -.286 .034 進(jìn)口總額(億 元) -.037b -.779 .449 -.204 .030 建筑業(yè)總產(chǎn)值 (億元) .319b 1.660 .119 .406 .002 3 出口總額(億元) .073c 1.478 .163 .379 .016 進(jìn)口總額(億 元) .101c 2
18、.111 .055 .505 .014 建筑業(yè)總產(chǎn)值 (億元) .188c 1.142 .274 .302 .001 a模型中的預(yù)測變量:(常量),貨運(yùn)量(萬噸) b.模型中的預(yù)測變量:(常量),貨運(yùn)量(萬噸),國內(nèi)生產(chǎn)總值(億元) c 模型中的預(yù)測變量:(常量),貨運(yùn)量(萬噸),國內(nèi)生產(chǎn)總值(億元),能源生產(chǎn)總量(萬噸)d.因變量:財政收入 表 8 殘差統(tǒng)計(jì)量 極小值 極大值 均值 標(biāo)準(zhǔn)偏差 N 預(yù)測值 5652.1587 116279.0000 38679.2983 34698.46056 18 殘差 -1919.03113 1378.36218 .00000 831.93444 18 標(biāo)
19、準(zhǔn)預(yù)測值 -.952 2.236 .000 1.000 18 標(biāo)準(zhǔn)殘差 -2.093 1.504 .000 .907 18 a.因變量:財政收入(億元) 43N A Au3b u3b u_u_ Histogram 標(biāo)準(zhǔn)化殘差的P-P圖通過比較樣本殘差分布與假設(shè)的正態(tài)分布是否相同來檢 驗(yàn)殘差是否符合正態(tài)分布,所有殘差點(diǎn)都分布在對角的直線附近,說明殘差的正態(tài)性假設(shè)基本成立。 NormalP-PPlotofRegressionStandardizedResidual DependentVariable:財政收入 心07 0 Z2012/O2011 1.0 qoqod 30p0K*dxd 30p0K*
20、dx山 19 1006 20i 2000 1997 o.o 2002 oo 2Q0S 011995 /20090 rIT-r 0.00.2Q,40.60.B1,0 ObservedCumProb 圖3標(biāo)準(zhǔn)P-P圖 60000.00 年份 O1自 由sL1906 1997Oigsa 1999O2000 2001 2002口2003O2004 .?2QD5 200502007 200602009:2010O2011 2012 QOQQO1oaooo3 口口 QQQ StandardizedResidual 從圖4的的財政收入與其標(biāo)準(zhǔn)化殘差散點(diǎn)圖中可以看到,所有觀測量隨機(jī)地落 在垂直圍繞i2的范圍內(nèi),預(yù)測值與標(biāo)準(zhǔn)化殘差值之間沒有明顯的關(guān)系,所以回歸方程應(yīng)該滿足線性關(guān)系與方差齊性的假設(shè)且擬和效果較好。 最優(yōu)回歸方程 由以上多元回歸分析可得各個分量的影響關(guān)系,從而得出最優(yōu)”方程為: Y=-15515.418+0.176X1-0.060X3+0.015X5 其中R2=0.999,F=8117.999 X1代表國內(nèi)生產(chǎn)總值,X3代表能源生產(chǎn)總量,X5代表貨運(yùn)量 代入2011年數(shù)據(jù),可得 Y2011=-15515.418+0.176473
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 預(yù)防小學(xué)生犯罪課件圖片
- 小學(xué)安全教育案例分析
- 倉庫操作培訓(xùn)
- 項(xiàng)目申報知識培訓(xùn)課件
- 音頻處理技術(shù)課件
- 企業(yè)員工培訓(xùn)需求分析
- 銀行客戶經(jīng)理培訓(xùn)大綱
- 汽車配套產(chǎn)業(yè)基地項(xiàng)目節(jié)能評估報告(模板范文)
- 2025年結(jié)構(gòu)化布線系統(tǒng)的檢測設(shè)備項(xiàng)目合作計(jì)劃書
- 2025年柴油發(fā)電機(jī)組項(xiàng)目合作計(jì)劃書
- 胃息肉術(shù)后的護(hù)理查房
- 2025年4月版安全法律法規(guī)標(biāo)準(zhǔn)文件清單
- 四川成都?xì)v年中考作文題與審題指導(dǎo)(2005-2024)
- 等保測評服務(wù)人員配置方案
- 安徽省2024年普通高校招生普通本科批院校投檔分?jǐn)?shù)及名次(物理科目組合)
- LY/T 2071-2024人造板類產(chǎn)品生產(chǎn)綜合能耗
- 2024年反洗錢考試題庫及答案
- 售樓處物業(yè)經(jīng)理年終總結(jié)
- 物業(yè)員工夏季防暑培訓(xùn)
- 水廠反恐培訓(xùn)教材
- 品管圈PDCA改善案例-降低住院患者跌倒發(fā)生率
評論
0/150
提交評論