回歸分析 系統(tǒng)工程_第1頁
回歸分析 系統(tǒng)工程_第2頁
回歸分析 系統(tǒng)工程_第3頁
回歸分析 系統(tǒng)工程_第4頁
回歸分析 系統(tǒng)工程_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、北京市農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的逐步回歸分析姓名: 學(xué)號:摘 要:農(nóng)業(yè)生產(chǎn)和農(nóng)村經(jīng)濟(jì)是國民經(jīng)濟(jì)的基礎(chǔ),影響農(nóng)村經(jīng)濟(jì)總產(chǎn)值的因素有多種,主要包括農(nóng)林牧漁業(yè)。本文以北京市農(nóng)業(yè)生產(chǎn)和農(nóng)村經(jīng)濟(jì)總產(chǎn)值為對象,首先分析了各種因素的線性相關(guān)性,建立回歸模型,再利用逐步回歸法進(jìn)行回歸分析,得到最符合實際情況的回歸模型。以SPSS 17.0為分析工具,給出了實驗結(jié)果,并用預(yù)測值驗證了結(jié)論的正確性。關(guān)鍵詞:農(nóng)業(yè)生產(chǎn)和農(nóng)村經(jīng)濟(jì),線性回歸模型,逐步回歸分析,SPSS1. 引言農(nóng)林牧漁業(yè)統(tǒng)計范圍包括轄區(qū)內(nèi)全部農(nóng)林牧漁業(yè)生產(chǎn)單位、非農(nóng)行業(yè)單位附屬的農(nóng)林牧漁業(yè)生產(chǎn)活動單位以及農(nóng)戶的農(nóng)業(yè)生產(chǎn)活動。軍委系統(tǒng)的農(nóng)林牧漁業(yè)生產(chǎn)(除軍馬外)也

2、應(yīng)包括在內(nèi),但不包括農(nóng)業(yè)科學(xué)試驗機(jī)構(gòu)進(jìn)行的農(nóng)業(yè)生產(chǎn)。在近幾年中國經(jīng)濟(jì)快速增長的帶動下,各地區(qū)農(nóng)林牧漁業(yè)也得到了突飛猛進(jìn)的發(fā)展。以北京地區(qū)為例,2005年的農(nóng)業(yè)總產(chǎn)值為1993年的6倍。因此用統(tǒng)計方法研究分析農(nóng)業(yè)總產(chǎn)值對指導(dǎo)國民經(jīng)濟(jì)生產(chǎn),合理有效的進(jìn)行產(chǎn)業(yè)布局,提高生產(chǎn)力等有著重要意義。表1 北京市農(nóng)業(yè)經(jīng)濟(jì)產(chǎn)值及各產(chǎn)品產(chǎn)量統(tǒng)計數(shù)據(jù)本文以北京市農(nóng)生產(chǎn)為對象,分析了農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與糧食產(chǎn)量、棉花產(chǎn)量、油料產(chǎn)量、蔬菜產(chǎn)量、干鮮果品產(chǎn)量、豬牛羊肉產(chǎn)量、禽蛋產(chǎn)量、水產(chǎn)品產(chǎn)量的關(guān)系,并建立農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的回歸模型。表1中列出了1999年至2008年間的統(tǒng)計數(shù)據(jù)(數(shù)據(jù)來源于北京統(tǒng)計信息網(wǎng))。2. 線性回歸模型

3、的建立2.1 線性回歸模型的假設(shè)為了研究農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與各種農(nóng)生產(chǎn)量的關(guān)系,必須要建立二者之間的數(shù)學(xué)模型。數(shù)學(xué)模型可以有多種形式,比如線性模型,二次模型,指數(shù)模型,對數(shù)模型等等。而實際生活中,影響農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的因素很多,并且這些因素的影響不能簡單的用某一種模型來描述,所以要建立農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的數(shù)學(xué)模型往往是很難的。但是為了便于研究,我們可以先假定一些前提條件,然后在這些條件下得到簡化后的近似模型。以下我們假定兩個前提條件:1) 農(nóng)產(chǎn)品的價格是不變的。這樣我們可以認(rèn)為每一種農(nóng)產(chǎn)品的總產(chǎn)值將與產(chǎn)品的總產(chǎn)量成正的線性關(guān)系。2) 每一種農(nóng)產(chǎn)品的總產(chǎn)值對于農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的貢獻(xiàn)都是很大的。因此可以根據(jù)每

4、種產(chǎn)品的總產(chǎn)值預(yù)測農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值。即農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與每種產(chǎn)品的總產(chǎn)值成正的線性關(guān)系。由以上兩個假設(shè),我們可以建立農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與各種農(nóng)產(chǎn)品生產(chǎn)量的線性回歸模型,模型如下: (1)其中,是因變量, 是自變量,是各個自變量的系數(shù)。各變量符號的定義見表2。表2 線性回歸模型中各變量的含義農(nóng)林牧漁業(yè)總產(chǎn)值糧 食棉 花油 料蔬 菜干鮮果品豬牛羊肉禽蛋產(chǎn)量水產(chǎn)品2.2 線性回歸模型的驗證以上,我們通過假設(shè)兩個前提條件得到了農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與各種農(nóng)生產(chǎn)量的線性回歸模型。然而這些假設(shè)是否合理,模型又是否能很好的近似實際的經(jīng)濟(jì)情況,我們需要進(jìn)一步的驗證。作數(shù)據(jù)散點圖,觀察因變量與自變量之間關(guān)系是否有線性特點。散點

5、圖結(jié)果如圖1所示。(a) (b)(c) (d)(e) (f) (g) (h)圖1 因變量與各自變量的散點圖(a)農(nóng)業(yè)總產(chǎn)值與糧食產(chǎn)量散點圖;(b)農(nóng)業(yè)總產(chǎn)值與棉花產(chǎn)量散點圖;(c)農(nóng)業(yè)總產(chǎn)值與油料產(chǎn)量散點圖;(d)農(nóng)業(yè)總產(chǎn)值與蔬菜散點圖;(e)農(nóng)業(yè)總產(chǎn)值干鮮果品產(chǎn)量散點圖;(f)農(nóng)業(yè)總產(chǎn)值與豬牛羊肉產(chǎn)量散點圖;(g)農(nóng)業(yè)總產(chǎn)值與禽蛋產(chǎn)量散點圖;(h)農(nóng)業(yè)總產(chǎn)值與水產(chǎn)品產(chǎn)量散點圖從圖1中不難發(fā)現(xiàn),農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與糧食產(chǎn)量、蔬菜產(chǎn)量、干鮮果品產(chǎn)量、豬牛羊肉產(chǎn)量具有良好的線性關(guān)系,而與棉花產(chǎn)量、油料產(chǎn)量和禽蛋產(chǎn)量沒有明確的線性關(guān)系。水產(chǎn)品產(chǎn)量雖然與農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值呈現(xiàn)較強(qiáng)的線性關(guān)系,但是二者是負(fù)相關(guān)的

6、,即布產(chǎn)量越大,農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值越小,這樣不符合我們建立線性回歸模型的初衷,也與建立模型的兩個假設(shè)相背。經(jīng)分析,某些變量與農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值不呈正的線性相關(guān)的原因主要有兩個:1) 與第一個假設(shè)相背。即這些農(nóng)產(chǎn)品的價格并不是一個常數(shù),而會隨著時間的推移、生產(chǎn)工藝的改進(jìn)、產(chǎn)品的淘汰等原因產(chǎn)生變動。當(dāng)價格變動范圍較大時,產(chǎn)品的總產(chǎn)值和總產(chǎn)量就不是線性關(guān)系了,應(yīng)當(dāng)用別的模型來近似。2) 與第二個假設(shè)相背。即這些農(nóng)產(chǎn)品的總產(chǎn)值對于農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的貢獻(xiàn)非常小,以至于某種農(nóng)產(chǎn)品總產(chǎn)值的變化不足以引起農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的變化。如圖1,可以明顯發(fā)現(xiàn)最后三種輕農(nóng)產(chǎn)品的產(chǎn)量與農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值都不具有良好的正的線性關(guān)系,而前六種

7、重農(nóng)產(chǎn)品中有五種與農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值呈現(xiàn)強(qiáng)的線性關(guān)系,說明重農(nóng)在農(nóng)業(yè)經(jīng)濟(jì)中占的比重比輕農(nóng)要大。在后來的逐步回歸分析結(jié)果中我們可以看到,這些不符合假設(shè)條件,與農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值呈弱的或者負(fù)的線性關(guān)系的自變量都被排除到回歸模型之外了。但是并不是說所有與因變量呈強(qiáng)線性關(guān)系的自變量都在回歸模型中,在最終確定回歸方程之前還應(yīng)當(dāng)應(yīng)當(dāng)用逐步回歸方法進(jìn)行分析。3逐步回歸分析3.1 線性回歸的方法線性回歸是描述一個因變量Y與一個或多個自變量X之間的線性依存關(guān)系。根據(jù)一批樣本值來估計這種線性關(guān)系,建立回歸方程,用回歸方程進(jìn)行預(yù)測和控制。在多元線性回歸分析中,選擇“最優(yōu)”回歸方程的方法有強(qiáng)行進(jìn)入法、消去法、向前選擇法、向后

8、剔除法和逐步回歸法。1) 強(qiáng)行進(jìn)入法:選擇的自變量全部進(jìn)入回歸模型。2) 消去法:建立回歸方程時,根據(jù)設(shè)定的條件剔除部分自變量。3) 向前選擇法:從模型中無自變量開始,然后設(shè)定判據(jù),每次將一個最符合判據(jù)的變量引入模型,直至所有符合判據(jù)的變量都進(jìn)入模型為止。4) 向后剔除法:先建立全模型,然后設(shè)定判據(jù),每次剔除一個最不符合進(jìn)入模型判據(jù)的變量。5) 逐步回歸法:向前選擇法和向后剔除法的結(jié)合,先設(shè)定判據(jù),選擇符合判據(jù)且對因變量貢獻(xiàn)最大的自變量進(jìn)入回歸方程,然后根據(jù)向后剔除法,將模型中貢獻(xiàn)最小的且符合剔除判據(jù)的變量剔除出模型,重復(fù)進(jìn)行直到回歸方程中的自變量均符合進(jìn)入模型的判據(jù),模型外的都不符合進(jìn)入模型

9、的判據(jù)為止。本實驗采用逐步回歸法。3.2 線性回歸的結(jié)果及分析利用表1中的數(shù)據(jù)建立回歸模型,用SPSS軟件的線性回歸分析功能,得到以下數(shù)據(jù)。表3中可以看出糧食產(chǎn)量、蔬菜產(chǎn)量和干鮮果品產(chǎn)量這三個自變量經(jīng)過逐步回歸過程被選擇進(jìn)入了回歸方程。選擇的判據(jù)是變量進(jìn)入回歸方程的F的概率不大于0.05,剔除的判據(jù)是變量進(jìn)入回歸方程的F的概率不小于0.10。選擇的過程是,最先引入了變量,建立了模型1;接著引入變量,沒有變量被剔除,建立了模型2(含有、);最后引入變量,沒有變量被剔除,建立了模型3,故最終的模型中含有變量、。表3 引入或從模型中剔除的變量輸入移去的變量a模型輸入的變量移去的變量方法1糧 食.步進(jìn)

10、(準(zhǔn)則: F-to-enter 的概率 = .100)。2干鮮果品.步進(jìn)(準(zhǔn)則: F-to-enter 的概率 = .100)。3蔬 菜.步進(jìn)(準(zhǔn)則: F-to-enter 的概率 = .100)。a. 因變量: 農(nóng)林牧漁業(yè)總產(chǎn)值表4 擬合過程小結(jié)模型匯總模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差1.986a.972.9695.42672.998b.996.9942.27613.999c.998.9971.6835a. 預(yù)測變量: (常量), 糧 食。b. 預(yù)測變量: (常量), 糧 食, 干鮮果品。c. 預(yù)測變量: (常量), 糧 食, 干鮮果品, 蔬 菜。表4顯示各模型的擬合情況,模型3的復(fù)

11、相關(guān)系數(shù)R=0.999,可決系數(shù)=0.998,調(diào)整可決系數(shù)為0.997,估計值的標(biāo)準(zhǔn)差為1.6835。可見模型3的擬合度較高,變量、的作用顯著。表5顯示各模型的方差分析結(jié)果。方差分析結(jié)果表明,當(dāng)回歸方程為模型1、2、3時,其顯著性概率值均小于0.001,即拒絕總體回歸系數(shù)均為0的原假設(shè)。因此,最終的回歸方程應(yīng)當(dāng)包含糧食產(chǎn)量, 干鮮果品產(chǎn)量, 蔬菜產(chǎn)量這3個自變量,且方程擬和效果很好。表5 方差分析Anovad模型平方和df均方FSig.1回歸8190.90218190.902278.136.000a殘差235.594829.449總計8426.49692回歸8390.23124195.1168

12、09.766.000b殘差36.26575.181總計8426.49693回歸8409.49132803.164989.048.000c殘差17.00562.834總計8426.4969a. 預(yù)測變量: (常量), 糧 食。b. 預(yù)測變量: (常量), 糧 食, 干鮮果品。c. 預(yù)測變量: (常量), 糧 食, 干鮮果品, 蔬 菜。d. 因變量: 農(nóng)林牧漁業(yè)總產(chǎn)值表6顯示方程外各模型變量的有關(guān)統(tǒng)計量,即標(biāo)準(zhǔn)化偏回歸系數(shù)Beta、回歸系數(shù)顯著性檢驗的t值、P(Sig)值、偏相關(guān)系數(shù)Partial Correlation、共線性統(tǒng)計的容差Collinearity statistic Toleran

13、ce。可見,模型3方程外的各變量偏回歸系數(shù)經(jīng)檢驗,P值均大于0.11,故不能引入方程。表6 逐步回歸過程中不在方程中的變量已排除的變量d模型Beta IntSig.偏相關(guān)共線性統(tǒng)計量容差VIF最小容差1棉 花.101a1.948.092.593.9711.030.971油 料-.054a-.654.534-.240.5461.832.546蔬 菜.497a4.071.005.838.08012.542.080干鮮果品.277a6.203.000.920.3093.238.309豬牛羊肉.426a1.030.337.363.02049.373.020禽蛋產(chǎn)量.094a1.519.173.498.

14、7791.284.779水產(chǎn)品-.142a-1.367.214-.459.2923.428.2922棉 花.012b.351.738.142.6261.597.199油 料-.034b-1.021.347-.385.5411.850.261蔬 菜.232b2.607.040.729.04223.638.042豬牛羊肉.200b1.147.295.424.01951.834.019禽蛋產(chǎn)量.015b.433.680.174.6021.660.191水產(chǎn)品-.059b-1.273.250-.461.2633.798.2193棉 花.027c1.165.297.462.5941.685.040油 料

15、.000c-.015.988-.007.3932.544.031豬牛羊肉-.029c-.158.881-.070.01286.500.012禽蛋產(chǎn)量-.008c-.299.777-.133.5261.900.037水產(chǎn)品.011c.196.852.087.1377.293.022a. 模型中的預(yù)測變量: (常量), 糧 食。b. 模型中的預(yù)測變量: (常量), 糧 食, 干鮮果品。c. 模型中的預(yù)測變量: (常量), 糧 食, 干鮮果品, 蔬 菜。d. 因變量: 農(nóng)林牧漁業(yè)總產(chǎn)值表7顯示各模型的偏回歸系數(shù)B、標(biāo)準(zhǔn)差Std. Error、常數(shù)Constant、標(biāo)準(zhǔn)化偏回歸系數(shù)Beta、回歸系數(shù)顯

16、著性檢驗的t值和P(Sig)值。按照模型3建立的多元線性回歸方程為: (2)方程中的常數(shù)項,偏回歸系數(shù)、,經(jīng)t檢驗、的P值分別為0.000、0.000、0.005、0.040,按=0.10水平,均有顯著性意義。表7 回歸計算過程中各方程系數(shù)表系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計量B標(biāo)準(zhǔn) 誤差試用版容差VIF1(常量)127.0896.21020.466.000糧 食.946.057.98616.677.0001.0001.0002(常量)91.8646.24814.704.000糧 食.725.043.75616.940.000.3093.238干鮮果品.717.116.2776

17、.203.000.3093.2383(常量)84.8655.34415.879.000糧 食.576.065.6008.794.000.07213.846干鮮果品.507.117.1964.323.005.1646.103蔬 菜.094.036.2322.607.040.04223.638a. 因變量: 農(nóng)林牧漁業(yè)總產(chǎn)值表8顯示殘差統(tǒng)計的結(jié)果,標(biāo)準(zhǔn)化殘差的絕對值最大為1.286,小于設(shè)定值3。如超過3,則顯示具體觀察單位Case number 的標(biāo)準(zhǔn)化殘差,以幫助發(fā)現(xiàn)離群點。表8 殘差統(tǒng)計量殘差統(tǒng)計量a極小值極大值均值標(biāo)準(zhǔn) 偏差N預(yù)測值179.029272.737226.62030.56781

18、0標(biāo)準(zhǔn) 預(yù)測值-1.5571.509.0001.00010預(yù)測值的標(biāo)準(zhǔn)誤差.6321.3671.043.22710調(diào)整的預(yù)測值175.986270.603226.16830.740210殘差-2.16421.7404.00001.374610標(biāo)準(zhǔn) 殘差-1.2861.034.000.81610Student 化 殘差-1.5541.599.0951.09810已刪除的殘差-3.16404.6143.45162.596010Student 化 已刪除的殘差-1.8361.928.1271.20610Mahal 距離.3685.0362.7001.49510Cook 的距離.0001.239.28

19、0.38510居中杠桿值.041.560.300.16610a. 因變量: 農(nóng)林牧漁業(yè)總產(chǎn)值圖2 農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的預(yù)測值與其Student化殘差散點圖從圖2的農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的預(yù)測值與其Student化殘差散點圖中可以看到,所有觀測量隨機(jī)地落在垂直圍繞2的范圍內(nèi),預(yù)測值與Student化殘差值之間沒有明顯的關(guān)系,所以回歸方程應(yīng)該滿足線性與方差齊性的假設(shè)且擬和效果較好。3.3 線性回歸的結(jié)果及分析多元線性回歸方程為:代入2006年的統(tǒng)計數(shù)據(jù),得到2006年農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值的實際值為8210.0億元,誤差為可見回歸模型的預(yù)測還是比較準(zhǔn)確的。4總結(jié)與討論本文以北京市農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值為例,分析了農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與各種農(nóng)產(chǎn)品產(chǎn)量的關(guān)系。首先分析了農(nóng)業(yè)經(jīng)濟(jì)總產(chǎn)值與各種農(nóng)產(chǎn)量的線性關(guān)系,建立了線性回歸模型,再利用逐步回歸法進(jìn)行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論