線性回歸模型在工業(yè)生產(chǎn)總值預測中應用_第1頁
線性回歸模型在工業(yè)生產(chǎn)總值預測中應用_第2頁
線性回歸模型在工業(yè)生產(chǎn)總值預測中應用_第3頁
線性回歸模型在工業(yè)生產(chǎn)總值預測中應用_第4頁
線性回歸模型在工業(yè)生產(chǎn)總值預測中應用_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、南 昌 工 程 學 院畢 業(yè) 設 計 (論 文) 理學系 系(院) 信息與計算科學 專業(yè)論文題目 多元回歸模型及其在工業(yè)生產(chǎn)總值預測中的應用研究學生姓名 班 級 學 號 指導教師 多元回歸模型及其在工業(yè)生產(chǎn)總值預測中的應用研究Multiple regression model and its application in industrial production prediction總計 論 文 26 頁 表 格 7 個 插 圖 2 副摘 要 經(jīng)濟指標預測是一項具有挑戰(zhàn)性的研究工作。本文利用多元回歸模型研究經(jīng)濟指標影響因素,并為資源優(yōu)化配置提供一定參考意見。以中國各省制造業(yè)工業(yè)生產(chǎn)總值為研究

2、對象,依據(jù)背景知識選取七個自變量:朔料制品、水泥、玻璃、原煤、生鐵、粗鋼、鋼筋、盤條,建立多元線性回歸模型。再通過觀測獲取n組觀測數(shù)據(jù),應用最小二乘法求出回歸參數(shù)估計值。運用回歸方程的顯著性檢驗,回歸系數(shù)的顯著性檢驗,多重共線性檢驗,異方差檢驗等檢驗方法法刪除不符合線性關系的自變量或得到更符合實際關系的多元線性模型。關鍵詞:工業(yè)生產(chǎn)總值,多元回歸模型,資源優(yōu)化配置,經(jīng)濟預測。AbstractEconomic index prediction is a challenging research work. In this paper, using multivariate regression

3、model of factors influencing economic index, and optimal allocation of resources to provide a certain reference. In China manufacturing industry gross industrial production as the research object, based on the background knowledge of selected seven variables: Schaumburg material products, cement, gl

4、ass, coal, pig iron, crude steel, rebar, wire rod, established a multiple linear regression model. Through observation to obtain the N groups of observation data, the application of the least squares method to get regression parameter estimation. Application of significance test of regression equati

5、on the significance test of regression coefficients, the multicollinearity of inspection, testing for heteroscedasticity test method to delete not consistent with the linear relationship between variables or get more accord with real relationship in the multivariate linear model.Key word: Gross indu

6、strial production; multiple regression model;optimize the allocation of resources;economic forecasting.目 錄 TOC o 1-3 h z u HYPERLINK l _Toc326224939摘 要 PAGEREF _Toc326224939 h - = 1 * ROMAN I -HYPERLINK l _Toc326224940Abstract PAGEREF _Toc326224940 h - = 2 * ROMAN II -HYPERLINK l _Toc326224941第一章 引言

7、 PAGEREF _Toc326224941 h - 1 -HYPERLINK l _Toc3262249421.1 工業(yè)生產(chǎn)總值簡介 PAGEREF _Toc326224942 h - 1 -HYPERLINK l _Toc3262249431.2回歸分析思想 PAGEREF _Toc326224943 h - 2 -HYPERLINK l _Toc326224944第二章 多元線性回歸模型 PAGEREF _Toc326224944 h - 3 -HYPERLINK l _Toc326224945第三章 多元線性回歸的參數(shù)估計 PAGEREF _Toc326224945 h - 5 -HY

8、PERLINK l _Toc3262249463.1 參數(shù)的最小二乘估計 PAGEREF _Toc326224946 h - 5 -HYPERLINK l _Toc3262249473.2 最小二乘估計的性質(zhì) PAGEREF _Toc326224947 h - 6 -HYPERLINK l _Toc326224948第四章 模型的檢驗及修正 PAGEREF _Toc326224948 h - 7 -HYPERLINK l _Toc3262249494.1 回歸方程的顯著性 PAGEREF _Toc326224949 h - 7 -HYPERLINK l _Toc3262249504.2 回歸系

9、數(shù)的顯著性 PAGEREF _Toc326224950 h - 8 -HYPERLINK l _Toc3262249514.3 多重共線性檢驗 PAGEREF _Toc326224951 h - 9 -HYPERLINK l _Toc3262249524.4 異方差檢驗 PAGEREF _Toc326224952 h - 11 -HYPERLINK l _Toc3262249534.5異方差的修正方法 PAGEREF _Toc326224953 h - 12 -HYPERLINK l _Toc326224954第五章 回歸擬合度 PAGEREF _Toc326224954 h - 14 -HY

10、PERLINK l _Toc3262249555.1 決定系數(shù) PAGEREF _Toc326224955 h - 14 -HYPERLINK l _Toc3262249565.2 決定系數(shù)的性質(zhì)和修正決定系數(shù) PAGEREF _Toc326224956 h - 15 -HYPERLINK l _Toc326224957第六章 工業(yè)生產(chǎn)總值預測模型分析 PAGEREF _Toc326224957 h - 17 -HYPERLINK l _Toc3262249586.1 SPSS簡介 PAGEREF _Toc326224958 h - 17 -HYPERLINK l _Toc3262249596

11、.2模型建立和數(shù)據(jù)搜集 PAGEREF _Toc326224959 h - 17 -HYPERLINK l _Toc3262249616.3基于SPSS的回歸分析實現(xiàn) PAGEREF _Toc326224961 h - 19 -HYPERLINK l _Toc3262249626.4統(tǒng)計檢驗 PAGEREF _Toc326224962 h - 19 -HYPERLINK l _Toc3262249636.5異方差檢驗及修正 PAGEREF _Toc326224963 h - 21 -HYPERLINK l _Toc3262249646.6 模型意義 PAGEREF _Toc326224964

12、h - 22 -HYPERLINK l _Toc326224965結(jié) 論 PAGEREF _Toc326224965 h - 24 -HYPERLINK l _Toc326224966參 考 文 獻 PAGEREF _Toc326224966 h - 25 -第一章 引言隨著科學技術(shù)的進步和社會的發(fā)展,在處理工業(yè)、經(jīng)濟、農(nóng)業(yè)和醫(yī)學等方面的問題的時候,需要研究影響問題的多個因素是如何作用于實際問題的,以及這些因素相互之間的關系。也就是因為實際問題大都是多因素影響的,所以我們主要致力于研究如何用多元回歸分析解決問題。多元回歸分析是一種綜合分析方法,它依靠統(tǒng)計軟件能很方便的對問題進行分析,所以隨著電

13、子計算機技術(shù)的普及,它的應用越來越廣泛。1本文先對工業(yè)生產(chǎn)總值和回歸分析的思想進行簡要介紹,然后描述了如何通過最小二乘法建立多元回歸模型,再通過回歸方程顯著性、回歸系數(shù)顯著性、多重共線性檢驗和異方差檢驗等顯著性檢驗法對求得的多元回歸模型進行檢驗最后得到最終模型。本文主要是先闡述多元回歸分析的理論知識,然后運用這些知識應用到具體的問題中。用SPSS軟件求出工業(yè)生產(chǎn)總值預測的回歸模型。通過該模型就可以知道在我國主要的制造業(yè)哪個行業(yè)對工業(yè)生產(chǎn)總值影響最重,哪個行業(yè)對工業(yè)生產(chǎn)總值影響最輕。如此在進行資源分配時就可以優(yōu)先對影響重的行業(yè)優(yōu)先分配。本文參考了許多相關的書籍和文獻,但由于作者的水平有限,本文存

14、在一些紕漏,希望能得到完善。1.1 工業(yè)生產(chǎn)總值簡介工業(yè)生產(chǎn)總值是以貨幣的形式表現(xiàn)出在一個報告期內(nèi)工業(yè)企業(yè)的產(chǎn)品的總量,它是在國家一年終了時進行工業(yè)產(chǎn)品統(tǒng)計中是很重要的一項指標,可以使政府從數(shù)值上了解一個地區(qū)的工業(yè)生產(chǎn)規(guī)模、一個地區(qū)經(jīng)濟繁榮程度,如果這項指標出現(xiàn)錯誤將會影響到國家對工業(yè)產(chǎn)品一年增加值以及工業(yè)產(chǎn)品銷售率等指數(shù)的計算。因此對工業(yè)生產(chǎn)總值進行預測是一件非常重要、有意義的事,如果我們能夠做好對一個地區(qū)的工業(yè)生產(chǎn)總值的預測有助于政府制定國民經(jīng)濟發(fā)展計劃,合理分配有限資源。5 當我們在計算工業(yè)生產(chǎn)總值時根據(jù)所用的價格不同,可以分為不變價工業(yè)生產(chǎn)總值和現(xiàn)價工業(yè)生產(chǎn)總值。所謂不變價工業(yè)生產(chǎn)總值

15、就是在計算各個不同時期的工業(yè)生產(chǎn)總值時,對某一種產(chǎn)品先選定曾經(jīng)某一個時期的工業(yè)產(chǎn)品的價格作為標準,而其他時期的這種產(chǎn)品也以這個標準計算其生產(chǎn)總值,我們把這個標準叫做不變價。采用不變價計算工業(yè)生產(chǎn)總值可以使我們計算現(xiàn)在和將來的價格有一個恒定的比較標準,消除了價格變動的影響;現(xiàn)價工業(yè)生產(chǎn)總值則是在計算工業(yè)生產(chǎn)總值時,采用計算的當年產(chǎn)品實際銷售價格計算工業(yè)生產(chǎn)總值。工業(yè)生產(chǎn)總值的構(gòu)成包括:成品價值、對外加工費收入、自制半成品、在產(chǎn)品期末期初差額價值。1.2回歸分析思想多元回歸分析思想是一種在現(xiàn)實生活中應用性很強的思想。它是人們依靠已掌握的知識和經(jīng)驗通過定性分析尋找出與要研究的問題有關的變量,再通過收

16、集大量的數(shù)據(jù),用數(shù)理統(tǒng)計的方法對這些數(shù)據(jù)進行觀測,并應用一定的方法來確定各變量之間的關系的科學方法。因為現(xiàn)實生活問題大多涉及多個影響因素,所以這種思想經(jīng)常用到。9回歸問題根據(jù)變量之間是否存在線性關系可以分為線性回歸和非線性回歸,又根據(jù)變量的數(shù)量可以分為一元回歸和多元回歸,而我們所研究的實際問題大多都是多元非線性回歸,而我們并沒有合適的方法直接對多元非線性回歸進行研究,因此我們要找到合適的模型和方法將多元非線性回歸轉(zhuǎn)變?yōu)槎嘣€性回歸。7回歸分析預測時先對所要研究的經(jīng)濟預測對象進行定性分析,找出研究對象的一個或多個影響因素,再去掉那些對經(jīng)濟問題影響很小的因素,留下影響大的因素。然后引進待定系數(shù)b,

17、建立待定回歸方程。最后搜集研究對象及其影響因素的數(shù)據(jù),再對這些數(shù)據(jù)進行定量分析,求出待定系數(shù)b,最后得到預測回歸模型。6第二章 多元線性回歸模型我們可以把一元線性回歸看作是多元線性回歸的一個特例,其模型一般形式是:。多元線性回歸是描述一個因變量和多個自變量的關系。我們可以設已知自變量和因變量y,多元線性回歸模型的一般形式是: 2-4 (2.1) 公式中的,是回歸系數(shù),它們是待估計參數(shù),u是隨機變量。因為我們進行回歸分析需要N組觀測值()k=1,2,3N.給出回歸分析系數(shù)的估計值,則多元樣本回歸函數(shù)為: (2.2)回歸殘差為因變量與其估計值的差: 。 (2.3) 將上面所說的N組觀測值代入方程則

18、可得N個方程,如下:其中是N個相互獨立且服從同一正態(tài)分布的隨機變量。設, , , 則矩陣方程為:。模型假設由于現(xiàn)實動力系統(tǒng)錯綜復雜,很難建立相應的多元回歸模型,如果我們建立的模型存在錯誤則最后得到的結(jié)果很難保證它的價值和有效性,當我們用這些錯誤的模型應用到實際問題中進行預測時,就會做出錯誤的決斷。為了保證所建立的模型的準確性,需要對模型做如下假設:20因變量和自變量存在線性關系:,是隨機誤差項。2. 隨機誤差項 的方差的大小與k無關,為一個常數(shù)。, k=1,2,N成立。3. ,k=1,2,N成立。即各組的觀測值的隨機誤差項的數(shù)學期望為零。4. 隨機誤差項服從正態(tài)分布。5. 對不同組的數(shù)據(jù)求得的

19、隨機誤差項是線性不相關的,即。6. 對每一個解釋變量與任何一個隨機誤差項都是線性不相關, 即 。第三章 多元線性回歸的參數(shù)估計3.1 參數(shù)的最小二乘估計與一元線性回歸方程的參數(shù)估計原理是一樣的,多元線性回歸方程的未知參數(shù),的估計方法也可以用最小二乘估計法。所謂最小二乘估計法,就是尋找出,的估計值,使,的離差平方和最小,那么,滿足條件 8 (3.1)可以求得回歸參數(shù),的最小二乘估計值,。 因為Q是關于,的非負二次函數(shù),它的最小值總是存在的,應該滿足下列方程組:引進參數(shù)估計量,解釋變量回歸值,回歸殘差.然后把樣本數(shù)據(jù)代入回歸方程可得:則回歸殘差項的向量為:殘差平方和的向量為: 。求對,的偏導數(shù)得:

20、 。整理得: 當?shù)哪婢仃嚧嬖跁r,最小二乘估計可以表示為: 。10-123.2 最小二乘估計的性質(zhì)多元回歸分析的最小二乘估計的性質(zhì)有以下幾點:線性,即估計量為隨即變量Y的線性函數(shù).在多元線性回歸中,回歸系數(shù)的估計量 ,根據(jù)模型假設知道,X是固定的矩陣,故與Y是線性關系。 無偏性,即與B是無偏估計。 , 和是無偏估計。. 在滿足和的條件下,B的線性函數(shù)的最小方差線性無偏估計為 , 是任一(p+1)維常數(shù)向量。 .說明估計值與殘差值u是不相關的。 當滿足時,,和獨立。第四章 模型的檢驗及修正面對實際問題中錯綜復雜的關系的研究,我們并不能事先判斷變量y與變量之間是否有線性關系。在進行回歸參數(shù)估計前,用

21、方程去擬合因變量y與自變量的關系,這只是我們經(jīng)過定性分析做出的假設,而定性分析的自主性很強,所以這樣得到的回歸方程很可能存在錯誤,并不能作為最終的結(jié)果。因此在我們求出線性回歸方程后,為了消除一些錯誤的變量給回歸方程帶來的影響,我們還需要對方程進行顯著性檢驗。4.1 回歸方程的顯著性 多元線性回歸方程的顯著性檢驗就是進行模型總體顯著性檢驗,要看從整體上是否對隨機變量y有影響。我們可以做出假設 13如果H0被接受,則表明因變量y與自變量的線性回歸模型沒有意義。通過總離差平方和分解法,可以構(gòu)造對H0進行檢驗的統(tǒng)計量。 (4.1)我們引進三個新的變量,。并設置為:總的偏差平方和: 回歸平方和: 殘差平

22、方和: 平方和分解式可簡寫為: 構(gòu)造F檢驗統(tǒng)計量 15,16 (4.2)對于給定的顯著水平a,當F值大于臨界值時,拒絕H0,回歸方程顯著,即x與y有顯著的線性關系。4.2 回歸系數(shù)的顯著性 本節(jié)主要研究每個自變量是否對應變量y的影響顯著,這就需要對每個自變量進行顯著性假設:, j=1,2,p若接受H0j,則不顯著;若拒絕,則顯著。設,令,i,j=0,1,p,可知,由此可構(gòu)造統(tǒng)計量t 15,16其標準差 (4.3)當成立,統(tǒng)計量服從n-p-1的t分布。給定顯著性水平a,當,拒絕假設,對y影響顯著;當,接受假設,對y影響不顯著。4.3 多重共線性檢驗多重共線性的介紹: 如今我們所研究的經(jīng)濟問題復雜

23、性很高,各個因素之間都可能存在線性或非線性關系。如果只是關注因變量和自變量的線性關系還不能說明問題的復雜性,因為除了因變量和自變量存在線性關系,自變量之間也存在線性關系,這就是多重共線性。多元線性回歸模型的矩陣形式為,我們對自變量X的基本假定是矩陣的各列向量是線性無關的。即,相當于。當假定不滿足時,我們稱該模型存在多重共線性,多重共線性有兩種:完全多重共線性,即, 不存在不完全多重共線性 ,即, 對角線元素比較大。在實際問題中大多是這種情況。多重共線性檢驗方法一. 直觀判斷法: 1. 觀察求得的參數(shù)的最小二乘估計值,如果發(fā)現(xiàn)這些估計值不符合我們所研究的實際情況或經(jīng)濟理論,那么該模型就可能存在多

24、重共線性。2. 當我們改變樣本的觀測值,增加或者減少變量,觀察參數(shù)的估計值隨著的變化,變化明顯就說明該模型存在多重共線性。3. 通過觀察回歸方程的系數(shù)與其相對應的單相關系的正負符號,如果它們的符號相反,則該模型存在二. 單相關系數(shù)矩陣法該方法比較簡單,就是先計算出兩個自變量之間的相關系數(shù),再將計算出的結(jié)果制作成一張矩陣表。當兩個自變量的相關系數(shù)r0.8時,一般可以判定該模型存在多重共線性。三. t檢驗法首先求出每個系數(shù)的方差,然后用它的平方根即標準差除回歸系數(shù),得 (4.4) 給出一定的置信水平a,將計算值與從t分布表上查到的理論值進行比較.當計算值的絕對值,則該回歸系數(shù)通過顯著性檢驗,它不會

25、引起多重共線性;當計算值的絕對值,該系數(shù)沒有通過顯著性檢驗,它會引起多重共線性。 四. 輔助回歸模型檢驗 將模型的每個解釋變量對其他變量進行回歸,在計算出擬合優(yōu)度當某個擬合優(yōu)度比較大,則該解釋變量xi與其他解釋變量存在共線性。多重共線性的克服和處理方法:當?shù)玫降幕貧w方程存在多重共線性,則我們應該想方法消除或者減輕導致存在多重共線性的解釋變量的影響。處理方法有: 刪減變量法,就是根據(jù)以下幾點原則刪除多元回歸方程的某個自變量。 eq oac(,1). 這個自變量應該是與因變量之間的相關系數(shù)最小的。 eq oac(,2). 在求得的相關系數(shù)中,刪除相關系數(shù)高的自變量中的一個。 eq oac(,3).

26、 當某個自變量xi的回歸系數(shù)與其單相關系正負符號相反,應該刪除這個自變量。eq oac(,4). 對于沒有通過t檢驗的自變量的回歸系數(shù)所對應的自變量應該刪除。 變換模型形式法假設自變量和線性相關,原模型形式為:模型滯后一期得:兩式相減得: 令 ; ; ; ; 則上式可寫為: (4.5)與的共線性將減弱。4.4 異方差檢驗在前面模型假設中提出了六條基本假設,當模型符合上述六條假設時。應用最小二乘法求得的參數(shù)估計量是無偏的、有效的。但在研究實際經(jīng)濟問題時,很難完全滿足著六條基本假設。當違背了第二項基本假設,那么應用最小二乘法求得的參數(shù)估計量就可能不是無偏的、有效的,甚至我們都不能求得參數(shù)估計量。這

27、里我們要研究模型違背了上述第二條基本假設的問題,我們稱這個為異方差性問題。異方差性的后果:21一. 參數(shù)估計量非有效 對參數(shù)估計量進行無偏性和有效性的證明中,當模型出現(xiàn)異方差性,其最小二乘法參數(shù)的估計量仍然具有無偏性,但是不具有有效性。 因為在有效性的證明中利用了同方差性條件,I為n階單位矩陣。所以參數(shù)估計量不再具有有效性。 二變量的顯著性檢驗失去意義 在多元線性回歸模型的顯著性檢驗的t檢驗中,構(gòu)造的統(tǒng)計量t中包含有隨機誤差項共同的方差,并且有t 統(tǒng)計量服從t(n-p-1) 分布。如果出現(xiàn)了異方差性, t檢驗就沒有意義了。采用其它檢驗也是如此。 三. 模型的預測失效 在預測值的置信區(qū)間a中包含

28、有隨機誤差項共同方差。所以當模型出現(xiàn)異方差性時,它的預測功能將失效。 異方差性的檢驗 異方差性檢驗就是檢驗隨機誤差項的方差和解釋變量、觀測值之間的相關性。檢驗法有以下幾種: G o l d f e l d Qu a n d t 檢驗, 把按絕對值的大小分為兩組,參照分組把模型的觀測值分為兩組。用 ,分別表示樣本容量。在這兩組中,分別用最小二乘法,求出兩組樣本的誤差項方差估計和,當假設 成立時, 的絕對值小的一組的與的絕對值大的一組的進行比較,應該有,用和定義F統(tǒng)計量: 該統(tǒng)計量F在誤差項方差一定的零假設下,服從F分布。對給定的顯著性水平, 當,拒絕零假設,也就是異方差性存在。當 ,接受零假設,

29、即隨機誤差項為同方差。 圖示法檢驗首先假設不存在異方差性,對模型進行最小二乘法估計,因為殘差是可以看成誤差項的估計,做出解釋變量與殘差平方的散點圖, 根據(jù)圖形的類型來判斷異方差是否存在。圖形如下: 圖(1):異方差檢驗示意圖圖( a )中,與x之間沒有可觀察到的系統(tǒng)模式,表明模型中不存在異方差。圖( c )表明與變量x之間存在線性關系,圖( b )、( d )、( e )表明與x間存在比較復雜的關系。如果殘差的平方 與x間呈現(xiàn)( b )( e )中的任意一種關系, 則數(shù)據(jù)中可能存在異方差。4.5異方差的修正方法加權(quán)最小二乘法:加權(quán)最小二乘法就是對原模型進行加權(quán)以消除模型存在的異方差性,使原模型

30、變成一個新的模型,在對這個新模型采用最小二乘法估計其參數(shù)。設線性回歸模型:; 即隨機誤差項的方差與解釋變量存在線性相關性, 則可以用 去除原模型, 使之變成如下形式的新模型: t=1,2n (4.6)對該模型有:即新模型存在同方差性。于是可以用最小二乘法估計其參數(shù),得到關于參數(shù),是無偏的、有效的估計量。這就是加權(quán)最小二乘法,在這里權(quán)就是 。第五章 回歸擬合度所謂的回歸擬合度檢驗就是對我們已經(jīng)制作好的預測模型進行檢驗,并比較它們的預測結(jié)果與實際發(fā)生情況的吻合程度。結(jié)果與實際的吻合程度就是求得的回歸直線與觀測到的樣本數(shù)據(jù)的擬合程度。擬合度可以判斷一個回歸模型所得到的結(jié)果的好壞,擬合度越高結(jié)果就越好

31、,因此我們要得到好的結(jié)果就要將得到的多個預測模型同時進行檢驗比較,我們要選的就是其中擬合度最高的。一條回歸直線的擬合度主要取決于兩個方面:1.取決于回歸直線的選擇,這個是由所選取的參數(shù)估計方法決定的;2.取決于所觀測的樣本數(shù)據(jù)分布決定的。我們求回歸方程時用的是最小二乘估計法,這就意味著參數(shù)估計方法是確定的,而上面說過擬合度取決于回歸直線的選擇和樣本數(shù)據(jù)的分布,因此回歸擬合度就取決于樣本數(shù)據(jù)的分布了。樣本數(shù)據(jù)的分布其實是由變量的關系而決定的,所以回歸擬合度可以檢驗變量關系的真實性,判斷模型的假設是否成立。當回歸擬合度比較差的時候,這個回歸模型得到的結(jié)果就不符合我們的要求,因此我們就要對原模型進行

32、修改、完善,將擬合度較差的模型變成擬合度好的回歸模型。195.1 決定系數(shù)為了將因變量的實際觀測值y和它的樣本平均值的離差中分解出由自變量決定的那部分,我們將總離差分成兩個部分:1.因變量的理論回歸值和它的的樣本平均值的離差,這部分是能夠由回歸直線解釋的。2.因變量的實際觀測值y和它的理論回歸值的離差,這部分是不能夠由回歸直線解釋的。對實際觀測值y進行離差分解有: (5.1)將上式兩邊平方并求和得:設: 總離差平方和,殘差平方和 ,回歸平方和 ,則 兩邊除以SST得: (5.2)當SSR在SST中占得比重越大,樣本觀測點和樣本回歸直線離得越近。決定系數(shù)就是反應自變量對因變量決定程度的指標,用表

33、示: (5.3)5.2 決定系數(shù)的性質(zhì)和修正決定系數(shù)eq oac(,1) 決定系數(shù)具有非負性 由于 , ,分子和分母都是平方和,不可能是負數(shù),因此 。eq oac(,2)決定系數(shù)的取值范圍是:。當所有觀測值都在回歸直線上的時候,這時;當觀測值不是都在回歸直線上的時候,則,這時;當自變量與因變量無關時,y的總離差全部歸于殘差平方和,則,這時=0。所以。eq oac(,3)決定系數(shù)即是樣本觀測值的函數(shù),也是一個統(tǒng)計量。 因為決定系數(shù)的大小受到自變量的個數(shù)的影響,當含有不同個數(shù)的自變量的回歸模型進行擬合程度比較時,我們應該對擬合決定系數(shù)進行調(diào)整。一般常用方法為:對,將分子和分母分別除以各自的自由度,

34、這樣將變成均方差比,就可以消除自變量的個數(shù)對擬合度的影響。綜上,調(diào)整后的決定系數(shù)為: (5.4)第六章 工業(yè)生產(chǎn)總值預測模型分析6.1 SPSS簡介SPSS是由三位美國斯坦福大學研究生在20世紀60年代末研制的世界上最早的一款統(tǒng)計分析軟件。該款軟件能夠研制成功是非常有深遠意義的,它也是具有相當多并且齊全的功能,世界上許多使用者紛紛就SPSS的各種齊全的功能以及各功能的高效率處理問題能力給予了很高的評價與稱贊。SPSS軟件操作界面、輸出結(jié)果的界面最大的特點就是看上去非常美觀并且結(jié)構(gòu)很簡潔。為了讓非統(tǒng)計專業(yè)人員和那些統(tǒng)計知識不是了解很深的使用者也能很好的使用該軟件,它借鑒了Windows的窗口方式

35、來展示各種管理和數(shù)據(jù)分析方法的功能,使用對話框展示各種功能選擇項。要使用該軟件來進行科研工作,使用者只需要掌握一定的統(tǒng)計分析原理并擁有基本的Windows操作技能就可以。為了方便數(shù)據(jù)的傳輸,SPSS軟件的數(shù)據(jù)接口是很通用的規(guī)格而且數(shù)據(jù)采用類似EXCEL的方式輸入與管理,這樣能很方便的從其他數(shù)據(jù)庫中讀入數(shù)據(jù)。 6.2模型建立和數(shù)據(jù)搜集本研究以制造業(yè)工業(yè)生產(chǎn)總值為對象,根據(jù)背景知識選取如下因變因素,以下對各變量進行設置:y為工業(yè)總產(chǎn)值(單位:億元)x1為塑料制品產(chǎn)量(單位:萬噸)x2為水泥產(chǎn)量(單位:萬噸)x3為平板玻璃產(chǎn)量(單位:萬重量箱)x4為生鐵產(chǎn)量(單位:萬噸)x5為粗鋼產(chǎn)量(單位:萬噸)

36、x6為鋼筋產(chǎn)量(單位:萬噸)x7為盤條產(chǎn)量(單位:萬噸)u為隨機誤差項。并建立模型: (6.1)數(shù)據(jù)搜集:該數(shù)據(jù)主要是中國制造業(yè)主要工業(yè)產(chǎn)品,并按地區(qū)分組統(tǒng)計,選取中國這些產(chǎn)品一年的產(chǎn)量。由于西藏地區(qū)生產(chǎn)的工業(yè)產(chǎn)品較少,所以沒有列出。具體數(shù)據(jù)見下表:表(1):中國2007年制造業(yè)工業(yè)產(chǎn)品統(tǒng)計數(shù)據(jù)地區(qū)工業(yè)總產(chǎn)值(當年價格)塑料制品(萬噸)水泥(萬噸)平板玻璃(萬重量箱)生鐵(萬噸)粗鋼(萬噸)鋼筋(萬噸)盤條(線材)(萬噸)全國10591.983305.23136117.2553918.0747651.6348928.810275.487919.02北京331.9232.661168.6235.

37、22780.51810.76296.34416.3天津204.8240.9614.79186.061435.41602.13185.1964.14河北376.27137.379758.2810031.7610523.0110569.291335.431171.84山西258.4913.442780.91971.913727.642506.36372.93465.82內(nèi)蒙古124.346.052871.171395.721260.091040.36100.9676.63遼寧680.18159.33893.21941.214057.594140.27246.94453.91吉林94.5721.97

38、1903.81850.76545.66599.6730.5969.16黑龍江175.4114.061645.06490.21374.11436.05184.533.3上海600.5772.46959.44744.531790.362081.5823.2178.48江蘇1425.76327.3711849.786856.113802.154721.471577.49949.47浙江875.07768.8810548.512917.53238.08577.23131.63183.74安徽173.27111.175402.23472.561517.71663.61501.04257.69福建253.

39、94106.664500.11867.12477.88588.82289.47222.27江西56.0912.955008.54686.641047.361306.81496.39332.42山東1736.69315.4715023.895175.614906.674406.911090.68638.12河南797.9121.699471.363619.931974.952275.39556.84660.1湖北126.5853.715638.852178.341679.791778.17226.99178.93湖南425.5623.255683.281518.121247.761331.793

40、37.18224.3廣東923.24754.459799.576123.03755.251154.03444.76284.86廣西175.5321.714350.48530.34639.3765.67288.06207.22海南2.032.25633.327.6818.844.546.540.67重慶84.8522.683000.05254.18328.38358.3649.76102.41四川364.483.516375.62495.791470.731415.34492.78195.91貴州28.317.962059.062.5363.19349.36176.45118.83云南37.24

41、16.113568.53329.81202.78883.85228.43183.61陜西181.625.143175.491175.08365.55396.27318.9453.67甘肅52.4110.321540.21591.89592.78602.898.84140.53青海1.220.27436.8592.9590.09114.711.317.54寧夏16.232.02817.3661.8246.250.3637.775.08新疆7.4639.471479.28113.66391.82446.85148.06142.086.3基于SPSS的回歸分析實現(xiàn)SPSS是一款專用統(tǒng)計軟件,在建立數(shù)

42、學模型之后,本文采用SPSS實現(xiàn)數(shù)學模型求解。在SPSS中輸入各變量,并為各變量設置名稱。然后點擊Analyze Regression Linear進入線性回歸對話框,在左邊源變量欄中選定變量Y,使之進入Dependent欄,選定變量,單擊按鈕使之進入Independent欄。如圖:14,17,18圖(2):在SPSS軟件中將選定變量輸入圖示6.4統(tǒng)計檢驗用spss計算得到如下結(jié)果:表(2):模型摘要ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.993(a).987.983245.843471.7

43、39表(3):方差分析ModelSum of Squares dfMean SquareFSig.1Regression105371311.469715052901.628249.095.000(a) Residual1390297.2462360439.011 Total106760408.73430 表(4):回歸系數(shù)ModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-2.21147.145-.0

44、47.963 塑料制品x1.989.452 .3172.187.039.02737.136 水泥x2.036.024.4601.535.138.006158.735 平板玻璃x3-.055.059-.281-.979.338.007145.382 生鐵x4.013.154.058.083.934.001858.839 粗鋼x5.004.173.020.026.981.0011170.54 鋼筋x6.456.366.4411.262.220.005216.267 盤條x7-.016.495-.012-.033.975.004242.790由此可得: (6.2)決定系數(shù); 調(diào)整決定系數(shù); 該方程的

45、決定系數(shù)比較高,因此該模型的擬合度較好。,該線性回歸方程顯著。6.5異方差檢驗及修正用SPSS對模型進行異方差檢驗,如圖:圖(3):在SPSS中對變量進行異方差檢驗圖示最后可得殘差絕對值和各自變量的相關系數(shù)為:0.59, 0.47, 0.287, 0.489, 0.513,0.416, 0.547不相等,說明存在異方差,需要用加權(quán)最小二乘估計。用SPSS可得到最優(yōu)權(quán)重為3.000。進行加權(quán)分析最后可得結(jié)果:表(5):模型摘要ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson11.000(a)1.0001.

46、000.085931.581表(6):方差分析ModelSum of SquaresdfMean SquareFSig.1Regression2587.0887369.57550065.439.000(a) Residual.17022.007 Total2587.28830 表(7):回歸系數(shù)ModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-13.0133.488-3.733.001 塑料制品x1

47、.841.096.2648.823.000.003314.686 水泥x2.020.011.2602.103.047.0005366.476 平板玻璃x3-.017.019-.084-.866.395.0003333.757 生鐵x4-.008.019-.038-.440.664.0002602.303 粗鋼x5.080.021.3703.836.001.0003255.656 鋼筋x6.405.055.3937.408.000.001984.360 盤條x7-.217.104-.163-2.090.048.0002131.465由上表可知:決定系數(shù); 修正決定系數(shù); 方程的決定系數(shù)較高,而決

48、定系數(shù)越高,模型擬合度就越好,因此該模型的擬合度很好;,模型總體顯著,即全部自變量總體與因變量存在線性關系。此時的多元線性回歸方程為: (6.3)6.6 模型意義本文通過選取工業(yè)生產(chǎn)總值和塑料制品、水泥、平板玻璃、生鐵、粗鋼、鋼筋、盤條的產(chǎn)量,經(jīng)過回歸分析和統(tǒng)計檢驗,最后得到回歸方程: 由上述多言回歸模型可知:所選取的各工業(yè)產(chǎn)品每增加一個單位的產(chǎn)量,工業(yè)生產(chǎn)總值就增加相應系數(shù)數(shù)值的產(chǎn)量。而平板玻璃產(chǎn)量系數(shù)是負值則工業(yè)生產(chǎn)總值就相對減少相應系數(shù)數(shù)值的產(chǎn)量。這可能是由于國家所采取的經(jīng)濟政策或者其它的因為地區(qū)特殊性的原因造成的。由模型知自變量塑料制品產(chǎn)量和鋼筋產(chǎn)量系數(shù)的絕對值最大,因此它們對工業(yè)生產(chǎn)

49、總值的影響也最大。當我們要最高的提高全國各地區(qū)工業(yè)生產(chǎn)總值的指標時,可以盡量加大塑料制品和鋼筋的生產(chǎn),而對于系數(shù)最小的生鐵,我們可以適當?shù)臏p少對其生產(chǎn)的投資。這樣,我們在進行資源的配置時,可以優(yōu)先考慮對各地區(qū)紙塑料制品和鋼筋制造的投資,這樣就能夠達到資源的優(yōu)化配置。結(jié) 論本文以預測工業(yè)生產(chǎn)總值為背景,簡約的介紹了回歸分析思想。運用定性分析選取有關變量后,建立多元回歸模型,再應用最小二乘法求得參數(shù)估計。為了防止所求得的模型是有效和有意義的,我們通過回歸方程的顯著性、回歸系數(shù)的顯著性、多重共線性檢驗、異方差檢驗等檢驗方法對其進行檢驗,再運用適當?shù)姆椒▽Σ环蠈嶋H情況的模型進行調(diào)整。通過擬合度分析,

50、我們可以知道得到的模型與實際情況的吻合程度。對擬合度過小的模型進行調(diào)整,使調(diào)整后的模型更符合實際。本文選取工業(yè)生產(chǎn)總值和塑料制品、水泥、平板玻璃、生鐵、粗鋼、鋼筋、盤條的產(chǎn)量為變量,應用SPSS軟件,以前面的所論述的知識為理論基礎求得關于預測工業(yè)生產(chǎn)總值的數(shù)學模型。該模型可以為制定國民經(jīng)濟發(fā)展計劃提供理論指導,并達到資源的優(yōu)化配置作用。參 考 文 獻1 HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100179932574&d=AD1652118BF623D48AF67FAACD3886BD&s=%E5%A4%9A%E5%85%8

51、3%E5%9B%9E%E5%BD%92%E6%A8%A1%E5%9E%8B&ecode=utf-8多元回歸模型在區(qū)域經(jīng)濟預測中的應用J,趙廣華,劉煒,中國商貿(mào),2009. 2 HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100156669901&d=110FD965F0FD1361C33D3F12BCDBCEBB&s=%E5%A4%9A%E5%85%83%E5%9B%9E%E5%BD%92%E6%A8%A1%E5%9E%8B&ecode=utf-8多元回歸模型分析與設計實現(xiàn)J,曲俊華,倪家明,中國電力教育,2007,第S1期3

52、HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100194896124&d=5E9C2C256487E964ED16864125214366&s=%E5%A4%9A%E5%85%83%E5%9B%9E%E5%BD%92%E5%88%86%E6%9E%90%E6%A8%A1%E5%9E%8B&ecode=utf-8多元混合數(shù)據(jù)回歸分析方法J,傅惠民,岳曉蕊,航空動力學報,2011,第1期4 HYPERLINK /views/specific/3004/bookDetail.jsp?dxNumber=000008067068&d=47

53、A1BEF750C8C256F44ED75DFEB077C5&fenlei=1301080104數(shù)學建模方法導引與案例分析M, 汪冬華,浙江大學出版社, 2011.025 HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100164558170&d=98079D9A0637E460E50536C79213547B&s=%E5%B7%A5%E4%B8%9A%E7%94%9F%E4%BA%A7%E6%80%BB%E5%80%BC%E9%A2%84%E6%B5%8B&ecode=utf-8國內(nèi)工業(yè)生產(chǎn)總值的時間序列模型研究J, 梁鑫,謝佳

54、利,榮小軍,廣西科學,2008,第1期6概率論與數(shù)理統(tǒng)計M,陳希孺編著.合肥:中國科學技術(shù)大學出版社,1992.5 7應用統(tǒng)計學M, 盧秀娟主編.北京:科學出版社,2005.2 8概率論與數(shù)理統(tǒng)計M,廖玉麟主編.上海:復旦大學出版社,1995.7 9HYPERLINK /kns50/detail.aspx?dbname=CJFD2005&filename=NCJJ200508006&filetitle=%e5%86%9c%e5%9c%b0%e6%b5%81%e5%8a%a8%e7%9a%84%e5%bd%b1%e5%93%8d%e5%9b%a0%e7%b4%a0%e5%88%86%e6%9e%90%e2%80%94%e2%80%94%e4%bb%a5%e5%90%89%e6%9e%97%e7%9c%81%e5%bb%b6%e8%be%b9%e5%9c%b0%e5%8c%ba%e7%9a%84%e5%86%9c%e5%9c%b0%e8%bd%ac%e5%8c%85%e4%b8%ba%e4%be%8b o 農(nóng)地流動的影響因素分析以吉林省延邊地區(qū)的農(nóng)地轉(zhuǎn)包為例 相似度 104%農(nóng)地流動的影響因素分析以吉林省延邊地區(qū)的農(nóng)地轉(zhuǎn)包為例J, 李明權(quán), 閆新華,HYPERLINK /kns50/Navi/Bridge.aspx?DBCode=CJFD&Li

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論