年銷售額的回歸模型預(yù)測(cè)_第1頁
年銷售額的回歸模型預(yù)測(cè)_第2頁
年銷售額的回歸模型預(yù)測(cè)_第3頁
年銷售額的回歸模型預(yù)測(cè)_第4頁
年銷售額的回歸模型預(yù)測(cè)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

#附件2:課程設(shè)計(jì)任務(wù)書學(xué)生姓名:專業(yè)班級(jí):指導(dǎo)教師:工作單位:題目:初始條件:要求完成的主要任務(wù):(包括課程設(shè)計(jì)工作量及其技術(shù)要求,以及說明書撰寫等具體要求)時(shí)間安排:指導(dǎo)教師簽名:年月日系主任(或責(zé)任教師)簽名:年月日年銷售額的回歸模型預(yù)測(cè)【摘要】本文首先利用題目所給數(shù)據(jù)做出散點(diǎn)圖,分析自變量與因變量之間的線性關(guān)系,建立基本的線性回歸模型y+Px+£[i],對(duì)所建立的模型直接用MATLAB統(tǒng)計(jì)工具箱TOC\o"1-5"\h\zt01tt[2]求解,得到的回歸系數(shù)估計(jì)值及其置信區(qū)間(置信水平?-0.05)、檢驗(yàn)統(tǒng)計(jì)量R2,F,P[3],將參數(shù)估計(jì)值代入初始模型得到$=-1.4548+0.17628x。tt但是這個(gè)模型沒有考慮到題目所給的數(shù)據(jù)是一個(gè)時(shí)間序列。實(shí)際上,在對(duì)時(shí)間序列數(shù)據(jù)作回歸分析時(shí),模型的隨機(jī)誤差項(xiàng)8有可能存在相關(guān)性。違背模型關(guān)于8(對(duì)t)tt相互獨(dú)立的基本假設(shè)。所以對(duì)原模型進(jìn)行自相關(guān)檢驗(yàn),發(fā)現(xiàn)其隨機(jī)誤差存在正自相關(guān),故對(duì)原模型作變量變換:y'二y-Py,x'=x-px得到新的模型:y'二卩'+卩'x'+u,ttt-1ttt-1t01tt其中,卩'=卩G-p),p'=p。0011對(duì)新的模型利用MATLAB統(tǒng)計(jì)工具箱求解,并對(duì)新的模型也作一次自相關(guān)檢驗(yàn),即診斷隨機(jī)誤差u是否還存在自相關(guān),經(jīng)檢驗(yàn)認(rèn)為新的模型中隨機(jī)誤差不存在自相關(guān)。因t此經(jīng)變換所得到的回歸模型y'=P'+P'x'+u是適用的。TOC\o"1-5"\h\zt01tt最后,將模型y'=P'+卩'x'+u中的y'和x'還原為原始變量y和x,得到結(jié)果為:t01tttttt$=—0.3916+0.6326y+0.1737x—0.1099xtt-1tt-1關(guān)鍵詞:時(shí)間序列回歸模型統(tǒng)計(jì)檢驗(yàn)D—W檢驗(yàn)一、問題重述與分析1.1、問題提出某公司(記為A)想用全行業(yè)的銷售額作為自變量來預(yù)測(cè)公司的銷售額,表1給出了2006年?2010年公司銷售額和行業(yè)銷售額的分季度數(shù)據(jù)(單位:百萬元)。表1A公司的公司銷售額和行業(yè)銷售額的分季度數(shù)據(jù)(單位:百萬元)年季t公司銷售額y行業(yè)銷售額x年季t公司銷售額y行業(yè)銷售額x20061120.96127.3200831124.54148.32221.40130.041224.30146.43321.96132.7200911325.00150.24421.52129.421425.64153.120071522.39135.031526.36157.32622.76137.141626.98160.73723.48141.2201011727.52164.24823.66142.821827.78165.620081924.10145.531928.24168.721024.01145.342028.78171.71.2、問題分析表1的數(shù)據(jù)是以時(shí)間序列為序的,稱為時(shí)間序列。由于公司銷售額和行業(yè)銷售額等經(jīng)變量均有一定的滯后性,因此,在這樣的時(shí)間序列數(shù)據(jù)中,同一變量的順序觀測(cè)值之間出現(xiàn)相關(guān)現(xiàn)象(稱自相關(guān))是很自然的。然而,一旦數(shù)據(jù)中存在這種自相關(guān)序列,如果仍采用普通的回歸模型直接處理,將會(huì)出現(xiàn)不良后果,其觀測(cè)也會(huì)失去意義,為此,我們必須先來診斷數(shù)據(jù)是否存在自相關(guān),如果存在,就要考慮自相關(guān)關(guān)系,建立新的模型。二、模型假設(shè)根據(jù)題目所給出的數(shù)據(jù)信息,做出以下簡(jiǎn)化假設(shè):1、假設(shè)只考慮題目所給的信息,不考慮其他因素對(duì)公司銷售額的直接影響;2、假設(shè)其他各種隨機(jī)因素對(duì)公司銷售額的影響都?xì)w為隨機(jī)誤差;

三?模型的符號(hào)說明y:表示公司銷售額。tx:表示行業(yè)銷售額。t0:表示線性回歸模型的回歸系數(shù)。i£:表示各種隨機(jī)因素對(duì)y的影響總和,稱為隨機(jī)誤差。tt冷:表示公司銷售額的估計(jì)值。t四、模型的建立與求解4.1、基本回歸模型的建立由于題目中所給數(shù)據(jù)較少,故將每年每季度的銷售額數(shù)據(jù)作為一個(gè)單獨(dú)研究的對(duì)象,將所有數(shù)據(jù)按年份和季度編號(hào)。記該公司的行業(yè)銷售額為x,公司銷售額為y,t=1,2,nG20)。利用MATLAB作出tt因變量y與自變量x的散點(diǎn)圖,如圖1。tt++++0126130135140145150155160165170175126130135140行業(yè)銷售額站圖1公司銷售額y與行業(yè)銷售額x的散點(diǎn)圖TOC\o"1-5"\h\ztt從圖1可以看出,隨著行業(yè)銷售額的增加,公司銷售額也增大,而且兩者有很強(qiáng)的線性關(guān)系,因此可以建立線性回歸模型y二B+Bx+s(1)t01tt上述線性回歸模型中除了行業(yè)銷售額外,影響的其他因素的作用包含在隨機(jī)誤差8t內(nèi),這里假設(shè)8(對(duì)t)相互獨(dú)立,且服從均值為零的正態(tài)分布,t二1,2,…n.t對(duì)于初步估計(jì)的回歸模型能否客觀揭示所研究的經(jīng)濟(jì)現(xiàn)象中諸因素之間的關(guān)系,是否符合變量之間的客觀規(guī)律性,引入所影響因素是否有效,變量之間是否存在線性相關(guān)關(guān)系,模型能否付諸應(yīng)用,應(yīng)通過模型檢驗(yàn)決定。4.2、統(tǒng)計(jì)檢驗(yàn)(一)擬合優(yōu)度檢驗(yàn)(R2檢驗(yàn))A、22A擬合優(yōu)度檢驗(yàn)是檢驗(yàn)回歸方程對(duì)樣本觀測(cè)值的擬合程度,即檢驗(yàn)所有解釋變量與被解釋變量之間的相關(guān)程度。檢驗(yàn)的方法是構(gòu)造一個(gè)可以表征擬合程度的指標(biāo),這個(gè)指標(biāo)是通過對(duì)總變差(總離差)的分解而得到。A、22A其中S二工殘總變差平方和S是各個(gè)觀察值與樣本均值之差的平方和,反映了全部數(shù)據(jù)之間的總差異;殘差平方和S殘是總變差平方和中未被回歸方程解釋的部分,由解釋變量x,X,…X中未包含的一切因素對(duì)被解釋變量y的影響而造成的;回歸平方和S是總變12k回差平方和中由回歸方程解釋的部分。一個(gè)擬合得好的回歸模型,體現(xiàn)在總體平方和與回歸平方和的接近程度,即S總中S殘?jiān)叫≡胶?。于是采?=1-^殘6<R2<I)S總對(duì)回歸方程的擬合優(yōu)度進(jìn)行檢驗(yàn)。如果所有樣本觀測(cè)值都位于回歸方程上,即:

\2Ay-yii丿此時(shí)回歸方程完全擬合了樣本觀測(cè)值,R2等于1。如果R2越接近1,則說明回歸方程的擬合優(yōu)度越高。R2說明了在被解釋變量y的總變差中,由一組解釋變量x,x,…x的變動(dòng)所引起的12k百分比。由于R2是一個(gè)隨解釋變量個(gè)數(shù)的增加而遞增的增函數(shù),所以為使擬合優(yōu)度檢驗(yàn)指標(biāo)不僅能反映已被解釋的變差與總變差的關(guān)系,而且能反映回歸模型中所包含的解釋變量個(gè)數(shù)的影響,需要調(diào)整R2,記為R2。_2S(n-k-1)R2=1-TS/(n-1)丿總式中n-k-1為殘差平方和S的自由度,n-1為總變差平方和S的自由度。故可殘總得:R2=1-(-R2)n-1n—k—1由于擬合優(yōu)度并不是檢驗(yàn)回歸模型的唯一標(biāo)準(zhǔn),在實(shí)際應(yīng)用中,為了使模型有較合理的經(jīng)濟(jì)解釋,可以在某種程度上犧牲擬合優(yōu)度。即模型合理的經(jīng)濟(jì)解釋是第一位的。方程顯著性檢驗(yàn)(F檢驗(yàn))方程顯著性檢驗(yàn)就是對(duì)模型中解釋變量與被解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。即檢驗(yàn)被解釋變量y與所有解釋變量x,x,…x之間的線性關(guān)系12k是否顯著,方程顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)。檢驗(yàn)的原假設(shè)H與對(duì)立假設(shè)H1分別為:01H:H:p=p=?-=p=0001k至少有一個(gè)P不為零j應(yīng)用數(shù)理統(tǒng)計(jì)理論可以證明:S與S相互獨(dú)立,且當(dāng)H:p=p=???=p=0為真回殘001k時(shí),S回與S殘分別服從自由度為k、"-11的”2分布,故有:F=(回)?F(k,n-k-1)S/G-k-1丿殘即F統(tǒng)計(jì)量服從以(,n-k-1)為自由度的F分布。首先根據(jù)樣本觀測(cè)值及回歸值計(jì)算出統(tǒng)計(jì)量F,于是在給定的顯著性水平?下,若F>F(k,n-k-1),則拒絕H,判定被解釋變量y與所有解釋變量x,x,…x之間的回a012k歸效果顯著,即確實(shí)存在線性關(guān)系;反之,則不顯著。(三)變量顯著性檢驗(yàn)(t檢驗(yàn))R2檢驗(yàn)和F檢驗(yàn)都是將所有的解釋變量作為一個(gè)整體來檢驗(yàn)它們與被解釋變量y的相關(guān)程度以及回歸效果,但對(duì)于多元回歸模型,方程的總體顯著性并不意味每個(gè)解釋變量對(duì)被解釋變量y的影響都是顯著的。如果某個(gè)解釋變量并不顯著,則應(yīng)該從方程中把它剔除,重新建立更為簡(jiǎn)單的方程。所以必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn)。等價(jià)于對(duì)每個(gè)解釋變量檢驗(yàn)假設(shè)H:0二0H:0豐00j1j其中j=0,1,2,…k。應(yīng)用數(shù)理統(tǒng)計(jì)理論可以證明:當(dāng)H:0二0為真時(shí),統(tǒng)計(jì)量t服從自由度為(-k-1)0jj的t分布,即:t=匚?t(H一k一1)j=0,1,2,…kjS在給定的顯著性水平a下,若|t>t(n-k-1),則拒絕H,說明解釋變量x對(duì)被1ja/20j解釋變量y有顯著影響,即x是影響y的主要因素;反之,接受H,說明解釋變量x對(duì)j0j被解釋變量y無顯著影響,則應(yīng)刪除該因素。當(dāng)影響y的主要因素只有一個(gè)變量x時(shí),問題變成了一元回歸分析,此時(shí)t檢驗(yàn)和F檢驗(yàn)的作用是一樣的,因此可以不用再做F檢驗(yàn)了。4.3、模型的求解根據(jù)表1的數(shù)據(jù),對(duì)模型(1)直接用MATLAB統(tǒng)計(jì)工具箱求解,得到的回歸系數(shù)估計(jì)值及其置信區(qū)間(置信水平八0-05)、檢驗(yàn)統(tǒng)計(jì)量R2,F,P的結(jié)果見表2。表2模型(1)的計(jì)算結(jié)果參數(shù)參數(shù)估計(jì)值置信區(qū)間00-1.4548[-1.9047-1.0048]

卩10.17628[0.17320.1793]R2=1F=14888P=0.0000將參數(shù)估計(jì)值代入模型(1)得到Ay(2)=_1.4548+0.17628x結(jié)果分析:表2顯示,R2=1指因變量y幾乎100%可由模型確定,(2)=_1.4548+0.17628xt檢驗(yàn)的臨界值,P遠(yuǎn)小于,可以計(jì)算剩余標(biāo)準(zhǔn)差僅為0.081。因而模型(2)從整體上看是可用的。利用MATLAB中rstool命令也可得到相應(yīng)的結(jié)果,在rstool交互式畫面中點(diǎn)擊左下方的Export,可輸出模型的統(tǒng)計(jì)結(jié)果,得剩余標(biāo)準(zhǔn)差s=0.081。產(chǎn)生的交互式畫面見圖2。PredictedY124.569

+/-

0.051307X1圖2回歸分析中的rstool交互式畫面X14.4、自相關(guān)性診斷與處理方法從表面上看得到的基本模型(2)的擬合度非常之高(R2二1),應(yīng)該很滿意了。但是這個(gè)模型沒有考慮到我們的數(shù)據(jù)是一個(gè)時(shí)間序列。實(shí)際上,在對(duì)時(shí)間序列數(shù)據(jù)作回歸分析時(shí),模型的隨機(jī)誤差項(xiàng)8有可能存在相關(guān)性。違背模型關(guān)于8(對(duì)t)相互獨(dú)立的tt基本假設(shè)。為了對(duì)8的自相關(guān)性作定量診斷,并在確診后得到新的結(jié)果,我們考慮如下t模型:(3)y=B+Bx+8(3)t01tt8=p8+utt—1t其中p是自相關(guān)系數(shù),|p|Wl,u相互獨(dú)立且服從均值為零的正態(tài)分布。模型(3)

中若P二0,則退化為普通的回歸模型;若P>0,則隨機(jī)誤差8存在正的自相關(guān);若tP<中若P二0,則退化為普通的回歸模型;若P>0,則隨機(jī)誤差8存在正的自相關(guān);若tP<0,則隨機(jī)誤差8存在負(fù)的自相關(guān)。大多數(shù)與經(jīng)濟(jì)有關(guān)的時(shí)間序列數(shù)據(jù),在經(jīng)濟(jì)規(guī)t律作用下,一般隨著時(shí)間的推移有一種向上或向下變動(dòng)的趨勢(shì),其隨機(jī)誤差表現(xiàn)出正相關(guān)性。D—W檢驗(yàn)是一種常用的診斷自相關(guān)現(xiàn)象的統(tǒng)計(jì)方法。首先根據(jù)模型(2)得到的殘差計(jì)算DW統(tǒng)計(jì)量如下:工(e-e》tt—1DW=Ye2(4)tt=1其中n是觀察值個(gè)數(shù),殘差e=y—夕為隨機(jī)誤差8的估計(jì)值。當(dāng)n較大時(shí),ttttYeett—1■t=2Ye2tt=1(5)而(5)式右端e2正是自相關(guān)系數(shù)p的估計(jì)值p,t于是(6)DW沁2(1—P、(6)I丿由于—1<p<1,所以0<DW<4,并且,若p在0附近,則DW在2附近,8的t自相關(guān)性很弱;若P在土1附近,則DW接近0或4,8的自相關(guān)性很強(qiáng)。t要根據(jù)DW的具體數(shù)值確定8是否存在自相關(guān),應(yīng)該在給定的檢驗(yàn)水平下,依照樣t本容量和回歸變量數(shù)目,查D—W分布表,得到檢驗(yàn)的臨界d和d,然后由表3中DWLu所在的區(qū)間來決定。表3與DW值對(duì)應(yīng)的自相關(guān)狀態(tài)DW值檢驗(yàn)結(jié)果0<DW<dL否定假設(shè),存在正自相關(guān)d<DW<dLU檢驗(yàn)無結(jié)論(不能確定)d<DW<4—dUU接受假設(shè),不存在自相關(guān)

4—d<DW<4—dUL檢驗(yàn)無結(jié)論(不能確定)4—d<DW<4L否定假設(shè),存在負(fù)自相關(guān)從表3中可知,DW檢驗(yàn)存在無結(jié)論區(qū)域,當(dāng)計(jì)算的DW統(tǒng)計(jì)量落到無結(jié)論區(qū)域時(shí),決策者就不能作出回歸模型是否存在自相關(guān)現(xiàn)象的結(jié)論。在實(shí)際應(yīng)用中,當(dāng)DW統(tǒng)計(jì)量的值在2左右時(shí),則無須查表檢驗(yàn)即可判定回歸模型不存在自相關(guān),此時(shí)回歸模型有效。4.5、加入自相關(guān)后的模型根據(jù)(4)式可計(jì)算出DW二0.7347,對(duì)于顯著性水平a二0.01,n二20,q二1,查D—W分布表,得到檢驗(yàn)的臨界值d=0.95和d=1.15,現(xiàn)在DW<d,由表3可以認(rèn)TOC\o"1-5"\h\zLuL為隨機(jī)誤差存在正自相關(guān),且P的估計(jì)值可由(6)式得。作變量變換:(7)(8)y'二y-Py(7)(8)ttt—1x'二x—pxttt—1則模型(3)化為:y'二卩'+P'x'+ut01tt其中,P'=PG—p),p'=p0011以p的估計(jì)值代入(7)式作變換,利用變換后的數(shù)據(jù)y',x'估計(jì)模型(8)的參數(shù),得tt到的結(jié)果見表4,可以得到其剩余標(biāo)準(zhǔn)差為0.067.表4模型(8)的計(jì)算結(jié)果變換變量y'二y—py和x'二x—pxttt—1ttt—1回歸系數(shù)估計(jì)回歸系數(shù)置信區(qū)間p'0b'=—0.39160[-0.7441-0.0390]p'1b'=0.17371[0.16750.1800]R2二1F二3432.3P二0.0000對(duì)模型(8)也作一次自相關(guān)檢驗(yàn),即診斷隨機(jī)誤差u是否還存在自相關(guān),從模型t(8)的殘差可計(jì)算出DW二1.6519,對(duì)于顯著性水平a二0.01、q二1以及n二19時(shí),檢驗(yàn)的臨界值為d=0.93,d二1.13,故d<DW<4-d,所以可以認(rèn)為隨機(jī)誤差不存在TOC\o"1-5"\h\zLuuu自相關(guān)。因此經(jīng)變換(7)所得到的回歸模型(8)是適用的。最后,將模型(8)中的y'和x'還原為原始變量y和x,得到結(jié)果為:tttt9=-0.3916+0.6326y+0.1737x-0.1099x(9)tt—1tt—14.6、結(jié)果分析及預(yù)測(cè)從機(jī)理上看,對(duì)于帶滯后性的經(jīng)濟(jì)規(guī)律作用下的時(shí)間序列數(shù)據(jù),加入自相關(guān)的模型(9)更為合理,而且在本例中,衡量與實(shí)際數(shù)據(jù)擬合程序的指標(biāo)——剩余標(biāo)準(zhǔn)差從模型(2)的0.081減少到0.0671。當(dāng)用模型(9)對(duì)公司的銷售額y作預(yù)測(cè)時(shí),先估計(jì)t未來的全行業(yè)銷售額x,比如,設(shè)t=21時(shí),x=174.1,容易由模型(9)得到9=29.1860。ttt五、模型的意義和推廣企業(yè)預(yù)測(cè)是企業(yè)編制計(jì)劃、做出正確決策的重要前提。預(yù)測(cè)的目的是為企業(yè)經(jīng)營(yíng)規(guī)劃和決策提供信息。企業(yè)為了規(guī)劃經(jīng)營(yíng)活動(dòng),必須對(duì)各項(xiàng)重要的經(jīng)濟(jì)指標(biāo)如銷售、利潤(rùn)、成本、資金等進(jìn)行科學(xué)的預(yù)測(cè),以便對(duì)未來的經(jīng)營(yíng)發(fā)展趨勢(shì)做出正確的分析與判斷?;貧w分析預(yù)測(cè)法是通過預(yù)測(cè)對(duì)象和影響因素的統(tǒng)計(jì)整理和分析,找出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論