第六講某車(chē)企汽車(chē)年銷(xiāo)量預(yù)測(cè)案例_第1頁(yè)
第六講某車(chē)企汽車(chē)年銷(xiāo)量預(yù)測(cè)案例_第2頁(yè)
第六講某車(chē)企汽車(chē)年銷(xiāo)量預(yù)測(cè)案例_第3頁(yè)
第六講某車(chē)企汽車(chē)年銷(xiāo)量預(yù)測(cè)案例_第4頁(yè)
第六講某車(chē)企汽車(chē)年銷(xiāo)量預(yù)測(cè)案例_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

某車(chē)企汽車(chē)年銷(xiāo)量預(yù)測(cè)案例2023/12/271信息技術(shù)教學(xué)中心學(xué)習(xí)要點(diǎn)分析方法:-散點(diǎn)圖、序列圖、線性回歸、曲線擬合、非線性回歸分析過(guò)程轉(zhuǎn)換:計(jì)算變量、個(gè)案排秩表:設(shè)定表統(tǒng)計(jì)圖:直方圖、散點(diǎn)圖、序列圖描畫(huà)統(tǒng)計(jì):序列圖比較均值:均值回歸:線性、曲線估計(jì)、非線性回歸2023/12/272信息技術(shù)教學(xué)中心案例背景現(xiàn)有某汽車(chē)企業(yè)1988——2001年的汽車(chē)銷(xiāo)售量數(shù)據(jù),如下表所示。為了制定企業(yè)的長(zhǎng)期市場(chǎng)開(kāi)展方案,管理者希望可以預(yù)測(cè)出至2021年的汽車(chē)銷(xiāo)量。

年份19881989199019911992199319941995199619971998199920002001銷(xiāo)量/萬(wàn)輛655951711061301351451461571601832082362023/12/273信息技術(shù)教學(xué)中心分析思緒與商業(yè)了解本研討的制約要素可用信息量少未來(lái)趨勢(shì)的變化基于以上緣由,預(yù)測(cè)2~3年內(nèi)的汽車(chē)銷(xiāo)量該當(dāng)是本案例更為適宜的研討目的。2023/12/274信息技術(shù)教學(xué)中心數(shù)據(jù)了解由于本數(shù)據(jù)比較簡(jiǎn)單,因此數(shù)據(jù)了解的重點(diǎn)可用放在兩變量間數(shù)據(jù)關(guān)聯(lián)趨勢(shì)的了解上,因此首先運(yùn)用散點(diǎn)圖對(duì)數(shù)據(jù)的變化規(guī)律進(jìn)展察看,步驟如下:選擇“圖形〞——“圖表構(gòu)建程序〞菜單命令將散點(diǎn)圖圖標(biāo)拖入畫(huà)布將year拖入X軸框,sales拖入Y軸框確定2023/12/275信息技術(shù)教學(xué)中心數(shù)據(jù)了解擴(kuò)展閱讀簡(jiǎn)單地說(shuō),散點(diǎn)圖在用于回歸分析前的預(yù)分析時(shí),可提供如下三類(lèi)關(guān)鍵信息變量之間能否存在數(shù)量關(guān)聯(lián)趨勢(shì)。假設(shè)存在關(guān)聯(lián)趨勢(shì),那么是線性的,還是曲線的數(shù)據(jù)中能否存在明顯偏離散點(diǎn)圖主體較遠(yuǎn)的散點(diǎn),它們能否能夠在建模時(shí)成為強(qiáng)影響點(diǎn)。2023/12/276信息技術(shù)教學(xué)中心數(shù)據(jù)了解2023/12/277信息技術(shù)教學(xué)中心數(shù)據(jù)了解根據(jù)散點(diǎn)圖的顯示1988~1992年的數(shù)據(jù)出現(xiàn)異常,因此將在后面建模時(shí)把其刪除,不再進(jìn)入后續(xù)分析。2023/12/278信息技術(shù)教學(xué)中心挑選數(shù)據(jù)并進(jìn)展變量轉(zhuǎn)換挑選數(shù)據(jù):數(shù)據(jù)——選擇個(gè)案選擇“假設(shè)條件滿足〞——假設(shè)——輸入“year>=1993〞繼續(xù)輸出——?jiǎng)h除未選定個(gè)案確定變量轉(zhuǎn)換:轉(zhuǎn)換——計(jì)算變量目的變量:time數(shù)字表達(dá)式:$casenum確定2023/12/279信息技術(shù)教學(xué)中心線性回歸模型簡(jiǎn)介線性回歸指的是一切自變量對(duì)因變量的影響均呈線性關(guān)系,設(shè)希望預(yù)測(cè)因變量y的取值,諸影響要素為自變量,那么自變量和因變量間存在如下關(guān)系:=a+++…..+2023/12/2710信息技術(shù)教學(xué)中心回歸模型的適用條件線性趨勢(shì):自變量和因變量的關(guān)系是線性的,假設(shè)不是,那么不能采用線性回歸來(lái)分析,可以經(jīng)過(guò)散點(diǎn)圖來(lái)判別。獨(dú)立性:可表述為因變量y的取值相互獨(dú)立,之間沒(méi)有聯(lián)絡(luò)。反映到模型中,實(shí)踐上就是要求殘差間相互獨(dú)立,不存在自相關(guān),否那么該當(dāng)采用自回歸模型來(lái)分析。這可以用D-W統(tǒng)計(jì)量來(lái)調(diào)查,另外一種常用的工具為自相關(guān)和偏相關(guān)圖,它們比D-W統(tǒng)計(jì)量更為直觀和敏感。正態(tài)性:就自變量的任何一個(gè)線性組合,因變量y均服從正態(tài)分布。方差齊性:就自變量的任何一個(gè)線性組合,因變量y的方差均一樣,本質(zhì)上就是要求殘差的方差齊性。2023/12/2711信息技術(shù)教學(xué)中心留意:本案例運(yùn)用回歸模型對(duì)序列數(shù)據(jù)進(jìn)展分析,數(shù)據(jù)的順序代表了時(shí)間變化的方向,相鄰數(shù)據(jù)間非常容易出現(xiàn)相關(guān)性。因此在本案例分析時(shí)殘差有無(wú)相關(guān)時(shí)必需加以調(diào)查的。假設(shè)模型的決議系數(shù)非常高,自相關(guān)趨勢(shì)非常弱,那么問(wèn)題影響不大,否那么該當(dāng)思索運(yùn)用自回歸模型來(lái)分析。2023/12/2712信息技術(shù)教學(xué)中心變量變換后擬合線性回歸模型本案例需求擬合曲線回歸模型,但統(tǒng)計(jì)學(xué)上開(kāi)展最早最成熟的是線性回歸模型,有無(wú)方法將其方法體系利用到曲線回歸方面去呢?答案非常簡(jiǎn)單,只需能夠經(jīng)過(guò)變量變換,將曲線方程變換為直線方程的方式,即可利用變換后的變量來(lái)進(jìn)展“線性〞模型的擬合。擬合方程:+2023/12/2713信息技術(shù)教學(xué)中心變量變換轉(zhuǎn)換——計(jì)算變量Time2=time*time2023/12/2714信息技術(shù)教學(xué)中心二次方曲線直線化擬合分析——回歸——線性將sales選入“因變量〞列表框,將time,time2選入“自變量〞列表框確定0~1取值,越接近1越好規(guī)范回歸系數(shù)2023/12/2715信息技術(shù)教學(xué)中心分析結(jié)果經(jīng)過(guò)系數(shù)表可以寫(xiě)出回歸方程如下:銷(xiāo)量=.976-5.998*time+1.821*time2當(dāng)time=0,即時(shí)間為1993-1=1992時(shí),銷(xiāo)量的模型估計(jì)值為.976,顯然這個(gè)數(shù)值和實(shí)踐值差的有點(diǎn)遠(yuǎn),由于1993年之前的數(shù)據(jù)趨勢(shì)并不服從如今擬合的模型,所以這個(gè)估計(jì)值沒(méi)有實(shí)踐的意義。銷(xiāo)量和時(shí)間的一次項(xiàng)負(fù)相關(guān),二次項(xiàng)正相關(guān)。2023/12/2716信息技術(shù)教學(xué)中心模型擬合效果的判別預(yù)測(cè)模型建立后,模型的預(yù)測(cè)精度終究如何是非常關(guān)懷的問(wèn)題,除了運(yùn)用回歸模型中的一些診斷目的外,也可以運(yùn)用針對(duì)時(shí)間序列預(yù)測(cè)的一些專門(mén)目的加以判別。殘差獨(dú)立性檢驗(yàn):運(yùn)用“統(tǒng)計(jì)量〞子對(duì)話框中,選中“Durbin-Watson〞統(tǒng)計(jì)量復(fù)選框,結(jié)果如下:普通地,假設(shè)自變量數(shù)少于4個(gè),統(tǒng)計(jì)量大于2,根本上一定殘差間相互獨(dú)立。取值1~4之間,大于上界那么闡明殘差獨(dú)立,低于下界那么闡明相互關(guān)聯(lián)2023/12/2717信息技術(shù)教學(xué)中心模型擬合效果的判別殘差分布的圖形察看在“繪制〞子對(duì)話框中,選中“直方圖〞和“正態(tài)概率圖〞復(fù)選框。結(jié)果如下:2023/12/2718信息技術(shù)教學(xué)中心模型擬合效果的判別2023/12/2719信息技術(shù)教學(xué)中心模型擬合效果的判別繪制殘差序列圖在“保管〞子對(duì)話框中,選中“規(guī)范化殘差〞復(fù)選框確定依次單擊“分析〞——“預(yù)測(cè)〞——“序列圖〞變量框:選入ZRE_1時(shí)間軸標(biāo)簽框:選入year確定2023/12/2720信息技術(shù)教學(xué)中心2023/12/2721信息技術(shù)教學(xué)中心存儲(chǔ)預(yù)測(cè)值和區(qū)間估計(jì)值本案例建立模型,不是為了找到年代對(duì)銷(xiāo)量的影響,而是為了對(duì)因變量進(jìn)展預(yù)測(cè),因此需求在數(shù)據(jù)集中計(jì)算出預(yù)測(cè)值、個(gè)體參考值范圍等。在“保管〞子對(duì)話框中,預(yù)測(cè)值、殘差、預(yù)測(cè)區(qū)間等都可以作為新變量存儲(chǔ)在數(shù)據(jù)集中。本例需求預(yù)測(cè)區(qū)間和預(yù)測(cè)值,相應(yīng)的操作如下:在數(shù)據(jù)集中新增三條記錄,變量id分別等于10,11,12反復(fù)執(zhí)行“回歸〞對(duì)話框“保管〞子對(duì)話框,選中“未規(guī)范化預(yù)測(cè)值〞、“單值預(yù)測(cè)區(qū)間〞兩個(gè)復(fù)選框。2023/12/2722信息技術(shù)教學(xué)中心用曲線估計(jì)過(guò)程同時(shí)擬合多個(gè)曲線模型依次單擊“分析〞——“回歸〞——“曲線估計(jì)〞“因變量〞列表框:sales“自變量〞列表框:time模型:選中二次項(xiàng)、立方和指數(shù)分布選中“顯示ANOVA表格〞復(fù)選框確定2023/12/2723信息技術(shù)教學(xué)中心分析結(jié)果2023/12/2724信息技術(shù)教學(xué)中心三次方2023/12/2725信息技術(shù)教學(xué)中心指數(shù)2023/12/2726信息技術(shù)教學(xué)中心擬合曲線比較圖2023/12/2727信息技術(shù)教學(xué)中心模型擬合效果的判別方法一、存儲(chǔ)殘差值先將模型的殘差存為新變量供分析中運(yùn)用,操作如下:進(jìn)入“保管〞子對(duì)話框“保管變量〞框:選中“殘差〞繼續(xù)再次運(yùn)轉(zhuǎn)曲線擬合過(guò)程,此時(shí)會(huì)消費(fèi)ERR_1~ERR_3共3個(gè)新變量,分別代表二次、三次和指數(shù)模型的誤差項(xiàng)。為了便于察看可以將他們的變量名標(biāo)簽分別改為二次方程、三次方程和指數(shù)方程。2023/12/2728信息技術(shù)教學(xué)中心察看模型誤差項(xiàng)的序列圖首先繪制3個(gè)模型誤差項(xiàng)的序列圖,以察看隨著年代的變化,相應(yīng)預(yù)測(cè)誤差的變動(dòng)趨勢(shì)。如下:依次單擊“分析〞——“預(yù)測(cè)〞——“序列圖〞變量框:選入ERR_1~ERR_3時(shí)間軸標(biāo)簽框:選入year確定2023/12/2729信息技術(shù)教學(xué)中心模型的預(yù)測(cè)根據(jù)上面的討論,確定該當(dāng)運(yùn)用三次方模型進(jìn)展預(yù)測(cè),并且預(yù)測(cè)的長(zhǎng)度在3年以內(nèi)比較恰當(dāng),為此采取和線性回歸一樣的操作:在數(shù)據(jù)集中新增三條記錄,變量id分別等于10,11,12,然后再曲線擬合過(guò)程中操作依次單擊“分析〞——“回歸〞——“曲線估計(jì)〞“因變量〞列表框:sales“自變量〞列表框:time模型:立方“保管〞子對(duì)話框“保管變量〞:選中“預(yù)測(cè)值〞和“預(yù)測(cè)區(qū)間〞確定2023/12/2730信息技術(shù)教學(xué)中心利用非線性回歸進(jìn)展擬合非線性回歸模型在SPSS中可以采用NLR和CNLR兩個(gè)過(guò)程擬合,前者用于普通的非線性模型,后者用于帶約束條件的非線性模型擬合2023/12/2731信息技術(shù)教學(xué)中心構(gòu)建分段回歸模型1993——1998年根本呈線性趨勢(shì),然后在1998——2001年呈現(xiàn)另外一種線性趨勢(shì)的模型,用公式表達(dá)如下:Sales=+*time1993<=year<1998Sales=+*timeyear>=1998非線性回歸模型中可以直接對(duì)該分段模型進(jìn)展擬合,獨(dú)一的難點(diǎn)就是模型表達(dá)式只能寫(xiě)在一個(gè)公式里,詳細(xì)如下:Sales=(year<1998)*(+*time)+(year>=1998)*(+*time)2023/12/2732信息技術(shù)教學(xué)中心SPSS中的操作如下:依次單擊“分析〞——“回歸〞——“非線性〞“因變量〞列表框:sales“自變量〞列表框:輸入Sales=(year<1998)*(+*time)+(year>=1998)*(+*time)參數(shù):在子對(duì)話框中分別將b01、b02、b11和b12的初始值設(shè)為1確定2023/12/2733信息技術(shù)教學(xué)中心分析結(jié)果2023/12/2734信息技術(shù)教學(xué)中心不同模型效果比較進(jìn)入“保管〞子對(duì)話框選中“預(yù)測(cè)值〞確定依次單擊“分析〞——“預(yù)測(cè)〞——“序列圖〞“變量〞列表框:選入三次方曲線的預(yù)測(cè)值FIT_1、LCL_1和UCL_1,以及非線性

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論