常用統(tǒng)計預(yù)測方法_第1頁
常用統(tǒng)計預(yù)測方法_第2頁
常用統(tǒng)計預(yù)測方法_第3頁
常用統(tǒng)計預(yù)測方法_第4頁
常用統(tǒng)計預(yù)測方法_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

常用統(tǒng)計預(yù)測方法2023/2/41第一頁,共四十一頁,2022年,8月28日2023/2/42第二頁,共四十一頁,2022年,8月28日傳統(tǒng)的時間序列分析的應(yīng)用,主要是確定性的時間序列分析方法,包括指數(shù)平滑法、滑動平均法、時間序列的分解等等,這些方法的應(yīng)用有一個前提條件:時間序列的隨機(jī)性部分相對來說并不顯著。事實上,這一條件在大多數(shù)情況下都是不成立的。因為,隨著社會的發(fā)展,許多不確定性因素的影響越來越大,必須引起人們的重視。2023/2/43第三頁,共四十一頁,2022年,8月28日1970年,Box和Jenkins提出了以隨機(jī)理論為基礎(chǔ)的時間序列分析方法,使時間序列分析理論上升到一個新的高度,預(yù)測的精確度大大提高。其基本模型有三種:自回歸(AR)模型;滑動平均(MA)模型自回歸滑動平均(ARIMA)模型。2023/2/44第四頁,共四十一頁,2022年,8月28日

兩個問題:(1)分析時間序列的隨機(jī)性、平穩(wěn)性和季節(jié)性;(2)在對時間序列分析的基礎(chǔ)上,選擇適當(dāng)?shù)哪P瓦M(jìn)行預(yù)測(AR(p),MA(q),ARIMA(p,d,q))。2023/2/45第五頁,共四十一頁,2022年,8月28日1ARIMA預(yù)測數(shù)學(xué)模型自回歸滑動平均混合模型(autoregressiveintegratedmovingaverage)

ARIMA(p,d,q)其中:p為自回歸的階數(shù);d為差分階數(shù);q為滑動平均階數(shù)。2023/2/46第六頁,共四十一頁,2022年,8月28日ARIMA模型可分為:(1)自回歸模型(AR),即ARIMA(p,0,0);(2)滑動平均模型(MA),即ARIMA(0,0,q);(3)自回歸滑動平均混合模型(ARIMA(p,d,q))。2023/2/47第七頁,共四十一頁,2022年,8月28日ARIMA方法依據(jù)的基本思想:將預(yù)測對象隨時間推移而形成的時間序列視為一個隨機(jī)序列,即除去個別偶然原因引起的觀測值外,時間序列是一組依賴于時間t的隨機(jī)變量。這組隨機(jī)變量所具有的依存關(guān)系或自相關(guān)性表征了預(yù)測對象發(fā)展的延續(xù)性,而這種自相關(guān)性一旦被相應(yīng)的數(shù)學(xué)模型描述出來,就可以從時間序列的過去及現(xiàn)在的值預(yù)測未來值。2023/2/48第八頁,共四十一頁,2022年,8月28日運用ARIMA方法的前提條件:作為預(yù)測對象的時間序列是一零均值的平穩(wěn)時間序列。平穩(wěn)隨機(jī)序列的統(tǒng)計特性不隨時間的推移而變化。直觀的看,平穩(wěn)隨機(jī)序列的折線圖無明顯的上升或下降趨勢。(如圖22-10)2023/2/49第九頁,共四十一頁,2022年,8月28日對非零均值的非平穩(wěn)的時間序列,若用ARIMA預(yù)測方法,需先對時間序列進(jìn)行零均值化和差分平穩(wěn)化處理.零均值化:對均數(shù)不為零的序列每一項都減去該序列的平均數(shù),構(gòu)成一個均值為零的新的時間序列。如例22-2:可取2023/2/410第十頁,共四十一頁,2022年,8月28日差分平穩(wěn)化處理(I)對均值為零的非平穩(wěn)時間序列進(jìn)行差分,使之成為平穩(wěn)時間序列。一般情況下,非平穩(wěn)序列經(jīng)過一階差分或二階差分都可以平穩(wěn)化。如:有線性增長趨勢的時間序列可用一階差分;若為二次增長可用二階差分。2023/2/411第十一頁,共四十一頁,2022年,8月28日例22-3某醫(yī)院從1990年1月-2001年12月的門診量數(shù)據(jù)(P336)門診情況的序列圖2023/2/412第十二頁,共四十一頁,2022年,8月28日門診、均零、一階差分法的序列圖2023/2/413第十三頁,共四十一頁,2022年,8月28日門診、一階差分法、二階差分的序列圖2023/2/414第十四頁,共四十一頁,2022年,8月28日具體計算:2023/2/415第十五頁,共四十一頁,2022年,8月28日自回歸模型(AR)經(jīng)典統(tǒng)計中的回歸模型:表示因變量對于自變量依賴(相關(guān))關(guān)系。等式右側(cè)將隨機(jī)變量分解成兩部分,一部分是自變量它們代表某些已知的可變化因素;另一部分是殘差量,它是由一些不可捉摸的因素及測量誤差產(chǎn)生。通常假定為正態(tài)零均值獨立序列。2023/2/416第十六頁,共四十一頁,2022年,8月28日

將經(jīng)典統(tǒng)計回歸模型推廣,得到一類新的線性模型稱為自回歸模型??捎脕砻枋瞿承r間序列。特別是當(dāng)時間序列難于和其它因素建立聯(lián)系時,用自回歸模型建模更顯重要。Yt代表在t時的觀察值,et代表誤差或偏差,表示不能用模型說明的隨機(jī)因素。2023/2/417第十七頁,共四十一頁,2022年,8月28日此模型和經(jīng)典統(tǒng)計回歸模型的本質(zhì)區(qū)別:在經(jīng)典統(tǒng)計回歸模型中是已知的可變化因素。自變量間的關(guān)系是相互獨立的。在自回歸模型中同屬于一個序列,它們彼此之間不是獨立的,而是有一定的相互依賴關(guān)系。2023/2/418第十八頁,共四十一頁,2022年,8月28日一階自回歸模型上面的模型稱為p階自回歸模型。當(dāng)p=1時是一階自回歸模型。意義:Yt變量受Yt-1的影響。2023/2/419第十九頁,共四十一頁,2022年,8月28日例如:考慮一個阻尼單擺。以Yt表示t時刻的最大擺幅,由于阻尼的作用,Yt與Yt-1之間具有關(guān)系式:式中的代表阻尼系數(shù)。表示第t個擺動周期中單擺還受到外加的力所額外加的擺幅。2023/2/420第二十頁,共四十一頁,2022年,8月28日滑動平均(MA)模型式中是時間序列在t時刻的觀察值;q是滑動平均的階數(shù);是時間序列模型在t時刻的誤差或偏差。在滑動平均的過程中,每一個值是由當(dāng)前干擾以及前一個或多個干擾的均值決定的?;瑒悠骄碾A確定了有多少個前干擾被用于平均。2023/2/421第二十一頁,共四十一頁,2022年,8月28日三、自回歸滑動平均混合(ARIMA)模型將自回歸模型和滑動平均模型組合,便構(gòu)成自回歸滑動平均混合(ARIMA)模型2023/2/422第二十二頁,共四十一頁,2022年,8月28日應(yīng)用ARIMA方法預(yù)測分為三個階段:模型的識別:利用自相關(guān)分析和偏相關(guān)分析等方法,分析時間序列的隨機(jī)性、平穩(wěn)性及季節(jié)性,并選定一個特定的模型以擬合所分析的時間序列。

2023/2/423第二十三頁,共四十一頁,2022年,8月28日2模型中參數(shù)的估計和模型的檢驗:用時間序列的數(shù)據(jù),估計模型的參數(shù),并進(jìn)行檢驗,以判定該模型是否恰當(dāng)。3預(yù)測應(yīng)用:用選定的模型對將來某個時刻的數(shù)值作出預(yù)測。2023/2/424第二十四頁,共四十一頁,2022年,8月28日ARIMA的計算步驟1、識別必須確定三個整數(shù)p,d,q,另外還須確定是否具有周期性。首先應(yīng)從散點圖判別時間序列是否平穩(wěn)。從上面差分之后的圖可見:進(jìn)行一階差分I(1)=ARIMA(1)之后,其隨機(jī)性較好。故d=1。I(2)=ARIMA(2)d通常取為0或1,一般不超過2。如圖22-10d=02023/2/425第二十五頁,共四十一頁,2022年,8月28日p的確定:AR(p)=ARIMA(p,0,0)。其意義為在自回歸序列中,每個值都是前一個值或多個值的線性組合。AR(1)代表每個值對前值的依賴程序。對于非周期的時間序列,P值的決定可取決于PACF。若Lag滯后項開始急劇減小,則通常令p=Lag。否則是拖尾的,其p=0。如:圖22-12,P=0。2023/2/426第二十六頁,共四十一頁,2022年,8月28日q值的確定:

滑動平均MA(q),每一項是由當(dāng)前干擾以及前或一個或前多個干擾的均值決定的。

MA(q)=ARIMA(0,0,q)對于非周期的時間序列,q值的決定可取決于ACF。若在Lag滯后項開始急劇減小,則通常令q=Lag。否則是拖尾的,其q=0。如:圖22-12,由于在滯后1處顯示了一個負(fù)的低谷,其后幾個值與其相差較大。故q=1。2023/2/427第二十七頁,共四十一頁,2022年,8月28日2、估計給出模型后ARIMA(0,1,1),計算模型的參數(shù),并獲得擬合值或預(yù)測值(FIT_1)、殘差(ERR_1)、其可信限(LCL_1,UCL_1)及標(biāo)準(zhǔn)誤(SEP_1)。

結(jié)果表22-7,模型中MA1=0.78105,表示序列中的每個值等于當(dāng)前的隨機(jī)干擾減去前一個隨機(jī)干擾的0.78倍。2023/2/428第二十八頁,共四十一頁,2022年,8月28日3診斷可從兩個方面考慮:(1)殘差的ACF和PACF不應(yīng)與0有顯著的差異。ACF、PACF高階相關(guān)相關(guān)可能偶爾會超過95%的可信區(qū)間,但如一或二階很大,那么模型就是錯誤的。2023/2/429第二十九頁,共四十一頁,2022年,8月28日(2)殘差應(yīng)是隨機(jī)的,即是白噪聲(whitenoise)??捎肂ox-LjungQ統(tǒng)計量。應(yīng)在大約有1/4的滯后項中考察Q值(但滯后項不能多于50)。Q統(tǒng)計量應(yīng)沒有統(tǒng)計學(xué)意義。(3)考察AIC和SBC

考慮多個模型,如AIC與SBC均小,說明這個模型較好。AIC適用于自回歸模型,SBC適用于更通用的模型。2023/2/430第三十頁,共四十一頁,2022年,8月28日(4)控制圖的建立可在同一個序列圖中,作出其實測值、95%的可信限上、下界及預(yù)測值。圖22-14。2023/2/431第三十一頁,共四十一頁,2022年,8月28日季節(jié)性ARIMA模型(seasonalARIMA)。2023/2/432第三十二頁,共四十一頁,2022年,8月28日ARIMA(0,1,1)12代表12為周期。1季節(jié)性后移算子B(backfit)代表時間序列后移一時間點考察。B2代表往后移動兩個單位。對于周期為12的觀察值,則為B12季節(jié)性ARIMA(0,0,1)12Zt=(1-θB12)etARIMA(0,1,1)12(1-B12)Zt=(1-θB12)et2023/2/433第三十三頁,共四十一頁,2022年,8月28日2識別季節(jié)模型的一些問題

(1)序列的長度要較長。如至少應(yīng)有7或8個季節(jié)周期的數(shù)據(jù)。

(2)季節(jié)性與非季節(jié)性的混合若ACF或PACF或兩者在季節(jié)周期的整數(shù)倍時點處都顯示了特別值,說明存在季節(jié)過程。

2023/2/434第三十四頁,共四十一頁,2022年,8月28日(1)ACF圖和PACF圖2023/2/435第三十五頁,共四十一頁,2022年,8月28日1次差分后的序列圖2023/2/436第三十六頁,共四十一頁,2022年,8月28日(2)季節(jié)模型的識別1次差分存在問題(1)仍存在季節(jié)性問題,仍有上升的趨勢,可考慮用季節(jié)性差分。(2)方差非齊,可考慮用對數(shù)變換。2023/2/437第三十七頁,共四十一頁,2022年,8月28日季節(jié)性差分中D=1。

季節(jié)性差分可平滑急劇的季節(jié)波動。左圖為一次性季節(jié)差分后的序列圖。2023/2/438第三十八頁,共四十一頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論