版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1.1時間序列定義:時間序列是指將某種現(xiàn)象某一個統(tǒng)計指標在不同時間上的各個數(shù)值,按時間先后順序排列而形成的序列.構(gòu)成要素:現(xiàn)象所屬的時間,反映現(xiàn)象發(fā)展水平的指標數(shù)值要素一:時間t;要素二:指標數(shù)值。1.2時間序列的成分:一個時間序列中往往由幾種成分組成,通常假定是四種獨立的成分一一趨勢T、循環(huán)C季節(jié)S和不規(guī)則I。T趨勢通常是長期因素影響的結(jié)果,如人口總量的變化、方法的變化等。C任何時間間隔超過一年的,環(huán)繞趨勢線的上、下波動,都可歸結(jié)為時間序列的循環(huán)成分。S許多時間序列往往顯示出在一年內(nèi)有規(guī)則的運動,這通常由季節(jié)因素引起,因此稱為季節(jié)成分。目前,可以稱之為“季節(jié)性的周期”,年或者季節(jié)或者月份。I
2、時間序列的不規(guī)則成分是剩余的因素,它用來說明在分離了趨勢、循環(huán)和季節(jié)成分后,時 間序列值的偏差。不規(guī)則成分是由那些影響時間序列的短期的、不可預(yù)期的和不重復(fù)出現(xiàn)的因素引起的。它是隨機的、無法預(yù)測的。四個組成部分與觀測值的關(guān)系可以用乘法模型或者加法模型或者綜合。1.3預(yù)測方法的選擇與評估方法P216三種預(yù)測方法:移動平均法、加權(quán)移動平均法和指數(shù)平滑法。因為每一種方法的都是要“消除”由時間序列的不規(guī)則成分所引起的隨機波動,所以它們被稱為平滑方法。 平滑方法對穩(wěn)定的時間序列一一即沒有明顯的趨勢、 循環(huán)和季節(jié)影響的時間序列一一是合適的, 這時平滑 方法很適應(yīng)時間序列的水平變化。 但當有明顯的趨勢、 循環(huán)
3、和季節(jié)變差時, 平滑方法將不能 很好地起作用。移動平均法使用時間序列中最近幾個時期數(shù)據(jù)值的平均數(shù)作為下一個時期的預(yù)測值。移動平均數(shù)的計算公式如下:移動平均數(shù)二最近斤期數(shù)據(jù)之和11指數(shù)平滑法模型:式中Ft+1 t+1期時間序列的預(yù)測值;Ytt期時間序列的實際值;Ft t期時間序列的預(yù)測值; a平滑常數(shù)(OWaW 1 )。F = aYr+(y-aFt(11-2)均方誤差是常用的(MSE)標準誤差定義為各測量值誤差的平方和的平均值的平方根。設(shè)n個測量值的誤差為& 1、£ 2£ n,則這組測量值的標準誤差b等于:cr+耳n數(shù)理統(tǒng)計中均方誤差是指參數(shù)估計值與參數(shù)真值之差平方的
4、期望值,記為 量“平均誤差”的一種較方便的方法,MSE可以評價數(shù)據(jù)的變化程度,明預(yù)測模型描述實驗數(shù)據(jù)具有更好的精確度。與此相對應(yīng)的,還有均方根誤差 絕對百分誤差等等。MSE。MSE 是衡MSE的值越小,說RMSE平均RMSE(observedt predieted n LK匸】MSE2( Servedf predictedtMAPEitE£= 1obseruedf predictedobserved)100xnMAD| observedi predicted 時間序列平穩(wěn)性的定義假定某個時間序列由某一隨機過程(stochastic process)生成,即假定時間序列Xt (t=1,
5、2,)的每一個數(shù)值都是從一個概率分布中隨機得到的。如果經(jīng)由該隨機過程所生成的時 間序列滿足下列條件:均值E(Xt)=m是與時間t無關(guān)的常數(shù);方差Var(Xt)=s2是與時間t無關(guān)的常數(shù);協(xié)方差Cov(Xt,Xt+k)=gk是只與時期間隔k有關(guān),與時間t無關(guān)的常數(shù); 則稱經(jīng)由該隨機過程而生成的時間序列是(弱)平穩(wěn)的(stationary)。該隨機過程便是一個平穩(wěn)的隨機過程( stationary stochastic process )。例如,白噪聲(white noise )過程就是平穩(wěn)的:Xt=ut , utIIN(0,sA2)因為它的均值為常數(shù)零;方差為常數(shù)sA2 ;所有時間間隔的協(xié)方差均
6、為零。但隨機游走(random walk )過程是非平穩(wěn)的:Xt=Xt-1+ut , utIIN(0,sA2),因為盡管其均值為常數(shù)E (Xt) =E (Xt-1),但其方差Var(Xt)=tsA2非常數(shù)。不過,若令 DXt=Xt-Xt-1,則隨機游走過程的一階差分(first differenee )是平穩(wěn)的: DXt=Xt-Xt-1=ut , utIIN(0,sA2)一般地,在經(jīng)濟系統(tǒng)中,一個非平穩(wěn)的時間序列通常均可通過差分變換的方法轉(zhuǎn)換成為平穩(wěn) 序列。指數(shù)平滑法有幾種不同形式:一次指數(shù)平滑法針對沒有趨勢和季節(jié)性的序列,二次指數(shù)平滑法針對有趨勢但沒有季節(jié)性的序列。術(shù)語“HoHWinters
7、法"有時特指三次指數(shù)平滑法。所有的指數(shù)平滑法都要更新上一時間步長的計算結(jié)果,并使用當前時間步長的數(shù)據(jù)中包含的新信息。它們通過混合”新信息和舊信息來實現(xiàn),而相關(guān)的新舊信息的權(quán)重由一個可調(diào)整的 拌和參數(shù)來控制。各種方法的不同之處在于它們跟蹤的量的個數(shù)和對應(yīng)的拌和參數(shù)的個數(shù)。 一次指數(shù)平滑法的遞推關(guān)系特別簡單:£=口+(1-00匸_;其中 0=1其中, 是時間步長i上經(jīng)過平滑后的值,是這個時間步長上的實際(未平滑的)數(shù)據(jù)。你可以看到是怎么由原始數(shù)據(jù)和上一時間步長的平滑值混合而成的。拌和參數(shù)可以是0和1之間的任意值,它控制著新舊信息之間的平衡:當接近1時,我們就只保留當前數(shù)據(jù)點 (
8、即完全沒有對序列進行平滑);當 接近0時,我們就只保留前面的平滑值 (也就是說整個曲線 都是平的)。為何這個方法被稱為 指數(shù)”平滑法?要找出答案,展開它的遞推關(guān)系式即可知道:壬十I_I-(ud +tl-盤心"-(1 宜)范心亠O一處X*-J1n 產(chǎn) Q - ctX-j 十 d -alXzl-d -曲 X從這里可以看出,在指數(shù)平滑法中,所有先前的觀測值都對當前平滑值產(chǎn)生了影響,但它們所起的作用隨著參數(shù)的幕的增大而逐漸減小。那些相對較早的觀測值所起的作用相對較小,這也就是指數(shù)變動形態(tài)所表現(xiàn)出來的特性。從某種程度上來說,指數(shù)平滑法就像是擁有無限記 憶且權(quán)值呈指數(shù)級遞減的移動平均法。(同時也
9、要注意到所有權(quán)值的和,一 一等于1,因為當q<1時,幾何序列 區(qū)涼莎0。 參見附錄B的幾何序列方面的信息。) 一次指數(shù)平滑所得的計算結(jié)果可以在數(shù)據(jù)集范圍之外進行擴展,因此也就可以用來進行預(yù)測。預(yù)測也非常簡單:其中,是最后一個已經(jīng)算出來的值。也就是說,一次指數(shù)平滑法得出的預(yù)測在任何時候都 是一條直線。剛剛描述的一次指數(shù)平滑法適用于沒有總體趨勢的時間序列。如果用來處理有總體趨勢的序列,平滑值將往往滯后于原始數(shù)據(jù),除非的值接近1,但這樣一來就會造成不夠平滑。二次指數(shù)平滑法保留了趨勢的詳細信息,從而改正了這個缺點。換句話說,我們保留并更新兩個量的狀態(tài):平滑后的信號和平滑后的趨勢。它有兩個等式和兩
10、個拌合參數(shù):我們先看看第二個等式。 這個等式描述了平滑后的趨勢。當前趨勢的未平滑 值”是當前平滑值和上一個平滑值的差;也就是說,當前趨勢告訴我們在上一個時間步長里平滑信號改變了多少。要想使趨勢平滑,我們用一次指數(shù)平滑法對趨勢進行處理,并使用拌合參數(shù)。為獲得平滑信號,我們像上次那樣進行一次混合,但要同時考慮到上一個平滑信號及趨勢。第一個等式的最后那個項可以對當前平滑信號進行估計一一假設(shè)在單個時間步長里我們保持著上一個趨勢。若要利用該計算結(jié)果進行預(yù)測,我們就取最后那個平滑值,然后每增加一個時間步長, 就在該平滑值上增加一次最后那個平滑趨勢:匚7+加最后,我們給三次指數(shù)平滑法添加第三個量,用來描述季
11、節(jié)性。我們有必要區(qū)分一下累加式和累乘式季節(jié)性,累加式對應(yīng)的等式:兌(X - (1 -復(fù))(和】-t嚴照 7占打斗一城+屈ru累乘式的等式:縣=冷弋_力沿J筑+肚)P"其中,pi是指 周期性”部分,是這個周期的長度。前面的等式中也包含預(yù)測的等式。所有的指數(shù)平滑方法都是基于遞推關(guān)系的, 這表明我們要先設(shè)定初始值才能使用它們。 選擇 什么樣的初始值并不特別重要:指數(shù)式衰減規(guī)律說明所有的指數(shù)平滑方法的 記憶”能力都是 很短的,只需經(jīng)過幾個時間步長,初始值的影響就會變得微乎其微。一些合理的初始值:=或害殆=一£兀其中l(wèi)scl.JDH T-對三次指數(shù)平滑法而言,我們必須初始化一個完整的
12、季節(jié)”的值,不過我們可以簡單地設(shè)置為全1(針對累乘式)或全0(針對累加式)。只有當序列的長度較短時,我們才需要慎重考慮初 始值的選取。最后一個問題是如何選擇拌合參數(shù) 杭"戲門/'Io我的建議是反復(fù)試驗。先試試0.2和0.4之間的幾個值(非常粗略地),然后看看會得到什么結(jié)果。或者也可以為(實際數(shù)據(jù)和平滑算法的結(jié)果之間的)誤差定 義一個標準,再使用一個數(shù)值優(yōu)化過程來將誤差最小化。就我的經(jīng)驗而言,一般沒有必要弄得這么麻煩,原因至少有兩個:數(shù)值優(yōu)化是一個不能保證收斂的迭代過 程,最終你可能還需要花非常多時間將算法設(shè)計成收斂的。此外,任何這樣的數(shù)值優(yōu)化 都受限于你選對誤差進行最小化的表
13、達式。問題是使誤差最小化的參數(shù)值可能并不能滿足在解決方案中你想要看到的其他特性(也就是近似值的精確性和結(jié)果曲線的平滑程度之間的平衡),那么,到最后你才會發(fā)現(xiàn),手動的計算方法往往更好。不過,如果你要預(yù)測很多序列,花些精力構(gòu)建一個能自動決定最優(yōu)參數(shù)值的系統(tǒng)也是值得的,但要實現(xiàn)這個系統(tǒng)恐怕也并不容易。最后,我想用一個例子來展示我們想從指數(shù)平滑法得到的結(jié)果。下圖是一個經(jīng)典的數(shù)據(jù)集,它顯示的是每個月國際航班的旅客數(shù)量(單位:千人)。該圖顯示了實際數(shù)據(jù)和三次指數(shù)近似值。19491957年用來 訓(xùn)練”生成它的算法,而 19581960年都是預(yù)測數(shù)值。注意,這 里的預(yù)測值與實際數(shù)據(jù)相當接近一一特別是它強烈的季
14、節(jié)形態(tài)一一持續(xù)了一段如此長的預(yù) 測時段(整整三年!)。對于像這樣簡單的方法來說,是很不錯的。F:指數(shù)平制吐的實Mi實繩I和平吊曲珂堺號上閘宙比垢55舉之打的邢和如線花麗的足僅梗用霜5: :|阿兩們數(shù)惦訃草冊爬的預(yù)刑掃I沖肚mi訃幅時間序列挖掘-預(yù)測算法-三次指數(shù)平滑法(Holt -Winters)在時間序列中,我們需要基于該時間序列當前已有的數(shù)據(jù)來預(yù)測其在之后的走勢,三次指數(shù)平滑(Triple/Three Order Exponen tial Smooth in g,Holt -Win ters)算法可以很好的進行時間序列的預(yù)測。時間序列數(shù)據(jù)一般有以下幾種特點:1趨勢(Trend) 2.季節(jié)性
15、(Seasonality)。趨勢描述的是時間序列的整體走勢,比如總體上升或者總體下降。下圖所示的時間序列是 總體上升的:3WI1001zoninci季節(jié)性描述的是數(shù)據(jù)的周期性波動,比如以年或者周為周期,如下圖:I w三次指數(shù)平滑算法可以對同時含有趨勢和季節(jié)性的時間序列進行預(yù)測, 指數(shù)平滑和二次指數(shù)平滑算法的。一次指數(shù)平滑算法 基于以下的遞推關(guān)系:Si= ai+(1- a )S其中a是平滑參數(shù),Si是之前i個數(shù)據(jù)的平滑值,取值為0,1 , a越接近1,平滑后的值越 接近當前時間的數(shù)據(jù)值,數(shù)據(jù)越不平滑,a越接近0,平滑后的值越接近前 i個數(shù)據(jù)的平滑值,數(shù)據(jù)越平滑,a的值通??梢远鄧L試幾次以達到最佳
16、效果。一次指數(shù)平滑算法進行預(yù)測的公式為:Xi+h=S,其中i為當前最后的一個數(shù)據(jù)記錄的坐標,亦即預(yù)測的時間序列為一條直線,不能反映時間序列的趨勢和季節(jié)性。二次指數(shù)平滑保留了趨勢的信息,使得預(yù)測的時間序列可以包含之前數(shù)據(jù)的趨勢。二次指 數(shù)平滑通過添加一個新的變量Si= a X(1- a )(3+ti-1)ti=?(Si-Si-1)+(1 -?)ti-1二次指數(shù)平滑的預(yù)測公式為t來表示平滑后的趨勢:該算法是基x+h=s+hti二次指數(shù)平滑的預(yù)測結(jié)果是一條斜的直線。使得其可以預(yù)測帶有季節(jié)性 p來表示平滑后的趨勢。三次指數(shù)平滑在二次指數(shù)平滑的基礎(chǔ)上保留了季節(jié)性的信息,的時間序列。三次指數(shù)平滑添加了一個
17、新的參數(shù)三次指數(shù)平滑有累加和累乘兩種方法,下面是累加的三次指數(shù)平滑Si= a (Xpi-k)+(1- a )(&+ti-1)ti=?(Si-Si-1)+(1 -?)ti-1pi= Y (XSi)+(1-Y )ip 其中 k 為周期累加三次指數(shù)平滑的預(yù)測公式為:根據(jù) Wikipedia修正。下式為累乘的三次指數(shù)平滑:Si= a i/p i-k+(1- a )(S+ti-1)ti=?(Si-Si-1)+(1-?)ti-1pi= Yi /Si+(1- Y其中 k 為周期累乘三次指數(shù)平滑的預(yù)測公式為:根據(jù) Wikipedia修正。a, ?, 丫的值都位于0,1之間,可以多試驗幾次以達到最佳效果
18、。s,t,p初始值的選取對于算法整體的影響不是特別大,通常的取值為p=0,累乘時p=1.我們使用 DataMarket的International Airline Passengers數(shù)據(jù)來測試累加和累乘三次指數(shù)平滑 算法的性能,該數(shù)據(jù)記錄的是每月的國際航線乘客數(shù):下圖為使用累加三次指數(shù)平滑進行預(yù)測的效果:其中紅色為源時間序列,藍色為預(yù)測的時Xi+h=Si+hti+pi-k+(h mod k)注意:數(shù)據(jù)之魅 P88此處有錯誤,Xi+h=(S+hti)pi-k+(h mod k)注意:數(shù)據(jù)之魅P88此處有錯誤,S0=X0,t 0=X1-X0,累加時間序列,a, ?, 丫的取值為0.45, 0.2
19、, 0.95:F圖為累乘三次指數(shù)平滑進行預(yù)測的效果,a, ?, 丫的取值為0.4 , 0.05, 0.9:可以看到三次指數(shù)平滑算法可以很好的保存時間序列數(shù)據(jù)的趨勢和季節(jié)性信息,在International Airline Passengers數(shù)據(jù)集上累乘平滑指數(shù)算法的效果更好。殘差檢驗a.用相關(guān)計量軟件:比如說E-VIEWS檢查殘差的分布。 如果殘差分布具有明顯和圓潤的線 性分布圖像,說明自相關(guān)性存在的可能性很高。 反之,無規(guī)則波動大的分布圖像顯示出相 關(guān)性微弱。自相關(guān)性判斷方法1例子比如,以上圖片,左邊較為圓潤的分布就顯示出自相關(guān)性的存在,右邊波動大的則反之。b. Durbin-Watson Statistics(德賓一瓦特遜檢驗):假設(shè)time series模型存在自相關(guān)性,我們假設(shè)誤差項可以表述為Ut= p *U11+ & .利用統(tǒng)計檢測設(shè)立假設(shè),如果p =0則表明沒有自相關(guān)性。Durbin-Watson統(tǒng)計量(后面建成 DW統(tǒng)計量)可以成為判斷正、負、零(無)相關(guān)性的工具。DW統(tǒng)計量:d=E (UtUt-1)A2/刀utA2沁2*仆)如果d=2則基本沒有自相關(guān)關(guān)系,d靠近0 存在正的相關(guān)關(guān)系,d靠近4則有負的相關(guān)關(guān)系。1c. Q-Statisti
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度新型農(nóng)村宅基地使用權(quán)轉(zhuǎn)讓合同范本
- 二零二五年度噴漆作業(yè)場所職業(yè)健康監(jiān)護與疾病預(yù)防合同
- 二零二五年度企業(yè)VI系統(tǒng)全案定制合同3篇
- 二零二五年度戶外噴泉節(jié)能改造專項合同
- 二零二五年度土地整治土石方運輸及土壤改良合同6篇
- 2025年度智能車展合作項目合作協(xié)議書范本4篇
- 2025版中學(xué)校園食品安全供應(yīng)與配送合作協(xié)議3篇
- 二零二五年度工業(yè)用地土地廠房轉(zhuǎn)讓與產(chǎn)業(yè)升級合同
- 珠海城市職業(yè)技術(shù)學(xué)院《韓國語語法》2023-2024學(xué)年第一學(xué)期期末試卷
- 二零二五年度農(nóng)產(chǎn)品供應(yīng)鏈合作協(xié)議書2篇
- 河北省石家莊市2023-2024學(xué)年高一上學(xué)期期末聯(lián)考化學(xué)試題(含答案)
- 小王子-英文原版
- 新版中國食物成分表
- 2024年山東省青島市中考生物試題(含答案)
- 河道綜合治理工程技術(shù)投標文件
- 專題24 短文填空 選詞填空 2024年中考英語真題分類匯編
- 再生障礙性貧血課件
- 產(chǎn)后抑郁癥的護理查房
- 2024年江蘇護理職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 電能質(zhì)量與安全課件
- 工程項目設(shè)計工作管理方案及設(shè)計優(yōu)化措施
評論
0/150
提交評論