時(shí)間序列分析版_第1頁
時(shí)間序列分析版_第2頁
時(shí)間序列分析版_第3頁
時(shí)間序列分析版_第4頁
時(shí)間序列分析版_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第2章時(shí)間序列的預(yù)處理拿到一個(gè)觀察值序列之后,首先要對(duì)它的平穩(wěn)性和純隨機(jī)性進(jìn)行檢驗(yàn), 這兩個(gè)重要的檢 驗(yàn)稱為序列的預(yù)處理。 根據(jù)檢驗(yàn)的結(jié)果可以將序列分為不同的類型, 對(duì)不同類型的序列我們 會(huì)采用不同的分析方法。2.1平穩(wěn)性檢驗(yàn)2.1.1特征統(tǒng)計(jì)量平穩(wěn)性是某些時(shí)間序列具有的一種統(tǒng)計(jì)特征。要描述清楚這個(gè)特征,我們必須借助如下統(tǒng)計(jì)工具。一、概率分布數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí)告訴我們分布函數(shù)或密度函數(shù)能夠完整地描述一個(gè)隨機(jī)變量的統(tǒng)計(jì)特征。同樣,一個(gè)隨機(jī)變量族的統(tǒng)計(jì)特性也完全由它們的聯(lián)合分布函數(shù)或聯(lián)合密度函數(shù)決定。對(duì)于時(shí)間序列Xt , t T ,這樣來定義它的概率分布:任取正整數(shù) m,任取t1? t2, , t

2、m T,則m維隨機(jī)向量(X Xt2, , Xtm )的聯(lián)合概率分布記為 &匕,(旨,X2, , Xm),由這些有限維分布函數(shù)構(gòu)成的全體。Ft1,t2, ,tm(Xf, X2, , Xm) , ? m 正整數(shù),? t1, t2, , tm T就稱為序列Xt的 概率分布族。概率分布族是極其重要的統(tǒng)計(jì)特征描述工具,因?yàn)樾蛄械乃薪y(tǒng)計(jì)性質(zhì)理論上都可以通過 概率分布推測(cè)出來, 但是概率分布族的重要 性也就停留在這樣的理論意義上。在實(shí)際應(yīng)用中,要得到序列的聯(lián)合概率分布幾乎是不可能的,而且聯(lián)合概率分布通常涉及非常復(fù)雜的數(shù)學(xué)運(yùn)算,這些原因使我們很少直接使用聯(lián)合概率分布進(jìn)行時(shí)間序列分析。二、特征統(tǒng)計(jì)量一個(gè)更簡單

3、、更實(shí)用的描述時(shí)間序列統(tǒng)計(jì)特征的方法是研究該序列的低階矩,特別是均值、方差、自協(xié)方差和自相關(guān)系數(shù),它們也被稱為特征統(tǒng)計(jì)量。盡管這些特征統(tǒng)計(jì)量不能描述隨機(jī)序列全部的統(tǒng)計(jì)性質(zhì),但由于它們概率意義明顯,易于計(jì)算,而且往往能代表隨機(jī)序列的主要概率特征,所以我們對(duì)時(shí)間序列進(jìn)行分析,主要就是通過分析這些統(tǒng)計(jì)量的統(tǒng)計(jì)特性,推斷出隨機(jī)序列的性質(zhì)。1均值對(duì)時(shí)間序列Xt, t T 而言,任意時(shí)刻的序列值 Xt都是一個(gè)隨機(jī)變量,都有它自己的概率分布,不妨記為 Ft(x)。只要滿足條件xdF t ( x )就一定存在著某個(gè)常數(shù)t,使得隨機(jī)變量 Xt總是圍繞在常數(shù)值t附近做隨機(jī)波動(dòng)。我們稱t為序列Xt在t時(shí)刻的均值函數(shù)

4、。t= EXt =xdFt(x)當(dāng)t取遍所有的觀察時(shí)刻時(shí),就得到一個(gè)均值函數(shù)序列 t, t T 。它反映的是時(shí)間序列Xt,t T 每時(shí)每刻的平均水平。2方差當(dāng)-xdF t (x)時(shí),可以定義時(shí)間序列的方差函數(shù)用以描述序列值圍繞其均值做隨機(jī)波動(dòng)時(shí)的平均波動(dòng)程度。t2 DXt E(Xt t)2 (x t)2dFt(x)同樣,當(dāng)t取遍所有的觀察時(shí)刻時(shí),我們得到一個(gè)方差函數(shù)序列 t2, t T。3自協(xié)方差函數(shù)和自相關(guān)系數(shù)類似于協(xié)方差函數(shù)和相關(guān)系數(shù)的定義,在時(shí)間序列分析中我們定義自協(xié)方差函數(shù)(autocovaria nee function) 和自相關(guān)系數(shù)( autocorrelati on coeff

5、icie nt )的概念。對(duì)于時(shí)間序列Xt , t T,任取t, s T,定義丫(t, s)為序列Xt的自協(xié)方差函數(shù):(t, s) E(Xt t)(Xs s)定義(t,s)為時(shí)間序列Xt的自相關(guān)系數(shù),簡記為 ACF。Word文檔資料之所以稱它們?yōu)樽詤f(xié)方差函數(shù)和自相關(guān)系數(shù),是因?yàn)橥ǔ5膮f(xié)方差函數(shù)和相關(guān)系數(shù)度量的是兩個(gè)不同事件彼此之間的相互影響程度,而自協(xié)方差函數(shù)和自相關(guān)系數(shù)度量的是同一事件在兩個(gè)不同時(shí)期之間的相關(guān)程度,形象地講就是度量自己過去的行為對(duì)自己現(xiàn)在的影響。2.1.2平穩(wěn)時(shí)間序列的定義平穩(wěn)時(shí)間序列有兩種定義,根據(jù)限制條件的嚴(yán)格程度,分為嚴(yán)平穩(wěn)時(shí)間序列和寬平穩(wěn)時(shí) 間序列。、嚴(yán)平穩(wěn)所謂嚴(yán)平穩(wěn)

6、(strictly stationary )就是一種條件比較苛刻的平穩(wěn)性定義,它認(rèn)為只有當(dāng)序列所有的統(tǒng)計(jì)性質(zhì)不會(huì)隨時(shí)間的推移而發(fā)生變化時(shí),該序列才能被認(rèn)為平穩(wěn)。而我們知道,隨機(jī)變量族的統(tǒng)計(jì)性質(zhì)完全由它們的聯(lián)合概率分布族決定。所以嚴(yán)平穩(wěn)時(shí)間序列的定義如 下:定義2.1設(shè)Xt為一時(shí)間序列,對(duì)任意正整數(shù)m,任取t, t2, , tm T,對(duì)任意整數(shù),有Ftl ,t2 ,t2,tm則稱時(shí)間序列Xt為嚴(yán)平穩(wěn)時(shí)間序列。前面說過,在實(shí)踐中要獲得隨機(jī)序列的聯(lián)合分布是一件非常困難的事,而且即使知道隨機(jī)序列的聯(lián)合分布,計(jì)算和應(yīng)用也非常不便。所以嚴(yán)平穩(wěn)時(shí)間序列通常只具有理論意義,在實(shí)踐中用得更多的是條件比較寬松的寬

7、平穩(wěn)時(shí)間序列。二、寬平穩(wěn)寬平穩(wěn)(weak stationary )是使用序列的特征統(tǒng)計(jì)量來定義的一種平穩(wěn)性。它認(rèn)為序列 的統(tǒng)計(jì)性質(zhì)主要由它的低階矩決定,所以只要保證效率低階矩平穩(wěn)(二階),就能保證序列的主要性質(zhì)近似穩(wěn)定。定義2.2如果Xt滿足如下三個(gè)條件:2(1) 任取 t T,有 EXt(2) 任取t T ,有EXt ,為常數(shù);(3) 任取 t, s, k T,且 k+s-t T,有丫(t,s)= *k,k+s-t)則稱Xt為寬平穩(wěn)時(shí)間序列。 寬平穩(wěn)也稱為弱平穩(wěn)或二階平穩(wěn)(second-order stationary )。顯然,嚴(yán)平穩(wěn)比寬平穩(wěn)的條件嚴(yán)格。嚴(yán)平穩(wěn)是對(duì)序列聯(lián)合分布的要求, 以保

8、證序列所有 的統(tǒng)計(jì)特征都相同;而寬平穩(wěn)只要求序列二階平穩(wěn), 對(duì)于高于二階的矩沒有任何要求。 所以 通常情況下,嚴(yán)平穩(wěn)序列也滿足寬平穩(wěn)條件,而寬平穩(wěn)序列不能反推嚴(yán)平穩(wěn)成立。但這不是絕對(duì)的,兩種情況都有特例。比如服從柯西分布的嚴(yán)平穩(wěn)序列就不是寬平穩(wěn)序列,因?yàn)樗淮嬖谝?、二階矩,所以無法驗(yàn)證它二階平穩(wěn)。嚴(yán)格地講,只要存在二階矩的嚴(yán)平穩(wěn)序列才能保證它一定也是寬平穩(wěn)序 列。寬平穩(wěn)一般推不出嚴(yán)平穩(wěn),但當(dāng)序列服從多元正態(tài)分布時(shí),則二階平穩(wěn)可以推出嚴(yán)平穩(wěn)。定義2.3時(shí)間序列Xt稱為正態(tài)時(shí)間序列,如果任取正整數(shù)n,任取右,t2, , tn T ,相對(duì)應(yīng)的有限維隨機(jī)變量X1, X2,,Xn服從n維正態(tài)分布,密度函

9、數(shù)為:ft1,t2,.,tn(Xn)(2 )2 | n | 2 exp1 (Xn n)21 n1(Xnn)其中,文n ( X11, X2,Xn) ;n(EX1,EX 2,EX.); n為協(xié)方差陣(t1,t1)(t1, t1 ).(t1,tn)n(t2 t1 )(t2,t1) -(t2,tn)(tn,tj(tn,t1)(tn,tn)從正態(tài)隨機(jī)序列的密度函數(shù)可以看出,它的n維分布僅由均值向量和協(xié)方差陣決定,即對(duì)正 態(tài)隨機(jī)序列而言,只要二階矩平穩(wěn)了, 就等于分布 平穩(wěn)了,所以寬平穩(wěn)的正態(tài)序列一 定是嚴(yán)平穩(wěn)時(shí)間序列。對(duì)于非正態(tài)過程,就沒有這個(gè)性質(zhì)了在實(shí)際應(yīng)用中,研究最多的是寬平穩(wěn)隨機(jī)序列,以后見到平穩(wěn)

10、隨機(jī)序列, 如果不加特別注明,指的都是寬平穩(wěn)隨機(jī)序列。如果序列不滿足平穩(wěn)條件,就稱為非平穩(wěn)序列。2.1.3 平穩(wěn)時(shí)間序列的統(tǒng)計(jì)性質(zhì)根據(jù)平穩(wěn)時(shí)間序列的定義,可以推斷出它一定具有如下兩個(gè)重要的統(tǒng)計(jì)性質(zhì)。一、常數(shù)均值EXt , t T二、自協(xié)方差函數(shù)和自相關(guān)系數(shù)只依賴于時(shí)間的平移長度而與時(shí)間的起止點(diǎn)無關(guān)(t,s)(k, k s t), t,s, k T根據(jù)這個(gè)性質(zhì),可以將自協(xié)方差函數(shù)由二維函數(shù)(t,s)簡化為一維函數(shù) (S t):(S t) (t,s), t,s T由此引出延遲k自協(xié)方差函數(shù)的概念。定義2.4 對(duì)于平穩(wěn)時(shí)間序列Xt , t T ,任取t(t+k T ),定義丫(k)為時(shí)間序列XJ的延

11、遲k自協(xié)方差函數(shù):(k) (t,t k)根據(jù)平穩(wěn)序列的這個(gè)性質(zhì),容易推斷出平穩(wěn)隨機(jī)序列一定具有常數(shù)方差:DXt (t,t)(0), t T由延遲k自協(xié)方差函數(shù)的概念可以等價(jià)得到延遲k自相關(guān)系數(shù)的概念:(t,t k) (k)DXt?DXt k (0)容易驗(yàn)證和相關(guān)系數(shù)一樣,自相關(guān)系數(shù)具有如下三個(gè)性質(zhì):(1) 規(guī)性01 且 k 1 k(2) 對(duì)稱性kk(3) 非負(fù)定性對(duì)任意正整數(shù)m,相關(guān)陣m為對(duì)稱非負(fù)定陣。01m 110m 2mm 1 m 20值得注意的是,k除了具有上述三個(gè)性質(zhì)外,還具有一個(gè)特別的性質(zhì): 對(duì)應(yīng)模型的非唯一性。一個(gè)平穩(wěn)時(shí)間序列一定唯一決定了它的自相關(guān)函數(shù),但它的自相關(guān)函數(shù)未必唯一對(duì)

12、應(yīng)著一個(gè)平穩(wěn)的時(shí)間序列。 我們?cè)诤竺娴恼鹿?jié)中將證明這一點(diǎn)。這個(gè)性質(zhì)就給我們根據(jù)樣本的自相關(guān)系數(shù)的特點(diǎn)來確定模型增加了一定的難度。2.1.4 平穩(wěn)時(shí)間序列的意義時(shí)間序列分析方法作為數(shù)理統(tǒng)計(jì)學(xué)的一個(gè)分支,遵循數(shù)理統(tǒng)計(jì)學(xué)的基本原理,都是利用樣本信息來推測(cè)總體信息。傳統(tǒng)的統(tǒng)計(jì)分析通常都擁有如下數(shù)據(jù)結(jié)構(gòu),見表2-1。根據(jù)數(shù)理統(tǒng)計(jì)學(xué)常識(shí),顯然要分析的隨機(jī)變量越少越好( m越小越好),而每個(gè)變量 獲得的樣本信息越多越好(n越大越好)。因?yàn)殡S機(jī)變量越少,分析的過程越簡單,而樣本容量越大,分析的結(jié)果就會(huì)越可靠。但是時(shí)間序列分析的數(shù)據(jù)結(jié)構(gòu)有它的特殊性。對(duì)隨機(jī)序列.,Xp X2,,Xt,.而言,它在任意時(shí)刻t的序列

13、值Xt都是一個(gè)隨機(jī)變量,而且由于時(shí)間的不可重復(fù)性,該變量在任意一個(gè)時(shí)刻只能獲得唯一的樣本觀察值。因?yàn)闀r(shí)間序列分析的數(shù)據(jù)結(jié)構(gòu)如下,見表2-2。由于樣本信息太少,如果沒有其他的輔助信息,通常這種數(shù)據(jù)結(jié)構(gòu)是沒有辦法進(jìn)行分析的。而序列平穩(wěn)性概念的提出可以有效地解決這個(gè)問題。在平穩(wěn)序列場(chǎng)合,序列的均值等于常數(shù)意味著原本含有可列多個(gè)隨機(jī)變量的均值數(shù)列t,t T變成了一個(gè)常數(shù)序列,t T原本每個(gè)隨機(jī)變量的均值t(t T)只能依靠唯一的一個(gè)樣本觀察值xt去估計(jì)?t Xt樣本觀察值現(xiàn)在由于(t T),于是每一個(gè)樣本觀察值 人(t T),都變成了常數(shù)均值的Xii 1n這極大地減少了隨機(jī)變量的個(gè)數(shù),并增加了待估參數(shù)

14、的樣本容量。換句話說,這大大降 低了時(shí)序分析的難度,同時(shí)也提高了對(duì)均值函數(shù)的估計(jì)精度。同理,根據(jù)平穩(wěn)序列二階矩平穩(wěn)的性質(zhì),可以得到基于全體觀察樣本計(jì)算出來的延遲k自協(xié)方差函數(shù)的估計(jì)值n k(Xt X)(Xt k X)?(k) 口,0 k nn k并進(jìn)一步推導(dǎo)出總體方差的估計(jì)值n(XtX)和延遲k自相關(guān)系數(shù)的估計(jì)值?(k)?(0)當(dāng)延遲階數(shù)k遠(yuǎn)遠(yuǎn)小于樣本容量 n時(shí),X) ,0n k(Xt X)(Xt kt 1n(Xt X)2t 12.1.5平穩(wěn)性的檢驗(yàn)對(duì)序列的平穩(wěn)性有兩種檢驗(yàn)方法,一種是根據(jù)時(shí)序圖和自相關(guān)圖顯示的特征做出判斷的 圖檢驗(yàn)方法;一種是構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn)的方法。圖檢驗(yàn)方法是一種

15、操作簡便、運(yùn)用廣泛的平穩(wěn)性判別方法,它的缺點(diǎn)是判別結(jié)論帶有很 強(qiáng)的主觀色彩。所以最好能用統(tǒng)計(jì)檢驗(yàn)方法加以輔助判斷。目前最常用的平穩(wěn)性統(tǒng)計(jì)檢驗(yàn)方法是單位根檢驗(yàn)(unit root test )。由于目前知識(shí)的局限性,本章將主要介紹平穩(wěn)性的圖檢 驗(yàn)方法,單位根檢驗(yàn)將在第 6章詳細(xì)介紹。一、時(shí)序圖檢驗(yàn)所謂時(shí)序圖就是一個(gè)平面二維坐標(biāo)圖,通常橫軸表示時(shí)間,縱軸表示序列取值。時(shí)序圖可以直觀地幫助我們掌握時(shí)間序列的一些基本分布特征。根據(jù)平穩(wěn)時(shí)間序列均值、方差為常數(shù)的性質(zhì),平穩(wěn)序列的時(shí)序圖應(yīng)該顯示出該序列始終 在一個(gè)常數(shù)值附近隨機(jī)波動(dòng),而且波動(dòng)的圍有界的特點(diǎn)。如果觀察序列的時(shí)序圖,顯示出該序列有明顯的趨勢(shì)性或

16、周期性,那它通常不是平穩(wěn)序列。根據(jù)這個(gè)性質(zhì),對(duì)于很多非平穩(wěn)序列,可以通過查看它的時(shí)序圖將其識(shí)別出來。例2-1繪制1964-1999年中國紗年產(chǎn)量序列時(shí)序圖(數(shù)據(jù)見表A1-4 )。時(shí)序圖如圖2-1所示。1SG0 19G5 1970 1975 19B0 I9S5 1990 1995 2000/ear圖2-1 中國紗年產(chǎn)量時(shí)序圖時(shí)序圖給我們提供的信息非常明確,中國紗年產(chǎn)量序列有明顯的遞增趨勢(shì), 所以它不一定不是平穩(wěn)序列。例2-2繪制1962年1月至1975年12月平均每頭奶牛月產(chǎn)奶量序列時(shí)序圖(數(shù)據(jù)見表A1-5)時(shí)序圖如圖2-2所示。JBN62 JNS4 J令N66 JNBS JAN70 JAN72

17、 JAN74 JAN76time圖2-2 平均每頭奶牛月產(chǎn)奶量序列時(shí)序圖時(shí)序圖清晰地顯示平均每頭奶牛的月產(chǎn)奶量以年為周期呈現(xiàn)出規(guī)則的周期性,除此之 外,還有明顯的逐年遞增的趨勢(shì)。顯然該序列也不一定不是平穩(wěn)序列。例2-3繪制1949-1998年北京市每年最高氣溫序列時(shí)序圖(數(shù)據(jù)見表 A1-6)時(shí)序圖如圖2-3所示。hign41403938373635343319491959 ISB9 197919891999t i me圖2-3 北京市每年的最高氣溫時(shí)序圖時(shí)序圖顯示北京市每年的最高氣溫始終圍繞在37 C附近隨機(jī)波動(dòng),沒有明顯趨勢(shì)或周期,基本可以視為平穩(wěn)序列。 為了穩(wěn)妥起見,我們還需要利用自相關(guān)圖

18、進(jìn)一步輔助識(shí)別。二、自相關(guān)圖檢驗(yàn)自相關(guān)圖是一個(gè)平面二維坐標(biāo)懸垂線圖,一個(gè)坐標(biāo)軸表示延遲時(shí)期數(shù), 另一個(gè)坐標(biāo)軸表示自相關(guān)系數(shù),通常以懸垂線表示自相關(guān)系數(shù)的大小。在后面的章節(jié)里我們會(huì)證明平穩(wěn)序列通常具有短期相關(guān)性。該性質(zhì)用自相關(guān)系數(shù)來描述就是隨著延遲期數(shù) k的增加,平穩(wěn)序列的自相關(guān)系數(shù) ?k會(huì)很快地衰減向零。反之,非平穩(wěn)序列的自相關(guān)系數(shù) ?k衰減向零的速度通常比較慢,這就是我們利用自相關(guān)圖進(jìn)行平穩(wěn)性判 斷的標(biāo)準(zhǔn)。例2-1續(xù)繪制1964-1999年中國紗年產(chǎn)量序列自相關(guān)圖。自相關(guān)圖如圖2-4所示。Autocorrelat ionsCovar ianee-19876543210123456789102

19、1741.1031.00000119069.6700.9139221093G.M50.94942316679.6440.76719415119.8270.G9545513234.7GS0.60874G11822.3G50.5437B710355.4250.47G31e0597 J 710.3954396977.2270.32092105262.5390.M206113105.45000650.0570213-717.129-.0329814-2356.?S2-.10844153657,864.1S82516-4675.021-.2150317-5645.938-.25

20、969IS-6662.959-.30647197523.279-.3160420-8300.85E.3818021906S.912-.4171322-9409.375-.43273Correlation11出世些出蟲 I f *(* I* Imarks two南南鼎常鳥常*黑!It*常黑*常溝辣幕購* 1(嶽 i|c * Jn P( *!lift申喘專帚席觸希黑* *濡 s|! * JC 1(3 1(富常常*常*常常盅常*席*常;岀常常*常制常*常*盅*機(jī)?(5津*常* a* *料standard errors圖2-4中國紗年產(chǎn)量序列自相關(guān)圖該圖橫軸表示自相關(guān)系數(shù),縱軸表示延遲時(shí)期數(shù),用水平方

21、向的垂線表示自相關(guān)系數(shù)的大小。從圖中我們發(fā)現(xiàn)序列的自相關(guān)系數(shù)遞減到零的速度相當(dāng)緩慢,在很長的延遲時(shí)期里,自相關(guān)系數(shù)一直為正,而后,又一直為負(fù),在自相關(guān)圖上顯示出明顯的三角對(duì)稱性,這是具 有單調(diào)趨勢(shì)的非平穩(wěn)序列的一種典型的自相關(guān)圖形式。這和該序列時(shí)序圖(圖2-1 )顯示的顯著的單調(diào)遞增性是一致的。例2-2續(xù)繪制1962年1月至1975年12月平均每頭奶牛的月產(chǎn)奶量序列自相關(guān)圖。 自相關(guān)圖如圖2-5所示。Autocorrelat ionsLagCovar ianceCorre1 at i on-1997G5432101?345G891010383.580kOOOOO| |iK|屮|ipi 1 ip

22、 ii rfl Fp jPrplirfV殲1 審1 中屮 |13257.7340,8915711學(xué)*事*章*乍珈童聿車當(dāng)尢*1|1|Jh|hHa|1 TnnflnSnlfli28080.2BSO.?7I8|-3W0.6430.5202T-岸來*礙岸145053.3140.48666-出區(qū)出屮業(yè)臺(tái)蟲程址屮154445了130.423151*(* 163904.8900.36061-*蟲!電蟲出典Sit1rp rji rji rprrfi TH H1 m|7430G.S27Q.4W771*f*184716.?610.454251i蛍ilj渥蟲* 魚典* 195833.6550.S61BI1*t*4

23、t110712C.9480.68S5&1-業(yè)* 業(yè)很yk也曲出山電出也世e nn e ”eC| * *車案率宰*率!f:帛韋*1|(TI ITTl 1 Ipitju|1 17900.3330.7G35S12C773.2340.84491-137735.6390.744991迂it就比近st1|*lTrriaITIJTl1FTlTl*TwTl 丁 T*PTTT*114G621.269Q.昭刑了Ilfaii |P rfi R rfi tfl 茅 fr pffii ini155084.6210.489681*. 1163775.0040.963551:*)*|i*)H.;1?317C.B490.30

24、5951* . |182646.8590.254911sk業(yè)魚比出1ifj ! T If T1_|192984.4580.287421事*事.1203328.659Q昭05孑11214324,9200.4165Z!f *.|225489.9830.52971岸艸和*艸種神|236265.0320.GO33GI2AC9SC.0880.6230-marks tvo standard err口廠呂圖2-5 平均每頭奶牛的月產(chǎn)奶量序列自相關(guān)圖自相關(guān)圖顯示序列自相關(guān)系數(shù)長期位于零軸的一邊,這是具有單調(diào)趨勢(shì)序列的典型特 征,同時(shí)自相關(guān)圖呈現(xiàn)出明顯的正弦波動(dòng)規(guī)律,這是具有周期變化規(guī)律的非平穩(wěn)序列的典型特征。

25、自相關(guān)圖顯示出來的這兩個(gè)性質(zhì)和該序列時(shí)序圖(圖2-2 )顯示出的帶長期遞增趨勢(shì)的周期性質(zhì)是非常吻合的。例2-3續(xù)(1)繪制1949-1998年北京市每年最高氣溫序列自相關(guān)圖。自相關(guān)圖如圖2-6所示。Autocarre 1 at- i onsLag匚ovar ianceCorre1a tion -19 87SS48210I23 4 5 6 7 8 51 102,5E9604i! | | C小 命郵甲邛*予,骨怦骨屮樣屮Mp平平|1-0,449960-.17511!1120.00910/8-.00354! 1i134.4632040 J802G!1出堂出出1 1144.0S9232!11115-0

26、.421420-.16400!常胖11160.253B12O.OHSEt |1胖117-,0G7559-.02629;*1118-0.0089274-.0032411 1119-0.057247-.02228 !1- 11104,1409170.05795!1*1111C.0954610.03715i*1112-O.M7799-.10422!11130.2C09690.1015E!M常11140,0110690,m31!111115-A.OG9249-02G95!1111.11 markstuostandard errors自相關(guān)圖顯示該序列的自相關(guān)系數(shù)一直都比較小,始終控制在2倍的標(biāo)準(zhǔn)差圍以

27、,可以認(rèn)為該序列自始至終都在零軸附近波動(dòng),這是隨機(jī)性非常強(qiáng)的平穩(wěn)時(shí)間序列通常具有的自相關(guān)圖特征。22 純隨機(jī)性檢驗(yàn)?zāi)玫揭粋€(gè)觀察值序列之后,首先是判斷它的平穩(wěn)性。 通過平穩(wěn)性檢驗(yàn), 序列可以分為平穩(wěn)序列和非平穩(wěn)序列兩大類。對(duì)于非平穩(wěn)序列,由于它不具有二階矩平穩(wěn)的性質(zhì),所以對(duì)它的統(tǒng)計(jì)分析要周折一些, 通常要進(jìn)行進(jìn)一步的檢驗(yàn)、變換或處理之后,才能確定適當(dāng)?shù)臄M合模型。如果序列平穩(wěn),情況就簡單多了,我們有一套非常成熟的平穩(wěn)序列建模方法。但是,并 不是所有的平穩(wěn)序列都值得建模。只有那些序列值之間具有密切的相關(guān)關(guān)系,歷史數(shù)據(jù)對(duì)未來的發(fā)展有一定影響的序列, 菜值得我們花時(shí)間去挖掘歷史數(shù)據(jù)中的有效信息,用來預(yù)測(cè)

28、序列未來的發(fā)展。如果序列值彼此之間沒有任何相關(guān)性, 那就意味著該序列是一個(gè)沒有記憶的序列, 過去 的行為對(duì)將來的發(fā)展沒有絲毫影響, 這種序列稱為純隨機(jī)序列。 從統(tǒng)計(jì)分析的角度而言, 純 隨機(jī)序列是沒有任何分析價(jià)值的序列。為了確定平穩(wěn)序列還值不值得繼續(xù)分析下去,我們需要對(duì)平穩(wěn)序列進(jìn)行純隨機(jī)性檢驗(yàn)。2.2.1 純隨機(jī)序列的定義定義2.5如果時(shí)間序列Xt滿足如下性質(zhì):(1)任取 t T,有 EXt(2)任取t, s T,有(t, s)0, t s2,t2 稱序列Xt為純隨機(jī)序列,也稱為白噪聲(white noise )序列,簡記為 Xt WN(,)。之所以稱之為白噪聲序列,是因?yàn)槿藗冏畛醢l(fā)現(xiàn)白光具有

29、這種特性。容易證明白噪聲序列一定是平穩(wěn)序列,而且是最簡單的平穩(wěn)序列。例2-4隨機(jī)產(chǎn)生1000個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的白噪聲序列觀察值,并繪制時(shí)序圖。 時(shí)序圖如圖2-7所示。no ise 3 二Y T T r T r t t t . r .r t . . t t r t . . t t r t r t t r t t r t r t r t1 . r 1 .| i i i i i i i ii | ii iii ii ii i i I ii h h ii i i i I i i i i i iii i i J i i i iIi ii ir|02004006008001000t i me圖2-7 標(biāo)

30、準(zhǔn)正態(tài)白噪聲序列時(shí)序圖2.2.2白噪聲序列的性質(zhì)白噪聲序列雖然很簡單,但它在我們進(jìn)行時(shí)間序列分析時(shí)所起的作用卻非常大。它的兩個(gè)重要性質(zhì)在后面的分析過程中要經(jīng)常用到。一、純隨機(jī)性由于白噪聲序列具有如下性質(zhì):(k)0, k 0這說明白噪聲序列的各項(xiàng)之間沒有任何相關(guān)關(guān)系,這種“沒有記憶”的序列就是純隨機(jī)序列。純隨機(jī)序列各項(xiàng)之間沒有任何關(guān)聯(lián), 序列在進(jìn)行完全無序的隨機(jī)波動(dòng)。 一旦某個(gè)隨機(jī)事 件呈現(xiàn)出純隨機(jī)波動(dòng)的特征,就認(rèn)為該隨機(jī)事件沒有包含任何值得提取的有用信息,我們就應(yīng)該終止分析了。如果序列值之間呈現(xiàn)出某種顯著的相關(guān)關(guān)系:(k)0, k 0就說明該序列不是純隨機(jī)序列,該序列間隔k期的序列值之間存在著

31、一定程度的相互影響關(guān) 系,這種相互影響關(guān)系, 統(tǒng)計(jì)上稱為相關(guān)信息。 我 們分析的目的就是要想方設(shè)法把這種相 關(guān)信息從觀察值序列中提取出來。一旦觀察值序列中蘊(yùn)含的相關(guān)信息被我們充分提取出來了,那么 剩下的殘差序列就應(yīng)該呈現(xiàn)出純隨機(jī)的性質(zhì)。所以純隨機(jī)性還是我們判斷相關(guān)信息是否提取充分的一個(gè)判別標(biāo)準(zhǔn)。二、方差齊性所謂方差齊性,就是指序列中每個(gè)變量的方差都相等,即DXt (0)2如果序列不滿足方差齊性,就稱該序列具有異方差性質(zhì)。在時(shí)間序列分析中,方差齊性是一個(gè)非常重要的限制條件。因?yàn)楦鶕?jù)馬爾可夫定理,只有方差齊 性假定成立時(shí),用最小二乘法得到的未知參數(shù)估計(jì)值才是準(zhǔn)確的、有效的。如果假定不成立,最 小二

32、乘估計(jì)值就不是方差最小線性無偏估計(jì),擬合模型的預(yù)測(cè)精度會(huì)受到 很大影響。所以我們?cè)谶M(jìn)行模型擬合時(shí),檢驗(yàn)容之一就是要檢驗(yàn)擬合模型的殘差是否滿足方差齊性假定。如果不滿足,那就說明殘差序列還不是白噪聲序列,即擬合模型沒有充分提取隨機(jī)序列中的相關(guān)信 息,這時(shí)擬合模型的精度是值得懷疑的。在這種場(chǎng)合下,我們通常需要使用適當(dāng)?shù)臈l件異方差模型來處理異方差信息。2.2.3 純隨機(jī)性檢驗(yàn)純隨機(jī)性檢驗(yàn)也稱為白噪聲檢驗(yàn),是專門用來檢驗(yàn)序列是否為純隨機(jī)序列的一種方法。我們知道如果一個(gè)序列是純隨機(jī)序列,那它的序列值之間應(yīng)該沒有任何相關(guān)關(guān)系,即滿足(k)0, k 0這是一種理論上才會(huì)出現(xiàn)的理想狀態(tài)。實(shí)際上,由于觀測(cè)值序列的

33、有限性,導(dǎo)致純隨機(jī)序列的樣本自相關(guān)系數(shù)不會(huì)絕對(duì)為零。例2-4續(xù)(1)繪制例2-4標(biāo)準(zhǔn)正態(tài)白噪聲序列的樣本自相關(guān)圖。自相關(guān)圖如圖2-8所示。Cou-ar ianceCorrelat ion-1937654JIZ10123 4 5 G 7 0 9 11 腫 QQQ11-0.0016647-.00106111i-0.03S747-.365511*iI-0.0062567-.4QE22!o.oiisae0.41107!-0.025139-.02500!*-0.0I442S-.CM3SI1IiO.OOSS565OOBQI11Ii-0.010179-.91012i IIi-.926741I*!-ii-O.

34、OE4Q82-.24751IIi-0.014021-.013941IIi0.0355270.0353311*l iAutocorre lat i or)marks t口 standard errors圖2-8 白噪聲序列樣本自相關(guān)圖樣本自相關(guān)圖顯示這個(gè)純隨機(jī)序列沒有一個(gè)樣本自相關(guān)系數(shù)嚴(yán)格等于零。 但這些自相關(guān) 系數(shù)確實(shí)都非常小,都在零值附近以一個(gè)很小的幅度做著隨機(jī)波動(dòng)。 這就提醒我們應(yīng)該考 慮樣本自相關(guān)系數(shù)的分布性質(zhì),從統(tǒng)計(jì)意義上來判斷序列的純隨機(jī)性質(zhì)。Barlett證明,如果一個(gè)時(shí)間序列是純隨機(jī)的,得到一個(gè)觀察期數(shù)為n的觀察序列人,t 1,2,,n ,那么該序列的延遲非零期的樣本自相關(guān)系數(shù)將

35、近似服從均值為零,方差為序列觀察期數(shù)倒數(shù)的正態(tài)分布,即1?kN(O,), k 0n式中,n為序列觀察期數(shù)。根據(jù)Barlett定理,我們可以構(gòu)造檢驗(yàn)統(tǒng)計(jì)量來檢驗(yàn)序列的純隨機(jī)性。一、假設(shè)條件由于序列值之間的變異性是絕對(duì)的,而相關(guān)性是偶然的,所以假設(shè)條件如下確定。原假設(shè):延遲期數(shù)小于或等于期的序列值之間相互獨(dú)立。備擇假設(shè):延遲期數(shù)小于或等于期的序列值之間有相關(guān)性。該假設(shè)條件用數(shù)學(xué)語言描述即為:H 0 :12.m0,m1Hi :至少存在某個(gè)k0,m1,km二、檢驗(yàn)統(tǒng)計(jì)量1.Q統(tǒng)計(jì)量為了檢驗(yàn)這個(gè)聯(lián)合假設(shè),Box和Pierce推導(dǎo)出了 Q統(tǒng)計(jì)量:mQ n?k2k 1式中,n為序列觀察期數(shù);m為指定延遲期數(shù)

36、。根據(jù)正態(tài)分布和卡方分布之間的關(guān)系,我們很容易推導(dǎo)出Q統(tǒng)計(jì)量近似服從自由度為m的卡方分布:mQ n 2(m)k 12當(dāng)Q統(tǒng)計(jì)量大于 1- (m)分位點(diǎn),或該統(tǒng)計(jì)量的P值小于時(shí),則可以以1-的置信水平拒絕原假設(shè),認(rèn)為序列為白噪聲序列;否則,接受原假設(shè),認(rèn)為該序列為純隨機(jī)序列。2丄B統(tǒng)計(jì)量在實(shí)際應(yīng)用中人們發(fā)現(xiàn) Q統(tǒng)計(jì)量在大樣本場(chǎng)合(n很大的場(chǎng)合)檢驗(yàn)效果很好,但在 小樣本場(chǎng)合就不太精確。為了彌補(bǔ)這一缺陷,Box和Ljung又推導(dǎo)出LB( Ljung-Box )統(tǒng)計(jì)量:m?2LB n(n 2)k 1 n k式中,n為序列觀測(cè)期數(shù);m為指定延遲期數(shù)。Box和Ljung證明LB統(tǒng)計(jì)量同樣近似服從自由度為

37、m的卡方分布。實(shí)際上LB統(tǒng)計(jì)量就是Box和Pierce的Q統(tǒng)計(jì)量的修正,所以人們習(xí)慣把它們統(tǒng)稱為Q統(tǒng)計(jì)量,分別記作Qbp統(tǒng)計(jì)量和Qlb統(tǒng)計(jì)量,在各種檢驗(yàn)場(chǎng)合普遍采用的Q統(tǒng)計(jì)量通常指的都是LB統(tǒng)計(jì)量。例2-4續(xù)(2)計(jì)算例2-4中白噪聲序列延遲 6期、延遲12期的Qlb統(tǒng)計(jì)量的值,并判斷該序列的隨機(jī)性(0.05 )。由圖2-8微米可以得到該序列延遲12期樣本自相關(guān)系數(shù),數(shù)據(jù)如下,見表2-3.表2-3延遲期數(shù)k123456?k-0.001-0.-0.0060.012-0.025-0.014延遲期數(shù)k789101112?k0.009-0.-0.027-0.025-0.0140.根據(jù)上述數(shù)據(jù),很容易計(jì)

38、算出表2-4的結(jié)果。表2-4延遲q lb統(tǒng)計(jì)量檢驗(yàn)Qlb統(tǒng)計(jì)量值P值延遲6期2.360.8838延遲12期5.350.9454由于P值顯著大于顯著性水平 ,所以該序列不能拒絕純隨機(jī)的原假設(shè)。換言之,我們 可以認(rèn)為該序列的波動(dòng)沒有任何統(tǒng)計(jì)規(guī)律可循,因而可以停止對(duì)該序列的統(tǒng)計(jì)分析。還需要解釋的一點(diǎn)是,為什么在本例中只檢驗(yàn)了前6期和前12期延遲的Q統(tǒng)計(jì)量和LB統(tǒng)計(jì)量就直接判斷該序列是白噪聲序列呢?為什么不進(jìn)行全部999期延遲呢?這是因?yàn)槠椒€(wěn)序列通常具有短期相關(guān)性,如果序列值之間存在顯著的相關(guān)關(guān)系,通常只存在于延遲時(shí)期比較短的序檢驗(yàn)結(jié)果列值之間。所以,如果一個(gè)平穩(wěn)序列短期延遲的序列值之間都不存在顯著的

39、相關(guān)關(guān)系,通常長期延遲之間就更不會(huì)存在顯著的相關(guān)關(guān)系。另一方面,假如一個(gè)平穩(wěn)序列顯示出顯著的短期相關(guān)性,那么該序列就一定不是白噪聲序列,我們就可以對(duì)序列值之間存在的相關(guān)性進(jìn)行分析。假如此時(shí)考慮的延遲期數(shù)太長, 反而可能淹沒了該序列的短期相關(guān)性。因?yàn)槠椒€(wěn)序列只要延遲期足夠長,自相關(guān)系數(shù)都會(huì) 收斂于零。例2-3續(xù)(2)對(duì)1949-1998年北京市最高氣溫序列做白噪聲檢驗(yàn)(0.05)。檢驗(yàn)結(jié)果見表2-5。表2-5延遲LB統(tǒng)計(jì)量檢驗(yàn)LB統(tǒng)計(jì)量值P值延遲6期5.580.4713延遲12期6.710.8760根據(jù)這個(gè)檢驗(yàn)結(jié)果,不能拒絕序列純隨機(jī)的原假設(shè)。因而可以認(rèn)為北京市最高氣溫的變動(dòng)屬于純隨機(jī)波動(dòng)。這說

40、明我們很難根據(jù)歷史信息預(yù)測(cè)未來年份的最高氣溫。至此,對(duì)該序列的分析也就結(jié)束了。例2-5對(duì)1950-1998年北京市城鄉(xiāng)居民定期儲(chǔ)蓄所占比例序列的平穩(wěn)性與純隨機(jī)性進(jìn)行檢驗(yàn) (數(shù)據(jù)見表A1-7 )。(1)繪制該序列時(shí)序圖。時(shí)序圖如圖2-9所示。圖2-9 北京市城鄉(xiāng)居民定期儲(chǔ)蓄所占比例序列時(shí)序圖該時(shí)序圖顯示北京市城鄉(xiāng)居民定期儲(chǔ)蓄始終占儲(chǔ)蓄存款余額的80%左右,波動(dòng)比較平穩(wěn)。(2)自相關(guān)圖檢驗(yàn)。考察該序列的樣本自相關(guān)圖,進(jìn)一步檢驗(yàn)該序列的平穩(wěn)性。自相關(guān)圖如圖2-10所示。樣本自相關(guān)圖顯示延遲3階之后,自相關(guān)系數(shù)都落入2倍標(biāo)準(zhǔn)差圍之,而且自相關(guān)系數(shù)向零衰減的速度非???,延遲8階之后自相關(guān)系數(shù)即在零值附近

41、波動(dòng)。這是一個(gè)非常典型的短期相關(guān)的樣本自相關(guān)圖。由時(shí)序圖的樣本自相關(guān)圖的性質(zhì),可以認(rèn)為該序列平穩(wěn)。(3)純隨機(jī)性檢驗(yàn)(0.05)。檢驗(yàn)結(jié)果見表 2-6.AutocorrelationsLagCb varianceCorrelat ion-1397G4321012345G?091030.7255231.00000jl th|Jp 屮蟲 d|d|H |fli 甲i iTp11 審i rp 齊i|i tffVipJfl ifi R申i |18L5894110.70246* MM* *1210.2935579.59539-賢 玄豎*柴X w *,星*1TTTTTTT TTTit|914.6843430

42、.47792*!k*lM *;斗10.0001930.32007* . 110.8317170.35579艸*岸艸1G9.3102400.303271 1-*蚩出械史*1T T T Tj|78.9449750.29113陽*嘯常黑陽84.9275410.1603?*艸19I.C42I140.05395*10-1.151434-.03747. 111-2,363343(07711, *1 112-1.130247.03679*1- 1)1 S3nidrks two stnddrd errors圖2-10北京市城鄉(xiāng)居民定期儲(chǔ)蓄所占比例序列自相關(guān)圖表2-6延遲期數(shù)LB統(tǒng)計(jì)量檢驗(yàn)LB檢驗(yàn)統(tǒng)計(jì)量的值P值

43、675.460.00011282.570.0001檢驗(yàn)結(jié)果顯示,在各階延遲下LB統(tǒng)計(jì)量的P值都非常小(99.999%)斷定北京市城鄉(xiāng)居民定期儲(chǔ)蓄所占比例序列屬于非白噪 聲序列。結(jié)合前面的平穩(wěn)性檢驗(yàn)結(jié)果,說明該序列不僅可以視為是平穩(wěn)的, 而且還蘊(yùn)含著值得提 取的信息。這種平穩(wěn)非白噪聲序列是目前最容易分析的一種心理,下一章我們就要詳細(xì)介紹對(duì)這種平穩(wěn)非白噪聲序列的建模及預(yù)測(cè)方法。2.3 習(xí)題1考慮序列1 , 2, 3, 4, 5,20:(1) 判斷該序列是否平穩(wěn);計(jì)算該序列的樣本自相關(guān)系數(shù)?k (k=1,2,6);(3)繪制該樣本自相關(guān)圖,并解釋該圖形。2.1975-1980年夏威夷島莫那羅亞火山(

44、 Mauna Loa)每月釋放的CO2數(shù)據(jù)如下(單位:ppm )見表2-7(行數(shù)據(jù))。表2-7330.45330.97331.64332.87333.61333.55331.90330.05328.58328.31329.41330.63331.63332.46333.36334.45334.82334.32333.05330.87329.24328.87330.18331.50332.81333.23334.55335.82336.44335.99334.65332.41331.32330.73332.05333.53334.66335.07336.33337.39337.65337.573

45、36.25334.39332.44332.25333.59334.76335.89336.44337.63338.54339.06338.95337.41335.71333.68333.69335.05336.53337.81338.16339.88340.57341.19340.87339.25337.19335.49336.63337.74338.36(1) 繪制該序列時(shí)序圖,并判斷該序列是否平穩(wěn)。(2) 計(jì)算該序列的樣本自相關(guān)系數(shù)?k (k=1,2,24)。(3) 繪制該樣本自相關(guān)圖,并解釋該圖形。3.1945-1950年費(fèi)城月度降雨量數(shù)據(jù)如下(單位: mm),見表2-8 (行數(shù)據(jù))表2

46、-869.380.040.974.984.6101.1225.095.3100.648.3144.5128.338.452.368.637.1148.6218.7131.6112.881.831.047.570.196.861.555.6171.7220.5119.463.2181.673.964.8166.948.0137.780.5105.289.9174.8124.086.4136.931.535.3112.3143.0160.897.080.562.5158.27.6165.9106.792.263.226.277.052.3105.4 144.349.5116.154.1148.61

47、59.385.367.3112.859.4(1 )計(jì)算該序列的樣本自相關(guān)系數(shù)?k (k=1,2, ;24)O(2 )判斷該序列的平穩(wěn)性。(3)判斷該序列的純隨機(jī)性。4.右序列長度為100,前12個(gè)樣本自相關(guān)系數(shù)如下:1 =0.02 2=0.053=0.104 =-0.025=0.056=0.017=0.12 8=-0.069 =0.0810 =-0.0511 =0.0212 =-0.05該序列能否視為純隨機(jī)序列(0.05)?5表2-9數(shù)據(jù)是某公司在2000-2003年期間每月的銷售量。表2-9月份2000 年2001 年2002 年2003 年115313414511721871752031783234243189149421

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論