《AR回歸模型研究》4300字_第1頁
《AR回歸模型研究》4300字_第2頁
《AR回歸模型研究》4300字_第3頁
《AR回歸模型研究》4300字_第4頁
《AR回歸模型研究》4300字_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

[21]AR模型在隨機時間序列分析模型中最簡單,也是采用最多的一種模型。自回歸模型分析表現(xiàn)得是隨機序列變量內(nèi)部的關(guān)系。這種關(guān)系是一種遞推式的線性回歸。它建立回歸方程,主要是通過自身變量之前各期得值與之后幾期的值之間的相關(guān)關(guān)系(自相關(guān))進行建模,再利用模型預測或者分析。其定義如下:定義1.設(shè){Xt,t=0,1,2,…}QUOTE{Xt,t=0,1,2,…}為時間序列。白噪聲序列為{εt,xt=?0+?1xt-1的時間序列為p階自回歸(Autoregression)序列,其中1,上式為p階自回歸模型,記作AR(p)。特例,AR(1),即一階自回歸過程。該過程是指只有一個時間記錄點,表達式,xt=?自回歸模型滯后算子(lagoperator),記作L。其主要作用是將t變?yōu)閠-1??梢缘玫絃xL2LpAR(p)模型中?Lx?(L)=1–如果xt是平穩(wěn)的,有μ=E(xt)=?0/(1–?1–?L?(L)=1–進行時間序列分析時所用AR模型通常時平穩(wěn)性的,那么AR(p)模型的平穩(wěn)性條件為AR(p)模型能否生成平穩(wěn)的時間序列完全由?1,…,?p決定。?(L)=0方程則為關(guān)于模型實現(xiàn)AR模型建模思想很簡單。AR模型從數(shù)學表達式可以簡單歸納為時間序列中過去值的線性組合加上白噪聲。這樣就可以向前預測當前的值。為了能夠通過AR模型對時間序列進行分析,該部分闡述了使用R語言實現(xiàn)AR模型分析,利用R生成隨機時間序列,以此進行仿真實驗,進行AR模型分析得出結(jié)論。隨機數(shù)據(jù)集首先,利用R語言生成隨機時間序列。設(shè)定生成隨機數(shù)的種子,生成符合正態(tài)分布N(0,1)的數(shù)據(jù),再生成滿足平穩(wěn)性的要求的時間序列的數(shù)據(jù)集ts圖1數(shù)據(jù)集tsx時間序列圖模型確立生成了時間序列后,根據(jù)時間序列圖進行自回歸建模,并且生成數(shù)據(jù)集默認使用一階AR模型。運行R語言程序后可以得到自相關(guān)系數(shù)為0.9879。由此可以看出模擬的時間序列自相關(guān)性很強,可以說明時間序列是具有自相關(guān)特性的。利用R語言進行自回歸建模時,它會提供自相關(guān)系數(shù)的估計方法,包括yule-walker方法以及常用最小二乘法,極大似然法。此次分析中將采用最小二乘法進行參數(shù)估計,其計算結(jié)果是,自相關(guān)系數(shù)為0.9911,截距為-0.017。自相關(guān)函數(shù)ACF體現(xiàn)了分析的時間序列在不同時點的值的相關(guān)關(guān)系,則利用R語言可以計算ACF值。其前三個值為0.9879、0.9760、0.9636。ACF可視化圖形為圖2。圖2自相關(guān)函數(shù)圖從圖2中看出,生成的隨機時間序列的ACF是拖尾的,它存在的自相關(guān)性很高。接下來就利用偏自相關(guān)函數(shù)PACF確定AR模型的階數(shù)。觀察PACF可視圖,偏自相關(guān)系數(shù)PACF近似于0,就表明兩個值的關(guān)系可以用線性關(guān)系表現(xiàn)。通過R語言的pacf()函數(shù)來進行偏自相關(guān)函數(shù)計算。其前三個值為0.9879、0.0065、-0.0305.其可視化圖形如圖3。圖3偏自相關(guān)函數(shù)圖從圖3可以看出,當滯后1階時,其值遠超范圍邊界,接近于1,可以表示此時AR模型顯著。當滯后階數(shù)為其他值時,顯然可以看出PACF的值接近于0。此時AR模型不顯著。因此對于模擬分析的時間序列而言,它能夠利用AR(1)進行自回歸模型建模。自回歸建模時參數(shù)估計得到的1階自相關(guān)系數(shù)值,因此可以直接得到參數(shù)估計后的AR(1)模型。模型檢驗模型檢驗的目的是檢驗模型是否合理。檢驗分兩個部分,其一是模型的有效性檢驗。判斷模型有效性的方法就是模型殘差應(yīng)該是白噪聲。而確定殘差是否為白噪聲序列的檢驗方法是通過殘差的自相關(guān)系數(shù)ACF可視圖判斷并進行Ljung-Box檢驗。利用R語言畫出殘差圖如圖4,畫出殘差樣本自相關(guān)系數(shù)圖如圖5.圖4模型殘差圖圖5殘差樣本自相關(guān)系數(shù)圖根據(jù)圖5,殘差的樣本自相關(guān)系數(shù)圖表示其自相關(guān)系數(shù)近似為0,在0上下小范圍的波動。接下來進行Ljung-Box檢驗,檢驗結(jié)果為p值是0.7338>0.05,因此接受原假設(shè),即殘差序列之間是隨機獨立的,沒有相關(guān)性,通過了檢驗。模型預測模型預測部分即是使用這一種自回歸AR模型的方法來對模型進行預測,并且通過規(guī)律來發(fā)現(xiàn)其價值。在R語言中,我們已經(jīng)可以使用predict()的函數(shù),來完成對預測結(jié)果的計算。預測出的結(jié)果前5個為9.8340、9.681307、9.5238、9.3703、9.2176.且誤差值為1.0808、1.5193、1.8495、2.1228、2.3592.當利用R語言得到的預測值是50個時,其預測值用圖表示如圖6,圖前一部分是原始數(shù)據(jù),后面紅色表示預測值,藍色表示預測值的上下范圍。圖6模型預測值圖實例分析自回歸在經(jīng)濟學方面應(yīng)用廣泛。經(jīng)濟學領(lǐng)域?qū)挿?,有宏觀于微觀之分,其包含的經(jīng)濟現(xiàn)象、經(jīng)濟特征數(shù)不勝數(shù)。這一方面的實例分析采用國內(nèi)生產(chǎn)總值時間序列數(shù)據(jù)進行分析與預測。在經(jīng)濟學領(lǐng)域,國內(nèi)生產(chǎn)總值GDP是一個非常重要的經(jīng)濟指標,它代表的是整個國家的經(jīng)濟狀況。因此本文選用中國GDP數(shù)據(jù)作為研究對象。此次實例分析的目的是研究中國GDP的變化趨勢并進行預測。實例分析中利用1959年到2010年GDP數(shù)據(jù)進行自回歸建模,并利用模型進行分析并且預測10年內(nèi)的GDP發(fā)展趨勢,并且與10年實際數(shù)據(jù)進行比較得到模型預測效果。數(shù)據(jù)收集與預處理實例分析的數(shù)據(jù)是1959-2020年GDP年度數(shù)據(jù)。數(shù)據(jù)來源于中國國家統(tǒng)計局網(wǎng)站。其中,利用1959年到2010年GDP進行模型建立與預測。數(shù)據(jù)導入后利用R語言可以得到時序圖,如圖7。觀察圖7可以看出1959到2010年,GDP是明顯上升趨勢,則一定不是平穩(wěn)序列。接下來為了將序列轉(zhuǎn)換為平穩(wěn)序列,則進行序列一階差分。然后對一階差分后的序列進行ADF檢驗。經(jīng)檢驗該序列也呈明顯上升趨勢。因此繼續(xù)進行序列二階差分,并進行ADF檢驗。經(jīng)檢驗依然不是平穩(wěn)時間序列。圖7國內(nèi)生產(chǎn)總值GDP時序圖因此轉(zhuǎn)換方法對原時間序列數(shù)據(jù)取其對數(shù),畫出時序圖如圖8。觀察圖8可以看出該時間序列呈明顯上升趨勢,判定其不是平穩(wěn)時間序列,經(jīng)ADF檢驗也可說明這一點。因此將其進行一階差分,并進行ADF檢驗。經(jīng)R語言的ADF檢驗,得到p值大于0.05。因此序列不是平穩(wěn)時間序列,則對取序列進行二階差分,并進行ADF檢驗。經(jīng)R語言的ADF檢驗,得到p值為0.01小于0.05。故判定該序列平穩(wěn)。畫出LnGDP序列二階階差分的的時序圖如圖9。圖8對國內(nèi)生產(chǎn)總值GDP取對數(shù)后的時序圖圖9LnGDP序列二階階差分的的時序圖數(shù)據(jù)建模與預測數(shù)據(jù)建模第一步是對2階差分后的LnGDP時間序列數(shù)據(jù)進行白噪聲檢驗,通過Ljung-Box檢驗所得結(jié)果p值小于0.05。這表示該序列不是白噪聲序列,而且該序列存在自相關(guān)性。接下來進行模型的判定,通過R語言畫出自相關(guān)圖和偏自相關(guān)圖分別為圖10、圖11。圖10二階差分對LnGDP序列的自相關(guān)圖圖11二階差分的LnGDP序列的偏自相關(guān)圖通過圖10與圖11,我們可以大致將AR模型的階數(shù)定為2。接下來可以直接利用數(shù)據(jù)通過R語言建立AR模型。在自回歸模型建模時,模型參數(shù)估計利用最小二乘法,直接用AIC得到估計結(jié)果為4階模型。因此接下來最終其模型為lnV然后對擬合的模型進行檢驗,通過R語言得到模型殘差圖,利用模型殘差進行檢驗確定其是否有效。通過模型的殘差自相關(guān)系數(shù)圖如圖12可以看出其自相關(guān)系數(shù)近似為0,在0上下小范圍的波動。圖12二階差分的LnGDP的模型殘差的自相關(guān)圖接下來進行Ljung-Box檢驗,檢驗結(jié)果為p值是0.9457>0.05,因此檢驗后可接受原假設(shè)。這表示殘差序列沒有相關(guān)性,檢驗通過。利用R語言模擬得到之后10年的GDP值,預測值與實際值對比如表1。表1GDP實際值預測值對比表年份2011201220132014201520162017201820192020預測值500034598346.2715392.6840217.4982632.11162295.11380613.31640288.11944558.72297178.7實際值487940.2538580592963.2643563.1688858.2746395.1832035.9919281.1986515.21015986.2誤差2%11%21%31%43%56%66%78%97%126%探究結(jié)果在數(shù)據(jù)模型的建立與預測這部分,對中國GDP數(shù)據(jù)取對數(shù)后的時間序列二階差分得到的時間序列是平穩(wěn)序列。該平穩(wěn)序列通過了白噪聲檢驗,通過ACF圖認定該序列可以進行AR建模。接下來利用R語言建立了AR(4)模型。模型建立后進行進行模型檢驗,觀察p值,得到模型檢驗通過的結(jié)論。最后利用建立的AR模型進行了模型10年的時序數(shù)據(jù)預測。而且該時間序列長度為52,趨勢呈明顯上升態(tài)勢,前面部分的數(shù)據(jù)增長緩慢,后面呈爆發(fā)性增長,在序列中前期的值遠小于后期的值。直接序列差分兩階以后的時間序列趨勢依然明顯上升,取對數(shù)的GDP進行差分兩階以后再顯著水平為0.95的情況下表明差分后的LnGDP是平穩(wěn)序列。經(jīng)過預測值與實際值得比較,可以發(fā)現(xiàn),誤差最小為2011年的2%,最大為2020年的125%。誤差的均值在53%。整個誤差在前幾期預測誤差較小,后面誤差較大。而且這個誤差隨時間越往后誤差越大。因此預測前5前5年預測效果比較符合實際,后5年則相差甚遠。結(jié)論從實例分析的結(jié)論來看,自回歸模型AR(P)是直接通過歷年的數(shù)據(jù)資料對本身進行模型構(gòu)建與預測分析,沒有考慮影響因素對自回歸變量的影響,因此在應(yīng)用時預測效果有時會有所偏差。而且對于自回歸模型來說,時間序列數(shù)據(jù)選取也有一定偏向性。首先所需數(shù)據(jù)需有時序性,自相關(guān)性強。采用AR模型分析則需是時間序列平穩(wěn)的才能進行分析,在數(shù)據(jù)時要采用差分、取對數(shù)等方法進行數(shù)據(jù)處理以期達到平穩(wěn)。最后AR模型建立與預測效果基本符合實際,雖然GDP誤差后5年較大,但其他的預測值都比較接近實際。參考文獻羅芳瓊,吳春梅.時間序列分析的理論與應(yīng)用綜述[J].柳州師專學報,2009,24(3):113-117.李秋菊,李茸.時間序列分析理論與發(fā)展趨勢[J].管理學家,2013(8):373-373.Litterma

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論