版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
金融數(shù)據(jù)分析參考教材RueySTsay.AnIntroductiontoAnalysisofFinancialDatawithR,3Ed,AJohnWiley&Sons,INC.2013RueySTsay著,李洪城等譯,金融數(shù)據(jù)分析導(dǎo)論:基于R語言,機(jī)械工業(yè)出版社,2013.戴維·羅伯特,金融統(tǒng)計(jì)與數(shù)據(jù)風(fēng)險(xiǎn),機(jī)械工業(yè)出版社,2020陳夢根,金融統(tǒng)計(jì)學(xué),中國統(tǒng)計(jì)出版社,2021.軟件學(xué)習(xí)網(wǎng)頁/forum-5-1.html;人大經(jīng)濟(jì)論壇-計(jì)量經(jīng)濟(jì)學(xué)與統(tǒng)計(jì)軟件/;統(tǒng)計(jì)之都論壇第一章導(dǎo)論
學(xué)習(xí)目標(biāo)
了解金融計(jì)量學(xué)的建模步驟、金融數(shù)據(jù)的主要類型和來源。熟悉R和Python語言的基本操作。掌握各類收益率的計(jì)算、分布特征和金融數(shù)據(jù)的可視化。通過疫情期間中美股指收益率對比,體現(xiàn)我國金融風(fēng)險(xiǎn)的可控性以及我國制度優(yōu)越性。1.1
金融數(shù)據(jù)分析概述
1.2
常見的統(tǒng)計(jì)分布
1.3
收益率及其分布特征
1.4R軟件和Python軟件介紹
1.5專題:金融數(shù)據(jù)的可視化
目錄CONTENTS金融數(shù)據(jù)分析概述1.11.1.1金融數(shù)據(jù)分析的含義
數(shù)據(jù)分析定義為,使用適當(dāng)?shù)慕y(tǒng)計(jì)方法,對收集來的大量數(shù)據(jù)進(jìn)行分析,并加以匯總、理解和消化,最大化開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。它包含“數(shù)據(jù)”和“分析”兩個(gè)方面,其中數(shù)據(jù)用以量化現(xiàn)狀,消除模糊,分析可以得到變量之間的相互關(guān)系,解釋相關(guān)現(xiàn)象。
金融數(shù)據(jù)分析關(guān)注金融領(lǐng)域的數(shù)據(jù)獲取、分析、展示及其在數(shù)據(jù)可視化、風(fēng)險(xiǎn)管理、投資組合優(yōu)化、金融建模等方面的應(yīng)用,旨在幫助金融機(jī)構(gòu)和投資者做出理性和有效的決策。它通過經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)和計(jì)算機(jī)科學(xué)等方法,系統(tǒng)地解讀和分析金融市場數(shù)據(jù)(如股票價(jià)格、收益率、匯率等)和財(cái)務(wù)數(shù)據(jù)(財(cái)務(wù)指標(biāo)、財(cái)務(wù)報(bào)表等)。1.1.2金融數(shù)據(jù)的主要類型和來源
金融數(shù)據(jù)的主要類型時(shí)間序列數(shù)據(jù)截面數(shù)據(jù)面板數(shù)據(jù)
金融數(shù)據(jù)的來源專業(yè)性網(wǎng)站專業(yè)數(shù)據(jù)公司和信息公司抽樣調(diào)查金融文本挖掘1.1.3金融數(shù)據(jù)分析步驟第一步,確定研究問題。第二步,數(shù)據(jù)收集和整理。第三步,探索性數(shù)據(jù)分析。第四步,數(shù)據(jù)分析與可視化。第五步,解釋和改進(jìn)。常見的統(tǒng)計(jì)分布1.2
1.2.1正態(tài)分布
在金融計(jì)量分析時(shí),常常假設(shè)資產(chǎn)收益率服從正態(tài)分布,其原因還是源于正態(tài)分布具有良好的統(tǒng)計(jì)特征。但事實(shí)上,假設(shè)資產(chǎn)收益率服從正態(tài)分布是不合理的,原因有三個(gè)方面。一:簡單收益率一定大于等于-100%,但正態(tài)分布卻沒有這樣的限制。二:多期毛收益率是單期毛收益率的乘積,不再服從正態(tài)分布。三:收益率分布大多是厚尾的,不符合正態(tài)分布的尾部特征。
1.2.2對數(shù)正態(tài)分布
R代碼>x=seq(0,1,by=0.01)>curve(dlnorm(x,meanlog=0,sdlog=1),from=0,to=10)
1.2.3學(xué)生t分布
1.2.4廣義誤差分布在時(shí)間序列分析中,廣義誤差分布有時(shí)也會(huì)被用到,其概率密度函數(shù)為:
1.2.5穩(wěn)態(tài)分布
穩(wěn)態(tài)分布是正態(tài)分布的自然推廣,其在加法運(yùn)算下是穩(wěn)定的,這一點(diǎn)滿足對數(shù)收益率的要求。
穩(wěn)態(tài)分布能刻畫股票的歷史收益率所顯現(xiàn)的超額峰度。非正態(tài)的穩(wěn)態(tài)分布沒有有限方差,這一點(diǎn)與大部分金融理論相矛盾。
用非正態(tài)的穩(wěn)態(tài)分布進(jìn)行統(tǒng)計(jì)建模是很困難的。非正態(tài)穩(wěn)態(tài)分布的例子是柯西分布,其關(guān)于中位數(shù)對稱,方差是無限的。
1.2.6極值分布
極值分布是指在概率論中極大值(或者極小值)的概率分布,是從很多個(gè)彼此獨(dú)立的極大值中挑出來的各個(gè)極大值應(yīng)當(dāng)服從的概率密度分布。
極值分布包括廣義極值分布、廣義Pareto分布等,極值分布在金融風(fēng)險(xiǎn)計(jì)量分析中是一個(gè)常用的分布。在第六章我們將詳細(xì)論述。收益率及其分布特征1.31.3.1常見的收益率類型
大多數(shù)金融研究都是從資產(chǎn)價(jià)格的時(shí)間序列開始的,如滬深300指數(shù)每天的收盤價(jià)、國際原油的每日價(jià)格等。但在金融計(jì)量上,使用更多的卻是資產(chǎn)收益率。其原因是收益率序列統(tǒng)計(jì)特性良好,而且具備無量綱等優(yōu)點(diǎn)。常用的收益率包括:單期簡單收益率和多期簡單收益率連續(xù)復(fù)利收益率對數(shù)收益率資產(chǎn)組合收益率當(dāng)期收益率與到期收益率1.單期簡單收益率和多期簡單收益率
設(shè)Pt是t時(shí)刻的資產(chǎn)價(jià)格。從t-1至t日,持有該資產(chǎn)的投資者,其單期簡單毛收益率(1+Rt)為:
與之相對應(yīng)的單期簡單凈收益率(simplenetreturn)或簡單收益率(simplereturn)Rt為:1.單期簡單收益率和多期簡單收益率2.連續(xù)復(fù)利收益率
3.對數(shù)收益率
R代碼library(xts)###加載包library(psych)>data<-read.csv("E://jrjl/Chapter1/GZMTp.csv",header=T)###讀入數(shù)據(jù)>DATE<-data[,1]>date<-as.Date(DATE)>dat<-xts(data[,2],date)>logR<-log(dat)###對數(shù)收益率計(jì)算>logr<-diff(logR)>logreturn<-logr[-1,]>date1<-date[-1]>par(mfrow=c(2,2))###可視化>plot(date,dat,main="",lwd=1,xlab="貴州茅臺(tái)收盤價(jià)",ylab="",type="l")>plot(date1,logreturn,main="",lwd=1,xlab="貴州茅臺(tái)收益率",ylab="",type="l")
4.資產(chǎn)組合收益率
5.當(dāng)期收益率與到期收益率1.3.2收益率的分布特質(zhì)
1.隨機(jī)變量的矩及分布特征1.隨機(jī)變量的矩及分布特征1.隨機(jī)變量的矩及分布特征
1.隨機(jī)變量的矩及分布特征
2.樣本矩及分布特征
2.樣本矩及分布特征
2.樣本矩及分布特征
2.樣本矩及分布特征R軟件和Python軟件介紹1.41.4.1R軟件介紹1.4.1R軟件介紹
1.4.1R軟件介紹
設(shè)置工作路徑是啟動(dòng)Rstudio要做的第一件事。工作路徑的設(shè)置常用有兩種方法。第一種方法是使用setwd函數(shù),這種方法只能是臨時(shí)修改路徑,即每打開一次R軟件就需要修改一次路徑;第二種方法是在Tools主菜單下,點(diǎn)擊Globaloptions,進(jìn)一步在defaultworkingdirectory中修改默認(rèn)工作路徑,保存后重新打開軟件即可永久改變工作路徑,具體可見圖1-5。1.4.1R軟件介紹
1.4.1R軟件介紹
(二)Rstudio基本命令
R軟件是專為統(tǒng)計(jì)計(jì)算和繪圖而產(chǎn)生的語言和環(huán)境,也是一款面向?qū)ο蟮能浖?,可以處理多種類型數(shù)據(jù)。本書選擇在RStudio平臺(tái)進(jìn)行,其命令行提示符為“”,在打開軟件后,在其后面進(jìn)行相關(guān)操作。R函數(shù)是R語言的一個(gè)基礎(chǔ),而函數(shù)封裝于相對應(yīng)的包中,在實(shí)踐中很多包需自行安裝后才可以使用,如下載包“fGarch”,所用到的命令為install.Packages(“fGarch”),其中引號(hào)不可省略,否則無法識(shí)別,引號(hào)中為所需安裝的包,同樣可以在RStudio的Tools目錄下點(diǎn)擊installPackages,如圖1-6所示,在“Packages(separatemultiplewithspaceorcomma)”中輸入需要的包,點(diǎn)擊“Install”進(jìn)行安裝,注意在安裝過程中要聯(lián)網(wǎng),安裝后的包需要加載,命令為library()。1.4.1R軟件介紹
1.4.1R軟件介紹
(三)Rstudio讀寫命令
Rstudio幾乎可以讀取所有主流的文件。常用的文件包括以下三種。第一是純文本文件,其文件擴(kuò)展名為“.txt”,所用的命令為read.table函數(shù);第二是逗號(hào)分割文件,其擴(kuò)展名為“.csv”,所用命令為read.table函數(shù)或者read.csv函數(shù),如果使用read.table函數(shù)需要設(shè)置sep參數(shù)為逗號(hào);第三是excel文件,其擴(kuò)展名為“.xls”和“.xlsx”,在讀取之前要先加載openxlsx包,然后使用read.xlsx讀取這兩類文件。
在讀取之前,若文件在當(dāng)前目錄下,直接輸入文件名,若不在當(dāng)前目錄下,需要使用文件的全路徑。若讀取的數(shù)據(jù)為網(wǎng)絡(luò)文件,只需要將read.table的第一個(gè)參數(shù)改為網(wǎng)絡(luò)文件具體的地址。
1.4.2Python軟件介紹
(一)軟件安裝
本書在windows系統(tǒng)下載Ananconda并啟動(dòng)AnacondaNavigator,如圖1-8所示,可以看到多種Python的多種IDE,若有需要,點(diǎn)擊“Install”即可下載。
1.4.2Python軟件介紹
Spyder:與RStudio很相似,其界面分為主窗口、歷史窗口和輸出窗口,分別用于編譯、數(shù)據(jù)存儲(chǔ)和輸出,大小和位置可以自行調(diào)整。JupyterNotebook:可以看作是一種交互式筆記本,便于分步執(zhí)行和顯示結(jié)果,具體見圖1-9,支持運(yùn)行多種編程語言,其本質(zhì)是一個(gè)Web應(yīng)用程序,便于創(chuàng)建和共享程序文檔,支持代碼實(shí)現(xiàn)和可視化。
1.4.2Python軟件介紹
(二)基本語法介紹Python和R軟件一樣,加載os模塊,使用os.chdir()可以自行修改工作路徑,方便結(jié)果的尋找。Python下載模塊可以直接在conda中選擇,也可以在資源管理器中打開conda,使用命令pipinstallPandas進(jìn)行下載,在程序運(yùn)行前下使用命令importpandasaspd加載該模塊。
Pythons的變量類型包含數(shù)值、字符串、列表、元組和字典,變量賦值所用符號(hào)為:“=”,且變量的對象下標(biāo)是由0開始,在編寫程序時(shí)要多加注意。Python中的基礎(chǔ)模塊有NumPy、Pandas和Matplotlib,其中NumPy模塊為開源數(shù)值計(jì)算擴(kuò)展,可以存儲(chǔ)和處理大型矩陣;Pandas模塊是基于NumPy的一種工具,納入了大量庫和標(biāo)準(zhǔn)數(shù)據(jù)模型,主要解決數(shù)據(jù)分析問題;Matplotlib為Python的2D繪圖庫,通過各種拷貝格式和跨平臺(tái)的交互環(huán)境生成圖形。
1.4.2Python軟件介紹
(三)Tensorflow模塊
近年來,人工智能在金融領(lǐng)域廣泛應(yīng)用,其中就包含機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)新方向,在數(shù)據(jù)挖掘、自然語言處理以及其他領(lǐng)域都取得了很多成果。而Python語言作為實(shí)現(xiàn)這一分析的工具,需要使用tensorflow模塊。2015年Google以開源形式發(fā)布Tensorflow,該模塊作為生產(chǎn)級(jí)深度學(xué)習(xí)庫,擁有巨大用戶群,并且不斷地部署和提供模型以及第三方工具和平臺(tái)。關(guān)于該模塊的下載,可以通過Anaconda下載并于Python的IDE進(jìn)行搭載,安裝時(shí)要注意Python和tensorflow版本相匹配。專題1.5金融數(shù)據(jù)的可視化
—基于新冠疫情間中美股市波動(dòng)的對比分析
1.5金融數(shù)據(jù)的可視化本專題將通過分析比較此次疫情對于中美兩國股票市場的影響,說明金融數(shù)據(jù)的可視化。為此,選擇中國滬深300指數(shù)和美國標(biāo)普500指數(shù)分別作為中美兩國金融市場代表性指標(biāo),時(shí)間區(qū)間為2020年1月1日至2020年12月31日,頻率為日度,研究新冠肺炎疫情對中美股票市場的影響。
1.5金融數(shù)據(jù)的可視化首先,繪制這兩種指數(shù)的開盤價(jià)、最高價(jià)、最低價(jià)和收盤價(jià)的時(shí)序圖。圖1-10左半部分為中國滬深300指數(shù)相關(guān)指標(biāo),很明顯這幾個(gè)數(shù)據(jù)有很強(qiáng)的相關(guān)性,2020年前后,受新冠疫情的影響,我國股市受到了比較大的沖擊。
1.5金融數(shù)據(jù)的可視化1.5金融數(shù)據(jù)的可視化
接下來對數(shù)據(jù)進(jìn)行一個(gè)統(tǒng)計(jì)性描述(表1.3),通過樣本均值和分位數(shù)發(fā)現(xiàn):滬深300指數(shù)多數(shù)時(shí)間在3500點(diǎn)至5200點(diǎn)之間浮動(dòng),在高位和低位持續(xù)的時(shí)間較短,這與現(xiàn)實(shí)情況相符。標(biāo)普500指數(shù)則從疫情后的2200點(diǎn)低位經(jīng)過一年的拉升才達(dá)到了3800點(diǎn)左右。1.5金融數(shù)據(jù)的可視化
接下來計(jì)算滬深300指數(shù)和標(biāo)普500指數(shù)簡單收益率和對數(shù)收益率,結(jié)果如圖1-11所示。從圖中可發(fā)現(xiàn)中美兩國代表性股指簡單收益率和對數(shù)收益率均大致平穩(wěn),它們圍繞一條軸上下波動(dòng),相對而言簡單收益率的波動(dòng)要大于對數(shù)收益率的波動(dòng)。1.5金融數(shù)據(jù)的可視化
圖1-12展示了中美兩個(gè)指數(shù)波動(dòng)率的時(shí)序圖??梢郧宄乜吹剑?020年年初和2020年年中,我國波動(dòng)率出現(xiàn)了一個(gè)顯著的上升。而美國在2020年初出現(xiàn)了巨大的波動(dòng)。特別注意的是,在疫情期間,我國經(jīng)濟(jì)整體保持穩(wěn)定狀態(tài),呈現(xiàn)為較小的波動(dòng),而美國則出現(xiàn)了較大的波動(dòng)。1.5金融數(shù)據(jù)的可視化
圖1-13展現(xiàn)的是對數(shù)收益分布的直方圖,從形態(tài)上來看,對數(shù)收益率是近似于正態(tài)分布的。直方圖是分布密度的一個(gè)比較粗糙的估計(jì)量,從圖1-13中也可以看出,美國標(biāo)普500指數(shù)峰度更大,風(fēng)險(xiǎn)更高。1.5金融數(shù)據(jù)的可視化
圖1-14分別演示了由使用三個(gè)帶寬的滬深300指數(shù)日和標(biāo)普500指數(shù)的對數(shù)收益率的核密度估計(jì)。圖1-14的實(shí)曲線來自于Rstudio中的density()函數(shù),具有缺省帶寬。虛線和點(diǎn)線曲線分別具有1/2和1的缺省帶寬。調(diào)諧參數(shù)adjust是缺省帶寬的乘數(shù),所以在三條曲線中,adjust分別為1/2,1和2。1.5金融數(shù)據(jù)的可視化
接下來對數(shù)據(jù)進(jìn)行正態(tài)分布檢驗(yàn)。Q-Q圖是正態(tài)分布檢驗(yàn)最常用最直觀的方法,分別進(jìn)行舉例說明:通過Q-Q圖(圖1-15)可以看到,樣本分位數(shù)和理論分位數(shù)并不能很好的擬合,由此我們初步認(rèn)定滬深300股指和標(biāo)普500指數(shù)的對數(shù)收益率都不符合正態(tài)分布。同時(shí)可看出,美國標(biāo)普500指數(shù)尾部極端風(fēng)險(xiǎn)更大。1.5金融數(shù)據(jù)的可視化新冠疫情不可避免地會(huì)對經(jīng)濟(jì)社會(huì)造成負(fù)面影響,但不會(huì)改變我國經(jīng)濟(jì)長期向好的基本面。從上面的分析我們看出,此次疫情初期,我國股票市場雖然有短期的異常波動(dòng)性,但并沒有對我國金融市場產(chǎn)生較大影響,我國股票市場完全有能力通過自我調(diào)節(jié)應(yīng)對此次疫情的沖擊。習(xí)題Theending第二章
金融時(shí)間序列線性模型
學(xué)習(xí)目標(biāo)
熟悉時(shí)間序列的平穩(wěn)性和單位根檢驗(yàn);掌握構(gòu)建AR、MA、ARMA模型的基本思想和建模過程;了解季節(jié)模型和長記憶模型的基本步驟和建模過程;了解中國居民消費(fèi)價(jià)格指數(shù)的波動(dòng)規(guī)律,了解中國黨和政府重視民生工程,保持物價(jià)穩(wěn)定的決心和能力。
本章導(dǎo)讀
時(shí)間序列是指將某一個(gè)統(tǒng)計(jì)指標(biāo)在不同時(shí)間上的各個(gè)數(shù)值,按時(shí)間先后順序排列而成的序列。時(shí)間序列的發(fā)展可以追溯到1927年Yule提出的AR模型和1937年Walker提出的MA模型及將兩個(gè)模型合并得到的ARMA模型;隨后標(biāo)志性的事件包括1970年Box和Jenkins中提出的ARIMA模型,1982年Engle提出的ARCH模型,1985年Bollerslov針對多變量的情況提出的GARCH模型。時(shí)間序列分析的目的一般有兩個(gè)方面:一是認(rèn)識(shí)產(chǎn)生觀測序列的隨機(jī)機(jī)制,即建立數(shù)據(jù)生成模型;二是基于序列的已知數(shù)據(jù),對未來的可能取值給出預(yù)測。目前,時(shí)間序列在金融數(shù)據(jù)分析中得到了廣泛應(yīng)用。本章將講述時(shí)間序列數(shù)據(jù)模型的性質(zhì)、識(shí)別、估計(jì)與預(yù)測,包括簡單自回歸模型(AR)、簡單移動(dòng)平均模型(MA)、自回歸移動(dòng)平均模型(ARMA)、自回歸整合移動(dòng)平均模型(ARIMA)、季節(jié)模型以及時(shí)間序列平穩(wěn)性與單位根檢驗(yàn)等。2.1相關(guān)性和平穩(wěn)性2.2簡單自回歸模型2.3簡單移動(dòng)平均模型2.4簡單ARMA模型2.5單位根非平穩(wěn)時(shí)間序列2.6季節(jié)模型組合風(fēng)險(xiǎn)測度2.7長記憶時(shí)間序列模型專題2:基于ARIMA模型的中國居民消費(fèi)價(jià)格指數(shù)預(yù)測
目錄CONTENTS相關(guān)性和平穩(wěn)性2.12.1.1相關(guān)性
2.1.1相關(guān)性
2.1.1相關(guān)性
2.1.1相關(guān)性例2.1股票相關(guān)性計(jì)算。圖2-1是浦發(fā)銀行股票和工商銀行股票從2007年1月到2021年12月的月收益率的散點(diǎn)圖。從其散點(diǎn)圖中可看出,這兩只股票收益率趨于正相關(guān)。之后分別計(jì)算這兩只股票前面所述的三種相關(guān)系數(shù),結(jié)果如下表2-1。相關(guān)系數(shù)種類Pearson相關(guān)系數(shù)Spearman相關(guān)系數(shù)Kendall相關(guān)系數(shù)指標(biāo)數(shù)值0.66740.71930.5536圖2-1浦發(fā)銀行股票月收益率對工商銀行股票月收益率散點(diǎn)圖表2-1浦發(fā)銀行和工商銀行股票收益率相關(guān)性分析2.1.1相關(guān)性R代碼>da=read.table("E://jrjl/Chapter2/pfyh.txt",header=T)>x<-da$gs>y<-da$pf>plot(x,y,xlab="工商銀行月收益率",ylab="浦發(fā)銀行月收益率")>cor(x,y,method="pearson")#計(jì)算皮爾遜相關(guān)系數(shù)>cor(x,y,method="spearman")#計(jì)算斯皮爾曼相關(guān)系數(shù)>cor(x,y,method="kendall")#計(jì)算肯德爾相關(guān)系數(shù)2.1.2平穩(wěn)性
2.1.2平穩(wěn)性
2.1.2平穩(wěn)性
2.1.2平穩(wěn)性
2.1.2平穩(wěn)性
2.1.2平穩(wěn)性
2.1.2平穩(wěn)性
圖2-2收益率序列時(shí)序圖和序列的ACF圖2.1.2平穩(wěn)性R代碼>d=read.table("E://jrjl/Chapter2/szzz.txt",header=T)>sse<-ts(d$IdxMonRet,start=c(1991,1),frequency=12)>plot(sse,xlab="年份",ylab="月收益率",main="上證綜指月收益率")>acf(d$IdxMonRet,lag=24,main="上證綜指月收益率")2.1.2平穩(wěn)性
圖2-3工商銀行的月簡單收益率和對數(shù)收益率的自相關(guān)函數(shù)圖2.1.2平穩(wěn)性R代碼>d=read.table("E://jrjl/Chapter2/gsyh.txt",header=T)#讀取文件>da=d$gs>gs<-ts(da,start=c(2007,1),frequency=12)>lngs=log(gs+1)#收益率取對數(shù)>acf(da,main="工商銀行月收益率")#簡單收益率自相關(guān)圖>acf(log(gs+1),main="工商銀行對數(shù)月收益率")#對數(shù)收益率自相關(guān)圖>Box.test(gs,lag=5,type="Ljung")#簡單收益率的自相關(guān)檢驗(yàn)>Box.test(gs,lag=10,type="Ljung")>Box.test(lngs,lag=5,type="Ljung")#對數(shù)收益率的自相關(guān)檢驗(yàn)>Box.test(lngs,lag=10,type="Ljung")2.1.2平穩(wěn)性
2.1.2平穩(wěn)性例2.3續(xù)從例2.3的分析可以看出,工商銀行股票序列可以認(rèn)為是一個(gè)白噪聲序列。圖2-4給出了隨機(jī)產(chǎn)生的1000個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的白噪聲序列的時(shí)序圖。圖2-4標(biāo)準(zhǔn)正態(tài)白噪聲序列時(shí)序圖2.1.2平穩(wěn)性R代碼>set.seed(111)>x<-rnorm(1000)>ts.plot(x)簡單自回歸模型2.22.2
簡單自回歸模型
2.2.1AR模型性質(zhì)
2.2.1AR模型性質(zhì)
2.2.1AR模型性質(zhì)R代碼>par(mfcol=c(2,2))>x1<-arima.sim(n=1000,list(ar=-0.2))>acf(x1,lag.max=30,main="φ=-0.2")>x2<-arima.sim(n=1000,list(ar=0.2))>acf(x2,lag.max=30,main="φ=0.2")>x3<-arima.sim(n=1000,list(ar=-0.8))>acf(x3,lag.max=30,main="φ=-0.8")>x4<-arima.sim(n=1000,list(ar=0.8))>acf(x4,lag.max=30,main="φ=0.8")2.2.1AR模型性質(zhì)
2.2.1AR模型性質(zhì)
2.2.1AR模型性質(zhì)圖2-6AR(2)模型的自相關(guān)函數(shù)
2.2.1AR模型性質(zhì)
2.2.2AR模型的識(shí)別AR模型的識(shí)別:在實(shí)際應(yīng)用中,AR時(shí)間序列的階數(shù)p是未知的,必須根據(jù)實(shí)際數(shù)據(jù)來決定。因此需要對AR模型定階。一般有兩個(gè)確定階數(shù)p的方法:一是利用AIC、BIC等信息準(zhǔn)則,二是利用偏自相關(guān)函數(shù)。2.2.2AR模型的識(shí)別
2.2.2AR模型的識(shí)別
2.2.2AR模型的識(shí)別
2.2.2AR模型的識(shí)別例2.4中國GDP的季度數(shù)據(jù)建模。本例使用中國GDP的季度數(shù)據(jù),時(shí)間從1992年第一季度至2021年第四季度,共116個(gè)數(shù)據(jù)。圖2-7給出了GDP序列的對數(shù)序列和增長率的時(shí)序圖(對數(shù)GDP增長率為對數(shù)GDP之間的一階差分)。之后對增長率的ACF和PACF進(jìn)行估計(jì),得到圖2-8,從圖2-8中可看出,可嘗試AR(7)建模。R軟件stats包中的ar()函數(shù)可以對時(shí)間序列進(jìn)行AR建模,默認(rèn)采用AIC準(zhǔn)則定階。用選項(xiàng)aic=FALSE,order.max=p可以選定p階模型。如本例產(chǎn)生了一個(gè)8階的模型,圖2-9為其AIC的圖形,當(dāng)p=8時(shí)達(dá)到最小值。雖然ar()函數(shù)沒有提供BIC的值,但因?yàn)锽IC(k)?AIC(k)=k(lnT?2)/T,因此可以計(jì)算BIC值。事實(shí)上,BIC也建議p=8。表2.2為PACF、AIC和BIC各階對應(yīng)的值,找出最小的AIC和BIC時(shí)對應(yīng)的階數(shù)即可。當(dāng)然,從AIC圖形可看出,如果取較低的階,4階也是可以的。這個(gè)例子說明不同的準(zhǔn)則可能會(huì)得出p的不同選擇。在實(shí)際應(yīng)用中,還沒有證據(jù)表明哪種方法更好。對給定的時(shí)間序列選擇一個(gè)AR模型時(shí),還有兩種因素起著重要作用,就是所研究問題的具體信息和模型的簡單性。2.2.2AR模型的識(shí)別2.2.2AR模型的識(shí)別2.2.2AR模型的識(shí)別R代碼>d=read.table("E://jrjl/Chapter2/gdp,txt",header=T)>gdp<-ts(d[["GDP"]],start=c(1992,1),frequency=4)>plot(log(gdp),xlab="年份",ylab="log(GDP)",main="對數(shù)GDP")>rate<-diff(log(gdp))>plot(rate,xlab="年份",ylab="增長率",main="GDP增長率")>b1<-pacf(rate,xlab="年份",main="")>b1>a1<-ar(rate,method="mle")>a1$order>a1$aic>plot(as.numeric(names(a1$aic)),a1$aic,type="h",xlab="k",ylab="AIC")>tmp.T<-length(rate)>tmp.bic<-a1$aic+as.number(names(a1$aic))*(log(tmp.T)-2)/tmp.T>tmp.bic>plot(as.numeric(names(a1$aic)),tmp.bic,type="h",xlab="k",ylab="BIC")2.2.3AR模型的估計(jì)
2.2.3AR模型的估計(jì)模型檢驗(yàn):檢查擬合的模型好壞的一個(gè)標(biāo)準(zhǔn)是考察模型是否充分。如果模型是充分的,則其殘差序列應(yīng)為白噪聲。殘差的樣本自相關(guān)函數(shù)和Ljung-Box統(tǒng)計(jì)量可用來檢驗(yàn)與白噪聲的接近程度。對AR(p)模型,Ljung-Box統(tǒng)計(jì)量Q(m)漸近服從自由度為的分布,其中g(shù)是所用模型中AR系數(shù)的個(gè)數(shù)。如果發(fā)現(xiàn)擬合的模型是不充分的,那么就需要對它進(jìn)行改進(jìn)。如果估計(jì)的AR系數(shù)中有一些與0沒有顯著差別,則我們應(yīng)該去掉這些不顯著的參數(shù)對模型進(jìn)行簡化。2.2.3AR模型的估計(jì)
2.2.3AR模型的估計(jì)
2.2.3AR模型的估計(jì)R代碼>d=read.table("E://jrjl/Chapter2/szzz.txt",header=T)>IMR<-ts(d[["IdxMonRet"]],start=c(1991,1),frequency=12)>a1<-ar(IMR,method="mle")>a1$order>a2<-arima(IMR,order=c(11,0,0))>Box.test(a2$residuals,lag=12,type="Ljung",fitdf=11)>a3<-arima(IMR,order=c(11,0,0),fixed=c(0,0,0,0,0,0,NA,0,NA,0,NA,0))>a3>Box.test(a3$residuals,lag=12,type="Ljung",fitdf=3)>abs(polyroot(c(1,-coef(a3)[1:11])))
2.2.3AR模型的估計(jì)
2.2.4AR模型的預(yù)測
2.2.4AR模型的預(yù)測
2.2.4AR模型的預(yù)測
2.2.4AR模型的預(yù)測
2.2.4AR模型的預(yù)測R代碼>d=read.table("E://jrjl/Chapter2/szzz.txt",header=T)>da=d$IdxMonRet>IMR<-ts(da[1:360],start=c(1991,1),frequency=12)>a1<-ar(IMR,method="mle")>a1$order>a2<-arima(IMR,order=c(11,0,0))>Box.test(a2$residuals,lag=12,type="Ljung",fitdf=11)>a2>a3<-arima(IMR,order=c(11,0,0),fixed=c(0,0,0,0,0,0,NA,0,NA,0,NA,0))>a3>pred1<-predict(a3,12)>pred1>x1=(c(1:24))/12+2020>y1=da[349:372]>plot(x1,y1,xlab='年份',ylab='上證綜指月簡單收益率',type='b',ylim=c(-0.06,0.12))>points(x1[13:24],pred1$pred,col="red",lwd=1,lty=2,type="b",pch=2)簡單移動(dòng)平均模型2.32.3簡單移動(dòng)平均模型
2.3.1MA模型的性質(zhì)
2.3.1MA模型的性質(zhì)
2.3.1MA模型的性質(zhì)
2.3.1MA模型的性質(zhì)R代碼>x1<-arima.sim(n=1000,list(ma=-2))>acf(x1,lag.max=20)>x2<-arima.sim(n=1000,list(ma=-0.5))>acf(x1,lag.max=20)>x3<-arima.sim(n=1000,list(ma=c(-2,4)))>acf(x3,lag.max=20)>x4<-arima.sim(n=1000,list(ma=c(-0.5,0.25)))>acf(x4,lag.max=20)2.3.1MA模型的性質(zhì)
2.3.2MA模型的識(shí)別
圖2-12民生銀行月簡單收益率時(shí)序圖和ACF圖2.3.3MA模型的估計(jì)MA模型的估計(jì):估計(jì)MA模型通常用最大似然法,它又細(xì)分為條件似然法(conditionallikelihoodmethod)和精確似然法(exactlikelihoodmethod)兩種估計(jì)方法。精確似然估計(jì)優(yōu)于條件似然估計(jì),尤其是當(dāng)MA模型接近于不可逆時(shí)。然而,精確似然估計(jì)的計(jì)算會(huì)更復(fù)雜一些。如果樣本量較大,這兩種似然估計(jì)是接近的。2.3.3MA模型的估計(jì)
2.3.3MA模型的估計(jì)R代碼>d=read.table("E://jrjl/Chapter2/zsyh.txt",header=T)>da=d$Monret>mr<-ts(da,frequency=12,start=c(2001,1))>plot(mr,xlab="年份",ylab="民生銀行月簡單收益率")>acf(da)>a1<-arima(mr,order=c(0,0,14))>a1>Box.test(a1$residuals,type="Ljung",lag=24,fitdf=13)>a2<-arima(mr,order=c(0,0,14),fixed=c(0,0,0,0,0,0,0,0,NA,0,0,0,0,NA,NA))>a22.3.4MA模型的預(yù)測
2.3.4MA模型的預(yù)測
2.3.4MA模型的預(yù)測
2.3.4MA模型的預(yù)測R代碼>d=read.table("E://jrjl/Chapter2/zsyh.txt",header=T)>da=d$Monret>mr<-ts(da[1:242],frequency=12,start=c(2001,1))>plot(mr,xlab="年份",ylab="民生銀行月簡單收益率")>acf(da)>a1<-arima(mr,order=c(0,0,14))>a1>a2<-arima(mr,order=c(0,0,14),fixed=c(0,0,0,0,0,0,0,0,NA,0,0,0,0,NA,NA))>a2>pred2<-predict(a2,10)>pred2簡單ARMA模型2.42.4.1ARMA(1,1)模型ARMA(1,1)理論推導(dǎo)2.4.1ARMA(1,1)模型2.4.1ARMA(1,1)模型2.4.1ARMA(1,1)模型通過推導(dǎo),發(fā)現(xiàn)ARMA(1,1)模型的ACF與AR(1)模型的ACF很相似,不同之處僅在于它的指數(shù)衰減是從滯后2階開始的。因此,ARMA(1,1)模型的ACF不能在任意有限滯后階截尾?,F(xiàn)在來看偏自相關(guān)函數(shù)(PACF)??梢宰C明ARMA(1,1)模型的PACF也不能在有限滯后階后截尾。它與MA(1)模型的PACF表現(xiàn)很相似,只是指數(shù)衰減從滯后2階開始,而不是從滯后1階開始。綜上所述,ARMA(1,1)模型的平穩(wěn)性條件與AR(1)模型相同,ARMA(1,1)模型的ACF與AR(1)模型的ACF有相似的模式,只是是從滯后2階開始的。ARMA(1,1)與AR(1)性質(zhì)比較2.4.2ARMA模型簡介ARMA模型一般形式2.4.3ARMA模型的識(shí)別
每一隨機(jī)過程都有它的典型的ACF和PACF式樣(表2.5)。對于AR(p)過程,ACF按幾何或指數(shù)規(guī)律下降(常描述為拖尾),而PACF則是在一定時(shí)期忽然截?cái)啵ǔC枋鰹榻匚玻?梢?,AR(p)過程的ACF和PACF與MA(q)過程的ACF和PACF相比,剛好相反。ARMA模型的識(shí)別2.4.3ARMA模型的識(shí)別
在給ARMA模型定階時(shí),ACF和PACF都不能提供足夠的信息。通常采用推廣的自相關(guān)函數(shù)(EACF)來確定ARMA過程的階。課本例題2.11講述自相關(guān)函數(shù)(EACF)來確定ARMA過程的階。選擇ARMA模型階數(shù)的另外一種方法是信息準(zhǔn)則。具體地說,對于事先指定的正整數(shù)P和Q,計(jì)算ARMA(p,q)模型的AIC(或BIC),其中0≤p≤P、0≤q≤Q,選取使AIC(或BIC)取最小值的模型。ARMA(p,q)模型的階確定后就可用條件似然法或者精確似然法來估計(jì)模型的參數(shù),并對殘差進(jìn)行Ljung-Box檢驗(yàn)判斷所擬合模型的合理性。在R中可以用arima()函數(shù)建立ARMA模型。利用自相關(guān)函數(shù)(EACF)定階單位根非平穩(wěn)時(shí)間序列2.52.5.1隨機(jī)游走和帶漂移項(xiàng)的隨機(jī)游走
隨機(jī)游動(dòng)帶漂移項(xiàng)的隨機(jī)游走2.5.2趨勢平穩(wěn)的時(shí)間序列
趨勢平穩(wěn)的時(shí)間序列2.5.3ARIMA模型如果允許其特征多項(xiàng)式存在特征根,則ARMA模型就變成了自回歸整合移動(dòng)平均模型ARIMA。ARIMA模型表達(dá)式中經(jīng)過d階差分得到一個(gè)平穩(wěn)序列,同時(shí)假定其自回歸算子的滯后期為p,移動(dòng)平均算子的滯后期為q,則ARIMA模型結(jié)構(gòu)為ARIMA(p,d,q)。應(yīng)用ARIMA模型進(jìn)行建模可分為如下的四個(gè)步驟。(1)對原序列進(jìn)行平穩(wěn)性檢驗(yàn),如果序列不滿足平穩(wěn)性條件,可以通過差分變換使得序列滿足平穩(wěn)性條件。(2)通過計(jì)算能夠描述序列特征的一些統(tǒng)計(jì)量(如自相關(guān)系數(shù)和偏自相關(guān)系數(shù)以及推廣的自相關(guān)函數(shù)EACF),來確定ARIMA模型階數(shù)p和q,并在初始估計(jì)中選擇盡可能少的參數(shù)。(3)估計(jì)模型的參數(shù),并檢驗(yàn)參數(shù)的顯著性,以及模型本身的合理性。(4)對結(jié)果進(jìn)行分析,以證實(shí)所得模型是否與所觀察的數(shù)據(jù)特征相符。ARIMA模型2.5.4非平穩(wěn)時(shí)間序列的單位根檢驗(yàn)非平穩(wěn)時(shí)間序列的單位根檢驗(yàn)2.5.4非平穩(wěn)時(shí)間序列的單位根檢驗(yàn)DF檢驗(yàn)2.5.4非平穩(wěn)時(shí)間序列的單位根檢驗(yàn)ADF檢驗(yàn)2.5.4非平穩(wěn)時(shí)間序列的單位根檢驗(yàn)例2.12考慮中國從1992年第1季度到2021年第4季度的季度GDP對數(shù)序列。該序列表現(xiàn)出上升趨勢,這表明中國經(jīng)濟(jì)的增長,同時(shí)它呈現(xiàn)高度的樣本序列相關(guān)性,參見圖2-7a。該序列的1階差分序列代表了中國GDP的增長率,圖2-7b給出了GDP增長率序列的時(shí)序圖,該差分序列看起來在一個(gè)固定的均值水平附近波動(dòng)。為證實(shí)這一現(xiàn)象,對該對數(shù)序列進(jìn)行ADF單位根檢驗(yàn)。基于圖2-8給出的差分序列的樣本PACF,選擇p=7較為合適,而基于圖2-9給的AIC圖,選擇p=8較為合適。在這里通過更加精確的fUnitRoots包函數(shù)進(jìn)行定階,選擇p=8更為合適。當(dāng)p=8時(shí),ADF檢驗(yàn)統(tǒng)計(jì)量是-0.8423,p值是0.7435,這表明單位根假設(shè)不能被拒絕。2.5.4非平穩(wěn)時(shí)間序列的單位根檢驗(yàn)R代碼>d=read.table("E://jrjl/Chapter2/gdp.txt",header=T)>library(fUnitRoots)>gdp=log(d[,2])>m1=ar(diff(gdp),method='mle')>m1$order>adfTest(gdp,lags=8,type=c("c"))季節(jié)模型2.62.6季節(jié)模型有些金融時(shí)間序列,呈現(xiàn)出一定的循環(huán)或周期性,這樣的時(shí)間序列叫做季節(jié)時(shí)間序列。在季節(jié)時(shí)間序列中,常常需先處理這些季節(jié)趨勢,把它從數(shù)據(jù)中移除,得到經(jīng)季節(jié)調(diào)整后的時(shí)間序列,然后再用來做推斷。這種從時(shí)間序列中移除季節(jié)性的過程叫做季節(jié)調(diào)整。圖2-14所示的是中國GDP對數(shù)的時(shí)序圖。對其對數(shù)變換主要是因?yàn)镚DP是指數(shù)增長的,同時(shí)通過對數(shù)變換可降低序列的波動(dòng)性。事實(shí)上,對數(shù)變換在金融、經(jīng)濟(jì)時(shí)間序列分析中是常用的處理數(shù)據(jù)的方法。季節(jié)模型2.6季節(jié)模型圖2-14中國GDP從1992年1季度到2021年4季度對數(shù)時(shí)序圖2.6季節(jié)模型
2.6季節(jié)模型
2.6季節(jié)模型圖2-15中國GDP從1992年第1季度到2021年第4季度的對數(shù)序列的樣本自相關(guān)函數(shù)圖2.6季節(jié)模型
2.6季節(jié)模型圖2-16
中國GDP從1992年第1季度到2021年第4季度的對數(shù)序列的時(shí)序圖2.6季節(jié)模型
多重季節(jié)模型2.6季節(jié)模型R代碼>d=read.table("E://jrjl/Chapter2/gdp.txt",header=T)>da=d>eps=log(da$GDP)>koeps=ts(eps,frequency=4,start=c(1992,1))>plot(gdp,type='l',xlab='year',ylab='ln(GDP)')>par(mfcol=c(2,2))>koeps=log(da$GDP)>deps=diff(koeps)>sdeps=diff(koeps,4)>ddeps=diff(sdeps)>acf(koeps,lag=20,main="a.對數(shù)序列")>acf(sdeps,lag=20,main="c.季節(jié)差分序列")>acf(deps,lag=20,main="b.一階差分序列")>acf(ddeps,lag=20,main="d.常規(guī)差分和季節(jié)差分后序列")2.6季節(jié)模型>c1=c("2","3","4","1")>c2=c("1","2","3","4")>par(mfcol=c(3,1))>deps=ts(deps,frequency=4,start=c(1992))>plot(deps,xlab='year',ylab='一階差分',type='l',main="a.一階差分序列")>points(deps,pch=c1,cex=0.7)>sdeps=ts(sdeps,frequency=4,start=c(1992))>plot(sdeps,xlab='year',ylab='季節(jié)差分',type='l',main="b.季節(jié)差分序列")>points(sdeps,pch=c2,cex=0.7)>ddeps=ts(ddeps,frequency=4,start=c(1992))>plot(ddeps,xlab='year',ylab='常規(guī)和季節(jié)差分',type='l',main="c.常規(guī)和季節(jié)差分序列")>points(ddeps,pch=c1,cex=0.7)長記憶時(shí)間序列模型2.72.7
長記憶時(shí)間序列模型時(shí)間序列可分為平穩(wěn)序列和非平穩(wěn)序列兩類,一般來說長記憶的時(shí)間序列是非平穩(wěn)的。我們知道,平穩(wěn)時(shí)間序列的ACF呈指數(shù)衰減。但是對單位根非平穩(wěn)時(shí)間序列,可證明對任意固定的滯后階數(shù),當(dāng)樣本容量增加時(shí),樣本ACF收斂于1。另外也存在一些時(shí)間序列,隨著滯后階數(shù)的增加它們的ACF以多項(xiàng)式的速度緩慢衰減到0。這些時(shí)間序列稱為長記憶時(shí)間序列(long-memorytimeseries)。長記憶時(shí)間序列模型2.7
長記憶時(shí)間序列模型
ARFIMA模型2.7
長記憶時(shí)間序列模型例2.13為說明長記憶時(shí)間序列的建模,考慮上海銀行間隔夜拆借利率中國工商銀行隔夜拆借利率的報(bào)價(jià)利率對數(shù)收益率的絕對收益率,時(shí)間跨度為2014年1月3日至2020年12月31日。圖2-17給出了序列絕對值序列的ACF圖。從圖中可見ACF的數(shù)值相對較小,且衰減緩慢,甚至在滯后300階后還在5%的水平下顯著。圖2-17上海銀行間隔夜拆借利率中國工商銀行日隔夜拆借利率的報(bào)價(jià)利率對數(shù)收益率的絕對值序列的樣本ACF值2.7
長記憶時(shí)間序列模型
2.7
長記憶時(shí)間序列模型R代碼>d=read.csv("E://jrjl/Chapter2/gsyhh.csv",header=T)>install.packages("fracdiff")>library(fracdiff)>ew=abs(d$dlnr)>m2=fracdiff(ew,nar=1,nma=1)>summary(m2)基于ARIMA模型的中國居民消費(fèi)價(jià)格指數(shù)預(yù)測2.8基于ARIMA模型的中國居民消費(fèi)價(jià)格指數(shù)預(yù)測通過研究國家或者一個(gè)區(qū)域的CPI指數(shù)的變動(dòng),可以從一個(gè)側(cè)面反映國家或者地區(qū)的民生情況。CPI的統(tǒng)計(jì)數(shù)據(jù)是一個(gè)典型的時(shí)間序列,一般可以按照月份、季度和年度來統(tǒng)計(jì)數(shù)據(jù),按照一籃子固定商品價(jià)格
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年房車托管與智能化管理系統(tǒng)集成合同3篇
- 二零二五版出租車企業(yè)車輛環(huán)保排放檢測合同3篇
- 2025沙子購銷合同范本
- 二零二五年度特種車輛采購合同種類與專用技術(shù)2篇
- 年度粘結(jié)稀土永磁材料市場分析及競爭策略分析報(bào)告
- 2025年消防工程驗(yàn)收及咨詢合同范本3篇
- 二零二五年版健康醫(yī)療服務(wù)履約保證金協(xié)議范本4篇
- 年度非接觸溫度計(jì)產(chǎn)業(yè)分析報(bào)告
- 二零二五版文化旅游公司股東責(zé)任免除與資源整合協(xié)議3篇
- 二零二五年度淋浴房浴室柜配套安裝合同4篇
- 保潔服務(wù)崗位檢查考核評分標(biāo)準(zhǔn)
- 稱量與天平培訓(xùn)試題及答案
- 超全的超濾與納濾概述、基本理論和應(yīng)用
- 2020年醫(yī)師定期考核試題與答案(公衛(wèi)專業(yè))
- 2022年中國育齡女性生殖健康研究報(bào)告
- 各種靜脈置管固定方法
- 消防報(bào)審驗(yàn)收程序及表格
- 教育金規(guī)劃ppt課件
- 呼吸機(jī)波形分析及臨床應(yīng)用
- 常用緊固件選用指南
- 私人借款協(xié)議書新編整理版示范文本
評論
0/150
提交評論