基于最小二乘支持向量機的余額寶收益率短期預測研究分析 計算機科學與技術專業(yè)_第1頁
基于最小二乘支持向量機的余額寶收益率短期預測研究分析 計算機科學與技術專業(yè)_第2頁
基于最小二乘支持向量機的余額寶收益率短期預測研究分析 計算機科學與技術專業(yè)_第3頁
基于最小二乘支持向量機的余額寶收益率短期預測研究分析 計算機科學與技術專業(yè)_第4頁
基于最小二乘支持向量機的余額寶收益率短期預測研究分析 計算機科學與技術專業(yè)_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目錄 摘要 1第1章 前言 4第1.1節(jié)研究的背景與意義 4第1.2節(jié)國內外研究現(xiàn)狀分析 5第1.2.1節(jié)余額寶宏觀研究現(xiàn)狀 5第1.2.2節(jié)余額寶微觀研究現(xiàn)狀 5第1.2.3節(jié)LS-SVM在金融時間序列預測領域的研究現(xiàn)狀 6第1.2.4節(jié)EEMD分解的研究現(xiàn)狀 6第1.3節(jié)本文研究框架 7第2章 模型介紹 8第2.1節(jié)LS-SVM的基本原理 8第2.2節(jié)基于LS-SVM的時間序列預測方法 10第2.3節(jié)EEMD的基本原理 11第2.4節(jié)EEMD的基本原理 12第3章 實證分析 13第3.1節(jié)數(shù)據(jù)的來源及處理 13第3.2節(jié)模型的建立 14第3.3節(jié)模型對比及結果分析 16第4章 結論與展望 18第4.1節(jié)結論分析 18第4.2節(jié)研究展望 18參考文獻 19致謝 22

摘要近年來,互聯(lián)網(wǎng)業(yè)與金融界的聯(lián)手及其快速發(fā)展極大地轉變了當代人的生活方式,開創(chuàng)了一個嶄新的時代。而這其中,由螞蟻金服攜手天弘基金于2013年共同推出的互聯(lián)網(wǎng)理財產品——余額寶無疑成為了最耀眼的一顆新星。余額寶借助互聯(lián)網(wǎng)這一龐大的勢力以其高收益、低門檻、高安全性等優(yōu)勢引來了社會各界的廣泛關注以及強烈反響。截至2017年第一季度末,余額寶的公募規(guī)模已突破萬億元,超越了一直以來駐守第一位的美國政府貨幣基金摩根集團(JPMorgan),躍升為全球最大的貨幣基金。余額寶為傳統(tǒng)金融領域的發(fā)展注入新鮮血液的同時,以它為代表的新興理財產品所可能帶來的流動性以及價格波動等風險也成為了社會的熱點問題之一。因此,余額寶收益率的預測研究具有重大的時代意義,它是中國金融行業(yè)在互聯(lián)網(wǎng)時代有序穩(wěn)健發(fā)展的必要條件。本文借助最小二乘支持向量機模型(LS-SVM)對余額寶的未來萬份收益進行短期預測。在此基礎上,本文還提出了一種基于集成經(jīng)驗模態(tài)分解的最小二乘支持向量機(EEMD-LSSVM)預測方法。該模型首先運用了集成經(jīng)驗模態(tài)分解(EEMD)將余額寶萬份收益時間序列分解成若干個具有不同特征尺度的本征模函數(shù)(IMF)以及剩余分量。其次,利用快速傅里葉變換(FFT)對每個分量進行平均周期的求解,并將各分量重組成高頻序列、低頻序列和趨勢序列。再針對這三個重組后的序列分別構建LS-SVM模型進行預測,將三組預測的結果進行加總從而得到EEMD-LSSVM的預測值。最后,將其與使用單一LS-SVM模型的余額寶收益預測值進行比較分析。結果表明,采用LS-SVM模型以及EEMD-LSSVM模型均能較好地反映其動態(tài)變化。從精確度角度來看,EEMD-LSSVM模型在部分月份的預測精度要明顯高于LS-SVM模型;從復雜性角度來看,直接采用LS-SVM更為高效。由此可見,最小二乘支持向量機對于余額寶收益率的回歸效果是十分可觀的,在金融時間序列預測領域具有良好的應用前景。余額寶收益率的短期預測研究對于余額寶自身、廣大的消費者投資者以及商業(yè)銀行均具有重要的參考價值。關鍵詞:余額寶;收益率;LS-SVM;EEMD-LSSVM;短期預測

AbstractInrecentyears,the"hand-in-hand"oftheInternetandthefinancialworldanditsrapiddevelopmenthavetransformedthewaymanypeopleconsumeandmanagetheirfinances,creatinganewera.Amongthese,theInternetwealthmanagementproductjointlylaunchedbyAntFinancialandTianhongFundin2013,YuEbao,hasundoubtedlybecomethebrighteststar.WiththehelpofthehugepoweroftheInternet,YuEbaoisshowingitselftotheworldwithitsadvantagesofhighyield,lowthreshold,andhighsecurity,whichhastriggeredwidespreadconcernandstrongrepercussionsfromthewholesociety.Bytheendofthefirstquarterof2017,thepublic-raisingscaleofYuEbaohasexceededtrillions,surpassingU.S.governmentcurrency,JPMorganandmakingittheworld’slargestcurrencyfund.WhileYuEbaohasinfusednewbloodforthedevelopmentofthetraditionalfinancialfield,therisksofliquidityandpricefluctuationsthatmayarisefromemergingfinancialproductsrepresentedbyithavealsobecomeoneofthehotissuesinthesociety.Therefore,theresearchontheforecastofYuEbao’syieldhasgreatsignificanceinthetimes,whichhelpsChina'sfinancialindustrytomaintainorderlyandrobustdevelopmentintheInternetage.ThispaperusestheLeastSquaresSupportVectorMachine(LS-SVM)modeltomakeashort-termpredictionofYuEbao’sfutureyield.Onthisbasis,thispaperalsoproposesaLeastSquaresSupportVectorMachinepredictionmethodbasedonEnsembleEmpiricalModeDecomposition(EEMD-LSSVM).ThismodelusestheEEMDtechniquetodecomposetheoriginalsequenceintoseveralcomponentsofdifferentfrequencies(includingseveralIntrinsicModeFunctionsandaresidualcomponent).AccordingtotheaverageperiodsolvedbyFastFourierTransform(FFT),weregroupeachcomponentintohigh-frequencysequence,low-frequencysequence,andtrendsequence,andthenconstructdifferentLS-SVMmodelsforthethreesequencestomakepredictions.Thepredictionvalues??ofeachsequencearesummedtoobtaintheEEMD-LSSVM’spredictionvalue.Finally,wecompareandanalyzetheresultsofthesetwomodels.TheresultsshowthatboththeLS-SVMmodelandtheEEMD-LSSVMmodelcanreflectYuEbao’sdynamicchanges.Fromtheaccuracyperspective,thepredictionaccuracyoftheEEMD-LSSVMmodelinsomemonthsissignificantlyhigherthanthatoftheLS-SVMmodel;fromthecomplexitypointofview,thedirectadoptionofLS-SVMismoreefficient.ItcanbeseenthattheleastsquaressupportvectormachinehasaconsiderableeffectontheregressioneffectofYuEbao.Ithasagoodapplicationprospectinthefieldoffinancialsequenceforecasting.Theshort-termforecastresearchofYuEbao'syieldratehasimportantreferencevalueforYuEbaoitself,themajorityofinvestors,andtheactionstrategiesofcommercialbanks.Keywords:YuEbao;yield;LS-SVM;EEMD-LSSVM;short-termforecast

前言第1.1節(jié)研究的背景與意義由螞蟻金服攜手天弘基金于2013年共同推出的互聯(lián)網(wǎng)理財創(chuàng)新產品——余額寶,以其高收益、低門檻、高安全性等優(yōu)勢橫空出世,而2013年也因此被普遍認為是中國“互聯(lián)網(wǎng)金融”的元年。余額寶借助互聯(lián)網(wǎng)這一龐大的勢力上線一年后,不僅讓國人養(yǎng)成了良好的理財意識和習慣,同時激發(fā)了金融行業(yè)的創(chuàng)新勢頭,有力地加快了利率市場化的腳步。當前互聯(lián)網(wǎng)金融行業(yè)的迅猛發(fā)展引來了社會各領域的高度關注,以余額寶為代表的互聯(lián)網(wǎng)理財產品如雨后春筍般發(fā)芽崛起,它們正悄無聲息地改變著傳統(tǒng)金融的模式,不斷地滲入各種消費場景,為用戶帶來了更多的便捷與無限的驚喜。余額寶的實質為天弘基金以公募方式籌資的一種貨幣基金——“增利寶”。通過支付寶的平臺,用戶只需將支付寶中的余額或者銀行卡中的金額轉入余額寶,每天便會根據(jù)當天的收益率產生相應的利息收益。這樣一個轉入資金并產生利息的過程,實質是購買天弘基金“增利寶”的過程。與此同時,用戶還可以隨時隨地不受任何限制地將余額寶中的空閑資金進行支出,非常地便捷。余額寶以電子商務的強流動性以及極簡的用戶體驗優(yōu)勢快速席卷全國,推出18天后便擁有了66億的公募規(guī)模,250多萬的用戶,當即成為了全國用戶量最大的貨幣基金。2014年1月底,其累計申購的貨幣基金的總量超過了2500億元,成為了我國規(guī)模最大的公募貨幣基金[1]。截至2017年第一季度末,余額寶的公募規(guī)模已突破萬億元,超越了掌管1500億美元的美國政府貨幣基金摩根大通(JPMorgan),躍升為全球最大的貨幣基金。在目前的公募基金年利潤排行榜中,天弘基金穩(wěn)居第一,其后還有易方達基金、嘉實基金、華夏基金、工銀瑞信基金等等。值得一提的是,雖然排名后幾位的基金年利潤均超過了80億元,但沒有一家超過130億元,而天弘基金以166.62億元位居榜首,由此可見余額寶的地位還遠遠無法撼動。然而,余額寶的誕生無疑是對傳統(tǒng)金融行業(yè)的一大沖擊,尤其是商業(yè)銀行。目前商業(yè)銀行最為主要的資金來源便是儲蓄存款,而活期存款更是重中之重。在流動性以及安全性方面,基于T+0運作模式的余額寶與其不相上下,然而在收益方面,余額寶卻比它高出了許多。這導致了大量的“存款搬家”,也使余額寶成為了商業(yè)銀行在資金來源方面的重要競爭對手。在余額寶如此強大的資金集聚力的帶動下,各大商業(yè)銀行也推出了一些與余額寶類似的“寶寶”理財產品與之抗衡,例如民生銀行的“如意寶”、中信銀行的“活期寶”、光大銀行的“定存寶”以及工商銀行的“天天益”等等。然而目前,市場對余額寶類互聯(lián)網(wǎng)金融產品所可能帶來的流動性以及價格波動等風險議論紛紛,更有專家指出余額寶是寄生在商業(yè)銀行身上的“寄生蟲”,以銀行拆借利率坐收漁利,不僅干擾了銀行的資金流動性,而且抬高了實業(yè)企業(yè)的融資門檻,從而進一步加大了實業(yè)與金融行業(yè)之間的縫隙。自2017年下半年以來,天弘基金已對余額寶進行了4次規(guī)模調整。為了維護貨幣市場的穩(wěn)健運行,2018年2月更是采取了每日限額的措施。因此,本文選擇對余額寶的未來收益率進行短期預測研究,為余額寶自身、廣大的消費者投資者、商業(yè)銀行以及監(jiān)管機構提了供重要的參考價值的同時,在當下的時間節(jié)點,具有深遠的歷史價值。第1.2節(jié)國內外研究現(xiàn)狀分析第1.2.1節(jié)余額寶宏觀研究現(xiàn)狀自余額寶誕生以來,不同專家學者從不同的角度對余額寶進行了較為深入的研究,可以歸納為以下三個方面:一是針對余額寶的創(chuàng)新優(yōu)勢。劉暉、王秀蘭分析了基于T+0運作模式的余額寶以支付寶作為資源平臺從而得到的巨大發(fā)展空間以及“雙高”的產品定位兩方面的創(chuàng)新特點[2]。邱冬陽、肖瑤則運用了經(jīng)濟學基本理論從不同角度剖析了以余額寶為代表的互聯(lián)網(wǎng)理財類產品獲得高收益的原因[3]。二是針對余額寶對商業(yè)銀行、監(jiān)管機構等行業(yè)所產生的影響與啟示。邱勛探討了余額寶在金融市場地位、銀行活期存款、短期理財產品和基金代銷業(yè)務這四個方面對商業(yè)銀行所造成的影響[4]。喬海曙、李穎對余額寶、銀行、監(jiān)管機構所構成的博弈關系進行分析,闡明了余額寶加快利率市場化的鲇魚效應[5]。三是針對余額寶的市場風險及其管理。李軍訓、齊丹基于我國特有的宏觀金融環(huán)境,總結出余額寶所面臨的流動性、收益性、競爭性等六大風險,并提出了相應的管理對策[6]。盧麗琴以余額寶為例闡述了互聯(lián)網(wǎng)金融經(jīng)營與投資的風險,并對消費者及余額寶自身提出了合理的意見[7]。第1.2.2節(jié)余額寶微觀研究現(xiàn)狀國內學者對余額寶的研究多側重于宏觀層面,微觀層面的理論和實證研究相對較少,而如今更為精準的定量分析已成為一種必然要求。具有代表性的有劉書真等學者利用自回歸滑動平均模型(AutoRegressiveMoving-Average,ARMA)對余額寶的未來收益進行了預測[8]。白潔、林禮連結合經(jīng)驗模態(tài)分解(EmpiricalModeDecomposition,EMD)運用了更適合非平穩(wěn)時間序列的廣義自回歸條件異方差模型(GeneralizedAutoRegressiveConditionalHeteroskedasticity,GARCH)對余額寶的收益率進行了短期預測[9]。何建敏、白潔通過構造集成經(jīng)驗模態(tài)分解向量自回歸模型(EnsembleEmpiricalModeDecomposition-Vectorautoregression,EEMD-VAR)對余額寶收益率的影響因素進行了實證研究,并得出了余額寶收益率與其影響因素之間所構成的穩(wěn)定關系[10]。然而這些文章對余額寶的定量分析僅使用較為傳統(tǒng)的統(tǒng)計學研究方法,且提出時間較早,余額寶的數(shù)據(jù)還不夠完善,實證研究還不夠全面。因此,在余額寶收益率預測方面,引入訓練精度高且速度快的最小二乘支持向量機模型對余額寶從2013年至2017年的收益率數(shù)據(jù)進行訓練預測是十分有必要的。第1.2.3節(jié)LS-SVM在金融時間序列預測領域的研究現(xiàn)狀最小二乘支持向量機(LeastSquareSupportVectorMachine,LS-SVM)[11]是Sykens和Vandewalle提出的支持向量機(SupportVectorMachine,SVM)[12]的一種改進算法,具有學習能力強、效率高、精度高、模型簡單等優(yōu)點。LS-SVM最先就被Suykens應用于金融時間序列的預測[13],之后在金融分析預測領域中又得到了進一步的推廣和應用。鄭曉薇等學者基于LSSVM算法,提出了一種結合GPU并行計算的股票預測模型[14]。王國俊則提出了一種基于粒子群算法參數(shù)優(yōu)化的LSSVM模型,對股價時間序列進行了預測與分析[15]??偨Y前人運用LS-SVM在金融時間序列預測領域的研究成果,與傳統(tǒng)統(tǒng)計學、人工神經(jīng)網(wǎng)絡等方法相比,LS-SVM擁有著較高的預測精度與預測效率。第1.2.4節(jié)EEMD分解的研究現(xiàn)狀借助何建敏、白潔(2015)[10]通過EEMD分解趨勢來探討余額寶影響因素的思想,本文還提出了EEMD-LSSVM模型。集成經(jīng)驗模態(tài)分解(EnsembleEmpiricalModeDecomposition,EEMD)[16]是在經(jīng)驗模態(tài)分解(EmpiricalModeDecomposition,EMD)[17]基礎上的一種改進。經(jīng)驗模態(tài)分解最初被用于研究海水的動態(tài)變化,而后又在天文學、醫(yī)學、通訊工程、地震測量等領域得到了廣泛的應用。Huang等人于2003年首次將經(jīng)驗模態(tài)分解方法引入到金融時間序列的分析當中,并指出了經(jīng)驗模態(tài)分解的高自適性[18]。其后,越來越多的學者將其應用于金融分析領域,從而得到了進一步的推廣。劉海飛、李心丹利用EMD降噪提出了一種較精準的金融市場時間序列的預測方法[19]。蔡赟姝、盧志明利用EMD對上證綜合指數(shù)(Shanghaicompositeindex,SCI)進行研究,通過對各階IMF函數(shù)的統(tǒng)計分析以及分布擬合,發(fā)現(xiàn)其"尖峰寬谷"特點的實質是自由度為3的t分布[20]。由于EEMD有效地改善了EMD模態(tài)混淆的缺陷,EEMD方法有著更為廣泛的應用。朱莉、高鵬使用EEMD對股指期現(xiàn)貨的高頻時間序列進行正交分解,隨后將降噪后的數(shù)據(jù)應用于GARCH模型和CCF檢驗,實證結果表明我國滬深300股指期貨合約和股票市場之間呈現(xiàn)出較強的波動溢出效應[21]。邵明振對我國物價指數(shù)使用了EEMD分解技術并結合實際影響因素對其中長期走勢進行了進一步的預測[22]。因此,本文將EEMD分解和LS-SVM方法結合起來,聯(lián)系余額寶各分量趨勢的實際影響因素,以求更精準地對余額寶的未來收益率進行預測。第1.3節(jié)本文研究框架本文將借助LS-SVM模型以及EEMD-LSSVM模型分別對余額寶的萬份收益時間序列進行短期預測,并根據(jù)預測結果的對比進行分析研究。根據(jù)總體研究內容,本文的結構安排如下:第1章,介紹本次主題的研究背景和研究意義,并對國內外的研究現(xiàn)狀分宏觀和微觀等研究層面進行分析,對相關的文獻進行總結和梳理,進而對文章的研究框架進行了說明。第2章,主要對LS-SVM以及EEMD-LSSVM兩種時間序列預測方法的原理進行簡單的介紹,并提出了這兩個模型的對比分析研究方法。其中,LS-SVM的時間序列預測方法可以簡單分為四個步驟:構造輸入向量、確定模型參數(shù)、模型訓練以及預測新序。而EEMD-LSSVM模型則在此基礎上運用了EEMD分解技術將原始時間序列分解成若干個具有不同特征尺度的本征模函數(shù)及一個剩余分量,并根據(jù)快速傅里葉變換(FFT)所求得的平均周期將各分量重組成高頻序列、低頻序列和趨勢序列,再針對這三個重組后的序列構建不同的LS-SVM模型分別進行預測,將各序列的預測值進行加總從而得到EEMD-LSSVM的預測值。最后,將其與使用單一LS-SVM模型的預測值進行比較分析。具體內容將在該章節(jié)中給出詳細的描述。第3章,給出余額寶萬份收益時間序列的實證研究,通過在第2章中介紹的兩個模型及其對比研究方法,得出精度和效率方面的結論。結果表明,采用LS-SVM模型以及EEMD-LSSVM模型均能較好地反映其動態(tài)變化。從精確度角度來看,EEMD-LSSVM模型在部分月份的預測精度要明顯高于LS-SVM模型;從復雜性角度來看,直接采用LS-SVM更為高效。第4章,針對此次的研究進行總結和展望。在第3章實證研究的基礎上,分析兩個模型各自的優(yōu)缺點以及對實際背景的參考價值,總結本文預測方法可能存在的改進之處以及對余額寶在未來可以進一步深入探討的問題上進行展望。模型介紹第2.1節(jié)LS-SVM的基本原理LS-SVM是基于SVM的一種改進算法。它是一種按照結構風險最小化準則的機器學習算法。它的目標函數(shù)采用了誤差的平方項,并利用正則化參數(shù)來調節(jié)其懲罰力度。改用等式作為約束條件,即將所有的訓練樣本均視為支持向量,將誤差e也視為需被優(yōu)化的變量,使最終的優(yōu)化問題轉化為在KKT(Karush-Kuhn-Tucker)條件下求解N維線性方程組的問題,從而大大降低了計算的復雜度,提高了訓練的效率。相比SVM,LS-SVM更適合求解大規(guī)模問題。因此,對于擁有龐大數(shù)據(jù)量的時間序列是十分適用的。與SVM相同,LS-SVM也有分類和回歸兩種用法。在這里,我們使用LS-SVM的回歸模型,即使用一個超平面對已知數(shù)據(jù)進行擬合。LS-SVM的回歸問題可描述如下:假設訓練樣本集為:S其中,xk是第k個輸入向量,yk是與之對應的輸出值,m為樣本容量。它的線性回歸函數(shù)為fx=wTφx+ 該回歸問題對應的優(yōu)化問題可以描述為:mins與分類不同的是,這里的yk不再是類別的標簽,而是函數(shù)的實際值。ek為第k個估計值與實際值之間的差,γ根據(jù)優(yōu)化函數(shù)式,采用Lagrange乘數(shù)法定義與其對偶的Lagrange函數(shù):L其中,Lagrange乘子αk分別對w,b,ek,α?L其中,k=1,2,...,上述求鞍點方程組可以轉化為如下矩陣方程的形式:0式中,1=[1,1,...,1]T;Ω為核函數(shù)矩陣,且Ωkl=φxkTφxl=Kxk,xl,k由于核函數(shù)矩陣具有對稱正定性,令A=Ω+γ-1b將該b和α代回原函數(shù)即可得到LS-SVM預測函數(shù):f第2.2節(jié)基于LS-SVM的時間序列預測方法基于LS-SVM模型對時間序列進行預測主要分為四個步驟:構造輸入向量、確定模型參數(shù)、模型訓練、預測新序列。流程如下圖1所示。圖1LS-SVM預測流程圖(1)構造輸入向量由于時間序列是一組一維的觀測值,直接對其進行單步預測的結果是極其不穩(wěn)定且不準確的,需要對其進行相空間重構從而充分地使用歷史數(shù)據(jù)來增加數(shù)據(jù)的可靠性。首先對數(shù)據(jù)進行歸一化處理。在此基礎上,我們需要針對余額寶的特性選擇合適的方法確定相空間重構的延遲時間τ和嵌入維數(shù)d,構造輸入向量和輸出向量對。輸入向量即可表示為:X(2)確定模型參數(shù)LS-SVM模型的參數(shù)包括核函數(shù)參數(shù)以及正則化參數(shù)γ.對于非線性回歸,RBF徑向基核函數(shù)是最為常用的。因此我們需要確定的參數(shù)有正則化參數(shù)γ以及徑向基函數(shù)的寬度σ.目前已有許多學者研究了LS-SVM模型的最優(yōu)參數(shù)的確定方法,其中最常用的有搜索盲目計算的多級多級網(wǎng)格搜索(GridSearching,GS)方法[23],遺傳算法(GeneticAlgorithm,GA)[24]以及粒子群算法(ParticleSwarmOptimization,PSO)[25]等等。綜合效率與精度的需求選擇適當?shù)姆椒▽?yōu)是十分有必要的。(3)模型訓練在完成型參數(shù)的優(yōu)化后,我們按照在本章第1節(jié)中介紹的原理訓練LS-SVM回歸模型。計算Lagrange乘子α以及偏移值b,按照公式(8)實現(xiàn)最終的預測函數(shù)f((4)預測新序列將需進行預測的序列的前d個已知數(shù)據(jù)代入由模型訓練得到的預測函數(shù)f(第2.3節(jié)EEMD的基本原理集成經(jīng)驗模態(tài)分解(EnsembleEmpiricalModeDecomposition,EEMD)[16]是在經(jīng)驗模態(tài)分解(EmpiricalModeDecomposition,EMD)[17]基礎上的一種改進。它是Wu和Huang提出的一種自適應的高效時間序列分析方法。它的任何一個具有特征尺度的本征模函數(shù)(IntrinsicModeFunction,IMF)子序列均攜帶各自的信號以及擁有一定振幅的白噪聲序列,從而有效地改善了EMD模式混淆的缺陷,使降噪結果更為精準。它的原理可以被簡單地描述為:將隨機產生的白噪聲加入到原始序列中,它在時間頻率的范圍內服從均勻分布。這樣可以改變原序列中極值點的性質,使其在不同的尺度上具有連續(xù)性,從而避免了模態(tài)混淆。顯然,隨機產生的白噪聲在不同的試驗中是不一樣的,而我們可以取每次試驗的平均值從而消除因白噪聲的加入所帶來的影響。EEMD分解逐步產生一系列具有不同特征尺度的子序列,且它們分別代表著不同的影響因素所引起的因變量的變化。其具體操作步驟如下:(1)將隨機產生的白噪聲序列加入原始序列x(t)x其中,xi(t)為加入i次白噪聲之后的序列,wi(t)(2)對得到的時間序列分別進行EMD分解[17],得到各自的IMF子序列imfij(t)與剩余分量ri(t),其中imfij(t)為第(3)加入不同的白噪聲序列,重復上述兩步驟;(4)對上述不同分解中對應的IMF子序列進行均值計算,得出最終的IMF子序列。通常,增加白噪聲的過程可以由下式進行控制:ε其中,N為集成數(shù)量,ε為附加的白噪聲的標準差。由文獻[26]可知在一般情況下,我們可將集成數(shù)量N設置為100,標準差ε設置為0.2.第2.4節(jié)EEMD的基本原理通過LS-SVM模型與EEMD-LSSVM模型的對比,分析兩個模型在精度以及效率方面的優(yōu)勢與劣勢,從而更好地結合實際情況利用不同的模型對余額寶的收益率進行預測。對于EEMD-LSSVM模型,我們首先將原始數(shù)據(jù)進行集成經(jīng)驗模態(tài)分解,并通過快速傅里葉變換(FastFourierTransformation,F(xiàn)FT)求解分解得到的若干IMF子序列和剩余序列的平均周期,再根據(jù)求得的平均周期重新組合為高頻分量、低頻分量和趨勢分量,對組合后的子序列分別進行LS-SVM預測,最后對各分量的預測結果進行加總,從而得到EEMD-LSSVM模型的預測結果。通過兩個模型的分別預測,得到兩組預測的新序列之后,我們需要對其精度進行評價,分析兩組預測結果偏離實際值的大小。常用的精度評價函數(shù)有均方根誤差(RMSError,RMSE)、平均絕對誤差MAE(MainAbsoluteError,MAE)等等。在這里,我們使用均方根誤差,其定義如下:設yk為預測值,yk為實際值,其中k=1,2,…,m,RMSE=整個對比研究的具體流程如下圖2所示:圖2對比流程圖實證分析第3.1節(jié)數(shù)據(jù)的來源及處理本文選取余額寶的每日萬份收益作為收益率的衡量指標。所謂萬份收益,就是指把貨幣基金每天投資運作得到的收益平均分攤到每一份額上(1元),然后以1萬份為單位進行衡量的一個數(shù)據(jù)。本文所截取的萬份收益數(shù)據(jù)的時間跨度為2013年7月1日至2017年6月30日,共1461個樣本,數(shù)據(jù)來源于天弘基金官方網(wǎng)站,其走勢入下圖3所示。本文使用MATLABR2014b處理時間序列數(shù)據(jù)。圖3余額寶收益率趨勢圖為了使得到的預測結果更為可靠,我們分別對2016.7月至2017.6月期間每月第一周的數(shù)據(jù)進行了預測以及精度分析。每月第一周預測所需的訓練集從2013.7.1開始取至上月末,共計12組訓練集,從而提高了預測的準確性以及可靠性。第3.2節(jié)模型的建立按照在2.4節(jié)介紹的模型對比研究的方法,我們對該收益率的時間序列分別進行LS-SVM以及EEMD-LSSVM的預測。(1)LS-SVM模型首先,我們對余額寶收益率時間序列進行相空間重構。由余額寶7日年化收益的先驗知識,我們可以設置嵌入維數(shù)d為7。一維時間序列的延遲時間在通常情況下設置為1,因此我們構造如下形式的輸入向量:X其中,k=1,2,...,m.其次,我們對正則化參數(shù)γ以及RBF徑向基核函數(shù)參數(shù)σ進行參數(shù)尋優(yōu)?;诙嗉壘W(wǎng)格搜索的參數(shù)優(yōu)化方法是一種基于遍歷的尋優(yōu)方法,通過對可能的γ和σ所構成的二維平面進行網(wǎng)格劃分,進而計算出每一個交叉點訓練的LS-SVM模型的預測性能,選擇性能最好的點所對應的參數(shù)值作為最優(yōu)參數(shù)。這種方法雖然具有較大的盲目性,但在對效率要求不太高的前提下,使用該方法所得到的參數(shù)精度是最高的。因此我們采用網(wǎng)格搜索方法對余額寶的模型進行參數(shù)尋優(yōu)。完成相空間重構以及模型參數(shù)的優(yōu)化之后,我們對12組訓練集分別進行訓練,并通過訓練后的模型得到相應的預測結果。(2)EEMD-LSSVM模型首先,我們對余額寶收益率序列進行EEMD分解,可得到若干個不同頻率的IMF子序列以及一個剩余分量,如下圖4所示。圖4EEMD分解后各分量趨勢圖通過快速傅里葉變換求解每個分量的平均周期(見下表1),根據(jù)所求周期將各分量重組成高頻、低頻和趨勢分量。由何建敏、白潔所提出的余額寶影響因素的分析中,我們可以知道它們分別代表著市場波動價格、重大事件價格和趨勢價格[10],因此對這三個序列分別進行預測是十分有價值的。表1各分量的平均周期分量IMF1IMF2IMF3IMF4IMF5平均周期(日)3.506.9914.4739.49121.75(續(xù))分量IMF6IMF7IMF8IMF9R平均周期(日)365.25365.25146114611461由表1我們可以看出,IMF1-IMF5對應的周期較短,且均短于6個月,我們可以將之歸為高頻分量;同理我們看到IMF6、IMF7對應的周期均為1年,我們可將之歸為低頻分量;剩下的IMF8-IMF9及R表現(xiàn)為無明顯的周期性,我們將之歸為趨勢分量。對于重新組合得到的三個分量序列,我們重復本節(jié)第(1)點中的做法,對12組訓練集樣本分別進行預測。最后將三個分量的預測結果進行加總,我們就得到了EEMD-LSSVM最終的預測結果。第3.3節(jié)模型對比及結果分析通過MATLABR2014b對余額寶收益率時間序列進行處理,我們得到了12組訓練集在兩種模型下的預測結果。以2016年10月第一周的數(shù)據(jù)為例,我們得到的預測結果與真實值的對比如下圖5所示。圖52016.10兩種模型預測結果對比圖我們求得2016年10月第一周實際萬份收益的均值為0.6347.進而,我們對LS-SVM及EEMD-LSSVM的預測結果分別進行均值及其相對誤差的計算,結果如下表2所示。表22016.10預測結果的均值與相對誤差均值相對誤差LS-SVM0.63630.25%EEMD-LSSVM0.6355-0.13%由表2中的相對誤差我們可以得到,兩組模型的預測結果均較為理想。我們將12組訓練集分別標記為1,2,...,12.引入評價函數(shù)RMSE,我們得到各組預測結果的精度如下表3所示。表3兩種模型預測結果的RMSE組別123456LS-SVM0.00790.00490.01330.00330.00420.0134EEMD-LSSVM0.00710.00440.01320.00350.00550.0133(續(xù))組別789101112LS-SVM0.01860.00670.00440.00590.00280.0106EEMD-LSSVM0.00830.00660.01160.00480.00340.0062從評價函數(shù)的值我們可以看出,兩個模型的精確度均較高,且相差不大。因此,我們可以得出,在一定時間范圍內,LS-SVM模型與EEMD-LSSVM模型均能較好地反映余額寶收益率的動態(tài)變化。進而,我們繼續(xù)對兩組評價函數(shù)的值做均值及標準差的分析。我們得到的結果如下表所示:表4兩組RMSE的均值與標準差均值標準差LS-SVM0.00804.1045E-04EEMD-LSSVM0.00732.9722E-04由表4,我們可以看到EEMD-LSSVM模型的均值及標準差均小于LS-SVM模型。由此,我們可以得出EEMD-LSSVM模型在部分月份的預測值精度要明顯高于LS-SVM模型的預測值精度,且EEMD-LSSVM的預測值更為穩(wěn)定。然而從復雜性角度考慮,由于EEMD-LSSVM模型需先對原始時間序列進行EEMD分解,且分解之后需進行FFT變換求解各分量的平均周期來求解,從而消耗了大量的時間復雜度。因此,從復雜性角度出發(fā),在保證精度的條件下,LS-SVM模型更為直接、簡便。結論與展望第4.1節(jié)結論分析本文借助LS-SVM模型和EEMD-LSSVM模型分別對余額寶的萬份收益時間序列進行建模分析。結果表明,采用LS-SVM模型以及EEMD-LSSVM模型均能較好地反映其動態(tài)變化。從精確度角度來看,EEMD-LSSVM模型在部分月份的預測精度要明顯高于LS-SVM模型;從復雜性角度來看,直接采用LS-SVM更為高效。由此可見最小二乘支持向量機對于余額寶收益率的回歸效果是十分可觀的,在金融時間序列預測領域具有良好的應用前景。第4.2節(jié)研究展望雖然LS-SVM模型以及EEMD-LSSVM預測算法已經(jīng)取得了較好的預測精度和較高的預測效率,但仍存在一定的缺陷,下面給出文章的幾處需進一步改進和提升的方面:(1)余額寶的突發(fā)事件特別需要指出的是,針對突發(fā)事件所帶來的余額寶收益率變動不在該模型的適用范圍之內。所謂突發(fā)事件,即例如貨幣政策的調整,余額寶規(guī)模的變動,以及“錢荒”事件等等。自2017年下半年以來,天弘基金已對余額寶進行了4次規(guī)模調整。為了維護貨幣市場的穩(wěn)健運行,2018年2月更是采取了每日限額的措施。因此在本文中我們只以2017年6月作為節(jié)點對數(shù)據(jù)進行了分析處理。對該類事件的預測,有待模型進一步的優(yōu)化。(2)LS-SVM的多步預測分析本文是基于LS-SVM的單步預測方法對余額寶的收益率時間序列進行短期預測的。在單步預測方法中,隨著步數(shù)的增加,輸入向量中的預測值會逐漸增多,使得新的預測值愈發(fā)的不穩(wěn)定。然而多步預測方法能較好地改進這一缺陷,我們可以根據(jù)自相關系分析方法確定多步預測方法中輸入向量的各元素位置,做到每一個輸入的元素都為已知的歷史數(shù)據(jù),從而大大提高了預測的穩(wěn)定性以及可靠性。由于相關系數(shù)的閾值取值方法沒有確切的指導原則,因此我們需要做進一步的分析和探討。參考文獻王崇志.“余額寶”的經(jīng)濟學思考[J].經(jīng)濟研究導刊,2013,16(32):12-13.劉暉,王秀蘭.基于T+0模式的互聯(lián)網(wǎng)金融產品研究——以余額寶為例[J].生產力研究,2014,(2):55-57.邱冬陽,肖瑤.余額寶高收益來源渠道研究[J].新金融,2014,(7):47-51.邱勛.余額寶對商業(yè)銀行的影響和啟示[J].新金融,2013,(9):50-54.喬海曙,李穎.余額寶的鲇魚效應、存款利率市場化及其應對[J].當代財經(jīng),2014,(8):41-49.李軍訓,齊丹.“余額寶”創(chuàng)新模式的風險及其防范策略[J].財會月刊,2014,(18):53-55.盧麗琴.互聯(lián)網(wǎng)金融投資的風險與防范措施——以余額寶為例[J].中小企業(yè)管理與科技,2017,(7):70-71.劉書真,封惠子,袁錚.基于ARMA模型對余額寶未來收益的預測[J].時代金融,2014,(4):17-18.白潔,林禮連.基于EMD—GARCH的余額寶收益率預測研究[J].管理現(xiàn)代化,2014,(6):117-119.何建敏,白潔.基于EMD—VAR的余額寶收益率影響因素研究[J].金融研究,2015,(8):8-10.SuykensJ,VandewalleJ.Leastsquaresupportvectormachineclassifiers[J].NeuralProcessingLetters,1999,9(3),293-300.VapnicVN.Thenatureofstatisticallearningtheory[M].NewYork:Springer-Verlag,1995.TonyVanGestel,JohanA.K.Suykens,Dirk-EmmaBaestaens,AnnemieLambrechts,GertLanckriet,BrunoVandaele,BartDeMoor,JoosVandewalle.FinancialTimeSeriesPredictiionUsingLeastSquaresSupportVectorMachinesWithintheEvidenceFramework[J].IEEETRANSACTIONSONNEURALNETWORKS,2001,12(4),809-821.鄭曉薇,侯立斐,于夢玲.GPU并行計算在LSSVM股票預測上的研究與應用[J].計算機應用與軟件,2013,(1):34-36.王國?。赑SO優(yōu)化LSSVM的股價時間序列預測[J].科技和產業(yè),2017,(10):132-137.WuZ.,N.EHuang.EnsembleEmpiricalModeDecomposition:anoise-assisteddataanalysismethod.AdvancesinAdaptiveDataAnalysis,2009,(1),1-41.HuangN.E.,ShenZ.andLongS.R..TheEmpiricalModeDecompositionandtheHilbertSpectrumorNonlinearandNon-stationa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論