金融產(chǎn)品深度:基于時序神經(jīng)網(wǎng)絡(luò)的選股模型初探_第1頁
金融產(chǎn)品深度:基于時序神經(jīng)網(wǎng)絡(luò)的選股模型初探_第2頁
金融產(chǎn)品深度:基于時序神經(jīng)網(wǎng)絡(luò)的選股模型初探_第3頁
金融產(chǎn)品深度:基于時序神經(jīng)網(wǎng)絡(luò)的選股模型初探_第4頁
金融產(chǎn)品深度:基于時序神經(jīng)網(wǎng)絡(luò)的選股模型初探_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本報告由中信建投證券股份有限公司在中華人民共和國(僅為本報告目的,不包括香港、澳門、臺灣)提供。在遵守適用的法律法規(guī)情況2022/7/42022/8/42022/9/42022/10/42022/11/42022/12/42023/1/42023/2/42023/3/42023/4/42023/5/42023/6/4證券研究報告·金融產(chǎn)品深度基于時序神經(jīng)網(wǎng)絡(luò)的選股模型初探核心觀點探討多種時序模型,將時序處理模塊拓寬為三大類、將時序模型結(jié)構(gòu)拓寬為九種。根據(jù)測試結(jié)果,單模型中TCN2022/7/42022/8/42022/9/42022/10/42022/11/42022/12/42023/1/42023/2/42023/3/42023/4/42023/5/42023/6/4證券研究報告·金融產(chǎn)品深度基于時序神經(jīng)網(wǎng)絡(luò)的選股模型初探核心觀點探討多種時序模型,將時序處理模塊拓寬為三大類、將時序模型結(jié)構(gòu)拓寬為九種。根據(jù)測試結(jié)果,單模型中TCN表現(xiàn)較優(yōu),均值因子IC可達11.31%,無明顯弱勢年份;模型間相關(guān)性隨結(jié)構(gòu)差異度而有相對高低;多模型簡單結(jié)合后,績效全面提升、分年表現(xiàn)更穩(wěn)定;基于多模型的中證1000增強組合年化超額達到18.6%、信息比率2.63。時序處理模塊對于時序數(shù)據(jù),常用處理模塊包括RNN、CNN和Attention。三于捕捉短期局部依賴關(guān)系;Attention可為時間或變量加權(quán)。時序模型結(jié)構(gòu)選擇9類結(jié)構(gòu)各異的時序模型,包含GRU、AGRU、TPA、GAT、LSTNet、TCN、TCAN、XCM和Transformer。其中,AGRU模型增加時序注意力層;TPA模型側(cè)重識別關(guān)鍵變量的時序模式;LSTNet模型包含短期信息、長期信息、周期信息、線性穩(wěn)健預(yù)測的多種學(xué)習(xí)途徑;GAT模型增加圖注意力層;XCM模型僅用CNN模塊實現(xiàn)低復(fù)雜度和高可解釋性的結(jié)構(gòu);TCN模型構(gòu)建適用于時序建模的卷積模塊;TCAN模型在TCN的基礎(chǔ)上納入注意力機制;Transformer模型以注意力機制為核心進行時序建模。單模型測試從單模型整體績效來看:1)TCN模型IC績效最優(yōu),均值因子IC達到11.31%,隨機種子間最大差異僅為0.26%;2)Transformer模型IC績效偏弱,均值因子IC8.66%,隨機種子間最大差異可達1.73%。從單模型分年績效來看:1)隨模型更新,模型間的相對表現(xiàn)出現(xiàn)輪轉(zhuǎn);2)GRU、AGRU、TPA、TCN在過往年份表現(xiàn)頗為強勢,其中TCN模型無明顯弱勢年份;3)XCM、Transformer在過往年份表現(xiàn)較弱勢,但今年表現(xiàn)偏強勢。多模型測試從模型間相關(guān)性來看:1)GRU、AGRU、TPA因結(jié)構(gòu)相似性而高度相關(guān);2)XCM、TF因模塊差異性而與其它模型偏低相關(guān)。從模型間兩兩結(jié)合來看:1)強強結(jié)合利于提升當(dāng)收IC績效;2)強弱結(jié)合可提升次均IC績效。從多模型等權(quán)結(jié)合的效果來看:1)相較于單模型,IC績效全面提升,分年表現(xiàn)更平滑、無弱勢年份;2)中證1000內(nèi)分組的多頭年化超額可達29.5%;3)中證1000增強組合的年化超額收益可達18.6%、信息比率2.63。風(fēng)險提示:本文所有模型結(jié)果均來自歷史數(shù)據(jù),不保證模型未來的有效性陳升銳陳升銳chenshengruiAC編號:S1440519040002王西之wangxizhi8109SAC編號:S1440522070003發(fā)布日期:2023年12月08日市場表現(xiàn)0%-5%-10%-15% 國債指數(shù)上證指數(shù)相關(guān)研究報告【中信建投金融產(chǎn)品】:基于循環(huán)神【中信建投金融產(chǎn)品】:基于循環(huán)神金融產(chǎn)品研究金融產(chǎn)品研究1 3 3 3 4 4 4 5 5 6 6 7 8 8 9 9 3 4 4 5 5 6 7 7 8 8 9 9 2 金融產(chǎn)品研究金融產(chǎn)品研究3一、前言本篇報告作為前兩篇專題(《基于循環(huán)神經(jīng)網(wǎng)絡(luò)的選股模型初探》與《基于循環(huán)神經(jīng)網(wǎng)絡(luò)的選股模型改進》)的拓展,對時序模型結(jié)構(gòu)做進一步探討。將時序處理模塊由RNN拓展為RNN、CNN和Attention三大類,將時序模型結(jié)構(gòu)由簡單GRU拓展為GRU、AGRU、TPA、GAT、LSTNet、TCN、TCAN、XCM和Transformer九種,從模型結(jié)構(gòu)介紹、到模型間互相關(guān)聯(lián)、再到多模型結(jié)合,對時序神經(jīng)網(wǎng)絡(luò)的選股應(yīng)用做了初步探究。根據(jù)測試結(jié)果得到以下初步結(jié)論:1)單模型測試下,TPA和TCN表現(xiàn)較突出;2)模型間的預(yù)測相關(guān)程度與模型結(jié)構(gòu)的相似性有密切關(guān)聯(lián);3)相較于單模型結(jié)果,多模型整合后的績效表現(xiàn)有全面提升、分年表現(xiàn)更為穩(wěn)定;4)基于多模型構(gòu)建中證1000指數(shù)增強組合,年化超額收益可達18.6%、信息比率為2.63。時序模型通常會考慮多維時序數(shù)據(jù),如圖表1所示,包含三個維度:樣本、變量和時間步。數(shù)據(jù)維度對模型結(jié)構(gòu)設(shè)計頗為重要,可以從三個維度內(nèi)部或三個維度之間提取豐富的特征信息。以基礎(chǔ)模塊而言,譬如RNN可以識別時間模式信息、Attention可以識別關(guān)鍵變量信息、CNN可以識別時間步與變量的聯(lián)合信息、GNN可以識別樣本間關(guān)聯(lián)信息。在特征輸入環(huán)節(jié),選擇8個日度行情特征作為特征集,包括:開盤價、收盤價、最高價、最低價、均價、成交額、成交量和市值。而后進行統(tǒng)一處理操作,涉及:1)序列截取,截取30日序列長度;2)時序變換,可以去除量綱并保留時序信息;3)截面變換,將所有特征縮放到同一尺度以便模型訓(xùn)練;4)缺失填補,對低缺失率的序列樣本做填補。資料來源:Spadonetal.(2021),中信建投金融產(chǎn)品研究金融產(chǎn)品研究4對于時序數(shù)據(jù),常用的處理模塊包括RNN、CNN和Attention。如圖表2所示,三者的作用各不相同:RNN擅于捕捉長期宏觀依賴關(guān)系;CNN擅于捕捉短期局部依賴關(guān)系;Attention可為時間或變量加權(quán)。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)專用于序列數(shù)據(jù)建模,利用其內(nèi)部循環(huán)結(jié)構(gòu)捕捉序列前后的依賴關(guān)系。常用的RNN模型包括長短期存儲器(LSTM)、門控循環(huán)單元(GRU)等,可改善長期依賴效應(yīng)。卷積神經(jīng)網(wǎng)絡(luò)(CNN)常用于圖像數(shù)據(jù)建模,通過局部感受野捕捉空間依賴關(guān)系。為了將CNN應(yīng)用于序列數(shù)據(jù),可以使用因果卷積(CasualConvolution)即僅考慮序列的歷史信息進行預(yù)測,同時為了削弱感受野的局限性,可以使用膨脹卷積(DilatedConvolution)納入更早的歷史信息。注意力機制(AttentionMechanism)適用于多種場景,使用加權(quán)操作捕捉關(guān)鍵信息。對于序列數(shù)據(jù)而言,可以直接聚焦于長歷史窗口內(nèi)的關(guān)鍵時間步。資料來源:Limetal.(2021),中信建投隨著研究的深入,通常會采用多種模塊的組合來搭建模型。如圖表4所示,我們列舉了9類常見的時序預(yù)測模型,分別使用了不同的模塊或不同的搭建方法。其中,相對基礎(chǔ)的模型結(jié)構(gòu)為GRU模型,也是前兩篇報告中使用的核心結(jié)構(gòu),原始數(shù)據(jù)經(jīng)過GRU提取特征,再輸入到MLP用于特征決策,最終輸出預(yù)測結(jié)果。以模塊的豐富度而言,GRU、Transformer、TCN、XCM均使用單一類型模塊,AGRU、LSTNet、TCAN使用兩種類型模塊,GAT、TPA則使用了三種類型模塊。以模塊的種類而言,GRU、AGRU、LSTNet、GAT、TPA均使用RNN模塊,LSTNet、TCN、TPA、TCAN、XCM均使用CNN模塊,AGRU、Transformer、GAT、TPA、TCAN均使用Attention模塊,此外GAT還涉及GNN模塊。以模型的復(fù)雜度而言,參考后文各模型的超參設(shè)定,計算參數(shù)量來衡量模型復(fù)雜度,由低到高依次為XCM、GRU、GAT、AGRU、TPA、LST、TCN、TCAN、TF。資料來源:中信建投金融產(chǎn)品研究金融產(chǎn)品研究5模型簡稱結(jié)構(gòu)來源GRUGRURNN+MLPtranslation:Encoder-decoderapproaches(2014)AGRUAGRULSTNetLSTCNN+RNN+MLPTransformerTFTCNTCNCNN+MLPRecurrentNetworksforSequenceMoTPATPARNN+CNN+Attention+MLPTCANSequenceModeling(2020)XCMXCMCNN+MLP資料來源:Limetal.(2021),中信建投相對于基礎(chǔ)GRU模型結(jié)構(gòu),AGRU模型在此基礎(chǔ)上增加時序注意力層。如圖表5所示,以自適應(yīng)權(quán)重聚合各時間步的隱狀態(tài),增強對不同時間步的感知能力。盡管GRU模型能捕捉長期依賴關(guān)系,但時序注意力能更直接識別關(guān)鍵時間步。在決策階段,將所有時間步的加權(quán)信息和最后時間步的隱狀態(tài)拼接起來,共同用于最終資料來源:Luongetal.(2015),中信建投金融產(chǎn)品研究金融產(chǎn)品研究6相較于前一節(jié)的AGRU模型,TPA模型同樣關(guān)注注意力機制,但更側(cè)重于識別關(guān)鍵變量的時序模式,也更適用于多維時序數(shù)據(jù)。如圖表6所示,在GRU之后使用CNN來提取單個特征的時序模式,之后經(jīng)過注意力機制識別關(guān)鍵特征,而在決策階段與AGRU類似,合并注意力加權(quán)信息和最后時間步的隱狀態(tài)共同用于最終的預(yù)資料來源:Shihetal.(2019),中信建投LSTNet模型全稱是Long-andShort-TermTime-SeriesNetwork,顧名思義專注于識別不同期限長度的時序模式。LSTNet模型結(jié)構(gòu)擁有4種模塊,包含CNN、GRU、SkipGRU和AR。如圖表7所示,1)使用CNN捕捉短期模式,在時間維度上用短期窗口提取局部信息;2)使用GRU捕捉長期模式,經(jīng)過CNN提取的多種短期模式,再進一步提取更長期模式;3)使用SkipGRU捕捉周期性模式,實際是根據(jù)一定間隔重組數(shù)據(jù)樣本再輸入到GRU;4)使用線性AR結(jié)構(gòu)提供穩(wěn)健預(yù)測,通過highway形式直接輸入原始數(shù)據(jù),相較于非線性結(jié)構(gòu)對數(shù)據(jù)尺度敏感性會更低;5)整合多源信息用于最終預(yù)測,一方面是拼接GRU與SkipGru的信息,另一方面是再疊加AR的信息。金融產(chǎn)品研究金融產(chǎn)品研究7資料來源:Laietal.(2018),中信建投相對于基礎(chǔ)GRU模型結(jié)構(gòu),GAT模型在此基礎(chǔ)上增加圖注意力層。如圖表8所示,將樣本看作是節(jié)點,將GRU提取最后時間步的隱狀態(tài)作為節(jié)點特征,通過自注意力機制計算兩兩節(jié)點間的注意力系數(shù),再通過激活函數(shù)和歸一化操作得到注意力權(quán)重矩陣,在決策階段仍與AGRU類似,合并注意力加權(quán)信息和最后時間步的隱狀態(tài)共同用于最終的預(yù)測。資料來源:Velickovicetal.(2018),中信建投金融產(chǎn)品研究金融產(chǎn)品研究8XCM模型由3個卷積子模塊構(gòu)成,模型復(fù)雜度較低、同時可解釋性程度較高。如圖表9所示,1)使用2維CNN提取單特征的時序模式,并通過填充保持維度;2)使用1維CNN提取聯(lián)合特征的時序模式,并通過填充保持維度;3)使用1維CNN提取高層特征的時序模式,將前2個CNN模塊提取的特征橫向拼接,再次提取特征并填充保持維度;4)經(jīng)過池化后,用于最終決策。資料來源:Fauveletal.(2021),中信建投TCN模型結(jié)構(gòu)的核心在于TCN模塊,改進CNN結(jié)構(gòu)以適配序列數(shù)據(jù)建模。如圖標(biāo)10所示,1)因果卷積:僅考慮序列的歷史信息進行預(yù)測;2)膨脹卷積:以特定間隔接收信息,削弱感受野的局限性來納入更早的歷史信息;3)殘差連接:有效應(yīng)對深層網(wǎng)絡(luò)模型性能退化的問題,同時能利用不同層級特征。資料來源:Baietal.(2018),中信建投金融產(chǎn)品研究金融產(chǎn)品研究9相對于TCN模型結(jié)構(gòu),TCAN模型在TCN模塊的基礎(chǔ)上增加注意力機制。如圖表11所示,1)時序注意力:將歷史時間步的關(guān)鍵信息整合至當(dāng)前步;2)增強殘差連接:將時間步加權(quán)的輸入信息直接連接至輸出層。資料來源:Haoetal.(2020),中信建投Transformer模型結(jié)構(gòu)復(fù)雜度較高,包含多個模塊。如圖表12所示,1)嵌入層:將原始特征信息轉(zhuǎn)為更豐富表示;2)位置編碼:將位置信息表征為向量形式;3)編碼器模塊:依次經(jīng)過自注意力層、正則化層、前饋層和正則化層,同時使用殘差連接;4)解碼器:使用全連接層。資料來源:Vaswanietal.(2017),中信建投金融產(chǎn)品研究金融產(chǎn)品研究模型GRU模型GRU三、單時序模型測試2016年末起,每兩年重新訓(xùn)練模型;3)抽樣規(guī)則:每個批屬于同期樣本;4)目標(biāo)函數(shù):設(shè)置單目標(biāo)函數(shù),模型測試方面,1)回測區(qū)間:從2017年1月至2023年10月,以周度頻率生成預(yù)測結(jié)果;2)因子處理:將預(yù)測結(jié)果看作是深度學(xué)習(xí)因子,進行異常值縮減、標(biāo)準(zhǔn)化(中性化)預(yù)處理;3)隨機性:采用相同的參數(shù)初始化方法,并設(shè)定5個固定的隨機種子,利于比對測試結(jié)果;4)結(jié)果整合:對不同隨機性的結(jié)果進行均值整合;5)IC回測:計算當(dāng)收IC和次均IC,分別以因子期當(dāng)日收盤價或次日均價作為首端價格計算收益率。對前文介紹的9個模型進行逐一測試,結(jié)果如圖表13至21所示:1)TCN模型表現(xiàn)較優(yōu),均值IC分別和中位IC分別達到11.31%和11.22%,最大差異僅為0.26%;2)TF模型表現(xiàn)較弱,中位IC僅有8.66%、最大差異高達1.73%。種子原始中性化當(dāng)收ICIR次均IC次均ICIR當(dāng)收ICIR次均IC次均ICIR種子2種子3種子3種子4種子5種子5最大差異均值整合資料來源:Wind,中信建投模型隨機種子原始中性化當(dāng)收ICIR次均IC次均ICIR當(dāng)收ICIR次均IC次均ICIRAGRU種子1種子2種子3種子4最大差異均值整合資料來源:Wind,中信建投金融產(chǎn)品研究金融產(chǎn)品研究TPA模型TPA模型原始中性化原始中性化次均ICIR次均ICIR資料來源:Wind,中信建投原始中性化次均ICIR次均ICIR資料來源:Wind,中信建投模型原始中性化次均ICIR次均ICIRGAT9.51%1.50%資料來源:Wind,中信建投模型原始中性化次均ICIR次均ICIRXCMXCM 資料來源:Wind,中信建投金融產(chǎn)品研究金融產(chǎn)品研究TCNTCN原始中性化原始中性化次均ICIR次均ICIR資料來源:Wind,中信建投模型原始中性化次均ICIR次均ICIRTCAN0.26%資料來源:Wind,中信建投模型原始中性化次均ICIR次均ICIRTFTF 資料來源:Wind,中信建投對9個模型的分年當(dāng)收IC表現(xiàn)進行對比,如圖表22所示:1)隨更新頻率模型表現(xiàn)呈現(xiàn)輪轉(zhuǎn),2017-2018年TPA與TCN表現(xiàn)突出、2019-2020年AGRU與TPA表現(xiàn)突出、2021-2022年GRU與AGRU表現(xiàn)突出、2023年TCAN與XCM表現(xiàn)突出;2)GRU、AGRU、TPA在2017-2022年表現(xiàn)偏強勢,但在2023年表現(xiàn)偏弱勢;3)XCM、TF在2017-2022年表現(xiàn)偏弱勢,但在2023年表現(xiàn)偏強勢;4)TCN模型在各年份均無明顯弱勢表現(xiàn)。金融產(chǎn)品研究金融產(chǎn)品研究年份GRUAGRUTPAGATLSTTCNTCANXCM 10.33%10.22%10.45%8.38%10.18%10.51%7.18%4.58% 14.48%13.94%14.51%14.21%14.06%14.94%13.41%10.23% 12.36%12.79%12.67%12.04%12.10%12.41%12.00%12.20% 10.28%10.61%10.95%9.61%10.11%10.56%9.65%8.42% 9.65%9.64%9.39%9.18%8.99%9.19%9.20%7.54% 11.63%11.72%11.45%11.55%10.74%11.15%11.26%9.58% 9.40%9.43%9.74%10.28%9.08%10.19%12.13%11.76%TFTF6.38%11.64%8.98%4.89%9.42%20172018201920202021202211.29%11.30%11.30%9.04%2023全部11.21%11.24%11.35%10.76%10.80%11.31%10.64%9.10%資料來源:Wind,中信建投金融產(chǎn)品研究金融產(chǎn)品研究四、多時序模型測試內(nèi)個股等權(quán)配置;3)分組收益:計算每組相對標(biāo)的指數(shù)超額收益;4)股票池:全市場、滬深300、中證500和中證1000,其中全市場對標(biāo)指數(shù)為萬德全A;3)持倉個股:剔除新股、停牌股、ST股和漲跌停個股;4)成交設(shè)定:按次日均價成交,雖然不考慮交易費率,但會計算每組換手率。股、剔除長期停牌股;3)優(yōu)化目標(biāo):最大化多模型等權(quán)預(yù)測結(jié)果,預(yù)測值經(jīng)過標(biāo)準(zhǔn)化與中性化處理;4)約束限制:指數(shù)內(nèi)權(quán)重下限80%、個股權(quán)重偏離限定1%、行業(yè)權(quán)重偏離限定1.5%、風(fēng)格暴露偏離限定0.2、換手率單邊上限15%;5)持倉設(shè)定:剔除停牌股和漲跌停股;6)成交設(shè)定:按次日均價成交,費率雙邊千三。為了便于模型間比較,將各模型的五種隨機種子結(jié)果按均值整合為單一結(jié)果,再做后續(xù)統(tǒng)計與測試??疾炷P烷g預(yù)測的兩兩相關(guān)性,如圖表23所示:1)GRU、AGRU、TPA間極高相關(guān),從模型結(jié)構(gòu)就不難發(fā)現(xiàn)三者高度相似,均以GRU作為前期特征提取模塊并以最后時間步的隱狀態(tài)最為主要決策依據(jù),區(qū)別在于AGRU和TPA補充了部分注意力信息;2)GAT、LST與前三者亦有高相關(guān),盡管模型結(jié)構(gòu)有部分差異,但核心特征提取模塊仍以GRU為主;3)TCN、TCAN與前五者相關(guān)性略低,主要源于TCN與RNN的序列建模有部分差異;4)XCM、TF與前七者相關(guān)性偏低,XCM和TF分別僅使用CNN模塊和注意力機制,區(qū)別于一般序列建模形式。資料來源:Wind,中信建投金融產(chǎn)品研究金融產(chǎn)品研究GATTCNGATTCN為了考察模型間增益效果,嘗試將模型進行兩兩等權(quán)結(jié)合。如圖表24左側(cè)所示,當(dāng)收IC績效下:1)強強結(jié)合增益明顯,TPA和TCN是表現(xiàn)最強的單模型,兩者結(jié)合后依然表現(xiàn)最強并有進一步提升;2)弱模型有拖累,XCM和TF是表現(xiàn)偏弱的單模型,與其它模型結(jié)合后會有不同程度拉低效果。如圖表24右側(cè)所示,次均IC績效下:1)高相關(guān)模型間增益有限,GRU、AGRU、TPA、GAT、LST互相高相關(guān),兩兩結(jié)合增益不及其它低相關(guān)模型;2)強弱結(jié)合有所增益,TCN和TF分別是表現(xiàn)稍強和稍弱的單模型,但兩者結(jié)合后表現(xiàn)最強并有所提升;3)弱模型亦有小幅增益,XCM和TF是表現(xiàn)偏弱的單模型,與其它模型結(jié)合后會有小幅拉升效果。資料來源:Wind,中信建投4.3、多模型疊加分析為了考察多模型結(jié)合的增益效果,將9個模型結(jié)果按照等權(quán)配置進行疊加。如圖表25所示:1)多模型的IC績效全面強于單模型表現(xiàn);2)多模型的次均IC提升幅度略高于當(dāng)收IC。進一步觀察分年IC績效,如圖表26所示,相較于單模型:1)多模型無明顯弱勢年份,除了2017年表現(xiàn)位于中游,其余年份表現(xiàn)靠前;2)多模型逐年表現(xiàn)更平滑、沒有極端表現(xiàn)。單模型原始中性化當(dāng)收IC當(dāng)收ICIR次均IC次均ICIR當(dāng)收IC當(dāng)收ICIR次均IC次均ICIRGRUTPATCANTF全部等權(quán)1.031.06GRUTPATCANTF全部等權(quán)1.031.060.911.001.040.900.710.671.0011.18%11.16%11.28%10.99%10.93%11.26%10.90%9.97%10.45%11.62%1.041.070.951.031.050.940.780.781.0310.46%10.35%10.44%10.27%10.13%10.53%10.01%9.22%8.58%10.75%9.95%9.85%9.94%9.93%9.75%10.02%9.74%9.43%9.21%10.47%AGRUXCM11.24%11.35%10.76%10.80%11.31%10.64%9.10%9.04%11.47%資料來源:Wind,中信建投年份GRUAGRUTPAGATLSTTCNTCANXCMTF 10.33%10.22%10.45%8.38%10.18%10.51%7.18%4.58%6.38%全部等權(quán)全部等權(quán)20179.63%14.57%14.57%12.87%10.84%9.55%11.73%11.10%201814.48%12.36%10.28%9.65%11.63%9.40%13.94%12.79%12.79%10.61%9.64%11.72%9.43%14.51%12.67%10.95%9.39%11.45%9.74%14.21%14.21%12.04%9.61%9.61%9.18%11.55%11.55%10.28%14.06%12.10%10.11%8.99%8.99%10.74%9.08%14.94%14.94%12.41%10.56%9.19%11.15%11.15%10.19%13.41%13.41%12.00%9.65%9.20%11.26%12.13%12.13%10.23%10.23%12.20%8.42%8.42%7.54%9.58%11.76%11.64%11.64%8.98%4.89%9.42%11.29%11.30%11.30%20192020202120222023全部11.21%11.24%11.35%10.76%10.80%11.31%10.64%9.10%9.04%11.47%資料來源:Wind,中信建投4.4、多模型組合績效將多模型預(yù)測結(jié)果在不同股票池內(nèi)進行分組測試,如圖表27和圖表28所示,1)中證1000內(nèi)多頭超額收益最高,原始因子的多頭超額可達29.5%,略高于全市場、明顯高于中證500和滬深300;2)全市場內(nèi)多空收益最高,原始因子的多空收益可達76.0%,其中空頭收益貢獻占比超過60%;3)中性化因子換手率略低,最頭組的換手率處于55%~59%;4)中性化因子多空凈值回撤率更低,相較于原始因子,中性化因子的最大回撤率能縮減一半。等權(quán)多頭超額空頭超額多空換手多頭超額空頭超額多空換手最尾組最頭-最尾最頭組最頭組最尾組最頭-最尾最頭組股票池最頭組次頭組次尾組次頭組次尾組原始全部全市場29.1%23.3%-18.0%-46.9%76.0%54.2%23.9%20.4%-19.6%-44.3%68.2%55.6%中證100029.5%27.3%-16.8%-40.5%70.0%59.4%24.1%24.8%-18.1%-37.5%61.6%58.9%中證50020.1%18.0%-10.0%-31.3%51.4%61.5%13.9%10.2%-12.1%-27.8%41.7%58.5%滬深30024.4%16.7%-13.4%-28.0%52.5%64.3%13.2%10.9%-13.3%-23.1%36.3%55.7%資料來源:Wind,中信建投資料來源:Wind,中信建投金融產(chǎn)品研究金融產(chǎn)品研究利用多模型預(yù)測結(jié)果構(gòu)建相對于中證1000的指數(shù)增強組合,如圖表29和圖表30所示,1)總體績效方面,年化超額收益達18.6%、信息比率達2.63、雙邊換手率約30%;2)分年績效方面,各年均有顯著正向超額,僅2021年略低于10%,2023年的年化超額可達26%;3)超額凈值方面,大幅回撤集中出現(xiàn)在三個時段,2020年的年初、2021年的年中和2022年的上半年。多模型全部等權(quán)年化超額收益年化超額波動信息比率超額最大回撤率雙邊換手率21.3%29.5%29.7%29.6%8.7%29.6%9.2%9.4%0.987.8%29.7%7.1%29.7%26.0%4.9929.7%全部7.1%7.8%29.6%資料來源:Wind,中信建投資料來源:Wind,中信建投金融產(chǎn)品研究金融產(chǎn)品研究五、總結(jié)本篇報告作為前兩篇專題的拓展,將時序處理模塊拓寬為三大類、將時序模型結(jié)構(gòu)拓寬為九種。從分析與測試結(jié)果來看:1)單模型測試下,TPA和TCN表現(xiàn)較突出;2)模型間的預(yù)測相關(guān)程度與模型結(jié)構(gòu)的相似性有密切關(guān)聯(lián);3)相較于單模型結(jié)果,多模型整合后的績效表現(xiàn)有全面提升、分年表現(xiàn)更為穩(wěn)定;4)基于多模型構(gòu)建中證1000指數(shù)增強組合,年化超額收益可達18.6%、信息比率為2.63。風(fēng)險提示:研究均基于歷史數(shù)據(jù),對未來投資不構(gòu)成任何建議。文中的模型分析均是以歷史數(shù)據(jù)進行計算和分析的,未來存在失效的可能性。市場的系統(tǒng)性風(fēng)險、政策變動風(fēng)險等市場不確定性均會對策略產(chǎn)生較大的影響。另外,本報告聚焦于深度模型構(gòu)建和量化組合的回測效果,因此對市場及相關(guān)交易做了一些合理假設(shè),但這樣可能會導(dǎo)致基于模型所得出的結(jié)論并不能完全準(zhǔn)確地刻畫現(xiàn)實環(huán)境,在此可能會與未來真實的情況出現(xiàn)偏差。而且數(shù)據(jù)源通常存在極少量的缺失值,會弱微增加模型的統(tǒng)計偏誤。六、參考文獻GabrielSpadon,ShendaHong,BrunoBrandoli,StanMatwin,JoseF.Rodrigues-Jr,andJiemengSun.PayAttentiontoEvolutionTimeSeriesForecastingwithDeepGraph-EvolutionLearning.IEEETransactionsonPatternAnalysis&MachineIntelligence,1939-3539(2021).BryanLim,andStefanZohren.TimeSeriesForecastingwithDeepLearning:ASurvey.PhilosophicalTransactionsoftheRoyalSociety,(2021).Minh-ThangLuong,HieuPham,andChristopherD.Manning.EffectiveApproachestoAttention-basedNeuralMachineTranslation.InProceedingsofthe2015ConferenceonEmpiricalMethodsinNaturalLanguageProcessing,1412-1241,(2015).Shun-YaoShih,Fan-KengSun,andHung-yiLee.TemporalPatternAttentionforMultivariateTimeSeriesForecasting.MachineLearning,vol108,1421-1441(2019).GuokunLai,Wei-ChengChang,YimingYang,andHanxiaoLiu.ModelingLongandShort-TermTemporalPatternswithDeepNeuralNetworks.InThe41stInternationalACMSIGIRConferenceonResearch&DevelopmentinInformationRetrieval,95-104(2018).PetarVelickovic,GuillemCucurull,ArantxaCasanova,AdrianaRomero,PietroLio,andYoshuaBengio.GraphAttentionNetworks.arXiv:1710.10903(2018).KevinFauvel,TaoLin,VeroniqueMasson,ElisaFromont,andAlexandreTermier.XCM:AnExplainableCNNforMultivariateTimeSeriesClassification.Mathematics9(23),3137(2021).金融產(chǎn)品研究金融產(chǎn)品研究ShaojieBai,J.ZicoKolter,andVladlenKoltun.AnEmpiricalEvaluationofGenericConvolutionalandRecurrentNetworksforSequenceModeling.arXiv:1803.01271.(2018).HongyanHao,YanWang,SiqiaoXue,YudiXia,FuraoShen,andJianZhao.TemporalConvolutionalAttention-basedNetworkforSequenceModeling.arXiv:2002.12530.(2020).AshishVaswani,NoamShazeer,NikiParmar,JakobU

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論