基于直觀邏輯和機器學(xué)習(xí)的高頻數(shù)據(jù)低頻化應(yīng)用_第1頁
基于直觀邏輯和機器學(xué)習(xí)的高頻數(shù)據(jù)低頻化應(yīng)用_第2頁
基于直觀邏輯和機器學(xué)習(xí)的高頻數(shù)據(jù)低頻化應(yīng)用_第3頁
基于直觀邏輯和機器學(xué)習(xí)的高頻數(shù)據(jù)低頻化應(yīng)用_第4頁
基于直觀邏輯和機器學(xué)習(xí)的高頻數(shù)據(jù)低頻化應(yīng)用_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、目錄 HYPERLINK l _TOC_250010 高頻數(shù)據(jù)的低頻化 5 HYPERLINK l _TOC_250009 逐筆成交與委托掛單的結(jié)合 5 HYPERLINK l _TOC_250008 因子月度選股能力 6 HYPERLINK l _TOC_250007 因子效果對比 9本章小結(jié) 11 HYPERLINK l _TOC_250006 高頻數(shù)據(jù)低頻化后的信息挖掘 11 HYPERLINK l _TOC_250005 因子挖掘結(jié)果 11 HYPERLINK l _TOC_250004 因子選股能力 12 HYPERLINK l _TOC_250003 本章小結(jié) 13 HYPERLI

2、NK l _TOC_250002 組合改進 14 HYPERLINK l _TOC_250001 5.總結(jié) 16 HYPERLINK l _TOC_250000 風(fēng)險提示 16圖目錄圖 1買入意愿占比分 10 組超額收益(正交后)(2014.01.022020.03.31) 7圖 2日內(nèi)買入意愿強度分 10 組超額收益(正交后)(2014.01.022020.03.31) 7圖 3買入意愿占比多空相對強弱(正交后)(2014.01.022020.03.31) 8圖 4日內(nèi)買入意愿強度多空相對強弱(正交后)(2014.01.022020.03.31) 8圖 5買入意愿占比累計凈值(2014.01

3、.022020.03.31) 8圖 6日內(nèi)買入意愿強度累計凈值(2014.01.022020.03.31) 8圖 7買入意愿占比與凈主買占比多空相對強弱(正交后)(2014.01.022020.03.31)10圖 8日 內(nèi) 買 入 意 愿 強 度 與 日 內(nèi) 凈 主 買 強 度 多 空 相 對 強 弱 ( 正 交 后 )(2014.01.022020.03.31) .10圖 9買入意愿占比與凈主買占比累計凈值(正交后)(2014.01.022020.03.31) 10圖 10日 內(nèi) 買 入 意 愿 強 度 與 日 內(nèi) 凈 主 買 強 度 累 計 凈 值 ( 正 交 后 )(2014.01.02

4、2020.03.31) .10圖 11機器挖掘因子分 10 組超額收益(正交剔 除常規(guī)低頻因子后) (2014.01.022020.03.31) .13圖 12機器挖掘因子分 10 組超額收益( 正交剔除常規(guī)低頻因子與高頻因子后)(2014.01.022020.03.31) .13圖 13各組合相對中證 500 指數(shù)的表現(xiàn)(2016.01.042020.03.31) 14表目錄表 1高頻因子研究報告所使用的高頻數(shù)據(jù) 5表 2買入意愿因子月度 IC 與多空收益(2014.01.022020.03.31) 7表 3部分買入意愿類因子分年度多空收益(正交后)(2014.01.022020.03.31

5、) 8表 4部分買入意愿類因子分年度月均溢價(正交后)(2014.01.022020.03.31) 9表 5因子月度 IC 與多空收益對比(正交后)(2013.01.042020.03.31) 9表 6因子分年度多空收益對比(正交后)(2014.01.022020.03.31) 10表 7因子分年度月均溢價對比(正交后)(2014.01.022020.03.31) 11表 8數(shù)據(jù)說明 11表 9算子說明 11表 10機器挖掘因子計算方法 12表 11機器挖掘因子月度 IC 與多空收益(2014.01.022020.03.31) 12表 12機器挖掘因子分年度多空收益( 正交剔除常規(guī)低頻因子與高

6、頻因子后)(2014.01.022020.03.31) .13表 13機器挖掘因子分年度月均溢價( 正交剔除常規(guī)低頻因子與高頻因子后)(2014.01.022020.03.31) .13表 14各因子對組合表現(xiàn)的影響(2016.01.042020.03.31) 14表 15部 分 機 器 挖 掘 因 子 與 部 分 買 入 意 愿 因 子 月 度 IC 與 多 空 收 益(2014.01.022020.03.31) .15表 16因子截面相關(guān)性(2014.01.022020.03.31) 15表 17因子 IC 序列相關(guān)性(2014.01.022020.03.31) 15表 18同時加入兩因子

7、對組合表現(xiàn)的影響(2016.01.042020.03.31) 15在系列前期報告中,我們從不同角度探尋了分鐘成交數(shù)據(jù)、TICK 盤口委托數(shù)據(jù)以及逐筆數(shù)據(jù)中所包含的選股能力。研究結(jié)果表明,高頻數(shù)據(jù)中包含著較為顯著的選股能力。即使在剔除了常規(guī)低頻因子的影響后,高頻因子依舊具有顯著的選股能力??紤]到系列前期報告在構(gòu)建高頻因子時,大多僅使用某一類高頻數(shù)據(jù)進行因子構(gòu)建,并未將各類數(shù)據(jù)混合使用。本文從邏輯以及機器學(xué)習(xí)兩個角度出發(fā),嘗試將不同類別的高頻數(shù)據(jù)混合使用并構(gòu)建低頻選股因子。本文分為六個部分。第一部分簡要介紹了系列前期報告中構(gòu)建高頻選股因子所使用到的不同類別的高頻數(shù)據(jù);第二部分從直觀邏輯的角度出發(fā),

8、將主買主賣數(shù)據(jù)與盤口委托數(shù)據(jù)進行了結(jié)合并構(gòu)建了買入意愿類因子;第三部分嘗試從機器學(xué)習(xí)的角度進行因子挖掘;第四部分展示了各因子在放入增強組合后的表現(xiàn);第五部分總結(jié)了全文,第六部分提示了風(fēng)險。高頻數(shù)據(jù)的低頻化在前期系列報告中,我們分別使用了分鐘成交數(shù)據(jù)、TICK 盤口委托數(shù)據(jù)、逐筆成交數(shù)據(jù)構(gòu)建了選股因子?;販y結(jié)果表明,相關(guān)因子具有較為顯著的選股能力,即使在剔除了常規(guī)低頻因子的影響后,因子依舊具有顯著的 Alpha。值得注意是,系列前期報告在構(gòu)建因子時所使用的高頻數(shù)據(jù)種類較為單一。例如,凈主買強度因子僅使用了逐筆數(shù)據(jù),凈委買變化率僅使用了盤口委托掛單數(shù)據(jù)??紤]到各類高頻數(shù)據(jù)從不同的角度刻畫了投資者的

9、交易行為,我們可在構(gòu)建選股因子時引入不同類別的高頻數(shù)據(jù),從而更加全面地刻畫投資者的交易行為。下表簡要展示了前期系列報告中所使用過的各類高頻數(shù)據(jù)。表 1 高頻因子研究報告所使用的高頻數(shù)據(jù)報告名稱使用數(shù)據(jù)類型選股因子系列研究(十九)高頻因子之股票收益分布特征分鐘成交高頻量價因子在股票與期貨中的表現(xiàn)分鐘成交選股因子系列研究(二十五)高頻因子之已實現(xiàn)波動分解分鐘成交選股因子系列研究(四十六)日內(nèi)分時成交中的玄機分鐘成交選股因子系列研究(四十七)捕捉投資者的交易意愿TICK 級盤口委托選股因子系列研究(五十六)買賣單數(shù)據(jù)中的 Alpha逐筆數(shù)據(jù)選股因子系列研究(四十九)當(dāng)下跌遇到托底分鐘成交、TICK

10、級盤口委托選股因子系列研究(五十七)基于主動買入行為的選股因子逐筆數(shù)據(jù)選股因子系列研究(五十八)知情交易與主買主賣逐筆數(shù)據(jù)、分鐘成交資料來源: 為了計算的便利,本文將各類的高頻數(shù)據(jù)統(tǒng)一調(diào)整為分鐘頻數(shù)據(jù),并基于分鐘頻數(shù)據(jù)構(gòu)建因子。例如,對于逐筆數(shù)據(jù)中的凈主買金額,可首先在每一分鐘計算凈主買成交金額,并使用該序列與其他類別的數(shù)據(jù)共同構(gòu)建選股因子。面對各種類型的高頻數(shù)據(jù),我們一方面可從主觀邏輯的角度出發(fā)構(gòu)建因子,另一方面,也可從機器學(xué)習(xí)的角度出發(fā),使用特征工程等機器學(xué)習(xí)技術(shù)進行因子挖掘。主觀邏輯可以幫助我們在機器學(xué)習(xí)中設(shè)定算子集合,而機器學(xué)習(xí)得到的因子也能為因子構(gòu)建提供新的思路并幫助挖掘新的邏輯。本

11、文第二部分將嘗試從主觀邏輯的角度出發(fā),結(jié)合逐筆成交數(shù)據(jù)與 TICK 級盤口委托掛單數(shù)據(jù)構(gòu)建選股因子。第三部分將使用機器學(xué)習(xí)的方法挖掘因子。逐筆成交與委托掛單的結(jié)合在系列報告選股因子系列研究(四十七)捕捉投資者的交易意愿與選股因子系列研究(五十七)基于主動買入行為的選股因子中,我們分別探討了委托掛單數(shù)據(jù)以及逐筆成交數(shù)據(jù)中所包含的選股能力??偨Y(jié)前期研究成果可知,委托掛單數(shù)據(jù)中包含了投資者還未釋放的交易意愿,而逐筆成交數(shù)據(jù)中包含了投資者已進行的交易行為。從邏輯上看,兩者的結(jié)合能夠更加全面地刻畫投資者的交易傾向。在數(shù)據(jù)選擇上,我們分別選擇了分鐘頻率的凈委買變化額以及凈主買成交額作為委托掛單數(shù)據(jù)與逐筆成

12、交數(shù)據(jù)的代表。對于任意一分鐘,凈委買變化額體現(xiàn)了投資者在該分鐘的買入意愿的凈增量,刻畫了投資者還未釋放的買入意愿,而凈主買成交額則體現(xiàn)了投資者在該分鐘的凈買入量,刻畫了投資者已經(jīng)釋放的買入意愿。因此,凈委買變化額與凈主買成交額之和則全面刻畫了投資者在這一分鐘的買入意愿。基于上述考慮,本章構(gòu)建了買入意愿序列,該指標計算方法如下:買入意愿=凈委買變化額+凈主買成交額i,T,ki,T,ki,T,k其中,買入意愿 i,T,k 為股票 i 在交易日 T 的第 k 分鐘的買入意愿,凈委買變化額 i,T,k 為股票 i 在交易日 T 的第 k 分鐘的凈委買變化額。凈委買變化額的計算考慮了盤口的變化,更多細節(jié)

13、可參考系列前期報告或聯(lián)系報告作者。凈主買成交額 i,T,k 為股票 i 在交易日 T 的第 k 分鐘的主動買入額與主動賣出額的差值。結(jié)合選股因子系列研究(五十七)基于主動買入行為的選股因子一文中因子的構(gòu)建思路,本章構(gòu)建了買入意愿占比以及日內(nèi)買入意愿強度。股票 i 在交易日 T 的指標計算方法如下:買入意愿占比i,T 買入意愿= i,T,k 成交金額i,T,k(買入意愿)買入意愿強度= i,T,k i,T,ki,T(買入意愿)為了滿足不同調(diào)倉頻率的需求,我們在進行因子計算時首先計算日度指標,并在相應(yīng)調(diào)倉時點計算指標在回看窗口中的日度均值,將指標的日度均值作為因子的因子值。更多細節(jié)可聯(lián)系報告作者。

14、此外,考慮到投資者的交易行為在日內(nèi)不同時段存在差異,本章在計算因子時,分別使用了 9:3014:56(后文簡稱為全天)、9:309:59(后文簡稱為開盤后)、10:0014:26(后文簡稱為盤中)以及 14:2714:56(后文簡稱為收盤前)的數(shù)據(jù)。因子月度選股能力下表展示了買入意愿因子在正交前后的因子月度 IC 以及前后 10%多空收益情況。本文在進行因子正交時剔除了行業(yè)因子、市值因子、中盤因子、估值因子、換手率因子、反轉(zhuǎn)因子、波動率因子、盈利因子以及盈利成長因子。全天-0.01-0.3941%-0.36%-0.14%-0.50%開盤后0.020.9669%0.78%0.43%-0.35%買

15、入意愿占比盤中-0.01-0.3745%-0.41%0.01%-0.40%收盤前-0.01-0.4548%-0.48%0.25%-0.22%表 2 買入意愿因子月度 IC 與多空收益(2014.01.022020.03.31)因子處理指標名稱時段IC 均值年化 ICIR月度勝率多空收益多頭收益空頭收益全天0.000.0959%-0.07%-0.50%-0.57%開盤后0.031.5272%1.24%0.33%-0.91%盤中0.010.2663%0.11%-0.32%-0.43%收盤前0.000.1956%-0.05%-0.28%-0.33%正交前全天0.021.6572%0.58%0.20%

16、-0.38%開盤后0.033.0985%0.98%0.57%-0.40%買入意愿占比盤中0.021.6571%0.46%0.17%-0.29%收盤前0.00-0.2051%-0.07%0.12%0.04%日內(nèi)買入意愿強度全天0.032.5679%0.82%0.09%-0.73%開盤后日內(nèi)買入意愿強度盤中0.040.033.702.6985%83%1.34%0.80%0.41%0.16%-0.93%-0.63%收盤前0.000.1551%0.08%-0.17%-0.25%正交后資料來源:Wind, 在正交處理前,開盤后買入意愿強度就呈現(xiàn)出了較為明顯的月度選股能力。因子月均 IC 達 0.03,年

17、化 ICIR 達 1.52,月度勝率超 70%,月度分 10 組多空收益差達 1.24%?;販y結(jié)果表明,前 1 個月投資者在開盤后 30 分鐘內(nèi)的買入意愿強度越高,股票未來一個月的超額收益表現(xiàn)越好。這一點與直觀理解較為吻合。值得注意的是,因子的月均多空收益雖然超 1%,但是多頭超額收益明顯弱于空頭超額收益。在正交處理后,買入意愿占比以及日內(nèi)買入意愿強度皆呈現(xiàn)出了較為顯著的月度選股能力。對于買入意愿占比類因子,開盤后買入意愿占比選股能力較為顯著,因子月均 IC 超 0.03,年化 ICIR 高于 3.0,月度勝率達 85%。因子多空收益分布較為均勻,月均多空收益為 0.98%,月均多頭超額收益為

18、 0.57%。此外,使用全天以及盤中數(shù)據(jù)計算得到的買入意愿占比因子同樣具有一定的截面選股能力。對于日內(nèi)買入意愿強度因子,全天日內(nèi)買入意愿強度、開盤后日內(nèi)買入意愿強度以及盤中日內(nèi)買入意愿強度皆呈現(xiàn)出了極為顯著的月度選股能力。因子月均 IC 普遍高于 0.03,年化 ICIR 普遍高于 2.5,月度勝率接近或者高于 80%。相比而言,開盤后日內(nèi)買入意愿強度因子表現(xiàn)更好,因子月均多空收益達 1.34%,月均多頭超額收益達 0.41%。下圖分別展示了正交后的買入意愿占比以及日內(nèi)買入意愿強度的分 10 組超額收益。圖1 買 入 意 愿 占 比 分 10 組 超 額 收 益 ( 正 交 后 )(2014.

19、01.022020.03.31)圖2 日內(nèi)買入意愿強度分 10 組超額收益( 正交后)(2014.01.022020.03.31) 0.80%0.60%0.40%0.20%0.00%-0.20%-0.40%-0.60%買入意愿占比(全天) 買入意愿占比(開盤后)買入意愿占比(盤中)123456789100.60%0.40%0.20%0.00%-0.20%-0.40%-0.60%-0.80%-1.00% 日內(nèi)買入意愿強度(全天) 日內(nèi)買入意愿強度(開盤后)日內(nèi)買入意愿強度(盤中)12345678910 資料來源:Wind, 資料來源:Wind, 從分組收益特征上看,買入意愿占比以及買入意愿強度在

20、正交處理后都呈現(xiàn)出了較為明顯的組間收益單調(diào)性。相比而言,開盤后買入意愿占比以及開盤后買入意愿強度具有更強的組間收益單調(diào)性以及更強的多頭效應(yīng)。下圖展示了買入意愿占比以及日內(nèi)買入意愿強度的多空相對強弱走勢。圖3 買 入 意 愿 占 比 多 空 相 對 強 弱 ( 正 交 后 )(2014.01.022020.03.31)圖4 日 內(nèi) 買 入 意 愿 強 度 多 空 相 對 強 弱 ( 正 交 后 )(2014.01.022020.03.31) 買入意愿占比(全天) 買入意愿占比(開盤后) 買入意愿占比(盤中)2.202.001.801.601.401.201.002.80日內(nèi)買入意愿強度(全天)

21、日內(nèi)買入意愿強度(開盤后) 日內(nèi)買入意愿強度(盤中)2.602.402.202.001.801.601.401.201.00 資料來源:Wind, 資料來源:Wind, 在正交處理后,買入意愿占比以及日內(nèi)買入意愿強度都呈現(xiàn)出了較強的收益區(qū)分能力。開盤后買入意愿占比以及開盤后日內(nèi)買入意愿強度年化多空收益分別為 12.49%以及 16.20%。各因子在大部分年份中皆取得了較好的收益表現(xiàn)。下表展示了各因子的分年度多空收益。表 3 部分買入意愿類因子分年度多空收益(正交后)(2014.01.022020.03.31)2020 年 3 月 31 日買入意愿占比(全天)7.47%72%9.75%-2.89

22、%6.20%7.40%5.64%14.71%2.36%買入意愿占比(開盤后)12.49%85%5.42%25.86%11.52%13.52%6.95%15.93%2.97%買入意愿占比(盤中)5.74%71%10.60%-6.39%1.41%5.65%7.54%11.18%1.19%日內(nèi)買入意愿強度(全天)10.64%79%10.91%16.45%9.66%7.88%9.46%12.93%1.26%日內(nèi)買入意愿強度(開盤后)16.20%85%9.87%44.68%15.97%12.50%12.64%12.35%1.86%日內(nèi)買入意愿強度(盤中)10.75%83%12.49%15.60%6.31

23、%5.37%13.30%12.58%2.67%資料來源:Wind,海通證券研究所因子名稱多空收益月度勝率201420152016201720182019截至我們同樣可從回歸法的角度對于上述因子的選股能力進行檢驗,可將上述因子分別與常規(guī)低頻因子(行業(yè)、市值、中盤、換手率、反轉(zhuǎn)、波動、估值、盈利以及盈利增長)放入多元回歸模型進行回歸檢驗。因子的回歸系數(shù)即為因子溢價,通過因子溢價可得到因子的累計凈值。下圖展示了各因子的累計凈值。 圖5 買入意愿占比累計凈值(2014.01.022020.03.31) 買入意愿占比(全天) 買入意愿占比(開盤后)買入意愿占比(盤中)1.301.251.201.151.

24、101.051.000.95圖6 日內(nèi)買入意愿強度累計凈值(2014.01.022020.03.31) 日內(nèi)買入意愿強度(全天)日內(nèi)買入意愿強度(開盤后)日內(nèi)買入意愿強度(盤中)1.351.301.251.201.151.101.051.000.95 資料來源:Wind, 資料來源:Wind, 從回歸法的角度看,上述因子同樣呈現(xiàn)出了顯著的選股能力。開盤后買入意愿占比以及開盤后日內(nèi)買入意愿強度月均溢價接近 0.30%,月度勝率超 75%。下表展示了各因子的月均溢價以及不同年度的月均溢價。表 4 部分買入意愿類因子分年度月均溢價(正交后)(2014.01.022020.03.31)2020 年 3

25、 月 31 日買入意愿占比(全天)0.16%71%0.12%-0.12%0.18%0.31%0.25%0.19%0.24%買入意愿占比(開盤后)0.28%75%0.13%0.41%0.24%0.43%0.26%0.24%0.24%買入意愿占比(盤中)0.13%66%0.11%-0.19%0.12%0.24%0.29%0.19%0.17%日內(nèi)買入意愿強度(全天)0.23%75%0.26%0.11%0.30%0.25%0.28%0.16%0.26%日內(nèi)買入意愿強度(開盤后)0.33%83%0.24%0.49%0.35%0.43%0.27%0.23%0.36%日內(nèi)買入意愿強度(盤中)0.21%72%

26、0.29%-0.01%0.22%0.22%0.34%0.18%0.28%資料來源:Wind,海通證券研究所因子名稱月均溢價月度勝率201420152016201720182019截至因子效果對比指標名稱時段全天IC 均值0.02年化 ICIR1.65月度勝率72%多空收益0.58%多頭收益0.20%空頭收益-0.38%開盤后 0.033.0985%0.98%0.57%-0.40%考慮到買入意愿占比以及日內(nèi)買入意愿強度與選股因子系列研究(五十七)基于主動買入行為的選股因子中提出的凈主買占比以及日內(nèi)凈主買強度邏輯較為相近,因此本節(jié)嘗試對比兩類因子,并考察買入意愿類因子能否相比于凈主買類因子產(chǎn)生提升

27、。下表對比展示了兩類因子在剔除常規(guī)低頻因子之后的 IC、ICIR 以及月度多空收益情況。表 5 因子月度 IC 與多空收益對比(正交后)(2013.01.042020.03.31)買入意愿占比盤中0.021.6571%0.46%0.17%-0.29%收盤前0.00-0.2051%-0.07%0.12%0.04%全天0.011.1661%0.33%0.03%-0.30%開盤后凈主買占比盤中0.020.012.151.4675%67%0.69%0.44%0.36%0.19%-0.33%-0.25%收盤前0.000.2651%0.01%0.03%0.03%全天0.032.5679%0.82%0.09

28、%-0.73%開盤后日內(nèi)買入意愿強度盤中0.040.033.702.6985%83%1.34%0.80%0.41%0.16%-0.93%-0.63%收盤前0.000.1551%0.08%-0.17%-0.25%全天0.022.3672%0.89%0.09%-0.80%開盤后日內(nèi)凈主買強度盤中0.030.032.962.6380%81%1.02%0.93%0.23%0.29%-0.79%-0.64%收盤前0.010.9060%0.34%-0.09%-0.43%資料來源:Wind, 對比正交后的因子 IC 可以發(fā)現(xiàn),買入意愿占比、日內(nèi)買入意愿強度相比于凈主買占比以及日內(nèi)凈主買強度皆有一定程度的提升

29、。以開盤后日內(nèi)買入意愿強度與開盤后日內(nèi)凈主買強度為例,因子的 IC 從 0.03 提升至 0.04,年化 ICIR 從 2.96 提升至 3.70,月度勝率從 80%提升至 85%,月均多空收益從 1.02%提升至 1.34%,月均多頭收益從 0.23%提升至 0.41%。下圖以兩類因子中表現(xiàn)較強的因子為例對比展示了因子的多空相對強弱。圖7 買入意愿占比與凈主買占比多空相對強弱( 正交后)(2014.01.022020.03.31)圖8 日內(nèi)買入意愿強度與日內(nèi)凈主買強度多空相對強弱(正交后)(2014.01.022020.03.31) 買入意愿占比(開盤后)凈主買占比(開盤后)2.202.00

30、1.801.601.401.201.002.80日內(nèi)買入意愿強度(開盤后)日內(nèi)凈主買強度(開盤后)2.602.402.202.001.801.601.401.201.00 資料來源:Wind, 資料來源:Wind, 觀察因子長期表現(xiàn)可知,開盤后買入意愿占比以及開盤后日內(nèi)買入意愿強度具有更強的選股能力。在大部分年份中,開盤后買入意愿占比的多空收益強于開盤后凈主買占比,開盤后日內(nèi)買入意愿強度的多空收益強于開盤后日內(nèi)凈主買強度。下表展示了各因子在不同年度中的多空收益。表 6 因子分年度多空收益對比(正交后)(2014.01.022020.03.31)2020 年 3 月 31 日買入意愿占比(開盤后

31、)12.49%85%5.42%25.86%11.52%13.52%6.95%15.93%2.97%凈主買占比(開盤后)7.25%75%3.37%18.45%6.42%8.06%5.19%7.27%-0.17%日內(nèi)買入意愿強度(開盤后)16.20%85%9.87%44.68%15.97%12.50%12.64%12.35%1.86%日內(nèi)凈主買強度(開盤后)11.52%80%5.10%30.36%9.37%9.76%8.29%13.03%2.38%資料來源:Wind,海通證券研究所因子名稱多空收益月度勝率201420152016201720182019截至下圖以兩類因子中表現(xiàn)較強的因子為例對比展示

32、了因子累計凈值。圖9 買入意愿占比與凈主買占比累計凈值( 正交后)(2014.01.022020.03.31)圖10 日內(nèi)買入意愿強度與日內(nèi)凈主買強度累計凈值(正交后)(2014.01.022020.03.31) 凈主買占比(開盤后) 買入意愿占比(開盤后)1.301.251.201.151.101.051.000.951.35日內(nèi)凈主買強度(開盤后) 日內(nèi)買入意愿強度(開盤后)1.301.251.201.151.101.051.000.95 資料來源:Wind, 資料來源:Wind, 從回歸法溢價的角度看,開盤后買入意愿占比以及開盤后日內(nèi)買入意愿強度同樣具有更強的選股能力。在大部分時段中,開

33、盤后買入意愿占比的月均溢價高于開盤后凈主買占比,開盤后日內(nèi)買入意愿強度的月均溢價高于開盤后日內(nèi)凈主買強度。下表展示了各因子在不同年度中的月均溢價。表 7 因子分年度月均溢價對比(正交后)(2014.01.022020.03.31)2020 年 3 月 31 日買入意愿占比(開盤后)0.28%75%0.13%0.41%0.24%0.43%0.26%0.24%0.24%凈主買占比(開盤后)0.18%70%0.03%0.25%0.17%0.33%0.17%0.16%0.13%日內(nèi)買入意愿強度(開盤后)0.33%83%0.24%0.49%0.35%0.43%0.27%0.23%0.36%日內(nèi)凈主買強度

34、(開盤后)0.26%75%0.15%0.31%0.27%0.38%0.21%0.22%0.35%資料來源:Wind,海通證券研究所2.3本章小結(jié)因子名稱月均溢價月度勝率201420152016201720182019截至本章從直觀邏輯的角度出發(fā),結(jié)合了逐筆成交數(shù)據(jù)與盤口委托數(shù)據(jù)中的信息,構(gòu)建得到了買入意愿類因子。在剔除了常規(guī)低頻因子的影響后,該因子在月度上具有較為顯著的選股能力。相比于使用逐筆成交數(shù)據(jù)構(gòu)建得到的凈主買類因子,買入意愿類因子更加全面地刻畫了投資者的買入意愿,因子具有更強的截面選股能力,且在大部分時段中皆取得了更好的收益表現(xiàn)。高頻數(shù)據(jù)低頻化后的信息挖掘為了能夠進一步增強因子挖掘的效

35、率并啟發(fā)新因子的構(gòu)建,我們可使用機器學(xué)習(xí)中的相關(guān)方法挖掘基于高頻數(shù)據(jù)的因子。在進行因子挖掘前,我們首先需要構(gòu)建數(shù)據(jù)備選庫。本章所使用到的數(shù)據(jù)如下表所示。表 8 數(shù)據(jù)說明數(shù)據(jù)層級數(shù)據(jù)內(nèi)容分鐘級數(shù)據(jù)成交額、收益逐筆級數(shù)據(jù)主買金額、凈主買金額、大單成交金額TICK 級數(shù)據(jù)凈委買變化額資料來源:Wind, 其次,我們可構(gòu)建算子備選庫,算子如下表所示。由于機器性能的約束,本章在進行回測時僅定義了一小部分算子,投資者可在實際回測中可按照自身需求對于算子進行調(diào)整。表 9 算子說明算子算子說明算子算子說明+加法period_beg()開盤時段(9:309:59)數(shù)據(jù)-減法period_med()盤中時段(10

36、:0014:26)數(shù)據(jù)*乘法period_end()盤中時段(14:2714:56)數(shù)據(jù)/除法period_all()全天(9:0014:56)數(shù)據(jù)inv()取倒數(shù)rolling_sum()滾動 20 日之和log()取對數(shù)rolling_mean()滾動 20 日均值neg()取負數(shù)rolling_std()滾動 20 日標準差資料來源:Wind, 最后,我們可將正交剔除常規(guī)低頻因子后的因子 ICIR 作為因子挖掘的目標。在實際的操作過程中,投資者既可參考金融科技(Fintech)和數(shù)據(jù)挖掘研究(三)量化因子的批量生產(chǎn)與集中管理中提供的因子挖掘方法,也可使用基因規(guī)劃等方法進行挖掘, pyth

37、on 中有較多開源包能夠高效實現(xiàn)特征工程。因子挖掘結(jié)果下表展示了部分挖掘得到的因子信息。表 10機器挖掘因子計算方法因子名稱因子計算方法 Alpha1neg(log(roll_std(period_med(主買額) Alpha2neg(log(roll_std(大單買入額* period_beg(成交額) ) Alpha3neg(log(roll_mean(period_med(成交額)- period_end(凈主買額) ) Alpha4neg(log(roll_mean(成交額- period_med(成交額) )Alpha5neg(log(roll_mean(period_beg(主買額

38、)+ period_med(主買額)- period_med(凈主買額)+period_end(成交額) )Alpha6neg(roll_sum(period_beg(成交額)+ period_end(成交額)/roll_sum(period_med(成交額)資料來源:Wind, 在上述機器挖掘因子中,部分因子的計算方法具有一定的邏輯性。Alpha1 計算了股票過去 20 日盤中主買額的波動率,計算公式中的 log 調(diào)整了因子的截面分布,而負號則表明,盤中主買額波動率越低,股票未來表現(xiàn)越好。Alpha4 計算了過去 1 個月開盤后與收盤前的成交額的滾動均值,該指標越高,股票未來表現(xiàn)越弱。Alp

39、ha6 體現(xiàn)出了類似的邏輯,它計算了過去 1 個月開盤后與收盤前的成交額之和與過去 1 個月盤中成交額之和的比值。然而,并不是所有機器挖掘因子的計算方式都具有邏輯性。例如,Alpha2 計算了大單買入額與開盤后成交額之積的波動率,我們難以直觀理解該種計算方法后的邏輯。因子選股能力下表展示了各因子在正交前后的因子月度 IC 以及前后 10%多空收益情況。本文在進行因子正交時首先考慮剔除行業(yè)、市值因子、中盤因子、估值因子、換手率因子、反轉(zhuǎn)因子以及波動率因子。其次,還考慮剔除行業(yè)、市值因子、中盤因子、估值因子、換手率因子、反轉(zhuǎn)因子、波動率因子以及系列前期報告中提出的相關(guān)高頻因子。表 11機器挖掘因子

40、月度 IC 與多空收益(2014.01.022020.03.31)因子處理因子名稱IC 均值年化 ICIR月度勝率多空收益多頭收益空頭收益Alpha_10.021.7368%0.90%0.17%-0.73%Alpha_20.021.6867%0.76%0.18%-0.58%正交剔除Alpha_30.021.3269%0.89%0.10%-0.79%常規(guī)低頻因子Alpha_40.031.9173%1.09%0.20%-0.89%Alpha_50.031.7172%1.09%0.20%-0.89%Alpha_60.032.6280%0.73%-0.05%-0.78%Alpha_10.043.148

41、3%1.57%0.46%-1.11%Alpha_20.053.5088%1.62%0.66%-0.96%正交剔除常規(guī)低頻Alpha_30.042.9381%1.63%0.40%-1.23%因子與高頻因子Alpha_40.053.1784%1.76%0.48%-1.28%Alpha_50.043.0683%1.73%0.46%-1.27%Alpha_60.021.8675%0.63%0.07%-0.57%資料來源:Wind, 觀察上表不難發(fā)現(xiàn),各因子在正交剔除常規(guī)低頻因子后就已經(jīng)呈現(xiàn)出了較為顯著的選股效果。如果進一步剔除高頻因子的影響,機器挖掘因子的月度選股能力會更加顯著,大部分因子月均 IC

42、高于 0.04,年化 ICIR 接近 3.0,月均多空收益高于 1.5%。下圖展示了因子在正交處理后的分 10 組超額收益。各機器挖掘因子在正交剔除常規(guī)低頻因子后就已經(jīng)呈現(xiàn)出了較為明顯的組間收益單調(diào)性,但是因子同樣呈現(xiàn)出了多頭效應(yīng)偏弱的特點。若進一步剔除常規(guī)高頻因子,因子依舊呈現(xiàn)出了較為顯著的組間收益單調(diào)性,并且因子的多頭效應(yīng)得到了明顯提升。圖11 機器挖掘因子分 10 組超額收益(正交剔除常規(guī)低頻因子后)(2014.01.022020.03.31)圖12 機器挖掘因子分 10 組超額收益(正交剔除常規(guī)低頻因子與高頻因子后)(2014.01.022020.03.31)0.60%1.00%0.4

43、0%0.20%0.50%0.00%0.00%-0.20%-0.40%-0.50%-0.60%Alpha_1Alpha_2Alpha_1Alpha_2-0.80%Alpha_3 Alpha_5 Alpha_4 Alpha_6-1.00%Alpha_3 Alpha_5 Alpha_4 Alpha_6-1.00%-1.50%1234567891012345678910資料來源:Wind, 資料來源:Wind, 下表對比展示了正交剔除常規(guī)低頻因子與高頻因子后的機器挖掘因子在不同年度的多空收益情況。除 Alpha6 外,各機器挖掘因子長期來看皆呈現(xiàn)出了較為顯著的選股能力,因子年化多空收益普遍接近 20%

44、,月度勝率皆高于 80%。分年度來看,各因子在大部分年份中皆取得了較好的收益表現(xiàn)。表 12機器挖掘因子分年度多空收益(正交剔除常規(guī)低頻因子與高頻因子后)(2014.01.022020.03.31)因子名稱多空收益月度勝率201420152016201720182019截至 2020 年 3 月 31 日Alpha_119.40%83%21.99%51.41%16.83%9.77%14.05%17.04%4.10%Alpha_220.97%88%19.45%58.06%21.09%11.70%12.23%20.25%4.00%Alpha_320.54%81%21.57%63.59%20.07%1

45、1.91%12.83%10.79%4.50%Alpha_422.09%84%23.87%68.09%20.58%15.50%11.58%12.64%5.06%Alpha_521.74%83%23.67%68.88%20.15%12.34%12.74%12.50%5.04%Alpha_68.50%75%7.70%12.67%6.74%9.71%6.11%7.12%3.30%資料來源:Wind, 下表展示了各因子的月均溢價以及不同年度的月均溢價。從回歸法的角度看,機器挖掘因子同樣呈現(xiàn)出了較為明顯的月度選股能力。因子在大部分時間段中皆取得了較好的收益表現(xiàn)。表 13機器挖掘因子分年度月均溢價(正交剔除

46、常規(guī)低頻因子與高頻因子后)(2014.01.022020.03.31)因子名稱月均溢價月度勝率201420152016201720182019截至 2020 年 3 月 31 日Alpha_10.29%71%0.25%0.74%0.31%0.05%0.28%0.13%0.27%Alpha_20.30%75%0.24%0.78%0.40%0.05%0.22%0.15%0.18%Alpha_30.26%67%0.26%0.74%0.30%-0.04%0.27%0.04%0.24%Alpha_40.28%67%0.29%0.74%0.34%-0.01%0.27%0.05%0.25%Alpha_50.

47、27%68%0.28%0.74%0.31%-0.04%0.28%0.05%0.24%Alpha_60.15%67%0.16%0.20%0.20%0.16%0.03%0.16%0.22%資料來源:Wind, 本章小結(jié)本章嘗試使用機器學(xué)習(xí)的方法挖掘低頻化后的高頻數(shù)據(jù)中所包含的選股能力。在剔除常規(guī)低頻因子的影響后,機器挖掘因子整體上呈現(xiàn)出了較為顯著的選股能力。在進一步剔除系列前期報告提出的高頻因子的影響后,機器挖掘因子依舊呈現(xiàn)出了顯著的選股能力。組合改進本章以月度調(diào)倉的中證 500 指數(shù)增強組合為例,展示了本文第二章以及第三章討論的因子在加入組合后對于組合表現(xiàn)的影響??墒褂贸R?guī)因子構(gòu)建基礎(chǔ)增強組合,

48、并分別加入各逐筆因子。下表展示了加入各逐筆因子的組合在 2016 年以來的分年度超額收益。表 14各因子對組合表現(xiàn)的影響(2016.01.042020.03.31)2020 年 3 月 31 日年化超額收益Alpha_124.15%8.76%22.29%18.57%4.03%18.93%Alpha_224.43%9.78%23.34%19.12%4.36%19.72%Alpha_322.46%11.21%21.68%19.08%0.35%18.04%Alpha_425.01%10.76%22.21%19.91%3.59%19.70%Alpha_523.53%9.22%22.26%19.44%2

49、.56%18.65%Alpha_622.65%16.08%20.68%12.78%1.39%18.04%買入意愿占比(開盤后)20.75%16.22%20.41%18.65%2.41%18.85%日內(nèi)買入意愿強度(開盤后)20.57%15.52%20.89%19.49%3.60%19.25%基礎(chǔ)模型18.92%12.50%21.90%17.91%3.82%18.22%加入因子名稱2016201720182019截至全區(qū)間資料來源:Wind, 觀察上表不難發(fā)現(xiàn),大部分因子的引入都能給組合的整體表現(xiàn)帶來一定程度的提升。相比而言,開盤后日內(nèi)買入意愿強度、Alpha_2、開盤后買入意愿占比以及 Alp

50、ha_4 帶來的收益提升較高。從分年度來看,機器挖掘因子的引入能夠進一步提升基礎(chǔ)模型在 2016 年的收益,但是會帶來 2017 年超額收益的下降。買入意愿因子的引入能夠在 2016年以及 2017 年帶來超額收益的提升,但是會降低組合在 2018 年的超額收益表現(xiàn)。下圖對比展示了各組合相對于中證 500 指數(shù)的相對強弱指數(shù)。圖13 各組合相對中證 500 指數(shù)的表現(xiàn)(2016.01.042020.03.31)Alpha_1Alpha_3 Alpha_5 買入意愿占比(開盤后)基礎(chǔ)模型Alpha_2 Alpha_4 Alpha_6 日內(nèi)買入意愿強度(開盤后)2.402.202.001.801.

51、601.401.202015-12-312016-02-292016-04-302016-06-302016-08-312016-10-312016-12-312017-02-282017-04-302017-06-302017-08-312017-10-312017-12-312018-02-282018-04-302018-06-302018-08-312018-10-312018-12-312019-02-282019-04-302019-06-302019-08-312019-10-312019-12-312020-02-291.00資料來源:Wind, 考慮到基于機器學(xué)習(xí)挖掘得到的因

52、子與基于直觀邏輯構(gòu)建得到的因子在加入組合 后,對于組合的分年度收益的影響有所不同,因此可將兩類因子同時加入模型從而得到更好的收益表現(xiàn)。不妨以本部分表現(xiàn)較好的 Alpha_2、Alpha_4、開盤后買入意愿占比以及開盤后日內(nèi)買入意愿強度為例。從單因子的角度看,上述因子在正交剔除常規(guī)常規(guī)低頻因子后都呈現(xiàn)出了較為顯著的月度選股能力,因子月均 IC 在 0.020.04 之間,年化 ICIR 超 1.5。表 15部分機器挖掘因子與部分買入意愿因子月度 IC 與多空收益(2014.01.022020.03.31)因子名稱IC 均值年化 ICIR月度勝率多空收益多頭收益空頭收益Alpha_20.021.6867%0.76%0.18%-0.58%Alpha_40.031.9173%1.09%0.20%-0.89%開盤后日內(nèi)買入意愿占比0.033.0985%0.98%0.57%-0.40%開盤后日內(nèi)買入意愿強度0.043.7085%1.34%0.41

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論