版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
目 錄1、開源金工特色遺傳算法框架 4、算子的賦予:創(chuàng)造性引入切割算子 4、變量的遴選:大小單資金流、日內(nèi)分鐘特征、日間特征 5、遺傳算法流程:針對性的改寫 52、遺傳算法的因子挖掘成果舉例 6、遺傳算法優(yōu)選綜合因子表現(xiàn)優(yōu)異 6、沙里淘金:遵循可解釋”理念 73、因子3的精細化討論 8、主動超大單強度效果不佳 8、“小單強度切割主動超大單強度敏感性分析 8、“小單強度切割全部超大單強度敏感性分析 94、因子4的精細化討論 、切割算子部分的討論 、時序極差算子 145、因子8的精細化討論 156、風險提示 16圖表目錄圖1:開源金工特色遺傳算法整體流程 6圖2:遺傳算法優(yōu)選綜合因子回測曲線較為優(yōu)異 7圖3:主動超大單強度5分組年化收益不單調(diào) 8圖4:不同??值下????????????_??????(??)和????????????_??????(??)的RankICIR績效 9圖5:主動超大單關(guān)注度因子多空收益波動比為2.08 9圖6:主動超大單關(guān)注度因子5分組年化收益單調(diào) 9圖7:不同??值下??????_??????(??)和??????_??????(??)的RankICIR績效 10圖8:超大單關(guān)注度因子多空收益波動比為2.63 10圖9:超大單關(guān)注度因子5分組年化收益單調(diào) 10圖10:因子4原始公式的拆分 圖日內(nèi)分鐘收益波動5分組年化收益不單調(diào) 12圖12:不同??值下????_??????(??)和????_??????(??)的RankICIR績效 12圖13:????_????????因子多空收益波動比為2.83 13圖14:????_????????因子5分組年化收益單調(diào) 13圖15:在多空IR值上????_????????略勝于理想振幅 13圖16:交易情緒不穩(wěn)定因子多空收益波動比為3.35 14圖17:交易情緒不穩(wěn)定因子5分組年化收益單調(diào) 14圖18:主力控盤能力因子多空收益波動比為2.46 16圖19:主力控盤能力因子5分組年化收益單調(diào) 16表1:四大類算子列示(部分) 5表2:3大類變量列示(部分) 5表3:遺傳算法優(yōu)選綜合因子在不同股票域的測試結(jié)果皆較為優(yōu)秀 7表4:遺傳算法精篩因子明細 7表5:超大單關(guān)注度因子在其他樣本空間依然具有一定選股能力 10表6:超大單關(guān)注度因子與傳統(tǒng)Barra因子相關(guān)性不高 表7:超大單關(guān)注度因子與已有資金流因子相關(guān)性也不高 表8:因子4的公式定義 表9:相較于理想反轉(zhuǎn),標準化的分鐘成交量波動也可改進傳統(tǒng)反轉(zhuǎn)因子 13表10:時序極差ts_max_to_min的應(yīng)用 14表交易情緒不穩(wěn)定性因子在其他樣本空間依然具有一定選股能力 15表12:交易情緒不穩(wěn)定性因子與傳統(tǒng)Barra因子相關(guān)性不高 15表13:時序相關(guān)性算子ts_corr的應(yīng)用 15表14:主力控盤能力因子在其他樣本空間依然具有一定選股能力 16表15:主力控盤能力因子與傳統(tǒng)Barra因子相關(guān)性不高 16相較于傳統(tǒng)人工挖掘因子而言,遺傳算法和神經(jīng)網(wǎng)絡(luò)是當下較為流行的挖掘因子的機器學習模型。其中遺傳算法的優(yōu)點在于公式的可視化,每個因子均可用算子樹的形式展現(xiàn),供我們在有一定變量和算子儲備的前提下,最大程度的找到蘊含在背后的有效因子。本篇報告以遺傳算法為基礎(chǔ),結(jié)合我們已有的特色變量和算子,嘗試了量價因子的挖掘,具體從如下3大部分展開。在第一部分,我們介紹了遺傳算法框架。其中在算子部分,我們創(chuàng)新性地引入了切割算子,其是我們的招牌因子理想反轉(zhuǎn)、理想振幅等的來源;在變量部分,我們引入了日內(nèi)量價、日間量價以及資金流相關(guān)指標;在遺傳算法的具體流程上,我們從個體初始化到初始種群的生成,再到選擇、交叉、變異,每一步都做了對應(yīng)的針對性改寫,使其更加高效的進行因子挖掘。200RankICIR3.5RankICIR為5.528超大單關(guān)注度因子,是對我們以往資金流研究的重要補充;第二,針對于理想反轉(zhuǎn)和理想振幅而言,我們發(fā)現(xiàn)了替代的形式,豐富了收益率和振幅改進的手段;第三,我們利用日內(nèi)分鐘特征如分鐘收益波動、分鐘量價相關(guān)性,并結(jié)合算子“日間時序極差”定義了交易情緒不穩(wěn)定性因子進一步發(fā)現(xiàn)了時序相關(guān)性的更多可能。1、開源金工特色遺傳算法框架、算子的賦予:創(chuàng)造性引入切割算子4alpha方法。第三大類是橫截面和時序算子的結(jié)合,這一類組合算子的加入有兩點好處:1、減少公式長度的同時涵蓋更多信息;2、豐富算子多樣性。signdiff_signsign大類 例子 說明表1:四大類算子列示(部分)大類 例子 說明時序
切割算子
基本運算符 add、sub、mul、div等ols(x,y) yx取殘差基本運算符 ts_sum、ts_mean、ts_median、ts_corr、delay等rolling_selmean_btm(x,d,n) 在過去d日上,根據(jù)y的值對x進行排序,取最小n個x的平均rolling_selmean_top(x,d,n) 在過去d日上,根據(jù)y的值對x進行排序,取最大n個x的平均值在過去d日上,根據(jù)y的值對x進行排序,rolling_selmean_diff(x,d,n)
取最大n個x的平均值與最小n個x的平均值的差值橫截面和時序結(jié)合邏輯判斷資料來源:研究所
ts_max_to_min(x,d) dx時序求最大值和最小值,并做差ts_meanrank(x,d) xd日上取均值sign(x) x>0,返回1;x<0,返回-1;x=0時,返回0diff_sign(x,d) 先計算x與過去d日均值的差,再使用sign函、變量的遴選:大小單資金流、日內(nèi)分鐘特征、日間特征3此之外我們也加入了一些衍生特色指標,比如分鐘極端收益、分鐘聰明度等;第三大類 例子 說明表2:3大類變量列示(部分)大類 例子 說明大小單資金流日內(nèi)分鐘特征日間特征資料來源:研究所
時序標準化的全部資金流 含有超大單、大單、中單、小單時序標準化的主動資金流 含有超大單、大單、中單、小單基本統(tǒng)計指標 分鐘收益波動、分鐘標準化成交量波動、分鐘量價相關(guān)性衍生統(tǒng)計指標 分鐘極端收益、分鐘聰明度等基本統(tǒng)計指標 高、開、低、收等衍生統(tǒng)計指標 隔夜及日內(nèi)收益、單筆成交金額等、遺傳算法流程:針對性的改寫對于遺傳算法而言,除了變量和算子需要進行精細化處理,整體的流程也需要針對性的改寫,大致的流程主要分為如下5步:20601~10RankICIR,若個體長群RankR>2且互相關(guān)系數(shù)不超過40。40%,331圖1:開源金工特色遺傳算法整體流程資料來源:研究所2、遺傳算法的因子挖掘成果舉例、遺傳算法優(yōu)選綜合因子表現(xiàn)優(yōu)異200RankICIR3.552(20131231-20211231)RankICIR5.81RankICIR4.13RankICIR5.52。53.8328.33%85.09%圖2:遺傳算法優(yōu)選綜合因子回測曲線較為優(yōu)異數(shù)據(jù)來源:、研究所表3:遺傳算法優(yōu)選綜合因子在不同股票域的測試結(jié)果皆較為優(yōu)秀多空對沖多頭全市場滬深300中證500中證1000全市場滬深300中證500中證1000年化收益率28.33%9.55%12.50%23.34%20.73%8.81%10.09%17.65%年化波動率7.40%6.29%7.29%7.94%26.89%21.07%24.42%28.94%收益波動比3.831.521.712.940.770.420.410.61最大回撤4.23%6.04%8.18%10.16%34.82%39.93%44.15%39.25%月度勝率85.09%67.54%72.81%82.46%57.89%54.39%56.14%57.02%數(shù)據(jù)來源:、研究所、沙里淘金:遵循“可解釋”理念在上述的測算中,雖然整體的效果很好,但是遵循著“可解釋”的理念,我們把目光聚集在了對我們以往研究有所補充的一些因子,爭取從邏輯對其進行了一定程度的解釋。表4:遺傳算法精篩因子明細因子序號具體定義公式樣本內(nèi)樣本外全區(qū)間因子1ts_correlation(asharemoneyflow_s_diff_value,delay(stockquote_ret,1),10)-4.20-2.23-3.80因子2ts_meanrank(ols(stockquote_ret,asharemoneyflow_l_diff_value),10)3.891.463.44因子3rolling_selmean_diff(asharemoneyflow_exl_diff_value_act,asharemoneyflow_s_diff_value,20,4)2.162.702.19rank_add(rolling_selmean_diff(stockminute_std,stockquote_close,20,4),因子4-4.53-5.87-4.68ts_max_to_min(stockminute_std,10))因子5rolling_selmean_top(stockquote_ret,stockminute_volume_distribution,10,1)-3.02-3.26-3.01因子6ts_max_to_min(ts_mean_standard(stockminute_volume_distribution,3),5)-3.66-5.02-3.77因子7ts_max_to_min(stockminute_rv_corr,6)-3.55-2.29-3.32因子8ts_covariance(stockminute_volume_distribution,stockquote_zf,10)-3.77-2.79-3.64數(shù)據(jù)來源:、研究所3、因子3的精細化討論412123是新增的亮點而且和切割算子有關(guān),所以我們把目光主要集中在因子3的討論上。、主動超大單強度效果不佳535IC圖3:主動超大單強度5分組年化收益不單調(diào)數(shù)據(jù)來源:、研究所、“小單強度”切割“主動超大單強度”敏感性分析3(1)選擇小單強度較高的??交易日,計算主動超大單強度均值????????????_??????(??);(2)??交易日,計算主動超大單強度均值????????????_??????(??);從圖4??值的因子RnkCR1??????_???(????90%10%RankICIR(2)????????????_??????(??)??90%10%RankICIR絕通過回測我們發(fā)現(xiàn),主動超大單強度在不同小單強度域下,其蘊含的信息存在結(jié)構(gòu)性差異。在小單強度比較高的部分,主動大單強度呈現(xiàn)正向選股效果,而在小單強度比較低的部分,主動大單強度卻呈現(xiàn)負向選股效果。針對這一現(xiàn)象,我們嘗試從行為金融學的角度對其進行解釋:由于拆單現(xiàn)象的存在,小單中充斥著超大單的拆單產(chǎn)物,當機構(gòu)看好某只股票時,其往往會以小單進貨,再用具備足夠市場關(guān)注度的超大單來抬升市場情緒,從而達到抬升股價收獲利潤的目的,所以在小單強度較高處的超大單強度有正向選股效果;相反,若機構(gòu)不看好某只股票時,其往往會以小單出貨,為了防止市場恐慌,機構(gòu)往往會用超大單來穩(wěn)住情緒來完成平穩(wěn)出貨,所以在小單強度較低處的超大單強度有負向選股效果。本篇報告將這種現(xiàn)象稱之為:超大單的關(guān)注度效應(yīng)。圖4:不同??值下????????????_????????(??)和????????????_??????(??)的RankICIR績效數(shù)據(jù)來源:、研究所??為20%????????????_??????(20%)與????????????_??????(20%)5574.4%。圖主動超大單關(guān)注度子空收益波動比為2.08 圖主動超大單關(guān)注度子5分組年化收益單調(diào)數(shù)據(jù)來源:、研究所 數(shù)據(jù)來源:、研究所、“小單強度”切割“全部超大單強度”敏感性分析3.2??值下??????_??????(??)和??????_??????(??)RankICIR7(??????_????(??)??從9010RankCR逐漸增大,且幅度近似于????????????(??)(2)????????????(??):隨著切割比例??從90%減小至10%的過程中,其RankICIR絕對值逐漸增大,且幅度要大于????????????_??????(??)。圖7:不同??值下??????_????????(??)和??????_??????(??)的RankICIR績效數(shù)據(jù)來源:、研究所??20%??????_??????(20%)與58RankICIR2.88,52.6382.4%,相圖超大單關(guān)注度因子空益波動比為2.63 圖超大單關(guān)注度因子5分年化收益單調(diào)數(shù)據(jù)來源:、研究所 數(shù)據(jù)來源:、研究所53000.650.175001.070.3710001.72和0.48。表5:超大單關(guān)注度因子在其他樣本空間依然具有一定選股能力多空對沖多頭全市場滬深300中證500中證1000全市場滬深300中證500中證1000年化收益率16.20%4.65%7.03%12.88%14.95%3.80%8.99%14.33%年化波動率6.16%7.18%6.57%7.47%27.37%21.79%24.58%29.68%收益波動比2.630.651.071.720.550.170.370.48最大回撤6.24%10.84%6.69%14.36%47.31%48.16%54.02%56.02%月度勝率82.40%61.60%62.40%72.00%53.60%52.80%52.00%53.60%數(shù)據(jù)來源:、研究所Barra6620%720%表6:超大單關(guān)注度因子與傳統(tǒng)Barra因子相關(guān)性不高Beta價值杠桿盈利成長流動性動量非線性規(guī)模波動規(guī)模-8.66%-1.05%-6.43%1.34%0.52%-22.28%2.53%-4.10%-10.03%-13.98%數(shù)據(jù)來源:、研究所表7:超大單關(guān)注度因子與已有資金流因子相關(guān)性也不高主動買賣大單殘差小單殘差散戶羊群大單殘差2.0小單殘差2.0散戶羊群2.019.15%12.22%3.39%-10.4%8.64%2.20%-10.27%數(shù)據(jù)來源:、研究所4、因子4的精細化討論對于因子4而言,其全區(qū)間RankICIR可以達到-4.68,公式定義如下:因子序號 具體定義公式 樣本內(nèi)樣本外全區(qū)間表因子序號 具體定義公式 樣本內(nèi)樣本外全區(qū)間4
rank_add(rolling_selmean_diff(stockminute_std,stockquote_close,20,4),ts_max_to_min(stockminute_std,10))
-4.53 -5.87 -4.68數(shù)據(jù)來源:、研究所但是具體觀察其結(jié)構(gòu)可以發(fā)現(xiàn)其為復(fù)合型因子,可以拆解成如下兩部分:1、時序極差算子2、切割算子,這里我們將分別討論這兩部分。圖10:因子4原始公式的拆分資料來源:研究所、切割算子部分的討論42044首先計算了日內(nèi)分鐘收益波動過去20天均值,發(fā)現(xiàn)選股效果一般,5分組年化收益率為圖11所示,并不單調(diào)。圖11:日內(nèi)分鐘收益波動5分組年化收益不單調(diào)數(shù)據(jù)來源:、研究所進一步地,我們測算了不同股價下的日內(nèi)分鐘收益波動指標信息差異,方案如下所示:??????_??????(??);??????_??????(??);從圖2??值的因子ankCR(1??_????(??)??90%10%RankICIR(??????????????(????從9010RankCR??20%圖12:不同??值下????_????????(??)和????_??????(??)的RankICIR績效數(shù)據(jù)來源:、研究所??20%????_??????(20%)與為????_????????因子,其5分組績效測算如圖13所示。該因子整體績效較為優(yōu)異,RankICIR為-4.08,52.8379.82%。圖13:????_????????因子多空收益波動為2.83 圖14:????_????????因子5分組年化收益單調(diào)數(shù)據(jù)來源:、研究所 數(shù)據(jù)來源:、研究所相較于理想振幅因子,????_????????因子只是將振幅換成了分鐘收益波動率而已,80%。以此我們對比了新因子????_????????和理想振幅的選股效果,5分組多空對沖結(jié)果如圖15IR????_????????圖15:在多空IR值上????_????????略勝于理想振幅數(shù)據(jù)來源:、研究所5表9:相較于理想反轉(zhuǎn),標準化的分鐘成交量波動也可改進傳統(tǒng)反轉(zhuǎn)因子RANKICIR5分組多空IR多頭IR多頭年化收益多空年化收益單筆成交金額-2.892.460.5715.76%17.15%標準化的分鐘成交量波動-3.112.440.4913.32%13.17%數(shù)據(jù)來源:、研究所、時序極差算子4ts_max_to_min6710表10:時序極差ts_max_to_min的應(yīng)用變量RankICIR5分組多空IR多頭IR多頭年化收益多空年化收益分鐘收益波動-2.722.640.5715.91%15.23%標準化的分鐘成交量波動-3.382.700.5214.36%13.30%分鐘量價相關(guān)性-2.382.560.5715.64%12.35%數(shù)據(jù)來源:、研究所103A5IR10IR2.5最后我們將這3個因子進行rank,16為3.3584.2%。圖16:交易情緒不穩(wěn)定因多收益波動比為3.35 圖17:交易情緒不穩(wěn)定因子5組年化收益單調(diào)數(shù)據(jù)來源:、研究所 數(shù)據(jù)來源:、研究所所3001.480.395002.010.4310002.82和0.49。接著,我們探討了其與Barra風格因子的相關(guān)性,如表12所示。從表12可以看多空對沖多頭全市場滬深300中證500多空對沖多頭全市場滬深300中證500中證1000全市場滬深300中證500中證1000年化收益率18.89%8.14%11.33%17.66%17.68%8.64%10.80%14.54%年化波動率5.64%5.49%5.63%6.27%27.73%22.08%24.94%29.53%收益波動比3.351.482.012.820.640.390.430.49最大回撤3.67%7.92%3.34%6.25%40.75%43.29%46.61%49.29%月度勝率84.21%68.42%72.81%81.58%57.02%53.51%55.26%57.02%數(shù)據(jù)來源:、研究所表12:交易情緒不穩(wěn)定性因子與傳統(tǒng)Barra因子相關(guān)性不高Beta價值杠桿盈利成長流動性動量非線性規(guī)模波動規(guī)模6.03%-13.44%-4.09%-11.79%-2.37%18.09%-2.22%-4.77%22.98%-11.61%數(shù)據(jù)來源:、研究所5、因子8的精細化討論8一般來說,隨著日內(nèi)成交量波動的放大,日度振幅往往也會加大,不同股票的差別存在于幅度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版樣機試制合作協(xié)議
- 2024年出租車租車合同模板
- 懷孕期間夫妻分手協(xié)議
- 城市軌道交通工程建筑信息模型(BIM)分類與編碼標準
- 建筑行業(yè)標準腳手架租賃合同
- 2024項目投資合同撰寫要點
- 購買混凝土合同范本
- 生物中圖版自主訓(xùn)練:第三單元第一章第一節(jié)遺傳物質(zhì)的發(fā)現(xiàn)
- 簡單的賠償協(xié)議書2024年
- 2024屆畢業(yè)生就業(yè)協(xié)議書樣本
- 小學語文人教三年級上冊 群文閱讀《奇妙的中心句》
- 大數(shù)據(jù)和人工智能知識考試題庫600題(含答案)
- 2023年上海機場集團有限公司校園招聘筆試題庫及答案解析
- 鏡頭的角度和方位課件
- 污水處理常用藥劑簡介知識講解課件
- 五年級上冊英語課件-Unit 1《My future》第1課時牛津上海版(三起) (共28張PPT)
- 光交接箱施工規(guī)范方案
- 氣溫和降水學案
- 普及人民代表大會制度知識競賽試題庫(1000題和答案)
- 國家電網(wǎng)公司施工項目部標準化管理手冊(2021年版)線路工程分冊
- 《汽車低壓線束設(shè)計規(guī)范》
評論
0/150
提交評論