基于基金特征與機(jī)器學(xué)習(xí)的選基研究_第1頁
基于基金特征與機(jī)器學(xué)習(xí)的選基研究_第2頁
基于基金特征與機(jī)器學(xué)習(xí)的選基研究_第3頁
基于基金特征與機(jī)器學(xué)習(xí)的選基研究_第4頁
基于基金特征與機(jī)器學(xué)習(xí)的選基研究_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

研究導(dǎo)讀目前市場上的基金投資者主要根據(jù)基金的收益類指標(biāo)風(fēng)險類指標(biāo)績效評價標(biāo)準(zhǔn)化標(biāo)來選擇基金,而基金定期披露的基金基本信息,例如基金規(guī)模、基金費用率、基金運作時間基金經(jīng)理任期等指標(biāo)鮮有關(guān)注。其原因主要是因為以上基金基本信息同基金未來收益的關(guān)系不夠直觀,線性相關(guān)性較弱,簡單運用以上指標(biāo)難以預(yù)測基金的未來收益。然而線性相關(guān)性較弱并不意味著基金基本信息與基金未來收益無關(guān)二者可能存在非性的相關(guān)關(guān)系考慮到非線性相關(guān)性難以求解我們將使用決策樹挖掘基金基本信息與基金未來收益的相關(guān)關(guān)系。在此基礎(chǔ)上,為了提高預(yù)測精度,避免過擬合,我們將通過隨機(jī)森林集成決策樹的預(yù)測結(jié)果。在本文的第一部分我將使基金定期披露的基本信息通過決策樹與隨機(jī)森林算法,預(yù)測基金的未來收益,逐期篩選出優(yōu)質(zhì)基金,構(gòu)建投資組合。通過對比組合與基準(zhǔn)收益,探討通過基金基本信息能否有效選基。在本文的第二部分,在基金基本特征的基礎(chǔ)上,我們將在模型中加入常用于量化選基線性相關(guān)性較強(qiáng)的特征,以期進(jìn)一步提升模型的選基性能。標(biāo)簽及特征構(gòu)建在標(biāo)簽與特征的選擇上我們借鑒了MililBzgls與Sat()的思路與方法,共選用6個基金基本特征來預(yù)測基金收益??紤]到部分基金基本信息僅基金中報與基金年報中披露,為充分利用基金特征信息,降低換倉成本,我們采用雙報季調(diào)倉策略,每年僅在中報與年報披露截止日期后進(jìn)行調(diào)倉。針對不同披露頻率的數(shù)據(jù),根據(jù)不同頻率的調(diào)倉策略,需要對數(shù)據(jù)進(jìn)行調(diào)頻。為方便后續(xù)調(diào)頻與說明,以下數(shù)據(jù)均以月度數(shù)據(jù)為例。倘若數(shù)據(jù)僅在季報、中報、年報中披露更新則根據(jù)對應(yīng)披露截止日期向后填充為月度數(shù)據(jù)。標(biāo)簽由于我們的目標(biāo)是通過預(yù)測基金未來收益,從而篩選優(yōu)質(zhì)基金,故我們選用基金未來一個月的收益率 作為訓(xùn)練的標(biāo)簽。特征根據(jù)基金定期披露的基本信息,我們一共生成了6個特征用來預(yù)測基金的未來收益其中個別特征的計算方法需要特別說明?;鹳Y金流入率基金在 月的基金凈現(xiàn)金流計算方法如下:(1)其中為基金當(dāng)月凈資產(chǎn)為基金當(dāng)月凈值增長率該指標(biāo)主要用來衡量剔除基金持有證券市場價值變動的情況下,基金資金流入的比率。超額收α我們將基金在 月的超額收益 定義為FmaFch5因子模(Fma&Fc,)超額收益:()其中, 代表無風(fēng)險收益率,代表因子收益率,代表殘差。我們使用6個月滾動窗口,通過S估計參數(shù),計算基金的月度超額收益。價值增量基金在 月的基金凈現(xiàn)金流計算公式如下:(3)其中,為上述基金月度超額收益,代表基金費用率,即總費用除以基金凈資產(chǎn)價值增量用來衡量在不考慮基金運作費用的情況下基金在一段時間內(nèi)取得的超額價值其它特征為方便查閱,我們將訓(xùn)練決策樹模型所需的全部特征羅列如下,共計6個訓(xùn)練特征。除基金凈值每日更新以,計算其特征原始數(shù)據(jù)均來自基金定期報告基金費用相關(guān)數(shù)據(jù)僅在中報與年報中詳細(xì)披露,需根據(jù)對應(yīng)的報告期進(jìn)行調(diào)整;其它數(shù)據(jù)均在基金季報更新表1:訓(xùn)練特征明細(xì)特征定義α通過公式()計算得到的基金超額收益fw通過公式()計算得到的基金資金流入率ved通過公式()計算得到的基金價值增量vyffwfw的標(biāo)準(zhǔn)差A(yù)基金凈資產(chǎn)基金費用率,基金總費用除以基金凈資產(chǎn)基金運作時間特征定義rre基金在任基金經(jīng)理平均任期rvrro基金換手,賣出股票總收入與買入股票總支出的較小值與基金凈資產(chǎn)之比a-starch5模型中,超額收益α的t統(tǒng)計量T-starch5模型中,市場因子收益率的t統(tǒng)計量W-starch5模型中,盈利因子收益率的t統(tǒng)計量A-starch5模型中,投資因子收益率的t統(tǒng)計量B-starch5模型中,規(guī)模因子收益率的t統(tǒng)計量L-starch5模型中,價值因子收益率的t統(tǒng)計量2arch5模型的可決系數(shù)RN,整理決策樹與隨機(jī)森林決策樹型根據(jù)決策樹預(yù)測輸出結(jié)果的不同決策樹可以分為分類樹和回歸樹兩類。當(dāng)我們預(yù)測結(jié)果為類別時,需要使用分類樹;當(dāng)我們預(yù)測的結(jié)果為一個實數(shù)時,需要使用回歸樹。決策樹模型的核心邏輯是根據(jù)度量標(biāo)準(zhǔn),從樹根開始,選擇最優(yōu)特征逐級分裂,遞推成一顆完整的決策樹。以分類樹為例,分裂遵循以下兩條停止條件:某個分支中的所有樣均屬一類;已無可供繼續(xù)分裂的特征。業(yè)界目前大多會使用以下三種度量指標(biāo)作為分裂標(biāo)準(zhǔn):信息增益:對應(yīng)算法稱第3代迭代二叉樹;信息增益比:對應(yīng)算法稱第.5代分類樹(.;基尼系數(shù):對應(yīng)算法稱回歸分類樹(A只有回歸分類樹(A)既可以解決分類問題又可以解決回歸問題,由于我們的目是通過基金基本特征預(yù)測基金未來收益,在此我們著介紹AT回歸樹。ART回歸樹采用最小化平方殘差(Seofsidl)作為分裂標(biāo)準(zhǔn)。我們可以簡單地將一個回歸樹模型表示為:其中, 代表任意一組特征取值;整個數(shù)據(jù)空間被劃分成共 單元,每個單上都有一個固定的輸出值 。圖1:T回歸樹數(shù)據(jù)來源整理在此基礎(chǔ)上,給定特征取值,模型預(yù)測輸出值與真實值的總誤差為:為了最小化預(yù)測誤差,需要在每個單元上尋找合適的 ,易知當(dāng) 取對應(yīng)單元所有真實值的平均值時,預(yù)測誤差最小,即為了構(gòu)造一棵完整的回歸樹,我們還需要明白如何劃分?jǐn)?shù)據(jù)空間。我們?nèi)稳√卣髯鳛榍蟹肿兞?,特征的取值作為切分點,由此我們將得到兩個區(qū)域:給定和,我們要尋找兩個區(qū)域的代表值 和 另各自區(qū)間上的平方差最?。何覀冎?, 取各自區(qū)間上真實值的平均值就可以最小化預(yù)測誤差,即那么實際上只要給定特征我們就可以遍歷特征所有的切分點計算每個切分點對應(yīng)的最小預(yù)測誤差從而找到最優(yōu)切分點;在此基礎(chǔ)上,我們可以遍歷所有的特征,計算每個特征最優(yōu)切分點下的最小預(yù)測誤差從而找到最優(yōu)切分特征。這樣我們就可以得到最優(yōu)分特征與最優(yōu)切分點及其對應(yīng)的最優(yōu)切分。重復(fù)以上步驟直至節(jié)點中的樣本個數(shù)小于預(yù)定閾值,或樣本集平方誤差小于預(yù)定閾值或沒有更多特征可供分裂,我們就可以生成一棵完整的AT回歸樹。隨機(jī)森集成算法與其它機(jī)器學(xué)習(xí)模型一樣,決策樹也可能出現(xiàn)欠擬合或過擬合問題。本文中我們將過隨機(jī)森林mFst)集成算法來規(guī)避這一問題。隨機(jī)森林的核心邏輯是通過重置抽樣的方式隨機(jī)采樣隨機(jī)構(gòu)造多個樣本在每個樣本上生成決策樹最終將隨機(jī)森林中每顆決策樹的預(yù)測結(jié)果通過等權(quán)的方式合成形成最預(yù)測結(jié)論。圖2:隨機(jī)森林集成算法數(shù)據(jù)來源整理由于隨機(jī)采樣的過程保證了隨機(jī)性,隨機(jī)森林中既有預(yù)測能力極強(qiáng)的強(qiáng)樹(過擬合也有預(yù)測能力較弱的弱樹(欠擬合,當(dāng)隨機(jī)森林中的樹足夠多時,過擬合與欠擬合的預(yù)結(jié)果相互抵消,從而保證了最終預(yù)測結(jié)果的穩(wěn)定。為了降低隨機(jī)樹之間的相關(guān)性提高模型的預(yù)測性能我們需要提高隨機(jī)樣本的隨機(jī)性因此在進(jìn)行重置抽樣時我們既要在樣本上隨(行采樣即我們從含有個原始樣本的樣本集中以重置抽樣的方式自助采樣出一個新的含有個樣本的樣本集;我們也要在特征上隨機(jī)(列采樣,即在全部的個特征中,每次自助采樣只隨機(jī)選擇其中的個特征。實證檢驗樣本期為//31至2//,基金池為全部普通股票基金與偏股混合基金??紤]到實際交易因素,我們剔除了C類、B類、O類、H類、R類的基金;與此同時,由于我們需要通過6個月滾動窗口估計基金在FF5因子模型下的超額收益我們也剔除了運作不滿6個月的權(quán)益基金。由于采用雙報季調(diào)倉策略每年僅在中報與年報披露截止日期后進(jìn)行調(diào)倉因此需要月頻數(shù)據(jù)做變頻處理其中標(biāo)簽使用基金雙報披露截止日期之間的累計收益;特征超額收α通過雙報披露截止日期之間的月度數(shù)據(jù)加總求和變頻;基金資金流入率lw與價值增量lueded通過雙報披露截止日期之間的月度數(shù)據(jù)求解平均值變頻;其它特征均使用雙報披露截止日期當(dāng)月月度數(shù)據(jù)進(jìn)行變頻。特征相性分析為考察特征與標(biāo)簽之間的線性相關(guān)性,我們計算了標(biāo)簽與特征間的相關(guān)系數(shù)矩陣如下從矩陣的左邊第一列可以得出,基于FF5模型計算的基金超額收益、基金凈資產(chǎn)、基金運作時間、超額收益的t統(tǒng)計量跟基金未來收益的線性相關(guān)性較強(qiáng),而基金資金流入率、價值增量、資金流入波動率、基金費用率、在任基金經(jīng)理的平均任期、換手率以及FF5型中各因子收益率的t統(tǒng)計量與可決系數(shù)與基金未來一期的收益線性相關(guān)性較低。表2:相關(guān)系數(shù)矩陣標(biāo)簽與特征rαowaeaddedoaiiyofowAERageaagereeoeraioapasatKTsatWsatCAsatSBsatLsatr-α005-000005-e000054003-iyf001000077000-TNA008017003046002-000012010009000022-004004005002005024008-aaerteure001014003011003020010040-r001004003001006010026009006-alhat-tat006089005047000011011005013003-MTt-tat002017004013002005006005009004013-RWt-sat002018001011001008005003000002021006-CAt-tat001017003008001006004004002002017004035-SBt-sat000009002001000003004001004000010033023022-HL-stt001007001002000000001000004000008011013047054-000012005011002005004006009004008076004019012003萬得整理回溯測試在訓(xùn)練模型前,對標(biāo)簽及全部特征在截面上進(jìn)行標(biāo)準(zhǔn)化處理,缺失值均以0填充。每期我們選用過去5年的歷史數(shù)據(jù),通過重置抽樣,每次從6個特征中隨機(jī)選擇9特征訓(xùn)練AT回歸樹,構(gòu)造包含0棵隨機(jī)樹的隨機(jī)森林,最終根據(jù)當(dāng)期特征取值,預(yù)測基金未來一期的收益??紤]到需要通過6個月滾動窗口估計FF5模型下基金的超額收益與因子收益率并且每期我們還需使用過去5年的歷史數(shù)據(jù)訓(xùn)練模型因此我們首次預(yù)測基金未來收益并以此基礎(chǔ)進(jìn)行調(diào)倉的時刻為//。預(yù)測穩(wěn)定性在模型回測的過程中我們最關(guān)注的是模型的泛化能力即模型在訓(xùn)練樣本外的預(yù)測力,我們可以通過包外估計驗證模型的泛化能力。對樣本數(shù)量為的數(shù)據(jù)集通過重置抽樣進(jìn)行自助采樣,如果采樣集的樣本數(shù)量也為那么沒有被選到的樣本約占 ,當(dāng)很大時,有以下極限這意味著,每做一次自助采樣,初始訓(xùn)練集中約有.%的數(shù)據(jù)被選作訓(xùn)練數(shù)據(jù)剩余.%沒有被選入的數(shù)據(jù)就可以作為驗證數(shù)據(jù)。根據(jù)驗證數(shù)據(jù),我們就可以計算模型在樣本外的預(yù)測誤差,從而考察模型的泛化能力。為了考察模型預(yù)測的穩(wěn)定性我們繪制了隨機(jī)森林中隨機(jī)樹的數(shù)量同包外預(yù)測誤差之間的變化示意圖(以//322//31為例。如圖所示,伴隨著隨機(jī)樹數(shù)量的逐步增加,模型包外誤差逐步降低至收斂。這意味著,選用0棵隨機(jī)樹構(gòu)筑隨機(jī)森林足以保證模型預(yù)測的穩(wěn)定性。圖3:隨機(jī)樹數(shù)量與模型包外預(yù)測誤差變化示意圖050505050 0 0 0 0 0 0 0 0 0 包外預(yù)測誤差萬得整理分組檢驗選用過去五年歷史數(shù)據(jù)進(jìn)行滾動預(yù)測,可以逐期得到模型預(yù)測的基金收益率為了考察模型的選基性能,我們對模型預(yù)測的基金收益率進(jìn)行了分組檢驗,根據(jù)預(yù)測收益率的大小將基金平均分為5組,分別逐期計算組內(nèi)平均收益,樣本期內(nèi)各組累計凈值如下。圖4:分組檢驗累計凈值0 0 0 0 0 0 0 0 0 0 01 2 組3 4 5數(shù)據(jù)來源萬得整理如圖所示,組1到組,伴隨著模型預(yù)測收益率的逐步增大除組2與組3的累計凈值出現(xiàn)交錯以外,各組累計凈值呈現(xiàn)出顯著的單調(diào)性,組1與組5多空收益顯著表明模型測收益對基金未來實際收益有較好的區(qū)分作用。信息系數(shù)分析為了進(jìn)一步考察模型預(yù)測收益的有效性我們對其進(jìn)行了信息系數(shù)分析。信息系數(shù)是指當(dāng)期收益預(yù)測值與下期基金實際收益之間的Sman相關(guān)系數(shù),C越大,模型對基金下期收益率的預(yù)測作用也就越強(qiáng)。信息系數(shù)分析的結(jié)果見下表。表3:信息系數(shù)分析結(jié)果C均值C標(biāo)準(zhǔn)差t統(tǒng)計量C與均值同向的比例預(yù)測基金收益*7%5數(shù)據(jù)來源萬得整理在樣本期內(nèi)模型預(yù)測基金收益的kC均值為.在置信水平%上強(qiáng)烈拒絕C均值為0的原假設(shè),C與均值同向的比例高達(dá).4,IR比率(C均值除以標(biāo)準(zhǔn)差)為.根據(jù)信息系數(shù)分析的結(jié)果我們可以判斷模型對基金下期收益具備較強(qiáng)的預(yù)測作用。為了進(jìn)一步展示樣本期內(nèi)模型的預(yù)測表現(xiàn)我們繪制了模型預(yù)測基金收益的累計信息數(shù)變化示意圖。28642186420數(shù)據(jù)來源萬得整理如圖所示在樣本期上除//31期累計信息系數(shù)出現(xiàn)回撤模型預(yù)測收益累計保持相對穩(wěn)定的速度持續(xù)增長,表明樣本期內(nèi)模型預(yù)測表現(xiàn)穩(wěn)定。324選基策略根據(jù)模型逐期的預(yù)測結(jié)果,每期選擇預(yù)測收益最高的0只基金構(gòu)建多頭組合,以等方式計算組合收益。由于基金池為普通股票型基金與偏股混合型基金,選擇普通股票基金指數(shù)偏股混合基金指數(shù)、滬深0指數(shù)作為比較基準(zhǔn)樣本期內(nèi)策略多頭組合同各比較基準(zhǔn)的收益表現(xiàn)如下表所示。表4:多頭組合收益表現(xiàn)收益評價指標(biāo)策略多頭普通股票型基金偏股混合型基金滬深平均月收益率%%%%年化收益率%%%%re比率5最大回撤率%%%%月勝率%%%%數(shù)據(jù)來源萬得整理策略多頭組合年化收益率.9,最大回撤率.6,Shre比率.,月勝率.0各類收益評價指標(biāo)顯著優(yōu)于普通股票型基金指數(shù)偏股混合型基金指數(shù)滬深指數(shù)。同比普通股票型基金指數(shù),年化超額收益率為.。樣本期內(nèi)策略多頭相較于三大基準(zhǔn)指數(shù)凈值變化如下所示。圖6:策略多頭累計凈值8.57.56.55.54.53.52.51.50.5頭 型 型 300如圖所示,自//30至0//3,策略多頭實現(xiàn)凈值.,顯著優(yōu)于普通股票型基金指數(shù)(.、偏股混合型基金指數(shù)(.、滬深0指數(shù)(.特征重性分析線性模型可以通過相關(guān)系數(shù)的大小判斷特征的重要性而非線性模型判斷特征的重要相對困難隨機(jī)森林雖然是非線性模型但隨機(jī)森林的一大優(yōu)勢就是可以通過置換檢驗判特征對預(yù)測的重要性。置換檢驗的核心思想是:如果特征是重要特征,那么將特征替換為白噪聲后,模的預(yù)測誤差會上升,模型的性能會下降。前文提到每次通過重置抽樣自助取樣時,約有/3的數(shù)據(jù)入選訓(xùn)練數(shù)據(jù)用來生成隨機(jī)樹,仍有/3的包外B數(shù)據(jù)未被選入,我們既然可以通過B數(shù)據(jù)計算包外預(yù)測誤差來判斷模型的泛用性,那么我們也可以通過計算B數(shù)據(jù)置換前后隨機(jī)樹的預(yù)測誤差來評估特征的重要性。假設(shè)我們的隨機(jī)森林中共有棵隨機(jī)樹,特征重要性的計算公式為其中,代表隨機(jī)樹的預(yù)測誤差,代表包外數(shù)據(jù),代表置換為白噪聲的外數(shù)據(jù)。如果將特征替換為白噪聲后,模型的預(yù)測誤差大幅增加,說明特征對模型的測結(jié)果非常關(guān)鍵,那么特征就是一個重要特征。通過置換檢驗,我們逐期計算了6個特征對預(yù)測基金收益的重要性,將重要性逐期疊加作為整個樣本期的特征重要性。我們也計算了樣本期內(nèi)6個特征與基金下期收益的相關(guān)系數(shù)(絕對值)作為可比對象。圖7:隨機(jī)森林特征重要性 圖8:線性模型特征重要性500000500000..

Radomorest

.9 .8.7.6.5.4.3.2.1.0Correlaion(Abs)如圖所示盡管每期各個特征的重要性有所差別但從整個樣本期來看,在隨機(jī)森林型中,6個特征對模型的預(yù)測結(jié)果均有顯著影響,這意味著6個特征均與基金的未來收益息息相關(guān),使用隨機(jī)森林預(yù)測基金的未來收益將會充分利用6個特征中所蘊含的信息;其中基金資金流入波動率基金凈資產(chǎn)基金費用率基金運作時間在任基金經(jīng)理平均任期、換手率是對預(yù)測相對來講最重要的6個特征。相反,在線性模型中僅有基金超額收益基金凈資產(chǎn)基金運作時間基金超額收益的t統(tǒng)計量與基金未來收益有明顯的相關(guān)關(guān)系,其它特征,例如價值增量、基金費用率、換手率、FF5模型可決系數(shù)在線性模型中難以發(fā)揮預(yù)測作用。為了進(jìn)一步考察線性相關(guān)性較低的基金特征能否有效選基在模型中我們剔除了基金超額收益、基金凈資產(chǎn)、基金超額收益的t統(tǒng)計量,重新訓(xùn)練模型,預(yù)測基金的下期收益。我們對模型預(yù)測的基金收益再次進(jìn)行了信息系數(shù)分析以同樣的方式我們再次構(gòu)建多頭策略信息系數(shù)分析的結(jié)果與樣本期內(nèi)策略多頭凈值變化情況如下所示。表5:剔除線性特征信息系數(shù)分析結(jié)果C均值C標(biāo)準(zhǔn)差t統(tǒng)計量C與均值同向的比例預(yù)測基金收益*0%3圖9:剔除線性變量策略多頭累計凈值 4.53.52.51.50.5策略多頭 普通股票型 偏股混合型 滬深剔除線性相關(guān)性較強(qiáng)的特征后,盡管模型的性能有所下降,但依舊擁有顯著的基金篩選能力因此我們可以得出結(jié)論線性相關(guān)性較低的基金特征與基金未來的收益依舊密切相關(guān)通過隨機(jī)森林模型,使用線性相關(guān)性較低的基金特征依舊可以有效選基。4模型完善前面我們已經(jīng)證明了通過非線性特征與決策樹隨機(jī)森林模型可以有效選基然而決策模型與隨機(jī)森林算法中既可以有線性特征也可以包含非線性特征在模型中引入與基金未來收益線性或非線性相關(guān)性更強(qiáng)的特征可以進(jìn)一步提升模型的選基性能。我們將部分常用于量化選基的線性特征引入模型并根據(jù)特征的重要性對部分非線性征進(jìn)行了調(diào)整,最終模型涵蓋的訓(xùn)練特征明細(xì)如下所示。表6:線性特征明細(xì)特征定義α通過公式()計算得到的基金超額收益A基金凈資產(chǎn)xp基金近6月最大漲幅xwn基金近1年最大回撤m基金過去1年收益動量R基金近1年信息比率t基金份額萬得整理表7:非線性特征明細(xì)特征定義fw通過公式()計算得到的基金資金流入率ved通過公式()計算得到的基金價值增量vyffwfw的標(biāo)準(zhǔn)差基金費用率,基金總費用除以基金凈資產(chǎn)基金運作時間rvrro基金換手,賣股票收入買入股票總支出的較小值與基金凈資產(chǎn)之比T-starch5模型中,市場因子收益率的t統(tǒng)計量W-starch5模型中,盈利因子收益率的t統(tǒng)計量B-starch5模型中,規(guī)模因子收益率的t統(tǒng)計量L-starch5模型中,價值因子收益率的t統(tǒng)計量RN,整理類似的,每期我們選用過去5年的歷史數(shù)據(jù),通過重置抽樣,每次從特征中隨機(jī)選擇0個特征訓(xùn)練ART回歸樹構(gòu)造包含0棵隨機(jī)樹的隨機(jī)森林最終根據(jù)當(dāng)期特征取值,預(yù)測基金未來一期的收益。模型預(yù)測基金收益信息系數(shù)分析結(jié)果如下所示。表8:引入線性特征模型信息系數(shù)分析結(jié)果C均值C標(biāo)準(zhǔn)差t統(tǒng)計量C與均值同向的比例預(yù)測基金收益*5%1在樣本期內(nèi),模型預(yù)測基金收益的kC均值為.,在置信水平%上強(qiáng)烈拒絕C均值為0的原假設(shè),C與均值同向的比例高達(dá).%,R比率為.。根據(jù)預(yù)測基金收益,逐期選擇表現(xiàn)最好的5只基金構(gòu)建多頭組合,樣本期內(nèi)策略凈值表現(xiàn)如下。圖10:引入線性特征策略多頭累計凈值10.59.58.57.56.55.54.53.52.51.50.5策略多頭 普通股票型 偏股混合型 滬深表9:引入線性特征模型多頭組合收益表現(xiàn)收益評價指標(biāo)策略多頭普通股票型基金偏股混合型基金滬深平均月收益率%%%%年化收益率%%%%re比率1最大回撤率%%%%月勝率%%%%策略多頭組合年化收益率.7,最大回撤率.0,Shre比率.,月勝率.8。同比普通股票型基金指數(shù),年化超額收益率為.5。引入線性特征后,模型選基能力顯著提升??偨Y(jié)與展望本文立足于基金基本面,一共構(gòu)造了6個特征,通過決策樹模型與隨機(jī)森林算法,測基金下期收益。在樣本期(//12//,模型預(yù)測基金收益的C均值為.,在置信水平%上強(qiáng)烈拒絕C均值為0的原假設(shè),C與均值同向的比例高達(dá).4,R比率(C均值除以標(biāo)準(zhǔn)差)為.,模型預(yù)測基金收益具備顯著的選基能力。以此為基礎(chǔ)我們基于模型預(yù)測基金收益構(gòu)建了選基策略并對策略進(jìn)行了回測。在樣本期內(nèi),策略多頭組合年

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論