金融數(shù)據(jù)分析-以Python為工具 課件 11、12 量化投資多因子模型分析、個(gè)人貸款信用風(fēng)險(xiǎn)評估_第1頁
金融數(shù)據(jù)分析-以Python為工具 課件 11、12 量化投資多因子模型分析、個(gè)人貸款信用風(fēng)險(xiǎn)評估_第2頁
金融數(shù)據(jù)分析-以Python為工具 課件 11、12 量化投資多因子模型分析、個(gè)人貸款信用風(fēng)險(xiǎn)評估_第3頁
金融數(shù)據(jù)分析-以Python為工具 課件 11、12 量化投資多因子模型分析、個(gè)人貸款信用風(fēng)險(xiǎn)評估_第4頁
金融數(shù)據(jù)分析-以Python為工具 課件 11、12 量化投資多因子模型分析、個(gè)人貸款信用風(fēng)險(xiǎn)評估_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Python金融數(shù)據(jù)分析量化投資多因子模型分析Chapter1111.1量化投資簡介量化投資是一種以數(shù)據(jù)為基礎(chǔ)、以策略模型為核心、以程序化交易為手段的投資方法。量化投資摒棄了傳統(tǒng)的完全依賴投資者的經(jīng)驗(yàn)和直覺的投資方式,而是將投資者的投資思想、投資經(jīng)驗(yàn)、投資直覺融入模型。利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)等技術(shù),通過對宏觀、基本面、市場行為、交易等各類金融數(shù)據(jù)的分析建立模型,基于歷史數(shù)據(jù)對模型進(jìn)行驗(yàn)證和改進(jìn),通過模型給出交易信號并自動下單交易。11.1量化投資簡介量化投資有許多自身的特點(diǎn),具體表現(xiàn)在:1) 紀(jì)律性以定量化和不可臨時(shí)更改為特點(diǎn)的紀(jì)律性能夠克服人性貪婪、恐懼、僥幸等弱點(diǎn),量化投資的決策具有可重復(fù)性和可回溯性。2) 系統(tǒng)性量化投資的數(shù)據(jù)處理是通過計(jì)算機(jī)完成的,計(jì)算機(jī)的海量數(shù)據(jù)處理能力使得量化投資能對市場進(jìn)行全面、深入的分析。11.1量化投資簡介3) 及時(shí)性通過計(jì)算機(jī)實(shí)時(shí)捕捉信息,量化投資策略能對市場做出迅速及時(shí)的反應(yīng),準(zhǔn)確客觀評價(jià)交易機(jī)會。在高頻交易中量化投資的及時(shí)性體現(xiàn)得更加明顯。4) 分散化量化投資是非常注重風(fēng)險(xiǎn)控制的,其中一個(gè)維度是利用其系統(tǒng)性的優(yōu)勢,通過構(gòu)建分散化的投資組合降低風(fēng)險(xiǎn)。另一個(gè)維度是通過積累多筆交易以概率取勝。11.1量化投資簡介5) 捕捉套利機(jī)會量化投資通過全面、系統(tǒng)性的掃描捕捉短暫的市場失效或者定價(jià)偏差帶來的機(jī)會,構(gòu)建套利組合獲取低風(fēng)險(xiǎn)收益。投資手段的不同并不意味著投資理念和投資策略的好壞,也不意味著投資結(jié)果的好壞。量化投資不是萬能的,其投資策略本身也是人為制定的,仍然需要結(jié)合投資者的經(jīng)驗(yàn)和市場邏輯進(jìn)行分析,才能更好地抓住獲利的機(jī)會。11.1.3量化投資策略簡介按照不同的分類方式,存在各種不同的量化策略。(1)根據(jù)交易品種分類,量化投資策略可以分為股票策略、CTA(commoditytradingadvisor)策略、期權(quán)策略等。(2)根據(jù)盈利模式分類,量化投資策略可以分為單邊多空策略、對沖策略和套利策略等。(3)根據(jù)策略功能分類,量化投資策略可以分為選股策略、擇時(shí)策略、倉位管理策略和風(fēng)險(xiǎn)控制策略等。策略和非高頻策略。11.1.3量化投資策略簡介量化投資首先要解決投資組合構(gòu)建問題,在股票投資上就是指買什么股票,以及資金如何分配。常見的選股模型有多因子選股、風(fēng)格輪動選股、行業(yè)輪動選股、趨勢追蹤選股、一致預(yù)期選股和動量反轉(zhuǎn)選股。其次是擇時(shí)問題,指的是對趨勢的判斷和買賣時(shí)機(jī)的把握,也就是何時(shí)買賣的問題。常見的擇時(shí)模型有趨勢量化擇時(shí)、市場情緒量化擇時(shí)、有效資金量化擇時(shí)和機(jī)器學(xué)習(xí)方法擇時(shí)等。再次是倉位管理,也就是每次買多少,賣多少,留多少資金。常見的倉位管理方法有漏斗型倉位管理法、矩形倉位管理法、金字塔形倉位管理法、凱利公式倉位管理等。最后是止盈止損,決定在盈利或虧損達(dá)到什么程度時(shí)該提前離場和及時(shí)增減倉位。止盈止損又可分為靜態(tài)和動態(tài)兩類,具體有限價(jià)止損、階梯止損、回撤止損、吊燈止損、ATR(averagetruerange)止損等。11.1.3量化投資策略簡介(4)根據(jù)策略本身的邏輯分類,量化投資策略可以分為指數(shù)增強(qiáng)、多因子選股、風(fēng)格輪動、行業(yè)輪動、趨勢追蹤、一致預(yù)期、動量反轉(zhuǎn)、均線策略、通道策略、海龜策略等。(5)根據(jù)交易頻率分類,量化投資策略可以分為高頻策略和非高頻策略。高頻策略在日內(nèi)短時(shí)持倉,依賴高端的計(jì)算機(jī)系統(tǒng)和算法,以毫秒級的速度執(zhí)行交易。其中算法交易是高頻策略的代表,專注于訂單的執(zhí)行過程,通過交易訂單的拆細(xì),降低交易的沖擊成本、隱藏交易行為并以最優(yōu)的方式高效完成交易。量化投資策略的開發(fā)量化策略的開發(fā)是一個(gè)循環(huán)的過程,以下我們具體介紹各個(gè)環(huán)節(jié)的內(nèi)容:策略建模模型是量化策略的核心,構(gòu)建一個(gè)策略的重要目標(biāo)就是構(gòu)建模型?;咀龇閺氖袌鲞壿嫵霭l(fā),提出策略的基本構(gòu)想,找到一個(gè)模型對策略構(gòu)想進(jìn)行刻畫和實(shí)現(xiàn)。策略實(shí)現(xiàn)量化策略以程序化交易為手段,最終需要把建好的模型通過具體的程序代碼進(jìn)行實(shí)現(xiàn)。主流的用于實(shí)現(xiàn)量化投資策略的計(jì)算機(jī)語言有Python、C++、Matlab等。策略實(shí)現(xiàn)通常需要在量化投資平臺上進(jìn)行,量化投資平臺通常會提供完善的數(shù)據(jù)接口、下單通道、策略回測和評價(jià)等功能。策略回測實(shí)現(xiàn)好策略后,很重要的環(huán)節(jié)是策略回溯測試,簡稱回測。策略回測指用歷史數(shù)據(jù)擬合策略模型并進(jìn)行模擬交易,目的是尋找最合適的模型超參數(shù)以及評估策略的效果。量化投資策略的開發(fā)為了保證策略回測的客觀性,需要注意以下幾點(diǎn):回測時(shí)需考慮交易稅費(fèi)、交易滑點(diǎn)、股票價(jià)格復(fù)權(quán)等實(shí)際交易環(huán)境因素,盡量使回測接近實(shí)盤情形。一般的量化回測平臺都支持這些參數(shù)的設(shè)置。嚴(yán)格區(qū)分樣本內(nèi)和樣本外數(shù)據(jù)。從抽象的角度敘述就是用于訓(xùn)練模型的數(shù)據(jù)不能用于模型測試。例如,不可以在某段時(shí)間區(qū)間內(nèi)挑選出最好的股票,又在相同的時(shí)間區(qū)間進(jìn)行回測。當(dāng)然,實(shí)際中的這類錯(cuò)誤不會這么明顯,往往存在于一些難以發(fā)現(xiàn)的細(xì)節(jié)中。避免前視偏差。前視偏差指策略中用到了未來的信息,也稱為未來函數(shù)。避免幸存者偏差。幸存者偏差指經(jīng)過優(yōu)勝劣汰之后,人們只能觀察到幸存者,未幸存者已無法發(fā)聲。因而人們只看到經(jīng)過某種篩選而產(chǎn)生的結(jié)果,忽略了被篩選掉的關(guān)鍵信息。最后需要注意,量化策略回測只是驗(yàn)證投資邏輯或動機(jī)的一種工具,而不是尋找投資邏輯的捷徑。即不能本末倒置地單純從數(shù)據(jù)出發(fā)倒推出投資邏輯,甚至完全忽略掉金融邏輯。量化投資策略的開發(fā)策略再平衡任何策略都不是萬能的,隨著市場行情的變化以及其他投資者的投資策略的調(diào)整,原先有效的量化投資策略很可能會失效。因此需要對投資策略進(jìn)行監(jiān)控,一旦發(fā)現(xiàn)策略效果持續(xù)變差,則應(yīng)該考慮對策略進(jìn)行調(diào)整。11.2多因子選股模型多因子選股模型以資本資產(chǎn)定價(jià)模型(CAPM)、套利定價(jià)理論(APT)、Fama-French三因素模型等現(xiàn)代金融投資理論為基礎(chǔ),是量化投資領(lǐng)域應(yīng)用最廣泛也是最成熟的選股模型之一。多因子模型用一系列因子,主要包括公司基本面指標(biāo)、股票技術(shù)面指標(biāo)、市場情緒因子等,作為解釋股票超額收益的因素,通過因子選出未來收益高的股票??傮w而言,該模型的核心之一在于如何選因子,其次是如何基于因子選股票。具體的步驟可分為預(yù)選因子池、因子有效性檢驗(yàn)、冗余因子剔除和多因子選股票。11.2.2預(yù)選因子池基于金融邏輯,從全方位各角度尋找影響股票收益率的因子,形成一個(gè)因子池。這一步一般通過人工以定性的方式來完成,依賴于市場邏輯和股票投資經(jīng)驗(yàn)。影響股票價(jià)格的重要因素是公司的基本面和股票技術(shù)面信息,其中基本面因素主要通過分析財(cái)務(wù)報(bào)表得到,技術(shù)面因素通過分析股票量價(jià)指標(biāo)得到。因子并不是對所有行業(yè)的公司都適用,不同的因子對股票收益的影響方向不一樣。11.2.3因子有效性檢驗(yàn)在構(gòu)建好預(yù)選因子池后,一個(gè)重要的步驟就是通過定量計(jì)算篩選出真正有效的因子。實(shí)際中衡量因子有效的重要標(biāo)準(zhǔn)之一就是看其能否產(chǎn)生超過基準(zhǔn)的超額收益率,即股票收益率減去基準(zhǔn)收益率的差。因子有效性檢驗(yàn)通常是逐因子進(jìn)行,最常用方法為排序法。選定一個(gè)因子后,排序法的具體步驟如下:選取股票池2)設(shè)定檢驗(yàn)時(shí)間段和周期11.2.3因子有效性檢驗(yàn)

11.2.3因子有效性檢驗(yàn)另一種方法:分組檢驗(yàn)月初根據(jù)因子值將股票排序,排序后以等頻或者等距的方式分為若干組(通常為5組),觀察月末各組股票的平均收益差距情況。贏家組合與輸家組合的平均月收益率之差稱為因子收益差。基于這個(gè)框架,可以定義一些衡量因子有效性的指標(biāo),這些指標(biāo)包括:因子勝率,指形成期內(nèi)因子收益為正的月份數(shù)占總月份數(shù)的比例。因子信息比率,因子收益差平均值比因子收益差的標(biāo)準(zhǔn)差。這個(gè)指標(biāo)的計(jì)算方式與前文的IR類似,區(qū)別在于這里用的是因子收益差而不是IC值序列。t檢驗(yàn),檢驗(yàn)原假設(shè)為因子收益差平均值小于等于0。11.2.3因子有效性檢驗(yàn)4) 實(shí)際操作及注意事項(xiàng)因子有效性檢驗(yàn)涉及到數(shù)據(jù)的分析和處理,因此需要經(jīng)過我們之前介紹過的數(shù)據(jù)獲取、探索性數(shù)據(jù)分析、特征工程等數(shù)據(jù)分析步驟。在數(shù)據(jù)清洗過程中需要注意結(jié)合數(shù)據(jù)的實(shí)際背景。首先剔除停牌和ST股票。其次,用最近一次的財(cái)報(bào)數(shù)據(jù)作為本月的因子數(shù)據(jù)。第三,對因子進(jìn)行行業(yè)和市值中性化處理,剔除掉這兩個(gè)因素的影響。常見的方法是將因子值對行業(yè)和市值進(jìn)行線性回歸,取殘差值作為新的因子值。11.2.4冗余因子剔除

11.2.5根據(jù)因子選股票

11.2.5根據(jù)因子選股票機(jī)器學(xué)習(xí)法回歸法本質(zhì)上是建立了股票收益率和因子之間的關(guān)系,可以將回歸法用各種不同的機(jī)器學(xué)習(xí)回歸模型進(jìn)行擴(kuò)展。例如可以用更高級的回歸方法如嶺回歸、核嶺回歸、支持向量回歸等機(jī)器學(xué)習(xí)方法進(jìn)行建模。除了回歸法,還可以將選股問題轉(zhuǎn)化為分類問題來處理。將股票收益率分為高和低兩類,建立分類模型。此時(shí)就可以用機(jī)器學(xué)習(xí)中的Logistic回歸、支持向量機(jī)、決策樹等分類方法,以及隨機(jī)森林、GBDT、XGBoost、LightGBM等集成學(xué)習(xí)方法。Alphalens的用法Alphalens主要提供了因子收益分析、IC分析、換手率分析以及事件收益分析這四大模塊。因子收益分析模塊的總體思路與11.2.3節(jié)中根據(jù)因子值排序后分組的有效性檢驗(yàn)類似,提供了因子收益分析表、因子分組累計(jì)收益曲線等結(jié)果。因子IC分析模塊提供了因子IC表(包括IR值)、因子IC時(shí)間序列、因子IC分布圖和QQ圖、熱力圖等結(jié)果。Alphalens的用法使用Alphalens的最關(guān)鍵步驟為數(shù)據(jù)預(yù)處理,即將股票因子數(shù)據(jù)、價(jià)格數(shù)據(jù)以及行業(yè)分類數(shù)據(jù)整合到一個(gè)數(shù)據(jù)表中(該部分的工作占了整個(gè)因子分析的絕大部分),隨后調(diào)用相關(guān)函數(shù)進(jìn)行相應(yīng)的分析即可。11.4多因子選股模型案例分析具體案例結(jié)果見JupyterNotebook代碼文件Python金融數(shù)據(jù)分析個(gè)人貸款信用風(fēng)險(xiǎn)評估Chapter1212.1信用風(fēng)險(xiǎn)分析概覽信用風(fēng)險(xiǎn)(creditrisk)又稱違約風(fēng)險(xiǎn),是指合約義務(wù)方(例如借款人或損失方),不愿或無力履行合約條件而構(gòu)成違約,致使權(quán)利方遭受損失的風(fēng)險(xiǎn)。信用風(fēng)險(xiǎn)管理對于金融機(jī)構(gòu),特別是銀行而言非常重要。借助金融科技的力量,對歷史數(shù)據(jù)進(jìn)行分析,建立信用風(fēng)險(xiǎn)評估模型,是評估信用風(fēng)險(xiǎn)的重要手段。12.1信用風(fēng)險(xiǎn)分析概覽信用風(fēng)險(xiǎn)評估建模包括對違約概率、違約損失率以及違約風(fēng)險(xiǎn)暴露的建模。其中違約概率是最重要的信用風(fēng)險(xiǎn)研究對象。根據(jù)被評估對象的不同,可分為企業(yè)信用風(fēng)險(xiǎn)評估和個(gè)人信用風(fēng)險(xiǎn)評估。對于個(gè)人通常稱為信用評分(creditscoring),信用評分也適用于中小企業(yè),常見的個(gè)人信用評分有FICO信用分、芝麻信用分等。12.1信用風(fēng)險(xiǎn)分析概覽信用風(fēng)險(xiǎn)評估的方法主要有三大類,分別是專家系統(tǒng)、金融模型和數(shù)據(jù)驅(qū)動模型。1) 專家系統(tǒng)早期的信用風(fēng)險(xiǎn)評估主要是一些簡單定性的方法,依賴于有經(jīng)驗(yàn)的專家的判斷,因此又稱為專家系統(tǒng)。12.1信用風(fēng)險(xiǎn)分析概覽2) 金融模型指從經(jīng)濟(jì)金融的邏輯出發(fā),從理論上用模型來刻畫信用風(fēng)險(xiǎn),并解釋違約的機(jī)理,對應(yīng)于第8章中的基于金融理論的建模。金融模型主要可以分為結(jié)構(gòu)化模型和約化模型兩大類。12.1信用風(fēng)險(xiǎn)分析概覽3) 數(shù)據(jù)驅(qū)動模型數(shù)據(jù)驅(qū)動模型不從金融邏輯出發(fā),基于信用風(fēng)險(xiǎn)的歷史數(shù)據(jù)用機(jī)器學(xué)習(xí)方法進(jìn)行建模,并對違約進(jìn)行預(yù)測,對應(yīng)于第8章中的基于機(jī)器學(xué)習(xí)的數(shù)據(jù)建模。數(shù)據(jù)驅(qū)動模型適用于對中小企業(yè)和個(gè)人的信用風(fēng)險(xiǎn)評估,即信用評分。信用評分可分為申請?jiān)u分、行為評分、盈利評分。12.1信用風(fēng)險(xiǎn)分析概覽信用風(fēng)險(xiǎn)評估中關(guān)于違約概率的預(yù)測可以抽象為一個(gè)分類問題,貸款申請人根據(jù)違約概率可分為好、壞等不同的類別。因此,對于個(gè)人信用評估可以用機(jī)器學(xué)習(xí)中的分類模型來解決。相關(guān)數(shù)據(jù)可以從各種來源獲得,包括金融機(jī)構(gòu)內(nèi)部和其他信貸機(jī)構(gòu)以及信貸評級機(jī)構(gòu)。這些數(shù)據(jù)主要涉及借款人和貸款的特征,以及與外部環(huán)境有關(guān)的其他風(fēng)險(xiǎn)因素。12.2Logistic回歸模型

12.2Logistic回歸模型

12.2Logistic回歸模型

12.3相關(guān)Python庫介紹scikit-learn(官網(wǎng):/stable/#)是一個(gè)著名的Python機(jī)器學(xué)習(xí)庫,包含在Anaconda中。scikit-learn庫基于NumPy、SciPy和Matplotlib,提供了機(jī)器學(xué)習(xí)領(lǐng)域分類、回歸、聚類和降維的各種模型接口,同時(shí)提供了強(qiáng)大的模型選擇和性能評估、數(shù)據(jù)預(yù)處理等功能。12.3相關(guān)Python庫介紹Logistic回歸屬于線性回歸模型,在scikit-learn中對應(yīng)的函數(shù)是LogisticRegression()。Logistic回歸用于分類問題時(shí)總體遵循機(jī)器學(xué)習(xí)的流程(見8.3.2節(jié)),具體實(shí)現(xiàn)步驟為:數(shù)據(jù)預(yù)處理訓(xùn)練測試樣本分割模型構(gòu)建模型預(yù)測模型評估12.3相關(guān)Python庫介紹X_train,X_test,y_train,y_test=train_test_split(X,y,test_size,random_state=None)model=LogisticRegress

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論