




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
計算機論文:基于深度強化學習的量化投資策略計算機研究agent與環(huán)境交互進行學習的方式使agent具備完全自主學習解決任務的能力,基于深度強化學習構(gòu)建的量化投資策略可以隨時根據(jù)金融市場的變化第一章緒論研究工作的背景與意義數(shù)據(jù)是最寶貴的財富。歷史行情、金融交易、投資理財、風險控制、量化投資運用數(shù)學、計算機技術(shù)制定策略,能夠有效利用金融數(shù)據(jù)。強化學習實現(xiàn)“感知—認知—自主決策—自我學習”的循環(huán),呈現(xiàn)出自我學習的特征。量化投資作為高度數(shù)據(jù)化、數(shù)學化、程序化的行業(yè),是強化學習很好的應用場景。金融行業(yè)需要便捷、有效、精確的量化投資豐富投資工具。隨著大數(shù)據(jù)、人工智能的蓬勃發(fā)展,量化投資具對將強化學習應用于金融領(lǐng)域具有參考價值。量化投資運用計算機對交易市場的數(shù)據(jù)進行處理并在適當時機發(fā)出期貨、股票等,目前我國可被交易的金融產(chǎn)品也比較豐富。.......................國內(nèi)外研究歷史與現(xiàn)狀I(lǐng)rwin[4](1986)等學者編寫自動化交易程序在期貨市場進行自動化交易,對期貨市場的交易產(chǎn)生了一定變革作用。Neftci[5](1991)等學者在道瓊斯工業(yè)指數(shù)預測的研究中編寫程序?qū)r格均線產(chǎn)生的交易信號進行篩選,提高了收益穩(wěn)定性。Ritter[6](1992)等學者在量化投資中引入行為金融學理論,他們發(fā)現(xiàn):在過去一段時間表現(xiàn)不好的股票在接下來的時間很有可能上漲。買入收益率最低的股票并且持倉一個月后再平倉。Jegadeesh[7](1993)等人在對投資收益進行研究時發(fā)現(xiàn),過去收益高的資產(chǎn),并且持倉時間要超過反轉(zhuǎn)策略的持倉時間。Moody[8]RRLRRL(SharpRRLQ-learning的策略。Kimk[9](2003)等學者將SVM運用于金融時間序列預測中,在研究中將基于SVM的策略與基于神經(jīng)網(wǎng)絡的策略進行對比,實驗結(jié)果顯示基于SVM的策略收益率更穩(wěn)定。J.W.Lee[10](2004)基于Q-Learning提出Q-trader股票交易系統(tǒng),Q-trader通過Q-Learning矩陣和每個周期的利潤決定持有股票的時間,完成股票買入、賣出。Khan[11](2008)等學者將遺傳算法融入基于神經(jīng)網(wǎng)絡的量化投夠提高準確率。.......................第二章量化投資和深度強化學習量化投資有效市場假說有效市場假說[38](EfficientMarketHypothesis,EMH)是傳統(tǒng)金融理論的基礎(chǔ)認為金融市場是健全和有效的傳統(tǒng)金融理論圍繞產(chǎn)定價和投資組合對個體的投資行為進行研究在20世紀80年代的金融研究領(lǐng)域占據(jù)主導地位。 20 世紀初,法國數(shù)學家 LouisBachelier應用統(tǒng)計分析方法分析證券收益率,從隨機過程角度對布朗運動以及股價變化的隨機性進行研究發(fā)現(xiàn)市場在信息方面的有性,有效市場假說開始萌芽1970年,EugeneFama在總結(jié)前人的理論和實證的基礎(chǔ)上正式提出有效市場假說。有效市場假說認為金融市場是健全和有效的,資產(chǎn)的價格完全(一技術(shù)分析方法無效,投資者使用基本分析方法有可能獲得超額收益。(二)(三)..........................強化學習環(huán)境構(gòu)建強化學習算法分類標準之一是agent能否完全訪問(或?qū)W習)MDP過程中的狀態(tài)轉(zhuǎn)移函數(shù)和獎勵函數(shù)。使用模型的算法為基于模型學習l,沒有基于模型的算法為免模型學習(-e。有模型學習最大的優(yōu)勢在于agent。基于模型的任務中使用基于模型的算法,那么agent必須完全從軌跡中學習探索出來的模型和真實模型之間存在誤差,而這種誤差會導致agent在學習到的終的結(jié)果也可能達不到預期的效果。在算法交易問題中,不存在環(huán)境的真實模型,若agent想學由于市場預測可行性很低(甚至不可預測,因此,本文使用無模型............................第三章基于深度強化學習的量化投資策略設計 20問題定義 19強化學習環(huán)境構(gòu)建 20第四章基于深度強化學習的量化投資策略改進 31動作塑造 31優(yōu)勢塑造 31第五章基于深度強化學習的量化投資策略實證.............................44算法改進驗證 44裁剪PPO改進驗證 46動作塑造改進驗證 47第五章基于深度強化學習的量化投資策略實證5.1 算法改進驗證本文中策略的訓練、回測在外匯市場進行,外匯交易市場是最具價格上升(下降)時,做多(做空)獲利。...........................第六章全文總結(jié)與展望6.1 全文總結(jié)本文以深度強化學習為基礎(chǔ)對量化投資策略進行了研究。金融活agentagent本文主要完成了以下工作:針對策略輸出動作的有效性與持倉狀態(tài)有關(guān)的問題提出動作agent輸策略獲利能力。針對將策略獲得的收益分配給不同交易動作的難題提出了優(yōu)通過實驗驗證
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福州墨爾本理工職業(yè)學院《企業(yè)資源規(guī)劃系統(tǒng)與應用》2023-2024學年第二學期期末試卷
- 鄭州大學《機器人機械系統(tǒng)》2023-2024學年第二學期期末試卷
- 衡水學院《影視文學研究》2023-2024學年第二學期期末試卷
- 廂式改裝車、特種車輛項目效益評估報告
- 羅定職業(yè)技術(shù)學院《別墅建筑空間設計》2023-2024學年第二學期期末試卷
- 《 峨日朵雪峰之側(cè)》教學設計 2024-2025學年統(tǒng)編版高中語文必修上冊
- 揚州大學廣陵學院《機器學習實驗》2023-2024學年第二學期期末試卷
- 昆玉職業(yè)技術(shù)學院《工業(yè)機器人基礎(chǔ)與實踐》2023-2024學年第二學期期末試卷
- 浙江外國語學院《水產(chǎn)養(yǎng)殖學創(chuàng)新創(chuàng)業(yè)教育》2023-2024學年第二學期期末試卷
- 【化學】認識有機化合物 第一課時教學設計 2024-2025學年高一下學期化學人教版(2019)必修第二冊
- 中國煙草總公司鄭州煙草研究院筆試試題2023
- 建設法規(guī)(全套課件)
- 心衰患者的容量管理中國專家共識-共識解讀
- 個人投資收款收據(jù)
- H3C全系列產(chǎn)品visio圖標庫
- 新生兒常見儀器的使用與維護 課件
- 工藝能力分析報告
- 《給校園植物掛牌》課件
- 氣道高反應性教學演示課件
- 健身房眾籌方案
- 護理帶教匯報課件
評論
0/150
提交評論