20230404-國金證券-Alpha掘金系列之五:如何利用ChatGPT挖掘高頻選股因子_第1頁
20230404-國金證券-Alpha掘金系列之五:如何利用ChatGPT挖掘高頻選股因子_第2頁
20230404-國金證券-Alpha掘金系列之五:如何利用ChatGPT挖掘高頻選股因子_第3頁
20230404-國金證券-Alpha掘金系列之五:如何利用ChatGPT挖掘高頻選股因子_第4頁
20230404-國金證券-Alpha掘金系列之五:如何利用ChatGPT挖掘高頻選股因子_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

11金融工程組分析師:高智威(執(zhí)業(yè)S1130522110003)聯(lián)系人:王小康如何利用chatGPT挖掘高頻選股因子?chatGPT模型介紹及原理解析GPT(GenerativePre-trainedTransformer)是一種大語言模型(LLM能夠?qū)W習(xí)大量文本數(shù)據(jù),并推斷出文本中詞語之間的關(guān)系。ChatGPT能夠進(jìn)行連續(xù)對(duì)話,綜合上下文內(nèi)容進(jìn)行交模型相較于傳統(tǒng)LSTM模型的改進(jìn)之處在于其引用了Transformer模型,對(duì)chatGPT提示工程介紹及使用指南提示工程(PromptEngineering)果。除標(biāo)準(zhǔn)的提示公式外,也有多種針對(duì)不同任務(wù)類型的提示方式。一種獨(dú)特的提示方式為思維鏈提示(Chain-of-ThoughtPrompting其主要思路為將一個(gè)復(fù)雜問題拆分成多個(gè)步驟,引導(dǎo)模型逐步思考并進(jìn)行糾偏,chatGPT因子挖掘?qū)崙?zhàn)ChatGPT在量化研究領(lǐng)域同樣擁有廣泛的使用前景,我們以最常見的因子挖掘作為測(cè)試場(chǎng)景,考察模型經(jīng)風(fēng)險(xiǎn)提示1、ChatGPT模型具有一定的隨機(jī)性,在部分情況下可能回答錯(cuò)誤,不符3、策略依據(jù)一定的假設(shè)通過歷史數(shù)據(jù)回測(cè)得到,當(dāng)交易成本提高或其他條件改變時(shí),可能導(dǎo)22 4 4 5 5 6 72.3思維鏈提示(Chain-of-ThoughtProm 8 4 5 6 7 7 7 8 8 8 8 9 9 9 33 44—、chatGPT模型介紹及原理解析五篇,同時(shí)也是ChatGPT量化研究系列的第一篇,將使用ChatGPT探索其文內(nèi)容進(jìn)行交流的自然語言處理(NLP)模型,并通過強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,從而理解人類的語言來進(jìn)行對(duì)話,甚至能相關(guān)研究較少,本文將從量化研究領(lǐng)域?yàn)樽xGPT(GenerativePre-trainedTransformer)作為一種大語言模型(LLM能夠?qū)W習(xí)大量文本數(shù)據(jù),并推斷出文本中詞語之間的關(guān)系。隨著過去幾年計(jì)算能力的不斷發(fā)展,輸入數(shù)據(jù)集和參數(shù)空間(parameterspace)的不斷增加,語言模型的一項(xiàng)基本任務(wù)是預(yù)測(cè)一句話中的單個(gè)詞,或根據(jù)上文推斷下文。模型在處理這類問題時(shí)存在兩大缺陷:關(guān)系來學(xué)習(xí)上下文并學(xué)習(xí)語句的含義,利用自注意力機(jī)制(Self-attentionmechani洞察力。OpenAI,BFT智能機(jī)器人研究公眾號(hào)55ChatGPT擁有如此高度的智能水平背后有著多重因素的共同作用,包括隨著參數(shù)數(shù)量提升帶來的涌現(xiàn)現(xiàn)象(scaling來源:/blog/chatgpt,國金例如,在翻譯任務(wù)中如果模型訓(xùn)練過英文到法語的翻譯任務(wù),它可以無需訓(xùn)練來處理英文到德語的翻譯任務(wù)。果只提供一張某人的照片,模型可以學(xué)習(xí)識(shí)如果只提供很少的相關(guān)語料,模型可以學(xué)習(xí)理解和推理其他類似語料的能力。二、chatGPT提示工程介紹及使用指南進(jìn)行合適的提示對(duì)于獲取最終需要的結(jié)果至關(guān)重要。提示工程(PromptEngineering)作為一門66解模型的能力和局限性,通過交互和提示,更加使模型按照人類的期望完成回答。77來源:ChatGPT,國金證券研究所來源:ChatGPT,國金證券研究所除標(biāo)準(zhǔn)化的提示工程之外,我們可以使用多種類型的提示方式,使模型完成不同類型任務(wù),滿足用戶的88來源:每日經(jīng)濟(jì)新聞,ChatGPT,國金證券研究所來源:e公司公眾號(hào),ChatGPT,國金證券研究所Weietal(2022)發(fā)現(xiàn)利用思維鏈(Chainofthought)能夠極大提升大語言模型在處理復(fù)雜邏輯問題上的表現(xiàn)。通會(huì)大打折扣。如下圖所示,我們給出了兩個(gè)因子值排序和對(duì)應(yīng)收益率的一圖表9:A因子IC指標(biāo)示例1圖表10:B因子IC指標(biāo)示例28%6%4%2%0%-2%8%6%4%2%0%-2%00來源:國金證券研究所來源:國金證券研究所99來源:ChatGPT,國金證券研究所來源:ChatGPT,國金證券研究所來源:ChatGPT,國金證券研究所來源:ChatGPT,國金證券研究所由于其對(duì)于股票市場(chǎng)A股的做空限制可能認(rèn)識(shí)不足,我們進(jìn)一步提示后,Cha權(quán)重的回答。但需要注意的是,ChatGPT被訓(xùn)練時(shí)接受了海量的文本和數(shù)據(jù),其處理實(shí)際問題時(shí)仍存在一些“生搬硬三、chatGPT因子挖掘?qū)崙?zhàn)考察經(jīng)過一定程度的提示(prompt模型是否能給出符值均大于2,IC均值從2.79%至5.36%不等??梢哉f明價(jià)格和成交量VLI我們根據(jù)十分位組合構(gòu)建出了因子的多空組2102016/1/42017/1/42018/1/42019/1/42020/1/42021VLI因子,多頭年化超額收益率為2.75%,多頭限制因子必須有一定的原創(chuàng)性,在經(jīng)過一定程度的引導(dǎo)后,得到了買賣盤來源:ChatGPT,國金證券研究所來源:ChatGPT,國金證券研究所們考慮到邏輯合理性,需要做標(biāo)準(zhǔn)化以做到橫截面可比,因此構(gòu)建過程中我們對(duì)因子進(jìn)行了修正。來源:ChatGPT,上交所,深交所,Wind,國金98765432102016/1/42017/1/42018/1/42019/1/42020/1/42021/1/4一BforceSforceBSForce來源:ChatGPT,上交所,深交所,Wind,國金4.51來源:ChatGPT,上交所,深交所,Wind,國金頻測(cè)試其效果,在中證1000指數(shù)成份股上,每周第一個(gè)交易日的開盤價(jià)成交進(jìn)行測(cè)試。由于買賣盤力量差異因子(BSForce)衰減速度過快,在第二天基本已經(jīng)失效,我們此處僅使用賣盤力量和賣盤力量因子進(jìn)行降頻測(cè)試,其測(cè)32102016/1/42017/1/42018/1/42019/1/42020/1/42021來源:ChatGPT,上交所,深交所,Wind,國金9.77%來源:ChatGPT,上交所,深交所,Wind,國金多頭夏普比率分別為0.48和0.49。說明使用ChatGPT所給方式構(gòu)建買盤力量和賣盤力量因子表現(xiàn)具有一定的持續(xù)性。102017/1/102018/1/1020ChatGPT買賣盤力量增強(qiáng)策略中證1超額凈值來源:ChatGPT,上交所,深交所,Wind,國金來源:ChatGPT,上交所,深交所,Wind,國金值得一提的是,ChatGPT不僅在文字、數(shù)學(xué)和表格類回答形式能給用戶較好的反饋,其同樣也可以直接輸來源:ChatGPT,國金證券研究所來源:ChatGPT,國金證券研究所由上圖可以看出,由于經(jīng)過大量數(shù)據(jù)、文獻(xiàn)、代碼等海量知識(shí)的訓(xùn)綜上,我們更建議,對(duì)于一些并不熟悉的函數(shù)和模型,可以快速使用ChatGPT幫助我們了解其基本用法和思路。在ChatGPT所給代碼的基礎(chǔ)上進(jìn)行修正,從而大大提升研究值方差模型進(jìn)行最大化夏普和使用Black-Litterman模型的組合優(yōu)化代碼。可以看出,ChatGPT比較準(zhǔn)確地給出了相關(guān)庫和函數(shù)的基本用法,有助于研究員快速掌握學(xué)習(xí)并進(jìn)行修正調(diào)試使用。來源:ChatGPT,國金證券研究所來源:ChatGPT,國金證券研究所發(fā)現(xiàn)模型能夠結(jié)合其本身訓(xùn)練得到的知識(shí)加以改進(jìn)創(chuàng)新,最終得到基本符合我們需求的高頻因子。本用法和思路。并在所給代碼的基礎(chǔ)上進(jìn)行修正1、ChatGPT模型具有一定的隨機(jī)性,在部分情況下可能回答錯(cuò)誤,不3、策略依據(jù)一定的假設(shè)通過歷史數(shù)據(jù)回測(cè)得到,當(dāng)交易成本提高或其他條件改變時(shí),可能導(dǎo)形式的復(fù)制、轉(zhuǎn)發(fā)、轉(zhuǎn)載、引用、修改、仿制、刊發(fā),或以任何侵犯本公司版權(quán)的其他方式使用。經(jīng)過書面授權(quán)的引用、刊發(fā),需注明出處為“國金本報(bào)告的產(chǎn)生基于國金證券及其研究人員認(rèn)為可信的公開資料或?qū)嵉卣{(diào)研資料,但國金證券及其研究人員對(duì)這些信息的準(zhǔn)確性和完整性反映撰寫研究人員的不同設(shè)想、見解及分析方法,故本報(bào)告所載觀點(diǎn)可能與其他類似研究報(bào)告的觀點(diǎn)及市場(chǎng)實(shí)際情況不一致,國金證券不對(duì)使用本報(bào)告所包含的材料產(chǎn)生的任何直接或間接損失或與此有關(guān)的其他任何損失承擔(dān)任何責(zé)任。且本報(bào)告中的資料、意見、預(yù)測(cè)均反映報(bào)告初次公開發(fā)布時(shí)的判斷,在不作事先通知的情況下,可能會(huì)隨時(shí)調(diào)整,亦可因使用不同假設(shè)和標(biāo)準(zhǔn)、采用不同觀點(diǎn)和分析方法而與國金證券其它業(yè)務(wù)部門、單位或附屬機(jī)構(gòu)在制作類似的其他材料時(shí)所給出的意見不同或者相反。本報(bào)告僅為參考之用,在任何地區(qū)均不應(yīng)被視為買賣任何證券、金融工具的要約或要約邀請(qǐng)。本報(bào)告提及的任何證券或金融工具均可能不易變賣以及不適合所有投資者。本報(bào)告所提及的證券或金融工具的價(jià)格、價(jià)值及收益可能會(huì)受匯率影響而波動(dòng)客戶應(yīng)當(dāng)考慮到國金證券存在可能影響本報(bào)告客觀性的利益沖突,而不應(yīng)視本報(bào)告為作出投資決策的唯一因素。證券研究報(bào)告是用于服務(wù)具備專業(yè)知識(shí)的者和投資顧問的專業(yè)產(chǎn)品,使用時(shí)必須經(jīng)專業(yè)人士進(jìn)行解讀。國金證券建議獲取報(bào)告人員應(yīng)考慮本報(bào)告的任何意見或建議咨詢獨(dú)立投資顧問。報(bào)告本身、報(bào)告中的信息或所表達(dá)意見也不構(gòu)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論