版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
正文目錄CHATGPT:金融本文情緒分析的新篇章 5如何使用對(duì)點(diǎn)評(píng)標(biāo)題進(jìn)行情感評(píng)分? 6模型輸出的一致性:系統(tǒng)提示與模型設(shè)置 7提示是ChatGPT執(zhí)行任務(wù)的起點(diǎn) 7優(yōu)化ChatGPT回復(fù),調(diào)整輸出隨機(jī)性 8批量請(qǐng)求以提升模型調(diào)用效率 9CHATGPT評(píng)分的合理性與連續(xù)性 10BERT情感分析較難適應(yīng)“研報(bào)標(biāo)題”場(chǎng)景 10GPT評(píng)分視角下的“超預(yù)期”刻畫 12“文本超預(yù)期”的刻畫 13“GPT超預(yù)期”的刻畫 13GPT評(píng)分刻畫的超預(yù)期是否能帶來(lái)增量? 16超預(yù)期樣本池的表現(xiàn) 16超預(yù)期樣本空間的JOR因子 17超預(yù)期JOR因子測(cè)試 19超預(yù)期JOR組合構(gòu)建 20透視GPT評(píng)分,挖掘新型另類因子 22全域中GPT評(píng)分因子的表現(xiàn) 23指數(shù)域中GPT評(píng)分因子的表現(xiàn) 265總結(jié) 27風(fēng)險(xiǎn)提示: 28圖表目錄圖表1的訓(xùn)練過(guò)程 5圖表2OPENAICOMPLETIONS請(qǐng)求示例 6圖表3OPENAICOMPLETIONS回復(fù)示例 6圖表4公司研究類的分析師研報(bào)數(shù)量 6圖表5情緒評(píng)分的提示 7圖表6OPENAI模型的TOKEN數(shù) 8圖表7提問(wèn)示例 8圖表8API接口成本與耗時(shí):逐個(gè)請(qǐng)求 9圖表9批量請(qǐng)求模板 9圖表10情緒評(píng)分示例1 10圖表情緒評(píng)分示例2 10圖表12BERT研報(bào)標(biāo)題情感分析流程圖 11圖表13BERT研報(bào)標(biāo)題情感分析結(jié)果 12圖表14“盈余點(diǎn)評(píng)”樣本的年度分布情況 12圖表15“盈余點(diǎn)評(píng)”樣本的月度分布情況 12圖表16“文本超預(yù)期”樣本的年度分布情況 13圖表17“文本超預(yù)期”樣本的月度分布情況 13圖表18對(duì)“超預(yù)期”主體判別能力較強(qiáng) 14圖表19具備上下文語(yǔ)義理解能力和邏輯能力 14圖表20對(duì)盈余點(diǎn)評(píng)評(píng)分的分布圖 15圖表21標(biāo)題不含“超預(yù)期”的“GPT超預(yù)期”樣本示例 15圖表22“GPT”與“文本”超預(yù)期樣本的年度分布情況 16圖表23“GPT”與“文本”超預(yù)期樣本的月度分布情況 16圖表24超預(yù)期樣本池?cái)?shù)量 16圖表25超預(yù)期樣本池的收益指標(biāo) 17圖表26超預(yù)期樣本池的分年度收益 17圖表27JOR_DELAY40因子的構(gòu)造邏輯舉例 18圖表28超預(yù)期JOR因子列表 18圖表29超預(yù)期JOR因子的覆蓋度18圖表30超預(yù)期JOR因子的覆蓋度18圖表31超預(yù)期JOR因子的分組數(shù)設(shè)置 19圖表32超預(yù)期JOR因子的單因子測(cè)試結(jié)果 19圖表33超預(yù)期JOR因子的RANKIC序列 20圖表34不同樣本空間下JOR因子的分組年化收益(%) 20圖表35超預(yù)期JOR因子的多空凈值曲線 20圖表36不同樣本空間下JOR的多頭分年度收益(%) 20圖表37優(yōu)選50等權(quán)組合的指標(biāo) 21圖表38優(yōu)選50等權(quán)組合凈值曲線 21圖表39優(yōu)選50等權(quán)組合分年度收益 21圖表40優(yōu)選100等權(quán)組合的指標(biāo) 21圖表41優(yōu)選100等權(quán)組合凈值曲線 21圖表42優(yōu)選100等權(quán)組合分年度收益 22圖表43指數(shù)衰減加權(quán)的權(quán)重計(jì)算舉例 23圖表44指數(shù)衰減加權(quán)的權(quán)重示意圖 23圖表45GPT評(píng)分因子及釋義 23圖表46GPT等權(quán)因子在全A的覆蓋度(%) 24圖表47GPT評(píng)分因子檢測(cè)結(jié)果(全A,10組) 24圖表48GPT評(píng)分因子檢測(cè)結(jié)果(全A,10組) 25圖表49GPT_AVGRECORD的IC序列(全A) 25圖表50GPT_AVGRECORD分組收益(全A,10組) 25圖表51GPT因子多頭分年度收益(全A,10組) 25圖表52GPT因子多空凈值曲線(全A,10組) 25圖表53GPT評(píng)分因子(非行業(yè)市值中性化)檢測(cè)結(jié)果(全A,10組) 26圖表54GPT評(píng)分因子檢測(cè)結(jié)果(滬深300,5組) 26圖表55GPT評(píng)分因子檢測(cè)結(jié)果(中證500,5組) 27圖表56GPT合成因子的IC序列(中證500) 27圖表57GPT合成因子分組收益(中證500,5組) 27圖表58GPT合成因子多頭分年度收益(中證500,5組) 27圖表59GPT合成因子多空凈值曲線(中證500,5組) 27ChatGPT:金融本文情緒分析的新篇章ChatGPTOpenAIGPT3.5(GenerativePre-trainedTransformer3.5)架202230。ChatGPT3.5CT(nsuc((O算法GPT3.5RwdlPT從GPTPPO強(qiáng)化學(xué)習(xí)策略來(lái)微調(diào)第一階段的模型,隨機(jī)抽取新的Prompt,用第二階段的RewardModelrewardPPO圖表1ChatGPT的訓(xùn)練過(guò)程資料來(lái)源:騰訊技術(shù)工程,ChatGPT如Bert)ChatGPTChatGPTChatGPTChatGPTOpenAI官方已公開了多個(gè)模型的gpt-3.5gpt-4Pythongpt-4API——gpt-3.5-turboPynPIchacois23gpt-3.5-turbo圖表2OpenAIchatcompletions請(qǐng)求示例 圖表3OpenAIchatcompletions回復(fù)示例 資料來(lái)源:OpenAI, 資料來(lái)源:OpenAI,如何使用ChatGPT對(duì)點(diǎn)評(píng)標(biāo)題進(jìn)行情感評(píng)分?A表,篩選了標(biāo)記為公司研究的研報(bào)標(biāo)題,進(jìn)行情感打分分析。樣本周期從2016.01.0124維持在2.5萬(wàn)條,近兩年研報(bào)記錄呈現(xiàn)出顯著增長(zhǎng)的態(tài)勢(shì)。圖表4公司研究類的分析師研報(bào)數(shù)量資料來(lái)源:wind資訊,雖然ChatGPT20219”ChatGPT“”模型輸出的一致性:系統(tǒng)提示與模型設(shè)置“提示”是ChatGPT執(zhí)行任務(wù)的起點(diǎn)"提示"在ChatGPT“”ChatGPT本研究嘗試將ChatGPT的目標(biāo)是讓模型根據(jù)輸入的大量的研報(bào)點(diǎn)評(píng)標(biāo)題輸出相應(yīng)的情感得分,因此,需要ChatGPT給出110(((+1、-10ChatGPT“5”與”類似的詞匯,且ChatGPT對(duì)“圖表5ChatGPT情緒評(píng)分的提示資料來(lái)源:然而,使用OpenAITOKENStoken4096,而gpt-48192tokensOpenAItokentokentokens,因token圖表6OpenAI模型的token數(shù)輸入單詞數(shù)Token長(zhǎng)度華安證券45業(yè)績(jī)超市場(chǎng)預(yù)期782季度費(fèi)用上升,短期盈利進(jìn)一步受限1723五糧液:業(yè)績(jī)釋放超預(yù)期,下半年預(yù)期改善空間大2227Overview11understandgeneratenaturallanguageorcode 7 8 資料來(lái)源:wind資訊,不能一次性將所有24為了保證不同批次的輸入的評(píng)分標(biāo)準(zhǔn)的一致性,模型的所有設(shè)置需保持一致,并且在每次調(diào)用PIsst為5:role:systemcontent:圖表5中的提示內(nèi)容此種做法與我們?cè)诠倬W(wǎng)的“Playground”頁(yè)面下的操作類似:圖表7ChatGPTPlayground提問(wèn)示例資料來(lái)源:OpenAI,優(yōu)化ChatGPT回復(fù)質(zhì)量,調(diào)整輸出隨機(jī)性PT為了解決這個(gè)問(wèn)題,除了上述“系統(tǒng)提示”之外,我們還可以通過(guò)設(shè)置模型的“ueT反之,模型則會(huì)更加創(chuàng)新、大膽,并且生成的文本更加隨機(jī)和多樣。默認(rèn)情況,10.5。model=”gpt-3.5-turbo”,messages=messages,max_tokens=max_tokens,temperature=0.5,top_p=1)在進(jìn)行網(wǎng)頁(yè)對(duì)話時(shí),我們可以在問(wèn)題后面添加“temperature=0.5”字樣控制回復(fù)的隨機(jī)性,增加回復(fù)的穩(wěn)定性。批量請(qǐng)求以提升模型調(diào)用效率除了限制單次請(qǐng)求和回復(fù)的總tokens數(shù)外,OpenAI還限定了API訪問(wèn)的siTP和esspe(Pgp5o的PM3,500$0.0015/1k出為$0.002/1ktokens2.2tokens600,標(biāo)tokens20~60tokens1032424¥2635元,耗3~6天。圖表8API接口成本與耗時(shí):逐個(gè)請(qǐng)求資料來(lái)源:然而,在執(zhí)行的時(shí)候會(huì)發(fā)現(xiàn),存在以下問(wèn)題:浪費(fèi)。組合方式15~20120標(biāo)題N:15個(gè)小圖表9批量請(qǐng)求模板系統(tǒng)提示role:system,content:系統(tǒng)提示+“請(qǐng)按照標(biāo)題順序,直接給出對(duì)應(yīng)的分?jǐn)?shù),不必解釋。每一行為一條標(biāo)題的評(píng)分,如:標(biāo)題1:6.8"+"\n"+"標(biāo)題2:4"+"\n"+"標(biāo)題3:8.1"role:user,content:標(biāo)題1:公司名稱+標(biāo)題內(nèi)容標(biāo)題序列
role:user,content:標(biāo)題2:公司名稱+標(biāo)題內(nèi)容…role:user,content:標(biāo)題20:公司名稱+標(biāo)題內(nèi)容資料來(lái)源:ChatGPT評(píng)分的合理性與連續(xù)性10ChatGPT總體上,ChatGPT所提供98A6圖表10ChatGPT情緒評(píng)分示例1USER長(zhǎng)春高新:2019年業(yè)績(jī)預(yù)告大超預(yù)期,制藥業(yè)務(wù)驅(qū)動(dòng)未來(lái)高增長(zhǎng)ASSISTANT9.8理由:標(biāo)題中的"大超預(yù)期"表明公司的業(yè)績(jī)遠(yuǎn)超預(yù)期,這是一個(gè)非常積極的信號(hào)。同時(shí),"制藥業(yè)務(wù)驅(qū)動(dòng)未來(lái)高增長(zhǎng)"也表示對(duì)公司未來(lái)的高度期待。因此,整體情緒非常積極,接近滿分。USER威孚高科:高壁壘高分紅,四季度業(yè)績(jī)有望扭轉(zhuǎn)ASSISTANT7.5非確定會(huì)扭轉(zhuǎn),因此整體上偏積極,但不足以得到超高分。USER長(zhǎng)安汽車:擬轉(zhuǎn)讓長(zhǎng)安PSA資產(chǎn),減少虧損聚焦主業(yè)ASSISTANT6.5業(yè)績(jī)的積極態(tài)度。但是,只是計(jì)劃,還未正式執(zhí)行,因此不能給予過(guò)高的評(píng)分。同輕度積極。資料來(lái)源:OpenAI,ChatGPT121的CPT3329.2ChatGPT這表明ChatGPT圖表11ChatGPT情緒評(píng)分示例2序號(hào)標(biāo)題ChatGPT評(píng)分標(biāo)題1東方園林:再計(jì)劃第三期員工持股,公司上下顯長(zhǎng)遠(yuǎn)信心8.5標(biāo)題2東方園林:三期員工持股彰顯發(fā)展信心,訂單增長(zhǎng)保持強(qiáng)勁8.8標(biāo)題3東方園林:第三期員工持股計(jì)劃點(diǎn)評(píng),連推兩期員工持股動(dòng)力強(qiáng),訂單高增業(yè)績(jī)優(yōu)9.2資料來(lái)源:wind資訊,OpenAI,BERT情感分析較難適應(yīng)“研報(bào)標(biāo)題”場(chǎng)景除了 BERT(Bidirectional Encoder Representations fromTransformers)Transformer(NLU)BERTBERT“用HuggingFace平臺(tái)上的預(yù)訓(xùn)練BERTBERT模((1(01圖表12Bert研報(bào)標(biāo)題情感分析流程圖資料來(lái)源:結(jié)果表明,當(dāng)應(yīng)用BERT模型于分析師研究報(bào)告標(biāo)題的情感分析時(shí),存在以下挑戰(zhàn):BERT的情感值,這限制了其能力在評(píng)估細(xì)微情感差異上的精度。BERT”13情感評(píng)估的邏輯不一致性:0.5416總體來(lái)說(shuō),盡管BERT在許多NLP任務(wù)中展現(xiàn)了出色的性能,但在處理特定領(lǐng)域,如分析師報(bào)告標(biāo)題的情感分析時(shí),它還是面臨著一些挑戰(zhàn)。圖表13Bert研報(bào)標(biāo)題情感分析結(jié)果公司公司Case123412標(biāo)題第二曲線創(chuàng)新業(yè)務(wù)高速增長(zhǎng),公司業(yè)績(jī)略超預(yù)期業(yè)績(jī)超預(yù)期,AI算力等創(chuàng)新業(yè)務(wù)跨越式增長(zhǎng)核心利潤(rùn)再超預(yù)期,第二曲線創(chuàng)新業(yè)一季報(bào)業(yè)績(jī)大超預(yù)期,5G算凈利潤(rùn)保持高凈利評(píng)分置信資料來(lái)源:wind資訊,BertBertBt如baseieigilwssiBert現(xiàn)的問(wèn)題,且上述的Bert5ChatGPTGPT評(píng)分視角下的“超預(yù)期”刻畫在前邊,我們已經(jīng)對(duì)所有分析師研報(bào)的公司研究類的標(biāo)題進(jìn)行了評(píng)分,記作??????_??????????考慮分析師撰寫盈余點(diǎn)評(píng)報(bào)告的時(shí)效性,我們僅納入在3類盈余(預(yù)告、快報(bào)、5盈余點(diǎn)評(píng)262510圖表14“盈余點(diǎn)評(píng)”樣本的年度分布情況 圖表15“盈余點(diǎn)評(píng)”樣本的月度分布情況資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,“文本超預(yù)期”的刻畫jieba分詞jieba'設(shè)置必選詞組限定“超預(yù)期”的樣本1和必選詞2的“and必選詞組1:預(yù)期、預(yù)計(jì)、承諾、預(yù)告上限、一致預(yù)期必選詞組2:超、超出、高于、好于、優(yōu)于設(shè)置屏蔽詞組屏蔽詞組:料、或、將、望、有望、可能、待161722016-20234、、10圖表16“文本超預(yù)期”樣本的年度分布情況 圖表17“文本超預(yù)期”樣本的月度分布情況資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,“GPT超預(yù)期”的刻畫出現(xiàn)“存?zhèn)巍卞e(cuò)誤。場(chǎng)景181634正面,因此也給了較高的分?jǐn)?shù),并由于并非業(yè)績(jī)超預(yù)期,分?jǐn)?shù)低于9分,與前邊的系統(tǒng)提示相符。圖表18ChatGPT對(duì)“超預(yù)期”主體判別能力較強(qiáng)資料來(lái)源:wind資訊,場(chǎng)景NLP基于真實(shí)數(shù)據(jù)訓(xùn)練,具備上下文語(yǔ)義理解能力和邏輯能力。圖表19+ChatGPT(>=9)圖表19ChatGPT具備上下文語(yǔ)義理解能力和邏輯能力序號(hào)標(biāo)題ChatGPT評(píng)分1石頭科技:2021年度業(yè)績(jī)快報(bào)點(diǎn)評(píng),Q4收入增長(zhǎng)超預(yù)期,單季凈利率下滑明顯72拓邦股份:2021年業(yè)績(jī)快報(bào)點(diǎn)評(píng),營(yíng)收超預(yù)期,Q4利潤(rùn)承壓7.33恒生電子:2021年收入超預(yù)期,但利潤(rùn)率不及預(yù)期令投資者情緒承壓7.34蒙娜麗莎:營(yíng)收增速超預(yù)期,成本+減值致業(yè)績(jī)承壓7.35金牌廚柜:大宗渠道高增、收入超預(yù)期,盈利略承壓8.36長(zhǎng)城汽車:看起來(lái)超預(yù)期,實(shí)際卻不及預(yù)期47兆易創(chuàng)新:21年3季度業(yè)績(jī)大超預(yù)期;利潤(rùn)率或面臨阻力,維持“中性”評(píng)級(jí)7.58銀河電子:同智機(jī)電軍品增速超預(yù)期,新能源汽車業(yè)務(wù)不及預(yù)期6.8資料來(lái)源:wind資訊,ChatGPT(9~10分14%50%8~95分的比圖表20ChatGPT對(duì)盈余點(diǎn)評(píng)評(píng)分的分布圖資料來(lái)源:wind資訊,GPT評(píng)分大于9GPTGPT217ChatGPTGPT100%或xxxxxxChatGPT圖表21標(biāo)題不含“超預(yù)期”的“GPT超預(yù)期”樣本示例序號(hào)標(biāo)題ChatGPT評(píng)分1恒力石化:預(yù)測(cè)恒力石化19年業(yè)績(jī)同比增長(zhǎng)超160%9.22中國(guó)汽研:2019年Q4收入、利潤(rùn)創(chuàng)上市來(lái)新高9.33三一重工:2019年年報(bào)業(yè)績(jī)預(yù)告點(diǎn)評(píng),業(yè)績(jī)?nèi)缙诟咴鲩L(zhǎng),上調(diào)2020年盈利預(yù)測(cè)94寧德時(shí)代:年報(bào)逆勢(shì)高增,穩(wěn)居全球龍頭9.55長(zhǎng)城汽車:扣非正增長(zhǎng),下半年凈利同比近翻倍9.36瑞芯微:國(guó)內(nèi)SoC芯片領(lǐng)跑者,ToF/快充芯片雙箭齊發(fā)97中國(guó)人壽:核心指標(biāo)遠(yuǎn)超同業(yè),重振國(guó)壽新起點(diǎn)9資料來(lái)源:wind資訊,GPT9GPT超PT3(約2萬(wàn)份PT超預(yù)期樣本的值為23,即67,PT超預(yù)期樣本包含了85%/GPT超預(yù)60%67%T6圖表22“GPT”與“文本”超預(yù)期樣本的年度分布情況 圖表23“GPT”與“文本”超預(yù)期樣本的月度分布情況GPT超預(yù)期GPT超預(yù)期文本超預(yù)期文本超預(yù)期/GPT超預(yù)期94%90%65%58%63%59% 48%0
“GPT超預(yù)期”與”文本超預(yù)期“樣本的年度分布情況
占比(%)140%120%100%0%2016 2017 2018 2019 2020 2021 2022 2023資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,GPT評(píng)分刻畫的超預(yù)期是否能帶來(lái)增量?GPT(JOR及JOR201701263種情況:“GPTJOR基于超預(yù)期樣本池構(gòu)建的JOR超預(yù)期樣本池的表現(xiàn)篩選了近6個(gè)月有GPTGPT70%。圖表24超預(yù)期樣本池?cái)?shù)量資料來(lái)源:wind資訊,接下來(lái),我們將前邊構(gòu)造的超預(yù)期組合,按照月頻調(diào)倉(cāng)進(jìn)行回測(cè),結(jié)果見圖表25和圖表26。GPT超預(yù)期樣本池年化8.0%,文本超預(yù)期樣本池年化7.8%;GPT雖然GPTGPT超預(yù)期文本超預(yù)期ChatGPT剔除ST*ST3A3500圖表25超預(yù)期樣本池的收益指標(biāo) 圖表26超預(yù)期樣本池的分年度收益收益超額收益文本超預(yù)期樣本池GPT超預(yù)期樣本池中證500文本-中證500GPT-中證500GPT-文本2017年10.328.20.449.887.76-2.122018年-20.93-24.1-33.3212.399.22-3.172019年39.7543.2426.3813.3716.863.492020年36.6838.2120.8715.8117.341.532021年12.0915.9815.59-3.50.393.892022年-18.42-18.27-20.311.892.040.152023年5.034.782.292.742.49-0.25資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,超預(yù)期樣本空間下的JOR因子JOR(JumpofReportDateFactor)因子是從技術(shù)面來(lái)構(gòu)建的盈余公告跳空因子,通過(guò)對(duì)盈余公告后次日(??)的最低價(jià)與盈余公告當(dāng)日(?????)的收盤價(jià)作為股價(jià)的跳空,同時(shí)剔除掉市場(chǎng)的因素,作為股價(jià)跳空的幅度,進(jìn)而用來(lái)度量超預(yù)期的幅度。????????,??
=(????????,??????????????,???1
?1)?(????????????,??
?1)????????,??為股票i在盈余公告次日的最低價(jià),????????????,??為股票i在盈余公告當(dāng)日的收盤價(jià);????????????,??為市場(chǎng)基準(zhǔn)指數(shù)在盈余公告次日的最低價(jià),????????????????,??為指數(shù)在盈余公告當(dāng)日的收盤價(jià),本文選擇中證500作為基準(zhǔn)指數(shù)。2個(gè)月(40日)和過(guò)去3個(gè)月(60日的最新的一個(gè)跳空RRRde和。以JR_0(2712021/2/53/314/10JOR3/31JOR24/10JORJOR因32/54/102/540JOR圖表27JOR_delay40因子的構(gòu)造邏輯舉例資料來(lái)源:“JOR因子JOR2個(gè)JOR4JOR圖表28超預(yù)期JOR因子列表因子 因子邏輯全A文本超預(yù)期GPT超預(yù)期
JOR_delay40JOR_delay60JOR_txtsue_delay40JOR_txtsue_delayJOR
過(guò)去2個(gè)月內(nèi)最新的一個(gè)跳空J(rèn)OR過(guò)去3個(gè)月內(nèi)最新的一文本超預(yù)資料來(lái)源:超預(yù)期JOR2930delay40還是delay60JOR_txtsue13%,GPTJOR_gptsue的覆20%85%GPTJOR_txtsue/JOR_gptsue的占比為67%,即2/3。圖表29超預(yù)期JOR因子的覆蓋度(delay40) 圖表30超預(yù)期JOR因子的覆蓋度(delay60)資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,超預(yù)期JOR因子測(cè)試JORJOR_txtsueJOR_gptsueMADz-score圖表31超預(yù)期JOR因子的分組數(shù)設(shè)置覆蓋度分組數(shù)覆蓋度/分組數(shù)JOR100%250.040JOR_txtsue13%30.043JOR_gptsue20%50.040資料來(lái)源:wind資訊,JORJORGPTJOR32-36圖表34,GPT超預(yù)期空間下的JOR因子較文本超預(yù)期JOR(ICIRIC勝率(JOR全體顯著增強(qiáng),再次驗(yàn)證了大,因子的表現(xiàn)越好,因此,我們選用delay60因子。RankICGPTGPTJORICICIR有明ICIR2.372.94;JORJOR17.1%15.2%;從勝率看,GPT超預(yù)期樣本空間下JOR的多頭勝率為65.8%,文本為64.5%,JOR61.8%;JORGPT2017GPTJORR圖表32超預(yù)期JOR因子的單因子測(cè)試結(jié)果類型因子RankICICIRIC勝率多頭年化多頭年化超額多頭勝率多空年化超額多空勝率全部(25分組)JOR_delay404.33%2.9984.110.08.260.519.863.2JOR_delay604.59%3.3487.011.29.461.822.465.8)JOR_txtsue_delay404.26%1.9175.714.112.263.28.353.9JOR_txtsue_delay604.52%2.3776.616.314.464.510.355.3)JOR_gptsue_delay404.27%2.7176.816.614.763.211.557.9JOR_gptsue_delay604.19%2.9480.517.115.265.813.159.2資料來(lái)源:wind資訊,圖表33超預(yù)期JOR因子的RankIC序列 圖表34不同樣本空間下JOR因子的分組年化收益(%)資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,圖表35超預(yù)期JOR因子的多空凈值曲線 圖表36不同樣本空間下JOR的多頭分年度收益(%)年度JOR(25分組)JOR_txtsue(3分組)JOR_gptsue(5分組)等權(quán)2017年-5.119.911.1-10.72018年-24.8-17.5-17.5-30.42019年43.854.058.327.02020年43.250.259.616.92021年41.523.926.525.52022年-16.8-16.2-16.0-10.62023年11.06.57.77.0資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,超預(yù)期JOR組合構(gòu)建JORJOR_txtsueJOR_gptsue我們下面嘗試構(gòu)建超預(yù)期JOR組合,每期篩選JOR值靠前10回測(cè)參數(shù)為:(1)AST*ST3A20%,(2)回測(cè)時(shí)間:2017.01.26-2023.06.30350050100delay6037-超預(yù)期JOR組合較文本超預(yù)期和JORGPTJOR50升了近2JR全體等權(quán)提升了10500年化超額272;相對(duì)文本超預(yù)期JRTJR081,2.32.578.1%84.4%0.3%。GPTJOR22232022GPTJOR5004.8%,而文本超預(yù)期和JR6018,相對(duì)文本超預(yù)期JOR5.8%5009.5%。圖表37優(yōu)選50等權(quán)組合的指標(biāo) 圖表38優(yōu)選50等權(quán)組合凈值曲線資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,圖表39優(yōu)選50等權(quán)組合分年度收益資料來(lái)源:wind資訊,10050GPT超預(yù)期JOR組合較文本超預(yù)期和JOR圖表40優(yōu)選100等權(quán)組合的指標(biāo) 圖表41優(yōu)選100等權(quán)組合凈值曲線100等權(quán)組合JOR等權(quán)加權(quán)100等權(quán)組合JOR等權(quán)加權(quán)JOR_txtsue等權(quán)加權(quán)JOR_gptsue等權(quán)加權(quán)中證500年化收益率15.1%18.5%19.8%-0.6%年化超額15.7%19.2%20.5%超額最大回撤-8.9%-8.8%-9.0%年化夏普0.560.770.80-0.12信息比率1.72.12.3Calmar比率0.440.570.60-0.01調(diào)倉(cāng)勝率-中證50068.8%78.1%75.0%調(diào)倉(cāng)超額均值-中證5003.05%3.54%3.81%資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,圖表42優(yōu)選100等權(quán)組合分年度收益資料來(lái)源:wind資訊,ChatGPT超預(yù)期”JORGPTGPTJORJOR有顯著收益增量,這一點(diǎn)在超預(yù)期Beta本身失效的近兩年尤為突出。ChatGPTChatGPT在股透視GPT評(píng)分,挖掘新型另類因子ChatGPT“GPT期”JOR接下來(lái),我們充分挖掘每一條具體評(píng)分所帶來(lái)的深度信息,并進(jìn)一步將其轉(zhuǎn)化為實(shí)際應(yīng)用的因子。ChatGPTGPTGPT,目的是將ChatGPT我們依然僅納入在3類盈余(預(yù)告、快報(bào)、正式報(bào)告)公告5個(gè)交易日內(nèi)的點(diǎn)評(píng)研報(bào)樣本,稱為“盈余點(diǎn)評(píng)”樣本。構(gòu)建以下GPT評(píng)分因子:PTgp_vg等權(quán),并非先計(jì)算日均評(píng)分再日間等權(quán)。如近3日有10個(gè)有效的評(píng)分記10正向因子p_wRcor的評(píng)分得到更大的權(quán)重。這種加權(quán)方式能夠確保因子更加關(guān)注近期的市場(chǎng)情緒或分析師的看法,認(rèn)為最近的評(píng)價(jià)更能反映股票的當(dāng)前或未來(lái)表現(xiàn)。理論上,時(shí)間衰減評(píng)分因子也是正向因子。????_??????=2
??????1??,??=1…??,??=??/2????_??????=∑????_??????最終權(quán)重????=????_??????/????_??????PTgpsdRcor負(fù)向因子圖表43指數(shù)衰減加權(quán)的權(quán)重計(jì)算舉例 圖表44指數(shù)衰減加權(quán)的權(quán)重示意圖日期標(biāo)記(i)GPT評(píng)分日期標(biāo)記(i)GPT評(píng)分初始權(quán)重最終權(quán)重2022/3/2018.525%11%2022/3/2018.625%11%2022/3/201925%11%2022/3/242935%15%2022/3/253850%22%2022/3/2649.571%31%合計(jì)231%100%資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,上邊的計(jì)算還涉及到2個(gè)參數(shù):有效記錄的認(rèn)定、窗口期的選擇:10%。13_1m_2m和_3m。JOR3(60類型因子gpt_avgRecord_1m等權(quán)加權(quán)類型因子gpt_avgRecord_1m等權(quán)加權(quán)gpt_avgRecord_2mgpt_avgRecord_3m指數(shù)衰減加權(quán)gpt_ewaRecord_1mgpt_ewaRecogpt_e釋義釋義近N1個(gè)月的有效權(quán)加波動(dòng)資料來(lái)源:GPT評(píng)分因子的表現(xiàn)AGPT43-52,基于GPT評(píng)分構(gòu)建的因子在全A在于,分析師對(duì)盈余的評(píng)論主要是文字描述,很少涉及具體的數(shù)值數(shù)據(jù)。因此,從因子角度看,其預(yù)測(cè)能力難以達(dá)到很高的水平。(avgRecord)RankIC、ICIRICa(sRcor3T1212gpt_avgRecord、gpt_ewaRecordgpt_stdRecord。合成因子在全A0.30.2圖表46GPT等權(quán)因子在全A的覆蓋度(%)資料來(lái)源:wind資訊,圖表47GPT評(píng)分因子檢測(cè)結(jié)果(全A,10組)AnalystavgRecordGrowthLiquidityOthersQualityReversalValueAnalyst126.3%33.9%-2.5%11.3%21.1%0.3%7.0%avgRecord26.3%119.7%-5.1%1.7%13.5%-5.8%-1.6%Growth33.9%19.7%1-3.4%4.9%53.4%-8.9%16.1%Liquidity-2.5%-5.1%-3.4%112.8%-6.1%54.2%13.8%Others11.3%1.7%4.9%12.8%17.7%8.7%7.9%Quality21.1%13.5%53.4%-6.1%7.7%1-3.8%34.9%Reversal0.3%-5.8%-8.9%54.2%8.7%-3.8%127.5%Value7.0%-1.6%16.1%13.8%7.9%34.9%27.5%1資料來(lái)源:wind資訊,d的RC為8CR為1C73Rank2021-20226.9%5.2%12.7%。分組收益:6.90%年化6.85%。分年度看gpt_avgRecord2021年圖表48GPT評(píng)分因子檢測(cè)結(jié)果(全A,10組)因子RankICICIRIC勝率多頭年化多頭年化超額多頭勝率多空年化超額多空勝率多空夏普多空最大回撤選擇gpt_avgRecord_1m2.8%1.6574.07.45.763.213.059.21.86-10.9√gpt_avgRecord_2m2.7%1.5472.76.95.167.112.560.51.78-11.9√gpt_avgRecord_3m2.4%1.3171.46.34.561.811.959.21.71-13.3gpt_avgRecord2.8%1.675.36.95.264.512.759.21.8-11.9gpt_ewaRecord_1m2.7%1.3563.68.16.461.811.955.31.39-13.3√gpt_ewaRecord_2m2.6%1.3168.89.47.665.812.459.21.47-13.6√gpt_ewaRecord_3m2.4%1.1464.99.57.759.214.257.91.69-12.7gpt_ewaRecord2.6%1.3470.19.07.261.812.556.61.49-13.8gpt_stdRecord_1m-1.6%-0.961.07.96.157.99.655.31.18-7.8√gpt_stdRecord_2m-1.2%-0.6561.06.04.257.97.553.90.92-11.0√gpt_stdRecord_3m-1.1%-0.6261.05.63.960.55.953.90.76-9.3gpt_stdRecord-1.34%-0.7559.76.54.856.68.353.91.03-9.8資料來(lái)源:wind資訊,圖表49gpt_avgRecord的IC序列(全A) 圖表50gpt_avgRecord分組收益(全A,10組)資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,圖表51GPT因子多頭分年度收益(全A,10組) 圖表52GPT因子多空凈值曲線(全A,10組)資料來(lái)源:wind資訊, 資料來(lái)源:wind資訊,非行業(yè)市值中性化的GPT53,RankIC好,但穩(wěn)定性不如行業(yè)市值中性化后的因子。gpt_avgRecord_1m的RankIC為3.22%9.8%15.9%。圖表53GPT評(píng)分因子(非行業(yè)市值中性化)檢測(cè)結(jié)果(全A,10組)因子RankICICIRIC勝率多頭年化多頭年化超額多頭勝率多空年化超額多空勝率多空夏普多空最大回撤gpt_avgRecord_1m3.2%1.2872.711.79.860.515.963.21.58-16.5gpt_avgRecord_2m3.0%1.1971.411.39.564.516.263.21.6-17.1gpt_avgRecord_3m2.8%1.0466.210.68.865.815.163.21.49-18.2gpt_ewaRecord_1m2.7%0.9362.39.67.860.513.660.51.16-17.6gpt_ewaRecord_2m2.7%0.9461.010.08.263.213.960.51.2-18.9gpt_ewaRecord_3m2.6%0.8659.712.010.263.217.563.21.5-20.4gpt_stdRecord_1m-1.2%-0.4944.26.24.547.48.655.30.84-11.7gpt_stdRecord_2m-0.9%-0.3641.67.05.347.48.555.30.83-13.1gpt_stdRecord_3m-0.8%-0.3245.55.23.548.75.556.60.54-12.9資料來(lái)源:wind資訊,指數(shù)域中GPT評(píng)分因子的表現(xiàn)在滬深300指數(shù)域中,行業(yè)市值中性化后的GPT評(píng)分因子整體表現(xiàn)不盡人意。圖表54GPT評(píng)分因子檢測(cè)結(jié)果(滬深300,5組)因子RankICICIRIC勝率多頭年化多頭年化超額多頭勝率多空年化超額多空勝率多空夏普多空最大回撤gpt_avgRecord_1m2.3%0.9161.00.5-1.453.92.847.40.32-23.8gpt_avgRecord_2m2.2%0.8557.11.3-0.656.62.951.30.33-26.5gpt_avgRecord_3m2.6%0.9361.03.31.459.27.052.60.81-22.2gpt_ewaRecord_1m2.1%0.7558.46.24.263.23.248.70.36-28.0gpt_ewaRecord_2m2.2%0.7558.45.43.463.22.648.70.28-31.9gpt_ewaRecord_3m2.4%0.7859.75.23.360.52.0500.21-28.7gpt_stdRecord_1m0.2%0.0650.71.90.057.9-3.148.7-0.37-25.4gpt_stdRecord_2m0.6%0.2052.0-0.1-1.952.6-4.944.7-0.57-31.6gpt_stdRecord_3m0.2%0.0854.61.1-0.842.1-3.744.7-0.42-33.4資料來(lái)源:wind資訊,在中證500指數(shù)域中,GPT評(píng)分因子具有一定的選股能力,采用等權(quán)因子(R
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國(guó)電視劇行業(yè)并購(gòu)重組擴(kuò)張戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)消費(fèi)性服務(wù)行業(yè)并購(gòu)重組擴(kuò)張戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)動(dòng)力電池行業(yè)并購(gòu)重組擴(kuò)張戰(zhàn)略制定與實(shí)施研究報(bào)告
- 自動(dòng)坦克模型課程設(shè)計(jì)指導(dǎo)書7
- 自動(dòng)安平水準(zhǔn)儀設(shè)計(jì)
- 袋鼠爪養(yǎng)護(hù)知識(shí)培訓(xùn)課件
- 2024年口語(yǔ)交際教案
- 期刊雜志市場(chǎng)深度調(diào)查及發(fā)展前景研究預(yù)測(cè)報(bào)告
- 2018-2024年中國(guó)多肉植物市場(chǎng)深度調(diào)研分析及投資前景研究預(yù)測(cè)報(bào)告
- 春季新銷售風(fēng)暴
- 2025年湖南出版中南傳媒招聘筆試參考題庫(kù)含答案解析
- 2025年度商用廚房油煙機(jī)安裝與維護(hù)服務(wù)合同范本3篇
- 2024年03月恒豐銀行2024年春季招考畢業(yè)生筆試歷年參考題庫(kù)附帶答案詳解
- 網(wǎng)絡(luò)安全系統(tǒng)運(yùn)維方案
- ISO 56001-2024《創(chuàng)新管理體系-要求》專業(yè)解讀與應(yīng)用實(shí)踐指導(dǎo)材料之14:“6策劃-6.3變更的策劃”(雷澤佳編制-2025B0)
- 【公開課】同一直線上二力的合成+課件+2024-2025學(xué)年+人教版(2024)初中物理八年級(jí)下冊(cè)+
- 12G614-1砌體填充墻結(jié)構(gòu)構(gòu)造
- 電鍍產(chǎn)品檢驗(yàn)作業(yè)指導(dǎo)書
- 湖北省武漢市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)及行政區(qū)劃代碼
- 路面輪胎模型建立方法swift
- 10KV供配電工程施工組織設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論