Beta獵手系列之七:追上投資熱點-基于LLM的產(chǎn)業(yè)鏈圖譜智能化生成_第1頁
Beta獵手系列之七:追上投資熱點-基于LLM的產(chǎn)業(yè)鏈圖譜智能化生成_第2頁
Beta獵手系列之七:追上投資熱點-基于LLM的產(chǎn)業(yè)鏈圖譜智能化生成_第3頁
Beta獵手系列之七:追上投資熱點-基于LLM的產(chǎn)業(yè)鏈圖譜智能化生成_第4頁
Beta獵手系列之七:追上投資熱點-基于LLM的產(chǎn)業(yè)鏈圖譜智能化生成_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

內(nèi)容目錄一、從大語言模型到智能體” 4如何理解智能體5Agents的運行機制 6二、Agent的應用與實踐 8單一智能體的部署——以為例 8多智能體的交互部署 10人與智能體的交互部署 10三、利用LLM-BasedAgent快速梳理產(chǎn)業(yè)鏈,捕捉投資熱點 10方法介紹 10產(chǎn)業(yè)鏈梳理智能體的構(gòu)建 12基于新聞數(shù)據(jù)進行產(chǎn)業(yè)鏈知識的拓展 14產(chǎn)業(yè)鏈梳理細化——相關(guān)投資標的推薦 15如何針對投資主題梳理其產(chǎn)業(yè)鏈信息? 16四、產(chǎn)業(yè)鏈梳理案例展示——以“華為供應鏈”主題為例 17投資主題梳理結(jié)果展示 17投資標的梳理結(jié)果展示 20五、總結(jié) 21風險提示 21圖表目錄圖表1:GPT商店界面 5圖表2:自定義GPTs界面 5圖表3:OpenAI提供的DataAnalysis應用案例 4圖表4:智能體技術(shù)演變 6圖表5:LLM-BasedAgent運行機制示例 6圖表6:智能體運行流程示意圖 7圖表7:LLM-BasedAgent三大應用場景 8圖表8:AutoGPT整體邏輯流程與模塊調(diào)用概念圖 8圖表9:AutoGPT生成的模板 9圖表10:多智能體交互模式示例 10圖表11:大語言模型擁有充足的產(chǎn)業(yè)鏈知識 11圖表12:手機產(chǎn)業(yè)鏈推導示意圖 12圖表13:產(chǎn)業(yè)鏈Agent運行流程示意圖 12圖表14:大語言模型產(chǎn)業(yè)鏈梳理結(jié)果展示 13圖表15:Wind智能手機產(chǎn)業(yè)鏈梳理結(jié)果展示 13圖表16:智能手機-顯示屏高相關(guān)新聞示例 14圖表17:智能手機-顯示屏上游(GPT3.5未疊加新聞) 14圖表18:智能手機-顯示屏上游(GPT3.5+202303-202306新聞) 15圖表19:智能手機-顯示屏上游(GPT3.5+202303-202310新聞) 15圖表20:智能手機-顯示屏上游投資標的推薦案例 16圖表21:投資主題拆解結(jié)果展示 17圖表22:“華為供應鏈”梳理(GPT4) 18圖表23:“華為供應鏈”梳理(GPT3.5+新聞) 19圖表24:“華為供應鏈”投資標的梳理結(jié)果 20的首屆開發(fā)者大會上公布了一系列新成果,但其中給人們帶來最大沖擊的不是全GPT商店。自推出以來,人們一直在尋找方法讓它成為適應特定使用目標的定制化產(chǎn)品,而正是為此而來。GPT進行“角色扮演”。當前GPTStore也已正式上線,包含超300萬個用戶設計的GPTs。OpenAIGPTsDataAnalysisGPTs圖表1:OpenAI提供的DataAnalysis應用案例來源:OpenAI,GPTsInstructions的具體行動內(nèi)容,還可以KnowledgeCapabilities調(diào)用代碼或其他接口的能力,GPTs并題問,它會自主地調(diào)用編程軟件并求解,直到它認為我們給出的問題已得到解答。圖表2:GPT商店界面 圖表3:自定義GPTs界面來源:OpenAI, 來源:OpenAI,實際上,類似的思路早已有雛形。之前火爆一時的AutoGPT項目可以實現(xiàn)用戶提問后大模型自主尋找解決方案,包括由模型規(guī)劃解決問題的步驟、使用哪些工具、以及得到反饋后自動進行下一步思考,在這一框架下模型獲得了一定的自主能力,并能夠獨立實現(xiàn)智能體get。如何理解智能體(Agent)?人工智能領(lǐng)域的“智能”概念與傳統(tǒng)理解有所不同,它更強調(diào)的是行使意志、做出選擇和采取行動的能力,強調(diào)物體不是單純被動地受外部刺激而做出反應。智能體則是泛指滿足上述行動要求的實體。歷史上的智能體實踐經(jīng)歷了多輪迭代。最初智能體僅停留在概念的層面,強調(diào)符號邏輯與反應速度。伴隨深度強化學習的發(fā)展,基于深度學習的智能體(RL-BasedAgents)開始發(fā)展,AlphaGo等廣為人知的項目獲得成功標志著智能體開始進入實際應用環(huán)境。不過,強化學習作為核心也帶來訓練時間長、采樣效率低以及穩(wěn)定性問題。大語言模型快速興起為智能體的發(fā)展也帶來了豐富想象,越來越多的人開始嘗試將大語言模型作為內(nèi)核,來構(gòu)建LLM-BasedAgent。大語言模型天生自帶的多模態(tài)感知、推理能力以及強大的泛化能力,為智能體帶來了豐富的應用場景。圖表4:智能體技術(shù)演變來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,智能體=大語言模型+規(guī)劃+工具+記憶大語言模型作為模型內(nèi)核,為智能體提供理解、推理與生成能力,也是其他所有功能的實現(xiàn)基礎。規(guī)劃步驟幫助智能體獲得對問題求解步驟進行拆分的能力,實現(xiàn)從“一問一答”向“自主思考”轉(zhuǎn)變,其本質(zhì)上依賴于大語言模型的推理能力。工具賦予智能體與環(huán)境交互的能力,是智能體行動的載體;記憶則記錄智能體每一輪的思考、行動以及獲取的反饋,幫助它在多輪迭代中保持思考的連貫。以下我們對這類基于大語言模型的智能體進行更詳細的介紹。LLM-BasedAgents的運行機制Agents的運行機制。當人類詢問“明天這里是否會-sdgnt圖表5:LLM-BasedAgent運行機制示例來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,感知模塊將指令轉(zhuǎn)換為大語言模型可以理解的表示形式;然后大腦模塊開始根據(jù)天氣的圖片、地理位置或是其他天氣相關(guān)的數(shù)據(jù)進行推理和行動規(guī)劃;最后由行動端做出響應并將雨傘遞給人類。以上只是大致的運作流程,實際上該流程內(nèi)部可能存在多輪迭代,譬如:第一輪,智能體識別出需要對下雨的概率進行估計,那么會規(guī)劃對天氣相關(guān)的數(shù)據(jù)進行實時收集,行為模塊就會執(zhí)行聯(lián)網(wǎng)的查詢或是數(shù)據(jù)庫調(diào)取這類操作;第二輪,模型讀取收集到的數(shù)據(jù),再決定是基于自有知識或是直接調(diào)用天氣預測模型,來給出下雨的概率;……最終,智能體在重復上述過程中不斷與環(huán)境交互并獲得反饋,最后得出結(jié)論??偨Y(jié)來說,智能體的運行流程可以簡化為:感知(Perception)、規(guī)劃(Planning)、行動(Action)。圖表6:智能體運行流程示意圖來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,感知的核心目的是將數(shù)據(jù)統(tǒng)一化為模型可以操作的向量形式,當然在實踐層面它還負責Prompt的編寫等工作。規(guī)劃模塊則負責進行推理和決策,主要是基于模型自身的參數(shù)來給出回答。在大語言模型的加持下,它能獲得“記憶”能力,結(jié)合自身過去的觀察、思考和行動進行規(guī)劃。行動模塊接收規(guī)劃給出的行動安排,并與環(huán)境產(chǎn)生互動,這也是讓智能體擁有自主性的最關(guān)鍵部分。工具一般以API或函數(shù)的形式提供,豐富的工具選擇可以大大拓寬智能體的能力范圍,補足大語言模型不擅長的方面。例如模型并不擅長數(shù)學運算,在需要涉及運算時我們允許模型調(diào)用代碼(Codeinterpreter)進行輔助,這樣可以明顯提升模型運算的準確度。大語言模型為智能體帶來如下的具體優(yōu)勢:知模塊也能添加圖像編碼器,在編碼器與大語言模型之間增添中間層的方式將Based的感知域擴展到視覺輸入層面;聽覺輸入方面,智能體可以以級聯(lián)方式調(diào)用現(xiàn)有工具集或模型庫來處理音頻信息,將感知空間從純文字領(lǐng)域擴展到包括文字、聽覺和視覺模式在內(nèi)的多模態(tài)領(lǐng)域。之外,針對復雜問題,我們還可以使用思維鏈(CoT)等技術(shù)有效提升智能體的推理能力。zero-shotfew-shot能力,允許我們通過描述工具功能或進行少量演示的提示方法來幫助智能體理解工具,這有助于模型進行復雜任務的拆分規(guī)劃;大語言模型還能夠按照指定的格式進行輸出,便于行動模塊準確讀取規(guī)劃的結(jié)果,這為智能體帶來更靈活且廣泛的工具調(diào)用能力。實踐中,我們一般要求模JSON格式給出選擇的工具名稱以及參數(shù)信息?!坝洃洝惫δ軒椭悄荏w從反饋中學習,與環(huán)境互動的能力幫助其在多輪推理中不斷接近目標。反饋包括環(huán)境反饋與人類反饋,智能體會識別自身行為給環(huán)境帶來的所有改變,包括任務是否完成等;在人類提供反饋時,智能體也會從人類給出的顯性評價或隱性行為中讀取反饋信息。類場景;除此之外,大語言模型還可以隨時補充專業(yè)領(lǐng)域的知識,以在特定任務上有更的知識庫搭載和微調(diào)FneTunngPrompt層面告訴模型一些專業(yè)知識來提升能力,而后者直接從參數(shù)層面對模型進行專業(yè)知識方向的提升。此外,若底層的大語言模型具有足夠的智能,LLM-BasedAgent還能通過生成可執(zhí)行程序或?qū)F(xiàn)有工具進行集成來創(chuàng)建工具,甚至在多個智能體的系統(tǒng)中為其他智能體制作軟件包。推測未來,智能體可能會變得自給自足,在工具方面表現(xiàn)出高度的自主性。LLM-BasedAgent的優(yōu)秀能力已被初步應用于各種現(xiàn)實場景,如軟件開發(fā)和科學研究等,但距離全方位的推廣還有一定距離。LLM-BasedAgent目前,LLM-BasedAgent應用實例的發(fā)展十分活躍,各類項目層出不窮。它們大致可以分為三種應用場景:單一智能體部署、多智能體交互部署和人與智能體交互部署。單個智能體擁有多種能力,在各種應用方向上都能表現(xiàn)出出色的任務解決能力。當多智能體互動時,它們可以通過合作或?qū)剐曰尤〉眠M步。目前單一智能體部署方面已有許多大膽嘗試,例如AutoGPT、Langchain等,此外還包括最近推出的GPTs。多智能體交互部署是未來的重點發(fā)展方向。圖表7:LLM-BasedAgent三大應用場景來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,單一智能體的部署——以AutoGPT為例AutoGPT是目前非常流行的開源項目之一,旨在實現(xiàn)完全自主的問題解決系統(tǒng)。除了GPT-4等大型語言模型的基本功能外,AutoGPT框架還集成了各種實用的外部工具和長短期內(nèi)存管理。理論上,用戶在輸入目標后就可以解放雙手,等待AutoGPT自動生成想法并執(zhí)行特定任務,所有這些都不需要用戶的額外提示。是將用戶的多目標復雜任務進行分步執(zhí)行,每一步使用何種工具以完成何種命令,都是通過調(diào)用大語言模型的返回結(jié)果決定的,從而極大程度上提升決策透明度,實現(xiàn)自我推理決策。此外,調(diào)用大語言模型時會將前幾輪推理結(jié)果的歷史信息一同傳給模LLM綜合全局的信息給出下一步要執(zhí)行的命令。其邏輯流程與模塊調(diào)用關(guān)系大致如下:圖表8:AutoGPT整體邏輯流程與模塊調(diào)用概念圖來源:GitHub,AutoGPT,從功能上來看,整個AutoGPT執(zhí)行可以分為四個步驟:任務構(gòu)建、LLM調(diào)用與結(jié)果解析、命令執(zhí)行、緩存處理四個部分。任務構(gòu)建是整個項目的核心所在,包括用戶的輸入以及Prompt生成兩大部分。用戶可以在最初的配置文件中指定任務目標、智能體角色和可使用的工具等。之后AutoGPT會對用戶的輸入進行整合與標準化形成Prompt文本,這也是該項目中最具特色的部分。目前階段,大語言模型的回答結(jié)果對Prompt依賴程度依舊較高,很可能使用了某些詞匯或句式可以大幅提升模型表現(xiàn)。因此,智能體的表現(xiàn)好壞與否很大程度上取決于其底層Prompt模板。命令、約束、表現(xiàn)評估和輸出格式的整個流程是在不斷地推理、行動與反思的循環(huán)中接近最終答案。圖表9:AutoGPT生成Prompt的模板來源:GitHub,AutoGPT,命令ommnds:通俗來說就是允許智能體調(diào)用的工具,包括執(zhí)行代碼、瀏覽網(wǎng)約束onstrants:約束主要給定一些輸入信息上的限制,防止多輪對話后智能體的“記憶”超出大語言模型的輸入上限。通過緩存來處理此前的行動與結(jié)果,為智能體賦予“記憶”的特性,但受限于當前大語言模型的輸入文本存在一定上限,智能體必須對記憶進行取舍。表現(xiàn)評估Prformncevutons:要求utoPT在每輪回答中對自己給出的回答進行反思,持續(xù)判斷思考的方向是否準確;同時要求后續(xù)求解步驟要盡可能精簡,以減少資源消耗。輸出格式RsponsectJSON格式輸出內(nèi)容。使用統(tǒng)一化的格式是為了方便后續(xù)調(diào)用命令時能讀取到具體的參數(shù)傳遞,提升智能體運行的穩(wěn)健性。隨后,大腦模塊進行新一輪思考并輸出標準化結(jié)果,同時判斷是否得到最終答案;若未獲得答案,行動模塊將開始解析輸出內(nèi)容并具體執(zhí)行命令;執(zhí)行得到的結(jié)果則進入記憶模塊,在下一輪流程開始時再導入模型。記憶模塊也是項目的一大特點,是由大語言模型向智能體邁進中不可或缺的功能。記憶性確保了思考的連續(xù),可以將歷史信息一起喂給模型,以便得到更優(yōu)、更全局思考的結(jié)果,同時也可以避免重復執(zhí)行而浪費計算資源。不過,這些功能能否按預期實現(xiàn)都依賴于大語言模型自身的能力是否足夠。AutoGPT在實際使用中經(jīng)常會陷入對某幾輪思考的循環(huán)中,這實際上就是受到了大語言模型輸入Token長度的限制導致智能體難以保留長期記憶;另一個現(xiàn)實問題就是成本,多輪思考通常會帶來較高的費用。不過這些問題在可預見的未來內(nèi)都將基本獲得解決。多智能體的交互部署Agent已展現(xiàn)出強大能力,且由于模型應用場景的固定化導致其實現(xiàn)多智能體的互動非常方便,例如擅長下圍棋的智能體之間進行對弈等。相比之下,LLM之間基于文本進行交流則更容易出現(xiàn)信息的丟失,這天生限制了它們從多輪反饋中學習以提高性能的潛力。不過伴隨參數(shù)量的上升,大語言模型展現(xiàn)出強大的文本理解和生成能力,從而大大提高了交互效率。這也是當前的發(fā)展趨勢之一。如下圖所示,基于大語言模型的多智能體交互模式可以大致分為:取長補短的合作式交互以及互利共贏的對抗式交互。在合作互動中,智能體以無序或有序的方式進行協(xié)作,以實現(xiàn)共同目標;在對抗式交互中,智能體以針鋒相對的方式展開競爭,以提高各自的性能。圖表10:多智能體交互模式示例來源:《TheRiseandPotentialofLargeLanguageModelBasedAgents:ASurvey》,具體來說,基于大語言模型的多智能體系統(tǒng)可以提供專業(yè)分工的優(yōu)勢。具備專業(yè)技能和領(lǐng)域知識的單個智能體可以從事特定的任務。同時,將復雜任務分解為多個子任務,可以省去在不同流程之間切換的時間。最終,多個智能體之間的高效分工可以完成比沒有專業(yè)化分工時大得多的工作量,從而大大提高整個系統(tǒng)的效率和產(chǎn)出質(zhì)量。人與智能體的交互部署人類能對LLM-BasedAgent進行最有效的指導和監(jiān)督,確保它們符合人類的要求和目標。人類的參與可以作為彌補數(shù)據(jù)不足的重要手段,從而促進更順利、更安全的協(xié)作過程。因此,智能體不應該完全依賴于用預先標注的數(shù)據(jù)集訓練出來的模型;相反,它們應該通過在線互動和參與來發(fā)展。實際上,目前我們使用ChatGPT等產(chǎn)品都是在進行這樣的交互,這也是最自然的交互形式之一。方法介紹當前市場熱點輪動速度不斷加快,而主題投資的核心就在于對主題相關(guān)產(chǎn)業(yè)鏈的快速梳理與分析,以及進一步對相關(guān)投資標的的迅速定位。因此,產(chǎn)業(yè)鏈研究也是當前市場上關(guān)注的熱點之一。如何快速了解一個完全陌生的產(chǎn)業(yè)或是投資熱點,乃至于定位其中的投資標的?投資者們迫切需要能實現(xiàn)以上功能的工具。我們嘗試基于大語言模型來做到這一點。對主動投資者來說,傳統(tǒng)的產(chǎn)業(yè)鏈梳理首先需要研究員對相關(guān)產(chǎn)業(yè)有較深入研究,且為了避免信息滯后需要定期跟蹤與實地調(diào)研才能掌握最新情況。而使用大語言模型進行產(chǎn)業(yè)鏈的梳理可以極大程度縮減反應速度,快速給出結(jié)果,盡管梳理結(jié)果的精度方面無法達到人工的程度,但在模型初步結(jié)果之上再進行手動檢查與修正同樣能顯著提升投資的反應速度;模型也能基于大數(shù)據(jù)給主觀投資提供增量信息,可能帶來新的投資視角。對量化投資者來說,本身了解新的產(chǎn)業(yè)鏈就存在一定壁壘,也需要大量資料搜集與專業(yè)的溝通之后才能逐步梳理出產(chǎn)業(yè)框架。使用大語言模型來輔助梳理產(chǎn)業(yè)鏈可以簡化工作,減少產(chǎn)業(yè)鏈投資中的各類成本。實踐結(jié)果顯示,盡管大語言模型具備充分的產(chǎn)業(yè)鏈知識,但無法直接給出完整的產(chǎn)業(yè)鏈結(jié)構(gòu)。梳理產(chǎn)業(yè)鏈是一個相對復雜的任務,通常人類專家需要在閱讀大量資料、積累豐富的產(chǎn)業(yè)相關(guān)知識后才能實現(xiàn),并且需要對產(chǎn)業(yè)鏈上每個產(chǎn)品的供需結(jié)構(gòu)有清晰的認識。當前的大語言模型當然也無法直接實現(xiàn)整個產(chǎn)業(yè)鏈結(jié)構(gòu)的推導,事實上,若我們單純詢PT4也可以給出比較完善的回答,但當面對較復雜的產(chǎn)業(yè)或需要給出更多產(chǎn)業(yè)鏈細節(jié)時,模型就無法處理了。不過從回答中我們可以看出,大語言模型的訓練文本中確實包含了充分的產(chǎn)業(yè)鏈知識,自身是有能力去回答產(chǎn)業(yè)鏈這種專業(yè)問題的。圖表11:大語言模型擁有充足的產(chǎn)業(yè)鏈知識來源:OpenAI,產(chǎn)業(yè)鏈中每一層級之間通過產(chǎn)品進行連接,上下游關(guān)系通過產(chǎn)品的供需關(guān)系得以建立。因此,整條產(chǎn)業(yè)鏈可以拆解到對其中每個產(chǎn)品的上下游分析中去。我們以智能手機為例,它的“直接組成產(chǎn)品”包括顯示屏、鋰電池、處理器、存儲等,這些也就是手機的“上游”產(chǎn)品;對其中顯示屏分析其直接組成產(chǎn)品,可以找出液晶面板、觸控模塊、二極管……末端條件:產(chǎn)品本身為原材料、或從整個產(chǎn)業(yè)鏈來看沒有繼續(xù)拆分必要的產(chǎn)品。比如對鋰電池我們最終會追溯到鎳、鈷等正極原材料,但對顯示屏來說到液晶材料、玻璃基板等就已經(jīng)足夠詳細了。以上方法需要我們首先給定一個核心產(chǎn)品,然后向上游或下游對每個節(jié)點逐步追索,直到觸及末端,最終給出完整的產(chǎn)業(yè)鏈結(jié)構(gòu)。這正是本次研究的核心框架。圖表12:手機產(chǎn)業(yè)鏈推導示意圖來源:大語言模型自身具備邏輯推理能力以及一定的產(chǎn)業(yè)鏈知識,非常適合用于處理這類非結(jié)構(gòu)化的信息。同時,產(chǎn)業(yè)鏈結(jié)構(gòu)相對穩(wěn)定,因此大語言模型用歷史信息也可以梳理出產(chǎn)業(yè)鏈結(jié)構(gòu)。因此,我們希望構(gòu)造一個以大語言模型為核心的智能體“產(chǎn)業(yè)鏈Agent”來自動化地完成產(chǎn)業(yè)鏈梳理任務。產(chǎn)業(yè)鏈梳理智能體的構(gòu)建智能體的交互核心在于行動模塊,我們首先需要明確“產(chǎn)業(yè)鏈Agent”應當能夠?qū)崿F(xiàn)哪些功能。除了上文提到的直接組成產(chǎn)品分析和是否觸及末端外,一個完整的產(chǎn)業(yè)鏈分析結(jié)果還需要能體現(xiàn)各個產(chǎn)品在其中的重要程度,這同樣是一個較為復雜的問題。這里我們簡單以成本占比作為排序標準,讓大語言模型根據(jù)其掌握的知識進行重要度的判斷。因此我們對框架進行細化,每次向上游分析出原產(chǎn)品的直接組成產(chǎn)品有哪些之后,要進一步判斷:1、各組成產(chǎn)品的重要性;2、各組成產(chǎn)品是否為末端產(chǎn)品。類似地,向下游探索時也需要首先找到對原產(chǎn)品依賴度高的下游產(chǎn)成品或服務,再判斷各自的重要性以及是否末端。以上兩個任務我們同樣基于大語言模型來完成。最后的行動模塊中,我們?yōu)楫a(chǎn)業(yè)鏈Agent增添了數(shù)據(jù)寫入以及新聞檢索的工具。數(shù)據(jù)寫入是最為基本的功能,需要實時保存對話記錄以及梳理后的產(chǎn)業(yè)鏈信息;新聞檢索則是對模型專業(yè)知識的巨大拓展,我們留到后文進行說明。完整的產(chǎn)業(yè)鏈梳理框架如下所示:圖表13:產(chǎn)業(yè)鏈Agent運行流程示意圖來源:其中,調(diào)用大語言模型的部分依舊需要我們維護一個完善的Prompt模板,來獲取上下游產(chǎn)品信息以及對應的重要性等。我們調(diào)用GPT4模型來進行初步實驗,得到如下回復:圖表14:大語言模型產(chǎn)業(yè)鏈梳理結(jié)果展示來源:OpenAI,我們可以與上現(xiàn)成的“智能手機產(chǎn)業(yè)鏈”進行對比,發(fā)現(xiàn)產(chǎn)業(yè)鏈Agent梳理出來的產(chǎn)業(yè)鏈結(jié)構(gòu)與結(jié)果基本保持一致;結(jié)果中的PCB等產(chǎn)品位于處理器、內(nèi)存的更上游,也將出現(xiàn)在產(chǎn)業(yè)鏈Agent最終完整的梳理結(jié)果中。我們認為產(chǎn)業(yè)鏈Agent具有正確梳理產(chǎn)業(yè)鏈結(jié)果的能力,并能最終導出網(wǎng)狀結(jié)構(gòu)的產(chǎn)業(yè)鏈圖譜。圖表15:智能手機產(chǎn)業(yè)鏈梳理結(jié)果展示來源:,基于新聞數(shù)據(jù)進行產(chǎn)業(yè)鏈知識的拓展針對手機這樣較為常見的產(chǎn)品,我們在分析產(chǎn)業(yè)時更想觀察到它在不同時間節(jié)點上的動態(tài)變化;而對一些相關(guān)信息較少的產(chǎn)品,模型可能掌握的相關(guān)知識較少,無法基于自有知識給出答案。為了解決這些問題,我們給出了基于檢索增強生成(RAG)的解決方案,為產(chǎn)業(yè)鏈Agent配置了新聞檢索的工具就是基于自然語言模型,在外部提供的知識庫或數(shù)據(jù)庫中尋找與所需回答問題相關(guān)性最高的文檔;生成步驟就是將用戶問題與檢索得到的信息結(jié)合后,放入大語言模型生成回復。Embedding轉(zhuǎn)換成向量格式,以便快速計算文本相似性,Embedding我們選擇“text2vec-large-chinese”模型。LangchainAgent項目都采用向量數(shù)據(jù)庫來實現(xiàn)中的檢索步驟,這是一個高效的相似性搜索和聚類的庫,能夠快速處理大規(guī)模數(shù)據(jù),并在高維空間中進行相似性搜索。相似性搜索會計算我們以智能手機的顯示屏為例,新聞時間區(qū)間為2023年3月至10月,篩選出與該產(chǎn)品相關(guān)性最高的新聞文本。以下新聞數(shù)據(jù)均來源于數(shù)庫。圖表16:智能手機-顯示屏高相關(guān)新聞示例新聞文本 文本距離液晶顯示屏及模組產(chǎn)品可應用于智能家居、可視對講產(chǎn)品,各種需要屏控的家電及電器產(chǎn)品(冰箱、洗衣機、溫控器、智能機器人、音響設備等)以及需要屏幕的車載、工控等領(lǐng)域的相關(guān)產(chǎn)品。發(fā)行人根據(jù)產(chǎn)品功能及應用領(lǐng)域不同細分產(chǎn)品類別,與同行業(yè)公司主要產(chǎn)品劃分基本相同,但是由于各家公司細分業(yè)務不同,產(chǎn)品分類略有不同。公司現(xiàn)已擁有豐富的顯示芯片產(chǎn)品系列,主要包括面板顯示驅(qū)動芯片、電源管理芯片、LEDLCD、LED、OLEDLED智能手機、平板電腦、超大屏電視、頭顯設備……顯示屏正在集成更多功能,衍生出更多形態(tài),應用到更多場景。在眾多新型顯示技術(shù)中,牢牢占據(jù)主流地位的LCD和穩(wěn)步上升的OLED處不在的未來世界,唯有創(chuàng)新應用,才能在激烈的競爭中充分釋放各自的價值,撬動更大的市場。作為信息交互的第一觸點和重要端口,新型顯示行業(yè)的重要地位不言而喻,而在人工智能、大數(shù)據(jù)、5G等新興科技的加持下,人類AMOLED調(diào)研時表示,在智能手機領(lǐng)域,得益于第6代AMOLEDAMOLED來源:數(shù)庫,

350.30084359.53342368.74445371.05957從新聞文本中我們可以看出,液晶顯示屏、顯示芯片、OLED等與顯示屏相關(guān)度較高的新聞都被篩選了出來,其中包含的市場現(xiàn)狀、專業(yè)知識等將為大語言模型的回答帶來增量信息。將篩選之后的新聞放入Prompt中,并告知大語言模型將自有知識與補充新聞進行綜合之后給出回答。疊加新聞數(shù)據(jù)后,使用ChatGPT-3.5模型進行產(chǎn)業(yè)鏈梳理同樣能獲得較高質(zhì)量的回答,ChatGPT3.5進行掛載新聞的測試,測試的對象為智能手機的顯示屏。我們對比一下情況:未疊加新聞數(shù)據(jù)、疊加2023年3月到6月新聞、以及疊加2023年3月到10月新聞的回答結(jié)果。圖表17:智能手機-顯示屏上游(GPT3.5未疊加新聞)序號產(chǎn)品名稱具體作用成本比例是否末端0液晶面板顯示圖像0.4是1OLED面板顯示圖像0.3是2背光模組提供背光0.15否3觸摸屏實現(xiàn)觸摸功能0.1否4驅(qū)動IC控制顯示屏驅(qū)動0.05否來源:OpenAI,圖表18:智能手機-顯示屏上游(GPT3.5+202303-202306新聞)序號產(chǎn)品名稱具體作用成本比例是否末端0液晶顯示屏顯示屏幕0.4是1模組產(chǎn)品整合顯示相關(guān)電路0.3是2面板顯示驅(qū)動芯片控制顯示面板0.15否3電源管理芯片管理顯示屏電源0.1否4LED顯示驅(qū)動芯片控制LED顯示0.05否來源:OpenAI,數(shù)庫,圖表19:智能手機-顯示屏上游(GPT3.5+202303-202310新聞)序號產(chǎn)品名稱具體作用成本比例是否末端0面板顯示驅(qū)動芯片用于控制顯示屏的工作和功能0.15否1LED顯示驅(qū)動芯片用于控制顯示屏的LED背光0.1否2控制芯片用于控制顯示屏的各項功能和接口0.1否3TFT-LCD顯示面板用于實現(xiàn)圖像的顯示0.25是4AMOLED半導體顯示面板用于實現(xiàn)圖像的顯示0.1是來源:OpenAI,數(shù)庫,可以看出,疊加新聞后的產(chǎn)業(yè)鏈Agent能給出更加細致的答案。例如在疊加新聞之前,它只能大致知道圖像顯示分為液晶面板和OLED面板;疊加全時間段新聞后,產(chǎn)業(yè)鏈Agent可以清楚知道當前主流采用的液晶技術(shù)為TFT-LCD,而自發(fā)光顯示方面目前主流采用AMOLED技術(shù)。同樣我們可以看出伴隨新的新聞數(shù)據(jù)加入數(shù)據(jù)庫后,產(chǎn)業(yè)鏈Agent梳理出來的結(jié)構(gòu)也會出現(xiàn)變化,掛載的新聞數(shù)據(jù)范圍更大,產(chǎn)業(yè)鏈Agent得到的產(chǎn)業(yè)鏈結(jié)構(gòu)也更加具體。當然,出現(xiàn)這樣明顯變化的原因可能在于我們提供的新聞數(shù)據(jù)范圍依然較短,這導致梳理出來的產(chǎn)業(yè)鏈結(jié)構(gòu)易于改變,但同時也證明產(chǎn)業(yè)鏈Agent掛載新聞數(shù)據(jù)之后,可以梳理出隨時間變化的動態(tài)產(chǎn)業(yè)鏈結(jié)構(gòu)。產(chǎn)業(yè)鏈梳理細化——相關(guān)投資標的推薦在實際投資中,投資者們梳理產(chǎn)業(yè)鏈的根本目的是獲取相關(guān)的投資標的,這也是我們梳理產(chǎn)業(yè)鏈后進一步想實現(xiàn)的功能。而在掛載新聞數(shù)據(jù)后,這一目標同樣可以通過新聞檢索與文本識別來實現(xiàn)。在底層新聞數(shù)據(jù)中,部分文本本身來源于個股的公告數(shù)據(jù),或是會在新聞開頭或其他標模型尋找出與新聞較為相關(guān)的上市公司信息,在檢索出新聞數(shù)據(jù)的同時便可查詢到對應投資標的。我們依舊以“智能手機-顯示屏”這一產(chǎn)品為例,給出該產(chǎn)品及其完整上游的相關(guān)投資標的梳理情況,淡藍色標簽表示產(chǎn)品,深藍色為投資標的及其代碼。需要注意的是,當前我們僅使用產(chǎn)業(yè)鏈上的產(chǎn)品信息篩選股票,若需要個股同時屬于某產(chǎn)業(yè)概念或有其他篩選條件,則需要在所有新聞文本中重新檢索并提取標的信息。圖表20:智能手機-顯示屏上游投資標的推薦案例來源:OpenAI,數(shù)庫,如何針對投資主題梳理其產(chǎn)業(yè)鏈信息?最后,我們在范圍更大的投資主題或投資概念下應用產(chǎn)業(yè)鏈梳理方法。多數(shù)時候,投資者更關(guān)注的是整個投資主題而非其中某個產(chǎn)品。投資主題形式多樣化,可以是某個公司、產(chǎn)品、地區(qū),甚至沒有對應的實體而僅僅是一種技術(shù)或概念,例如華為供應鏈、AR/VR、新能源汽車等等。我們利用業(yè)務的聯(lián)接作為切入,來處理相同主題下的不同產(chǎn)業(yè)鏈。此處,我們梳理的投資主題需要具有特定的業(yè)務作為核心,因此可能無法應用于一些聯(lián)系處于業(yè)務以外的概念,例如“中特估”等。如何確立主題相關(guān)業(yè)務同樣是較復雜,傳統(tǒng)的做法是依賴行業(yè)分析師的經(jīng)驗來確定哪些業(yè)務與該主題相關(guān),并進一步匹配相關(guān)標的。這種方法結(jié)果準確,但需要消耗大量的精力和時間,不利于在主題行情啟動時迅速跟進。為此,我們在梳理產(chǎn)業(yè)鏈的基礎上為產(chǎn)業(yè)鏈Agent增加了拆解投資主題的功能。以“華為供應鏈”為例,我們給出GPT4的回答結(jié)果:圖表21:投資主題拆解結(jié)果展示來源:OpenAI,從回答中可以看出,大語言模型首先將“華為供應鏈”投射到業(yè)務層面上,找出與概念相關(guān)性較高的數(shù)個業(yè)務板塊,再由業(yè)務去尋找相關(guān)度較高的終端產(chǎn)品或服務。有了具體的產(chǎn)品,我們可以很方便地調(diào)用產(chǎn)業(yè)鏈Agent來進行梳理,最終將各個產(chǎn)品的產(chǎn)業(yè)鏈進行匯總,得到“華為供應鏈”概念的上下游信息。投資主題梳理結(jié)果展示我們以“華為供應鏈”為例,梳理這一投資主題的上下游結(jié)構(gòu)。前文產(chǎn)業(yè)鏈Agent已總結(jié)出與該投資主題關(guān)聯(lián)最強的三個產(chǎn)品為:智能手機、5G基站設備、云服務。在此基礎上我們分別梳理各自的產(chǎn)業(yè)鏈信息,并進行匯總。我們首先使用GPT4為內(nèi)核的產(chǎn)業(yè)鏈Agent對“華為供應鏈”投資主題進行梳理。結(jié)果如下:圖表22:“華為供應鏈”梳理(GPT4)來源:OpenAI,

5G基站設備的梳理結(jié)果GPT4的訓練5G基站設備本身專業(yè)程度更高,網(wǎng)絡相關(guān)討GPT4對這部分的掌握較少。隨后,我們使用GPT3.5作為內(nèi)核,同時給Agent提供新聞檢索的能力來增強生成結(jié)果。圖表23:“華為供應鏈”梳理(GPT3.5+新聞)來源:OpenAI,數(shù)庫,

可以看出,5GGPT4的智能體先將云服務拆解成硬件、軟件等大類,再做上游劃分,GPT3.5模型在劃分上游時,其分類依據(jù)更加貼近于業(yè)務或功能,同時也能給出的節(jié)點產(chǎn)品更加細節(jié)化。整體來看,疊加新聞數(shù)據(jù)能對智能體的回答效果帶來明顯增益。GPT3.5GPT3.5模型給出節(jié)點信息后,再GPT4投資標的梳理結(jié)果展示最后,我們給出產(chǎn)業(yè)鏈Agent檢索得到的個股推薦結(jié)果。在篩選過程中,我們僅保留每只個股及其同時出現(xiàn)次數(shù)最多的產(chǎn)品節(jié)點,同時剔除掉了部分末端節(jié)點對應的個股。最終保留板塊股數(shù)量在72只。圖表24:“華為供應鏈”投資標的梳理結(jié)果個股代碼股票簡稱相關(guān)產(chǎn)品節(jié)點產(chǎn)業(yè)鏈個股代碼股票簡稱相關(guān)產(chǎn)品節(jié)點產(chǎn)業(yè)鏈300603.SZ002179.SZ003021.SZ002184.SZ002194.SZ立昂技術(shù)電源管理功率放大器內(nèi)存射頻濾波器5G5G5G5G5G002384.SZ002463.SZ002916.SZ002938.SZ300456.SZ東山精密PCBPCBPCBPCB半導體硅片智能手機002138.SZ300134.SZ001255.SZ600760.SH002975.SZ300322.SZ000063.SZ002635.SZ碩貝德射頻天線射頻天線5G5G5G5G5G5G5G5G300691.SZ603773.SH300598.SZ300496.SZ002241.SZ603160.SH688110.SH300183.SZ聯(lián)合光電沃格光電誠邁科技中科創(chuàng)達歌爾股份匯頂科技東芯股份東軟載波處理器電解液智能手機智能手機智能手機智能手機智能手機智能手機智能手機智能手機002792.SZ002881.SZ002229.SZ002261.SZ300379.SZ688171.SH300302.SZ東方通安全防護安全防護安全防護安全防護儲存設備5G基站設備5G基站設備云服務云服務云服務云服務云服務300543.SZ002185.SZ603005.SH300397.SZ688020.SH002158.SZ002456.SZ朗科智能華天科技晶方科技天和防務方邦股份漢鐘精機歐菲光電解液隔膜智能手機智能手機智能手機智能手機智能手機智能手機智能手機000034.SZ301128.SZ600498.SH603912.SH002123.SZ002334.SZ000977.SZ601138.SH佳力圖英威騰冷卻設備冷卻設備冷卻設備冷卻設備軟件開發(fā)數(shù)據(jù)中心硬件設備硬件設備云服務云服務云服務云服務云服務云服務云服務云服務000049.SZ300340.SZ300400.SZ688123.S

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論