互聯(lián)網(wǎng)行業(yè)人工智能應(yīng)用專題分析報(bào)告:國(guó)內(nèi)AI大模型趨勢(shì)互聯(lián)網(wǎng)大廠AI進(jìn)程_第1頁(yè)
互聯(lián)網(wǎng)行業(yè)人工智能應(yīng)用專題分析報(bào)告:國(guó)內(nèi)AI大模型趨勢(shì)互聯(lián)網(wǎng)大廠AI進(jìn)程_第2頁(yè)
互聯(lián)網(wǎng)行業(yè)人工智能應(yīng)用專題分析報(bào)告:國(guó)內(nèi)AI大模型趨勢(shì)互聯(lián)網(wǎng)大廠AI進(jìn)程_第3頁(yè)
互聯(lián)網(wǎng)行業(yè)人工智能應(yīng)用專題分析報(bào)告:國(guó)內(nèi)AI大模型趨勢(shì)互聯(lián)網(wǎng)大廠AI進(jìn)程_第4頁(yè)
互聯(lián)網(wǎng)行業(yè)人工智能應(yīng)用專題分析報(bào)告:國(guó)內(nèi)AI大模型趨勢(shì)互聯(lián)網(wǎng)大廠AI進(jìn)程_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

證券研究報(bào)告|2024年01月02日人工智能應(yīng)用專題(4):國(guó)內(nèi)AI大模型趨勢(shì)探討,互聯(lián)網(wǎng)大廠AI進(jìn)程梳理行業(yè)研究

·

行業(yè)專題摘要?

大模型技術(shù)本質(zhì)上

于科研創(chuàng)新與技術(shù)積累,我國(guó)大模型廠商根據(jù)自身特點(diǎn)演繹出不同的發(fā)展方向。大模型誕生與技術(shù)的積累與不斷創(chuàng)新,伴隨海外技術(shù)進(jìn)步與大模型開源,我國(guó)大模型企業(yè)也在不斷追趕,包括根據(jù)其技術(shù)路徑自研或在其開源框架上優(yōu)化調(diào)整。?

有效數(shù)據(jù)集有限,優(yōu)質(zhì)數(shù)據(jù)集仍舊稀缺,關(guān)注具備高質(zhì)量?jī)?nèi)容的平臺(tái)。大模型的未來(lái)發(fā)展依賴于訓(xùn)練數(shù)據(jù)集的質(zhì)量,而非僅僅是數(shù)量。AI技術(shù)把原先難以利用的非結(jié)構(gòu)數(shù)據(jù)帶入分析領(lǐng)域,內(nèi)容創(chuàng)作者所聚集的平臺(tái)成為高質(zhì)量數(shù)據(jù)的重要

。?

大模型后續(xù)競(jìng)爭(zhēng)格局B端與C端分化:C端更易于產(chǎn)生通用底座以及大一統(tǒng)的入口,通過(guò)豐富的插件、定制化功能、AIAgent滿足用戶的高度定制化和長(zhǎng)尾需求。B端定制化模型或垂類模型性價(jià)比更高,不同B端行業(yè)可能用各自模型來(lái)滿足企業(yè)場(chǎng)景、業(yè)務(wù)流程、模型大小和性能的差異化需求。?

AIAgent框架帶來(lái)全鏈路、定制化的信息處理能力,成為生產(chǎn)環(huán)節(jié)的重要輔助,助力智能硬件“All

inOne”搶占終端流量入口。AIAgent需要標(biāo)準(zhǔn)定義和模型能力進(jìn)化,同時(shí)GenerativeUI可能帶來(lái)人機(jī)交互方式的革新。?

月之暗面、清華GLM、百川智能:作為獨(dú)立的第三方模型廠商,創(chuàng)始人技術(shù)背景強(qiáng),模型迭代速度快,產(chǎn)品布局AIGC等各個(gè)領(lǐng)域。?

互聯(lián)網(wǎng)大廠騰訊、字節(jié)、百度、阿里:結(jié)合自身業(yè)務(wù)場(chǎng)景進(jìn)行模型和AI應(yīng)用的開發(fā),同時(shí)布局算力、平臺(tái)、大模型與應(yīng)用全環(huán)節(jié),關(guān)注AI生態(tài)建設(shè)。?

投資建議:國(guó)內(nèi)模型能力有望快速提升,帶動(dòng)應(yīng)用百花齊放。建議積極布局大模型相關(guān)廠商和產(chǎn)業(yè)鏈機(jī)會(huì)。?

風(fēng)險(xiǎn)提示:宏觀經(jīng)濟(jì)波動(dòng)風(fēng)險(xiǎn),下游需求不及預(yù)期風(fēng)險(xiǎn),AI倫理風(fēng)險(xiǎn),核心技術(shù)水平升級(jí)不及預(yù)期的風(fēng)險(xiǎn)等。2目錄大模型的競(jìng)爭(zhēng)格局演繹的關(guān)鍵因素獨(dú)立的模型團(tuán)隊(duì)—月之暗面、清華GLM、百川智能互聯(lián)網(wǎng)大廠的模型和應(yīng)用進(jìn)展—騰訊、字節(jié)、百度、阿里風(fēng)險(xiǎn)提示010203043大模型技術(shù)本質(zhì)上

于科研創(chuàng)新與技術(shù)積累?

海外大廠核心大模型的能力遷移是國(guó)內(nèi)AI發(fā)展的重要考量??疾焓欠裼泻M獯髲S核心大模型研發(fā)的技術(shù)積累和知識(shí)遷移到國(guó)內(nèi),以及這些技術(shù)在本土的應(yīng)用情況和調(diào)整,對(duì)理解國(guó)內(nèi)外AI技術(shù)的差異和互動(dòng)具有重要意義。?

國(guó)內(nèi)企業(yè)大模型技術(shù)路線有兩類:①自研效果復(fù)現(xiàn)類:參考GPT論文自研復(fù)現(xiàn)效果,前期耗時(shí)、后續(xù)Finetuning對(duì)于數(shù)據(jù)數(shù)量質(zhì)量也有一定要求,能力天花板高;②基于開源迭代類:訓(xùn)練更順暢但天花板低,依賴開源社區(qū),且開源模型如Llama2比較GPT3.5還是有差距。?

國(guó)內(nèi)企業(yè)大模型團(tuán)隊(duì)發(fā)展路徑有兩類:①?gòu)乃褟V推背景轉(zhuǎn)向大模型研發(fā),如百度和百川;②成立之初主要基于大模型研究路線和學(xué)術(shù)背景,如月之暗面的楊植麟團(tuán)隊(duì)和清華的智譜團(tuán)隊(duì)。圖1:不同公司/組織/院校近三年top-100AI發(fā)文數(shù)圖2:海外SuperGlue模型榜單排名(截至2023年12月)??資料

:SergiCastella

i

Sapé,《Mustread:the100mostcitedAIpapersin2022》,ZetaAlpha,2023年3月2日,國(guó)信證券經(jīng)濟(jì)研究所整理資料

:SuperGlue,參考文獻(xiàn):Z

Du、Y

Qian等,《GLM:GeneralLanguageModelPretrainingwithAutoregressiveBlankInfilling

》,ComputationandLanguage(cs.CL),2022,arXiv:2103.10360,國(guó)信證券經(jīng)濟(jì)研究所整理4基于開源大模型框架進(jìn)行優(yōu)化調(diào)整、應(yīng)用創(chuàng)新較易落地?

OpenAI的核心能力主要體現(xiàn)在三個(gè)方面:1)數(shù)據(jù)收集和處理的能力,包括數(shù)據(jù)

,清洗方式,數(shù)據(jù)結(jié)構(gòu)等;2)模型結(jié)構(gòu),包括注意力、隱藏層等設(shè)計(jì);3)訓(xùn)練方法,包括各類超參數(shù),學(xué)習(xí)率等。海外大模型開源后,我國(guó)大模型企業(yè)可在其框架上進(jìn)行優(yōu)化調(diào)整,以百川智能為例:?

基于開源模型提升性能:據(jù)GitHub,百川智能通過(guò)對(duì)LLaMA框架進(jìn)行修改以提升訓(xùn)練時(shí)的吞吐。此外,在LLaMA較為薄弱的中文語(yǔ)料方面,百川智能采用2000萬(wàn)條以中英為主的多語(yǔ)言語(yǔ)料訓(xùn)練分詞模型,顯著提高中文的壓縮率。?

大模型+搜索增強(qiáng)解決方案服務(wù)B端場(chǎng)景:百川智能通過(guò)借助搜索增強(qiáng),解決大模型在幻覺和時(shí)效性問(wèn)題,提升了模型的可用性,并拓展了應(yīng)用領(lǐng)域,如金融、政務(wù)、司法、教育等行業(yè)的智能客服、知識(shí)問(wèn)答、合規(guī)風(fēng)控、營(yíng)銷顧問(wèn)等。圖3:Baichuan-7B對(duì)LLaMA框架進(jìn)行優(yōu)化后的性能提升圖4:在LLaMA上進(jìn)行的研究工作的演化圖?資料

:GitHubBaiChuan主頁(yè),國(guó)信證券經(jīng)濟(jì)研究所整理資料

:WayneXinZhao、Kun

Zhou等,

《A

SurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國(guó)信證券經(jīng)濟(jì)研究所整理5高質(zhì)量訓(xùn)練數(shù)據(jù)促進(jìn)大模型技術(shù)的提升,但優(yōu)質(zhì)數(shù)據(jù)集稀缺?

有效數(shù)據(jù)集有限,優(yōu)質(zhì)數(shù)據(jù)集仍舊稀缺。當(dāng)前開源榜單公開訓(xùn)練數(shù)量級(jí),現(xiàn)有常見的大模型訓(xùn)練數(shù)據(jù)集往往在幾十到幾百B的量級(jí),優(yōu)質(zhì)的數(shù)據(jù)集可能就只有300-500Btoken,進(jìn)化到多模態(tài)數(shù)據(jù)量有所增加,但總量也不多。有的模型會(huì)用萬(wàn)億級(jí)別的數(shù)據(jù)token訓(xùn)練,但很多數(shù)據(jù)其實(shí)是無(wú)效的。?

大模型的未來(lái)發(fā)展依賴于訓(xùn)練數(shù)據(jù)集的質(zhì)量,而非僅僅是數(shù)量。根據(jù)ScalingLaw,Transformer架構(gòu)的語(yǔ)言模型性能在很大程度上取決于模型大小、數(shù)據(jù)集大小和訓(xùn)練計(jì)算量,性能與這三個(gè)因素之間存在冪律關(guān)系,且趨勢(shì)跨越多個(gè)數(shù)量級(jí),而對(duì)其他架構(gòu)細(xì)節(jié)(如網(wǎng)絡(luò)深度或?qū)挾龋┑囊蕾囅鄬?duì)較小。未來(lái)的大模型可能會(huì)經(jīng)歷增長(zhǎng)飛輪效應(yīng),但關(guān)鍵在于訓(xùn)練數(shù)據(jù)集的質(zhì)量。這強(qiáng)調(diào)了選擇和使用高質(zhì)量數(shù)據(jù)的重要性,而不僅僅是追求數(shù)量。單純的用戶數(shù)據(jù)上不一定會(huì)產(chǎn)生飛輪效應(yīng),比如某些用戶數(shù)據(jù)目前只具備統(tǒng)計(jì)學(xué)的能力,能夠發(fā)現(xiàn)邏輯、數(shù)學(xué)的問(wèn)題還需要找邏輯、數(shù)學(xué)數(shù)據(jù)集去優(yōu)化。圖5:各大模型訓(xùn)練數(shù)據(jù)集對(duì)比圖6:ScalingLaw模型性能與模型參數(shù)、數(shù)據(jù)集和訓(xùn)練計(jì)算量成冪律關(guān)系??資料

:Wayne?Xin?Zhao、Kun?Zhou等,?《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國(guó)信證券經(jīng)濟(jì)研究所整理資料

:OpenAI官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理6AI技術(shù)將更大范圍的數(shù)據(jù)帶入分析領(lǐng)域,關(guān)注稀缺內(nèi)容平臺(tái)?

AI技術(shù)把原先難以利用的非結(jié)構(gòu)數(shù)據(jù)(占比80%)帶入分析領(lǐng)域。AI浪潮下數(shù)據(jù)資產(chǎn)的重要性凸顯,Snowflake在財(cái)報(bào)會(huì)提到AI技術(shù)把原來(lái)客戶無(wú)法利用的非結(jié)構(gòu)化數(shù)據(jù)帶入分析領(lǐng)域構(gòu)成新的增量。一系列數(shù)據(jù)公司與產(chǎn)品受益,包括云數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域(Snowflake)、非結(jié)構(gòu)化/向量數(shù)據(jù)庫(kù)(MangoDB、Pinecone)、云數(shù)據(jù)監(jiān)控(DataDog)和ML/AIOps

領(lǐng)域(Databricks、AWSBedrock、Weights&Biases)。?

內(nèi)容創(chuàng)作者所聚集的平臺(tái),如字節(jié)和騰訊視頻號(hào)成為高質(zhì)量數(shù)據(jù)的重要

。

隨著內(nèi)容創(chuàng)作者轉(zhuǎn)向音視頻平臺(tái),這些平臺(tái)成為了聚集高質(zhì)量數(shù)據(jù)的熱點(diǎn),如字節(jié)跳動(dòng)和騰訊視頻號(hào)等平臺(tái)。部分觀點(diǎn)類數(shù)據(jù)可能具有一定時(shí)效性,如百度問(wèn)答和知乎等平臺(tái)上的數(shù)據(jù)。圖7:各大模型訓(xùn)練數(shù)據(jù)集對(duì)比圖8:AI技術(shù)下數(shù)據(jù)分析各領(lǐng)域的增量?公司模型參數(shù)量10T數(shù)據(jù)規(guī)模阿里巴巴智源研究院騰訊M6?1.9?TB圖像和?292GB?文本悟道2.0混元1.75T4.9T1T2T百度文心260B45TB中科院自動(dòng)化所智譜華章百川智能紫東·太初ChatGLM3百川100B1.42TB中文1.5B、3B和6B2B/7B/13B7B/20B2.6T上海人工智能實(shí)驗(yàn)

書生室2.3T(InternLM-20B)科大訊飛商湯科技星火170B1,04B7B數(shù)十億的語(yǔ)言數(shù)據(jù)集1.6?萬(wàn)億?token?1300億InternLM春田知韻(抖音)

豆包阿里云

通義千問(wèn)盤古7B3萬(wàn)億tokens200B40TB中文文本、3B圖像?資料

:各公司官網(wǎng)、國(guó)信證券經(jīng)濟(jì)研究所整理資料

:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,國(guó)信證券經(jīng)濟(jì)研究所整理7大模型的競(jìng)爭(zhēng)格局猜想—C端集中,B端差異化競(jìng)爭(zhēng)?

C端:通用的大模型技術(shù)底座不會(huì)太多,可能只會(huì)有一個(gè)大一統(tǒng)的入口,通過(guò)豐富的插件、定制化功能、AI

Agent滿足用戶的高度定制化和長(zhǎng)尾需求。從大模型的迭代發(fā)展,我們看到底層技術(shù)基于Transformer架構(gòu)的統(tǒng)一化。隨著模型能力的增強(qiáng),與硬件終端協(xié)同可能加劇流量入口的集成和統(tǒng)一。?

B端:不同行業(yè)具有各自垂類模型,不同大小的模型適用于不同場(chǎng)景。由于企業(yè)場(chǎng)景、業(yè)務(wù)流程差異化,不同的領(lǐng)域模型功能、數(shù)據(jù)集、模型大小和性能都有較大差別,定制化模型廠商或小模型性價(jià)比更高。目前出現(xiàn)很多競(jìng)爭(zhēng)廠商在B端發(fā)力,比如Cohere、或者在Huggingface上用開源模型改造。圖9:近年來(lái)現(xiàn)有(大于10B)大語(yǔ)言模型的時(shí)間軸圖10:北美各大企業(yè)的AI應(yīng)用行業(yè)分布??資料

:Wayne

XinZhao、Kun

Zhou等,

《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國(guó)信證券經(jīng)濟(jì)研究所整理資料

:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,國(guó)信證券經(jīng)濟(jì)研究所整理8OpenAI商業(yè)模式:大模型技術(shù)領(lǐng)先,積極嘗試構(gòu)建生態(tài)壁壘?

通過(guò)先進(jìn)的閉源實(shí)現(xiàn)商業(yè)化,通過(guò)開源前代模型構(gòu)建生態(tài):OpenAI的GPT技術(shù)路線是當(dāng)前模型自研商家優(yōu)先選擇并跟隨的技術(shù)方向,而OpenAI憑借大模型的領(lǐng)先優(yōu)勢(shì),后續(xù)更新到GPT5后,有可能將前代GPT3.5開源,通過(guò)更新一代、開源一代來(lái)實(shí)現(xiàn)自身戰(zhàn)略。領(lǐng)先模型閉源、服務(wù)B端客戶實(shí)現(xiàn)商業(yè)化,落后模型開源繁榮GPT生態(tài)與應(yīng)用建設(shè)。?

通過(guò)AIAgent的形態(tài)去構(gòu)建流量入口:OpenAI在AIAgent與流量入口領(lǐng)域有許多嘗試,比如插件生態(tài)、GPTs。GPTs出現(xiàn)打破過(guò)去的軟件孤島、復(fù)雜、不能滿足長(zhǎng)尾需求的缺點(diǎn),創(chuàng)建過(guò)程工具化標(biāo)準(zhǔn)化而且創(chuàng)建成果產(chǎn)品化。但是AIAgent必須要對(duì)個(gè)人有全鏈路的信息處理能力,當(dāng)前GPTs實(shí)際上對(duì)個(gè)人信息的創(chuàng)建和積累是分裂的,比如單人創(chuàng)建不同的GPTs,其實(shí)它們之間互不相連,導(dǎo)致可能會(huì)產(chǎn)生訓(xùn)練和數(shù)據(jù)的浪費(fèi)。圖11:OpenAI模型演進(jìn)圖圖12:OpenAI

GPTs應(yīng)用?DELL-E12021.01DELL-E22022.07DELL-E12023.09?資料:OpenAI官網(wǎng),參考文獻(xiàn):Wayne

XinZhao、Kun

Zhou等,

《ASurveyofLarge資料

:Gptshunter官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理LanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,國(guó)信證券經(jīng)濟(jì)研究所整理9AI

Agent:成為生產(chǎn)環(huán)節(jié)的定制化輔助,帶來(lái)人機(jī)交互的革新?

AI

Agent框架為大模型提供結(jié)構(gòu)化思考方法,成為生產(chǎn)環(huán)節(jié)的重要輔助:大模型作為理解推理能力不斷增強(qiáng),軟件生產(chǎn)進(jìn)入低門檻、高定制化時(shí)代,面向用戶的長(zhǎng)尾、個(gè)性化需求,Agent框架可以打造每個(gè)知識(shí)工作者的AI助理。?

AIAgent需要標(biāo)準(zhǔn)定義和模型能力進(jìn)化,同時(shí)GenerativeUI可能帶來(lái)人機(jī)交互方式的革新:當(dāng)前大模型對(duì)連續(xù)的復(fù)雜推理問(wèn)題包括對(duì)多模態(tài)信息的交叉處理仍有不足,需要用更復(fù)雜、結(jié)構(gòu)化、多維度的數(shù)據(jù)來(lái)進(jìn)一步學(xué)習(xí)。另一方面,Agent應(yīng)用對(duì)當(dāng)前的人機(jī)交互方式帶來(lái)改變,演進(jìn)成為同時(shí)適用于人類和AI操作的形式。?

案例:Agent以類人的方式與智能手機(jī)應(yīng)用進(jìn)行交互,使用點(diǎn)擊和滑動(dòng)等底層操作來(lái)操作圖形用戶界面(GUI)。利用大型語(yǔ)言模型的視覺能力以類似人類的方式操作智能手機(jī)應(yīng)用程序。在探索階段,智能體與智能手機(jī)應(yīng)用程序交互并從結(jié)果中學(xué)習(xí),以創(chuàng)建一個(gè)全面的參考文檔。在部署階段,智能體利用這個(gè)文檔匯編的信息來(lái)有效操作和導(dǎo)航應(yīng)用程序。圖13:用于操作智能手機(jī)應(yīng)用程序的多模態(tài)智能體框架概述圖14:多模態(tài)智能體框架在智能手機(jī)App操作中的多種應(yīng)用?資料:ChiZhang,ZhaoYang等,《AppAgent:

MultimodalAgentsasSmartphone

Users》,?

資料:ChiZhang,ZhaoYang等,《AppAgent:

MultimodalAgentsasSmartphoneUsers》,ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國(guó)信證券經(jīng)ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國(guó)信證券經(jīng)濟(jì)研究所整理10濟(jì)研究所整理智能硬件“All

inOne”終端流量入口的搶占之路?

AIGC將帶來(lái)無(wú)限的內(nèi)容生產(chǎn)與供給,進(jìn)而顛覆當(dāng)前的信息分發(fā)方式:a16z曾說(shuō)過(guò)“芯片將計(jì)算的邊際成本降到了零,互聯(lián)網(wǎng)將分發(fā)的邊際成本降到了零,現(xiàn)在AIGC實(shí)際上將創(chuàng)作的邊際成本降到零”。每個(gè)人都有機(jī)會(huì)獲得無(wú)限的娛樂(lè)內(nèi)容供給,互聯(lián)網(wǎng)常見的信息分發(fā)方式未來(lái)可能都面臨重組。人會(huì)從主動(dòng)生產(chǎn)和管理信息,進(jìn)化到與AI共同生產(chǎn)以及與AI輔助管控共存。?

智能終端充當(dāng)人類和AI認(rèn)知世界的延伸,依托大模型同時(shí)滿足生產(chǎn)力、社交娛樂(lè)等全面需求。相比軟件產(chǎn)品智能硬件終端更容易演化到allinone的形態(tài),從而搶占終端的流量入口。從蘋果生態(tài)來(lái)看,智能終端的壁壘同時(shí)取決于生態(tài)業(yè)務(wù)場(chǎng)景的廣度和深度,而AI大模型的技術(shù)同時(shí)帶來(lái)兩個(gè)維度的革新。圖15:蘋果MR眼鏡圖16:谷歌Pixel

AI手機(jī)圖17:AI

Pin資料

:公司官網(wǎng)、國(guó)信證券經(jīng)濟(jì)研究所整理資料理:公司官網(wǎng)、國(guó)信證券經(jīng)濟(jì)研究所整

資料

:公司官網(wǎng)、國(guó)信證券經(jīng)濟(jì)研究所整理11目錄大模型的競(jìng)爭(zhēng)格局演繹的關(guān)鍵因素獨(dú)立的模型團(tuán)隊(duì)—月之暗面、清華GLM、百川智能互聯(lián)網(wǎng)大廠的模型和應(yīng)用進(jìn)展—騰訊、字節(jié)、百度、阿里風(fēng)險(xiǎn)提示0102030412獨(dú)立的模型團(tuán)隊(duì)—月之暗面、清華GLM、百川智能13月之暗面:清華系新星楊植麟領(lǐng)銜,團(tuán)隊(duì)核心人員多為清華同門?

月之暗面(MoonshotAI)創(chuàng)始人楊植麟自2020年起便堅(jiān)信“大模型是未來(lái)”,2020年下半年為

的盤古大模型做核心技術(shù)研發(fā),2021年參與智源研究院的悟道大模型研發(fā)。2022年底楊植麟前往美國(guó)進(jìn)行為期2個(gè)月的考察,美國(guó)民眾對(duì)于GPT的狂熱讓他更堅(jiān)信此時(shí)正是成立大模型公司的合適時(shí)機(jī),于是他在接下來(lái)的1個(gè)月內(nèi)完成首輪融資,拿到來(lái)自紅杉等頭部機(jī)構(gòu)6000萬(wàn)美元的啟動(dòng)資金,并于3個(gè)月內(nèi)組建起了大約40人的技術(shù)研發(fā)團(tuán)隊(duì)。?

MoonshotAI于2023年3月成立,成立前其團(tuán)隊(duì)主要通過(guò)與其他公司合作,以團(tuán)隊(duì)提供技術(shù)、合作方提供算力的形式來(lái)完成大模型相關(guān)工作。創(chuàng)始團(tuán)隊(duì)核心成員參與了

GoogleGemini、GoogleBard、盤古NLP、悟道等多個(gè)大模型的研發(fā),多項(xiàng)核心技術(shù)被GooglePaLM、MetaLLaMa、StableDiffusion等主流產(chǎn)品采用。表1:MoonshotAI創(chuàng)始人團(tuán)隊(duì)背景介紹姓名持股比例職位簡(jiǎn)介本科畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,博士畢業(yè)于CMU計(jì)算機(jī)系,師從蘋果AI研究負(fù)責(zé)人RuslanSalakhutdinov和谷歌首席科學(xué)家WilliamCohen;博士期間,先后以一作身份,發(fā)表Transformer-XL和XLNet兩項(xiàng)工作,谷歌學(xué)術(shù)被引次數(shù)近2萬(wàn);據(jù)GitHub個(gè)人資料,楊植麟曾效力于Google和MetaPlatforms人工智能實(shí)驗(yàn)室,曾任循環(huán)智能聯(lián)合創(chuàng)始人。MoonshotAI創(chuàng)始人,CEO楊植麟78.97%本碩博均畢業(yè)于清華大學(xué)計(jì)算機(jī)系,師從清華大學(xué)計(jì)算機(jī)系副系主任、數(shù)據(jù)挖掘頂級(jí)專家唐杰教授,研究方向是異構(gòu)數(shù)據(jù)融合和知識(shí)圖譜構(gòu)建;曾作為核心開發(fā)者研發(fā)了全球知名的科技大數(shù)據(jù)分析平臺(tái)AMiner,產(chǎn)品服務(wù)于BATH等科技巨頭及國(guó)家科技部等政府科研管理機(jī)構(gòu)。MoonshotAI聯(lián)合創(chuàng)始人,CTO張宇韜周昕宇5%與楊植麟一同畢業(yè)于清華大學(xué)計(jì)算機(jī)系,畢業(yè)后加入,從事算法量產(chǎn)工作,旨在提升算法生產(chǎn)效率;就職期間,他和10%MoonshotAI聯(lián)合創(chuàng)始人研究院基礎(chǔ)科研負(fù)責(zé)人張祥雨一同研究移動(dòng)端模型,以共同一作的身份撰寫ShuffleNet論文,中標(biāo)CVPR,這項(xiàng)工作為包括蘋果3D人臉解鎖在內(nèi)的各種手機(jī)毫秒級(jí)人臉解鎖技術(shù)的發(fā)展提供了關(guān)鍵支持。與楊植麟背景類似,先后畢業(yè)于清華大學(xué)與CMU,研究方向?yàn)橛?jì)算機(jī)視覺中的檢測(cè)和識(shí)別問(wèn)題;曾就職于MetaFAIR,和隊(duì)員吳育昕資料5.96%MoonshotAI聯(lián)合創(chuàng)始人

何愷明共同提出組歸一化(GroupNormalization)的方法,吳育昕創(chuàng)建的detectron2,成為Meta受歡迎的AI項(xiàng)目之一;谷歌學(xué)術(shù)被引次數(shù)超過(guò)1.9萬(wàn)次。14:天眼查、國(guó)信證券經(jīng)濟(jì)研究所整理2023年首次發(fā)布大模型產(chǎn)品Kimi

Chat,長(zhǎng)文本能力為核心能力?

基于千億大模型的智能助手Kimi

Chat,核心能力為長(zhǎng)文本能力(LongContext):2023年10月9日,MoonshotAI推出首款產(chǎn)品,擁有長(zhǎng)達(dá)20萬(wàn)漢字的上下文處理能力,據(jù)MoonshotAI官方,這是目前全球市場(chǎng)上能夠產(chǎn)品化使用的大模型服務(wù)中所能支持的最長(zhǎng)上下文輸入長(zhǎng)度。此外,KimiChat還可處理多種文檔格式(如PDF、Excel等),具備較強(qiáng)的多語(yǔ)言能力,以及調(diào)用搜索引擎獲取信息,旨在為用戶提供強(qiáng)大、智能的對(duì)話伙伴,并為其工作、學(xué)習(xí)、生活提供助力。表2:MoonshotAI推出的大模型產(chǎn)品Kimi

Chat簡(jiǎn)介核心優(yōu)勢(shì)應(yīng)用實(shí)例底層技術(shù)處理長(zhǎng)文本:依靠長(zhǎng)文本技術(shù),KimiChat擁有長(zhǎng)達(dá)20萬(wàn)漢字的上下文處理能力,這意味著其能夠覆蓋更多應(yīng)用場(chǎng)景,且可直接基于全文理解進(jìn)行問(wèn)答和信息處理,從而極大程度上解決大模型的“幻覺”問(wèn)題。?

KimiChat根據(jù)提供的文章鏈接,快速總結(jié)分析公眾號(hào)長(zhǎng)文;?

KimiChat根據(jù)提供的上市公司財(cái)報(bào),快速總結(jié)要點(diǎn);支持多語(yǔ)言:相比當(dāng)前市面上以英文為基礎(chǔ)訓(xùn)練的大模型服務(wù),KimiChat在中文上具備顯著優(yōu)勢(shì),實(shí)際使用效果能夠支持約?

可閱讀長(zhǎng)篇中文小說(shuō)(如《三體》),并梳理內(nèi)容概要、角20萬(wàn)漢字的上下文,2.5倍于Claude-100k(實(shí)測(cè)約8萬(wàn)字),

色介紹等8倍于GPT-4-32k(實(shí)測(cè)約2.5萬(wàn)字)。大語(yǔ)言模型、長(zhǎng)文本處理技術(shù)、注意力機(jī)制長(zhǎng)程注意力機(jī)制:KimiChat通過(guò)創(chuàng)新的網(wǎng)絡(luò)結(jié)構(gòu)和工程優(yōu)化,可在千億參數(shù)下實(shí)現(xiàn)無(wú)損的長(zhǎng)程注意力機(jī)制,不依賴于滑動(dòng)窗口、降采樣、小模型等對(duì)性能損害較大的方案。?

可基于長(zhǎng)篇小說(shuō)、游戲設(shè)定進(jìn)行角色扮演,不會(huì)在多次對(duì)話后脫離設(shè)定?

可一次接收多篇上市公司財(cái)報(bào)并進(jìn)行市場(chǎng)分析;?

可一次接收多份出差發(fā)票并整理相關(guān)信息可處理多種文檔格式:KimiChat可處理多種文檔格式(包括PDF、Excel、CSV等)?

可一次接收多份求職簡(jiǎn)歷并根據(jù)用戶需求篩選排序出Top5求職者資料

:MoonshotAI官網(wǎng)、國(guó)信證券經(jīng)濟(jì)研究所整理15模型版本經(jīng)歷兩次更新,在多個(gè)場(chǎng)景下持續(xù)優(yōu)化模型效果?

KimiChat更新歷程:?

2023年11月15日,KimiChatV1.1

面向全社會(huì)開放版本,模型版本更新至moonshot-v1-20231115,主要更新內(nèi)容包括(1)大幅解決模型在復(fù)雜場(chǎng)景下輸出重復(fù)的問(wèn)題;(2)關(guān)閉頁(yè)面不再導(dǎo)致模型回復(fù)停止,同一對(duì)話下,各終端同步輸出內(nèi)容;?

2023年12月25日,KimiChat模型版本更新至moonshot-v1-20231225,主要更新包括(1)內(nèi)容生成長(zhǎng)度提升(2)優(yōu)化首字回復(fù)速度(3)實(shí)現(xiàn)從掃描件(文檔、合同、白板等)提取文字的功能,目前已支持掃描文件以PDF格式上傳解析(4)微信小程序端上線“Kimi智能助手”圖18:Kimi

Chat最新版本可從掃描件提取手寫文字并解析圖19:Kimi

Chat上線微信小程序“Kimi智能助手”???資料

:Moonshot?AI官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料

:Moonshot?AI官方公眾號(hào),國(guó)信證券經(jīng)濟(jì)研究所整理16智譜:清華KEG孵化而來(lái),團(tuán)隊(duì)核心成員多有清華背景?智譜AI由清華大學(xué)計(jì)算機(jī)系教授唐杰領(lǐng)銜的清華KEG(知識(shí)工程實(shí)驗(yàn)室)孵化而來(lái),其團(tuán)隊(duì)核心成員多有清華系背景。?

2019年成立以來(lái),智譜AI始終堅(jiān)持投身大模型技術(shù)研發(fā),愿景是“未來(lái)讓機(jī)器像人一樣思考”,并希望能對(duì)標(biāo)OpenAI;?

2020年6月,GPT-3發(fā)布,智譜AI意識(shí)到GPT模型已實(shí)現(xiàn)越級(jí)提升;?

2022年8月,智譜AI推出自研大模型GLM-130B,結(jié)合了GPT的單向向后預(yù)測(cè)模型框架與BERT的雙向預(yù)測(cè)的模型框架;公司專注于ToB和ToG服務(wù),客戶主要是企業(yè)和政府機(jī)構(gòu)。?

2023年,智譜AI獲融資25億,估值超百億人民幣。?目前智譜的合作案例包括:1)G端,跟北京政府合作提供智能客服能產(chǎn)品;跟北京中醫(yī)院合作中醫(yī)藥在線問(wèn)診模型構(gòu)建等;2)B端,跟中石油合作ERP改造企業(yè)工作流;跟美團(tuán)合作對(duì)話、廣告、搜索等功能;3)C端,提供ChatGLM通用大模型入口。圖20:智譜股權(quán)圖表3:智譜AI創(chuàng)始人團(tuán)隊(duì)背景介紹姓名

職位簡(jiǎn)介畢業(yè)于清華大學(xué)計(jì)算機(jī)系,博士研究方向?yàn)橹R(shí)圖譜。曾在KDD、ICML等國(guó)際頂會(huì)和期刊上發(fā)表多篇學(xué)術(shù)論文,榮獲2013年中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)三等獎(jiǎng)、2012年北京市科學(xué)技術(shù)三等獎(jiǎng)及2009年王選新聞科學(xué)技術(shù)獎(jiǎng)二等獎(jiǎng)等多項(xiàng)重要獎(jiǎng)項(xiàng)。張鵬

CEO劉德

董事長(zhǎng)、

師從高文院士,曾任清華數(shù)據(jù)科學(xué)研究院科技大數(shù)據(jù)研究中心副兵經(jīng)理主任王紹蘭總裁清華創(chuàng)新領(lǐng)軍博士??資料:天眼查,國(guó)信證券經(jīng)濟(jì)研究所整理資料:天眼查、國(guó)信證券經(jīng)濟(jì)研究所整理17模型迭代歷程:創(chuàng)新動(dòng)力充足,多個(gè)模型持續(xù)迭代GLM:?

2021.9設(shè)計(jì)GLM算法,發(fā)布擁有自主知識(shí)產(chǎn)權(quán)的開源百億大模型GLM-10B;?

2022.8發(fā)布高精度千億大模型GLM-130B并開源,效果對(duì)標(biāo)GPT-3175B,收到70余個(gè)國(guó)家、1000余個(gè)研究機(jī)構(gòu)的使用需求;?

2022.10發(fā)布開源的100+語(yǔ)言預(yù)訓(xùn)練模型mGLM-1BChatGLM:?

2023.3發(fā)布千億基座的對(duì)話模型ChatGLM及其單卡開源版本ChatGLM-6B,全球下載量超過(guò)800萬(wàn);為實(shí)現(xiàn)從GLM到ChatGLM的迭代,智譜AI加入了代碼訓(xùn)練、進(jìn)行SFT(Supervised

FineTuning,有監(jiān)督微調(diào))、加入RLHF(Reinforcement

LearningwithHumanFeedback,基于人類反饋的強(qiáng)化學(xué)習(xí));?

2023.6發(fā)布全面升級(jí)的ChatGLM2模型矩陣,據(jù)GitHub,主要更新包括(1)升級(jí)基座模型以提升模型在MMLU(+23%)、CEval(+33%)、GSM8K(+571%)、BBH(+60%)等數(shù)據(jù)集的性能表現(xiàn)(2)上下文長(zhǎng)度從2k擴(kuò)展至32k(3)推理速度提升42%;?

2023.8搭載ChatGLM2模型的AI生成式助手“智譜清言”上線;?

2023.10發(fā)布全面升級(jí)的ChatGLM3模型及相關(guān)系列產(chǎn)品,主要更新包括(1)升級(jí)基座模型以提升模型在MMLU(+36%)、CEval(+33%)、GSM8K(+179%)、BBH(+126%)等數(shù)據(jù)集的性能表現(xiàn)(2)在多模態(tài)理解、代碼增強(qiáng)、網(wǎng)絡(luò)搜索等功能上進(jìn)行迭代更新(3)集成自研AgentTuning技術(shù),激活模型智能體能力(4)推出可手機(jī)部署的端測(cè)模型,支持包括Vivo、小米、三星在內(nèi)的多種手機(jī)以及車載平臺(tái)(5)推理速度提升2-3倍,以上更新同樣作用于智譜清言;CodeGeeX:?

2022.9發(fā)布代碼生成模型CodeGeeX;?

2023.7發(fā)布新一代代碼生成模型CodeGeeX2,主要更新包括(1)代碼能力大幅提升,據(jù)GitHub,六種編程語(yǔ)言能力均大幅提升

(Python+57%,C+++71%,Java+54%,JavaScript+83%,Go+56%,Rust+321%);(2)支持編程語(yǔ)言數(shù)量大幅提升,達(dá)到100余種;18大模型產(chǎn)品涵蓋AI開放平臺(tái)、智譜清言及一系列AIGC產(chǎn)品?

智譜AI合作研發(fā)大模型GLM-130B,并基于此推出對(duì)話模型ChatGLM,開源單卡版模型ChatGLM-6B,并推出AI提效助手智譜清言(ChatGLM)。AIGC模型及其產(chǎn)品矩陣包括高效率代碼模型CodeGeeX、多模態(tài)理解模型CogVLM和文生圖模型CogView等;建立大模型MaaS開放平臺(tái),致力于AI生態(tài)建設(shè)。表4:智譜AI的大模型產(chǎn)品矩陣產(chǎn)品功能介紹應(yīng)用實(shí)例底層模型-為開發(fā)者提供開放平臺(tái),使其通過(guò)API調(diào)用,實(shí)現(xiàn)基于ChatGLM系列模型(ChatGLM-130B、ChatGLM-6B、GLM-130B)、CodeGeeX代碼大模型、多模態(tài)大模型(CogView、CogVideo)快速搭建AI應(yīng)用。電子簽約SaaS提供商上上簽集成GLM-130B大模型與行業(yè)數(shù)據(jù),推出簽約智能產(chǎn)品Hubble哈勃。AI開放平臺(tái)基于ChatGLM2開發(fā)的千億參數(shù)對(duì)話模型,支持多輪對(duì)話,具備內(nèi)容創(chuàng)作、信息歸納總結(jié)、代碼生成等能力。ChatGLM3:具問(wèn)答和對(duì)話功能的千億中英語(yǔ)言模型,不同于BERT、GPT-3以及T5的架構(gòu),是一個(gè)包含多目標(biāo)函數(shù)的自回歸預(yù)訓(xùn)練模型。ChatGLM(智譜清言)代碼生成能力:支持100余種編程語(yǔ)言,幫助用戶快速準(zhǔn)確生成代碼。CodeGeeX:千億級(jí)參數(shù)的多編程語(yǔ)言代碼生成大模型,在超過(guò)20種編程語(yǔ)言的大型代碼語(yǔ)料庫(kù)上進(jìn)行預(yù)訓(xùn)練?;贑odeGeeX代碼大模型的全能的智能編程助手,

可實(shí)現(xiàn)代碼的生成與補(bǔ)全、自動(dòng)添加注釋、支持主流編程語(yǔ)言,并適配多種主流IDE。

代碼翻譯以及智能問(wèn)答等功能。CodeGeeX免費(fèi)智能寫作工具,可生成AI原創(chuàng)內(nèi)容創(chuàng)意以及完成各種文本任務(wù),如文章、報(bào)告、新聞稿、營(yíng)銷文案等。GLM(GeneralLanguageModel):通用語(yǔ)言模型,通過(guò)自回歸空白填充目標(biāo)進(jìn)行預(yù)訓(xùn)練,并可在各種自然語(yǔ)言理解和生成任務(wù)上進(jìn)行微調(diào)??筛鶕?jù)不同創(chuàng)作模板完成不同類型的文案創(chuàng)作,如“元旦祝福”、“文章潤(rùn)色”等。寫作蛙基于GLM模型的智能對(duì)話機(jī)器人,可根據(jù)用戶定義

可創(chuàng)造多種不同人設(shè),如“林妹妹”、的人設(shè)切換對(duì)話風(fēng)格、進(jìn)行有情感地流暢表達(dá)。

“帶貨主播”等。小呆對(duì)話GLM?

CogView:全球首個(gè)中文的全領(lǐng)域文到圖生成模型,40億級(jí)參數(shù);?

CogVideo:是全球首個(gè)開源的大規(guī)模文本到視頻生成模型,90億級(jí)參數(shù)。CogView/Cog

基于CogView/CogViedeo大模型的文(中文)生圖

可根據(jù)用戶輸入的中文文字描述生成相關(guān)圖片/視頻。Video工具19資料:智譜AI官網(wǎng)、智譜官方公眾號(hào)、GitHub、國(guó)信證券經(jīng)濟(jì)研究所整理百川智能:前搜狗CEO王小川帶領(lǐng),團(tuán)隊(duì)核心成員多為知名科技公司AI頂尖人才?百川智能由前搜狗公司CEO王小川聯(lián)合前搜狗公司COO茹立云于2023年4月10日創(chuàng)立,團(tuán)隊(duì)核心成員多為來(lái)自搜狗、百度、、微軟、字節(jié)、騰訊等知名科技公司的AI頂尖人才,截至2023年10月,團(tuán)隊(duì)規(guī)模170余人,其中碩士及以上學(xué)歷員工占比近70%,研發(fā)人員占比超80%。融資方面,啟動(dòng)資金5000萬(wàn)美元來(lái)自創(chuàng)始人王小川及其業(yè)內(nèi)好友個(gè)人支持,2023年10月完成A1輪戰(zhàn)略融資,獲阿里、騰訊等科技巨頭及頂級(jí)投資機(jī)構(gòu)的3億美元融資金額,創(chuàng)下國(guó)內(nèi)大模型初創(chuàng)企業(yè)最快晉升獨(dú)角獸的記錄。?目前已有超過(guò)200家企業(yè)申請(qǐng)百川大模型開源和商業(yè)授權(quán),并已將百川模型投入實(shí)際生產(chǎn)場(chǎng)景。企業(yè)涵蓋互聯(lián)網(wǎng)、軟件和信息技術(shù)、金融、法律、教育、制造業(yè)、企業(yè)服務(wù)等眾多領(lǐng)域,客戶包括阿里云、騰訊、火山引擎、京東科技、順豐科技、浪潮、中國(guó)農(nóng)業(yè)銀行、蔚來(lái)汽車等。表5:百川智能創(chuàng)始人團(tuán)隊(duì)背景介紹姓名持股比例

職位簡(jiǎn)介畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),擁有學(xué)士、碩士及EMBA學(xué)位;曾任搜狗CEO,搜狐高級(jí)副百川智能創(chuàng)始人,

總裁兼CTO;先后發(fā)明了有5億多用戶在使用的搜狗輸入法、搜狗搜索等互聯(lián)網(wǎng)標(biāo)志性產(chǎn)品;曾帶王小川

76.43%CEO領(lǐng)搜狗公司發(fā)展語(yǔ)音、圖像、翻譯等AI技術(shù)并率先實(shí)用化,帶領(lǐng)搜狗公司成長(zhǎng)為國(guó)內(nèi)用戶規(guī)模第四大互聯(lián)網(wǎng)公司,并赴美上市中國(guó)人工智能第一股。畢業(yè)于清華大學(xué)計(jì)算機(jī)系,獲學(xué)士、碩士、博士學(xué)位及長(zhǎng)江商學(xué)院EMBA學(xué)位;曾任搜狗COO,葡萄百川智能聯(lián)合創(chuàng)始

智學(xué)創(chuàng)始人;曾帶領(lǐng)搜狗搜索在多個(gè)搜索領(lǐng)域取得不俗成績(jī),如率先發(fā)布分類搜索、推出全新的茹立云

0.77%人知識(shí)庫(kù)搜索引擎知立方、搜狗語(yǔ)音助手等產(chǎn)品,并成為唯一一家能夠提供“通用搜索”、“微信公眾平臺(tái)搜索”及微信內(nèi)容差異化閱讀服務(wù)的搜索引擎。資料:天眼查、國(guó)信證券經(jīng)濟(jì)研究所整理20成立8個(gè)月內(nèi)發(fā)布8款自研大模型,速度與性能俱佳模型研發(fā)方面,自成立以來(lái),百川智能先后發(fā)布Baichuan-7B/13B,Baichuan2-7B/13B四款開源模型和Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo四款閉源模型,并與國(guó)家級(jí)科研機(jī)構(gòu)鵬城實(shí)驗(yàn)室共同發(fā)布基于國(guó)產(chǎn)算力訓(xùn)練的最長(zhǎng)上下文窗口大模型“鵬城-百川·腦海33B”。表6:百川智能大模型基本信息及測(cè)評(píng)表現(xiàn)模型基本信息發(fā)布時(shí)間是否開源

測(cè)評(píng)表現(xiàn)基于Transformer結(jié)構(gòu),在大約1.2萬(wàn)億tokens上訓(xùn)練而成,參數(shù)量70億,支持中英雙語(yǔ),上下文窗口長(zhǎng)度為4096。國(guó)內(nèi)首個(gè)開源可商用模型,國(guó)內(nèi)外多榜單排名第一,在中文榜大幅度領(lǐng)先,英文榜首超LlaMA。Baichuan-7B2023.6.15是在Baichuan-7B的基礎(chǔ)上提升參數(shù)量到130億,在高質(zhì)量語(yǔ)料上訓(xùn)練1.4萬(wàn)億tokens(同等級(jí)別開源模型中訓(xùn)練數(shù)據(jù)最多,超LLaMA-13B40%);同時(shí)開源預(yù)訓(xùn)練模型(Baichuan-13B-Base)和對(duì)齊模型(Baichuan-13B-Chat),服務(wù)于開發(fā)者與普通用戶。Baichuan-13B同等級(jí)開源模型中效果最好的可商用大語(yǔ)言模型,中文榜大幅領(lǐng)先LlaMA-13B,英文榜超越所有同等級(jí)開源模型。2023.7.11是得益于團(tuán)隊(duì)的搜索引擎背景,Baichuan-53B采用高質(zhì)量知識(shí)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并通過(guò)搜索增強(qiáng)(融合指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件)減少模型幻覺;此外,進(jìn)行對(duì)齊調(diào)整以使模型同人類價(jià)值觀對(duì)齊,從而生成“更令人滿意”的回復(fù)內(nèi)容。Baichuan-53B2023.8.82023.9.62023.9.25否是否-Baichuan2-7B/13B包括Baichuan2-7B、Baichuan2-13B,基于2.6萬(wàn)億高質(zhì)量多語(yǔ)言數(shù)據(jù)訓(xùn)練而成,在數(shù)學(xué)、代碼、安全、邏輯推理、語(yǔ)義理解等能力有顯著提升。在MMLU、CMMLU、GSM8K等幾大權(quán)威評(píng)估基準(zhǔn)中,以絕對(duì)優(yōu)勢(shì)領(lǐng)先LLaMA2,性能大幅度優(yōu)于LLaMA2等同等級(jí)模型競(jìng)品。對(duì)Baichuan-53B各項(xiàng)能力進(jìn)行提升(邏輯推理+100%,數(shù)學(xué)+31%,語(yǔ)言理解+29%,文本創(chuàng)作+18%,知識(shí)問(wèn)答+9%),重點(diǎn)升級(jí)邏輯推理與數(shù)學(xué)能力;通過(guò)高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng)極大降低模型幻覺;開放API接口,以方便企業(yè)與開發(fā)者將其集成至自己的應(yīng)用程序或服務(wù)中。在FacTool測(cè)評(píng)(查核大模型生成內(nèi)容的事實(shí)準(zhǔn)確性)中,Baichuan2-53B的綜合得分為140.5,在主流基礎(chǔ)大模型中僅排在GPT-4之后,處于國(guó)內(nèi)領(lǐng)先水平。Baichuan2-53B上下文窗口長(zhǎng)度高達(dá)192K,在長(zhǎng)窗口文本生成質(zhì)量、長(zhǎng)上下文理解以及長(zhǎng)文本問(wèn)答、摘要等方面全面領(lǐng)先Claude2;通過(guò)算法和工程優(yōu)化,實(shí)現(xiàn)窗口長(zhǎng)度

2023.10.30和模型性能之間的平衡;以API調(diào)用和私有化部署的方式提供給企業(yè)用戶。Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10項(xiàng)中英文長(zhǎng)文本問(wèn)答、摘要的評(píng)測(cè)集上表現(xiàn)優(yōu)異,有7項(xiàng)取得SOTA,顯著超過(guò)其他長(zhǎng)窗口模型。否否Baichuan2-Turbo融合長(zhǎng)上下文窗口和搜索增強(qiáng),鏈接大模型與領(lǐng)域知識(shí)、全網(wǎng)知識(shí);支持多種文檔(PDF、Word)上傳及網(wǎng)址輸入;開放API。2023.12.19-21資料:百川智能官網(wǎng)、百川大模型官方公眾號(hào)、GitHub、國(guó)信證券經(jīng)濟(jì)研究所整理目錄大模型的競(jìng)爭(zhēng)格局演繹的關(guān)鍵因素獨(dú)立的模型團(tuán)隊(duì)—月之暗面、清華GLM、百川智能互聯(lián)網(wǎng)大廠的模型和應(yīng)用進(jìn)展—騰訊、字節(jié)、百度、阿里風(fēng)險(xiǎn)提示0102030422騰訊:混元大模型+應(yīng)用解析23騰訊-基礎(chǔ)大模型:混元大模型?

混元大模型是騰訊自研的通用大語(yǔ)言模型。具有超千億的參數(shù)規(guī)模、超2萬(wàn)億tokens的預(yù)訓(xùn)練語(yǔ)料。9月,騰訊混元大模型正式通過(guò)騰訊云對(duì)外開放。用戶可以直接調(diào)用API接口,或者將騰訊混元作為基底模型,在公有云上進(jìn)行精調(diào)。?

10月,騰訊混元大模型迎來(lái)全新升級(jí),并正式對(duì)外開放“文生圖”功能。根據(jù)公司介紹,升級(jí)后的騰訊混元中文效果整體超過(guò)GPT3.5,代碼能力大幅提升20%,達(dá)到業(yè)界領(lǐng)先水平。?

11月世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì),騰訊集團(tuán)副總裁蔣杰還展示了騰訊混元大模型的“文生視頻”能力。?

混元助手是基于騰訊混元大模型的多模態(tài)對(duì)話Bot產(chǎn)品。隨著9月騰訊混元大模型首批通過(guò)備案,混元助手以微信小程序的形式陸續(xù)面向公眾開放。在場(chǎng)景的AI聊天頁(yè)面之外,還在“靈感發(fā)現(xiàn)”頁(yè)面提供了多個(gè)場(chǎng)景化的應(yīng)用。除文生文外,混元助手已經(jīng)支持文生圖功能,尚不支持文生視頻和讀圖功能。圖21:騰訊混元助手小程序圖22:騰訊混元文生圖功能??24資料

:騰訊云AI官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料

:騰訊混元官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理騰訊-MaaS:騰訊云TI平臺(tái),打造行業(yè)大模型精選商店?

MaaS云服務(wù):騰訊于今年6月首次公布騰訊云行業(yè)大模型方案,依托騰訊云TI平臺(tái),打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù)。?

中國(guó)銀聯(lián):在單據(jù)識(shí)別錄入場(chǎng)景,騰訊云TI-OCR訓(xùn)練平臺(tái)整合OCR大模型,支持銀聯(lián)快速自定義證件、票據(jù)、文本識(shí)別,實(shí)現(xiàn)業(yè)務(wù)流程自動(dòng)化,提升效率并節(jié)約成本。?

上海仁濟(jì)醫(yī)院:運(yùn)用騰訊云醫(yī)療行業(yè)大模型,以互聯(lián)網(wǎng)醫(yī)院適老化服務(wù)為重點(diǎn),打造了高度擬人化的虛擬數(shù)字形象“小威護(hù)士”,有效提升患者就醫(yī)體驗(yàn)。?

8月起,騰訊云TI平臺(tái)全面接入Llama2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多個(gè)主流模型。圖23:騰訊云MaaS全景圖???資料:騰訊云智能官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理25騰訊-AI基建:自研紫霄芯片+HCC算力集群+向量數(shù)據(jù)庫(kù)?

騰訊自研芯片已經(jīng)量產(chǎn),包括用于AI推理的紫霄芯片:采用自研存算架構(gòu)和自研加速模塊,可以提供高達(dá)3倍的計(jì)算加速性能和超過(guò)45%的整體成本節(jié)省。目前在騰訊會(huì)議實(shí)時(shí)字幕上已實(shí)現(xiàn)全量上線,單卡紫霄機(jī)器負(fù)載可達(dá)到T4的4倍,并將超時(shí)率從0.005%降低至0。?

騰訊云在4月發(fā)布新一代HCC高性能計(jì)算集群:采用最新一代星星海自研服務(wù)器,搭載NVIDIAH800TensorCoreGPU,性能較前代提升3倍。通過(guò)對(duì)單機(jī)算力、網(wǎng)絡(luò)架構(gòu)和存儲(chǔ)性能進(jìn)行協(xié)同優(yōu)化,能夠?yàn)榇竽P陀?xùn)練提供高性能、高帶寬、低延遲的智算能力支撐。?

騰訊云在7月發(fā)布AI原生的向量數(shù)據(jù)庫(kù):之后經(jīng)過(guò)多次迭代升級(jí),在優(yōu)化版的IVF索引支持下,從最初支持的十億向量規(guī)模到現(xiàn)在的千億規(guī)模和500萬(wàn)QPS峰值能力。目前,騰訊云向量數(shù)據(jù)庫(kù)已經(jīng)在內(nèi)部服務(wù)于騰訊視頻、QQ瀏覽器、QQ音樂(lè)等40多個(gè)業(yè)務(wù),日請(qǐng)求量達(dá)1600億次,服務(wù)了包括博世、銷售易、搜狐、好未來(lái)、鏈家等在內(nèi)的超過(guò)1000家外部客戶。圖24:騰訊云新一代HCC集群圖25:紫霄芯片算力參數(shù)跟其他常見芯片的對(duì)比圖26:騰訊云向量數(shù)據(jù)庫(kù)資料

:騰訊云官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料

:騰訊云官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料

:騰訊云數(shù)據(jù)庫(kù)官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理26騰訊-SaaS產(chǎn)品:AI提供了生成式新功能和潛在銷售機(jī)會(huì)?

根據(jù)“騰訊混元”官方公眾號(hào)的10月推文,超過(guò)180個(gè)騰訊內(nèi)部業(yè)務(wù)已接入騰訊混元,包括騰訊會(huì)議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。我們認(rèn)為,SaaS產(chǎn)品在接入混元大模型后,不僅帶來(lái)了更豐富的AI功能,也提供了新的銷售機(jī)會(huì),有望帶動(dòng)SaaS產(chǎn)品用戶數(shù)和客單價(jià)的提升。?

騰訊會(huì)議:AI小助手,已經(jīng)上線部分功能。提供會(huì)前日程協(xié)調(diào)、會(huì)中問(wèn)答、會(huì)后智能紀(jì)要、會(huì)議待辦項(xiàng)等新功能。其中,“智能錄制不限次(包括智能紀(jì)要)”已經(jīng)加入付費(fèi)版本專屬權(quán)益,有望帶動(dòng)騰訊會(huì)議付費(fèi)率的提升。?

騰訊文檔:智能助手。支持?jǐn)?shù)十種文本創(chuàng)作場(chǎng)景,提供文檔創(chuàng)作、文本潤(rùn)色、文本校閱、表格公式及圖表生成等能力,提高創(chuàng)作效率,提升創(chuàng)作體驗(yàn)。目前智能助手已經(jīng)率先嵌入智能文檔中,需要申請(qǐng)后參與試用;未來(lái)還將嵌入智能表格、PPT、思維導(dǎo)圖等文檔類型。參照NotionAI,智能助手有望帶動(dòng)騰訊文檔付費(fèi)率和客單價(jià)的提升。?

此外,騰訊企點(diǎn)、企業(yè)微信、AI代碼助手等SaaS產(chǎn)品同樣在AI加持下增添了更多新功能,提升了潛在銷售機(jī)會(huì)。圖27:騰訊會(huì)議AI小助手圖28:騰訊文檔智能助手??資料

:騰訊云AI官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料

:騰訊云AI官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理27騰訊-廣告平臺(tái):AI一方面增強(qiáng)廣告定向和歸因,另一方面通過(guò)AIGC提升廣告創(chuàng)作效率和效果?增強(qiáng)廣告定向和歸因的準(zhǔn)確性:2022年6月,騰訊廣告對(duì)外公布了借助大模型降本增效的進(jìn)展:首先以混元AI大模型助力系統(tǒng)深刻理解廣告內(nèi)容,其次以精排大模型提升廣告和用戶的匹配準(zhǔn)確率。騰訊連續(xù)4個(gè)季度在業(yè)績(jī)公告中提及機(jī)器學(xué)習(xí)平臺(tái)升級(jí)和廣告AI模型。?AI智能化創(chuàng)作廣告素材:騰訊廣告以騰訊混元大模型為基礎(chǔ),結(jié)合廣告應(yīng)用場(chǎng)景,實(shí)現(xiàn)含文生圖及文生視頻在內(nèi)的多種智能化廣告素材創(chuàng)作能力,滿足千人千面。目前,騰訊廣告“AI創(chuàng)意工作臺(tái)”已覆蓋電商、文旅、閱讀資訊、游戲等多個(gè)行業(yè)場(chǎng)景,針對(duì)閱讀行業(yè)還在持續(xù)打磨古言、都市、玄幻等小說(shuō)人物形象模型,已從9月份開始陸續(xù)為廣告主提供“素材創(chuàng)作”、“二次編輯&一鍵投放”、“商品生成”等核心能力。圖29:騰訊廣告AI創(chuàng)意工作臺(tái)圖30:使用AIGC素材的生成效率與效果更優(yōu)?資料:騰訊云AI官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料:騰訊云官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理28騰訊-微信Agent:以微信為入口的Agents具備很強(qiáng)的想象空間?

騰訊Q3業(yè)績(jī)會(huì)議上提及過(guò)“智能代理”(smartagent)的概念,目前還非常早期,但想象空間很大。?

AIAgents,是一種能夠自主感知環(huán)境、進(jìn)行規(guī)劃和決策、使用外部工具的人工智能體。相比于Copilot,AIAgents具備更強(qiáng)的自主性,在復(fù)雜任務(wù)中參與度更深。目前完全意義上的Agents尚不成熟,市面上工具更多是Copilot。?

假設(shè)后期技術(shù)能夠?qū)崿F(xiàn)AIAgents,以微信為入口的Agents具備很強(qiáng)的想象空間:1.微信+小程序提供流量入口和基礎(chǔ)設(shè)施,有機(jī)會(huì)將微信的流量進(jìn)一步貨幣化;2.增強(qiáng)微信的基礎(chǔ)性APP地位;3.派生更多新的商業(yè)模式。圖31:LLM-basedAgent概念框架圖32:多模態(tài)智能體框架在智能手機(jī)App操作中的多種應(yīng)用??資料

:復(fù)旦大學(xué)NLP團(tuán)隊(duì),國(guó)信證券經(jīng)濟(jì)研究所整理參考文獻(xiàn):XiZ,ChenW,GuoX,etal.Theriseandpotentialoflargelanguagemodelbasedagents:Asurvey[J].arXivpreprintarXiv:2309.07864,2023.資料

:Chi

Zhang,ZhaoYang等,《AppAgent:

MultimodalAgents

asSmartphoneUsers》,Computer

VisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,國(guó)信證券經(jīng)濟(jì)研究所整理29百度:文心大模型+應(yīng)用解析30百度-基礎(chǔ)大模型:文心大模型4.0?文心大模型4.0具備強(qiáng)大的理解、生成、邏輯和記憶的能力。根據(jù)百度官方公眾號(hào),文心一言于8月31日向全社會(huì)開放,至今已有超7000萬(wàn)用戶。10月17日,在百度世界2023大會(huì)上,文心大模型4.0版本正式發(fā)布。文心4.0實(shí)現(xiàn)了基礎(chǔ)模型的全面升級(jí),在理解、生成、邏輯和記憶能力上都有著顯著提升,其中邏輯的提升幅度達(dá)到理解的近3倍,記憶的提升幅度也達(dá)到了理解的2倍多。根據(jù)三季度業(yè)績(jī)會(huì)議,與3月的文心一言相比,當(dāng)前版本的推理成本降低了98%,同等算力條件下QPS提升了50倍。圖33:文心產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型???資料:百度文心一言官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理31百度-核心廣告:預(yù)計(jì)在四季度貢獻(xiàn)數(shù)億增量收入?

核心廣告:文心大模型重構(gòu)廣告系統(tǒng),預(yù)計(jì)在四季度貢獻(xiàn)數(shù)億增量收入。?

1)9月7日,百度營(yíng)銷發(fā)布全球首個(gè)AINative營(yíng)銷平臺(tái)“輕舸”。根據(jù)業(yè)績(jī)會(huì)議,百度通過(guò)文心大模型重構(gòu)廣告系統(tǒng),提升廣告素材創(chuàng)作效率和定向能力,“輕舸”可以自然語(yǔ)言和表達(dá)、高效推送、隨時(shí)調(diào)度AI能力,大大提升投放效率,便利用戶投放。至今已有數(shù)千名廣告客戶采用新廣告系統(tǒng),采用這些新功能的廣告客戶在三季度實(shí)現(xiàn)了平均高個(gè)位數(shù)的轉(zhuǎn)化率提升。在四季度,AI相關(guān)舉措有望為百度廣告貢獻(xiàn)數(shù)億增量收入。?

2)公司正在測(cè)試采用新的對(duì)話形式替代原有的落地頁(yè),不僅有望提升廣告轉(zhuǎn)化率,還將使公司有機(jī)會(huì)從CPC模式向CPS模式轉(zhuǎn)變。圖34:百度營(yíng)銷平臺(tái)-輕舸???資料:百度輕舸官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理32百度-智能云:貢獻(xiàn)API調(diào)用收入、大模型解決方案收入??智能云:伴隨著文心大模型4.0的發(fā)布,公司相信客戶對(duì)AI大模型的需求有望打開云業(yè)務(wù)新的增長(zhǎng)空間。根據(jù)業(yè)績(jī)會(huì)議,目前來(lái)自生成式AI和LLM的收入還比較少,但增速快。大模型的2B收入貢獻(xiàn)分為幾個(gè)層面:1)API調(diào)用收入:文心4.0已開放面向企業(yè)客戶的API,目前文心大模型API的調(diào)用量呈指數(shù)級(jí)增長(zhǎng)。2)大模型解決方案收入:百度具備完善的芯片、框架、模型、應(yīng)用四層技術(shù)棧,支持企業(yè)客戶基于文心大模型構(gòu)建企業(yè)級(jí)大模型和行業(yè)應(yīng)用,也支持企業(yè)客戶基于文心千帆平臺(tái)訓(xùn)練自己的大模型,無(wú)論客戶選擇何種方式,都將為百度帶來(lái)新的創(chuàng)收機(jī)會(huì)。目前大模型可應(yīng)用于電商、短視頻、教育、游戲、醫(yī)療、金融等六大行業(yè):1)電商行業(yè):通過(guò)使用大模型,可以幫助電商平臺(tái)提升用戶體驗(yàn)、增加銷售額同時(shí)大大降低運(yùn)營(yíng)成本;2)短視頻行業(yè):可以實(shí)現(xiàn)內(nèi)容創(chuàng)作文本的輸出,提高短視頻內(nèi)容創(chuàng)作者的效率;3)教育行業(yè):可以幫助提升教育教學(xué)效果、個(gè)性化教育水平、輔助教育決策能力;4)游戲行業(yè):在研發(fā)端,可以提升游戲設(shè)計(jì)、游戲代碼開發(fā)的工作效率;在體驗(yàn)端,可以輔助開發(fā)者提供游戲優(yōu)化方案,提升游戲體驗(yàn);5)醫(yī)療行業(yè):為醫(yī)生提供更加準(zhǔn)確和全面的診斷和治療建議,以及幫助醫(yī)生進(jìn)行疾病檢測(cè)和預(yù)測(cè);6)金融行業(yè):幫助銀行和金融機(jī)構(gòu)進(jìn)行風(fēng)險(xiǎn)評(píng)估、市場(chǎng)預(yù)測(cè)和欺詐檢測(cè)等任務(wù)。圖35:百度智能云發(fā)布基于文心一言的“超級(jí)助理”圖36:百度千帆平臺(tái)架構(gòu)??資料:百度智能云官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料:百度智能云官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理33百度-AI重構(gòu)旗下應(yīng)用,如百度文庫(kù)、地圖、網(wǎng)盤等??運(yùn)用文心大模型的能力重構(gòu)旗下應(yīng)用,為用戶帶來(lái)全新AI原生體驗(yàn)。百度目前已經(jīng)基于文心大模型重構(gòu)了百度文庫(kù)、地圖、網(wǎng)盤、如流等原有應(yīng)用,也推出了新的AI原生應(yīng)用百度GBI和Comate代碼助手。重構(gòu)后的AI原生應(yīng)用,在用戶量、活躍度等數(shù)據(jù)指標(biāo)方面實(shí)現(xiàn)顯著增長(zhǎng)。例如,百度文庫(kù)AI新功能累計(jì)使用用戶達(dá)3000萬(wàn),付費(fèi)率明顯提升;百度網(wǎng)盤個(gè)人助理“云一朵”用戶累計(jì)突破2000萬(wàn)。各應(yīng)用AI功能:“云一朵”可以幫助用戶答疑解惑、總結(jié)文檔和視頻、提供創(chuàng)作靈感;AI向?qū)Э梢蕴峁╊A(yù)估行程、沿途規(guī)劃、安排聚會(huì)地點(diǎn)等服務(wù);百度文庫(kù)AI助理可以進(jìn)行內(nèi)容總結(jié)、創(chuàng)作、PPT編輯等。圖37:百度文庫(kù)AI重構(gòu)圖38:百度網(wǎng)盤AI重構(gòu)-云一朵、百度地圖AI向?qū)?悠悠??資料:百度官方公眾號(hào),國(guó)信證券經(jīng)濟(jì)研究所整理資料:百度網(wǎng)盤官網(wǎng)、百度地圖官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理34阿里巴巴:通義大模型+應(yīng)用解析35阿里—AI組織架構(gòu):云智能團(tuán)隊(duì)主導(dǎo),全鏈條布局AI?阿里云戰(zhàn)略為“AI驅(qū)動(dòng),公共云優(yōu)先”,達(dá)摩院和基礎(chǔ)設(shè)施事業(yè)部負(fù)責(zé)AI底層基礎(chǔ)設(shè)施及芯片研發(fā);集團(tuán)層面,阿里巴巴成立了基礎(chǔ)設(shè)施委員會(huì),由CEO吳泳銘直接統(tǒng)籌負(fù)責(zé),協(xié)調(diào)全集團(tuán)底層技術(shù)基礎(chǔ)設(shè)施的規(guī)劃與建設(shè),助力AI更好地在集團(tuán)其他業(yè)務(wù)落地應(yīng)用。?根據(jù)IDC統(tǒng)計(jì),2022年中國(guó)AI公有云服務(wù)市場(chǎng)還是呈現(xiàn)出80.6%的正增長(zhǎng),整體市場(chǎng)規(guī)模達(dá)79.7億元人民幣。2022年中國(guó)AI公有云服務(wù)市場(chǎng)份額,百度智能云占比28.9%,阿里云占比27.4%,云占比18.7%,騰訊云占比18.7%,其他云廠商占比6.4%。圖39:阿里AI組織架構(gòu)情況圖40:2022年中國(guó)AI公有云服務(wù)市場(chǎng)份額資料:雷鋒網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料:IDC,國(guó)信證券經(jīng)濟(jì)研究所整理36阿里—AI基礎(chǔ)設(shè)施:自研AI芯片+通義大模型,支持外部AI?芯片:平頭哥半導(dǎo)體(2018年9月成立),目前已有鎮(zhèn)岳、含光、倚天、羽陣等多款芯片產(chǎn)品,其中含光為AI芯片,均已在阿里云、淘寶電商等場(chǎng)景投入應(yīng)用。?通義大模型:包括統(tǒng)一底座“M6-OFA”,三大通用模型“通義-M6”“通義-AliceMind”“通義-視覺大模型”,以及行業(yè)層面的不同垂直領(lǐng)域?qū)I(yè)模型。?AI應(yīng)用情況:自2023年4月通義大模型重磅發(fā)布以來(lái),阿里集團(tuán)董事會(huì)主席蔡崇信再2023云棲大會(huì)表示,全國(guó)80%的科技企業(yè)和超過(guò)一半的AI大模型公司跑在阿里云上;據(jù)公司管理層在FY24Q2業(yè)績(jī)會(huì)議披露,AI在公有云收入占比達(dá)到2%。表7:百度阿里騰訊自研芯片情況圖41:阿里巴巴通義大模型系列發(fā)布公司自研芯片昆侖芯類別AI芯片百度鴻鵠語(yǔ)音交互芯片RISC-V處理器芯片AI芯片玄鐵系列含光800多模態(tài)AI處理器SoC原型曳影1520阿里倚天710羽陣600羽陣611鎮(zhèn)岳510滄海Arm服務(wù)器芯片RFID芯片RFID芯片SSD主控芯片視頻處理加速AI芯片騰訊資料紫霄玄靈智能網(wǎng)卡芯片:平頭哥半導(dǎo)體官網(wǎng)、昆侖芯科技官網(wǎng)、百度AI開放平臺(tái)、資料:阿里云開發(fā)者社區(qū),國(guó)信證券經(jīng)濟(jì)研究所整理37騰訊數(shù)字生態(tài)大會(huì)、國(guó)信證券經(jīng)濟(jì)研究所整理阿里C端應(yīng)用—淘寶問(wèn)問(wèn):三大基本模式支撐四大應(yīng)用場(chǎng)景?

淘寶問(wèn)問(wèn)是淘寶App推出的ToCAI應(yīng)用,可以根據(jù)用戶輸入信息,通過(guò)深度合成算法解答用戶問(wèn)題,提供內(nèi)容建議及相關(guān)商品推薦,目前淘寶問(wèn)問(wèn)僅向C端使用者開放,底層模型為通義千問(wèn)。?

自9月上線測(cè)試版以來(lái),累計(jì)使用人次超500萬(wàn);淘寶問(wèn)問(wèn)處理的需求中25%是非購(gòu)物類場(chǎng)景需求,未來(lái)有望開拓購(gòu)物之外的更多使用場(chǎng)景,向泛生活消費(fèi)類平臺(tái)轉(zhuǎn)型;?

未來(lái)有望以接口方式向B端商家開放,助力其將品牌內(nèi)容、商品優(yōu)勢(shì)更高效傳達(dá)給消費(fèi)者,同時(shí)了解消費(fèi)者更長(zhǎng)尾的購(gòu)物需求。表8:淘寶問(wèn)問(wèn)的交互方式、基本模式及應(yīng)用場(chǎng)景交互方式基本模式應(yīng)用場(chǎng)景購(gòu)物場(chǎng)景:用戶已有購(gòu)物需求,問(wèn)問(wèn)提供購(gòu)買建議,如商品比對(duì)Copilot指令模式:通過(guò)場(chǎng)景推薦彈幕、選擇指定AI角色的交互方式,自動(dòng)補(bǔ)全用戶需求,提供輕量級(jí)、伴隨式的搜索體驗(yàn)關(guān)鍵詞搜索消費(fèi)場(chǎng)景:?jiǎn)枂?wèn)主動(dòng)刺激用戶潛在購(gòu)物需求,如場(chǎng)景導(dǎo)購(gòu)方案場(chǎng)景推薦彈幕Q&A問(wèn)答模式:生成式AI疊加對(duì)話式交互,滿足消費(fèi)者更長(zhǎng)尾、個(gè)性化的需求生活場(chǎng)景:基于日常生活,同時(shí)提供生活技巧及購(gòu)物建議,如婚禮策劃、烹飪指導(dǎo)選擇指定AI角色雙11大促模式:疊加大促營(yíng)銷權(quán)益,形成精準(zhǔn)購(gòu)物建議陪伴場(chǎng)景:通過(guò)關(guān)鍵詞搜索的交互方式,問(wèn)問(wèn)作為用戶的交談對(duì)象,可滿足諸如“給我講一個(gè)笑話”的需求資料

:淘寶APP、國(guó)信證券經(jīng)濟(jì)研究所整理38阿里B端應(yīng)用—企業(yè)溝通軟件:釘釘全面走向智能化,已開啟商業(yè)化?

釘釘開放智能化底座AIPaaS給企業(yè)客戶,AIPaaS包含模型調(diào)度平臺(tái)、模型訓(xùn)練平臺(tái)和插件開發(fā)平臺(tái)三個(gè)部分,降低企業(yè)開發(fā)運(yùn)維的門檻,幫助企業(yè)數(shù)據(jù)與大模型建立聯(lián)系。目前釘釘軟件的訂閱服務(wù)客戶已經(jīng)超過(guò)了10萬(wàn)家,付費(fèi)DAU達(dá)到2300萬(wàn)。?

AI商業(yè)化情況:釘釘專業(yè)版年費(fèi)9800元基礎(chǔ)上,增加10000元即可獲得20萬(wàn)次大模型調(diào)用額度;在專屬釘釘年費(fèi)基礎(chǔ)上,增加20000元即可獲得45萬(wàn)次大模型調(diào)用額度,相當(dāng)于一次調(diào)用平均只需不到5分錢。?

與釘釘對(duì)比,飛書智能伙伴是開放的AI服務(wù)框架,沒(méi)有固定的底層模型,更初階更靈活,支持內(nèi)容創(chuàng)作、內(nèi)容總結(jié)、數(shù)據(jù)分析、場(chǎng)景構(gòu)建等功能,目前開放試用,尚未商業(yè)化。圖42:釘釘AIPaaS平臺(tái)/飛書智能伙伴概覽資料

:釘釘官網(wǎng),飛書公眾號(hào),國(guó)信證券經(jīng)濟(jì)研究所整理39阿里B端應(yīng)用:萬(wàn)相臺(tái)無(wú)界版&阿里媽媽百靈,多種營(yíng)銷場(chǎng)景智能化?萬(wàn)相臺(tái)無(wú)界版和阿里媽媽百靈是阿里媽媽推出的兩大ToB一站式智能營(yíng)銷投放產(chǎn)品,其中萬(wàn)相臺(tái)無(wú)界版以GMV為導(dǎo)向,側(cè)重站內(nèi)投放;阿里媽媽百靈整合站內(nèi)外媒體資源,側(cè)重品牌營(yíng)銷。二者依托阿里媽媽專屬AI大模型,將消費(fèi)者觸達(dá)、營(yíng)銷推廣等多種經(jīng)營(yíng)場(chǎng)景智能化,助力商家降本增效。?具體案例:日系洗護(hù)類品牌Claynal就轉(zhuǎn)變了以品類詞為核心的投放方式,利用萬(wàn)相臺(tái)無(wú)界版7大場(chǎng)景能力找到了全新爆款群,收藏加購(gòu)成本降低了12%,ROI提升了近24%?據(jù)阿里2023年9月季度財(cái)報(bào),淘天廣告收入增速快于GMV增速,主要由于萬(wàn)相臺(tái)無(wú)界和阿里媽媽百靈提升商家投放效率與投放意愿。圖43:萬(wàn)相臺(tái)無(wú)界版覆蓋六大智能經(jīng)營(yíng)場(chǎng)景圖44:阿里媽媽百靈包含三大智能化營(yíng)銷場(chǎng)景????資料:阿里媽媽官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理資料:阿里媽媽官網(wǎng),國(guó)信證券經(jīng)濟(jì)研究所整理40阿里AIGC應(yīng)用—妙鴨相機(jī):AI在影視行業(yè)的應(yīng)用探索的小荷尖?妙鴨相機(jī)是一款基于AI技術(shù)的寫真生成工具,由阿里大文娛的張?jiān)鹿鈳ш?duì)開發(fā)。2023年6月,妙鴨相機(jī)內(nèi)測(cè);7月中旬小程序正式上線;7月底妙鴨相機(jī)APP上線;上線即爆火,高峰期有4000-5000人排隊(duì),需等待十幾個(gè)小時(shí)才能出片,后因用戶等待時(shí)長(zhǎng)過(guò)長(zhǎng)、數(shù)據(jù)收集條款侵犯用戶隱私等爭(zhēng)議熱度很快下降。?AI商業(yè)化情況:上線伊始,用戶需支付9.9元并上傳20張照片即可生成數(shù)字分身并開始生成AI寫真;9月,妙鴨相機(jī)宣布推出免費(fèi)版本,與仍為9.9元的專家模式相比,免費(fèi)版本等待生成時(shí)間較長(zhǎng)且模板使用受限。專家模式下會(huì)贈(zèng)送用戶10顆鉆石,后續(xù)如需體驗(yàn)更多模板或下載高清原圖需付費(fèi)購(gòu)買更多鉆石。?在妙鴨相機(jī)之外,阿里大文娛已經(jīng)在多個(gè)影視工業(yè)化垂直賽道進(jìn)行AI布局。近期阿里大文娛團(tuán)隊(duì)通過(guò)自研大模型生成了超寫實(shí)數(shù)字人厘里,通過(guò)真人替身加后期光場(chǎng)制作的方式呈現(xiàn)在劇集《異人之下》之中。傳統(tǒng)特效技術(shù)通常需要至少一個(gè)月才能完成,使用數(shù)字人參演疊加后期制作只需要一周,對(duì)于影視行業(yè)帶來(lái)直接的降本增效。圖45:妙鴨相機(jī)區(qū)分體驗(yàn)?zāi)J脚c專家模式圖46:妙鴨相機(jī)微信指數(shù)趨勢(shì)變化????資料:妙鴨相機(jī)小程序,國(guó)信證券經(jīng)濟(jì)研究所整理資料:微信指數(shù),國(guó)信證券經(jīng)濟(jì)研究所整理41字節(jié)跳動(dòng):云雀大模型+應(yīng)用解析42字節(jié)AI—產(chǎn)品與發(fā)展時(shí)間線:新AI部門Flow同時(shí)發(fā)力技術(shù)與產(chǎn)品2023年2月2023年4月18日2023年6月布局語(yǔ)言和圖像兩個(gè)方向的大模型。其中語(yǔ)言大模型由字節(jié)跳動(dòng)搜索部門牽頭,團(tuán)隊(duì)規(guī)模在十?dāng)?shù)人左右,圖片大模型團(tuán)隊(duì)則由該公司產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊(duì)牽頭,整體由朱文佳負(fù)責(zé)?;鹕揭嬖谄渑e辦的春季FORCE原動(dòng)力“原動(dòng)力大會(huì)”上發(fā)布了包括自研DPU在內(nèi)的一系列新云產(chǎn)品,并推出了升級(jí)版的機(jī)器學(xué)習(xí)平臺(tái)。內(nèi)部測(cè)試一款A(yù)I對(duì)話類產(chǎn)品“Grace”,也就是豆包的前身,但彼時(shí)這一內(nèi)部項(xiàng)目團(tuán)隊(duì)隸屬字節(jié)跳動(dòng)技術(shù)中臺(tái),還沒(méi)有組建單獨(dú)的產(chǎn)品部門。同月,字節(jié)跳動(dòng)旗下火山引擎發(fā)布大模型服務(wù)平臺(tái)“火山方舟”,可為開發(fā)者和企業(yè)提供模型訓(xùn)練、推理、評(píng)測(cè)、精調(diào)等全方位的平臺(tái)服務(wù)(MaaS,即Model-as-a-Service)。2023年8月17日開始對(duì)外測(cè)試其AI對(duì)話產(chǎn)品“豆包”。豆包是字節(jié)推出的大模型產(chǎn)品,可以通過(guò)網(wǎng)頁(yè)直接訪問(wèn),包括豆包本身以及其他多功能小助手,如聊天小寧、寫作助手、智能體創(chuàng)建助手、AI圖片生成、AI漫畫生成、英語(yǔ)學(xué)習(xí)助手、MUSE音樂(lè)電臺(tái)等。2023年8月Cici

在海外多個(gè)市場(chǎng)上線。2023年8月31日字節(jié)云雀大模型成為首批通過(guò)《生成式人工智能服務(wù)管理暫行辦法》備案的大模型,可正式上線面向公眾提供服務(wù)。2023年9月11日“悟空搜索”的應(yīng)用程序更名為“小悟空”,其主要特色是提供“無(wú)廣告搜索”體驗(yàn)。小悟空應(yīng)用內(nèi)集成了一系列基于大語(yǔ)言模型的AI工具,這些工具支持智能對(duì)話和輔助推薦功能。2023年11月22日2023年11月底飛書在北京舉辦發(fā)布會(huì),正式推出了“飛書智能伙伴”和其他系列

AI

產(chǎn)品。成立了一個(gè)專注于

AI

創(chuàng)新業(yè)務(wù)的新部門

Flow。該部門的技術(shù)負(fù)責(zé)人是字節(jié)跳動(dòng)的副總裁洪定坤,業(yè)務(wù)負(fù)責(zé)人是大模型團(tuán)隊(duì)朱文佳,整體團(tuán)隊(duì)規(guī)模近150人。Flow將主要聚焦在AI應(yīng)用層、押注AI大模型方向,后續(xù)技術(shù)層面更大的模型、端到端的原生多模態(tài),業(yè)務(wù)層面關(guān)注豆包、CiCi等AI原生應(yīng)用的用戶拓展、DAU增長(zhǎng)。資料:公司官網(wǎng)、國(guó)信證券經(jīng)濟(jì)研究所整理43字節(jié)產(chǎn)品線與AI功能一覽表9:字節(jié)產(chǎn)品線傳統(tǒng)功能與AI功能產(chǎn)品名稱通用信息平臺(tái)短視頻分享應(yīng)用創(chuàng)建、編輯和共享短視頻PUGC視頻平臺(tái)一站式汽車信息與服務(wù)真實(shí)專業(yè)的汽車內(nèi)容和選車服務(wù)PUGC內(nèi)容互動(dòng)社區(qū)企業(yè)協(xié)作與管理平臺(tái)面向網(wǎng)文熱愛者的免費(fèi)閱讀平臺(tái)???推薦引擎搜索引擎關(guān)注訂閱和內(nèi)容運(yùn)營(yíng)???提供優(yōu)質(zhì)內(nèi)容多樣化創(chuàng)作???短視頻內(nèi)容社交服務(wù)????即時(shí)溝通傳統(tǒng)功能音視頻會(huì)議在線文檔云盤、工作臺(tái)等??海量正版小說(shuō)免費(fèi)閱讀體驗(yàn)?瀏覽其他用戶上傳的視頻內(nèi)容?為汽車廠商提供高效解決方案AI功能利用AI技術(shù)根據(jù)用戶的興趣和偏好,為其個(gè)性化推薦新聞內(nèi)容???智能推薦AI視頻剪輯AI實(shí)時(shí)特效???個(gè)性化推薦用戶行為分析AI視頻壓縮????智能語(yǔ)音助手智能推薦智能車輛識(shí)別AI咨詢與服務(wù)????智能視頻剪輯視頻語(yǔ)音識(shí)別智能配樂(lè)和配音人像美化??智能語(yǔ)音識(shí)別和翻譯智能機(jī)器人助手,處理咨詢、問(wèn)題??精準(zhǔn)推薦智能分類?AI會(huì)議議程生成產(chǎn)品名稱巨量引擎小荷健康綜合的數(shù)字化營(yíng)銷服務(wù)平臺(tái)健康知識(shí)及服務(wù)平臺(tái)相機(jī)自拍相機(jī)?視頻剪輯云上數(shù)據(jù)產(chǎn)品?傳統(tǒng)功能??智能投放、智能優(yōu)化數(shù)據(jù)統(tǒng)計(jì)、預(yù)算管理???特色案例、醫(yī)療科普在線

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論