![人工智能大模型專題報(bào)告:方興未艾并驅(qū)爭(zhēng)先_第1頁](http://file4.renrendoc.com/view/27caa8828314ca7be1f49ff1ddbab7a4/27caa8828314ca7be1f49ff1ddbab7a41.gif)
![人工智能大模型專題報(bào)告:方興未艾并驅(qū)爭(zhēng)先_第2頁](http://file4.renrendoc.com/view/27caa8828314ca7be1f49ff1ddbab7a4/27caa8828314ca7be1f49ff1ddbab7a42.gif)
![人工智能大模型專題報(bào)告:方興未艾并驅(qū)爭(zhēng)先_第3頁](http://file4.renrendoc.com/view/27caa8828314ca7be1f49ff1ddbab7a4/27caa8828314ca7be1f49ff1ddbab7a43.gif)
![人工智能大模型專題報(bào)告:方興未艾并驅(qū)爭(zhēng)先_第4頁](http://file4.renrendoc.com/view/27caa8828314ca7be1f49ff1ddbab7a4/27caa8828314ca7be1f49ff1ddbab7a44.gif)
![人工智能大模型專題報(bào)告:方興未艾并驅(qū)爭(zhēng)先_第5頁](http://file4.renrendoc.com/view/27caa8828314ca7be1f49ff1ddbab7a4/27caa8828314ca7be1f49ff1ddbab7a45.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能大模型專題報(bào)告:方興未艾,并驅(qū)爭(zhēng)先報(bào)告緣起:AI趨勢(shì)明確,大模型為關(guān)鍵環(huán)節(jié)全球AI產(chǎn)業(yè)發(fā)展趨勢(shì)明確,波動(dòng)中前行。自1956年約翰·麥卡錫首次提出“人工智能”的概念以來,全球人工智能產(chǎn)業(yè)逐漸進(jìn)入學(xué)術(shù)研究和產(chǎn)業(yè)實(shí)操并進(jìn)的階段。盡管在算力性能、數(shù)據(jù)量、硬件成本等多重因素影響下,人工智能產(chǎn)業(yè)經(jīng)歷了“三起兩落”的螺旋式發(fā)展,但全球人工智能發(fā)展的趨勢(shì)仍然明確,通用人工智能(AGI)仍然是人工智能行業(yè)發(fā)展的主線。ChatGPT
加速推進(jìn)AI產(chǎn)業(yè)發(fā)展,需求爆發(fā)倒逼供給創(chuàng)新。ChatGPT在全球范圍內(nèi)快速傳播,在短時(shí)間內(nèi)完成了對(duì)企業(yè)和用戶的市場(chǎng)教育,需求端的爆發(fā)驅(qū)動(dòng)著供給端加速創(chuàng)新,加快推動(dòng)全球AI產(chǎn)業(yè)發(fā)展進(jìn)程。IDC預(yù)測(cè),2026年全球AI市場(chǎng)規(guī)模有望達(dá)3082.8億美元,2023-2026年CAGR約26.7%。而AI作為下一代全球科技競(jìng)速的重要領(lǐng)域,我國(guó)從頂層設(shè)計(jì)到科技企業(yè)均積極參與,有望進(jìn)一步帶動(dòng)國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展。IDC預(yù)測(cè),2026年,我國(guó)AI市場(chǎng)規(guī)模有望達(dá)264.4億美元,2023-2026年CAGR約21.5%。政策重點(diǎn)支持,人工智能有望維持高景氣。人工智能作為展現(xiàn)大國(guó)國(guó)際競(jìng)爭(zhēng)力的重要領(lǐng)域,我國(guó)在頂層設(shè)計(jì)方面始終重視對(duì)人工智能產(chǎn)業(yè)發(fā)展的鼓勵(lì)和引導(dǎo),在關(guān)鍵技術(shù)投入、人才培養(yǎng)、人工智能賦能實(shí)體經(jīng)濟(jì)、基本倫理要求等方面均推出相關(guān)政策。政策積極支持下,我國(guó)人工智能行業(yè)有望維持高景氣。9月1日,網(wǎng)信辦發(fā)布第二批境內(nèi)深度合成服務(wù)算法備案信息,百度文心大模型、抖音云雀大模型、京東言犀大模型、騰訊混元助手大模型等110款深度合成服務(wù)算法通過備案。隨著國(guó)產(chǎn)大模型陸續(xù)向公眾開放服務(wù),有望加速產(chǎn)品落地進(jìn)程及模型迭代飛輪,并驅(qū)動(dòng)AI的商業(yè)化變現(xiàn)。產(chǎn)業(yè)結(jié)構(gòu):大模型是重要一環(huán),AI時(shí)代的入口之爭(zhēng)。從AI產(chǎn)業(yè)結(jié)構(gòu)來看,大模型是連接底層算力和上層應(yīng)用的重要一環(huán),成熟的大模型能力和生態(tài)是真正實(shí)現(xiàn)通用人工智能和未來應(yīng)用端繁榮的基礎(chǔ),擁有更強(qiáng)計(jì)算和推理能力、更高通用性的大模型企業(yè)有望把握AI時(shí)代的流量入口和話語權(quán)。競(jìng)爭(zhēng)態(tài)勢(shì):格局明晰尚需時(shí)間,看好互聯(lián)網(wǎng)巨頭領(lǐng)先優(yōu)勢(shì)發(fā)展階段:國(guó)內(nèi)大模型百家爭(zhēng)鳴,格局明晰尚需時(shí)間全球:中美領(lǐng)先發(fā)展,但行業(yè)格局或?qū)⑾鄬?duì)獨(dú)立。從全球范圍來看,中美在大模型領(lǐng)域引領(lǐng)全球發(fā)展。其中,基于在算法模型研發(fā)上的領(lǐng)先優(yōu)勢(shì),美國(guó)大模型數(shù)量居全球首位,根據(jù)中國(guó)科學(xué)技術(shù)信息研究所、科技部新一代人工智能發(fā)展研究中心聯(lián)合發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》,截至2023年5月,美國(guó)已發(fā)布100個(gè)參數(shù)規(guī)模10億以上的大模型。中國(guó)亦積極跟進(jìn)全球大模型發(fā)展趨勢(shì),自2021年以來加速產(chǎn)出,如2021年6月北京智源人工智能研究院發(fā)布1.75萬億參數(shù)量的悟道2.0、2021年11月阿里M6大模型參數(shù)量達(dá)10萬億等。截至2023年5月,我國(guó)已發(fā)布79個(gè)大模型,在全球范圍占據(jù)先發(fā)優(yōu)勢(shì)。但考慮到數(shù)據(jù)安全、隱私合規(guī)以及科技監(jiān)管等因素,我們認(rèn)為中美的大模型市場(chǎng)有望形成相對(duì)獨(dú)立的行業(yè)格局。海外:OpenAI
及谷歌雙龍頭+Meta開源追趕+垂類特色廠商的格局已較為清晰。從海外大模型格局來看,目前已經(jīng)形成較為清晰的雙龍頭領(lǐng)先+Meta開源追趕+垂類繁榮的格局。同時(shí),基于通用大模型能力已相對(duì)成熟可用,其上的應(yīng)用生態(tài)已逐漸繁榮。得益于對(duì)先進(jìn)算法模型的集成以及較早的產(chǎn)品化,OpenAI不僅展現(xiàn)了GPT在人機(jī)對(duì)話中的超預(yù)期表現(xiàn),同時(shí)基于GPT的應(yīng)用生態(tài)也已逐漸繁榮,微軟數(shù)款產(chǎn)品(Bing、Windows操作系統(tǒng)、Office、瀏覽器、PowerPlatform等)、代碼托管平臺(tái)GitHub、AI營(yíng)銷創(chuàng)意公司Jasper等均已接入GPT。谷歌在人工智能領(lǐng)域持續(xù)投入,其提出的IeNet卷積神經(jīng)網(wǎng)絡(luò)模型、Transformer語言架構(gòu)、BERT大語言模型等均對(duì)全球人工智能產(chǎn)業(yè)產(chǎn)生重要推動(dòng)。但由于公司團(tuán)隊(duì)變動(dòng)及更謹(jǐn)慎的產(chǎn)品化落地的態(tài)度,谷歌前期尚未大規(guī)模推出面向C端的AI產(chǎn)品。在ChatGPT快速流行的帶動(dòng)下,谷歌亦推出聊天機(jī)器人Bard及PaLM2,并將接入谷歌的協(xié)作與生產(chǎn)力工具Workspace以及與Spotify、沃爾瑪、UberEats等外部應(yīng)用融合。Meta通過開源方式快速追趕,7月發(fā)布最新開源大模型LLaMA2,使用2萬億tokens訓(xùn)練,上下文長(zhǎng)度翻倍,實(shí)現(xiàn)了更強(qiáng)大的表現(xiàn)能力和更廣泛的應(yīng)用場(chǎng)景。此外,Anthropic、Cohere、HuggingFace等基于各自的垂類特色和定制化服務(wù)也在海外AI市場(chǎng)中扮演著重要角色。國(guó)內(nèi):大模型投入如火如荼,格局明晰仍需時(shí)間。ChatGPT獲得良好用戶反響并在全球范圍引發(fā)關(guān)注以來,中國(guó)頭部科技企業(yè)(阿里、百度、騰訊、華為、字節(jié)等)、新興創(chuàng)業(yè)公司(百川智能、MiniMax等)、傳統(tǒng)AI企業(yè)(科大訊飛、商湯科技等)以及高校研究院(復(fù)旦大學(xué)、中科院等)亦加速大模型領(lǐng)域投入。當(dāng)前國(guó)內(nèi)大模型仍處研發(fā)和迭代的早期階段,各個(gè)大模型的性能差異及易用性仍在市場(chǎng)檢驗(yàn)的過程當(dāng)中,我們預(yù)計(jì)國(guó)內(nèi)大模型領(lǐng)域競(jìng)爭(zhēng)格局的明晰仍需一定時(shí)間。競(jìng)爭(zhēng)要素:技術(shù)投入、核心人才和應(yīng)用場(chǎng)景構(gòu)成核心壁壘技術(shù)投入、核心人才和應(yīng)用場(chǎng)景構(gòu)成核心壁壘。我們認(rèn)為,大模型是一個(gè)重資源稟賦、高進(jìn)入門檻的賽道,其對(duì)算法模型的有效性、高質(zhì)量的數(shù)據(jù)、算力的支撐能力均有極高要求,模型的優(yōu)化迭代亦有賴于資金和人才的持續(xù)投入。此外,大模型的實(shí)際落地和行業(yè)應(yīng)用能力也是市場(chǎng)檢驗(yàn)的重要標(biāo)準(zhǔn)。模型架構(gòu):理論創(chuàng)新與工程實(shí)踐有效分離,加速AI技術(shù)創(chuàng)新效率。2017年transformer模型的出現(xiàn),以及引入的自注意力機(jī)制,推動(dòng)AI在語言類問題(NLP等)上取得快速進(jìn)展的同時(shí),亦先后擴(kuò)展至圖像生成、音視頻生成、計(jì)算機(jī)視覺等領(lǐng)域,并逐步成為眾多AI算法的底層基礎(chǔ)。各類算法輸入數(shù)據(jù)規(guī)模、模型參數(shù)的指數(shù)級(jí)增長(zhǎng),以及模型scale帶來更優(yōu)的計(jì)算精度、問題泛化求解能力等,推動(dòng)大模型快速普及,據(jù)PercyLiang、RishiBommasani、李飛飛等人在2021年論文《OntheOpportunitiesandRiskofFoundationModels》中提及,具有“表達(dá)能力、可擴(kuò)展性、多模態(tài)性、記憶容量和組合性”特征的大模型將成為學(xué)術(shù)研究的核心方向,并成為AI產(chǎn)業(yè)的底層基礎(chǔ)模型(foundationmodel)。ChatGPT的成功表明,算法架構(gòu)+工程實(shí)踐的有效結(jié)合,經(jīng)過fine-tuning之后的基礎(chǔ)模型部署于各類應(yīng)用場(chǎng)景,將能顯著改善AI技術(shù)研發(fā)效率、產(chǎn)業(yè)化門檻。我們判斷,基礎(chǔ)模型理論創(chuàng)新將逐步回歸至科研機(jī)構(gòu)、科技巨頭等,而眾多算法企業(yè)的差異化能力將進(jìn)一步向工程實(shí)踐領(lǐng)域遷移,并成為下游應(yīng)用場(chǎng)景廠商緊密的合作伙伴。大模型訓(xùn)練對(duì)算力及資金均提出極高要求。我們對(duì)ChatGPT單次訓(xùn)練成本進(jìn)行測(cè)算,假定預(yù)訓(xùn)練單次,且訓(xùn)練過程中沒有出現(xiàn)錯(cuò)誤時(shí)的成本。實(shí)際情形中,考慮到訓(xùn)練過程中出現(xiàn)工程類錯(cuò)誤的可能性,實(shí)際成本會(huì)高于我們計(jì)算的理想情況成本。假設(shè)參數(shù)量為175B、訓(xùn)練數(shù)據(jù)500BTokens的情況下,根據(jù)《ScalingLawsforNeuralLanguageModels》(JaredKaplan,SamMcCandlish,TomHenighan等)的分析,在使用256個(gè)英偉達(dá)HGXA100服務(wù)器(包含2048個(gè)A100GPU卡)的情況下,模型FLOPsUtilization(MFU)假設(shè)為Megatron-LM的51.04%,我們推測(cè)單次訓(xùn)練時(shí)長(zhǎng)約為30.7天,對(duì)應(yīng)約151萬GPU小時(shí)。假設(shè)訓(xùn)練使用成本價(jià)約為1美元/GPU小時(shí)的情況下,耗費(fèi)服務(wù)器端成本約為151萬美元。數(shù)據(jù):高質(zhì)量的數(shù)據(jù),能夠?yàn)槟P妥陨淼膶W(xué)習(xí)、迭代,以及對(duì)推理能力的訓(xùn)練帶來正向影響。按照當(dāng)前LLM的技術(shù)范式,數(shù)據(jù)集主要應(yīng)用于預(yù)訓(xùn)練和模型調(diào)優(yōu)階段。預(yù)訓(xùn)練階段需要大規(guī)模、多類別、高質(zhì)量的訓(xùn)練數(shù)據(jù),在模型調(diào)優(yōu)階段,垂類小數(shù)據(jù)集、提示詞工程同樣重要。近年來全球數(shù)據(jù)量呈現(xiàn)爆發(fā)式增長(zhǎng),據(jù)IDC統(tǒng)計(jì),2019年全球產(chǎn)生的數(shù)據(jù)量為41ZB,過去十年的CAGR接近50%,IDC預(yù)計(jì)到2025年全球數(shù)據(jù)量或高達(dá)175ZB,2019-2025年仍將維持近30%的復(fù)合增速,其中超過80%的數(shù)據(jù)都將是處理難度較大的文本、圖像、音視頻等非結(jié)構(gòu)化數(shù)據(jù)。從Bert開始到GPT-3再到谷歌的PALM,網(wǎng)絡(luò)中的公開語言數(shù)據(jù)源已經(jīng)在被盡可能地利用(論壇、新聞、維基百科等),但模型優(yōu)化仍需更多數(shù)據(jù),這要求模型開發(fā)商有能力接觸到優(yōu)質(zhì)私有數(shù)據(jù)來源,從而才能在模型的數(shù)據(jù)底層取得差異性優(yōu)勢(shì)。場(chǎng)景:應(yīng)用落地時(shí)檢驗(yàn)?zāi)P湍芰Φ闹匾獦?biāo)準(zhǔn)。一方面,通用大模型與行業(yè)場(chǎng)景結(jié)合,在帶來生產(chǎn)力和效率的實(shí)質(zhì)性提升后才能真正實(shí)現(xiàn)普及。另一方面,大模型結(jié)合行業(yè)應(yīng)用落地后,更多的真實(shí)用戶反饋也有望加速大模型的優(yōu)化迭代,從而不斷強(qiáng)化模型能力。格局推演:有望形成互聯(lián)網(wǎng)巨頭主導(dǎo)+垂類廠商共存的格局歷史積累:互聯(lián)網(wǎng)巨頭具備先發(fā)優(yōu)勢(shì),芯片層、模型層、應(yīng)用層布局完備。互聯(lián)網(wǎng)巨頭在AI領(lǐng)域投入已久,百度2014年即成立人工智能實(shí)驗(yàn)室,阿里、騰訊、字節(jié)跳動(dòng)也于2016年成立人工智能實(shí)驗(yàn)室,此后各家在芯片層、模型層及應(yīng)用層持續(xù)探索,不斷完善布局,在研發(fā)、模型、數(shù)據(jù)、應(yīng)用等方面已積累顯著的先發(fā)優(yōu)勢(shì)。算法模型:追隨海外技術(shù)進(jìn)展,研發(fā)突破是競(jìng)爭(zhēng)關(guān)鍵。從技術(shù)路線來看,國(guó)內(nèi)大模型主要追隨海外進(jìn)展。基于谷歌在人工智能領(lǐng)域更高的影響力以及BERT開源代碼,前期我國(guó)企業(yè)在大模型領(lǐng)域的探索更多參考BERT路線。隨著ChatGPT在人機(jī)對(duì)話領(lǐng)域的超預(yù)期表現(xiàn)驗(yàn)證了高質(zhì)量數(shù)據(jù)+反饋激勵(lì)(大模型預(yù)訓(xùn)練+小數(shù)據(jù)微調(diào))的有效性,國(guó)內(nèi)大模型技術(shù)路線也逐漸向GPT方向收斂。我們認(rèn)為,盡管模型架構(gòu)設(shè)計(jì)的不同對(duì)特定任務(wù)上的表現(xiàn)有一定影響,但國(guó)內(nèi)大模型廠商在技術(shù)上基本同源,從而導(dǎo)致了現(xiàn)階段較為相似的模型能力,而下一階段對(duì)于GPT方向的研發(fā)突破將是競(jìng)爭(zhēng)關(guān)鍵。算力:互聯(lián)網(wǎng)廠商在算力資源上具備優(yōu)勢(shì)。隨著模型參數(shù)和復(fù)雜度的提升,大模型對(duì)算力的需求也在加速增長(zhǎng)。當(dāng)前國(guó)內(nèi)已發(fā)布的大模型中,參數(shù)規(guī)模達(dá)到千億及以上的廠商僅為10個(gè)左右,一定程度上體現(xiàn)出各廠商之間算力能力的差異。我們認(rèn)為,互聯(lián)網(wǎng)廠商在算力資源上具備相對(duì)優(yōu)勢(shì),主要原因系:1)互聯(lián)網(wǎng)企業(yè)業(yè)務(wù)布局多元,用戶基數(shù)龐大,海量數(shù)據(jù)高頻更新,使得互聯(lián)網(wǎng)企業(yè)自身對(duì)算力有大量需求,阿里、字節(jié)、百度、騰訊等頭部互聯(lián)網(wǎng)企業(yè)是全球芯片及服務(wù)器領(lǐng)域的重要客戶。2)阿里云、百度云、騰訊云等為國(guó)內(nèi)頭部云廠商,在云計(jì)算中心、AI算力平臺(tái)、超算中心等新型高性能計(jì)算基礎(chǔ)設(shè)施上布局領(lǐng)先,如阿里云推出PAI靈駿智算服務(wù),提供覆蓋AI開發(fā)全流程的平臺(tái)和分布式異構(gòu)計(jì)算優(yōu)化能力;騰訊云發(fā)布新一代HCC(High-PerformanceComputingCluster)高性能計(jì)算集群,算力性能較前代提升高達(dá)3倍。數(shù)據(jù):優(yōu)質(zhì)開源中文數(shù)據(jù)集稀缺,自有數(shù)據(jù)及處理能力構(gòu)成模型訓(xùn)練壁壘。得益于開源共創(chuàng)的互聯(lián)網(wǎng)生態(tài),海外已有大量?jī)?yōu)質(zhì)、結(jié)構(gòu)化的開源數(shù)據(jù)庫,文本來源既包含嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)寫作、百科知識(shí),也包含文學(xué)作品、新聞媒體、社交網(wǎng)站、流行內(nèi)容等,更加豐富的語料數(shù)據(jù)能夠提高模型在不同情景下的對(duì)話能力。而受制于搭建數(shù)據(jù)集較高的成本以及尚未成熟的開源生態(tài),國(guó)內(nèi)開源數(shù)據(jù)集在數(shù)據(jù)規(guī)模和語料質(zhì)量上相比海外仍有較大差距,數(shù)據(jù)來源較為單一,且更新頻率較低,從而導(dǎo)致模型的訓(xùn)練效果受限。因此,大模型廠商的自有數(shù)據(jù)和處理能力構(gòu)成模型訓(xùn)練效果差異化的核心。受益于移動(dòng)互聯(lián)網(wǎng)時(shí)代積累的海量用戶、應(yīng)用和數(shù)據(jù),互聯(lián)網(wǎng)企業(yè)在自有數(shù)據(jù)上更具特色化和獨(dú)占性,疊加更強(qiáng)大的數(shù)據(jù)處理能力,從而能夠通過數(shù)據(jù)優(yōu)勢(shì)帶來模型訓(xùn)練成果的差異。例如,阿里在研發(fā)M6時(shí),構(gòu)建了最大的中文多模態(tài)預(yù)訓(xùn)練數(shù)據(jù)集M6-Corpus,包含超過1.9TB圖像和292GB文本,涵蓋百科全書、網(wǎng)頁爬蟲、問答、論壇、產(chǎn)品說明等數(shù)據(jù)來源,并設(shè)計(jì)了完善的清潔程序以確保數(shù)據(jù)質(zhì)量。百度ERNIE模型的訓(xùn)練數(shù)據(jù)集中也運(yùn)用了大量百度百科、百度搜索以及百度知識(shí)圖譜等生態(tài)內(nèi)數(shù)據(jù),通過更高質(zhì)量的數(shù)據(jù)保障了模型的訓(xùn)練效果。資源投入:互聯(lián)網(wǎng)廠商重研發(fā)投入,資金及人才實(shí)力領(lǐng)先。大模型的訓(xùn)練需要較高且可持續(xù)的研發(fā)投入,頭部互聯(lián)網(wǎng)企業(yè)兼具高資本密度和高人才密度優(yōu)勢(shì)。資金方面,2022年,騰訊/阿里/百度研發(fā)費(fèi)用達(dá)614/567/233億元,明顯領(lǐng)先于行業(yè)相關(guān)公司。人才方面,根據(jù)脈脈人才庫,在計(jì)算機(jī)視覺、深度學(xué)習(xí)、語音識(shí)別、自然語言處理4個(gè)人工智能重要的技術(shù)方向上,互聯(lián)網(wǎng)大廠是人才儲(chǔ)備最豐富的企業(yè)。持續(xù)的高研發(fā)投入以及極高的人才密度有望驅(qū)動(dòng)頭部互聯(lián)網(wǎng)企業(yè)保持在AI及大模型領(lǐng)域的領(lǐng)先優(yōu)勢(shì)。場(chǎng)景:業(yè)務(wù)豐富多元,互聯(lián)網(wǎng)廠商天然具備落地實(shí)踐場(chǎng)景??紤]到數(shù)據(jù)隱私和安全合規(guī),初期通用大模型在行業(yè)落地時(shí)可能會(huì)面臨一定的信任問題,從而導(dǎo)致較高的獲客成本。而頭部互聯(lián)網(wǎng)平臺(tái)基于自身在電商、搜索、游戲、金融等領(lǐng)域豐富的業(yè)務(wù)積累,天然具備落地實(shí)踐場(chǎng)景。在提高產(chǎn)品效率的同時(shí),也有望率先形成示范效應(yīng),從而有助于外部客戶和應(yīng)用的拓展。格局推演:互聯(lián)網(wǎng)巨頭有望保持領(lǐng)先地位,中小廠商或?qū)⒚媾R路徑選擇。綜合上述分析,結(jié)合行業(yè)競(jìng)爭(zhēng)要素,并參考海外當(dāng)前競(jìng)爭(zhēng)格局,我們認(rèn)為,國(guó)內(nèi)大模型賽道有望形成與海外相似的產(chǎn)業(yè)趨勢(shì),兼具技術(shù)、資金、人才和場(chǎng)景優(yōu)勢(shì)的頭部互聯(lián)網(wǎng)企業(yè)有望成為大模型領(lǐng)域的重要玩家,而中小廠商或?qū)⒚媾R路徑選擇。一方面,中小廠商可以利用自身在垂類場(chǎng)景和數(shù)據(jù)層面積累的優(yōu)勢(shì),成為聚焦垂類的核心特色玩家;另一方面,基于訓(xùn)練和用戶調(diào)用帶來的算力需求的激增,考慮到資源優(yōu)勢(shì)和經(jīng)濟(jì)性,中小廠商或?qū)で笤茝S商的支持和合作。互聯(lián)網(wǎng)大模型對(duì)比:短看技術(shù)突破,長(zhǎng)看生態(tài)壁壘歷史積累:百度、阿里技術(shù)積累深厚,大模型已實(shí)現(xiàn)良好性能本章節(jié),我們對(duì)國(guó)內(nèi)頭部互聯(lián)網(wǎng)企業(yè)在AI領(lǐng)域的發(fā)展現(xiàn)狀、自研布局以及對(duì)外投資進(jìn)行了梳理。從時(shí)間線上看,國(guó)內(nèi)頭部互聯(lián)網(wǎng)企業(yè)阿里、百度、騰訊、字節(jié)均在2014-2016年間成立人工智能實(shí)驗(yàn)室,但此后在發(fā)展思路和框架布局上各有側(cè)重。我們認(rèn)為,阿里、百度更偏重對(duì)底層技術(shù)的投入,兼具先發(fā)優(yōu)勢(shì)和完備自研布局,目前推出的大模型產(chǎn)品已實(shí)現(xiàn)良好的中文對(duì)話能力。騰訊在AI領(lǐng)域亦積極跟進(jìn),并于2022年12月公布萬億中文NLP預(yù)訓(xùn)練模型混元的最新進(jìn)展;同時(shí),騰訊在大模型領(lǐng)域也保持了開放的投資風(fēng)格,與企業(yè)共同成長(zhǎng)。字節(jié)此前在AI領(lǐng)域的投入更多與自身業(yè)務(wù)相關(guān),如音視頻識(shí)別、內(nèi)容創(chuàng)作、AR/VR等,算法能力突出,但在大模型領(lǐng)域的積累則相對(duì)薄弱,推出火山方舟,通過MaaS的方式積極參與行業(yè)競(jìng)爭(zhēng)。阿里巴巴:AI自研投入已久,數(shù)據(jù)、算法及算力積累上已占據(jù)領(lǐng)先身位。作為國(guó)內(nèi)頭部科技企業(yè),阿里在人工智能等前沿科技方向上早有投入,2014年即成立了數(shù)據(jù)科學(xué)與技術(shù)研究院,2016年成立人工智能實(shí)驗(yàn)室,2017年成立達(dá)摩院,后續(xù)成立AI芯片自研團(tuán)隊(duì)作為算力支持,并陸續(xù)發(fā)布了中文社區(qū)最大規(guī)模預(yù)訓(xùn)練語言模型PLUG和多模態(tài)大模型M6。同時(shí),阿里在電商、智慧城市等業(yè)務(wù)中積極運(yùn)用深度學(xué)習(xí)等智能化技術(shù),通過技術(shù)進(jìn)步提升業(yè)務(wù)效率。我們認(rèn)為,基于在數(shù)據(jù)、算法和算力上的沉淀,阿里在國(guó)內(nèi)人工智能和大模型競(jìng)速中已占據(jù)領(lǐng)先身位。對(duì)外投資:廣泛布局,打造AI生態(tài)圈實(shí)現(xiàn)共贏。除自研投入外,阿里也在AI核心產(chǎn)業(yè)環(huán)節(jié)積極進(jìn)行對(duì)外投資,在芯片領(lǐng)域投資寒武紀(jì)、深鑒科技等,機(jī)器視覺和深度學(xué)習(xí)領(lǐng)域投資商湯科技、曠視科技等,應(yīng)用領(lǐng)域投資小鵬、小i機(jī)器人等。通過AI領(lǐng)域的廣泛布局,阿里巴巴有望與相關(guān)企業(yè)形成協(xié)同效應(yīng)和戰(zhàn)略合作,進(jìn)一步實(shí)現(xiàn)效率提升和業(yè)務(wù)拓展,通過打造AI生態(tài)圈的方式實(shí)現(xiàn)共贏。技術(shù)架構(gòu):IaaS+PaaS+MaaS重新定義AI架構(gòu)。面向新的AI時(shí)代,阿里云重新定義了IaaS+PaaS+MaaS的三層技術(shù)體系。IaaS層,阿里云專門為AI設(shè)計(jì)了云基礎(chǔ)設(shè)施,包括異構(gòu)計(jì)算、高效高速的網(wǎng)絡(luò)存儲(chǔ)等。同時(shí),在訓(xùn)練方面提供靈駿計(jì)算集群,在推理方面提供彈性計(jì)算ECS集群,通過更加穩(wěn)定高效的基礎(chǔ)設(shè)施為AI發(fā)展提供堅(jiān)實(shí)的基礎(chǔ)。PaaS層,阿里云基于長(zhǎng)期的技術(shù)和軟件能力積累提供了豐富的大數(shù)據(jù)及機(jī)器學(xué)習(xí)產(chǎn)品,從數(shù)據(jù)清洗、特征工程訓(xùn)練等方面助力模型訓(xùn)練。此外,阿里云于2022年11月推出魔搭社區(qū),提出MaaS(modelasaservice),通過打造大模型開源社區(qū)和生態(tài)共建的方式加速模型發(fā)展及迭代。百度:深耕十年,全棧自研構(gòu)筑核心壁壘?;谧陨順I(yè)務(wù)需求和濃厚的工程師文化,百度始終重視對(duì)AI的投入,2011年在硅谷開設(shè)辦公室,并在2017年提出“AllinAI”的公司戰(zhàn)略。從AI技術(shù)體系來看,百度是國(guó)內(nèi)少數(shù)在AI領(lǐng)域全棧自研布局的公司之一,在芯片層、框架層、模型層和應(yīng)用層均有自研投入,已形成一定的產(chǎn)業(yè)生態(tài)和影響力。對(duì)外投資:長(zhǎng)期投入,加速布局大模型領(lǐng)域。百度長(zhǎng)期關(guān)注人工智能賽道,堅(jiān)持布局前沿科技領(lǐng)域,在芯片、大模型、AI+制藥、應(yīng)用等領(lǐng)域均有投資。2023年以來,隨著ChatGPT引發(fā)新一輪AI產(chǎn)業(yè)熱潮,百度亦加速在AIGC及多模態(tài)大模型領(lǐng)域的布局,先后投資text-to-video生成技術(shù)與社區(qū)的初創(chuàng)企業(yè)MorphStudio、人工智能公司西湖心辰及多模態(tài)大模型公司生數(shù)科技,有望進(jìn)一步完善公司的AI生態(tài)布局并加快協(xié)同發(fā)展。芯片+框架+模型+應(yīng)用全棧自研布局,強(qiáng)化內(nèi)部反饋迭代。百度在AI領(lǐng)域全棧自研布局,芯片層,百度已有兩代自研昆侖芯實(shí)現(xiàn)量產(chǎn),預(yù)計(jì)第三代昆侖芯將于2024年初實(shí)現(xiàn)規(guī)模上市;框架層,百度飛槳經(jīng)過6年開發(fā)并逐漸成熟后,成為中國(guó)首個(gè)開源開放、功能完備的端到端深度學(xué)習(xí)平臺(tái),截至2022年11月,百度飛槳已有535萬開發(fā)者,服務(wù)了20萬家企事業(yè)單位,創(chuàng)建了67萬個(gè)模型;模型層,百度最早于2019年推出文心大模型并不斷迭代,并于2021年發(fā)布百億級(jí)大模型文心ERNIE3.0和千億級(jí)大模型文心ERNIE3.0Titan;應(yīng)用層,百度推出生成式AI對(duì)話產(chǎn)品文心一言以及面向企業(yè)客戶的文心千帆大模型平臺(tái),積極通過實(shí)踐場(chǎng)景驗(yàn)證大模型能力。我們認(rèn)為,百度全棧自研布局的優(yōu)勢(shì)在于各層之間的反饋有望進(jìn)一步驅(qū)動(dòng)技術(shù)能力的優(yōu)化,提升迭代效率。騰訊:重視AI發(fā)展,內(nèi)生+外延雙輪并驅(qū)。騰訊2016年成立AILab,并在2017年提出“makeAIeverywhere”的戰(zhàn)略愿景,2018年建立以人工智能與前沿科技為基礎(chǔ)的兩大實(shí)驗(yàn)室矩陣。根據(jù)騰訊RoboticsX實(shí)驗(yàn)室微信公眾號(hào),截至2022年底,騰訊AILab已累計(jì)在AAAI、CVPR、ACL、ICML、NeurIPS等國(guó)際頂級(jí)AI學(xué)術(shù)會(huì)議或期刊發(fā)表超780篇文章,并持續(xù)推動(dòng)AI與機(jī)器人、數(shù)字內(nèi)容生成、生命科學(xué)、醫(yī)療醫(yī)藥、游戲等行業(yè)應(yīng)用的結(jié)合。對(duì)外投資方面,根據(jù)IT桔子,截至2022年底,騰訊共投資53家國(guó)內(nèi)AI公司,多次投資AI算力芯片公司燧原科技、企業(yè)級(jí)認(rèn)知智能服務(wù)平臺(tái)明略科技等,并在2023年投資深言科技、MiniMax、光年之外等大模型企業(yè)。在大模型領(lǐng)域,騰訊仍然保持以投資見長(zhǎng)的風(fēng)格,有望與企業(yè)共享成長(zhǎng)果實(shí)。騰訊:從MaaS切入大模型賽道,算力支持及應(yīng)用工具完備。6月19日,騰訊云首次正式公布行業(yè)大模型研發(fā)進(jìn)展,并發(fā)布面向B端客戶的騰訊云MaaS服務(wù)解決方案。有別于阿里、百度等直接發(fā)布大模型產(chǎn)品,騰訊率先以MaaS的方式切入大模型賽道,在金融、文旅、政務(wù)、傳媒、教育等10大行業(yè)提供超50個(gè)解決方案,以更懂行業(yè)、更易落地的方式滿足企業(yè)需求。同時(shí),騰訊TI平臺(tái)提供數(shù)據(jù)標(biāo)注、訓(xùn)練、測(cè)試、評(píng)估、部署等全套工具,技術(shù)底座提供HCC高性能計(jì)算集群、向量數(shù)據(jù)庫等算力支撐,以保障行業(yè)大模型的運(yùn)行效果。字節(jié)跳動(dòng):2023年成立大模型團(tuán)隊(duì),搜索、智創(chuàng)兩部門牽頭。字節(jié)跳動(dòng)于2016年成立人工智能實(shí)驗(yàn)室,將其定位為公司內(nèi)部的研究所和技術(shù)服務(wù)商,為平臺(tái)輸出的海量?jī)?nèi)容提供AI技術(shù)支持。此前公司AI研究成果主要與業(yè)務(wù)相結(jié)合,研發(fā)重點(diǎn)集中在機(jī)器翻譯、智能語音、視頻圖像和多模態(tài)等領(lǐng)域,而大模型相關(guān)積累相對(duì)薄弱。根據(jù)36氪,字節(jié)跳動(dòng)語言大模型團(tuán)隊(duì)在今年組建,由搜索部門牽頭;圖片大模型團(tuán)隊(duì)則由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊(duì)牽頭。字節(jié)跳動(dòng):從MaaS切入,應(yīng)用先行豐富行業(yè)經(jīng)驗(yàn)。6月28日,火山引擎發(fā)布大模型服務(wù)平臺(tái)火山方舟,面向企業(yè)提供模型精調(diào)、評(píng)測(cè)、推理等全方位平臺(tái)服務(wù),已接入百川智能、復(fù)旦大學(xué)MOSS、瀾舟科技、MiniMax、智譜AI等多家AI科技公司及科研院所的大模型,并已對(duì)外啟動(dòng)邀測(cè)。我們認(rèn)為,由于前期在大模型領(lǐng)域的積累相對(duì)薄弱,通過MaaS的方式切入大模型賽道是更具可行性的方式。一方面,通過MaaS模式為需求方提供豐富多元、靈活選擇、具有性價(jià)比的大模型使用方式;另一方面,行業(yè)應(yīng)用的落地和行業(yè)經(jīng)驗(yàn)的積累也有望反哺字節(jié)自身在大模型領(lǐng)域的積累和迭代。核心人才:關(guān)注人才密度與粘性,兼顧基礎(chǔ)研發(fā)與業(yè)務(wù)落地在人才方面,我們認(rèn)為,互聯(lián)網(wǎng)大廠的差異化競(jìng)爭(zhēng)主要體現(xiàn)在兩方面:1)人才密度和人才質(zhì)量;2)人才粘性,而保障人才粘性的關(guān)鍵在于組織架構(gòu)與激勵(lì)機(jī)制的設(shè)置。由于人工智能的研發(fā)工作具有一定的前瞻研究和學(xué)術(shù)影響力的屬性,而在互聯(lián)網(wǎng)行業(yè)整體提質(zhì)增效背景下,對(duì)于研發(fā)產(chǎn)出和業(yè)務(wù)落地也有一定需求,因此如何平衡基礎(chǔ)研究和業(yè)務(wù)落地之間的關(guān)系、通過合理的組織體系保障人才粘性是互聯(lián)網(wǎng)大廠在架構(gòu)設(shè)置的關(guān)鍵。阿里巴巴:達(dá)摩院堅(jiān)持前沿探索,高密度AI人才引領(lǐng)發(fā)展。組織架構(gòu)上,阿里在人工智能領(lǐng)域的研究主要由達(dá)摩院主導(dǎo)。達(dá)摩院于2017年成立,致力于探索科技未知,以人類愿景為驅(qū)動(dòng)力,開展基礎(chǔ)科學(xué)和創(chuàng)新性技術(shù)研究。達(dá)摩院主要覆蓋機(jī)器智能、數(shù)據(jù)計(jì)算、機(jī)器人、金融科技、X實(shí)驗(yàn)室(量子計(jì)算)5大領(lǐng)域,其中機(jī)器智能布局最為突出,下轄語音實(shí)驗(yàn)室、視覺實(shí)驗(yàn)室、語言技術(shù)實(shí)驗(yàn)室、決策智能實(shí)驗(yàn)室、城市大腦實(shí)驗(yàn)室5大實(shí)驗(yàn)室。人員構(gòu)成上,阿里大模型研發(fā)由阿里云智能CTO周靖人帶隊(duì),其在大數(shù)據(jù)平臺(tái)及人工智能領(lǐng)域經(jīng)驗(yàn)豐富,并在M6系列模型研發(fā)中發(fā)揮了重要作用。黃非和趙德麗分別擔(dān)任語言技術(shù)實(shí)驗(yàn)室和基礎(chǔ)視覺實(shí)驗(yàn)室負(fù)責(zé)人,分別領(lǐng)導(dǎo)NLP和CV領(lǐng)域的研究,黃非曾在自然語言處理和人工智能頂級(jí)會(huì)議和期刊發(fā)表文章40多篇,獲得美國(guó)專利10多項(xiàng),并在IBM和Facebook從事自然語言處理的研發(fā)和技術(shù)管理等職位;趙德麗曾在微軟亞洲研究院的視覺計(jì)算組和香港中文大學(xué)的多媒體實(shí)驗(yàn)室工作六年,從事機(jī)器視覺和機(jī)器學(xué)習(xí)的算法研究工作。此外,阿里達(dá)摩院團(tuán)隊(duì)廣納賢才,原貝殼技術(shù)副總裁兼首席科學(xué)家葉杰平、前京東數(shù)科AI實(shí)驗(yàn)室首席科學(xué)家薄列峰等相繼于2022年加入阿里,有望進(jìn)一步推動(dòng)阿里在大模型及AI領(lǐng)域的探索。百度:技術(shù)攻堅(jiān)與產(chǎn)品承接并重,CTO王海峰統(tǒng)領(lǐng)AI研發(fā)。根據(jù)36氪,百度目前文心一言團(tuán)隊(duì)主要由TPG(技術(shù)中臺(tái)事業(yè)群)和MEG(移動(dòng)生態(tài)事業(yè)群)兩大部門協(xié)同,前者負(fù)責(zé)技術(shù)攻堅(jiān),后者進(jìn)行搜索、內(nèi)容產(chǎn)品承接。團(tuán)隊(duì)人員上,百度CTO王海峰自2018年底開始統(tǒng)領(lǐng)TG和AIG,總體負(fù)責(zé)百度人工智能技術(shù)和算法、算力、數(shù)據(jù)、安全等基礎(chǔ)技術(shù)的研發(fā),并擔(dān)任文心一言項(xiàng)目總指揮。騰訊:多團(tuán)隊(duì)并行,基礎(chǔ)研究與業(yè)務(wù)應(yīng)用并重。騰訊內(nèi)部多個(gè)團(tuán)隊(duì)均從事人工智能相關(guān)研發(fā)工作,其中,AILab和RoboticsX實(shí)驗(yàn)室作為雙基礎(chǔ)研究部門,均隸屬于技術(shù)工程事業(yè)部。AILab專注計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理和機(jī)器學(xué)習(xí)等方向的基礎(chǔ)研究,和內(nèi)容、社交、游戲等方向的應(yīng)用探索,截至2022年底,已有100多位頂尖研究科學(xué)家及300多位應(yīng)用工程師。同時(shí),云與智慧產(chǎn)業(yè)事業(yè)群設(shè)立騰訊優(yōu)圖實(shí)驗(yàn)室,專注于圖像技術(shù)的深入研究及應(yīng)用探索;微信事業(yè)部?jī)?nèi)部孵化微信AI團(tuán)隊(duì)。2023年2月,針對(duì)類ChatGPT對(duì)話式產(chǎn)品,騰訊成立混元助手項(xiàng)目組,騰訊首席科學(xué)家張正友擔(dān)任項(xiàng)目owner,俞棟、王迪、劉田分別擔(dān)任PM,并已有至少7位組長(zhǎng)和7位Sponsor。字節(jié)跳動(dòng):年初快速集結(jié)團(tuán)隊(duì),多部門協(xié)作開發(fā)。根據(jù)36氪,字節(jié)跳動(dòng)語言大模型團(tuán)隊(duì)在今年組建,由搜索部門牽頭;圖片大模型團(tuán)隊(duì)則由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊(duì)牽頭。朱文佳是字節(jié)大模型的第一負(fù)責(zé)人,其在算法和搜索業(yè)務(wù)上經(jīng)驗(yàn)深厚。此外,Data-AML負(fù)責(zé)人項(xiàng)亮、人工智能實(shí)驗(yàn)室總監(jiān)李航、前阿里M6核心技術(shù)人員楊紅霞等也均為團(tuán)隊(duì)重要成員。技術(shù)投入:百度、阿里暫居第一梯隊(duì),騰訊、字節(jié)加速追趕,關(guān)注迭代效率本章節(jié),我們從技術(shù)角度對(duì)國(guó)內(nèi)頭部互聯(lián)網(wǎng)大模型進(jìn)行對(duì)比研究。前期基于相似的算法路線、架構(gòu)設(shè)計(jì)和訓(xùn)練語料,互聯(lián)網(wǎng)大模型尚未展現(xiàn)出顯著的能力差異。根據(jù)IDC,阿里的通義千問和百度的文心一言在算法模型、通用能力、創(chuàng)新能力等方面取得相近評(píng)分。展望后續(xù),我們認(rèn)為,互聯(lián)網(wǎng)大模型在技術(shù)上的競(jìng)爭(zhēng)要點(diǎn)在于:1)對(duì)GPT關(guān)鍵技術(shù)的研發(fā)突破;2)相似性能下的成本和效率優(yōu)勢(shì);3)大規(guī)模、高質(zhì)量訓(xùn)練預(yù)料的搭建。算法模型:此前各家大模型架構(gòu)及路線主要參考BERT、LLaMA等開源模型,技術(shù)路線基本同源,但在模型設(shè)計(jì)和訓(xùn)練方式上各有側(cè)重,如阿里更強(qiáng)調(diào)多模態(tài)任務(wù)能力及效率,百度聚焦在NLP能力上的提升,騰訊兼顧模型規(guī)模增長(zhǎng)與效率提升。隨著ChatGPT驗(yàn)證了GPT路線及高質(zhì)量數(shù)據(jù)+反饋激勵(lì)的有效性,正驅(qū)動(dòng)著大模型的技術(shù)路線向GPT方向收斂。我們認(rèn)為,后續(xù)互聯(lián)網(wǎng)大廠在算法模型上差異化競(jìng)爭(zhēng)的核心在于:1)對(duì)GPT關(guān)鍵技術(shù)的研發(fā)突破;2)若在模型研發(fā)上較難取得突破,則通過模型設(shè)計(jì)和訓(xùn)練方法的優(yōu)化實(shí)現(xiàn)相似性能下更優(yōu)的成本和效率的廠商有望具備更大的競(jìng)爭(zhēng)優(yōu)勢(shì)。算力:隨著大模型參數(shù)和數(shù)據(jù)量的飆升帶來對(duì)算力需求的快速增長(zhǎng),互聯(lián)網(wǎng)大廠均加速在AI算力平臺(tái)、超算中心等新型計(jì)算基礎(chǔ)設(shè)施上的建設(shè)?;诨ヂ?lián)網(wǎng)大廠充足的算力儲(chǔ)備及在新型計(jì)算基礎(chǔ)設(shè)施上的積極建設(shè),我們認(rèn)為短期算力或?qū)⒉粫?huì)成為限制互聯(lián)網(wǎng)大模型發(fā)展的瓶頸,中長(zhǎng)期具備芯片自研能力的公司有望具備更強(qiáng)的競(jìng)爭(zhēng)優(yōu)勢(shì)。數(shù)據(jù):高質(zhì)量數(shù)據(jù)源及數(shù)據(jù)處理能力是差異化競(jìng)爭(zhēng)的核心。阿里在訓(xùn)練M6、百度在訓(xùn)練ERNIE3.0時(shí),均自行搭建了TB級(jí)別的大規(guī)模數(shù)據(jù)庫,數(shù)據(jù)來源中包含了大量生態(tài)內(nèi)獨(dú)有數(shù)據(jù),并設(shè)計(jì)了完善的清潔程序以確保數(shù)據(jù)質(zhì)量,有效提升了模型的訓(xùn)練效果和中文語境的對(duì)話表現(xiàn)。算法模型:底層路線逐漸向GPT方向收斂,模型設(shè)計(jì)和訓(xùn)練方式各有側(cè)重阿里巴巴:統(tǒng)一學(xué)習(xí)范式+模塊化設(shè)計(jì),通義打造多模態(tài)統(tǒng)一底座。達(dá)摩院認(rèn)為一個(gè)全能模型應(yīng)當(dāng)具備三重屬性:①任務(wù)無關(guān)(Task-Agnostic):不針對(duì)具體下游任務(wù),而是更具通用性的模型。②模態(tài)無關(guān)(Modality-Agnostic):對(duì)所有任務(wù)建立統(tǒng)一的輸入和輸出形式,從而實(shí)現(xiàn)不同模態(tài)的處理能力。③任務(wù)足夠豐富(TaskComprehensiveness):需要設(shè)計(jì)足夠豐富的任務(wù)種類,以確保模型的穩(wěn)健性。為了打造多模態(tài)全任務(wù)的通用性大模型,達(dá)摩院通過統(tǒng)一學(xué)習(xí)范式和模塊化設(shè)計(jì)的方式,使M6-OFA可處理超30種跨模態(tài)任務(wù),同時(shí)能夠靈活調(diào)用模塊從而實(shí)現(xiàn)高效率和高性能。M6-OFA實(shí)現(xiàn)架構(gòu)、模態(tài)和任務(wù)統(tǒng)一。①架構(gòu)統(tǒng)一:M6-OFA使用統(tǒng)一的TransformerEncoder-Decoder+ResNetBlocks的架構(gòu)進(jìn)行預(yù)訓(xùn)練和微調(diào),從而不需要針對(duì)不同任務(wù)設(shè)計(jì)特定的模型層。②模態(tài)統(tǒng)一:M6-OFA將NLP、CV和多模態(tài)任務(wù)統(tǒng)一到同一個(gè)框架和訓(xùn)練范式,從而可以完成對(duì)不同任務(wù)的輸出。③任務(wù)統(tǒng)一:M6-OFA將涉及多模態(tài)和單模態(tài)的所有任務(wù)都統(tǒng)一建模成序列到序列(seq2seq)任務(wù),模型可以同時(shí)學(xué)習(xí)多任務(wù),從而讓模型通過一次預(yù)訓(xùn)練即可獲得文本生成、圖像生成、跨模態(tài)理解等多種能力。借鑒人腦運(yùn)行機(jī)制,模塊化設(shè)計(jì)提升多模態(tài)任務(wù)能力及效率。模塊化設(shè)計(jì)借鑒人腦的運(yùn)行機(jī)制,即人類大腦中擁有儲(chǔ)備各種知識(shí)和處理不同模態(tài)信息的能力模塊,人類思考時(shí)只調(diào)用與特定任務(wù)相關(guān)的模塊,從而保證了人腦的高速運(yùn)行。模塊化大模型采用模塊化TransformerEncoder-Decoder結(jié)構(gòu)來統(tǒng)一多模態(tài)的理解和生成,同時(shí)切分出不同的獨(dú)立模塊,包括基礎(chǔ)層、通用層(如不同模態(tài))、任務(wù)層到功能性模塊(如推理),每個(gè)模塊間相互解耦,各司其職,從而通過靈活拆撥不同模塊進(jìn)行微調(diào)或者預(yù)訓(xùn)練實(shí)現(xiàn)大模型的輕量化和任務(wù)水平的提升。通義-M6:模型快速迭代,2年投入推出全球最大預(yù)訓(xùn)練模型。達(dá)摩院于2020年1月正式啟動(dòng)中文多模態(tài)預(yù)訓(xùn)練模型M6項(xiàng)目,此后模型快速迭代升級(jí),2021年3月/5月模型參數(shù)規(guī)模達(dá)千億/萬億。2021年11月模型參數(shù)規(guī)模達(dá)10萬億,成為全球最大預(yù)訓(xùn)練模型,通過阿里云PAI自研Whale框架上搭建MoE模型,疊加更細(xì)粒度的CPUoffload技術(shù)實(shí)現(xiàn)僅利用512張GPU即完成10萬億規(guī)模參數(shù)的訓(xùn)練;同時(shí),M6團(tuán)隊(duì)設(shè)計(jì)了Pseudo-to-Real(共享解除)機(jī)制,大幅提升訓(xùn)練速度。2022年9月,達(dá)摩院發(fā)布通義大模型系列,打造業(yè)界首個(gè)AI統(tǒng)一底座,并宣布相關(guān)核心模型向全球開發(fā)者開源開放。通義-AliceMind:深度語言模型體系持續(xù)豐富,NLP(自然語言處理)能力突出。歷經(jīng)三年研發(fā),目前深度語言模型體系A(chǔ)liceMind已包含通用語言模型StructBERT、多語言VECO、生成式PALM、多模態(tài)StructVBERT、結(jié)構(gòu)化StructuralLM、知識(shí)驅(qū)動(dòng)LatticeBERT、機(jī)器閱讀理解UED、超大模型PLUG等。AliceMind先后登頂GLUE、CLUE、XTREME、VQAChallenge、DocVQA、MSMARCO等自然語言處理領(lǐng)域權(quán)威榜單,在多語言、生成式、多模態(tài)、結(jié)構(gòu)化、知識(shí)驅(qū)動(dòng)等領(lǐng)域能力突出。通義-視覺大模型:專注CV(計(jì)算機(jī)視覺)領(lǐng)域的應(yīng)用落地。通義視覺大模型基于文本到視覺生成和特征到視覺生成兩個(gè)基礎(chǔ)模型,通過視頻處理、視覺問答、視覺算術(shù)、知識(shí)抽取等中層通用算法的支持,實(shí)現(xiàn)在電商、城市大腦、工業(yè)視覺等領(lǐng)域的產(chǎn)業(yè)應(yīng)用。例如,通義-視覺大模型可以在電商行業(yè)實(shí)現(xiàn)圖像搜索和萬物識(shí)別等場(chǎng)景應(yīng)用,并在文生圖以及交通和自動(dòng)駕駛領(lǐng)域發(fā)揮作用。模型生態(tài):MaaS先行者,魔搭社區(qū)快速迭代。阿里云于2022年11月提出MaaS,并推出開源社區(qū)魔搭,一方面,通過提供以模型為核心要素的一站式使用平臺(tái),降低AI使用門檻;另一方面,通過開源方式吸引更多開發(fā)者共創(chuàng)共建,加速模型開發(fā)迭代。魔搭社區(qū)經(jīng)過數(shù)月時(shí)間快速發(fā)展,根據(jù)阿里巴巴財(cái)報(bào),截至2023年7月,魔搭社區(qū)模型總數(shù)已超1000個(gè),累計(jì)模型下載量超4500萬次。同時(shí),通義大模型系列中語言大模型AliceMind-PLUG、多模態(tài)理解與生成統(tǒng)一模型AliceMind-mPLUG、多模態(tài)統(tǒng)一底座模型M6-OFA和超大模型落地關(guān)鍵技術(shù)S4框架等核心模型及能力也已在魔搭社區(qū)中面向全球開發(fā)者開源。我們認(rèn)為,魔搭作為國(guó)內(nèi)MaaS的先行者,開源社區(qū)帶來的更快的迭代速度和更豐富的應(yīng)用反饋有望使得魔搭在中長(zhǎng)期模型生態(tài)建設(shè)中占得先機(jī)。百度:ERNIE系列模型不斷迭代,持續(xù)突破NLP任務(wù)表現(xiàn)ERNIE1.0:加入短語和實(shí)體掩碼策略,強(qiáng)化模型知識(shí)推理能力?;贐ERT模型,ERNIE1.0主要在掩碼策略上進(jìn)行了改進(jìn)。有別于BERT采用基礎(chǔ)mask類型,ERNIE1.0新增了短語mask和實(shí)體mask類型,從而使得模型表現(xiàn)出更強(qiáng)的語法學(xué)習(xí)和知識(shí)推理能力。在五類自然語言處理任務(wù)(自然語言推理、語義相似性、命名實(shí)體識(shí)別、情感分析和檢索問答)上,ERNIE表現(xiàn)優(yōu)于基準(zhǔn)模型BERT。同時(shí),語料庫方面,預(yù)訓(xùn)練除使用中文維基百科外,還使用了大量百度百科、百度新聞和百度貼吧的數(shù)據(jù),更豐富的訓(xùn)練數(shù)據(jù)提升了模型對(duì)中文語意的理解能力。此外,ERNIE在DLM(對(duì)話語言模型)任務(wù)上對(duì)查詢-響應(yīng)對(duì)話結(jié)構(gòu)進(jìn)行建模,通過多回合對(duì)話幫助ERNIE學(xué)習(xí)對(duì)話中的隱式關(guān)系,從而增強(qiáng)了模型學(xué)習(xí)的語義表示能力。ERNIE2.0:改進(jìn)多任務(wù)學(xué)習(xí)方式,實(shí)現(xiàn)多個(gè)NLP下游任務(wù)SOTA表現(xiàn)。多任務(wù)學(xué)習(xí)通常有同時(shí)學(xué)習(xí)和順序?qū)W習(xí)兩種方式,同時(shí)學(xué)習(xí)模式無法確保任務(wù)的不斷增加能夠帶來模型效果的持續(xù)提升,而順序?qū)W習(xí)模式下隨著不同任務(wù)的學(xué)習(xí)、模型參數(shù)的遞進(jìn),可能會(huì)使得模型陷入遺忘。ERNIE2.0采用了交替式的多任務(wù)學(xué)習(xí)方式,當(dāng)出現(xiàn)新任務(wù)時(shí),使用先前學(xué)習(xí)的參數(shù)來初始化模型,并同時(shí)訓(xùn)練新引入的任務(wù)和原始任務(wù),從而有效緩解了遺忘現(xiàn)象并提高了模型訓(xùn)練的有效性。在多任務(wù)學(xué)習(xí)方式的優(yōu)化下,ERNIE2.0在多個(gè)NLP下游任務(wù)上取得了中英文SOTA(stateofthearts)表現(xiàn)。ERNIE3.0:引入大規(guī)模知識(shí)圖譜,提升模型的知識(shí)記憶和推理能力。由于已有大模型使用純文本進(jìn)行訓(xùn)練,而沒有引入知識(shí),且傳統(tǒng)的自回歸微調(diào)方式在解決下游語言理解任務(wù)時(shí)表現(xiàn)出相對(duì)較弱的性能。因此,ERNIE3.0提出了用于大規(guī)模知識(shí)增強(qiáng)模型預(yù)訓(xùn)練的統(tǒng)一框架,通過引入4TB語料和10B參數(shù)的大規(guī)模知識(shí)圖譜,在大規(guī)模無監(jiān)督語料庫上對(duì)模型進(jìn)行預(yù)訓(xùn)練。同時(shí),ERNIE3.0采用了單詞感知、結(jié)構(gòu)感知和知識(shí)感知等多種預(yù)訓(xùn)練任務(wù),從而使得模型能夠更有效地學(xué)習(xí)不同層次的知識(shí)。上述改進(jìn)下,ERNIE3.0在情感分析、觀點(diǎn)抽取、閱讀理解、文本摘要、對(duì)話生成、數(shù)字運(yùn)算等54個(gè)中文NLP任務(wù)中實(shí)現(xiàn)SOTA表現(xiàn)。ERNIE3.0Titan:強(qiáng)化可控及可信,實(shí)現(xiàn)中文預(yù)訓(xùn)練最強(qiáng)表現(xiàn)。ERNIE3.0Titan在保留了ERNIE3.0海量無監(jiān)督文本與大規(guī)模知識(shí)圖譜的平行預(yù)訓(xùn)練算法的基礎(chǔ)上,進(jìn)一步設(shè)計(jì)了可控和可信學(xué)習(xí)算法,通過自監(jiān)督的對(duì)抗損失和可控的語言建模損失,達(dá)到不同類型的零樣本生成能力并顯著提升了生成結(jié)果的可信度,并實(shí)現(xiàn)文本分類、信息抽取、閱讀理解等68個(gè)NLP任務(wù)的SOTA表現(xiàn)。多模態(tài)大模型布局完善,文心系列模型滿足多元需求。百度除了在NLP領(lǐng)域持續(xù)升級(jí)ERNIE系列模型外,在視覺、跨模態(tài)和生物計(jì)算領(lǐng)域也積極布局。視覺領(lǐng)域,基于領(lǐng)先的視覺技術(shù),利用海量圖像、視頻等數(shù)據(jù),提供視覺基礎(chǔ)模型以及視覺任務(wù)定制與應(yīng)用能力;跨模態(tài)領(lǐng)域,基于知識(shí)增強(qiáng)的跨模態(tài)語義理解關(guān)鍵技術(shù),實(shí)現(xiàn)跨模態(tài)檢索、圖文生成、圖片文檔的信息抽取等應(yīng)用的快速搭建;生物計(jì)算領(lǐng)域,將生物領(lǐng)域研究對(duì)象的特性融入模型,構(gòu)建面向化合物分子、蛋白分子的生物計(jì)算領(lǐng)域預(yù)訓(xùn)練模型?;诙嗄B(tài)大模型的完善布局,使得文心系列模型能夠滿足各行業(yè)在不同領(lǐng)域的多元需求。騰訊:關(guān)注效率提升,混元成為國(guó)內(nèi)首個(gè)低成本、可落地的NLP萬億大模型?;煸狝I大模型集CV、NLP和多模態(tài)理解能力于一體,2022年4月首次對(duì)外發(fā)布研發(fā)進(jìn)展,在MSR-VTT、MSVD等五大權(quán)威數(shù)據(jù)集榜單中登頂。2022年12月,混元在熱啟動(dòng)和課程學(xué)習(xí)、MoE路由算法、模型結(jié)構(gòu)、訓(xùn)練加速等方面研究?jī)?yōu)化,大幅降低了萬億大模型的訓(xùn)練成本,成為國(guó)內(nèi)首個(gè)低成本、可落地的NLP萬億大模型,并再次登頂自然語言理解任務(wù)榜單CLUE。熱啟動(dòng)和課程學(xué)習(xí):混元首先在小規(guī)模模型上訓(xùn)練收斂,然后將小模型的知識(shí)遷移到大模型,逐步增加模型的規(guī)模,從而使得當(dāng)模型規(guī)模指數(shù)型增長(zhǎng)時(shí),只需要較少的迭代即可達(dá)到較好的水平。MoE路由算法:有別于Dense模型在訓(xùn)練過程中激活所有FFN和SA層的參數(shù),從而導(dǎo)致較高的訓(xùn)練成本,MoE通過引入路由,只激活部分FFN的參數(shù)參與計(jì)算,從而能夠?qū)崿F(xiàn)訓(xùn)練成本的節(jié)約。同時(shí),在規(guī)模相同的情況下,使用MoE的大模型能夠具有更高的訓(xùn)練和推理效率。注意力權(quán)重復(fù)制:混元研究團(tuán)隊(duì)發(fā)現(xiàn)注意力權(quán)重在不同層之間的差異不大,因此改進(jìn)了注意力權(quán)重設(shè)置方式。在每一層隨機(jī)有p的概率重新計(jì)算注意力權(quán)重,1-p的概率復(fù)用上一層的注意力權(quán)重。通過實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)p設(shè)置為50%,模型效果無損,注意力權(quán)重總的時(shí)間復(fù)雜度降低50%,大模型預(yù)訓(xùn)練提速約20%。詞向量路由機(jī)制:引入額外的詞向量用于專家的路由,把路由和注意力層輸出解耦,相同詞的路由向量相同,在保證路由穩(wěn)定性的同時(shí)加速了收斂。算力:積極布局新型高性能計(jì)算基礎(chǔ)設(shè)施,保障算力支撐阿里巴巴:PAI×靈駿智算支持10萬億參數(shù)大模型研發(fā)?;陟`駿智算,阿里云推出了PAI×靈駿智算服務(wù),提供覆蓋AI開發(fā)全流程的平臺(tái)和分布式異構(gòu)計(jì)算優(yōu)化能力,能夠支撐10萬億參數(shù)規(guī)模的大型模型訓(xùn)練,單個(gè)訓(xùn)練任務(wù)可達(dá)到萬卡級(jí)別規(guī)模,訓(xùn)練性能提高近10倍,千卡規(guī)模的線性擴(kuò)展效率達(dá)92%,能夠深度支持通用大型模型的研發(fā)。百度:百度百舸構(gòu)建AI原生的智能計(jì)算基礎(chǔ)設(shè)施,同等配置下實(shí)現(xiàn)性能領(lǐng)先。2022年9月,百度云升級(jí)發(fā)布百度百舸2.0,在AI計(jì)算、AI存儲(chǔ)、AI容器等模塊上進(jìn)行了能力增強(qiáng)和功能豐富,并全新發(fā)布AI加速套件。①AI計(jì)算:發(fā)布了彈性RDMA網(wǎng)卡,其和VPC網(wǎng)絡(luò)進(jìn)行了融合,使得用戶的使用成本更低,且通信延時(shí)相比傳統(tǒng)TCP網(wǎng)絡(luò)降低了2-3倍。②AI存儲(chǔ):發(fā)布并行文件存儲(chǔ)
PFS
的裸金屬版本,支持IB網(wǎng)絡(luò),可將計(jì)算對(duì)數(shù)據(jù)的訪問延遲降低至百us級(jí)別。同時(shí),對(duì)象存儲(chǔ)BOS新增了原生層級(jí)namespace,可以將元數(shù)據(jù)訪問速度提升4倍以上。③AI容器:在業(yè)界率先推出雙引擎GPU容器虛擬化方案,可以滿足各類場(chǎng)景的要求,提升GPU資源利用率。④AI加速套件:通過存訓(xùn)推一體化的方式,對(duì)數(shù)據(jù)的讀取和查詢、訓(xùn)練、推理進(jìn)行加速,進(jìn)一步提升AI作業(yè)速度。在MLPerfTrainningv2.0的榜單中,百度百舸2.0和百度飛槳聯(lián)合提交的BERTLarge模型GPU訓(xùn)練性能結(jié)果在同等GPU配置下排名第一,比其他結(jié)果快5%-11%。騰訊:最新HCC高性能計(jì)算集群算力提升3倍,4天完成萬億大模型訓(xùn)練。2023年4月,騰訊云推出全新HCC高性能計(jì)算集群,采用最新一代騰訊云星星海自研服務(wù)器,搭載了NVIDIAH800TensorCoreGPU,可提供業(yè)界目前最高的3.2T超高互聯(lián)帶寬。相較1.6T網(wǎng)絡(luò),集群整體算力提升20%,將萬億參數(shù)的混元NLP大模型的訓(xùn)練時(shí)間縮短至4天,大幅提升了大模型的訓(xùn)練效率。字節(jié)跳動(dòng):自研DPU等系列云產(chǎn)品,提高大模型訓(xùn)練效率。4月18日,火山引擎發(fā)布自研DPU等系列云產(chǎn)品,并推出智能推薦-高速訓(xùn)練引擎,采取軟硬一體、細(xì)粒度算子優(yōu)化以及分布式訓(xùn)練和推理,以實(shí)現(xiàn)更快的訓(xùn)練速度和更低的訓(xùn)練成本。根據(jù)火山引擎微信公眾號(hào):軟硬一體化:針對(duì)關(guān)鍵場(chǎng)景的超大模型,火山引擎智能推薦-高速訓(xùn)練引擎提供全GPU方案,可以支持100GB-10TB的超大模型的高速訓(xùn)練,綜合ROI是CPU的5倍;覆蓋更多場(chǎng)景的模型,提供了GPU+CPU混訓(xùn)方案,綜合ROI是CPU的2倍。細(xì)粒度算子優(yōu)化:針對(duì)搜索、推薦和營(yíng)銷場(chǎng)景,優(yōu)化細(xì)粒度算子,使得在模型推理的過程中有更好的性能表現(xiàn)。在訓(xùn)練時(shí),通過算子融合并精細(xì)調(diào)優(yōu),性能提升20%;在推理時(shí),通過算子優(yōu)化,性能提升40%。分布式訓(xùn)練和推理:智能推薦-高速訓(xùn)練引擎為了保障系統(tǒng)的穩(wěn)定性,支持訓(xùn)練和推理的全方位容錯(cuò),當(dāng)某一個(gè)節(jié)點(diǎn)故障時(shí),可以快速恢復(fù);支持分布式推理,包括多分片、多副本,從而保證線上服務(wù)的高可用。抖音、今日頭條等基于火山引擎高速訓(xùn)練引擎的業(yè)務(wù),模型訓(xùn)練時(shí)間的速度相較以往快10倍-25倍,綜合成本降低25%-67%。數(shù)據(jù):高質(zhì)量數(shù)據(jù)源及數(shù)據(jù)處理能力是差異化競(jìng)爭(zhēng)核心。由于優(yōu)質(zhì)中文開源數(shù)據(jù)庫較少、數(shù)據(jù)規(guī)模較小,因此高質(zhì)量數(shù)據(jù)源及數(shù)據(jù)處理能力是競(jìng)爭(zhēng)差異化的核心。阿里在訓(xùn)練M6、百度在ERNIE3.0時(shí),均自行搭建了TB級(jí)別的大規(guī)模數(shù)據(jù)庫,數(shù)據(jù)來源中包含了大量生態(tài)內(nèi)獨(dú)有數(shù)據(jù),并設(shè)計(jì)了完善的清潔程序以確保數(shù)據(jù)質(zhì)量,有效提升了模型的訓(xùn)練效果和中文語境的對(duì)話表現(xiàn)。資金:互聯(lián)網(wǎng)大廠均重視研發(fā)投入,百度10年投入AI超千億元?;ヂ?lián)網(wǎng)大廠均具備穩(wěn)健的現(xiàn)金流并重視研發(fā)投入,在資金實(shí)力上不存在顯著差異,但在行業(yè)整體降本增效趨勢(shì)下,或?qū)⒏幼⒅匮邪l(fā)的投入效率及產(chǎn)出。2022年,騰訊/阿里/百度研發(fā)費(fèi)用分別為614/567/233億元,研發(fā)費(fèi)用率分別為11.1%/6.5%/18.9%,并多次強(qiáng)調(diào)在人工智能領(lǐng)域的研發(fā)投入。根據(jù)阿里財(cái)報(bào),F(xiàn)Y2022,阿里巴巴技術(shù)投入超過1200億元人民幣;近三年,阿里巴巴專利投入中超60%集中于云計(jì)算、人工智能、芯片等硬核科技領(lǐng)域。根據(jù)李彥宏在2022年世界人工智能大會(huì)上的發(fā)言,百度在人工智能領(lǐng)域10年間累計(jì)投入超過1000億元,其中核心研發(fā)投入在核心收入占比連續(xù)多個(gè)季度超過20%。同時(shí),百度也持續(xù)在免費(fèi)算力開放、AI人才培養(yǎng)等方面提供資金和資源。應(yīng)用場(chǎng)景:內(nèi)部核心業(yè)務(wù)率先落地,積極探索行業(yè)場(chǎng)景自身核心業(yè)務(wù)及B端率先應(yīng)用,關(guān)注實(shí)際落地進(jìn)展。從場(chǎng)景上看,各公司均率先將大模型能力用于自身核心業(yè)務(wù),在提升業(yè)務(wù)效率的同時(shí),也打造了行業(yè)應(yīng)用的標(biāo)桿案例。外部應(yīng)用上,由于大模型提質(zhì)增效的能力天然契合B端需求,因此目前B端落地進(jìn)展相對(duì)較快。我們認(rèn)為,AI在數(shù)字化程度較高或人力密集型行業(yè)有望形成更大的應(yīng)用空間。根據(jù)IDC數(shù)據(jù),我國(guó)專業(yè)服務(wù)、政府、制造業(yè)、銀行、通信有望成為AI應(yīng)用市場(chǎng)規(guī)模最大的行業(yè),2026年市場(chǎng)規(guī)模有望達(dá)77.4/36.9/28.0/20.6/18.5億美元。行業(yè)覆蓋上,各公司展現(xiàn)出較強(qiáng)的自身業(yè)務(wù)屬性及此前產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域的資源積累。參考各公司在云計(jì)算市場(chǎng)的客戶構(gòu)成,我們認(rèn)為隨著行業(yè)應(yīng)用-數(shù)據(jù)-模型的不斷迭代反饋,各公司在大模型領(lǐng)域也有望形成特定行業(yè)賽道的相對(duì)優(yōu)勢(shì)。C端,盡管目前尚未有爆款應(yīng)用的出現(xiàn),但參考移動(dòng)互聯(lián)網(wǎng)時(shí)代應(yīng)用類公司實(shí)現(xiàn)了更高的市值增長(zhǎng),我們認(rèn)為未來AI對(duì)C端應(yīng)用的顛覆式創(chuàng)新也有望帶來產(chǎn)業(yè)價(jià)值的爆發(fā)。阿里巴巴:產(chǎn)品全系接入,有望率先形成示范效應(yīng)。AI帶來生產(chǎn)效率的顯著提升,目前在文字歸納與生成、創(chuàng)意性內(nèi)容生成、代碼開發(fā)等領(lǐng)域已得到廣泛應(yīng)用。同時(shí),大模型結(jié)合行業(yè)應(yīng)用落地后,更多的真實(shí)用戶反饋也有望加速大模型的優(yōu)化迭代,從而強(qiáng)化良性循環(huán)。根據(jù)2023阿里云峰會(huì),阿里所有產(chǎn)品未來都將接入大模型全面升級(jí),在提高產(chǎn)品效率的同時(shí),也有望率先形成示范效應(yīng),從而有助于外部客戶和應(yīng)用的拓展。辦公:釘釘全面接入通義千問,實(shí)現(xiàn)生產(chǎn)智能化。4月,釘釘總裁葉軍在2023春季釘峰會(huì)宣布,釘釘全面接入阿里巴巴通義千問大模型。用戶在使用釘釘時(shí),可以通過斜杠“/”調(diào)用通義大模型能力,實(shí)現(xiàn)對(duì)群聊工作討論、推文創(chuàng)建、視頻會(huì)議、活動(dòng)策劃、資料管理等場(chǎng)景協(xié)作效率的大幅提升。我們認(rèn)為,辦公場(chǎng)景中較多的文本工作及內(nèi)容創(chuàng)意天然適合通過AI的方式進(jìn)行生產(chǎn)力改造。辦公:通義聽悟全新上線,全面提升音視頻向圖文轉(zhuǎn)化效率。6月1日,阿里云發(fā)布聚焦音視頻的AI新品通義聽悟,成為國(guó)內(nèi)首個(gè)開放公測(cè)的大模型應(yīng)用產(chǎn)品。通義聽悟接入了通義千問大模型的理解與摘要能力,幫助用戶在工作學(xué)習(xí)中完成對(duì)音視頻內(nèi)容的轉(zhuǎn)寫、檢索、摘要和整理。同時(shí),通義聽悟也可嵌入各類音視頻平臺(tái),形成實(shí)時(shí)字幕、智能摘要等,如釘釘?shù)摹搬旈W記”便集成了通義聽悟,未來通義聽悟也有望接入夸克APP、阿里云盤等端口提供服務(wù)。電商:用戶端優(yōu)化購(gòu)物體驗(yàn),商家端提升經(jīng)營(yíng)效率。由于電商鏈路中存在大量人機(jī)交互、內(nèi)容生成等場(chǎng)景,因此適合與AI結(jié)合實(shí)現(xiàn)早期應(yīng)用落地。阿里電商業(yè)務(wù)與AI能力結(jié)合后,用戶端,將通過智能推薦、輔助決策等方式優(yōu)化消費(fèi)者購(gòu)物體驗(yàn),降低決策成本;商家端,既能通過AI輔助創(chuàng)意生成降低營(yíng)銷成本,也能通過智能客服等方式降低運(yùn)營(yíng)成本,同時(shí)AI帶來更精準(zhǔn)的用戶洞察也有望提升商家的經(jīng)營(yíng)產(chǎn)出,從而打開未來潛在的貨幣化空間;平臺(tái)端,消費(fèi)者及商家更好的使用體驗(yàn)及經(jīng)營(yíng)成果有望提升用戶及商家對(duì)平臺(tái)的心智和粘性,從而進(jìn)一步保障平臺(tái)的市場(chǎng)份額。智能終端:通義千問賦能天貓精靈,有望成為一站式家庭生活服務(wù)入口。2023阿里云峰會(huì)展示了通義千問在智能居家方面帶來的體驗(yàn)提升,接入通義千問的天貓精靈Demo版本也展現(xiàn)了其理解用戶需求成功下單外賣以及語言能力和推理能力的增強(qiáng)。我們認(rèn)為,未來天貓精靈在通義千問賦能下,并接入淘寶、天貓、餓了么、飛豬等應(yīng)用后,有望優(yōu)化交互體驗(yàn),成為一站式家庭生活服務(wù)入口。通義千問積極與企業(yè)展開合作,共創(chuàng)企業(yè)專屬大模型滿足個(gè)性化需求。除阿里系內(nèi)部應(yīng)用將全面接入大模型外,通義千問也將與各行業(yè)合作生成行業(yè)專屬和企業(yè)專屬大模型,滿足企業(yè)個(gè)性化需求并提升業(yè)務(wù)效率。目前,阿里云已和多家企業(yè)在大模型相關(guān)場(chǎng)景展開技術(shù)合作探索和共創(chuàng),首批合作企業(yè)包括OPPO安迪斯智能云、太平洋保險(xiǎn)、吉利汽車、奇瑞新能源、波司登等。根據(jù)2023阿里云峰會(huì),阿里發(fā)布通義千問兩周后,超20萬家企業(yè)申請(qǐng)接入。百度:內(nèi)部廣泛應(yīng)用,有望重塑主業(yè)搜索體驗(yàn)。目前,文心大模型已大規(guī)模應(yīng)用于搜索、信息流、小度智能屏、百度地圖等百度內(nèi)部的各類產(chǎn)品,顯著提升了產(chǎn)品智能化體驗(yàn)。尤其對(duì)于百度的搜索主業(yè)來講,傳統(tǒng)搜索模式下存在信息冗余繁雜、用戶篩選成本較高等痛點(diǎn),結(jié)合AI能力后,百度搜索以對(duì)話方式生成回答,并列示資料來源,有望大幅優(yōu)化用戶搜索體驗(yàn),從而進(jìn)一步帶來用戶規(guī)模及使用頻率的提升。行業(yè)應(yīng)用:深入實(shí)體經(jīng)濟(jì),行業(yè)生態(tài)不斷豐富。在通用文心大模型的基礎(chǔ)之上,結(jié)合行業(yè)數(shù)據(jù)和知識(shí)圖譜,文心已累計(jì)發(fā)布電力、燃?xì)?、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域的11個(gè)行業(yè)大模型,不斷通過大模型賦能千行百業(yè)的數(shù)字化和智能化進(jìn)程。文心一言發(fā)布首日,即與5家企業(yè)完成首批簽約,與650家企業(yè)啟動(dòng)簽約,超6.5萬企業(yè)申請(qǐng)調(diào)用,產(chǎn)業(yè)化進(jìn)程領(lǐng)先。文心一格:AI輔助藝術(shù)和創(chuàng)意生成,有望釋放AIGC生產(chǎn)力。文心一格是百度基于文心大模型技術(shù)推出的AI藝術(shù)和創(chuàng)意輔助平臺(tái),可以根據(jù)用戶輸入的文本描述,自動(dòng)生成畫作,同時(shí)可以根據(jù)用戶需求進(jìn)行編輯和二次創(chuàng)作。截至2023年5月底,文心一格官網(wǎng)的注冊(cè)用戶數(shù)已超600萬,參與文心一格測(cè)試的生態(tài)伙伴超過900家。隨著文心一格模型能力的不斷優(yōu)化和迭代,有望大幅提升游戲原畫、廣告營(yíng)銷素材、工業(yè)設(shè)計(jì)及建筑設(shè)計(jì)等領(lǐng)域的生產(chǎn)效率,在實(shí)現(xiàn)內(nèi)容創(chuàng)作能力突破的同時(shí),也能促進(jìn)公司的降本增效。騰訊:多核心業(yè)務(wù)落地,行業(yè)大模型推動(dòng)生態(tài)共建游戲:降低制作成本,豐富玩家體驗(yàn)。AI技術(shù)在游戲全鏈路中均可充分運(yùn)用,一方面,AI可以輔助游戲制作、運(yùn)用及周邊生態(tài)開發(fā),降低游戲創(chuàng)造門檻和成本,同時(shí)提升游戲品質(zhì);另一方面,AI也能拓展更加多元的游戲品類,如圍棋、麻將等棋牌類,足球等體育類,以及多人在線戰(zhàn)術(shù)競(jìng)技(MOBA)、第一人稱射擊(FPS)等復(fù)雜策略類游戲,不斷豐富玩家體驗(yàn)。廣告:提升理解和運(yùn)算能力,兼顧起量、成本和穩(wěn)定性?;煸狝I大模型幫助騰訊廣告系統(tǒng)實(shí)現(xiàn)升級(jí),在廣告內(nèi)容理解、廣告智能創(chuàng)作、廣告智能審核和廣告指紋系統(tǒng)4個(gè)方面分別打造解決方案,大幅提升了系統(tǒng)在廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的能力,在助力廣告主達(dá)成起量、成本和穩(wěn)定性三大效果指標(biāo)、實(shí)現(xiàn)生意增字節(jié)跳動(dòng):8月發(fā)布大模型對(duì)話產(chǎn)品“豆包”,加速研發(fā)進(jìn)展。8月,字節(jié)發(fā)布大模型對(duì)話類產(chǎn)品豆包、超愛聊天的小寧、英語學(xué)習(xí)助手、英文寫作潤(rùn)色、全能寫作助手,已具備基本的問答對(duì)話、智能創(chuàng)作等能力。根據(jù)SuperCLUE測(cè)評(píng),目前豆包在不同維度的能力上差異較大,在邏輯推理及計(jì)算方面具有較強(qiáng)表現(xiàn),而在代碼、上下文對(duì)話等方面仍存
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 湘教版數(shù)學(xué)八年級(jí)下冊(cè)《小結(jié)練習(xí)》聽評(píng)課記錄
- 人教版七年級(jí)數(shù)學(xué)上冊(cè)4.3.2《角的比較與運(yùn)算》聽評(píng)課記錄
- 生化儀器維修合同(2篇)
- 湘教版數(shù)學(xué)九年級(jí)上冊(cè)5.1《總體平均數(shù)與方差的估計(jì)》聽評(píng)課記錄1
- 人教版英語七年級(jí)下冊(cè)知識(shí)點(diǎn)
- 人教版數(shù)學(xué)九年級(jí)下冊(cè)29.2《三視圖》聽評(píng)課記錄(二)
- 浙教版數(shù)學(xué)七年級(jí)上冊(cè)《6.6 角的大小比較》聽評(píng)課記錄1
- 小學(xué)二年級(jí)數(shù)學(xué)口算心算題天天練75套
- 五年級(jí)數(shù)學(xué)下冊(cè)聽評(píng)課記錄《4.1 體積與容積 》北師大版
- 蘇科版數(shù)學(xué)九年級(jí)上冊(cè)1.4《用一元二次方程解決問題》聽評(píng)課記錄4
- 藥膳與食療試題及答案高中
- 二零二五年度海外市場(chǎng)拓展合作協(xié)議4篇
- 2024年湖南汽車工程職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫標(biāo)準(zhǔn)卷
- 2025中國(guó)鐵塔集團(tuán)安徽分公司招聘29人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年河北省農(nóng)村信用社招聘歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 手術(shù)室植入物的管理
- 電力供電系統(tǒng)試驗(yàn)調(diào)試和聯(lián)調(diào)方法
- (正式版)HGT 6313-2024 化工園區(qū)智慧化評(píng)價(jià)導(dǎo)則
- 法語工程詞匯(路橋、隧道、房建)
- 地推管理制度(完整版)
- NUDD新獨(dú)難異失效模式預(yù)防檢查表
評(píng)論
0/150
提交評(píng)論