2025 互聯(lián)網(wǎng)行業(yè)專題研究:互聯(lián)網(wǎng)大廠如何受益于DeepSeekR1“破圈”_第1頁
2025 互聯(lián)網(wǎng)行業(yè)專題研究:互聯(lián)網(wǎng)大廠如何受益于DeepSeekR1“破圈”_第2頁
2025 互聯(lián)網(wǎng)行業(yè)專題研究:互聯(lián)網(wǎng)大廠如何受益于DeepSeekR1“破圈”_第3頁
2025 互聯(lián)網(wǎng)行業(yè)專題研究:互聯(lián)網(wǎng)大廠如何受益于DeepSeekR1“破圈”_第4頁
2025 互聯(lián)網(wǎng)行業(yè)專題研究:互聯(lián)網(wǎng)大廠如何受益于DeepSeekR1“破圈”_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年2月14日行業(yè)研究光大證券互聯(lián)網(wǎng)大廠如何受益于DeepSeek-R1“破圈”?——互聯(lián)網(wǎng)行業(yè)專題研究要點(diǎn)要點(diǎn)DeepSeek-R1“破圈”拆解:1、業(yè)界領(lǐng)先的強(qiáng)大性能。1)R1在多個(gè)基準(zhǔn)測(cè)試中的表現(xiàn)超越當(dāng)下全球Al行業(yè)領(lǐng)先的推理模型OpenAl-01。2)在開發(fā)人員和使用者中收獲高評(píng)價(jià),在ChatbotArena榜單中居前列,超過OpenAl-01。3)英文日常問答、物理測(cè)試等實(shí)際用戶體驗(yàn)不亞于o1系列。2、多項(xiàng)算法和工程上的實(shí)質(zhì)性突破。首個(gè)驗(yàn)證后訓(xùn)練時(shí)使用強(qiáng)化學(xué)習(xí)讓千億參數(shù)的模型獲得推理能力的研究,切實(shí)解決行業(yè)難題。經(jīng)歷多代模型,R1實(shí)現(xiàn)在GRPO算法、MoE架構(gòu)、MLA機(jī)制、FP8精度、MTP方法等多方位突破。3、全面開源并推出免費(fèi)C端產(chǎn)品。DeepSeekApp成為大部分用戶首次體驗(yàn)的優(yōu)質(zhì)AI推理模型,在幾乎沒有廣告投放情況下7天用戶增長(zhǎng)1億。互聯(lián)網(wǎng)大廠大模型進(jìn)展梳理:1、阿里巴巴:1)旗艦?zāi)P蚎wen2.5-Max:指令模型、基座模型的指標(biāo)對(duì)比中趕超業(yè)界領(lǐng)先模型,代碼編寫等能力、應(yīng)用體驗(yàn)提升。2)實(shí)驗(yàn)性推理模型:數(shù)學(xué)和編程等領(lǐng)域取得進(jìn)步,期待新模型賦能、DeepSeek-R1技術(shù)啟示,正式版帶來突破。3)開源:提供全尺寸開源模型,性能和開發(fā)者參與度均領(lǐng)先。2、騰訊:1)架構(gòu)調(diào)整:TEG聚焦技術(shù)底座,其他事業(yè)群共推產(chǎn)品化,騰訊Al產(chǎn)品25年整體進(jìn)展有望相較24年更積極。元寶并入CSIG或顯示出騰訊Al戰(zhàn)略轉(zhuǎn)變更加重視產(chǎn)品體驗(yàn)。2)多模態(tài)較多進(jìn)展:業(yè)界首個(gè)一站式3D內(nèi)容AI創(chuàng)作平臺(tái)。支持游戲等工作流,幾何結(jié)構(gòu)更精細(xì),紋理色彩更豐富。3、百度:1)文心4.0Turbo24M6發(fā)布,期待25年新版本。2)兩大產(chǎn)品助力全棧服務(wù)解決方案:大模型精調(diào)和應(yīng)用開發(fā)平臺(tái)千帆,提供穩(wěn)定高效算力服務(wù)的百舸。4、快手:文生視頻生成模型可靈始終處于全球業(yè)界領(lǐng)先水平,最新基座版本更新后,帶來顯著畫面表現(xiàn)力提升,并獲專家評(píng)測(cè)榜單好評(píng)。5、美團(tuán):聯(lián)合推出MobileVLMV2模型,有望在移動(dòng)環(huán)境占優(yōu)。6、嗶哩嗶哩:Index自研模型角色扮演等能力不俗。DeepSeek“破圈”后,對(duì)互聯(lián)網(wǎng)大廠有何價(jià)值?1、大模型能力提升:R1帶來的突破有機(jī)會(huì)持續(xù)完善,推出性能更強(qiáng)力的模型。R1的模式有助于激發(fā)現(xiàn)有模型潛力,如對(duì)阿里Qwen2.5等模型進(jìn)行微調(diào)。DeepSeek的成功或有望促使各大互聯(lián)網(wǎng)公司加大對(duì)AI大模型的戰(zhàn)略投入。R1多項(xiàng)創(chuàng)新性技術(shù)突破路徑已開源,其或可被復(fù)刻至各大互聯(lián)網(wǎng)公司旗下AI模型中,帶來模型能力成功證明海內(nèi)外市場(chǎng)對(duì)高性能Al推理的強(qiáng)烈需求。已經(jīng)有多家互聯(lián)網(wǎng)大廠接入DeepSeek,并提供價(jià)格等優(yōu)惠。市場(chǎng)有望感知到并認(rèn)可頭部互聯(lián)網(wǎng)公司云服務(wù)能力和未來增長(zhǎng)空間,有望逐步提升云業(yè)務(wù)估值水平。3、推理模型直接提升AlAgent能力:OpenAI上線AlAgent,騰訊、阿里等互聯(lián)網(wǎng)大廠提供AlAgent服務(wù)。AlAgent仍處于早期,具備一定不可預(yù)測(cè)性,且依賴基座模型表現(xiàn)。4、提升Al賦能廣告能力:廣告作為互聯(lián)網(wǎng)重要的高毛利變現(xiàn)板塊,AI賦能空間理想。有望逐步加深A(yù)I自動(dòng)化廣告的滲透,將大模型更深度地用于分析用戶在大廠生態(tài)上的行為,精準(zhǔn)總結(jié)畫像進(jìn)而優(yōu)化廣告定向投放,促進(jìn)廣告點(diǎn)擊率等指標(biāo)增長(zhǎng),進(jìn)而提升廣告業(yè)務(wù)收入和利潤(rùn)水平的增長(zhǎng)率。投資建議:復(fù)盤DeepSeek-R1在業(yè)界和大眾間的“破圈”,關(guān)注投資主線:1)R1等科技成果催化下中概資產(chǎn)價(jià)值重估。2)技術(shù)進(jìn)展等方面領(lǐng)先的中國(guó)互聯(lián)網(wǎng)傳媒買入(維持)行業(yè)與納斯達(dá)克指數(shù)對(duì)比圖行業(yè)與納斯達(dá)克指數(shù)對(duì)比圖60%40%20%0%-20% 一恒生互聯(lián)網(wǎng)科技業(yè)—恒生指數(shù)資料來源:火山引擎冬季FORCE原動(dòng)力大會(huì)召開,梳理字節(jié)AI全產(chǎn)業(yè)鏈——AIGC行業(yè)跟蹤報(bào)告(四十四)(2024-12-22)掌趣Al游戲創(chuàng)作平臺(tái)前瞻視頻發(fā)布,AI應(yīng)用勤更新激發(fā)市場(chǎng)情緒勢(shì)能——AIGC行業(yè)跟蹤報(bào)告(三十七)(2023-12-07)關(guān)注AIGC+游戲潛在催化:ChinaJoy2023有何亮點(diǎn)?——AIGC行業(yè)跟蹤報(bào)告(十八)(2023-07-27)游戲板塊后續(xù)還有哪些潛在催化劑?——AIGC行業(yè)跟蹤報(bào)告(十六)(2023-7-20)生成式AI管理辦法落地,利于模型及應(yīng)用加速發(fā)展——AIGC行業(yè)跟蹤報(bào)告(十五)(2023-7-13)人工智能大會(huì)多場(chǎng)論壇聚焦游戲,Al結(jié)合游戲進(jìn)一步被市場(chǎng)認(rèn)知——AIGC行業(yè)跟蹤報(bào)告(十四)(2023-07-11)網(wǎng)易《逆水寒》手游初上線表現(xiàn)優(yōu)異,Al技術(shù)研發(fā)和產(chǎn)品迭代不及預(yù)期;技術(shù)研發(fā)和產(chǎn)品迭代不及預(yù)期;Al行業(yè)競(jìng)爭(zhēng)加劇風(fēng)險(xiǎn);商業(yè)化游戲迎關(guān)鍵玩法革新——AIGC行業(yè)跟蹤報(bào)告(土二)(2023-07-03)風(fēng)險(xiǎn)提示:AI互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒1“破圈”拆解:突破性解決業(yè)界難題,全面開源利于傳播 51.1原因1:強(qiáng)大性能領(lǐng)跑全球,評(píng)測(cè)、實(shí)際體驗(yàn)趕超OpenAl推理模型o1 51.2原因2:多項(xiàng)工作實(shí)現(xiàn)算法和工程上的實(shí)質(zhì)性突破,解決困擾行業(yè)的難題 71.3原因3:全面開源并推出免費(fèi)C端產(chǎn)品,使得優(yōu)質(zhì)Al推理體驗(yàn)快速擴(kuò)散 92、互聯(lián)網(wǎng)大廠大模型:持續(xù)迭代參與競(jìng)爭(zhēng),阿里通義性能比肩DeepSeek 2.1阿里巴巴:基座模型、深度推理模型進(jìn)展穩(wěn)居第一梯隊(duì) 2.2騰訊:基座模型采取跟隨戰(zhàn)略穩(wěn)健追趕,組織架構(gòu)調(diào)整聚焦應(yīng)用結(jié)合 2.3百度:文心最早上線經(jīng)多次迭代,期待25年下一代模型能力提升 2.4快手:可靈模型專注文生視頻領(lǐng)域居業(yè)界領(lǐng)先 2.5美團(tuán):MobileVLMV2模型在移動(dòng)設(shè)備環(huán)境具備優(yōu)勢(shì),或仍在推進(jìn)自研模型 2.6嗶哩嗶哩:Index自研模型在角色扮演、長(zhǎng)文本等方面表現(xiàn)不俗 3.1大模型能力:R1是起點(diǎn)不是終點(diǎn),技術(shù)突破有望啟發(fā)大廠改進(jìn)模型 3.2云服務(wù):大廠已廣泛支持DeepSeek模型,模型加速迭代有望提升云需求 23.3AIAgent:優(yōu)質(zhì)推理模型帶來能力提升,大廠AIAgent&行業(yè)應(yīng)用有望滲透 3.4Al+廣告:AIGC重塑營(yíng)銷鏈條,更強(qiáng)的模型效果提升廣告自動(dòng)化能力 敬敬互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒圖目錄圖1:DeepSeek-R1模型在多個(gè)基準(zhǔn)測(cè)試中的表現(xiàn)超越OpenAl-01模型的兩個(gè)版本mini和0912 5圖2:海外AI社區(qū)對(duì)DeepSeek-R1的物理測(cè)試具有高評(píng)價(jià) 7圖3:DeepSeek主力模型持續(xù)迭代性能逐步提升直至接近最優(yōu)模型 8圖4:DeepSeek-R1模型的開發(fā)過程 9 圖6:超級(jí)產(chǎn)品增長(zhǎng)1億用戶所用的時(shí)間(部分) 圖7:Qwen2.5-Max指令模型在基準(zhǔn)測(cè)試中成績(jī)優(yōu)異 圖8:Qwen2.5-Max基座模型在基準(zhǔn)測(cè)試中展現(xiàn)優(yōu)勢(shì) 圖9:Qwen2.5-Max一句話生成代碼及可視化演示 圖10:Qwen2.5-Max一句話生成掃雷小游戲演示 圖11:QwQ-32B-Preview在數(shù)學(xué)和編程等領(lǐng)域基準(zhǔn)集中獲得能力的提升 圖13:DeepSeek采用Qwen開源模型蒸餾多個(gè)小模型 圖14:24M12MAUTOP10綜合類Al原生App 圖15:騰訊會(huì)議Al小助手Pro功能升級(jí) 圖16:混元Hunyuan-Large模型在MATH、HumanEval等測(cè)評(píng)集效果好于Llama3.1-405B及DeepSeek-V2.5 圖17:混元3D支持自主設(shè)計(jì)細(xì)致的3D生成工作流 圖18:混元3D幾何模型生成可視化比較 圖20:千帆三層架構(gòu) 圖21:可靈1.6圖生視頻穩(wěn)定性提升 圖22:可靈1.6圖生視頻人物運(yùn)動(dòng)表演加強(qiáng) 圖23:MobileVLMV2在速度和準(zhǔn)確性上均有提升 圖25:Index-1.9B-Character在角色扮演林黛玉中的表現(xiàn) 圖26:三種ScalingLaw(預(yù)訓(xùn)練、后訓(xùn)練和在線推理)示意 圖27:DeepSeek研究過程中對(duì)Qwen、Llama蒸餾模型與非蒸餾模型的基準(zhǔn)比較 圖28:DeepSeek-R1推理成本和主流模型對(duì)比 圖30:騰訊元器特色功能和分發(fā)渠道 圖31:提出自動(dòng)競(jìng)價(jià)策略示例 圖32:谷歌AI概要廣告 圖33:百度城市名片智能體示例 圖34:騰訊廣告妙思具備文生視頻等全面廣告創(chuàng)意素材生成能力 互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒表目錄1居前列(2025-02-09) 6表2:科技媒體arstechnica對(duì)DeepSeek-R1與OpenAl-01&o1-Pro分別提問并對(duì)答案進(jìn)行評(píng)測(cè) 6表3:DeepSeek通過模型迭代逐步引入多項(xiàng)創(chuàng)新性技術(shù)突破 8表4:騰訊AI大模型主要布局團(tuán)隊(duì) 表5:23M5-24M10百度文心大模型迭代&相關(guān)產(chǎn)品發(fā)布時(shí)間線梳理 評(píng)測(cè)社區(qū)24年12月多模態(tài)模型(文生視頻模型)榜單排行 表7:主要互聯(lián)網(wǎng)大廠提供DeepSeek-R1調(diào)用服務(wù)價(jià)格 敬敬OpenAl推理模型o1的分?jǐn)?shù),僅在考察物理化學(xué)生物的GPQADiamond數(shù)據(jù)集上遜色于圖1:DeepSeek-R1模型在多個(gè)基準(zhǔn)測(cè)試中的表現(xiàn)超越OpenAl-01模型的兩個(gè)版本mini和0912Bio,physics&Bio,physics&GPQADiamondpass@177.3DeepSeek-R179.897.371.5SFT+RLOpenAI-o1-miniOpenAI-o1-0912pass@1pass@153.8ratingLiveCodeBench74.471.0CodeForcesAIME2024MATH-500pass@1Model出更好的一個(gè),平臺(tái)通過眾包利用來自不同用戶群的輸入,截至2025年2月9尚未收集到足夠多的投票次數(shù)(共4193次,前十名的模型中最少),但仍獲得1361分的ArenaElo分?jǐn)?shù),超過OpenAl-o1,僅次于Gemini的兩款模型和最新版的ChatGPT-40。表1:ChatbotArena榜單中DeepSeek-R1居前列(2025-02-09)模型機(jī)構(gòu)Gemini-2.0-Flash-Thinking-Exp-01-21GoogleGemini-2.0-Pro-Exp-02-05GoogleOpenAlDeepSeek-R1DeepSeekGemini-2.0-Flash-001Googleo1-2024-12-17OpenAlQwen2.5-MaxAlibabaDeepSeek-V3DeepSeekGemini-2.0-Flash-Lite-Preview-02-05Google資料來源:ChatbotArena,光大證券研究所英文日常問答、物理測(cè)試等。1)海外科技媒體arstechnica資深編輯對(duì)他大模型的表現(xiàn)。表2:科技媒體arstechnica對(duì)DeepSeek-R1與OpenAl-0序號(hào)提問媒體評(píng)測(cè)獲勝者寫五個(gè)原創(chuàng)的老爸笑話(輕松、無害,還有點(diǎn)「冷」的笑話)。DeepSeek-R2DeepSeek-R3寫一段短文.其中每句話的第一個(gè)字母拼出單詞「CODF1、這段文字應(yīng)顯得白然.不要明顯暴霞這一模式。ChatGPT-01-Pro4如果Magenta這個(gè)城鎮(zhèn)不存在,這種顏色還會(huì)被稱為「品紅」(magenta)嗎?ChatGPT-01-Pro5第10億個(gè)質(zhì)數(shù)是多少?DeepSeek-R6我需要你幫我制定一個(gè)時(shí)間表,基于以下幾點(diǎn):我的飛機(jī)早上6:30起飛、需要在起飛前1小時(shí)到達(dá)機(jī)場(chǎng)、去機(jī)場(chǎng)需要45分鐘、我需要1小時(shí)來穿衣和吃早餐。請(qǐng)一步一步考慮,告訴我應(yīng)該幾點(diǎn)起床,什么時(shí)候出發(fā),這樣才能準(zhǔn)時(shí)趕上6:30的航班。DeepSeek-R7在我的廚房里,有一張桌子,上面放著一個(gè)杯子,杯子里有一個(gè)球。我把杯子移到了臥室的床上,并將杯子倒過來。然后,我再次拿起杯子,移到了主房間?,F(xiàn)在,球在哪里?并列8請(qǐng)?zhí)峁┮粋€(gè)包含10個(gè)自然數(shù)的列表,要求滿足:至少有一個(gè)是質(zhì)數(shù),至少6個(gè)是奇數(shù),至少2個(gè)是2的冪次方,并且這10個(gè)數(shù)的總位數(shù)不少于25位。ChatGPT-01和ChatGPT-01-Pro資料來源:機(jī)器之心,arstechnica,光大證券研究所圖2:海外AI社區(qū)對(duì)DeepSeek-R1的物理測(cè)試具有高XXDeepseek-R1XXSonarHugeWorst?OpenAlo1:Completelymisunderstoodthetask雪Videobelow↓Firstrow=Reasoningmodels,rest=Basemodels.Gemini2.0FlashThinking01-21Claude3.5SonnetOpenAlo1PearAlModelGPT-4o資料來源:機(jī)器之心,X1.2原因2:多項(xiàng)工作實(shí)現(xiàn)算法和工程上的實(shí)質(zhì)性突破,解決困擾行業(yè)的難題源模型DeepSeek-Coder,于2023年11月發(fā)布,當(dāng)時(shí)是業(yè)界領(lǐng)先的代碼大模DeepSeek-V3等多款大模型,不僅提升模型性能,更引入GRPO算法、論和認(rèn)可。表3:DeepSeek通過模型迭代逐步引入多項(xiàng)創(chuàng)新性技術(shù)突破創(chuàng)新性技術(shù)突破發(fā)布時(shí)間簡(jiǎn)介GRPO算法DeepSeekMath群組相對(duì)策略優(yōu)化(GRPO)算法,這是對(duì)經(jīng)典PPO算法的創(chuàng)新改進(jìn),不僅增強(qiáng)了模型的數(shù)學(xué)推理能力,還優(yōu)化了內(nèi)存使用效率DeepSeekMoE架構(gòu)DeepSeek-V2通過細(xì)粒度的專家分割和共享專家隔離,DeepSeekMoE與主流的MoE架構(gòu)相比,實(shí)現(xiàn)了更高的專家專業(yè)化和性能。MLA機(jī)制DeepSeek-V22024年5月創(chuàng)新多頭潛在注意力(MLA)機(jī)制,性能優(yōu)于傳統(tǒng)的MHA,但需要的KV緩存量要少得多FP8精度DeepSeek-V32024年12月在極大規(guī)模模型上驗(yàn)證了FP8訓(xùn)練的有效性,通過支持FP8計(jì)算和存儲(chǔ),實(shí)現(xiàn)加速訓(xùn)練和減少GPU內(nèi)存使用。MTP方法DeepSeek-V32024年12月MTP目標(biāo)使訓(xùn)練信號(hào)更加密集,并可能提高數(shù)據(jù)效率。MTP可以使模型預(yù)先規(guī)劃其表示,以便更好地預(yù)測(cè)后續(xù)的token。資料來源:csdn博客,DeepSeek各模型技術(shù)報(bào)告,光大證券研究所圖3:DeepSeek主力模型持續(xù)迭代性能逐步提升直至接近最優(yōu)模型型的技術(shù)路線。光大證券光大證券互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒DeepSeekDeepSeek-V3(671B)SFTDeepSeek-R1-ZeroTrainwith"coldstart"dataRLwithrule-basedverification(math,code)Llama3&Qwen2.5DeepSeek-R1DeepSeek-R1-Distill-Qwen(1.5B-32B)DeepSeek-R1-Distill-Llama(8B&70B)accuracy&formatrewardsSFT(knowledge)EQ\*jc3\*hps52\o\al(\s\up2(Co),data)資料來源:AheadofAI博客1.3原因3:全面開源并推出免費(fèi)C端產(chǎn)品,使得優(yōu)質(zhì)AI推理體驗(yàn)快速擴(kuò)散DeepSeek采用完全開源策略,降低C端用戶使用門檻,促進(jìn)Al開發(fā)者社區(qū)的協(xié)作生態(tài)。相較于閉源且收費(fèi)較高的OpenAl-o1,1)通過開源并在技術(shù)報(bào)告中詳細(xì)公布技術(shù)進(jìn)展和模型訓(xùn)練思路,DeepSeek吸引大量海內(nèi)外開發(fā)者和研究人員的關(guān)注,使得其作為中國(guó)模型首次受到海外Al科技界全面推崇認(rèn)可。2)免費(fèi)使用的DeepSeekApp成為大部分中國(guó)乃至全球用戶首次體驗(yàn)的優(yōu)質(zhì)Al推理模型,用戶量實(shí)現(xiàn)快速增長(zhǎng)。根據(jù)Questmobile數(shù)據(jù),DeepSeek在25年1月28日的日活躍用戶數(shù)首次超越豆包,隨后在2月1日突破3000萬大關(guān),成為史上最快達(dá)成這一里程碑的應(yīng)用。根據(jù)Al產(chǎn)品榜數(shù)據(jù),25年1月DeepSeek用戶增長(zhǎng)達(dá)1.25億(含網(wǎng)站(Web)、應(yīng)用(App)累加不去重)。其中,80%以上用戶來自1月最后一周,即DeepSeek在幾乎沒有任何廣告投放情況下實(shí)現(xiàn)7天完成1億用戶增長(zhǎng)。互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒AIGCAPP行業(yè)TOP5APP日活躍用戶規(guī)模趨勢(shì)Source:QuestMobiieTRUTH中國(guó)移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)庫2025年2月資料來源:Questmobile圖6:超級(jí)產(chǎn)品增長(zhǎng)1億用戶所用的時(shí)間(部分)增長(zhǎng)1億用戶所用的時(shí)間增長(zhǎng)1億用戶花費(fèi)時(shí)間2個(gè)月9個(gè)月10個(gè)月1年2個(gè)月2年6個(gè)月3年6個(gè)月3年8個(gè)月4年6個(gè)月資料來源:Al產(chǎn)品榜Tiktok拼多多微信InstagramsnapchatfFacebook產(chǎn)品DeepSeekAi產(chǎn)品膀ChatGPT2、互聯(lián)網(wǎng)大廠大模型:持續(xù)迭代參與競(jìng)爭(zhēng),阿里通義性能比肩DeepSeek2.1阿里巴巴:基座模型、深度推理模型進(jìn)展穩(wěn)居第一梯隊(duì)阿里旗下最新旗艦?zāi)P蚎wen2.5-Max在指令模型、基座模型的指標(biāo)對(duì)比中,均已能趕超業(yè)界領(lǐng)先的模型。阿里通義于25年1月發(fā)布最新Qwen2.5-Max模型,其為通義千問系列效果最好的模型。根據(jù)通義千問披露:1)指令模型(即我們平常使用的可以直接對(duì)話的模型)對(duì)比,在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等基準(zhǔn)測(cè)試中,Qwen2.5-Max的表現(xiàn)超越DeepSeek-V3。同時(shí)在MMLU-Pro等其他評(píng)估中也展現(xiàn)出具備競(jìng)爭(zhēng)力的成績(jī)。BBH等多項(xiàng)測(cè)試中均展現(xiàn)出相對(duì)上一代Qwen2.5-72B的大幅提升,以及相對(duì)3)盡管并未進(jìn)一步披露在算法技術(shù)、工程上的具體細(xì)節(jié),但Qwen2.5-Max同樣為超大規(guī)模的MoE模型,使用超過20萬億token的預(yù)訓(xùn)練數(shù)據(jù)及精心設(shè)計(jì)的后訓(xùn)練方案進(jìn)行訓(xùn)練。Qwen2.5-Max和DeepSeek-V3同樣實(shí)現(xiàn)AI業(yè)界對(duì)訓(xùn)練超大規(guī)模MoE模型的突破?;ヂ?lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒200Qwen2.5-MaxArena-Hard一MMLUProLlamo-3.1-405BInstGPQA-DiamondGPT-400806LiveCodeBench(24.0824.11)(202408-311資料來源:通義千問github資料來源:通義千問githubQwen2.5-Max代碼編寫等各項(xiàng)能力、實(shí)際應(yīng)用體驗(yàn)均得到提升,已在QwenChat中上線,整體接入阿里云服務(wù)API。1)Qwen2.5-Max的代碼編寫與理解能力、邏輯能力、多語言能力顯著提升,回復(fù)風(fēng)格面向人類偏好進(jìn)行大幅調(diào)整,模型回復(fù)詳實(shí)程度和格式清晰度明顯改善,內(nèi)容創(chuàng)作、JSON格式遵循、角色扮演能力定向提升。2)Qwen2.5-Max具備聯(lián)網(wǎng)搜索功能,輸出的每句話來源出處都有標(biāo)注,整體運(yùn)行也很絲滑。代碼能力上,Qwen2.5-Max能夠幫助用戶完成各種可視化創(chuàng)作,一句話生成代碼及建模;也有Artifacts功能,一句話能開發(fā)各種小應(yīng)用、小游戲。資料來源:量子位圖10:Qwen2.5-Max一句話生成掃雷小游戲演示資料來源:量子位阿里旗下最新實(shí)驗(yàn)性研究推理模型在數(shù)學(xué)和編程等領(lǐng)域已取得顯著進(jìn)步,期待Qwen2.5-Max新模型賦能、DeepSeek-R1開源后的技版帶來突破。阿里通義于24年11月發(fā)布QwQ-32B-Preview實(shí)驗(yàn)性研究模型,MATH-500(數(shù)學(xué))以及LiveCodeBench(代碼)四個(gè)數(shù)據(jù)集中各有勝負(fù),但整體水平比較接近。而相比GPT-4o、Claude3.5Sonnet和Qwen2.5,具備比較明顯的領(lǐng)先優(yōu)勢(shì)。時(shí)在25年2月發(fā)布的更強(qiáng)大的Qwen2.5-Max則有望成為QwQ-32B訓(xùn)練的基石。圖11:QwQ-32B-Preview在數(shù)學(xué)和編程等領(lǐng)域基準(zhǔn)集中獲得能力的提升2024.08-2024.11阿里通義同樣是模型開源的支持和踐行者,其在開源大模型中性能和開發(fā)者參與模型都在走開源路線。截至2025年2月9Qwen2.5-72B-Instruct居第三位,優(yōu)于Llama-3.3-70B-Instruct。源的671B超大模型不同,Qwen開源模型參數(shù)量覆蓋小到手機(jī)也能運(yùn)行的25年2月10日,全球最大Al開源社區(qū)Huggingface發(fā)布了最新的開源大模型衍生模型。DeepSeek-R1基于Qwen2.5模型(參數(shù)個(gè)數(shù)1.5B到32B)蒸餾多圖12:ChatbotArena開源大模型榜單圖13:DeepSeek采用Qwen開源模型蒸餾多個(gè)小模型DeepSeek-R1MITDeepSeek-V3DeepSeekQwen2.5-72B-InstructQwenXLlama-3.3-70B-Instructpass@1cons@64pass@1pass@1pass@1rating49.980.090.090.641.9DeepSeek-R1-Distill-Qwen-1.5B83.9DeepSeek-R1-Distill-Qwen-83.392.849.1DeepSeek-R1-Distill-Qwen-180.093.9DeepSeek-R1-Distill-Qwen-383.394.3DeepSeek-R1-Distill-Llama-80.089.149.0DeepSeek-R1-Distill-Llama-786.794.52.2騰訊:基座模型采取跟隨戰(zhàn)略穩(wěn)健追趕,組織架構(gòu)1)混元大模型團(tuán)隊(duì),旗下產(chǎn)品包括23年9月正式上線的混元系列大模型,及2)騰訊AILab團(tuán)隊(duì),早在16年4月成立,其基礎(chǔ)研究方向包括計(jì)算機(jī)視覺、語音技術(shù)、自然語言處理和機(jī)器學(xué)習(xí),應(yīng)用探索結(jié)合了騰訊場(chǎng)景與業(yè)務(wù)優(yōu)勢(shì),聚焦于游戲、數(shù)字人、內(nèi)容和社交Al四類。3)騰訊云AI團(tuán)隊(duì),23年6月早于混元發(fā)布行業(yè)大模型,并發(fā)布面向B端客戶和應(yīng)用探索。表4:騰訊Al大模型主要布局團(tuán)隊(duì)騰訊大模型布局團(tuán)隊(duì)歸屬事業(yè)群簡(jiǎn)介混元大模型23年9月上線;截至24年底,相繼開源旗下文生文、文生圖、3D生成大模型和視頻生成大模型。騰訊元寶CSIG24年5月上線;基于混元大模型及搜索引擎驅(qū)動(dòng)的Al智能助手。騰訊元器TEG24年5月上線;混元大模型團(tuán)隊(duì)推出的AI智能體開放平臺(tái)。騰訊AILabTEG16年4月成立;基礎(chǔ)研究方向計(jì)算機(jī)視覺、語音技術(shù)、自然語言處理和機(jī)器學(xué)習(xí),應(yīng)用探索游戲、數(shù)字人、內(nèi)容和社交Al。騰訊云CSIG23年6月發(fā)布行業(yè)大模型,并發(fā)布面向B端客戶的騰訊云MaaS服務(wù)解決方案。微信AlWXG24M1微信公開課PRO分享微信對(duì)話開放平臺(tái),幫助開發(fā)者和商家快速搭建AI對(duì)話機(jī)器人。資料來源:騰訊混元官網(wǎng),騰訊AILab,光子星球,極客公園,光大證券研究所2)元寶App等騰訊Al產(chǎn)品24年整體進(jìn)展相對(duì)保守,后續(xù)或有望在Al產(chǎn)品化較為保守。根據(jù)Questmobile數(shù)據(jù),24年12月騰訊元寶AppMAU211萬,明顯低于字節(jié)豆包App、百度文小言App等。根據(jù)第一財(cái)經(jīng)等媒體報(bào)道,25年1互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒事業(yè)群一起推進(jìn)。騰訊混元已經(jīng)在跟騰訊會(huì)議、輸入法、瀏覽器等結(jié)合,微信、QQ都在推進(jìn)智能體落地了,游戲也要全方位擁抱Al。2024年12月月活躍用戶規(guī)模TOP10綜合類A原生App單位:萬復(fù)合增長(zhǎng)率212%694%4.7%2024年12月月活躍用戶規(guī)模TOP10綜合類A原生App單位:萬復(fù)合增長(zhǎng)率212%694%4.7%0.9%3.1%80.1%27%17.5%4,0002.1012,0003810注:1、月復(fù)合增長(zhǎng)率=(2024年12月活躍用戶規(guī)模/起始月活躍用戶規(guī)模)^(V時(shí)間段-1。以2024年1月作為起始月,針對(duì)特定App,如2024年月未被QM收錄,則按照實(shí)際收錄月份作為起始值,時(shí)間段進(jìn)行相應(yīng)調(diào)整;2、文小言全稱為文小言(原文Source:QestMobleTRUTH中國(guó)移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)庫2024年12月圖15:騰訊會(huì)議Al小助手Pro功能升級(jí)舊版功能舊版功能智能提醒解讀共享的在線文檔回顧所有歷史會(huì)議檢索互聯(lián)網(wǎng)海量信息√提問本場(chǎng)會(huì)議內(nèi)容解讀本地文件基礎(chǔ)大模型方面,騰訊混元最新開源Hunyuan-Large模型,模型效果整體趕超根據(jù)混元披露:1)騰訊混元24年11月發(fā)布的Hunyuan-Large(Hunyuan-MoE-A52B)模型,是當(dāng)時(shí)業(yè)界已經(jīng)開源的基于Transformer的最大MoE模型,擁有389B總參數(shù)和52B激活參數(shù)(對(duì)比DeepSeek-V3總參數(shù)量671B,每個(gè)Token激活的參數(shù)量為37B)。2)中英文NLP任務(wù)、代碼和數(shù)學(xué)等維度取得理想成績(jī),在MMLU、MATH、HumanEval超越Llama3.1-405B及DeepSeek-V2.5,在ARC-C、圖16:混元Hunyuan-Large模型在MATH、HumanEval等測(cè)評(píng)集效果好于LLama3.1LLama3.1HellaSwagARC-CDROPGPQAdiamond46.742.442.4MATHHumanEvalC-EvalCMMLU AlignBenchMT-Bench-IFEvalstrict-prompt-騰訊混元在多模態(tài)方面具有較廣布局和較多進(jìn)展,探索3D生成、文生視頻等領(lǐng)域,為內(nèi)部賦能和行業(yè)進(jìn)步打下基礎(chǔ)。1)25年1月,騰訊開源3D生成大模型2.0升級(jí)版本,上線業(yè)界首個(gè)一站式3D內(nèi)容AI創(chuàng)作平臺(tái)——混元3DAl創(chuàng)作引擎。作為創(chuàng)作者,可以用它輸入文字、圖互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒片一鍵生成高質(zhì)量3D模型,并包含3D功能矩陣、3D編輯、3D生成工作流、創(chuàng)作素材庫等多種功能。作為游戲開發(fā)、動(dòng)畫制作等領(lǐng)域?qū)I(yè)創(chuàng)作者,還支持快速搭建3D生成工作流。圖17:混元3D支持自主設(shè)計(jì)細(xì)致的3D生成工作流◎◎運(yùn)行國(guó)運(yùn)行列表A分享分導(dǎo)入B導(dǎo)出幾何生成CrmetteCneatlen<文生游戲道具工作流_copy10v●滕機(jī)ameAan*1254日文本生城幾同g混元3DAI模型2.0版本再升級(jí),通過幾何、紋理解耦生成,幾何結(jié)構(gòu)更精細(xì),紋理色彩更豐富。幾何模型實(shí)現(xiàn)超高精度白模生成,媲美設(shè)計(jì)師手工建模水平。紋理模型則能對(duì)任意幾何模型生成逼真紋理,支持文本/圖18:混元3D幾何模型生成可視化比較2)24年12月,騰訊宣布旗下混元視頻生成大模型(HunYuan-Video)開源,模型參數(shù)量130億。該模型可供企業(yè)與個(gè)人開發(fā)者免費(fèi)使用,目前已上線騰訊元寶APP。HunYuan-Video在文生視頻多個(gè)方面都具有較高的質(zhì)量,擁有包括超寫實(shí)畫質(zhì)、原生鏡頭切換、高語義一致等特點(diǎn)?;ヂ?lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒2.3百度:文心最早上線經(jīng)多次迭代,期待25年下一代模型能力提升百度自率先發(fā)布國(guó)產(chǎn)大模型文心以來,推出多次大模型迭代及相關(guān)產(chǎn)品發(fā)布,期待25年文心新版本面世。24年6月,百度發(fā)布文心大模型4.0Turbo,大幅強(qiáng)化檢索能力以改善幻覺問題,全網(wǎng)搜索、分析資料、等待大模型回復(fù)的速度得到明顯提升。24年11月,百度集團(tuán)CEO李彥宏稱文心的新版本面世,或在25年年初。百度通過兩大關(guān)鍵產(chǎn)品:大模型精調(diào)和應(yīng)用開發(fā)平臺(tái)的千帆,以及提供穩(wěn)定高效算力服務(wù)的百舸平臺(tái),為企業(yè)提供全棧服務(wù)解決方案。1)百舸:以GPU為核心搭建的異構(gòu)計(jì)算平臺(tái),適合多模態(tài)大模型訓(xùn)練。百舸平臺(tái)支持同一智算集群中混合使用不同廠商芯片,降低算力成本的同時(shí),多芯混合訓(xùn)練任務(wù)的性能損失,控制在了萬卡性能損失5%,已經(jīng)是業(yè)界最高水平。2)千帆:主打低門檻的模型平臺(tái),憑借模型開發(fā)層、模型服務(wù)層和應(yīng)用開發(fā)層三層架構(gòu),滿足多樣化的現(xiàn)實(shí)需求。在模型開發(fā)層,千帆提供全流程工具;在模型服務(wù)層,可直接調(diào)用多模態(tài)能力;在應(yīng)用開發(fā)層,千帆幫助企業(yè)用多模態(tài)能力改造業(yè)務(wù)。圖19:百舸產(chǎn)品架構(gòu)快速部署快速部署開源項(xiàng)目一健描速可視化管理多部潛方案資源池訓(xùn)推部故障白愈系統(tǒng)巡檢網(wǎng)絡(luò)診新合通儲(chǔ)性能優(yōu)化網(wǎng)絡(luò)放好容罐HANG檢測(cè)帶寬時(shí)統(tǒng)計(jì)高性能緩存加速數(shù)鋼湖存儲(chǔ)異構(gòu)芯片昆侖芯/英偉達(dá)/異姆生產(chǎn)級(jí)推理報(bào)務(wù)開源模型快速部器首Gbps卷吐干萬IOPS井行文件系統(tǒng)穩(wěn)定性&容錯(cuò)住務(wù)件穿構(gòu)多芯開容液冷10萬卡RDMA網(wǎng)紹多芯適配圖20:千帆三層架構(gòu)應(yīng)用開發(fā)層流程引攀報(bào)表開發(fā)頁面開發(fā)應(yīng)用分發(fā)模型服務(wù)層百度ERNIE系列大語言模百度視覺系列模型國(guó)內(nèi)外開源楔型|多模態(tài)系列模型模型開發(fā)層表5:23M5-24M10百度文心大模型迭代&相關(guān)產(chǎn)品發(fā)布時(shí)間線梳理時(shí)間迭代&功能備注PaddleOCR2.9大幅提升了文本圖像版面解析能力,充分發(fā)揮文心一言語言理解優(yōu)勢(shì),信息抽取整體效果相比于上一個(gè)版本提升6%,同時(shí)新增7個(gè)實(shí)用的OCR基礎(chǔ)模型。千帆大模型平臺(tái)3.0針對(duì)模型調(diào)用、模型開發(fā)、應(yīng)用開發(fā)三個(gè)方面進(jìn)行優(yōu)化升級(jí),不僅提升了用戶體驗(yàn),還大幅降低了企業(yè)使用大模型的成本。面向萬卡、十萬卡集群全面升級(jí)算力管理能力。通過集群設(shè)計(jì)、任務(wù)調(diào)度、并行策略、顯存優(yōu)化等一系列升級(jí),整體性能相比業(yè)界平均水平提文心快碼2.5飛槳框架3.0向下適配異構(gòu)多芯,向上一體化支撐大模型的訓(xùn)練、推理,同時(shí)具有動(dòng)靜統(tǒng)一自動(dòng)并行、編譯器自動(dòng)優(yōu)化、大模型訓(xùn)推一體、大模型多硬件適配四項(xiàng)能力。文心大模型4.0Turbo在基礎(chǔ)大模型的基礎(chǔ)上,進(jìn)一步創(chuàng)新智能體技術(shù),包括理解、規(guī)劃、反tokens,能夠同時(shí)閱讀100個(gè)文件或網(wǎng)址,Al生圖分辨率提升至ModelBuilder可以根據(jù)開發(fā)者的需求定制任意尺寸的模型,并根據(jù)細(xì)分場(chǎng)景對(duì)模型進(jìn)-步精調(diào)SFT,達(dá)到更好的效果。ModelBuilder預(yù)置了最全面最豐富的大模型,也支持國(guó)內(nèi)外第三方主流模型,是國(guó)內(nèi)擁有大模型數(shù)量最多的開發(fā)平臺(tái)。AppBuilder是目前最好用的Al原生應(yīng)用開發(fā)工具,提前封裝和預(yù)置了開發(fā)AI原生應(yīng)用所需的各種組件和框架,大幅降低開發(fā)門檻。AgentBuilder開發(fā)者和商家可以利用AgentBuilder批量生成,應(yīng)用在各種各樣的場(chǎng)景的智能體。文心大模型4.0工具版可以體驗(yàn)代碼解釋器功能,通過自然語言交互實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)和文件的處理與分析,還可以生成圖表或文件、快速洞察數(shù)據(jù)。Speed、Lite、Tiny輕量級(jí)大模型顯著減少了參數(shù)量,更加便于客戶針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行模型精調(diào)。有助于客戶更容易地實(shí)現(xiàn)預(yù)期的使用效果,也節(jié)約了大量的成本開銷。ERNIECharacter&ERNIEFunctions分別適配角色扮演類應(yīng)用場(chǎng)景(如游戲NPC、客服對(duì)話等)、工具調(diào)用場(chǎng)景(對(duì)話中使用外部工具、調(diào)用業(yè)務(wù)函數(shù)等)。飛槳開源框架2.6版本和大模型重構(gòu)的開發(fā)工具鏈包括面向前后端開發(fā),Al應(yīng)用開發(fā)以及所有開發(fā)者的新工具,打造更智能、高效、低門檻的Al原生應(yīng)用開發(fā)新范式。文心一言專業(yè)版需求的用戶。文心大模型4.0綜合水平與GPT-4相比已經(jīng)毫不遜色。百度GBI具有支持自然語言交互、跨數(shù)據(jù)庫分析和專業(yè)知識(shí)學(xué)習(xí)三方面能力,將商業(yè)分析師十幾天才能完成的數(shù)據(jù)分析工作縮短到分鐘級(jí)?!办`境”插件平臺(tái)實(shí)現(xiàn)全流程自動(dòng)化,大大降低了大模型插件開發(fā)的成本。“千帆大模型”平臺(tái)2.0支持大模型和數(shù)據(jù)集數(shù)量最多、工具鏈最完善、算力效能最佳和企業(yè)級(jí)安全四大亮點(diǎn)。智能助理“云一朵”基于文心大模型,可快搜文件、總結(jié)/創(chuàng)作內(nèi)容?!扒娑妗睜I(yíng)銷平臺(tái)通過多模態(tài)內(nèi)容制作,賦能創(chuàng)意生產(chǎn)力提升,可輕松實(shí)現(xiàn)文案創(chuàng)作、圖片創(chuàng)作和數(shù)字人視頻制作三大創(chuàng)意生產(chǎn)能力。文心大模型3.5實(shí)現(xiàn)了基礎(chǔ)模型升級(jí)、精調(diào)技術(shù)創(chuàng)新、知識(shí)點(diǎn)增強(qiáng)、邏輯推理增強(qiáng)等,新版本在效果、功能、性能全面提升。文心一言首個(gè)可以對(duì)標(biāo)ChatGPT的產(chǎn)品,實(shí)現(xiàn)了中文語言大模型AI生成式產(chǎn)品從無到有的突破。資料來源:百度官方公眾號(hào),百度AI公眾號(hào),同花順財(cái)經(jīng),新浪網(wǎng),騰訊網(wǎng),光大證券研究所整理后,帶來顯著畫面表現(xiàn)力提升,并獲得專家評(píng)測(cè)榜單好評(píng)。1)可靈在上線半年多的時(shí)間保持積極的前沿探索和模型更新,維持全球視頻生成領(lǐng)域領(lǐng)先水平。可靈24年6月正式發(fā)布并上線,作為全球首個(gè)可公開體驗(yàn)的支持標(biāo)準(zhǔn)和高品質(zhì)模式,特別是1.6模型的圖生視頻,內(nèi)部評(píng)測(cè)比1.5模型整強(qiáng)。圖21:可靈1.6圖生視頻穩(wěn)定性提升資料來源:數(shù)字生命卡茲克公眾號(hào),可靈Al圖22:可靈1.6圖生視頻人物運(yùn)動(dòng)表演加強(qiáng)資料來源:數(shù)字生命卡茲克公眾號(hào),可靈Al的文生視頻模型在24年12月的最新測(cè)評(píng)中拿到0.573分,拿到第二名,高于OpenAl的Sora-720p和Sora-1080p,僅略低于Pixverse-V3的0.5732分。具體評(píng)價(jià)上看,與國(guó)內(nèi)頭部大模型(國(guó)內(nèi)前三)相比,Sora在視頻-文本一致性維度、視頻質(zhì)量上均有小幅落后。Sora在運(yùn)動(dòng)質(zhì)量維度表現(xiàn)略好于可靈1.6,即生成的視頻畫面在動(dòng)態(tài)過程中的主體一致性和動(dòng)態(tài)幅度更自然。在視頻-文本一致性維度上,Sora存在文本理解有誤、指令遵循不符的問題,即生成的視頻內(nèi)容與提示詞的描述不符的現(xiàn)象。表6:AGI-Eval評(píng)測(cè)社區(qū)24年12月多模態(tài)模型(文生視頻模型)榜單排行排名模型廠商最新評(píng)測(cè)時(shí)間1愛詩科技閉源2Kling1.5快手閉源3Minimax閉源4閉源5閉源6Kling1.6快手閉源7Pika1.5閉源8生數(shù)科技閉源9閉源閉源智譜清言閉源Dreamina1.2字節(jié)跳動(dòng)閉源閉源開源資料來源:AGI-Eval評(píng)測(cè)社區(qū),光大證券研究所2.5美團(tuán):MobileVLMV2模型在移動(dòng)設(shè)備環(huán)境具備優(yōu)每秒的state-of-the-art性能。Speed(tokens/s)資料來源:ADFeed,MobileVLM互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒美團(tuán)自研大模型仍未公布名稱等細(xì)節(jié),內(nèi)部或仍在推進(jìn)大模型研發(fā)及摸索業(yè)務(wù)結(jié)合方向。23年11月,在國(guó)內(nèi)第二批通過備案的11家公司大模型里包含美團(tuán),但美團(tuán)并未公布其大模型的名稱、定位及應(yīng)用案例等,整體美團(tuán)在大模型的研發(fā)和投入比較隱秘。根據(jù)鈦媒體消息,23年美團(tuán)已在擴(kuò)張算法團(tuán)隊(duì),并啟動(dòng)籌劃單獨(dú)的“平臺(tái)部門”,幫助美團(tuán)大模型通過具體的商業(yè)化形式落地。我們認(rèn)為,美團(tuán)或仍在探索大模型如何更緊密得和自身業(yè)務(wù)相結(jié)合,建議關(guān)注后續(xù)AI對(duì)美團(tuán)內(nèi)部工作提效的應(yīng)用,及對(duì)美團(tuán)更多業(yè)務(wù)場(chǎng)景的滲透。2.6嗶哩嗶哩:Index自研模型在角色扮演、長(zhǎng)文本等方面表現(xiàn)不俗嗶哩嗶哩推出自研Index模型,在對(duì)話交互、角色扮演等方面展現(xiàn)出較為出色的性能。1)Index系列包含聊天、角色扮演等多個(gè)模型,向輕量級(jí)探索的同時(shí),覆蓋方向較為全面。24年6月,嗶哩嗶哩發(fā)布Index系列模型中的輕量版本:Index-1.9B系列,其中包含基座模型:多個(gè)評(píng)測(cè)基準(zhǔn)上與同級(jí)別模型比處于領(lǐng)先;基座模型對(duì)照組;增強(qiáng)聊天趣味性的Index-1.9Bchat;實(shí)現(xiàn)fewshots角色扮演定制的年9月,嗶哩嗶哩開源長(zhǎng)文本處理能力出色的2)嗶哩嗶哩Index-70B模型在角色扮演能力方面具備出色能力,符合嗶哩嗶哩自身潛在應(yīng)用場(chǎng)景。根據(jù)24年11月在中文場(chǎng)景角色扮演評(píng)測(cè)集benchmarkCharacterEval上的測(cè)試,Index-70B角色扮演模型在該benchmark中均分第一,且在知識(shí)幻覺性、對(duì)話流利度、表現(xiàn)多樣性12個(gè)細(xì)分維度中的7項(xiàng)中排名第一,優(yōu)于情感陪伴賽道同類產(chǎn)品。對(duì)于B站來說,角色扮演模型在娛樂、教育、視頻創(chuàng)作等方面都擁有著豐富的應(yīng)用場(chǎng)景。3)嗶哩嗶哩Index模型已經(jīng)應(yīng)用于自身Al字幕等場(chǎng)景,期待后續(xù)模型在對(duì)AI接受度更高的年輕人社區(qū)得到更廣泛的應(yīng)用。24年9月嗶哩嗶哩CEO陳睿表示,B站將自研大語言模型index應(yīng)用于AI字幕,具備中、英、韓、日、泰語等近10種語言的實(shí)時(shí)翻譯能力,準(zhǔn)確度接近90%。能力對(duì)比資料來源:?jiǎn)袅▎袅夹g(shù)IndexIndex-1.9BRolePlayGradioDemor王.在要所中的日子看化風(fēng)光,實(shí)心多有優(yōu)放.您如在這復(fù)家族關(guān)系中保特自己7心模平和林空玉世表無鬼,人心道愿在這雜族關(guān)系中,有保自的內(nèi)心平機(jī)才概好地意對(duì)各種成至于如河-點(diǎn)瓶、最重的要有空定的倍全的自己的造擇益正9,會(huì)密容和理解他人ISuomitclo資料來源:機(jī)器之心SOTA模型公眾號(hào)敬互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒AI應(yīng)用有何價(jià)值?3.1大模型能力:R1是起點(diǎn)不是終點(diǎn),技術(shù)突破有望啟發(fā)大廠改進(jìn)模型DeepSeek-R1只是DeepSeek的第一個(gè)推理模型,其帶來的突破有機(jī)會(huì)在后續(xù)研發(fā)中持續(xù)完善,在近期帶來性能更強(qiáng)力的產(chǎn)品。DeepSeek-R1證明僅用強(qiáng)化學(xué)習(xí)就可以在后訓(xùn)練階段提升模型推理能力,后續(xù)通過在此階段增加算力,有望滿足后訓(xùn)練階段的強(qiáng)化學(xué)習(xí)ScalingLaw(RLScalingLaw),進(jìn)而提升大模型的圖26:三種ScalingLaw(預(yù)訓(xùn)練、后訓(xùn)練和在線推理)示意FROMFROMONEmTHRESCALINGLAWSTEST-TIMESCALING"REASONING"PE資料來源:騰訊網(wǎng),CES2025DeepSeek-R1的研究過程已經(jīng)證明對(duì)阿里Qwen2.5進(jìn)行微調(diào),能夠提升模型DeepSeek-R1-Distill-Qwen-32B模型各評(píng)測(cè)指標(biāo)盡管不如DeepSeek-R1但好于參數(shù)量級(jí)高很多的DeepSeek-R1-Zero,也好于通義千問自己的推理模型QwQ-32B-Preview。蒸餾后的較小模型有較低的運(yùn)行成本,有利于推理模型的圖27:DeepSeek研究過程中對(duì)Qwen、Llama蒸餾模型與非蒸餾模型的基準(zhǔn)pass@1pass@1pass@1rating資料來源:AheadofAI博客累和戰(zhàn)略布局。旗下Al模型中,帶來模型能力的提升。正如2.1節(jié)中所敘述,阿里3.2云服務(wù):大廠已廣泛支持DeepSeek模型,模型加速迭代有望提升云需求無法滿足大量用戶的并發(fā)需求,25年2月6日起DeepSeek已暫停API服務(wù)充2)DeepSeek采用寬泛、自由的MIT開源許可證,其一方面允許商用,使得云廠商可較為便捷地將其上線提供服務(wù),另一方面允許修改調(diào)整模型,開源模型有望在后續(xù)得到快速迭代,進(jìn)而得到可觀的進(jìn)步,為后續(xù)云廠商上線更多優(yōu)質(zhì)開源模型、提供多種模型供用戶選擇提供可能性。表7:主要互聯(lián)網(wǎng)大廠提供DeepSeek-R1調(diào)用服務(wù)價(jià)格日期主要內(nèi)容價(jià)格騰訊云DeepSeek-R1大模型一鍵部署至騰訊云THA」上,開發(fā)者僅需3分鐘就能接入調(diào)用。調(diào)用R1:3.6元/小時(shí);對(duì)應(yīng)算力15+TFlopsSP。阿里云2月3日阿里云PAIModelGallery支持云上一鍵部署DeepSeek-V3、DeepSeek-R1。調(diào)用R1:輸入0.004元/千token;輸出0.016元/千token免費(fèi)額度:100萬Token(有效期:百煉開通后180天內(nèi))。百度云百度智能云千帆平臺(tái)已正式上架DeepSeek-R1和驗(yàn)。調(diào)用R1:輸入2元/百萬token;輸出8元/百萬token;限時(shí)限額免費(fèi)2周(至2月18日24:00)?;鹕揭?月4日火山引擎為通過方舟調(diào)用DeepSeek模型API的企業(yè)提落地。調(diào)用R1:輸入2元/百萬token;輸出8元/百萬token;限時(shí)限額優(yōu)惠2周。資料來源:騰訊云、阿里云、百度智能云、火山引擎,光大證券研究所我們認(rèn)為,各大互聯(lián)網(wǎng)公司:現(xiàn)云服務(wù)收入增長(zhǎng)。具有更便捷的接入方式、更廣泛的客戶群體、更強(qiáng)的技術(shù)穩(wěn)定性的云服務(wù)廠商有望率先受益。3.3AlAgent:優(yōu)質(zhì)推理模型帶來能力提升,大廠AlAgent&行業(yè)應(yīng)用有望滲透互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒Estimatedpriceforprocessingonemillioninput/outputtokensondifferentAlmodels$15$12$9$6AtokenisthesmallestunitofAlmod資料來源:騰訊云,statistaNemotron deepseekNVIDIAamazonOpenAl已上線其AIAgent,騰訊、阿里等互聯(lián)網(wǎng)大廠已提供AIAgent服務(wù)。1)ChatGPT25M1更新新功能“Tasks”,讓Al具備一定執(zhí)行力,可以替用戶完成各種任務(wù),如定時(shí)提醒天氣、總結(jié)&創(chuàng)作文章、創(chuàng)建編程謎題等。2)百度文心智能體平臺(tái)、騰訊元器、訊飛星火智能體創(chuàng)作中心、通義智能體、字節(jié)扣子等面向企業(yè)用戶提供了智能體創(chuàng)建平臺(tái),并開始在其Al智能助手界面中添加AIAlAgent仍處于發(fā)展早期,具備一定不可預(yù)測(cè)性,且依賴基座模型表現(xiàn),DeepSeek-R1有望帶來提升。1)AIAgent工作流程需鏈接多個(gè)Al步驟,用戶難以確保Agent能否始終提供準(zhǔn)確、符合上下文的響應(yīng)。2)AlAgent依賴基座模型需要具備較快的速度和較低的成本,特別是需要進(jìn)行循環(huán)和自動(dòng)重試時(shí)。互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒圖29:騰訊元器創(chuàng)建AlAgent頁面Q搜索智能體健智練口我的創(chuàng)建好一個(gè)人物,我盡量在10步@tipyis7-白495k立國(guó)體驗(yàn)讀心術(shù)大師特你心中所組我足讀心師請(qǐng)?jiān)谛闹雄孪胍粋€(gè)通用實(shí)…莫青成莫青成,配音濱員,網(wǎng)名銷吉每個(gè)空球曰消立出淋驗(yàn)B插件你要什么Logo,小弟我施時(shí)給MBTI性格測(cè)試專家深情版相柳,古裝神活劇《長(zhǎng)虛擬女友我屈帥氣畫良渺明的就長(zhǎng)直荒島求生資料來源:騰訊元器圖30:騰訊元器特色功能和分發(fā)渠道智能體創(chuàng)作與分發(fā)平臺(tái)溫元大模型)特色功能公眾號(hào)生態(tài)優(yōu)勢(shì)·一鍵接入公眾號(hào)內(nèi)容庫·獨(dú)特用戶互動(dòng)權(quán)重分析分發(fā)渠道微信客服Q0智能體第三方應(yīng)用元器vs元寶元器:智能體創(chuàng)作平臺(tái),用于制作和發(fā)布智能體元寶:智能體應(yīng)用平臺(tái),類似豆包的應(yīng)用商店資料來源:騰訊元器元寶公眾號(hào)知識(shí)庫智能管理一站式平臺(tái))表8:AgentOps.ai25年AlAgent圖譜(25年1月)類型應(yīng)用效果上榜個(gè)數(shù)Productivity(生產(chǎn)力)75個(gè)AlAgentsPlatform(AI智能體平臺(tái))74個(gè)AlAgentsFrameworks(AI智能體框架)為創(chuàng)建高效、可擴(kuò)展的Al智能體提供編程工具和庫,包含任務(wù)規(guī)劃、對(duì)話管理和數(shù)據(jù)處理等模塊。Coding(編程)協(xié)助開發(fā)者完成代碼編寫、調(diào)試和優(yōu)化,提升開發(fā)效率,減少人為錯(cuò)誤。38個(gè)VoiceAlAgents(語音Al智能體)借助語音識(shí)別和自然語言處理技術(shù),與用戶進(jìn)行語音交互,廣泛應(yīng)用于智能家居、車載系統(tǒng)和客戶服務(wù)等場(chǎng)景。37個(gè)CustomerService(客戶服務(wù))提供即時(shí)客戶支持、回答常見問題,并通過個(gè)性化推薦提高客戶滿意度。36個(gè)DataAnalysis(數(shù)據(jù)分析)處理海量數(shù)據(jù),快速生成洞察,幫助用戶做出數(shù)據(jù)驅(qū)動(dòng)的決策,應(yīng)用于商業(yè)、科學(xué)和金融等領(lǐng)域。35個(gè)DigitalWorkers(數(shù)字化工作者)專注執(zhí)行重復(fù)性高的任務(wù),如數(shù)據(jù)輸入、文檔整理和流程自動(dòng)化。31個(gè)PersonalAssistant(個(gè)人助理)幫助用戶管理日程、發(fā)送提醒、執(zhí)行簡(jiǎn)單任務(wù),提供個(gè)性化建議,提升個(gè)人日常效率。30個(gè)資料來源:AI信息Gap公眾號(hào),光大證券研究所3.4Al+廣告:AIGC重塑營(yíng)銷鏈條,更強(qiáng)的模型效果提升廣告自動(dòng)化能力海外互聯(lián)網(wǎng)大廠已經(jīng)在廣告主側(cè)(B端)和消費(fèi)者側(cè)(C端)全面重塑營(yíng)銷鏈條,從而提升廣告投放效率和增加廣告創(chuàng)收。過去依賴人工經(jīng)驗(yàn)和傳統(tǒng)計(jì)算的營(yíng)銷決策,正在被具備高度數(shù)據(jù)理性的Al系統(tǒng)所取代。微軟廣告的動(dòng)態(tài)搜索廣告(DSA)系統(tǒng)會(huì)自動(dòng)為每一個(gè)落地頁動(dòng)態(tài)創(chuàng)建廣告,并基于Al驅(qū)動(dòng)自動(dòng)識(shí)別搜索與對(duì)話背后的用戶意圖,從而更高效地和商家廣告精準(zhǔn)匹配,最終達(dá)成獲客成本的下降和投資回報(bào)率的提升。Meta基于AI互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒驅(qū)動(dòng)的自動(dòng)化廣告產(chǎn)品Advantage+已經(jīng)讓Meta的廣告收入實(shí)現(xiàn)連續(xù)的強(qiáng)勁2)C端:在Al生成內(nèi)容中創(chuàng)新性地引入廣告,在廣告組件中的交互中運(yùn)用生成23年谷歌就將廣告引入到對(duì)話型AI產(chǎn)品中,24年更進(jìn)一步,AI生成的搜索結(jié)果概要(Overviews)就成為一個(gè)重要的廣告位置,其圖像識(shí)別工具Lens中推出購物廣告,目標(biāo)是吸引更多電商類客戶投放廣告。AI對(duì)于廣告承載頁的交互方面,用戶在谷歌搜索裝修和家具購買時(shí),谷歌會(huì)允許用戶提交一系列客廳照片,然后智能地向他們推薦適合用戶目標(biāo)房間的相關(guān)家具。圖31:提出自動(dòng)競(jìng)價(jià)策略示例出價(jià)策略②出價(jià)策略②您想如何管理您的出價(jià)?了解更多目標(biāo)CPA(自動(dòng)出價(jià)):設(shè)置目標(biāo)CPA(每次獲取成本)每次獲取成本②我的目標(biāo)CPA是100.00]cNY□我想設(shè)置一個(gè)最高的每次點(diǎn)擊費(fèi)用②資料來源:微軟廣告圖32:谷歌Al概要廣告SponsoredProductstounwrinklRelaxfabricfibersandsmoothawaywrinkleswiththeseproducts.Downyfabricspray,wrinklerele...53.19touch-upspray3...$7.99Wotn資料來源:MorketingGlobal公眾號(hào)國(guó)內(nèi)互聯(lián)網(wǎng)大廠已有Al+廣告投放方面、Al+廣告素材生成方面布局,DeepSeek系列旗艦?zāi)P驮谔嵘阅艿耐瑫r(shí)全面開源,有望助力互聯(lián)網(wǎng)大廠進(jìn)一步增強(qiáng)自動(dòng)化廣告投放能力。1)對(duì)于百度,24年12月百度商業(yè)系統(tǒng)升級(jí)為“百度伴飛”,基于文心大模型,整合多樣化的Al能力,助力實(shí)現(xiàn)高品質(zhì)品牌宣傳,并帶來視頻廣告點(diǎn)擊率、完播率等投放效果提升。2)對(duì)于騰訊,騰訊廣告妙思由騰訊混元大模型提供基底支持,通過其對(duì)語義的精準(zhǔn)理解和表達(dá),生產(chǎn)穩(wěn)定實(shí)用的廣告創(chuàng)意素材,降低廣告優(yōu)化師制作廣告的成本。3)對(duì)于嗶哩嗶哩,25年1月推出首個(gè)商業(yè)化AIGC平臺(tái)“星辰Al”,能夠智能化地生成圖片素材,同時(shí)優(yōu)化廣告創(chuàng)意的迭代過程,有望提高廣告素材的轉(zhuǎn)化互聯(lián)網(wǎng)傳媒互聯(lián)網(wǎng)傳媒圖33:百度城市名片智能體示例資料來源:首席營(yíng)銷官公眾號(hào)圖34:騰訊廣告妙思具備文生視頻等全面廣告創(chuàng)意素材生成能力頁互選二解汽車圖文汽車口播平汽車神圈行業(yè)工具首播工算文生視頻覆級(jí)一銅相實(shí)規(guī)深服三社量生度直播工具AIl直播圖生圖作一生多圖照片數(shù)字人金融口播文生圖資料來源:衛(wèi)夕指北公眾號(hào),騰訊廣告妙思我們認(rèn)為,廣告作為高毛利業(yè)務(wù)板塊,Al賦能空間理想。騰訊等國(guó)內(nèi)互聯(lián)網(wǎng)公司此前在Al+廣告賦能領(lǐng)域相較于海外大廠較慢,部分因模型性能等Al技術(shù)能力相較海外領(lǐng)先水平有一定差距,且應(yīng)用AI賦能廣告的實(shí)踐晚于海外大廠。若借力DeepSeek等高性能模型帶來的模型水平提升,有望伴隨著AI廣告的應(yīng)用實(shí)踐,逐步加深A(yù)l自動(dòng)化廣告的滲透,將大模型更深度地用于分析用戶在自身生態(tài)上的行為,精準(zhǔn)總結(jié)畫像進(jìn)而優(yōu)化廣告定向投放,促進(jìn)廣告點(diǎn)擊率等指標(biāo)增長(zhǎng),進(jìn)而提升廣告業(yè)務(wù)收入和利潤(rùn)水平的增長(zhǎng)率。25年1月騰訊集團(tuán)年會(huì)中,董事會(huì)主席兼CEO馬化騰表示,看好Al未來給廣告帶來的空間。4、投資建議DeepSeek-R1因其趕超OpenAI推理模型o1的強(qiáng)大性能、多項(xiàng)算法和工程上的實(shí)質(zhì)性突破、全面開源并推出便于擴(kuò)散的免費(fèi)C端產(chǎn)品,實(shí)現(xiàn)在業(yè)界和大眾間的“破圈”。我們認(rèn)為,復(fù)盤DeepSeek-R1的成功,建議關(guān)注投資主線:1)DeepSeek-R1作為中國(guó)模型首次受到海外AI科技界全面推崇認(rèn)可。RayDalio《2024年大國(guó)指數(shù)》顯示,科技創(chuàng)新一項(xiàng)中美國(guó)(高于平均1.9標(biāo)準(zhǔn)差)僅略超中國(guó)(1.8),是中美差距最小的項(xiàng)之一。關(guān)注DeepSeek-R1等科技成果催化下的中概資產(chǎn)價(jià)值重估。2)關(guān)注DeepSeek系列之外在技術(shù)進(jìn)展等方面領(lǐng)先的中國(guó)大模型,推薦:阿里巴巴-W:旗下最新旗艦?zāi)P蚎wen2.5-Max已能趕超業(yè)界領(lǐng)先的模型,實(shí)驗(yàn)性研究推理模型QwQ-32B-Preview在數(shù)學(xué)和編程等領(lǐng)域已取得顯著進(jìn)步。騰訊控股:上線業(yè)界混元3DAI創(chuàng)作引擎,組織架構(gòu)調(diào)整后Al戰(zhàn)略更清晰。快手-W:文生視頻生成模型可靈始終處于全球業(yè)界領(lǐng)先水平。百度集團(tuán)-S

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論