AI商業(yè)化的旗手：不止豆包的字節(jié)跳動(dòng)-海通國(guó)際

上傳人：策*** IP屬地：山西上傳時(shí)間：2025-01-03 格式：DOCX 頁(yè)數(shù)：73 大?。?.18MB 積分：19.9 舉報(bào) 版權(quán)申訴

AI商業(yè)化的旗手：不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第2頁(yè)

AI商業(yè)化的旗手：不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第3頁(yè)

AI商業(yè)化的旗手：不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第4頁(yè)

AI商業(yè)化的旗手：不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第5頁(yè)

已閱讀5頁(yè)，還剩68頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

l“更強(qiáng)模型”，是豆包大模型的持續(xù)追求。2023年，豆包大模型（原名：云雀）在字節(jié)跳動(dòng)內(nèi)部完成了上線，在一年的時(shí)間內(nèi)，豆包大模型在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)被大量使用。2024年5月，字節(jié)跳動(dòng)正式發(fā)布豆包大模型家族，此后7個(gè)月時(shí)間，豆包大模型團(tuán)隊(duì)發(fā)布了Doubao-pro、Seed-TTS、Seed-ASR、Seed-Music、視頻生成模型、視覺理解模型等多項(xiàng)重磅成果，在語(yǔ)言能力、多模態(tài)理解與生成、模型推理、代碼生成等方面不斷提升。到2024年12月，豆包大模型通用模型能力已經(jīng)全面對(duì)齊GPT-4o，在FlagEval模型評(píng)測(cè)的“對(duì)話模型”榜單中，豆包-pro32k版本已經(jīng)位列第一。我們認(rèn)為，在短短6個(gè)月的時(shí)間里，豆包大模型不斷升級(jí)迭代，性能持續(xù)提升，已經(jīng)成為字節(jié)AI發(fā)展的重要基石，這背后代表的是字節(jié)孜孜不倦的技術(shù)投入，這些投入不僅推動(dòng)了模型能力的持續(xù)擴(kuò)展，也有效地拓展了豆包大模型的應(yīng)用邊界，此外，豆包大模型團(tuán)隊(duì)對(duì)AI前沿技術(shù)的積極研究，奠定了未來(lái)豆包大模型長(zhǎng)期發(fā)展的基礎(chǔ)，未來(lái)豆包大模型的領(lǐng)先優(yōu)勢(shì)有望持續(xù)擴(kuò)大，“更強(qiáng)模型”也有望不斷實(shí)現(xiàn)。l“更低價(jià)格”與“更易落地”，讓豆包大模型落地千行百業(yè)。2024年5月，豆包大模型剛發(fā)布時(shí)，豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千tokens，0.8厘就能處理1500多個(gè)漢字，比行業(yè)便宜99.3%，大模型價(jià)格，進(jìn)入“厘時(shí)代”。此后，豆包大模型家族維持了“極低”的定價(jià)體系，例如新發(fā)布的豆包·視覺理解的輸入價(jià)格為每千tokens0.003元，比行業(yè)平均價(jià)格降低85%，相當(dāng)于一塊錢可以處理284張720P的圖片，視覺理解模型也正式走進(jìn)厘時(shí)代。此外，豆包還積極開發(fā)各類開發(fā)者工具，助力AI應(yīng)用的落地。例如字節(jié)發(fā)布的新一代AI應(yīng)用開發(fā)平臺(tái)：扣子（Coze目前的扣子1.5已經(jīng)擁有超過100萬(wàn)活躍開發(fā)者，發(fā)布超過200萬(wàn)個(gè)智能體，并提供全新的AI應(yīng)用開發(fā)環(huán)境和更強(qiáng)的多模態(tài)能力。這就使得豆包大模型迅速在各行各業(yè)落地，2024年12月豆包大模型日均tokens調(diào)用量突破4萬(wàn)億，7個(gè)月增長(zhǎng)幅度達(dá)33倍。尤其在汽車、手機(jī)、智能終端等新興行業(yè)，豆包大模型調(diào)用量增長(zhǎng)了50倍以上。我們認(rèn)為，展望未來(lái)，字節(jié)AI的目標(biāo)：“更強(qiáng)模型”、“更低價(jià)格”、“更易落地”正在推動(dòng)字節(jié)AI更加高速的落地千行百業(yè)，AI應(yīng)用爆發(fā)的前夜也正離我們?cè)絹?lái)越近。l不止豆包，字節(jié)AI商業(yè)布局行以致遠(yuǎn)。2023年8月豆包APP正式上線，伴隨時(shí)用榜（APP豆包11月上榜應(yīng)用APPMAU高達(dá)5998萬(wàn)，對(duì)比第二名文小言1299萬(wàn)的數(shù)據(jù)在國(guó)內(nèi)處于斷崖領(lǐng)先的位置。在全球范圍內(nèi)，豆包的11月上榜應(yīng)用APPMAU也能排到第二的位置，僅次于ChatGPT。我們認(rèn)為，豆包的功能全面，并且多端覆蓋，使用門檻又低，日常場(chǎng)景夠用，再疊加字節(jié)強(qiáng)大的廣告投放和流量效應(yīng)，使得豆包獲得了巨大流量。而豆包也遠(yuǎn)不是字節(jié)在AI應(yīng)用唯一的布局，根據(jù)第一財(cái)經(jīng)雜志，字節(jié)目前還在正常運(yùn)營(yíng)的AI應(yīng)用大約20款。在2024年8月a16z評(píng)選的領(lǐng)先的100款生成式AI應(yīng)用榜單中，字節(jié)上榜了6款應(yīng)用。我們認(rèn)為，客觀上，AI技術(shù)逐漸從陡峭進(jìn)入到平緩區(qū)間，AI商業(yè)化落地已經(jīng)成為事實(shí)上AI發(fā)展的下一階段。豆包使得字節(jié)獲得了領(lǐng)先于其他競(jìng)爭(zhēng)對(duì)手的獨(dú)特的AI應(yīng)用成功落地經(jīng)驗(yàn)?？紤]到字節(jié)強(qiáng)大的資本體量和對(duì)AI商業(yè)化的高度重視，字節(jié)目前20余款A(yù)I應(yīng)用也許只是個(gè)開始，字節(jié)已經(jīng)成為了事實(shí)上的中國(guó)AI商業(yè)化旗手，正在AI發(fā)展的道路上行以致遠(yuǎn)。l建議關(guān)注。金山辦公、新致軟件、漢得信息、合合信息、萬(wàn)興科技、虹軟科技、新國(guó)都、當(dāng)虹科技、同花順、福昕軟件、泛微網(wǎng)絡(luò)、致遠(yuǎn)互聯(lián)、三六零、商湯-W、科大訊飛、邁富時(shí)、鼎捷數(shù)智、賽意信息、中國(guó)軟件國(guó)際、?？低暋⒋笕A股份、潤(rùn)澤科技、浪潮信息。l風(fēng)險(xiǎn)提示。AI技術(shù)的發(fā)展不及預(yù)期，AI商業(yè)落地不及預(yù)期，市場(chǎng)競(jìng)爭(zhēng)加劇的風(fēng)2行業(yè)研究·信息服務(wù)行業(yè)21.“更強(qiáng)模型”，是豆包大模型的持續(xù)追求 52.“更低價(jià)格”與“更易落地”，讓豆包大模型落地千行百業(yè) 3.不止豆包，字節(jié)AI商業(yè)布局行以致遠(yuǎn) 4.建議關(guān)注與風(fēng)險(xiǎn)提示 3行業(yè)研究·信息服務(wù)行業(yè)3 圖1豆包大模型正式發(fā)布時(shí)已經(jīng)被廣泛應(yīng)用 5圖2剛發(fā)布時(shí)的豆包大模型家族 6圖32024年6月的FlagEval大模型評(píng)測(cè)能力榜單（客觀評(píng)測(cè)） 7圖4豆包·視頻生成模型支持多種畫面比例/風(fēng)格 8圖52024年9月豆包通用模型pro最新版本性能不斷升級(jí) 9圖6豆包·視覺理解模型內(nèi)容識(shí)別能力優(yōu)秀圖7豆包·視覺理解模型理解推理能力突出圖8豆包·視覺理解模型擁有細(xì)膩的視覺描述能力圖9Doubao-pro綜合能力持平GPT-4o 圖10豆包通用模型pro性能全面升級(jí) 圖11豆包3D模型示例圖12最新的豆包大模型家族圖13Doubao-pro模型位列FlagEval模型評(píng)測(cè)第一圖14火山引擎對(duì)話式AI實(shí)時(shí)交互服務(wù)方案架構(gòu) 圖15豆包·視頻生成模型運(yùn)用的相關(guān)技術(shù) 圖16HybridFlow能有效減少模型參數(shù)在兩個(gè)階段之間的重分片和通信開銷圖18北京大學(xué)-字節(jié)跳動(dòng)“豆包大模型系統(tǒng)軟件聯(lián)合實(shí)驗(yàn)室”簽約儀式圖19豆包大模型維持“極低”價(jià)格水平圖20豆包·視覺理解模型定價(jià)顯著低于行業(yè)水平圖21方舟2.0擁有優(yōu)質(zhì)插件庫(kù) 圖22Prompt優(yōu)解功能介紹圖23火山引擎提供的AI落地方案圖24豆包大模型日均tokens7個(gè)月時(shí)間增速達(dá)33倍圖25火山引擎汽車大模型生態(tài)聯(lián)盟首批聯(lián)盟成員圖26豆包大模型在10-12月各應(yīng)用場(chǎng)景調(diào)用量增長(zhǎng) 圖27豆包APP版示例圖28豆包支持一鍵生成帶有指定文字的圖片圖29豆包電腦網(wǎng)頁(yè)版示例圖30豆包排名2024年11月AI產(chǎn)品榜·國(guó)內(nèi)總榜第一 4行業(yè)研究·信息服務(wù)行業(yè)4圖31豆包能滿足日常生活中的多重需求圖32豆包能滿足教育領(lǐng)域中的多重需求圖33豆包的擬人化形象：可愛女生圖34豆包輸入更方便，所以更“快” 圖35OlaFriend耳機(jī)與豆包App 圖36豆包離用戶更近，所以更“快” 圖37豆包模型能力更強(qiáng)，所以更“快” 圖382024年6月豆包MAU迅速超過競(jìng)爭(zhēng)對(duì)手圖39字節(jié)跳動(dòng)旗下AI應(yīng)用/硬件圖40a16zTop50生成式AIWeb應(yīng)用榜單圖41a16zTop50生成式AI移動(dòng)應(yīng)用榜單 5行業(yè)研究·信息服務(wù)行業(yè)52023年，豆包大模型（原名：云雀）在字節(jié)跳動(dòng)內(nèi)部完成了上線，它也是首批通過大模型服務(wù)安全備案的大模型之一。在一年的時(shí)間內(nèi)，豆包大模型在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)被大量使用，以進(jìn)行AI創(chuàng)新，包括抖音、頭條等數(shù)億DAU產(chǎn)品。2024年5月，在2024春季火山引擎FORCE原動(dòng)力大會(huì)上，字節(jié)跳動(dòng)正式發(fā)布了豆包大模型家族。此時(shí)，豆包大模型已經(jīng)能夠日均處理1200億tokens文本、生成3000萬(wàn)張圖片。在豆包模型發(fā)布時(shí)，字節(jié)對(duì)于AI的目標(biāo)是：更強(qiáng)模型：大使用量才能打磨出更好模型。豆包大模型已經(jīng)在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)、多場(chǎng)景應(yīng)用中落地，經(jīng)過千億級(jí)日tokens的持續(xù)打磨，模型能力和推理效果得到市場(chǎng)的廣泛認(rèn)可。更低價(jià)格：為了讓每一家企業(yè)都能用得起大模型，火山引擎大幅度降低大模型應(yīng)用推理成本。例如本次登榜的豆包通用模型pro，其32k版模型推理輸入價(jià)格僅為0.0008元/千tokens。更易落地：火山引擎2023年發(fā)布了一站式大模型服務(wù)平臺(tái)火山方舟，通過模型即服務(wù)的理念，幫助企業(yè)在高效、安全的環(huán)境里應(yīng)用各類模型。2024年5月，火山引擎對(duì)方舟平臺(tái)進(jìn)行了全面升級(jí)，升級(jí)后的火山方舟2.0將大幅提升模型效果、核心插件、系統(tǒng)性能以及平臺(tái)體驗(yàn)，幫助企業(yè)推進(jìn)大模型的價(jià)值創(chuàng)造。6行業(yè)研究·信息服務(wù)行業(yè)6當(dāng)時(shí)的豆包大模型家族包括：豆包通用模型pro：字節(jié)跳動(dòng)自研LLM模型專業(yè)版，支持128k長(zhǎng)文本，全系列可精調(diào)，具備更強(qiáng)的理解、生成、邏輯等綜合能力，適配問答、總結(jié)、創(chuàng)作、分類等豐豆包通用模型lite：字節(jié)跳動(dòng)自研LLM模型輕量版，對(duì)比專業(yè)版提供更低token成本、更低延遲，為企業(yè)提供靈活經(jīng)濟(jì)的模型選擇；豆包·角色扮演模型：個(gè)性化的角色創(chuàng)作能力，更強(qiáng)的上下文感知和劇情推動(dòng)能力，滿足靈活的角色扮演需求；豆包·語(yǔ)音合成模型：提供自然生動(dòng)的語(yǔ)音合成能力，善于表達(dá)多種情緒，演繹多豆包·聲音復(fù)刻模型：5秒即可實(shí)現(xiàn)聲音1:1克隆，對(duì)音色相似度和自然度進(jìn)行高度還原，支持聲音的跨語(yǔ)種遷移；豆包·語(yǔ)音識(shí)別模型：更高的準(zhǔn)確率及靈敏度，更低的語(yǔ)音識(shí)別延遲，支持多語(yǔ)種的正確識(shí)別；豆包·文生圖模型：更精準(zhǔn)的文字理解能力，圖文匹配更準(zhǔn)確，畫面效果更優(yōu)美，擅長(zhǎng)對(duì)中國(guó)文化元素的創(chuàng)作；豆包·Functioncall模型：提供更加準(zhǔn)確的功能識(shí)別和參數(shù)抽取能力，適合復(fù)雜工具調(diào)用的場(chǎng)景；豆包·向量化模型：聚焦向量檢索的使用場(chǎng)景，為L(zhǎng)LM知識(shí)庫(kù)提供核心理解能力，支持多語(yǔ)言。2024年6月，智源研究院旗下的FlagEval大模型評(píng)測(cè)平臺(tái)發(fā)布最新評(píng)測(cè)榜單。榜單顯示，在閉源大模型的“客觀評(píng)測(cè)”中，豆包大模型（Doubao-Pro-4k）以綜合評(píng)分75.96分排名第二，僅次于GPT-4，是得分最高的國(guó)產(chǎn)大模型。在“主觀評(píng)測(cè)”中，豆包大模型同樣排名第二。7行業(yè)研究·信息服務(wù)行業(yè)7FlagEval大模型評(píng)測(cè)平臺(tái)由智源研究院與多個(gè)高校團(tuán)隊(duì)共建，以人類認(rèn)知能力的發(fā)展階梯為基準(zhǔn)，對(duì)齊大模型所能達(dá)到的認(rèn)知水平。FlagEval構(gòu)建了大量原創(chuàng)的非公開評(píng)測(cè)集，確保評(píng)測(cè)質(zhì)量和公正性。自2023年6月上線以來(lái)，F(xiàn)lagEval已完成了1000多次覆蓋全球大模型的評(píng)測(cè)。評(píng)測(cè)成績(jī)顯示，豆包大模型（Doubao-Pro-4k）的數(shù)學(xué)能力、知識(shí)運(yùn)用、任務(wù)解決等多項(xiàng)能力在客觀評(píng)測(cè)和主觀評(píng)測(cè)中都有著出色表現(xiàn)。其中，知識(shí)運(yùn)用和數(shù)學(xué)能力得分排名客觀評(píng)測(cè)第一、主觀評(píng)測(cè)前三，任務(wù)解決測(cè)試得分在主客觀評(píng)測(cè)中均排名前三。在隨后的日子里，豆包大模型不斷升級(jí)，其家族也不斷壯大。2024年8月，豆包大模型正式支持實(shí)時(shí)語(yǔ)音通話?；鹕揭嫱瞥隽藢?duì)話式AI實(shí)時(shí)交互解決方案，搭載火山方舟大模型服務(wù)平臺(tái)，通過火山引擎RTC實(shí)現(xiàn)語(yǔ)音數(shù)據(jù)的高效采集、處理和傳輸，并深度整合豆包·語(yǔ)音識(shí)別模型和豆包·語(yǔ)音合成模型，簡(jiǎn)化語(yǔ)音到文本和文本到語(yǔ)音的轉(zhuǎn)換過程，提供卓越的智能對(duì)話和自然語(yǔ)言處理能力，幫助應(yīng)用快速實(shí)現(xiàn)用戶和云端大模型的實(shí)時(shí)語(yǔ)音通話。豆包·語(yǔ)音合成模型：解鎖「豆包」同款音色，提供自然生動(dòng)的語(yǔ)音合成能力，善于表達(dá)多種情緒，演繹多種場(chǎng)景。豆包·語(yǔ)音識(shí)別模型：更高的準(zhǔn)確率及靈敏度，更低的語(yǔ)音識(shí)別延遲，支持多語(yǔ)種的正確識(shí)別。火山方舟：提供模型精調(diào)、推理、評(píng)測(cè)等全方位功能與服務(wù)，提供豐富的插件生態(tài)和AI原生應(yīng)用開發(fā)服務(wù)，全方位保障企業(yè)級(jí)AI應(yīng)用落地。2024年9月，豆包·視頻生成模型正式上線。2024年9月24日，2024火山引擎AI創(chuàng)新巡展在深圳舉辦，豆包大模型家族迎來(lái)新成員：豆包·視頻生成模型。豆包·視頻生成模型能遵從復(fù)雜prompt，解鎖時(shí)序性多拍動(dòng)作指令與多個(gè)主體間的交互能力。還可以讓視頻在主體的大動(dòng)態(tài)與鏡頭中炫酷切換，擁有變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語(yǔ)言能力，靈活控制視角，帶來(lái)真實(shí)世界的體驗(yàn)。8行業(yè)研究·信息服務(wù)行業(yè)8此外，豆包·視頻生成模型成功攻克多鏡頭切換時(shí)一致性的技術(shù)挑戰(zhàn)，在一個(gè)prompt內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換，同時(shí)保持主體、風(fēng)格、氛圍的一致性。豆包·視頻生成模型還支持包括黑白、3D動(dòng)畫、2D動(dòng)畫、國(guó)畫等多種風(fēng)格，包含1:1、3:4、4:3、16:9、9:16、21:9六個(gè)比例，適配于各種終端，以及電影、手機(jī)豎屏等不同畫幅。在2024年9月的火山引擎AI創(chuàng)新巡展上，豆包·音樂模型、豆包·同聲傳譯模型同期豆包·音樂模型能夠讓用戶“實(shí)現(xiàn)高品質(zhì)的音樂創(chuàng)作自由”：（1）歌詞更精準(zhǔn)，僅需幾個(gè)字，就能生成情感表達(dá)精準(zhǔn)的歌詞。（2）旋律更多樣，提供10余種不同的音樂風(fēng)格和情緒表達(dá)。（3）演唱更真實(shí)，基于豆包語(yǔ)音能力，媲美真人演唱效果。（4）創(chuàng)作門檻低，支持圖片成曲、靈感成曲、寫詞成曲多種創(chuàng)作方式。豆包·同聲傳譯模型則讓跨語(yǔ)言溝通“更無(wú)障礙”。（1）實(shí)時(shí)翻譯：超低延時(shí)，邊說(shuō)邊譯，實(shí)時(shí)翻譯溝通無(wú)障礙。（2）精準(zhǔn)自然：翻譯流暢自然、準(zhǔn)確率高，在辦公、法律、教育等場(chǎng)景接近甚至超越人類同傳水平。（3）支持音色克隆：支持跨語(yǔ)言同音色翻譯，以更強(qiáng)聲音表現(xiàn)力打破溝通壁壘。此外，創(chuàng)新巡展上，豆包大模型團(tuán)隊(duì)宣布豆包通用模型pro和文生圖模型、語(yǔ)音合成模型等垂類模型大幅升級(jí)。不斷增加的各類模態(tài)以及規(guī)?；恼{(diào)用量讓豆包大模型“更強(qiáng)模型、更低價(jià)格、更易落地”的優(yōu)勢(shì)持續(xù)凸顯。其中，主力模型“豆包通用模型pro”最新版本在各維度上國(guó)內(nèi)領(lǐng)先，模型效果持續(xù)增強(qiáng)。9行業(yè)研究·信息服務(wù)行業(yè)92024年12月，豆包視覺理解模型正式發(fā)布，通用模型能力全面對(duì)齊GPT-4o。2024年12月18日，在火山引擎Force原動(dòng)力大會(huì)上，豆包大模型家族公布新成員“豆包·視覺理解模型”。它不僅具備強(qiáng)大的視覺感知能力，還能融合視覺與語(yǔ)言輸入，進(jìn)行綜合的深度思考和創(chuàng)作。根據(jù)圖像信息，豆包·視覺理解模型可以完成諸多復(fù)雜的邏輯計(jì)算任務(wù)，包括解微積分題、分析論文圖表、診斷真實(shí)代碼問題等挑戰(zhàn)性任務(wù)。通過豆包·視覺理解模型，用戶可以同時(shí)輸入文本和圖像相關(guān)的問題，模型經(jīng)綜合理解，可給出準(zhǔn)確的回答。這將極大地簡(jiǎn)化開發(fā)流程，解鎖更多的大模型價(jià)值場(chǎng)景。豆包·視覺理解模型提供三大能力：●更強(qiáng)的內(nèi)容識(shí)別能力豆包·視覺理解模型有非常強(qiáng)的內(nèi)容識(shí)別能力，不僅可以識(shí)別出圖像中的物體類別、形狀、紋理等基本要素，還能理解物體之間的關(guān)系、空間布局以及場(chǎng)景的整體含義，甚至背后的文化知識(shí)。具體來(lái)說(shuō)，視覺理解模型不僅可以識(shí)別現(xiàn)實(shí)中的物品，還能根據(jù)光影、輪廓、位置等特征，一眼識(shí)別出小動(dòng)物的影子，并“認(rèn)出”這是一只貓。行業(yè)研究·信息服務(wù)行業(yè)10●更強(qiáng)的理解推理能力豆包·視覺理解模型也具備出色的理解和推理能力。模型不僅能識(shí)別圖文信息，還能進(jìn)行復(fù)雜的邏輯計(jì)算。拍下一道需要進(jìn)行微積分運(yùn)算的數(shù)學(xué)題，豆包·視覺理解模型能很好地理解圖片問題，并根據(jù)提示詞進(jìn)行對(duì)應(yīng)的推理計(jì)算，給出答題思路?！窀?xì)膩的視覺描述能力除卻識(shí)別與理解推理能力，豆包·視覺理解模型還有著非常細(xì)膩的視覺描述和創(chuàng)作能力。當(dāng)用戶想設(shè)計(jì)一款文創(chuàng)產(chǎn)品贈(zèng)送客戶，模型可基于產(chǎn)品的造型或寓意寫一段真摯走心的祝福語(yǔ)。行業(yè)研究·信息服務(wù)行業(yè)除發(fā)布視覺理解模型之外，2024年12月的火山引擎Force原動(dòng)力大會(huì)現(xiàn)場(chǎng)還官宣了豆包語(yǔ)言大模型的升級(jí)。相比2024年5月版本，豆包最強(qiáng)模型Doubao-pro能力大幅提升。面向MMLU_pro評(píng)測(cè)集，模型綜合能力提升32%，和GPT-4o持平，使用價(jià)格僅為GPT-4o的八分之一。Doubao-pro指令遵循能力提升9%，代碼能力提升58%，GPQA專業(yè)知識(shí)方面能力提升54%，數(shù)學(xué)能力提升43%，推理能力提升13%，全面對(duì)齊GPT-4o水平。行業(yè)研究·信息服務(wù)行業(yè)12豆包音樂模型和文生圖模型也在火山引擎Force原動(dòng)力大會(huì)現(xiàn)場(chǎng)發(fā)布了升級(jí)。豆包·音樂模型，首次發(fā)布于2024年9月，時(shí)隔3個(gè)月后，已能支持3分鐘的完整音樂作品生成，實(shí)現(xiàn)包括前奏、主歌、副歌、間奏、過渡段等復(fù)雜結(jié)構(gòu)的作品創(chuàng)作。此外，全新版本模型可合理運(yùn)用旋律、節(jié)奏、和聲等信息，使全曲保持在風(fēng)格、情感等音樂元素上的連貫性。如對(duì)生成歌詞不滿意，還可進(jìn)行局部修改，給原調(diào)賦新詞，讓音樂創(chuàng)作更自由靈活。文生圖模型則新增“一鍵P圖，一鍵海報(bào)”技能?；诙拱竽Ｐ蛨F(tuán)隊(duì)成果SeedEdit，豆包文生圖模型2.1版支持通過自然語(yǔ)言對(duì)圖像進(jìn)行“一鍵P圖”，包括換裝、美化、涂抹、風(fēng)格轉(zhuǎn)化等任意編輯指令。同時(shí)，豆包文生圖模型還支持“一鍵海報(bào)”，可實(shí)現(xiàn)精準(zhǔn)控制的文字圖案生成。通過打通LLM和DiT構(gòu)架，豆包文生圖模型構(gòu)建了高質(zhì)量文字渲染能力，可大幅提升文字生成準(zhǔn)確率。這種原生的文字渲染能力，讓文字與整體畫面的融合更為自然和實(shí)用。此外，面向3D仿真領(lǐng)域，豆包大模型家族還新發(fā)布了3D生成模型，該模型采用3D-DiT架構(gòu)，可生成高質(zhì)量3D模塊。該模型與火山引擎數(shù)字孿生平臺(tái)veOmniverse結(jié)合使用，可以高效完成智能訓(xùn)練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作，成為一套支持AIGC創(chuàng)作的物理世界仿真模擬器。舉例來(lái)說(shuō)，用戶只需輸入文本，即可實(shí)時(shí)生成并搭建起一個(gè)工廠車間場(chǎng)景。通過快速批量生成并上傳至云空間，布局師可實(shí)時(shí)調(diào)用并完成場(chǎng)景設(shè)計(jì)，提升創(chuàng)作效率和協(xié)作體驗(yàn)。行業(yè)研究·信息服務(wù)行業(yè)13自2024年5月豆包大模型家族正式發(fā)布，到12月冬季原動(dòng)力大會(huì)，短短7個(gè)月時(shí)SeedEdit、視頻生成模型、視覺理解模型等多項(xiàng)重磅成果，在語(yǔ)言能力、多模態(tài)理解與生成、模型推理、代碼生成等方面不斷提升。我們上文提到的FlagEval模型評(píng)測(cè)，截至2024年12月21日的最新結(jié)果，在大語(yǔ)言模型總榜的“對(duì)話模型”榜單，豆包-pro32k版本已經(jīng)位列第一。行業(yè)研究·信息服務(wù)行業(yè)14而且，豆包大模型的潛力還不僅僅如此，字節(jié)跳動(dòng)的AI團(tuán)隊(duì)一直在積極研究各類AI前沿技術(shù)，這也是豆包大模型能力的基石。舉例來(lái)講，在語(yǔ)音領(lǐng)域，字節(jié)AI團(tuán)隊(duì)判斷相比于WebSocket，為了提供更流暢自然的用戶體驗(yàn)，適應(yīng)大模型向多模態(tài)方向的快速發(fā)展，AI實(shí)時(shí)語(yǔ)音方案采用實(shí)時(shí)通信（RTC）技術(shù)更為合適。于是團(tuán)隊(duì)深耕RTC技術(shù)，火山引擎的RTC基于成熟的音頻3A處理技術(shù)，針對(duì)“雙講”通過傳統(tǒng)回聲消除算法和深度學(xué)習(xí)算法的結(jié)合，不僅有效去除回聲，還能避免用戶語(yǔ)音被過度處理，確保云端語(yǔ)音識(shí)別（ASR）能準(zhǔn)確捕捉和識(shí)別用戶的語(yǔ)音信息。此外，火山引擎RTC通過簡(jiǎn)化算法提高處理速度，避免因算法復(fù)雜性帶來(lái)的額外延時(shí)。簡(jiǎn)單來(lái)說(shuō)，這就使得用戶與AI的交流能夠像和朋友一樣自然，隨時(shí)打斷甚至直接插話。正是通過這一技術(shù)，豆包大模型在2024年8月宣布支持實(shí)時(shí)語(yǔ)音通話。又比如，火山引擎就曾經(jīng)官方表示：“豆包·視頻生成模型生成強(qiáng)大畫面效果的背后，是字節(jié)跳動(dòng)在視頻大模型技術(shù)研發(fā)的不斷投入?！毙袠I(yè)研究·信息服務(wù)行業(yè)15而豆包大模型團(tuán)隊(duì)的AI前沿技術(shù)研究從未止步，僅僅在2024年11月，豆包大模型團(tuán)隊(duì)就發(fā)布了多項(xiàng)技術(shù)進(jìn)展。2024年11月1日，豆包大模型團(tuán)隊(duì)宣布與香港大學(xué)聯(lián)合提出HybridFlow（開源項(xiàng)目名：veRL），一個(gè)靈活且高效的RL（強(qiáng)化學(xué)習(xí)）/RLHF（人類反饋強(qiáng)化學(xué)習(xí)）框架。該框架采用混合編程模型，融合單控制器（Single-Controller）的靈活性和多控制器（Multi-Controller）的高效性，可更好實(shí)現(xiàn)和執(zhí)行多種RL算法，顯著提升訓(xùn)練吞吐量，降低開發(fā)和維護(hù)復(fù)雜度。實(shí)驗(yàn)結(jié)果表明，HybridFlow在運(yùn)行各種RL(HF)算法時(shí)，吞吐量相較SOTA基線提升了1.5-20倍。2024年11月20日，豆包大模型團(tuán)隊(duì)宣布提出SuperClass，一個(gè)簡(jiǎn)單且高效的預(yù)訓(xùn)練方法。該方法首次舍棄文本編碼器，直接使用原始文本的分詞作為多分類標(biāo)簽，無(wú)需額外的文本過濾或篩選，比CLIP（可謂AI大模型中的“眼睛”。該模型通過將圖像與文本對(duì)齊，實(shí)現(xiàn)了圖像與語(yǔ)言之間的理解與關(guān)聯(lián)。近些年來(lái)，CLIP被廣泛應(yīng)用于視覺理解、圖像問答、機(jī)器人/具身智能等多個(gè)領(lǐng)域）具有更高的訓(xùn)練效率。行業(yè)研究·信息服務(wù)行業(yè)162024年11月22日，豆包大模型團(tuán)隊(duì)宣布與北京大學(xué)聯(lián)合提出FAN:FourierAnalysisNetworks，一種新型神經(jīng)網(wǎng)絡(luò)架構(gòu)，彌補(bǔ)了Transformer缺陷。FAN通過引入傅里葉原理，將周期性信息顯式嵌入到網(wǎng)絡(luò)結(jié)構(gòu)中，使模型更自然地捕捉和理解數(shù)據(jù)中的周期性特征，并且可用更少參數(shù)量和FLOPs無(wú)縫替換傳統(tǒng)MLP層。實(shí)驗(yàn)表明，F(xiàn)AN不僅在周期性建模上表現(xiàn)顯著優(yōu)于現(xiàn)有模型，而且在符號(hào)公式表示、時(shí)間序列預(yù)測(cè)、語(yǔ)言建模、圖像識(shí)別等實(shí)際任務(wù)中，同樣表現(xiàn)超過了Transformer等主流模型，尤其在域外測(cè)試數(shù)據(jù)上，表現(xiàn)出色。團(tuán)隊(duì)認(rèn)為，F(xiàn)AN提供了一種全新范式，可有效地對(duì)周期性建模，無(wú)縫替換傳統(tǒng)MLP，同時(shí)減少參數(shù)量和計(jì)算量，填補(bǔ)了當(dāng)前基礎(chǔ)模型在周期性建模方面缺陷，并展示出廣泛應(yīng)用潛力。2024年12月12日，字節(jié)跳動(dòng)更是聯(lián)合北京大學(xué)共同成立了北京大學(xué)-字節(jié)跳動(dòng)“豆包大模型系統(tǒng)軟件聯(lián)合實(shí)驗(yàn)室”，這一實(shí)驗(yàn)室將立足北京大學(xué)計(jì)算機(jī)學(xué)院在系統(tǒng)軟件領(lǐng)域的研究積累，依托字節(jié)跳動(dòng)在大模型應(yīng)用和系統(tǒng)方面的實(shí)踐優(yōu)勢(shì)，聚焦人工智能大模型系統(tǒng)軟件研發(fā)。團(tuán)隊(duì)多名成員曾在SIGCOMM、NSDI等國(guó)際頂級(jí)會(huì)議發(fā)表成果，在訓(xùn)練和推理系統(tǒng)方面，有過豐富的大規(guī)模生產(chǎn)環(huán)境成功部署經(jīng)驗(yàn)，為團(tuán)隊(duì)技術(shù)創(chuàng)新奠定了堅(jiān)實(shí)基礎(chǔ)。行業(yè)研究·信息服務(wù)行業(yè)17正如我們上文所提到的，豆包大模型團(tuán)隊(duì)一直在積極研究各類AI前沿技術(shù)，這也是豆包大模型能力的基石，部分技術(shù)雖然還未落地，但是可以預(yù)期的前景十分廣闊。以HybridFlow為例，從ChatGPT到o1等各種大語(yǔ)言模型，強(qiáng)化學(xué)習(xí)（RL）算法在提升模型性能和適應(yīng)性方面起著至關(guān)重要的作用。在大模型后訓(xùn)練（Post-Training）階段引入RL方法，已成為提升模型質(zhì)量和對(duì)齊人類偏好的重要手段。我們認(rèn)為，HybridFlow作為一個(gè)靈活且高效的RL/RLHF框架，在可以預(yù)期的未來(lái)，能夠?yàn)樽止?jié)的模型訓(xùn)練帶來(lái)重要助力。我們認(rèn)為，在短短6個(gè)月的時(shí)間里，豆包大模型不斷升級(jí)迭代，性能持續(xù)提升，已經(jīng)成為字節(jié)AI發(fā)展的重要基石，豆包大模型從FlagEval模型評(píng)測(cè)的“第二”邁向“第一”，這背后代表的是字節(jié)孜孜不倦的技術(shù)投入，這些投入不僅推動(dòng)了模型能力的持續(xù)擴(kuò)展，也有效地拓展了豆包大模型的應(yīng)用邊界，客觀上加速推動(dòng)了AI大模型應(yīng)用的普及與落地，此外，豆包大模型團(tuán)隊(duì)對(duì)AI前沿技術(shù)的積極研究，更加奠定了未來(lái)豆包大模型長(zhǎng)期發(fā)展的基礎(chǔ)，未來(lái)豆包大模型的領(lǐng)先優(yōu)勢(shì)有望持續(xù)擴(kuò)大，“更強(qiáng)模型”也有望不斷實(shí)現(xiàn)。行業(yè)研究·信息服務(wù)行業(yè)18上文我們提到了字節(jié)對(duì)于AI發(fā)展的目標(biāo)：更強(qiáng)模型：大使用量才能打磨出更好模型。豆包大模型目前已經(jīng)在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)、多場(chǎng)景應(yīng)用中落地，經(jīng)過千億級(jí)日tokens的持續(xù)打磨，模型能力和推理效果得到市場(chǎng)的廣泛認(rèn)可。更低價(jià)格：為了讓每一家企業(yè)都能用得起大模型，火山引擎大幅度降低大模型應(yīng)用推理成本。例如本次登榜的豆包通用模型pro，其32k版模型推理輸入價(jià)格僅為0.0008元/千tokens。更易落地：火山引擎2023年發(fā)布了一站式大模型服務(wù)平臺(tái)火山方舟，通過模型即服務(wù)的理念，幫助企業(yè)在高效、安全的環(huán)境里應(yīng)用各類模型。2024年5月，火山引擎對(duì)方舟平臺(tái)進(jìn)行了全面升級(jí)，升級(jí)后的火山方舟2.0將大幅提升模型效果、核心插件、系統(tǒng)性能以及平臺(tái)體驗(yàn)，幫助企業(yè)推進(jìn)大模型的價(jià)值創(chuàng)造。其中，更低價(jià)格和更易落地，都是為了AI應(yīng)用的落地和發(fā)展。2024年5月，豆包大模型剛發(fā)布的時(shí)候，豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千tokens，0.8厘就能處理1500多個(gè)漢字，比行業(yè)便宜99.3%。以豆包通用模型pro-32k版為例，模型推理輸入價(jià)格僅為0.0008元/千tokens。而市面上同規(guī)格模型的定價(jià)一般為0.12元/千tokens，是豆包模型價(jià)格的150倍。大模型價(jià)格，進(jìn)入“厘時(shí)代”。此后，豆包大模型家族維持了“極低”的定價(jià)體系，例如新發(fā)布的豆包·視覺理解的輸入價(jià)格為每千tokens0.003元，比行業(yè)平均價(jià)格降低85%，相當(dāng)于一塊錢可以處理284張720P的圖片，視覺理解模型也正式走進(jìn)厘時(shí)代。行業(yè)研究·信息服務(wù)行業(yè)19我們認(rèn)為，“極低”的定價(jià)能夠助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新，讓企業(yè)在同等甚至稍差的技術(shù)水平下更愿意去使用豆包模型，這也帶動(dòng)了豆包各類應(yīng)用的廣泛落此外，豆包還積極開發(fā)各類開發(fā)者工具，助力AI應(yīng)用的落地。2023年，火山引擎發(fā)布了一站式大模型服務(wù)平臺(tái)火山方舟，希望通過模型即服務(wù)的理念，幫助企業(yè)在高效、安全的環(huán)境里應(yīng)用各類模型。2024年5月，豆包大模型首次發(fā)布時(shí)，火山引擎對(duì)方舟平臺(tái)進(jìn)行了全面升級(jí)，升級(jí)后的火山方舟2.0將大幅提升模型效果、核心插件、系統(tǒng)性能以及平臺(tái)體驗(yàn)，幫助企業(yè)推進(jìn)大模型的價(jià)值創(chuàng)造。在插件和工具鏈上，方舟2.0升級(jí)了聯(lián)網(wǎng)插件，提供頭條抖音同款搜索能力，實(shí)時(shí)連接海量?jī)?yōu)質(zhì)數(shù)據(jù)，同時(shí)使用文本、圖像、語(yǔ)音等多模態(tài)交互方式，并通過業(yè)內(nèi)領(lǐng)先的意圖識(shí)別能力，大幅提升模型的信息獲取能力；升級(jí)內(nèi)容插件，提供頭條抖音同源海量?jī)?nèi)容，支持多模態(tài)交互，提供基于意圖的垂類內(nèi)容信息檢索，內(nèi)容時(shí)效檢索更強(qiáng)，幫助大模型深入理解、檢索和生成內(nèi)容；升級(jí)知識(shí)庫(kù)插件，提供毫秒級(jí)百億規(guī)模的高性能檢索，秒級(jí)流式知識(shí)庫(kù)索引更新，內(nèi)嵌豆包向量化模型，提高搜索的相關(guān)性和準(zhǔn)確性。行業(yè)研究·信息服務(wù)行業(yè)20除以上核心插件升級(jí)之外，火山方舟2.0也全面升級(jí)了系統(tǒng)承載能力、安全防護(hù)能力和算法服務(wù)能力。在系統(tǒng)承載力上，提供充沛的GPU算力資源，分鐘級(jí)千卡擴(kuò)縮容的超強(qiáng)彈性，保障業(yè)務(wù)穩(wěn)定和成本可控；在安全防護(hù)上，通過安全沙箱構(gòu)建可信的執(zhí)行環(huán)境，多維度的安全架構(gòu)，保障數(shù)據(jù)安全；此外，火山引擎提供專業(yè)的算法團(tuán)隊(duì)服務(wù)，幫助客戶釋放獨(dú)有數(shù)據(jù)價(jià)值，讓企業(yè)大模型應(yīng)用輕松落地。此外，火山引擎還正式發(fā)布了扣子專業(yè)版。扣子（Coze）作為字節(jié)跳動(dòng)推出的新一代AI應(yīng)用開發(fā)平臺(tái)，具備低門檻、個(gè)性化、實(shí)時(shí)性、多模態(tài)等優(yōu)勢(shì)，并集合海量的AI資源、豐富的發(fā)布渠道、一鍵自定義API服務(wù)，幫助填補(bǔ)大模型到用戶場(chǎng)景的最后一公火山引擎正式發(fā)布了扣子專業(yè)版。扣子專業(yè)版在扣子可視化靈活編排智能體的能力基礎(chǔ)上，進(jìn)一步提供企業(yè)級(jí)SLA和多種高級(jí)特性，使AI應(yīng)用更易落地，讓企業(yè)更專注于通過智能體創(chuàng)新，驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)。2024年7月，火山方舟進(jìn)一步升級(jí)了核心插件和智能體能力，以及全周期數(shù)據(jù)安全可信方案，其中，頭條抖音同款三大插件——聯(lián)網(wǎng)插件、內(nèi)容插件和RAG知識(shí)庫(kù)插件能力再次升級(jí)，還新增了網(wǎng)頁(yè)解析插件和計(jì)算器插件，進(jìn)一步擴(kuò)寬模型能力的邊界，支持企業(yè)多樣的應(yīng)用需求。智能體是大模型落地有效路徑。為幫助企業(yè)“低門檻”開發(fā)智能體，火山引擎提供扣子專業(yè)版，支持低代碼構(gòu)建契合企業(yè)業(yè)務(wù)場(chǎng)景的專家型“AIBot”，并通過專業(yè)級(jí)SLA和多種高級(jí)特性保障AI應(yīng)用在企業(yè)中高效落地。火山引擎還打造了HiAgent企業(yè)專屬AI應(yīng)用創(chuàng)新平臺(tái)，幫助企業(yè)打通擁抱大模型的最后一公里。HiAgent能夠從速度、密度、厚度三個(gè)維度全方位賦能企業(yè)AI應(yīng)用的快速落地與持續(xù)優(yōu)化：速度：HiAgent將模型應(yīng)用開發(fā)方式從代碼進(jìn)化到自然語(yǔ)言，業(yè)務(wù)人員可以利用提示詞、知識(shí)庫(kù)、插件等工具，像搭積木一樣低代碼搭建智能體，提升應(yīng)用創(chuàng)新的“速度”。行業(yè)研究·信息服務(wù)行業(yè)密度：增強(qiáng)的企業(yè)級(jí)知識(shí)庫(kù)RAG，讓知識(shí)沉淀萃取成智慧，在企業(yè)流程中體現(xiàn)知識(shí)的“密度”。厚度：HiAgent豐富的專屬企業(yè)級(jí)特性，允許企業(yè)自定義新AI中臺(tái)，并支持混合部署，積累AI資產(chǎn)，讓AI能力有“厚度”。此外，火山引擎AI全棧云依托字節(jié)跳動(dòng)的海量資源共池，支持多芯、多云架構(gòu)，擁有超大規(guī)模算力，支持萬(wàn)卡集群組網(wǎng)、萬(wàn)億參數(shù)MoE大模型；提供超高性能網(wǎng)絡(luò)，支持3.2TbpsRDMA網(wǎng)絡(luò)，全球網(wǎng)絡(luò)POP覆蓋廣，時(shí)延優(yōu)化最高達(dá)75%；提供優(yōu)質(zhì)的存儲(chǔ)性能，文件存儲(chǔ)vePFS支持2TB/s吞吐并行存儲(chǔ)、3000萬(wàn)IOPS；提供毫秒級(jí)性能監(jiān)控，智能GPU自愈能力，保障計(jì)算資源的穩(wěn)定運(yùn)行；提供靈活的資源使用和計(jì)費(fèi)方式，自研mGPU容器共享方案，GPU利用率提升100%+，為生成式AI工作負(fù)載提供更高性價(jià)比的算力資源；強(qiáng)大的彈性調(diào)度能力，支持分鐘級(jí)創(chuàng)建千臺(tái)實(shí)例；提供一站式資源服務(wù)和全鏈路數(shù)據(jù)管理能力，助力企業(yè)高效、彈性構(gòu)建AI訓(xùn)練或推理業(yè)務(wù)，加速企業(yè)實(shí)現(xiàn)AI應(yīng)用落地。2024年12月，火山方舟、扣子平臺(tái)以及HiAgent等平臺(tái)進(jìn)一步升級(jí)，加速了大模型落地，為企業(yè)和開發(fā)者提供高效的工具。火山方舟作為一站式大模型服務(wù)平臺(tái)，火山方舟憑借Cache、離線推理模式等產(chǎn)品與升級(jí)，以及全新發(fā)布的Prompt優(yōu)解，加速大模型能力落地。大模型落地過程中，prompt（提示詞）的編寫，往往是橫在面前的第一道門檻，大模型能力越強(qiáng)，對(duì)指示詞、指令的遵循程度也就越高?；鹕揭姘l(fā)布Prompt優(yōu)解，可以通過“自動(dòng)+互動(dòng)”方式協(xié)助用戶編寫提示詞，讓用戶在互動(dòng)中表達(dá)需求，快速上手。用機(jī)器實(shí)現(xiàn)類似人類的反思、類比、錯(cuò)誤總結(jié)能力，全自動(dòng)優(yōu)化prompt，助力企業(yè)低成本高效率獲得高質(zhì)量prompt。圖22Prompt優(yōu)解功能介紹行業(yè)研究·信息服務(wù)行業(yè)22在價(jià)格方面，火山引擎始終把更低、更好的成本和價(jià)格放在首位。為進(jìn)一步踐行“人人用得起，才是好模型”理念，火山引擎發(fā)布離線批量推理方案和上下文緩存，幫助用戶實(shí)現(xiàn)更為精細(xì)化和低成本的運(yùn)營(yíng)。以上下文緩存為例，針對(duì)有大量聊天、客服對(duì)話的連續(xù)型客戶需求場(chǎng)景，火山引擎推出context上下文緩存記憶方案，無(wú)需重復(fù)對(duì)話就可以保持上下文，可將多輪對(duì)話延遲減少50%，極大改善客戶體驗(yàn)。同時(shí)在命中上下文緩存部分，降低企業(yè)使用成本80%。全新扣子1.5和HiAgent1.5也在2024年12月發(fā)布。（1）開發(fā)者生態(tài)逐漸完善，超過100萬(wàn)活躍開發(fā)者，發(fā)布超過200萬(wàn)個(gè)智能體。（2）全新的AI應(yīng)用開發(fā)環(huán)境，支持GUI搭建界面，并且可以一鍵發(fā)布為小程序、H5、API等多種應(yīng)用形態(tài)。（3）更強(qiáng)的多模態(tài)能力，提供音視頻對(duì)話能力，端到端延遲響應(yīng)低至1秒低成本SDK快速接入各類硬件。（4）海量的精品模板，涵蓋多業(yè)務(wù)場(chǎng)景，一鍵復(fù)制使用。HiAgent1.5：（1）更懂AI轉(zhuǎn)型：提供觀測(cè)&評(píng)測(cè)體系，保障效果生產(chǎn)可用；提供100+行業(yè)應(yīng)用模板，企業(yè)可開箱即用；提供配套AI咨詢，幫助企業(yè)找到AI落地路徑。（2）更深業(yè)務(wù)適配：提供豐富的企業(yè)級(jí)插件、靈活的應(yīng)用集成機(jī)制；GraphRAG構(gòu)建知識(shí)圖譜，提供細(xì)粒度的知識(shí)資產(chǎn)管理；生成式畫布融合CUI和GUI，打造智能交互引擎。（3）更強(qiáng)安全保障：支持RAG知識(shí)庫(kù)和大模型全棧私有化部署。此外，豆包大模型最新發(fā)布的豆包·視覺理解模型、豆包·文生圖模型2.1和豆包·音樂模型，都可以在扣子通過插件的方式體驗(yàn)，將有助于更多多模態(tài)AI應(yīng)用在扣子誕行業(yè)研究·信息服務(wù)行業(yè)23可以看出，除了認(rèn)真打磨技術(shù)，讓模型更強(qiáng)以外，字節(jié)一直努力在踐行著“更低價(jià)格”和“更易落地”，這也使得字節(jié)的大模型，真正的在各行各業(yè)遍地開花。早在2024年5月豆包大模型剛發(fā)布時(shí)，豆包大模型和火山方舟2.0就已經(jīng)在金融、汽車、智能終端、電商零售、教育科研等多個(gè)行業(yè)實(shí)踐落地。招商銀行、海底撈火鍋、超級(jí)猩猩、攜程旅游、飛常準(zhǔn)、獵聘等企業(yè)也已經(jīng)在扣子上搭建了智能體。復(fù)旦大學(xué)、浙江大學(xué)等名校也為課程和實(shí)驗(yàn)搭建了“AI助教”。以招商銀行為例，作為金融行業(yè)AI轉(zhuǎn)型的踐行者，招商銀行正在智能外呼、數(shù)字人、智能數(shù)據(jù)助理等上百個(gè)AI服務(wù)場(chǎng)景探索和投入。招商銀行數(shù)字金融發(fā)展辦公室主任高旭磊就表示，大模型將為銀行全鏈條業(yè)務(wù)帶來(lái)改造和升級(jí)。攜手火山引擎，雙方將共建大模型應(yīng)用場(chǎng)景及高性能基礎(chǔ)設(shè)施，改造現(xiàn)有系統(tǒng)和產(chǎn)品，催生大量以AI為核心的智能體應(yīng)用。蒙牛集團(tuán)也與火山引擎合作夯實(shí)技術(shù)底座，并構(gòu)建了AI營(yíng)養(yǎng)專家、AI育嬰師、AI數(shù)據(jù)分析師、產(chǎn)品創(chuàng)新助手、熱點(diǎn)創(chuàng)意助手等智能體矩陣，提升前端消費(fèi)者體驗(yàn)，助力后端運(yùn)營(yíng)人員決策。2024年7月，豆包大模型日均tokens使用量超過5000億，自2024年5月15日豆包大模型發(fā)布的2個(gè)月內(nèi)，平均每家企業(yè)客戶日均tokens使用量增長(zhǎng)了22倍?，F(xiàn)如今，不少前沿技術(shù)已應(yīng)用于豆包APP、即夢(mèng)等C端產(chǎn)品，并通過火山引擎服務(wù)眾多行業(yè)的企業(yè)客戶。2024年12月豆包大模型日均tokens調(diào)用量突破4萬(wàn)億，7個(gè)月增長(zhǎng)幅度達(dá)33倍。尤其在汽車、手機(jī)、智能終端等新興行業(yè)，豆包大模型調(diào)用量增長(zhǎng)了50倍以上。此外，字節(jié)還高度重視生態(tài)建設(shè)，早在豆包大模型正式發(fā)布的2024年5月的2024春季火山引擎FORCE原動(dòng)力大會(huì)上，火山引擎還與OPPO、vivo、榮耀、小米、三星、華碩宣布成立智能終端大模型聯(lián)盟。OPPO小布助手、榮耀MagicBook的YOYO助理、小米“小愛同學(xué)”、華碩筆記本電腦的豆叮AI助手等應(yīng)用，均已接入火山引擎的大模型服務(wù)。此外，字節(jié)還組織了火山引擎汽車行業(yè)大模型生態(tài)聯(lián)盟。2024年5月的時(shí)候，聯(lián)盟已聚合中國(guó)電動(dòng)車百人會(huì)、廣汽集團(tuán)、北汽集團(tuán)、一汽奔騰、上汽大通、長(zhǎng)城汽車、捷途汽車、智己汽車、哪吒汽車、吉祥汽車、東軟睿馳、美行科技、大搜車等眾多汽車產(chǎn)業(yè)上下游企業(yè)，共同打造汽車大模型生態(tài)。當(dāng)時(shí)字節(jié)的宣傳語(yǔ)就是：“大模型定價(jià)低于行業(yè)價(jià)格99%，火山引擎助力車企加速駛?cè)搿瓵I時(shí)代’”。行業(yè)研究·信息服務(wù)行業(yè)24汽車大模型生態(tài)聯(lián)盟也在不斷擴(kuò)容，在2024年8月又迎來(lái)了領(lǐng)克汽車、吉利銀河、幾何汽車、上汽榮威、上汽名爵、雄獅科技、大圣科技等多位新成員。而在這基礎(chǔ)上，豆包大模型在汽車行業(yè)的拓展一騎絕塵，正如上文介紹的，豆包大模型2024年5月發(fā)布到2024年12月，在汽車行業(yè)的調(diào)用量增長(zhǎng)了50倍以上，遠(yuǎn)超平均值。2024年8月，火山引擎還攜手多點(diǎn)DMALL成立零售大模型生態(tài)聯(lián)盟，通過融合豆包大模型與AI能力，讓零售企業(yè)能夠以極低的試錯(cuò)成本將大模型技術(shù)應(yīng)用到業(yè)務(wù)場(chǎng)景中，推動(dòng)零售行業(yè)的智能化升級(jí)，提升行業(yè)的整體效能和創(chuàng)新能力，以適應(yīng)不斷變化的市場(chǎng)需求和消費(fèi)者行為，加速零售行業(yè)的創(chuàng)新步伐。零售聯(lián)盟首批成員就包括物美集團(tuán)、抖音電商、抖音生活服務(wù)、百勝、麥當(dāng)勞、中國(guó)飛鶴、海底撈、居然之家、南7-11、重慶百貨、百果園、波司登、天虹、三得利、絕味、名創(chuàng)優(yōu)品、NielsenIQ、電我們認(rèn)為，對(duì)生態(tài)的重視，也使得豆包大模型能夠更便利的進(jìn)入不同的行業(yè)，并在各企業(yè)端落地。而且，值得注意的是，tokens調(diào)用規(guī)模化增長(zhǎng)的同時(shí)，豆包大模型在不同場(chǎng)景中都在快速增長(zhǎng)、全面開花。我們認(rèn)為，這說(shuō)明不同領(lǐng)域企業(yè)對(duì)于豆包模型不同需求場(chǎng)景下的使用正在不斷深化。行業(yè)研究·信息服務(wù)行業(yè)25我們認(rèn)為，“極低”的定價(jià)能夠助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新，讓企業(yè)在同等的技術(shù)水平下更愿意去使用豆包模型，這也帶動(dòng)了豆包各類應(yīng)用的廣泛落地，而不斷增加的tokens調(diào)用量，疊加越來(lái)越多的場(chǎng)景覆蓋嗎，使得豆包大模型能力越來(lái)越全面，這就進(jìn)一步推動(dòng)豆包大模型變得“更強(qiáng)”，使得“更強(qiáng)模型”這一目標(biāo)能夠進(jìn)一步實(shí)現(xiàn)，從而帶動(dòng)了多個(gè)良性循環(huán)：模型能力層面：低價(jià)+易落地+好模型，使得豆包大模型用戶數(shù)持續(xù)提升，用戶越多，tokens調(diào)用量越大，場(chǎng)景覆蓋越多，從而使得豆包模型能力越來(lái)越全面，模型越強(qiáng)，用戶模型使用意愿越強(qiáng)，最終推動(dòng)模型能力持續(xù)迭代。而且tokens調(diào)用量越大，字節(jié)算力規(guī)模越大，算力單位成本越低，模型價(jià)格就能進(jìn)一步下降，從而使得用戶模型使用意愿進(jìn)一步增強(qiáng)，從而使得tokens調(diào)用量進(jìn)一步提升，使得算力單位成本進(jìn)一步下降，最終推動(dòng)模型價(jià)格持續(xù)下降。展望未來(lái)，字節(jié)AI的目標(biāo)：“更強(qiáng)模型”、“更低價(jià)格”、“更易落地”正在推動(dòng)字節(jié)AI更加高速的落地千行百業(yè)，AI應(yīng)用爆發(fā)的前夜也正離我們?cè)絹?lái)越近。行業(yè)研究·信息服務(wù)行業(yè)262023年8月豆包APP（由于豆包AI應(yīng)用/豆包AI大模型名稱相同，下文如僅用“豆包”二字，則專指豆包AI應(yīng)用，“豆包xx模型/大模型”則指代各類豆包AI大模型）正式上線。圖27豆包APP版示例行業(yè)研究·信息服務(wù)行業(yè)27伴隨時(shí)間的推移，豆包APP的應(yīng)用功能也不斷深化。2024年7月16日，豆包瀏覽器插件推出播客總結(jié)功能，并不斷優(yōu)化視頻總結(jié)功能，不僅可以總結(jié)視頻內(nèi)容，還能增加多級(jí)目錄和思維導(dǎo)圖，方便用戶觀看和消化超2024年7月17日，三星電子面向中國(guó)市場(chǎng)發(fā)布新一代GalaxyZ系列產(chǎn)品。會(huì)上，三星電子與火山引擎官宣合作，為GalaxyZFold6、GalaxyZFlip6手機(jī)的Bixby語(yǔ)音助手和AI視覺接入豆包大模型，提升手機(jī)的智能應(yīng)用體驗(yàn)。2024年8月8日，豆包音樂生成功能上線。用戶在豆包“音樂生成”中輸入主題或歌詞，設(shè)定音樂風(fēng)格、情緒及音色，便能快速生成一首約1分鐘的詞曲。2024年9月6日，豆包旗下教育品牌“豆包愛學(xué)”完成升級(jí)，應(yīng)用推出作業(yè)批改、拍照答疑、作文創(chuàng)作等多項(xiàng)實(shí)用功能，以適配家庭教育各類場(chǎng)景。此外，豆包愛學(xué)還提供知識(shí)問答、AI搜知識(shí)、與歷史名人對(duì)話、故事創(chuàng)作等功能，旨在提升用戶綜合素2024年10月，豆包App和電腦版完成多項(xiàng)功能更新。豆包App支持上傳附件支持多種音頻文件格式，用戶可快速總結(jié)會(huì)議錄音、課程記錄等內(nèi)容。豆包電腦版上線「語(yǔ)2024年11月11日，豆包電腦版上線了一項(xiàng)新功能，讓用戶不懂P圖也能實(shí)現(xiàn)輕松修圖。在豆包電腦版，用戶選擇“圖片生成”，生成圖片后，選擇“繼續(xù)編輯”，輸入一句簡(jiǎn)單的指令，就能實(shí)現(xiàn)一鍵P圖。此外，用戶也可以通過“參考圖”入口上傳圖片進(jìn)行二次加工。2024年12月5日，豆包正式支持一鍵生成帶有指定文字的圖片。行業(yè)研究·信息服務(wù)行業(yè)28行業(yè)研究·信息服務(wù)行業(yè)292024年12月10日，豆包電腦版視頻生成功能開啟內(nèi)測(cè)使用，用戶內(nèi)測(cè)申請(qǐng)通過后，在豆包電腦版選擇“視頻生成”，上傳一張圖片輸入提示詞，并添加運(yùn)鏡、分鏡信息，即可生成一段視頻。不難發(fā)現(xiàn)，伴隨豆包大模型的不斷升級(jí)迭代，豆包的功能也在不斷更新。舉例來(lái)說(shuō)，2024年8月9日，火山引擎宣布豆包大模型支持實(shí)時(shí)語(yǔ)音通話功能。該功能通過實(shí)時(shí)通信（RTC）技術(shù)，提高了語(yǔ)音數(shù)據(jù)的傳輸效率和流暢度，適用于AI社交陪伴、口語(yǔ)學(xué)習(xí)、游戲NPC及呼叫中心等場(chǎng)景。而在2024年10月，豆包電腦版就上線「語(yǔ)音通話」功能。又比如，2024年9月24日，在火山引擎AI創(chuàng)新巡展深圳站活動(dòng)上，豆包視頻生成模型PixelDance與Seaweed正式發(fā)布，支持多鏡頭一致性切換及多拍動(dòng)作與主體復(fù)雜交互。在2024年12月10日，豆包電腦版視頻生成功能就開啟了內(nèi)測(cè)使用。行業(yè)研究·信息服務(wù)行業(yè)30在豆包上線后很長(zhǎng)一段時(shí)間內(nèi)，字節(jié)官方并沒有進(jìn)行大量公開宣傳，豆包的官微都是在2024年6月才發(fā)布了第一篇官方文章，但是豆包的流量卻快速提升。2024年5月，豆包大模型正式發(fā)布的時(shí)候，基于豆包APP在蘋果APPStore和各大安卓應(yīng)用市場(chǎng)的表現(xiàn)，豆包APP的下載量在AIGC類應(yīng)用中已經(jīng)排名第一。2024年11月，根據(jù)AI產(chǎn)品榜·應(yīng)用榜（APP），豆包11月上榜應(yīng)用APPMAU高達(dá)5998萬(wàn)，對(duì)比第二名文小言1299萬(wàn)的數(shù)據(jù)在國(guó)內(nèi)處于斷崖領(lǐng)先的位置。在全球范圍內(nèi)，豆包的11月上榜應(yīng)用APPMAU也能排到第二的位置，僅次于ChatGPT。行業(yè)研究·信息服務(wù)行業(yè)那么究竟是什么帶給了豆包如此強(qiáng)大的流量？我們認(rèn)為，從表面來(lái)看，豆包首先是一個(gè)“好用”的AI助手，能滿足用戶在多種使用場(chǎng)景下的不同需求。作為一款通用型AI產(chǎn)品，豆包致力于去滿足不同用戶具體且真實(shí)的需求，讓用戶像開口問身邊的朋友一樣快捷方便地和豆包溝通，真正做到什么都問問豆包。日常生活里各種知識(shí)和經(jīng)驗(yàn)問答，豆包總能快速為用戶答疑解惑。例如最近上海到了銀杏季節(jié)，用戶問豆包“上海哪里可以看銀杏？?,豆包很快就列出了市中心和郊區(qū)的觀賞地及特點(diǎn)，并配上了銀杏樹的照片和路線視頻攻略，非常方便。在教育學(xué)習(xí)領(lǐng)域，豆包也能很快很好的滿足學(xué)習(xí)和教育的各種需求。比如解答奧數(shù)題，豆包可以給用戶進(jìn)行解答。豆包能提供詳盡的解題步驟，引導(dǎo)用戶理解題目解法。如果用戶對(duì)某類題目掌握的不太牢固，豆包還可以繼續(xù)給用戶出幾道同類知識(shí)點(diǎn)題目鞏固練習(xí)。英語(yǔ)口語(yǔ)練習(xí)也是重要的教育場(chǎng)景。根據(jù)用戶反饋，豆包的發(fā)音、詞匯量、句型都遠(yuǎn)遠(yuǎn)超過普通用戶水平。通過豆包實(shí)時(shí)語(yǔ)音通話功能，用戶可以實(shí)現(xiàn)和豆包一來(lái)一回練英語(yǔ)，毫不尷尬，也節(jié)約了請(qǐng)老師輔導(dǎo)的開銷。此外，生成的英語(yǔ)對(duì)話還配有字幕，用戶退出后還可以復(fù)習(xí)。行業(yè)研究·信息服務(wù)行業(yè)32在工作場(chǎng)景中，豆包也能滿足眾多使用場(chǎng)景。以論文這一“問問豆包”的高頻場(chǎng)景為例，用戶不僅可以讓豆包總結(jié)，劃詞解釋專業(yè)名詞，還可以多追問，不論是圖片還是實(shí)驗(yàn)數(shù)據(jù)，都可以截圖問問豆包，它都能給出清晰的圖表解釋和實(shí)驗(yàn)含義。此外，文字、圖片、音樂、視頻的創(chuàng)作上，用戶也都會(huì)問問豆包。我們認(rèn)為，豆包的“好用”只是其廣受歡迎的最表面，在深層，豆包團(tuán)隊(duì)做出了大量的努力。首先，豆包團(tuán)隊(duì)努力讓豆包“接地氣”、“擬人化”。在豆包團(tuán)隊(duì)看來(lái)，“擬人化”是大模型產(chǎn)品的新特性。AI除了帶來(lái)了新的能力，也帶來(lái)了新的交互方式，用和人類對(duì)齊的交互體驗(yàn)，降低使用門檻，也讓用戶在使用產(chǎn)品時(shí)感覺到產(chǎn)品有類似人的溫度。為了體現(xiàn)這種擬人的感受，豆包團(tuán)隊(duì)希望產(chǎn)品的名字，就像用戶對(duì)一個(gè)親密朋友日常稱呼的昵稱。在簡(jiǎn)單、好讀、好記的通用原則下。最終，團(tuán)隊(duì)在有點(diǎn)隨意，甚至字節(jié)跳動(dòng)產(chǎn)品與戰(zhàn)略副總裁朱駿都曾表示：?（選中豆包后團(tuán)隊(duì)認(rèn)為）反正以后如果有更好的名字也還可以改嘛”的情況下，選擇了“豆包”這一親切又有點(diǎn)可愛的名字。豆包上線后，名字的起源引起了眾多用戶的猜測(cè)和討論，湊巧的吸引了普通用戶的關(guān)注，而且是用戶主動(dòng)幫豆包想出了兩個(gè)有趣的解釋1）豆包=抖音的官方bot，“抖bot”諧音就是豆包；（2）說(shuō)豆包=“都包了”，工作生活學(xué)習(xí)的需求都包了，寓意是通用助手的產(chǎn)品愿景。這兩個(gè)解釋最終也都得到了豆包官方團(tuán)隊(duì)的認(rèn)可。我們認(rèn)為，豆包的“接地氣”和“擬人化”使得其發(fā)布最初，就得到了一波“自來(lái)水”，同時(shí)，也讓其更易于被普通用戶所接受。行業(yè)研究·信息服務(wù)行業(yè)33此外，豆包團(tuán)隊(duì)不斷通過各種手段讓豆包更易用、更“快”。（1）豆包輸入更方便，所以更“快”在產(chǎn)品設(shè)計(jì)上，豆包團(tuán)隊(duì)一直努力讓用戶的輸入更快更方便。豆包團(tuán)隊(duì)非常注重多模態(tài)的輸入和打磨，尤其是語(yǔ)音輸入。輸入速度上來(lái)說(shuō)，普通人的打字速度大概是每分鐘60到80個(gè)字，而普通人的語(yǔ)速每分鐘可以到250至300字。所以一般情況下，語(yǔ)音輸入效率至少是鍵盤輸入的3倍以上。語(yǔ)音的效率天然更高，更快。同時(shí)，豆包的語(yǔ)音能準(zhǔn)確轉(zhuǎn)錄各種語(yǔ)音信號(hào)，識(shí)別不同語(yǔ)言、方言、口音。豆包對(duì)于人名、生詞，也能結(jié)合上下文做出準(zhǔn)確分析。語(yǔ)音以外，豆包也上線了視覺識(shí)別模型。無(wú)論是讀心電圖、還是拍奧數(shù)題，都依靠視覺輸入。人和世界的溝通中，視覺是很重要的一環(huán)。相比用語(yǔ)言描述心電圖上的復(fù)雜信息，直接拍下來(lái)問問豆包，會(huì)更快更方便。（2）豆包離用戶更近，所以更“快”2024年10月，豆包團(tuán)隊(duì)發(fā)布了OlaFriend智能體耳機(jī)，其宣傳語(yǔ)即為：“讓豆包，成為隨時(shí)隨地陪伴在你耳邊的朋友”。OlaFriend耳機(jī)與豆包APP深度結(jié)合。在官網(wǎng)和官方宣傳片中，豆包強(qiáng)調(diào)了OlaFriend能夠在信息查詢、旅游出行、英語(yǔ)學(xué)習(xí)及情感交流等場(chǎng)景為用戶提供幫助。行業(yè)研究·信息服務(wù)行業(yè)34OlaFriend耳機(jī)這樣輕便的可穿戴設(shè)備，讓豆包能夠成為用戶耳邊伴隨的朋友，在路上隨時(shí)和豆包對(duì)話，最快。運(yùn)動(dòng)，逛街，旅行時(shí)，用戶無(wú)需再拿出手機(jī)或其他設(shè)備，直接通過耳機(jī)就能和豆包對(duì)話，快速獲取信息。這種無(wú)縫連接的交互方式，讓豆包真正成為了用戶身邊的智能伙伴，陪伴用戶度過每一個(gè)需要知識(shí)和幫助的時(shí)刻。此外，豆包團(tuán)隊(duì)在2024年還重點(diǎn)建設(shè)了豆包電腦版。用戶可以把電腦版當(dāng)成瀏覽器，直接打開網(wǎng)頁(yè)。在瀏覽中遇到需要提問、翻譯或總結(jié)時(shí)，直接點(diǎn)擊“問問豆包”，就能輕松喚起，獲得幫助。豆包還即將上線“文檔編輯器”功能，采取全新的交互方式，生成文檔后，用戶可以在畫布中自由編輯，讓AI針對(duì)特定詞語(yǔ)和段落優(yōu)化改寫，也可以一鍵全文潤(rùn)色、調(diào)整長(zhǎng)度，全網(wǎng)搜圖等，讓創(chuàng)作更輕松。行業(yè)研究·信息服務(wù)行業(yè)35（3）豆包模型能力更強(qiáng)，所以更“快”豆包的快，究其根本，是背后的豆包大模型幫助用戶做了意圖識(shí)別、信息收集、處理、整合和分析。當(dāng)用戶提出較為復(fù)雜的搜索或?qū)懽餍枨髸r(shí)，豆包快速識(shí)別用戶意圖，推理并拆解內(nèi)容，再進(jìn)行多步驟分析和推理，并調(diào)度搜索，呈現(xiàn)總結(jié)后的結(jié)果。同時(shí)，豆包還能將搜索到的文本信息與視頻內(nèi)容相結(jié)合，為用戶提供更加豐富和直觀的體驗(yàn)。此外，字節(jié)還投入了大量資源為豆包引流。根據(jù)第一財(cái)經(jīng)雜志官方百家號(hào)援引廣告情報(bào)分析平臺(tái)AppGrowing統(tǒng)計(jì)，豆包智能助手2024年4月、5月的投放金額接近1800萬(wàn)元，等到2024年6月上旬，投放金額飆升至1.24億元。2024年6月開啟大規(guī)模買量投流后，豆包月活躍用戶（MAU）迅速超過競(jìng)爭(zhēng)對(duì)手。與此同時(shí)，字節(jié)還限制了豆包的競(jìng)對(duì)產(chǎn)品在抖音平臺(tái)的廣告投放。行業(yè)研究·信息服務(wù)行業(yè)36我們認(rèn)為，總結(jié)來(lái)講，豆包的功能發(fā)展全面，并且多端覆蓋，使用門檻又低，日常場(chǎng)景夠用，再疊加字節(jié)強(qiáng)大的廣告投放和流量效應(yīng)，豆包的關(guān)注度持續(xù)提升也就是情理之中的事情了。而豆包也遠(yuǎn)不是字節(jié)在AI應(yīng)用唯一的布局。根據(jù)第一財(cái)經(jīng)雜志官方百家號(hào)，字節(jié)目前還在正常運(yùn)營(yíng)的AI應(yīng)用大約20款，其中絕大部分是在2024年以后發(fā)布的。行業(yè)研究·信息服務(wù)行業(yè)37研發(fā)團(tuán)隊(duì)產(chǎn)品研發(fā)團(tuán)隊(duì)AnyDoor（海外）應(yīng)用應(yīng)用視頻剪輯視頻剪輯TikTok抖音AI分身（KOL內(nèi)測(cè)）TikTokCozeCoze（海外）模型分享社區(qū)硬件硬件字節(jié)的AI應(yīng)用不僅在數(shù)量上突出，在市場(chǎng)認(rèn)可度上也擁有領(lǐng)先地位。硅谷知名投資機(jī)構(gòu)a16z，其每6個(gè)月會(huì)深入挖掘數(shù)據(jù)，分別評(píng)選出50款領(lǐng)先的生成式AIWeb應(yīng)用和50款領(lǐng)先的生成式AI移動(dòng)應(yīng)用，豆包在2024年8月份的最新榜單中同時(shí)出現(xiàn)在了AIWeb應(yīng)用和AI移動(dòng)應(yīng)用兩個(gè)榜單中。此外，字節(jié)跳動(dòng)旗下還有4個(gè)應(yīng)用上榜。在生成式AIWeb應(yīng)用榜單，除豆包外，AI智能體開發(fā)平臺(tái)Coze（海外版的“扣子”）、教育類AI應(yīng)用Gauth上榜。行業(yè)研究·信息服務(wù)行業(yè)38在生成式AIApp應(yīng)用榜單，除豆包外，豆包海外版Cici、圖片編輯類的AI應(yīng)用Hypic上榜。行業(yè)研究·信息服務(wù)行業(yè)39根據(jù)新浪財(cái)經(jīng)，NeurIPS2024大會(huì)上，前OpenAI聯(lián)合創(chuàng)始人、SSI創(chuàng)始人IlyaSutskever發(fā)表演講時(shí)表示，預(yù)訓(xùn)練作為AI模型開發(fā)的第一階段即將結(jié)束。在此，我們不評(píng)價(jià)Ilya言論正確與否，我們認(rèn)為，從海內(nèi)外AI大模型發(fā)展速度來(lái)看，客觀上，AI技術(shù)逐漸從陡峭進(jìn)入到平緩區(qū)間，AI商業(yè)化落地已經(jīng)成為事實(shí)上AI發(fā)展的下一階段。我們認(rèn)為，過去幾個(gè)月來(lái)，字節(jié)通過成熟的產(chǎn)品技術(shù)，親民的產(chǎn)品定位，龐大的流量投入打造了豆包這一目前國(guó)內(nèi)用戶量最大的AI應(yīng)用，這使得字節(jié)已經(jīng)走出了一條AI應(yīng)用發(fā)展的成功道路，獲得了領(lǐng)先于其他競(jìng)爭(zhēng)對(duì)手的獨(dú)特的AI應(yīng)用落地經(jīng)驗(yàn)?？紤]到字節(jié)強(qiáng)大的資本體量和對(duì)AI商業(yè)化的高度重視，字節(jié)目前20余款A(yù)I應(yīng)用也許只是個(gè)開始，字節(jié)已經(jīng)成為了事實(shí)上的中國(guó)AI商業(yè)化旗手，正在AI發(fā)展的道路上行以致遠(yuǎn)。建議關(guān)注：金山辦公、新致軟件、漢得信息、合合信息、萬(wàn)興科技、虹軟科技、新國(guó)都、當(dāng)虹科技、同花順、福昕軟件、泛微網(wǎng)絡(luò)、致遠(yuǎn)互聯(lián)、三六零、商湯-W、科大訊飛、邁富時(shí)、鼎捷數(shù)智、賽意信息、中國(guó)軟件國(guó)際、海康威視、大華股份、潤(rùn)澤科技、浪潮信息。風(fēng)險(xiǎn)提示：AI技術(shù)的發(fā)展不及預(yù)期，AI商業(yè)落地不及預(yù)期，市場(chǎng)競(jìng)爭(zhēng)加劇的風(fēng)險(xiǎn)。行業(yè)研究·信息服務(wù)行業(yè)40APPENDIX1SummaryInvestmentHighlights:Doubao’spursuitofa‘strongermodel’continues.In2023,DoubaofoundationmodellaunchedinternallyatByteDance,usedinover50businessunits.ByMay2024,ByteDanceofficiallyreleasedtheDoubaomodelfamily,achievingsignificantadvancementsinlanguage,multimodalunderstanding,andcodegeneration.ByDecember2024,Doubao’scapabilitiesmatchedGPT-4o,rankingfirstinFlagEval’sdialoguemodellist.Doubao’srapidupgradesandperformanceimprovementshavebecomeacornerstoneofByteDanceAI,drivenbyrelentlesstechnicalinvestment,expandingapplicationboundariesandlayingafoundationforfuturegrowth.Themodel’sleadingedgeisexpectedtogrow.‘Lowerprices’and‘easierimplementation’makeDoubaoaccessibleacrossindustries.InMay2024,Doubao’smainmodelpricedatRMB0.0008perthousandtokens,99.3%cheaperthanindustrystandards.Thefamilymaintainedlowpricing,withvisualunderstandingatRMB0.003perthousandtokens,85%belowaverage,processing284imagesforRMB1.ToolslikeCozeplatformsupportAIapplicationdevelopment,withover1millionactivedevelopers.ByDecember2024,dailytokencallsexceeded4trillion,growing33timesin7months,especiallyinemergingsectorslikeautomotiveandsmartdevices.ByteDanceAI’sgoalsof‘strongermodels’,‘lowerprices’,and‘easierimplementation’aredrivingrapidindustryadoption,heraldinganAIapplicationboom.BeyondDoubao,ByteDance’sAIcommercialstrategyisadvancing.DoubaoapplaunchedinAugust2023,reaching59.98millionMAUbyNovember2024,leadingdomesticallyandrankingsecondgloballyafterChatGPT.Doubao’scomprehensivefeatures,lowusagethreshold,andByteDance’sadvertisingpowerdrivemassivetraffic.ByteDanceoperatesaround20AIapplications,with6listedina16z’stop100generativeAIapps.AItechnologyisstabilizing,andcommercializationisthenextphase.DoubaoprovidesByteDancewithuniquesuccessinAIapplicationdeployment.WithstrongcapitalandfocusonAIcommercialization,ByteDanceisaleaderinChina’sAImarket,poisedforlong-termsuccess.Recomme

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 研究報(bào)告

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

AI商業(yè)化的旗手：不止豆包的字節(jié)跳動(dòng)-海通國(guó)際

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

AI商業(yè)化的旗手：不止豆包的字節(jié)跳動(dòng)-海通國(guó)際

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔