AI商業(yè)化的旗手:不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第1頁(yè)
AI商業(yè)化的旗手:不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第2頁(yè)
AI商業(yè)化的旗手:不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第3頁(yè)
AI商業(yè)化的旗手:不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第4頁(yè)
AI商業(yè)化的旗手:不止豆包的字節(jié)跳動(dòng)-海通國(guó)際_第5頁(yè)
已閱讀5頁(yè),還剩68頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

l“更強(qiáng)模型”,是豆包大模型的持續(xù)追求。2023年,豆包大模型(原名:云雀)在字節(jié)跳動(dòng)內(nèi)部完成了上線,在一年的時(shí)間內(nèi),豆包大模型在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)被大量使用。2024年5月,字節(jié)跳動(dòng)正式發(fā)布豆包大模型家族,此后7個(gè)月時(shí)間,豆包大模型團(tuán)隊(duì)發(fā)布了Doubao-pro、Seed-TTS、Seed-ASR、Seed-Music、視頻生成模型、視覺理解模型等多項(xiàng)重磅成果,在語(yǔ)言能力、多模態(tài)理解與生成、模型推理、代碼生成等方面不斷提升。到2024年12月,豆包大模型通用模型能力已經(jīng)全面對(duì)齊GPT-4o,在FlagEval模型評(píng)測(cè)的“對(duì)話模型”榜單中,豆包-pro32k版本已經(jīng)位列第一。我們認(rèn)為,在短短6個(gè)月的時(shí)間里,豆包大模型不斷升級(jí)迭代,性能持續(xù)提升,已經(jīng)成為字節(jié)AI發(fā)展的重要基石,這背后代表的是字節(jié)孜孜不倦的技術(shù)投入,這些投入不僅推動(dòng)了模型能力的持續(xù)擴(kuò)展,也有效地拓展了豆包大模型的應(yīng)用邊界,此外,豆包大模型團(tuán)隊(duì)對(duì)AI前沿技術(shù)的積極研究,奠定了未來(lái)豆包大模型長(zhǎng)期發(fā)展的基礎(chǔ),未來(lái)豆包大模型的領(lǐng)先優(yōu)勢(shì)有望持續(xù)擴(kuò)大,“更強(qiáng)模型”也有望不斷實(shí)現(xiàn)。l“更低價(jià)格”與“更易落地”,讓豆包大模型落地千行百業(yè)。2024年5月,豆包大模型剛發(fā)布時(shí),豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千tokens,0.8厘就能處理1500多個(gè)漢字,比行業(yè)便宜99.3%,大模型價(jià)格,進(jìn)入“厘時(shí)代”。此后,豆包大模型家族維持了“極低”的定價(jià)體系,例如新發(fā)布的豆包·視覺理解的輸入價(jià)格為每千tokens0.003元,比行業(yè)平均價(jià)格降低85%,相當(dāng)于一塊錢可以處理284張720P的圖片,視覺理解模型也正式走進(jìn)厘時(shí)代。此外,豆包還積極開發(fā)各類開發(fā)者工具,助力AI應(yīng)用的落地。例如字節(jié)發(fā)布的新一代AI應(yīng)用開發(fā)平臺(tái):扣子(Coze目前的扣子1.5已經(jīng)擁有超過100萬(wàn)活躍開發(fā)者,發(fā)布超過200萬(wàn)個(gè)智能體,并提供全新的AI應(yīng)用開發(fā)環(huán)境和更強(qiáng)的多模態(tài)能力。這就使得豆包大模型迅速在各行各業(yè)落地,2024年12月豆包大模型日均tokens調(diào)用量突破4萬(wàn)億,7個(gè)月增長(zhǎng)幅度達(dá)33倍。尤其在汽車、手機(jī)、智能終端等新興行業(yè),豆包大模型調(diào)用量增長(zhǎng)了50倍以上。我們認(rèn)為,展望未來(lái),字節(jié)AI的目標(biāo):“更強(qiáng)模型”、“更低價(jià)格”、“更易落地”正在推動(dòng)字節(jié)AI更加高速的落地千行百業(yè),AI應(yīng)用爆發(fā)的前夜也正離我們?cè)絹?lái)越近。l不止豆包,字節(jié)AI商業(yè)布局行以致遠(yuǎn)。2023年8月豆包APP正式上線,伴隨時(shí)用榜(APP豆包11月上榜應(yīng)用APPMAU高達(dá)5998萬(wàn),對(duì)比第二名文小言1299萬(wàn)的數(shù)據(jù)在國(guó)內(nèi)處于斷崖領(lǐng)先的位置。在全球范圍內(nèi),豆包的11月上榜應(yīng)用APPMAU也能排到第二的位置,僅次于ChatGPT。我們認(rèn)為,豆包的功能全面,并且多端覆蓋,使用門檻又低,日常場(chǎng)景夠用,再疊加字節(jié)強(qiáng)大的廣告投放和流量效應(yīng),使得豆包獲得了巨大流量。而豆包也遠(yuǎn)不是字節(jié)在AI應(yīng)用唯一的布局,根據(jù)第一財(cái)經(jīng)雜志,字節(jié)目前還在正常運(yùn)營(yíng)的AI應(yīng)用大約20款。在2024年8月a16z評(píng)選的領(lǐng)先的100款生成式AI應(yīng)用榜單中,字節(jié)上榜了6款應(yīng)用。我們認(rèn)為,客觀上,AI技術(shù)逐漸從陡峭進(jìn)入到平緩區(qū)間,AI商業(yè)化落地已經(jīng)成為事實(shí)上AI發(fā)展的下一階段。豆包使得字節(jié)獲得了領(lǐng)先于其他競(jìng)爭(zhēng)對(duì)手的獨(dú)特的AI應(yīng)用成功落地經(jīng)驗(yàn)??紤]到字節(jié)強(qiáng)大的資本體量和對(duì)AI商業(yè)化的高度重視,字節(jié)目前20余款A(yù)I應(yīng)用也許只是個(gè)開始,字節(jié)已經(jīng)成為了事實(shí)上的中國(guó)AI商業(yè)化旗手,正在AI發(fā)展的道路上行以致遠(yuǎn)。l建議關(guān)注。金山辦公、新致軟件、漢得信息、合合信息、萬(wàn)興科技、虹軟科技、新國(guó)都、當(dāng)虹科技、同花順、福昕軟件、泛微網(wǎng)絡(luò)、致遠(yuǎn)互聯(lián)、三六零、商湯-W、科大訊飛、邁富時(shí)、鼎捷數(shù)智、賽意信息、中國(guó)軟件國(guó)際、??低暋⒋笕A股份、潤(rùn)澤科技、浪潮信息。l風(fēng)險(xiǎn)提示。AI技術(shù)的發(fā)展不及預(yù)期,AI商業(yè)落地不及預(yù)期,市場(chǎng)競(jìng)爭(zhēng)加劇的風(fēng)2行業(yè)研究·信息服務(wù)行業(yè)21.“更強(qiáng)模型”,是豆包大模型的持續(xù)追求 52.“更低價(jià)格”與“更易落地”,讓豆包大模型落地千行百業(yè) 3.不止豆包,字節(jié)AI商業(yè)布局行以致遠(yuǎn) 4.建議關(guān)注與風(fēng)險(xiǎn)提示 3行業(yè)研究·信息服務(wù)行業(yè)3 圖1豆包大模型正式發(fā)布時(shí)已經(jīng)被廣泛應(yīng)用 5圖2剛發(fā)布時(shí)的豆包大模型家族 6圖32024年6月的FlagEval大模型評(píng)測(cè)能力榜單(客觀評(píng)測(cè)) 7圖4豆包·視頻生成模型支持多種畫面比例/風(fēng)格 8圖52024年9月豆包通用模型pro最新版本性能不斷升級(jí) 9圖6豆包·視覺理解模型內(nèi)容識(shí)別能力優(yōu)秀 圖7豆包·視覺理解模型理解推理能力突出 圖8豆包·視覺理解模型擁有細(xì)膩的視覺描述能力 圖9Doubao-pro綜合能力持平GPT-4o 圖10豆包通用模型pro性能全面升級(jí) 圖11豆包3D模型示例 圖12最新的豆包大模型家族 圖13Doubao-pro模型位列FlagEval模型評(píng)測(cè)第一 圖14火山引擎對(duì)話式AI實(shí)時(shí)交互服務(wù)方案架構(gòu) 圖15豆包·視頻生成模型運(yùn)用的相關(guān)技術(shù) 圖16HybridFlow能有效減少模型參數(shù)在兩個(gè)階段之間的重分片和通信開銷 圖18北京大學(xué)-字節(jié)跳動(dòng)“豆包大模型系統(tǒng)軟件聯(lián)合實(shí)驗(yàn)室”簽約儀式 圖19豆包大模型維持“極低”價(jià)格水平 圖20豆包·視覺理解模型定價(jià)顯著低于行業(yè)水平 圖21方舟2.0擁有優(yōu)質(zhì)插件庫(kù) 圖22Prompt優(yōu)解功能介紹 圖23火山引擎提供的AI落地方案 圖24豆包大模型日均tokens7個(gè)月時(shí)間增速達(dá)33倍 圖25火山引擎汽車大模型生態(tài)聯(lián)盟首批聯(lián)盟成員 圖26豆包大模型在10-12月各應(yīng)用場(chǎng)景調(diào)用量增長(zhǎng) 圖27豆包APP版示例 圖28豆包支持一鍵生成帶有指定文字的圖片 圖29豆包電腦網(wǎng)頁(yè)版示例 圖30豆包排名2024年11月AI產(chǎn)品榜·國(guó)內(nèi)總榜第一 4行業(yè)研究·信息服務(wù)行業(yè)4圖31豆包能滿足日常生活中的多重需求 圖32豆包能滿足教育領(lǐng)域中的多重需求 圖33豆包的擬人化形象:可愛女生 圖34豆包輸入更方便,所以更“快” 圖35OlaFriend耳機(jī)與豆包App 圖36豆包離用戶更近,所以更“快” 圖37豆包模型能力更強(qiáng),所以更“快” 圖382024年6月豆包MAU迅速超過競(jìng)爭(zhēng)對(duì)手 圖39字節(jié)跳動(dòng)旗下AI應(yīng)用/硬件 圖40a16zTop50生成式AIWeb應(yīng)用榜單 圖41a16zTop50生成式AI移動(dòng)應(yīng)用榜單 5行業(yè)研究·信息服務(wù)行業(yè)52023年,豆包大模型(原名:云雀)在字節(jié)跳動(dòng)內(nèi)部完成了上線,它也是首批通過大模型服務(wù)安全備案的大模型之一。在一年的時(shí)間內(nèi),豆包大模型在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)被大量使用,以進(jìn)行AI創(chuàng)新,包括抖音、頭條等數(shù)億DAU產(chǎn)品。2024年5月,在2024春季火山引擎FORCE原動(dòng)力大會(huì)上,字節(jié)跳動(dòng)正式發(fā)布了豆包大模型家族。此時(shí),豆包大模型已經(jīng)能夠日均處理1200億tokens文本、生成3000萬(wàn)張圖片。在豆包模型發(fā)布時(shí),字節(jié)對(duì)于AI的目標(biāo)是:更強(qiáng)模型:大使用量才能打磨出更好模型。豆包大模型已經(jīng)在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)、多場(chǎng)景應(yīng)用中落地,經(jīng)過千億級(jí)日tokens的持續(xù)打磨,模型能力和推理效果得到市場(chǎng)的廣泛認(rèn)可。更低價(jià)格:為了讓每一家企業(yè)都能用得起大模型,火山引擎大幅度降低大模型應(yīng)用推理成本。例如本次登榜的豆包通用模型pro,其32k版模型推理輸入價(jià)格僅為0.0008元/千tokens。更易落地:火山引擎2023年發(fā)布了一站式大模型服務(wù)平臺(tái)火山方舟,通過模型即服務(wù)的理念,幫助企業(yè)在高效、安全的環(huán)境里應(yīng)用各類模型。2024年5月,火山引擎對(duì)方舟平臺(tái)進(jìn)行了全面升級(jí),升級(jí)后的火山方舟2.0將大幅提升模型效果、核心插件、系統(tǒng)性能以及平臺(tái)體驗(yàn),幫助企業(yè)推進(jìn)大模型的價(jià)值創(chuàng)造。6行業(yè)研究·信息服務(wù)行業(yè)6當(dāng)時(shí)的豆包大模型家族包括:豆包通用模型pro:字節(jié)跳動(dòng)自研LLM模型專業(yè)版,支持128k長(zhǎng)文本,全系列可精調(diào),具備更強(qiáng)的理解、生成、邏輯等綜合能力,適配問答、總結(jié)、創(chuàng)作、分類等豐豆包通用模型lite:字節(jié)跳動(dòng)自研LLM模型輕量版,對(duì)比專業(yè)版提供更低token成本、更低延遲,為企業(yè)提供靈活經(jīng)濟(jì)的模型選擇;豆包·角色扮演模型:個(gè)性化的角色創(chuàng)作能力,更強(qiáng)的上下文感知和劇情推動(dòng)能力,滿足靈活的角色扮演需求;豆包·語(yǔ)音合成模型:提供自然生動(dòng)的語(yǔ)音合成能力,善于表達(dá)多種情緒,演繹多豆包·聲音復(fù)刻模型:5秒即可實(shí)現(xiàn)聲音1:1克隆,對(duì)音色相似度和自然度進(jìn)行高度還原,支持聲音的跨語(yǔ)種遷移;豆包·語(yǔ)音識(shí)別模型:更高的準(zhǔn)確率及靈敏度,更低的語(yǔ)音識(shí)別延遲,支持多語(yǔ)種的正確識(shí)別;豆包·文生圖模型:更精準(zhǔn)的文字理解能力,圖文匹配更準(zhǔn)確,畫面效果更優(yōu)美,擅長(zhǎng)對(duì)中國(guó)文化元素的創(chuàng)作;豆包·Functioncall模型:提供更加準(zhǔn)確的功能識(shí)別和參數(shù)抽取能力,適合復(fù)雜工具調(diào)用的場(chǎng)景;豆包·向量化模型:聚焦向量檢索的使用場(chǎng)景,為L(zhǎng)LM知識(shí)庫(kù)提供核心理解能力,支持多語(yǔ)言。2024年6月,智源研究院旗下的FlagEval大模型評(píng)測(cè)平臺(tái)發(fā)布最新評(píng)測(cè)榜單。榜單顯示,在閉源大模型的“客觀評(píng)測(cè)”中,豆包大模型(Doubao-Pro-4k)以綜合評(píng)分75.96分排名第二,僅次于GPT-4,是得分最高的國(guó)產(chǎn)大模型。在“主觀評(píng)測(cè)”中,豆包大模型同樣排名第二。7行業(yè)研究·信息服務(wù)行業(yè)7FlagEval大模型評(píng)測(cè)平臺(tái)由智源研究院與多個(gè)高校團(tuán)隊(duì)共建,以人類認(rèn)知能力的發(fā)展階梯為基準(zhǔn),對(duì)齊大模型所能達(dá)到的認(rèn)知水平。FlagEval構(gòu)建了大量原創(chuàng)的非公開評(píng)測(cè)集,確保評(píng)測(cè)質(zhì)量和公正性。自2023年6月上線以來(lái),F(xiàn)lagEval已完成了1000多次覆蓋全球大模型的評(píng)測(cè)。評(píng)測(cè)成績(jī)顯示,豆包大模型(Doubao-Pro-4k)的數(shù)學(xué)能力、知識(shí)運(yùn)用、任務(wù)解決等多項(xiàng)能力在客觀評(píng)測(cè)和主觀評(píng)測(cè)中都有著出色表現(xiàn)。其中,知識(shí)運(yùn)用和數(shù)學(xué)能力得分排名客觀評(píng)測(cè)第一、主觀評(píng)測(cè)前三,任務(wù)解決測(cè)試得分在主客觀評(píng)測(cè)中均排名前三。在隨后的日子里,豆包大模型不斷升級(jí),其家族也不斷壯大。2024年8月,豆包大模型正式支持實(shí)時(shí)語(yǔ)音通話?;鹕揭嫱瞥隽藢?duì)話式AI實(shí)時(shí)交互解決方案,搭載火山方舟大模型服務(wù)平臺(tái),通過火山引擎RTC實(shí)現(xiàn)語(yǔ)音數(shù)據(jù)的高效采集、處理和傳輸,并深度整合豆包·語(yǔ)音識(shí)別模型和豆包·語(yǔ)音合成模型,簡(jiǎn)化語(yǔ)音到文本和文本到語(yǔ)音的轉(zhuǎn)換過程,提供卓越的智能對(duì)話和自然語(yǔ)言處理能力,幫助應(yīng)用快速實(shí)現(xiàn)用戶和云端大模型的實(shí)時(shí)語(yǔ)音通話。豆包·語(yǔ)音合成模型:解鎖「豆包」同款音色,提供自然生動(dòng)的語(yǔ)音合成能力,善于表達(dá)多種情緒,演繹多種場(chǎng)景。豆包·語(yǔ)音識(shí)別模型:更高的準(zhǔn)確率及靈敏度,更低的語(yǔ)音識(shí)別延遲,支持多語(yǔ)種的正確識(shí)別。火山方舟:提供模型精調(diào)、推理、評(píng)測(cè)等全方位功能與服務(wù),提供豐富的插件生態(tài)和AI原生應(yīng)用開發(fā)服務(wù),全方位保障企業(yè)級(jí)AI應(yīng)用落地。2024年9月,豆包·視頻生成模型正式上線。2024年9月24日,2024火山引擎AI創(chuàng)新巡展在深圳舉辦,豆包大模型家族迎來(lái)新成員:豆包·視頻生成模型。豆包·視頻生成模型能遵從復(fù)雜prompt,解鎖時(shí)序性多拍動(dòng)作指令與多個(gè)主體間的交互能力。還可以讓視頻在主體的大動(dòng)態(tài)與鏡頭中炫酷切換,擁有變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語(yǔ)言能力,靈活控制視角,帶來(lái)真實(shí)世界的體驗(yàn)。8行業(yè)研究·信息服務(wù)行業(yè)8此外,豆包·視頻生成模型成功攻克多鏡頭切換時(shí)一致性的技術(shù)挑戰(zhàn),在一個(gè)prompt內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換,同時(shí)保持主體、風(fēng)格、氛圍的一致性。豆包·視頻生成模型還支持包括黑白、3D動(dòng)畫、2D動(dòng)畫、國(guó)畫等多種風(fēng)格,包含1:1、3:4、4:3、16:9、9:16、21:9六個(gè)比例,適配于各種終端,以及電影、手機(jī)豎屏等不同畫幅。在2024年9月的火山引擎AI創(chuàng)新巡展上,豆包·音樂模型、豆包·同聲傳譯模型同期豆包·音樂模型能夠讓用戶“實(shí)現(xiàn)高品質(zhì)的音樂創(chuàng)作自由”:(1)歌詞更精準(zhǔn),僅需幾個(gè)字,就能生成情感表達(dá)精準(zhǔn)的歌詞。(2)旋律更多樣,提供10余種不同的音樂風(fēng)格和情緒表達(dá)。(3)演唱更真實(shí),基于豆包語(yǔ)音能力,媲美真人演唱效果。(4)創(chuàng)作門檻低,支持圖片成曲、靈感成曲、寫詞成曲多種創(chuàng)作方式。豆包·同聲傳譯模型則讓跨語(yǔ)言溝通“更無(wú)障礙”。(1)實(shí)時(shí)翻譯:超低延時(shí),邊說(shuō)邊譯,實(shí)時(shí)翻譯溝通無(wú)障礙。(2)精準(zhǔn)自然:翻譯流暢自然、準(zhǔn)確率高,在辦公、法律、教育等場(chǎng)景接近甚至超越人類同傳水平。(3)支持音色克隆:支持跨語(yǔ)言同音色翻譯,以更強(qiáng)聲音表現(xiàn)力打破溝通壁壘。此外,創(chuàng)新巡展上,豆包大模型團(tuán)隊(duì)宣布豆包通用模型pro和文生圖模型、語(yǔ)音合成模型等垂類模型大幅升級(jí)。不斷增加的各類模態(tài)以及規(guī)?;恼{(diào)用量讓豆包大模型“更強(qiáng)模型、更低價(jià)格、更易落地”的優(yōu)勢(shì)持續(xù)凸顯。其中,主力模型“豆包通用模型pro”最新版本在各維度上國(guó)內(nèi)領(lǐng)先,模型效果持續(xù)增強(qiáng)。9行業(yè)研究·信息服務(wù)行業(yè)92024年12月,豆包視覺理解模型正式發(fā)布,通用模型能力全面對(duì)齊GPT-4o。2024年12月18日,在火山引擎Force原動(dòng)力大會(huì)上,豆包大模型家族公布新成員“豆包·視覺理解模型”。它不僅具備強(qiáng)大的視覺感知能力,還能融合視覺與語(yǔ)言輸入,進(jìn)行綜合的深度思考和創(chuàng)作。根據(jù)圖像信息,豆包·視覺理解模型可以完成諸多復(fù)雜的邏輯計(jì)算任務(wù),包括解微積分題、分析論文圖表、診斷真實(shí)代碼問題等挑戰(zhàn)性任務(wù)。通過豆包·視覺理解模型,用戶可以同時(shí)輸入文本和圖像相關(guān)的問題,模型經(jīng)綜合理解,可給出準(zhǔn)確的回答。這將極大地簡(jiǎn)化開發(fā)流程,解鎖更多的大模型價(jià)值場(chǎng)景。豆包·視覺理解模型提供三大能力:●更強(qiáng)的內(nèi)容識(shí)別能力豆包·視覺理解模型有非常強(qiáng)的內(nèi)容識(shí)別能力,不僅可以識(shí)別出圖像中的物體類別、形狀、紋理等基本要素,還能理解物體之間的關(guān)系、空間布局以及場(chǎng)景的整體含義,甚至背后的文化知識(shí)。具體來(lái)說(shuō),視覺理解模型不僅可以識(shí)別現(xiàn)實(shí)中的物品,還能根據(jù)光影、輪廓、位置等特征,一眼識(shí)別出小動(dòng)物的影子,并“認(rèn)出”這是一只貓。行業(yè)研究·信息服務(wù)行業(yè)10●更強(qiáng)的理解推理能力豆包·視覺理解模型也具備出色的理解和推理能力。模型不僅能識(shí)別圖文信息,還能進(jìn)行復(fù)雜的邏輯計(jì)算。拍下一道需要進(jìn)行微積分運(yùn)算的數(shù)學(xué)題,豆包·視覺理解模型能很好地理解圖片問題,并根據(jù)提示詞進(jìn)行對(duì)應(yīng)的推理計(jì)算,給出答題思路?!窀?xì)膩的視覺描述能力除卻識(shí)別與理解推理能力,豆包·視覺理解模型還有著非常細(xì)膩的視覺描述和創(chuàng)作能力。當(dāng)用戶想設(shè)計(jì)一款文創(chuàng)產(chǎn)品贈(zèng)送客戶,模型可基于產(chǎn)品的造型或寓意寫一段真摯走心的祝福語(yǔ)。行業(yè)研究·信息服務(wù)行業(yè)除發(fā)布視覺理解模型之外,2024年12月的火山引擎Force原動(dòng)力大會(huì)現(xiàn)場(chǎng)還官宣了豆包語(yǔ)言大模型的升級(jí)。相比2024年5月版本,豆包最強(qiáng)模型Doubao-pro能力大幅提升。面向MMLU_pro評(píng)測(cè)集,模型綜合能力提升32%,和GPT-4o持平,使用價(jià)格僅為GPT-4o的八分之一。Doubao-pro指令遵循能力提升9%,代碼能力提升58%,GPQA專業(yè)知識(shí)方面能力提升54%,數(shù)學(xué)能力提升43%,推理能力提升13%,全面對(duì)齊GPT-4o水平。行業(yè)研究·信息服務(wù)行業(yè)12豆包音樂模型和文生圖模型也在火山引擎Force原動(dòng)力大會(huì)現(xiàn)場(chǎng)發(fā)布了升級(jí)。豆包·音樂模型,首次發(fā)布于2024年9月,時(shí)隔3個(gè)月后,已能支持3分鐘的完整音樂作品生成,實(shí)現(xiàn)包括前奏、主歌、副歌、間奏、過渡段等復(fù)雜結(jié)構(gòu)的作品創(chuàng)作。此外,全新版本模型可合理運(yùn)用旋律、節(jié)奏、和聲等信息,使全曲保持在風(fēng)格、情感等音樂元素上的連貫性。如對(duì)生成歌詞不滿意,還可進(jìn)行局部修改,給原調(diào)賦新詞,讓音樂創(chuàng)作更自由靈活。文生圖模型則新增“一鍵P圖,一鍵海報(bào)”技能?;诙拱竽P蛨F(tuán)隊(duì)成果SeedEdit,豆包文生圖模型2.1版支持通過自然語(yǔ)言對(duì)圖像進(jìn)行“一鍵P圖”,包括換裝、美化、涂抹、風(fēng)格轉(zhuǎn)化等任意編輯指令。同時(shí),豆包文生圖模型還支持“一鍵海報(bào)”,可實(shí)現(xiàn)精準(zhǔn)控制的文字圖案生成。通過打通LLM和DiT構(gòu)架,豆包文生圖模型構(gòu)建了高質(zhì)量文字渲染能力,可大幅提升文字生成準(zhǔn)確率。這種原生的文字渲染能力,讓文字與整體畫面的融合更為自然和實(shí)用。此外,面向3D仿真領(lǐng)域,豆包大模型家族還新發(fā)布了3D生成模型,該模型采用3D-DiT架構(gòu),可生成高質(zhì)量3D模塊。該模型與火山引擎數(shù)字孿生平臺(tái)veOmniverse結(jié)合使用,可以高效完成智能訓(xùn)練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作,成為一套支持AIGC創(chuàng)作的物理世界仿真模擬器。舉例來(lái)說(shuō),用戶只需輸入文本,即可實(shí)時(shí)生成并搭建起一個(gè)工廠車間場(chǎng)景。通過快速批量生成并上傳至云空間,布局師可實(shí)時(shí)調(diào)用并完成場(chǎng)景設(shè)計(jì),提升創(chuàng)作效率和協(xié)作體驗(yàn)。行業(yè)研究·信息服務(wù)行業(yè)13自2024年5月豆包大模型家族正式發(fā)布,到12月冬季原動(dòng)力大會(huì),短短7個(gè)月時(shí)SeedEdit、視頻生成模型、視覺理解模型等多項(xiàng)重磅成果,在語(yǔ)言能力、多模態(tài)理解與生成、模型推理、代碼生成等方面不斷提升。我們上文提到的FlagEval模型評(píng)測(cè),截至2024年12月21日的最新結(jié)果,在大語(yǔ)言模型總榜的“對(duì)話模型”榜單,豆包-pro32k版本已經(jīng)位列第一。行業(yè)研究·信息服務(wù)行業(yè)14而且,豆包大模型的潛力還不僅僅如此,字節(jié)跳動(dòng)的AI團(tuán)隊(duì)一直在積極研究各類AI前沿技術(shù),這也是豆包大模型能力的基石。舉例來(lái)講,在語(yǔ)音領(lǐng)域,字節(jié)AI團(tuán)隊(duì)判斷相比于WebSocket,為了提供更流暢自然的用戶體驗(yàn),適應(yīng)大模型向多模態(tài)方向的快速發(fā)展,AI實(shí)時(shí)語(yǔ)音方案采用實(shí)時(shí)通信(RTC)技術(shù)更為合適。于是團(tuán)隊(duì)深耕RTC技術(shù),火山引擎的RTC基于成熟的音頻3A處理技術(shù),針對(duì)“雙講”通過傳統(tǒng)回聲消除算法和深度學(xué)習(xí)算法的結(jié)合,不僅有效去除回聲,還能避免用戶語(yǔ)音被過度處理,確保云端語(yǔ)音識(shí)別(ASR)能準(zhǔn)確捕捉和識(shí)別用戶的語(yǔ)音信息。此外,火山引擎RTC通過簡(jiǎn)化算法提高處理速度,避免因算法復(fù)雜性帶來(lái)的額外延時(shí)。簡(jiǎn)單來(lái)說(shuō),這就使得用戶與AI的交流能夠像和朋友一樣自然,隨時(shí)打斷甚至直接插話。正是通過這一技術(shù),豆包大模型在2024年8月宣布支持實(shí)時(shí)語(yǔ)音通話。又比如,火山引擎就曾經(jīng)官方表示:“豆包·視頻生成模型生成強(qiáng)大畫面效果的背后,是字節(jié)跳動(dòng)在視頻大模型技術(shù)研發(fā)的不斷投入?!毙袠I(yè)研究·信息服務(wù)行業(yè)15而豆包大模型團(tuán)隊(duì)的AI前沿技術(shù)研究從未止步,僅僅在2024年11月,豆包大模型團(tuán)隊(duì)就發(fā)布了多項(xiàng)技術(shù)進(jìn)展。2024年11月1日,豆包大模型團(tuán)隊(duì)宣布與香港大學(xué)聯(lián)合提出HybridFlow(開源項(xiàng)目名:veRL),一個(gè)靈活且高效的RL(強(qiáng)化學(xué)習(xí))/RLHF(人類反饋強(qiáng)化學(xué)習(xí))框架。該框架采用混合編程模型,融合單控制器(Single-Controller)的靈活性和多控制器(Multi-Controller)的高效性,可更好實(shí)現(xiàn)和執(zhí)行多種RL算法,顯著提升訓(xùn)練吞吐量,降低開發(fā)和維護(hù)復(fù)雜度。實(shí)驗(yàn)結(jié)果表明,HybridFlow在運(yùn)行各種RL(HF)算法時(shí),吞吐量相較SOTA基線提升了1.5-20倍。2024年11月20日,豆包大模型團(tuán)隊(duì)宣布提出SuperClass,一個(gè)簡(jiǎn)單且高效的預(yù)訓(xùn)練方法。該方法首次舍棄文本編碼器,直接使用原始文本的分詞作為多分類標(biāo)簽,無(wú)需額外的文本過濾或篩選,比CLIP(可謂AI大模型中的“眼睛”。該模型通過將圖像與文本對(duì)齊,實(shí)現(xiàn)了圖像與語(yǔ)言之間的理解與關(guān)聯(lián)。近些年來(lái),CLIP被廣泛應(yīng)用于視覺理解、圖像問答、機(jī)器人/具身智能等多個(gè)領(lǐng)域)具有更高的訓(xùn)練效率。行業(yè)研究·信息服務(wù)行業(yè)162024年11月22日,豆包大模型團(tuán)隊(duì)宣布與北京大學(xué)聯(lián)合提出FAN:FourierAnalysisNetworks,一種新型神經(jīng)網(wǎng)絡(luò)架構(gòu),彌補(bǔ)了Transformer缺陷。FAN通過引入傅里葉原理,將周期性信息顯式嵌入到網(wǎng)絡(luò)結(jié)構(gòu)中,使模型更自然地捕捉和理解數(shù)據(jù)中的周期性特征,并且可用更少參數(shù)量和FLOPs無(wú)縫替換傳統(tǒng)MLP層。實(shí)驗(yàn)表明,F(xiàn)AN不僅在周期性建模上表現(xiàn)顯著優(yōu)于現(xiàn)有模型,而且在符號(hào)公式表示、時(shí)間序列預(yù)測(cè)、語(yǔ)言建模、圖像識(shí)別等實(shí)際任務(wù)中,同樣表現(xiàn)超過了Transformer等主流模型,尤其在域外測(cè)試數(shù)據(jù)上,表現(xiàn)出色。團(tuán)隊(duì)認(rèn)為,F(xiàn)AN提供了一種全新范式,可有效地對(duì)周期性建模,無(wú)縫替換傳統(tǒng)MLP,同時(shí)減少參數(shù)量和計(jì)算量,填補(bǔ)了當(dāng)前基礎(chǔ)模型在周期性建模方面缺陷,并展示出廣泛應(yīng)用潛力。2024年12月12日,字節(jié)跳動(dòng)更是聯(lián)合北京大學(xué)共同成立了北京大學(xué)-字節(jié)跳動(dòng)“豆包大模型系統(tǒng)軟件聯(lián)合實(shí)驗(yàn)室”,這一實(shí)驗(yàn)室將立足北京大學(xué)計(jì)算機(jī)學(xué)院在系統(tǒng)軟件領(lǐng)域的研究積累,依托字節(jié)跳動(dòng)在大模型應(yīng)用和系統(tǒng)方面的實(shí)踐優(yōu)勢(shì),聚焦人工智能大模型系統(tǒng)軟件研發(fā)。團(tuán)隊(duì)多名成員曾在SIGCOMM、NSDI等國(guó)際頂級(jí)會(huì)議發(fā)表成果,在訓(xùn)練和推理系統(tǒng)方面,有過豐富的大規(guī)模生產(chǎn)環(huán)境成功部署經(jīng)驗(yàn),為團(tuán)隊(duì)技術(shù)創(chuàng)新奠定了堅(jiān)實(shí)基礎(chǔ)。行業(yè)研究·信息服務(wù)行業(yè)17正如我們上文所提到的,豆包大模型團(tuán)隊(duì)一直在積極研究各類AI前沿技術(shù),這也是豆包大模型能力的基石,部分技術(shù)雖然還未落地,但是可以預(yù)期的前景十分廣闊。以HybridFlow為例,從ChatGPT到o1等各種大語(yǔ)言模型,強(qiáng)化學(xué)習(xí)(RL)算法在提升模型性能和適應(yīng)性方面起著至關(guān)重要的作用。在大模型后訓(xùn)練(Post-Training)階段引入RL方法,已成為提升模型質(zhì)量和對(duì)齊人類偏好的重要手段。我們認(rèn)為,HybridFlow作為一個(gè)靈活且高效的RL/RLHF框架,在可以預(yù)期的未來(lái),能夠?yàn)樽止?jié)的模型訓(xùn)練帶來(lái)重要助力。我們認(rèn)為,在短短6個(gè)月的時(shí)間里,豆包大模型不斷升級(jí)迭代,性能持續(xù)提升,已經(jīng)成為字節(jié)AI發(fā)展的重要基石,豆包大模型從FlagEval模型評(píng)測(cè)的“第二”邁向“第一”,這背后代表的是字節(jié)孜孜不倦的技術(shù)投入,這些投入不僅推動(dòng)了模型能力的持續(xù)擴(kuò)展,也有效地拓展了豆包大模型的應(yīng)用邊界,客觀上加速推動(dòng)了AI大模型應(yīng)用的普及與落地,此外,豆包大模型團(tuán)隊(duì)對(duì)AI前沿技術(shù)的積極研究,更加奠定了未來(lái)豆包大模型長(zhǎng)期發(fā)展的基礎(chǔ),未來(lái)豆包大模型的領(lǐng)先優(yōu)勢(shì)有望持續(xù)擴(kuò)大,“更強(qiáng)模型”也有望不斷實(shí)現(xiàn)。行業(yè)研究·信息服務(wù)行業(yè)18上文我們提到了字節(jié)對(duì)于AI發(fā)展的目標(biāo):更強(qiáng)模型:大使用量才能打磨出更好模型。豆包大模型目前已經(jīng)在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)、多場(chǎng)景應(yīng)用中落地,經(jīng)過千億級(jí)日tokens的持續(xù)打磨,模型能力和推理效果得到市場(chǎng)的廣泛認(rèn)可。更低價(jià)格:為了讓每一家企業(yè)都能用得起大模型,火山引擎大幅度降低大模型應(yīng)用推理成本。例如本次登榜的豆包通用模型pro,其32k版模型推理輸入價(jià)格僅為0.0008元/千tokens。更易落地:火山引擎2023年發(fā)布了一站式大模型服務(wù)平臺(tái)火山方舟,通過模型即服務(wù)的理念,幫助企業(yè)在高效、安全的環(huán)境里應(yīng)用各類模型。2024年5月,火山引擎對(duì)方舟平臺(tái)進(jìn)行了全面升級(jí),升級(jí)后的火山方舟2.0將大幅提升模型效果、核心插件、系統(tǒng)性能以及平臺(tái)體驗(yàn),幫助企業(yè)推進(jìn)大模型的價(jià)值創(chuàng)造。其中,更低價(jià)格和更易落地,都是為了AI應(yīng)用的落地和發(fā)展。2024年5月,豆包大模型剛發(fā)布的時(shí)候,豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千tokens,0.8厘就能處理1500多個(gè)漢字,比行業(yè)便宜99.3%。以豆包通用模型pro-32k版為例,模型推理輸入價(jià)格僅為0.0008元/千tokens。而市面上同規(guī)格模型的定價(jià)一般為0.12元/千tokens,是豆包模型價(jià)格的150倍。大模型價(jià)格,進(jìn)入“厘時(shí)代”。此后,豆包大模型家族維持了“極低”的定價(jià)體系,例如新發(fā)布的豆包·視覺理解的輸入價(jià)格為每千tokens0.003元,比行業(yè)平均價(jià)格降低85%,相當(dāng)于一塊錢可以處理284張720P的圖片,視覺理解模型也正式走進(jìn)厘時(shí)代。行業(yè)研究·信息服務(wù)行業(yè)19我們認(rèn)為,“極低”的定價(jià)能夠助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新,讓企業(yè)在同等甚至稍差的技術(shù)水平下更愿意去使用豆包模型,這也帶動(dòng)了豆包各類應(yīng)用的廣泛落此外,豆包還積極開發(fā)各類開發(fā)者工具,助力AI應(yīng)用的落地。2023年,火山引擎發(fā)布了一站式大模型服務(wù)平臺(tái)火山方舟,希望通過模型即服務(wù)的理念,幫助企業(yè)在高效、安全的環(huán)境里應(yīng)用各類模型。2024年5月,豆包大模型首次發(fā)布時(shí),火山引擎對(duì)方舟平臺(tái)進(jìn)行了全面升級(jí),升級(jí)后的火山方舟2.0將大幅提升模型效果、核心插件、系統(tǒng)性能以及平臺(tái)體驗(yàn),幫助企業(yè)推進(jìn)大模型的價(jià)值創(chuàng)造。在插件和工具鏈上,方舟2.0升級(jí)了聯(lián)網(wǎng)插件,提供頭條抖音同款搜索能力,實(shí)時(shí)連接海量?jī)?yōu)質(zhì)數(shù)據(jù),同時(shí)使用文本、圖像、語(yǔ)音等多模態(tài)交互方式,并通過業(yè)內(nèi)領(lǐng)先的意圖識(shí)別能力,大幅提升模型的信息獲取能力;升級(jí)內(nèi)容插件,提供頭條抖音同源海量?jī)?nèi)容,支持多模態(tài)交互,提供基于意圖的垂類內(nèi)容信息檢索,內(nèi)容時(shí)效檢索更強(qiáng),幫助大模型深入理解、檢索和生成內(nèi)容;升級(jí)知識(shí)庫(kù)插件,提供毫秒級(jí)百億規(guī)模的高性能檢索,秒級(jí)流式知識(shí)庫(kù)索引更新,內(nèi)嵌豆包向量化模型,提高搜索的相關(guān)性和準(zhǔn)確性。行業(yè)研究·信息服務(wù)行業(yè)20除以上核心插件升級(jí)之外,火山方舟2.0也全面升級(jí)了系統(tǒng)承載能力、安全防護(hù)能力和算法服務(wù)能力。在系統(tǒng)承載力上,提供充沛的GPU算力資源,分鐘級(jí)千卡擴(kuò)縮容的超強(qiáng)彈性,保障業(yè)務(wù)穩(wěn)定和成本可控;在安全防護(hù)上,通過安全沙箱構(gòu)建可信的執(zhí)行環(huán)境,多維度的安全架構(gòu),保障數(shù)據(jù)安全;此外,火山引擎提供專業(yè)的算法團(tuán)隊(duì)服務(wù),幫助客戶釋放獨(dú)有數(shù)據(jù)價(jià)值,讓企業(yè)大模型應(yīng)用輕松落地。此外,火山引擎還正式發(fā)布了扣子專業(yè)版。扣子(Coze)作為字節(jié)跳動(dòng)推出的新一代AI應(yīng)用開發(fā)平臺(tái),具備低門檻、個(gè)性化、實(shí)時(shí)性、多模態(tài)等優(yōu)勢(shì),并集合海量的AI資源、豐富的發(fā)布渠道、一鍵自定義API服務(wù),幫助填補(bǔ)大模型到用戶場(chǎng)景的最后一公火山引擎正式發(fā)布了扣子專業(yè)版。扣子專業(yè)版在扣子可視化靈活編排智能體的能力基礎(chǔ)上,進(jìn)一步提供企業(yè)級(jí)SLA和多種高級(jí)特性,使AI應(yīng)用更易落地,讓企業(yè)更專注于通過智能體創(chuàng)新,驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)。2024年7月,火山方舟進(jìn)一步升級(jí)了核心插件和智能體能力,以及全周期數(shù)據(jù)安全可信方案,其中,頭條抖音同款三大插件——聯(lián)網(wǎng)插件、內(nèi)容插件和RAG知識(shí)庫(kù)插件能力再次升級(jí),還新增了網(wǎng)頁(yè)解析插件和計(jì)算器插件,進(jìn)一步擴(kuò)寬模型能力的邊界,支持企業(yè)多樣的應(yīng)用需求。智能體是大模型落地有效路徑。為幫助企業(yè)“低門檻”開發(fā)智能體,火山引擎提供扣子專業(yè)版,支持低代碼構(gòu)建契合企業(yè)業(yè)務(wù)場(chǎng)景的專家型“AIBot”,并通過專業(yè)級(jí)SLA和多種高級(jí)特性保障AI應(yīng)用在企業(yè)中高效落地。火山引擎還打造了HiAgent企業(yè)專屬AI應(yīng)用創(chuàng)新平臺(tái),幫助企業(yè)打通擁抱大模型的最后一公里。HiAgent能夠從速度、密度、厚度三個(gè)維度全方位賦能企業(yè)AI應(yīng)用的快速落地與持續(xù)優(yōu)化:速度:HiAgent將模型應(yīng)用開發(fā)方式從代碼進(jìn)化到自然語(yǔ)言,業(yè)務(wù)人員可以利用提示詞、知識(shí)庫(kù)、插件等工具,像搭積木一樣低代碼搭建智能體,提升應(yīng)用創(chuàng)新的“速度”。行業(yè)研究·信息服務(wù)行業(yè)密度:增強(qiáng)的企業(yè)級(jí)知識(shí)庫(kù)RAG,讓知識(shí)沉淀萃取成智慧,在企業(yè)流程中體現(xiàn)知識(shí)的“密度”。厚度:HiAgent豐富的專屬企業(yè)級(jí)特性,允許企業(yè)自定義新AI中臺(tái),并支持混合部署,積累AI資產(chǎn),讓AI能力有“厚度”。此外,火山引擎AI全棧云依托字節(jié)跳動(dòng)的海量資源共池,支持多芯、多云架構(gòu),擁有超大規(guī)模算力,支持萬(wàn)卡集群組網(wǎng)、萬(wàn)億參數(shù)MoE大模型;提供超高性能網(wǎng)絡(luò),支持3.2TbpsRDMA網(wǎng)絡(luò),全球網(wǎng)絡(luò)POP覆蓋廣,時(shí)延優(yōu)化最高達(dá)75%;提供優(yōu)質(zhì)的存儲(chǔ)性能,文件存儲(chǔ)vePFS支持2TB/s吞吐并行存儲(chǔ)、3000萬(wàn)IOPS;提供毫秒級(jí)性能監(jiān)控,智能GPU自愈能力,保障計(jì)算資源的穩(wěn)定運(yùn)行;提供靈活的資源使用和計(jì)費(fèi)方式,自研mGPU容器共享方案,GPU利用率提升100%+,為生成式AI工作負(fù)載提供更高性價(jià)比的算力資源;強(qiáng)大的彈性調(diào)度能力,支持分鐘級(jí)創(chuàng)建千臺(tái)實(shí)例;提供一站式資源服務(wù)和全鏈路數(shù)據(jù)管理能力,助力企業(yè)高效、彈性構(gòu)建AI訓(xùn)練或推理業(yè)務(wù),加速企業(yè)實(shí)現(xiàn)AI應(yīng)用落地。2024年12月,火山方舟、扣子平臺(tái)以及HiAgent等平臺(tái)進(jìn)一步升級(jí),加速了大模型落地,為企業(yè)和開發(fā)者提供高效的工具。火山方舟作為一站式大模型服務(wù)平臺(tái),火山方舟憑借Cache、離線推理模式等產(chǎn)品與升級(jí),以及全新發(fā)布的Prompt優(yōu)解,加速大模型能力落地。大模型落地過程中,prompt(提示詞)的編寫,往往是橫在面前的第一道門檻,大模型能力越強(qiáng),對(duì)指示詞、指令的遵循程度也就越高?;鹕揭姘l(fā)布Prompt優(yōu)解,可以通過“自動(dòng)+互動(dòng)”方式協(xié)助用戶編寫提示詞,讓用戶在互動(dòng)中表達(dá)需求,快速上手。用機(jī)器實(shí)現(xiàn)類似人類的反思、類比、錯(cuò)誤總結(jié)能力,全自動(dòng)優(yōu)化prompt,助力企業(yè)低成本高效率獲得高質(zhì)量prompt。圖22Prompt優(yōu)解功能介紹行業(yè)研究·信息服務(wù)行業(yè)22在價(jià)格方面,火山引擎始終把更低、更好的成本和價(jià)格放在首位。為進(jìn)一步踐行“人人用得起,才是好模型”理念,火山引擎發(fā)布離線批量推理方案和上下文緩存,幫助用戶實(shí)現(xiàn)更為精細(xì)化和低成本的運(yùn)營(yíng)。以上下文緩存為例,針對(duì)有大量聊天、客服對(duì)話的連續(xù)型客戶需求場(chǎng)景,火山引擎推出context上下文緩存記憶方案,無(wú)需重復(fù)對(duì)話就可以保持上下文,可將多輪對(duì)話延遲減少50%,極大改善客戶體驗(yàn)。同時(shí)在命中上下文緩存部分,降低企業(yè)使用成本80%。全新扣子1.5和HiAgent1.5也在2024年12月發(fā)布。(1)開發(fā)者生態(tài)逐漸完善,超過100萬(wàn)活躍開發(fā)者,發(fā)布超過200萬(wàn)個(gè)智能體。(2)全新的AI應(yīng)用開發(fā)環(huán)境,支持GUI搭建界面,并且可以一鍵發(fā)布為小程序、H5、API等多種應(yīng)用形態(tài)。(3)更強(qiáng)的多模態(tài)能力,提供音視頻對(duì)話能力,端到端延遲響應(yīng)低至1秒低成本SDK快速接入各類硬件。(4)海量的精品模板,涵蓋多業(yè)務(wù)場(chǎng)景,一鍵復(fù)制使用。HiAgent1.5:(1)更懂AI轉(zhuǎn)型:提供觀測(cè)&評(píng)測(cè)體系,保障效果生產(chǎn)可用;提供100+行業(yè)應(yīng)用模板,企業(yè)可開箱即用;提供配套AI咨詢,幫助企業(yè)找到AI落地路徑。(2)更深業(yè)務(wù)適配:提供豐富的企業(yè)級(jí)插件、靈活的應(yīng)用集成機(jī)制;GraphRAG構(gòu)建知識(shí)圖譜,提供細(xì)粒度的知識(shí)資產(chǎn)管理;生成式畫布融合CUI和GUI,打造智能交互引擎。(3)更強(qiáng)安全保障:支持RAG知識(shí)庫(kù)和大模型全棧私有化部署。此外,豆包大模型最新發(fā)布的豆包·視覺理解模型、豆包·文生圖模型2.1和豆包·音樂模型,都可以在扣子通過插件的方式體驗(yàn),將有助于更多多模態(tài)AI應(yīng)用在扣子誕行業(yè)研究·信息服務(wù)行業(yè)23可以看出,除了認(rèn)真打磨技術(shù),讓模型更強(qiáng)以外,字節(jié)一直努力在踐行著“更低價(jià)格”和“更易落地”,這也使得字節(jié)的大模型,真正的在各行各業(yè)遍地開花。早在2024年5月豆包大模型剛發(fā)布時(shí),豆包大模型和火山方舟2.0就已經(jīng)在金融、汽車、智能終端、電商零售、教育科研等多個(gè)行業(yè)實(shí)踐落地。招商銀行、海底撈火鍋、超級(jí)猩猩、攜程旅游、飛常準(zhǔn)、獵聘等企業(yè)也已經(jīng)在扣子上搭建了智能體。復(fù)旦大學(xué)、浙江大學(xué)等名校也為課程和實(shí)驗(yàn)搭建了“AI助教”。以招商銀行為例,作為金融行業(yè)AI轉(zhuǎn)型的踐行者,招商銀行正在智能外呼、數(shù)字人、智能數(shù)據(jù)助理等上百個(gè)AI服務(wù)場(chǎng)景探索和投入。招商銀行數(shù)字金融發(fā)展辦公室主任高旭磊就表示,大模型將為銀行全鏈條業(yè)務(wù)帶來(lái)改造和升級(jí)。攜手火山引擎,雙方將共建大模型應(yīng)用場(chǎng)景及高性能基礎(chǔ)設(shè)施,改造現(xiàn)有系統(tǒng)和產(chǎn)品,催生大量以AI為核心的智能體應(yīng)用。蒙牛集團(tuán)也與火山引擎合作夯實(shí)技術(shù)底座,并構(gòu)建了AI營(yíng)養(yǎng)專家、AI育嬰師、AI數(shù)據(jù)分析師、產(chǎn)品創(chuàng)新助手、熱點(diǎn)創(chuàng)意助手等智能體矩陣,提升前端消費(fèi)者體驗(yàn),助力后端運(yùn)營(yíng)人員決策。2024年7月,豆包大模型日均tokens使用量超過5000億,自2024年5月15日豆包大模型發(fā)布的2個(gè)月內(nèi),平均每家企業(yè)客戶日均tokens使用量增長(zhǎng)了22倍?,F(xiàn)如今,不少前沿技術(shù)已應(yīng)用于豆包APP、即夢(mèng)等C端產(chǎn)品,并通過火山引擎服務(wù)眾多行業(yè)的企業(yè)客戶。2024年12月豆包大模型日均tokens調(diào)用量突破4萬(wàn)億,7個(gè)月增長(zhǎng)幅度達(dá)33倍。尤其在汽車、手機(jī)、智能終端等新興行業(yè),豆包大模型調(diào)用量增長(zhǎng)了50倍以上。此外,字節(jié)還高度重視生態(tài)建設(shè),早在豆包大模型正式發(fā)布的2024年5月的2024春季火山引擎FORCE原動(dòng)力大會(huì)上,火山引擎還與OPPO、vivo、榮耀、小米、三星、華碩宣布成立智能終端大模型聯(lián)盟。OPPO小布助手、榮耀MagicBook的YOYO助理、小米“小愛同學(xué)”、華碩筆記本電腦的豆叮AI助手等應(yīng)用,均已接入火山引擎的大模型服務(wù)。此外,字節(jié)還組織了火山引擎汽車行業(yè)大模型生態(tài)聯(lián)盟。2024年5月的時(shí)候,聯(lián)盟已聚合中國(guó)電動(dòng)車百人會(huì)、廣汽集團(tuán)、北汽集團(tuán)、一汽奔騰、上汽大通、長(zhǎng)城汽車、捷途汽車、智己汽車、哪吒汽車、吉祥汽車、東軟睿馳、美行科技、大搜車等眾多汽車產(chǎn)業(yè)上下游企業(yè),共同打造汽車大模型生態(tài)。當(dāng)時(shí)字節(jié)的宣傳語(yǔ)就是:“大模型定價(jià)低于行業(yè)價(jià)格99%,火山引擎助力車企加速駛?cè)搿瓵I時(shí)代’”。行業(yè)研究·信息服務(wù)行業(yè)24汽車大模型生態(tài)聯(lián)盟也在不斷擴(kuò)容,在2024年8月又迎來(lái)了領(lǐng)克汽車、吉利銀河、幾何汽車、上汽榮威、上汽名爵、雄獅科技、大圣科技等多位新成員。而在這基礎(chǔ)上,豆包大模型在汽車行業(yè)的拓展一騎絕塵,正如上文介紹的,豆包大模型2024年5月發(fā)布到2024年12月,在汽車行業(yè)的調(diào)用量增長(zhǎng)了50倍以上,遠(yuǎn)超平均值。2024年8月,火山引擎還攜手多點(diǎn)DMALL成立零售大模型生態(tài)聯(lián)盟,通過融合豆包大模型與AI能力,讓零售企業(yè)能夠以極低的試錯(cuò)成本將大模型技術(shù)應(yīng)用到業(yè)務(wù)場(chǎng)景中,推動(dòng)零售行業(yè)的智能化升級(jí),提升行業(yè)的整體效能和創(chuàng)新能力,以適應(yīng)不斷變化的市場(chǎng)需求和消費(fèi)者行為,加速零售行業(yè)的創(chuàng)新步伐。零售聯(lián)盟首批成員就包括物美集團(tuán)、抖音電商、抖音生活服務(wù)、百勝、麥當(dāng)勞、中國(guó)飛鶴、海底撈、居然之家、南7-11、重慶百貨、百果園、波司登、天虹、三得利、絕味、名創(chuàng)優(yōu)品、NielsenIQ、電我們認(rèn)為,對(duì)生態(tài)的重視,也使得豆包大模型能夠更便利的進(jìn)入不同的行業(yè),并在各企業(yè)端落地。而且,值得注意的是,tokens調(diào)用規(guī)模化增長(zhǎng)的同時(shí),豆包大模型在不同場(chǎng)景中都在快速增長(zhǎng)、全面開花。我們認(rèn)為,這說(shuō)明不同領(lǐng)域企業(yè)對(duì)于豆包模型不同需求場(chǎng)景下的使用正在不斷深化。行業(yè)研究·信息服務(wù)行業(yè)25我們認(rèn)為,“極低”的定價(jià)能夠助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新,讓企業(yè)在同等的技術(shù)水平下更愿意去使用豆包模型,這也帶動(dòng)了豆包各類應(yīng)用的廣泛落地,而不斷增加的tokens調(diào)用量,疊加越來(lái)越多的場(chǎng)景覆蓋嗎,使得豆包大模型能力越來(lái)越全面,這就進(jìn)一步推動(dòng)豆包大模型變得“更強(qiáng)”,使得“更強(qiáng)模型”這一目標(biāo)能夠進(jìn)一步實(shí)現(xiàn),從而帶動(dòng)了多個(gè)良性循環(huán):模型能力層面:低價(jià)+易落地+好模型,使得豆包大模型用戶數(shù)持續(xù)提升,用戶越多,tokens調(diào)用量越大,場(chǎng)景覆蓋越多,從而使得豆包模型能力越來(lái)越全面,模型越強(qiáng),用戶模型使用意愿越強(qiáng),最終推動(dòng)模型能力持續(xù)迭代。而且tokens調(diào)用量越大,字節(jié)算力規(guī)模越大,算力單位成本越低,模型價(jià)格就能進(jìn)一步下降,從而使得用戶模型使用意愿進(jìn)一步增強(qiáng),從而使得tokens調(diào)用量進(jìn)一步提升,使得算力單位成本進(jìn)一步下降,最終推動(dòng)模型價(jià)格持續(xù)下降。展望未來(lái),字節(jié)AI的目標(biāo):“更強(qiáng)模型”、“更低價(jià)格”、“更易落地”正在推動(dòng)字節(jié)AI更加高速的落地千行百業(yè),AI應(yīng)用爆發(fā)的前夜也正離我們?cè)絹?lái)越近。行業(yè)研究·信息服務(wù)行業(yè)262023年8月豆包APP(由于豆包AI應(yīng)用/豆包AI大模型名稱相同,下文如僅用“豆包”二字,則專指豆包AI應(yīng)用,“豆包xx模型/大模型”則指代各類豆包AI大模型)正式上線。圖27豆包APP版示例行業(yè)研究·信息服務(wù)行業(yè)27伴隨時(shí)間的推移,豆包APP的應(yīng)用功能也不斷深化。2024年7月16日,豆包瀏覽器插件推出播客總結(jié)功能,并不斷優(yōu)化視頻總結(jié)功能,不僅可以總結(jié)視頻內(nèi)容,還能增加多級(jí)目錄和思維導(dǎo)圖,方便用戶觀看和消化超2024年7月17日,三星電子面向中國(guó)市場(chǎng)發(fā)布新一代GalaxyZ系列產(chǎn)品。會(huì)上,三星電子與火山引擎官宣合作,為GalaxyZFold6、GalaxyZFlip6手機(jī)的Bixby語(yǔ)音助手和AI視覺接入豆包大模型,提升手機(jī)的智能應(yīng)用體驗(yàn)。2024年8月8日,豆包音樂生成功能上線。用戶在豆包“音樂生成”中輸入主題或歌詞,設(shè)定音樂風(fēng)格、情緒及音色,便能快速生成一首約1分鐘的詞曲。2024年9月6日,豆包旗下教育品牌“豆包愛學(xué)”完成升級(jí),應(yīng)用推出作業(yè)批改、拍照答疑、作文創(chuàng)作等多項(xiàng)實(shí)用功能,以適配家庭教育各類場(chǎng)景。此外,豆包愛學(xué)還提供知識(shí)問答、AI搜知識(shí)、與歷史名人對(duì)話、故事創(chuàng)作等功能,旨在提升用戶綜合素2024年10月,豆包App和電腦版完成多項(xiàng)功能更新。豆包App支持上傳附件支持多種音頻文件格式,用戶可快速總結(jié)會(huì)議錄音、課程記錄等內(nèi)容。豆包電腦版上線「語(yǔ)2024年11月11日,豆包電腦版上線了一項(xiàng)新功能,讓用戶不懂P圖也能實(shí)現(xiàn)輕松修圖。在豆包電腦版,用戶選擇“圖片生成”,生成圖片后,選擇“繼續(xù)編輯”,輸入一句簡(jiǎn)單的指令,就能實(shí)現(xiàn)一鍵P圖。此外,用戶也可以通過“參考圖”入口上傳圖片進(jìn)行二次加工。2024年12月5日,豆包正式支持一鍵生成帶有指定文字的圖片。行業(yè)研究·信息服務(wù)行業(yè)28行業(yè)研究·信息服務(wù)行業(yè)292024年12月10日,豆包電腦版視頻生成功能開啟內(nèi)測(cè)使用,用戶內(nèi)測(cè)申請(qǐng)通過后,在豆包電腦版選擇“視頻生成”,上傳一張圖片輸入提示詞,并添加運(yùn)鏡、分鏡信息,即可生成一段視頻。不難發(fā)現(xiàn),伴隨豆包大模型的不斷升級(jí)迭代,豆包的功能也在不斷更新。舉例來(lái)說(shuō),2024年8月9日,火山引擎宣布豆包大模型支持實(shí)時(shí)語(yǔ)音通話功能。該功能通過實(shí)時(shí)通信(RTC)技術(shù),提高了語(yǔ)音數(shù)據(jù)的傳輸效率和流暢度,適用于AI社交陪伴、口語(yǔ)學(xué)習(xí)、游戲NPC及呼叫中心等場(chǎng)景。而在2024年10月,豆包電腦版就上線「語(yǔ)音通話」功能。又比如,2024年9月24日,在火山引擎AI創(chuàng)新巡展深圳站活動(dòng)上,豆包視頻生成模型PixelDance與Seaweed正式發(fā)布,支持多鏡頭一致性切換及多拍動(dòng)作與主體復(fù)雜交互。在2024年12月10日,豆包電腦版視頻生成功能就開啟了內(nèi)測(cè)使用。行業(yè)研究·信息服務(wù)行業(yè)30在豆包上線后很長(zhǎng)一段時(shí)間內(nèi),字節(jié)官方并沒有進(jìn)行大量公開宣傳,豆包的官微都是在2024年6月才發(fā)布了第一篇官方文章,但是豆包的流量卻快速提升。2024年5月,豆包大模型正式發(fā)布的時(shí)候,基于豆包APP在蘋果APPStore和各大安卓應(yīng)用市場(chǎng)的表現(xiàn),豆包APP的下載量在AIGC類應(yīng)用中已經(jīng)排名第一。2024年11月,根據(jù)AI產(chǎn)品榜·應(yīng)用榜(APP),豆包11月上榜應(yīng)用APPMAU高達(dá)5998萬(wàn),對(duì)比第二名文小言1299萬(wàn)的數(shù)據(jù)在國(guó)內(nèi)處于斷崖領(lǐng)先的位置。在全球范圍內(nèi),豆包的11月上榜應(yīng)用APPMAU也能排到第二的位置,僅次于ChatGPT。行業(yè)研究·信息服務(wù)行業(yè)那么究竟是什么帶給了豆包如此強(qiáng)大的流量?我們認(rèn)為,從表面來(lái)看,豆包首先是一個(gè)“好用”的AI助手,能滿足用戶在多種使用場(chǎng)景下的不同需求。作為一款通用型AI產(chǎn)品,豆包致力于去滿足不同用戶具體且真實(shí)的需求,讓用戶像開口問身邊的朋友一樣快捷方便地和豆包溝通,真正做到什么都問問豆包。日常生活里各種知識(shí)和經(jīng)驗(yàn)問答,豆包總能快速為用戶答疑解惑。例如最近上海到了銀杏季節(jié),用戶問豆包“上海哪里可以看銀杏??,豆包很快就列出了市中心和郊區(qū)的觀賞地及特點(diǎn),并配上了銀杏樹的照片和路線視頻攻略,非常方便。在教育學(xué)習(xí)領(lǐng)域,豆包也能很快很好的滿足學(xué)習(xí)和教育的各種需求。比如解答奧數(shù)題,豆包可以給用戶進(jìn)行解答。豆包能提供詳盡的解題步驟,引導(dǎo)用戶理解題目解法。如果用戶對(duì)某類題目掌握的不太牢固,豆包還可以繼續(xù)給用戶出幾道同類知識(shí)點(diǎn)題目鞏固練習(xí)。英語(yǔ)口語(yǔ)練習(xí)也是重要的教育場(chǎng)景。根據(jù)用戶反饋,豆包的發(fā)音、詞匯量、句型都遠(yuǎn)遠(yuǎn)超過普通用戶水平。通過豆包實(shí)時(shí)語(yǔ)音通話功能,用戶可以實(shí)現(xiàn)和豆包一來(lái)一回練英語(yǔ),毫不尷尬,也節(jié)約了請(qǐng)老師輔導(dǎo)的開銷。此外,生成的英語(yǔ)對(duì)話還配有字幕,用戶退出后還可以復(fù)習(xí)。行業(yè)研究·信息服務(wù)行業(yè)32在工作場(chǎng)景中,豆包也能滿足眾多使用場(chǎng)景。以論文這一“問問豆包”的高頻場(chǎng)景為例,用戶不僅可以讓豆包總結(jié),劃詞解釋專業(yè)名詞,還可以多追問,不論是圖片還是實(shí)驗(yàn)數(shù)據(jù),都可以截圖問問豆包,它都能給出清晰的圖表解釋和實(shí)驗(yàn)含義。此外,文字、圖片、音樂、視頻的創(chuàng)作上,用戶也都會(huì)問問豆包。我們認(rèn)為,豆包的“好用”只是其廣受歡迎的最表面,在深層,豆包團(tuán)隊(duì)做出了大量的努力。首先,豆包團(tuán)隊(duì)努力讓豆包“接地氣”、“擬人化”。在豆包團(tuán)隊(duì)看來(lái),“擬人化”是大模型產(chǎn)品的新特性。AI除了帶來(lái)了新的能力,也帶來(lái)了新的交互方式,用和人類對(duì)齊的交互體驗(yàn),降低使用門檻,也讓用戶在使用產(chǎn)品時(shí)感覺到產(chǎn)品有類似人的溫度。為了體現(xiàn)這種擬人的感受,豆包團(tuán)隊(duì)希望產(chǎn)品的名字,就像用戶對(duì)一個(gè)親密朋友日常稱呼的昵稱。在簡(jiǎn)單、好讀、好記的通用原則下。最終,團(tuán)隊(duì)在有點(diǎn)隨意,甚至字節(jié)跳動(dòng)產(chǎn)品與戰(zhàn)略副總裁朱駿都曾表示:?(選中豆包后團(tuán)隊(duì)認(rèn)為)反正以后如果有更好的名字也還可以改嘛”的情況下,選擇了“豆包”這一親切又有點(diǎn)可愛的名字。豆包上線后,名字的起源引起了眾多用戶的猜測(cè)和討論,湊巧的吸引了普通用戶的關(guān)注,而且是用戶主動(dòng)幫豆包想出了兩個(gè)有趣的解釋1)豆包=抖音的官方bot,“抖bot”諧音就是豆包;(2)說(shuō)豆包=“都包了”,工作生活學(xué)習(xí)的需求都包了,寓意是通用助手的產(chǎn)品愿景。這兩個(gè)解釋最終也都得到了豆包官方團(tuán)隊(duì)的認(rèn)可。我們認(rèn)為,豆包的“接地氣”和“擬人化”使得其發(fā)布最初,就得到了一波“自來(lái)水”,同時(shí),也讓其更易于被普通用戶所接受。行業(yè)研究·信息服務(wù)行業(yè)33此外,豆包團(tuán)隊(duì)不斷通過各種手段讓豆包更易用、更“快”。(1)豆包輸入更方便,所以更“快”在產(chǎn)品設(shè)計(jì)上,豆包團(tuán)隊(duì)一直努力讓用戶的輸入更快更方便。豆包團(tuán)隊(duì)非常注重多模態(tài)的輸入和打磨,尤其是語(yǔ)音輸入。輸入速度上來(lái)說(shuō),普通人的打字速度大概是每分鐘60到80個(gè)字,而普通人的語(yǔ)速每分鐘可以到250至300字。所以一般情況下,語(yǔ)音輸入效率至少是鍵盤輸入的3倍以上。語(yǔ)音的效率天然更高,更快。同時(shí),豆包的語(yǔ)音能準(zhǔn)確轉(zhuǎn)錄各種語(yǔ)音信號(hào),識(shí)別不同語(yǔ)言、方言、口音。豆包對(duì)于人名、生詞,也能結(jié)合上下文做出準(zhǔn)確分析。語(yǔ)音以外,豆包也上線了視覺識(shí)別模型。無(wú)論是讀心電圖、還是拍奧數(shù)題,都依靠視覺輸入。人和世界的溝通中,視覺是很重要的一環(huán)。相比用語(yǔ)言描述心電圖上的復(fù)雜信息,直接拍下來(lái)問問豆包,會(huì)更快更方便。(2)豆包離用戶更近,所以更“快”2024年10月,豆包團(tuán)隊(duì)發(fā)布了OlaFriend智能體耳機(jī),其宣傳語(yǔ)即為:“讓豆包,成為隨時(shí)隨地陪伴在你耳邊的朋友”。OlaFriend耳機(jī)與豆包APP深度結(jié)合。在官網(wǎng)和官方宣傳片中,豆包強(qiáng)調(diào)了OlaFriend能夠在信息查詢、旅游出行、英語(yǔ)學(xué)習(xí)及情感交流等場(chǎng)景為用戶提供幫助。行業(yè)研究·信息服務(wù)行業(yè)34OlaFriend耳機(jī)這樣輕便的可穿戴設(shè)備,讓豆包能夠成為用戶耳邊伴隨的朋友,在路上隨時(shí)和豆包對(duì)話,最快。運(yùn)動(dòng),逛街,旅行時(shí),用戶無(wú)需再拿出手機(jī)或其他設(shè)備,直接通過耳機(jī)就能和豆包對(duì)話,快速獲取信息。這種無(wú)縫連接的交互方式,讓豆包真正成為了用戶身邊的智能伙伴,陪伴用戶度過每一個(gè)需要知識(shí)和幫助的時(shí)刻。此外,豆包團(tuán)隊(duì)在2024年還重點(diǎn)建設(shè)了豆包電腦版。用戶可以把電腦版當(dāng)成瀏覽器,直接打開網(wǎng)頁(yè)。在瀏覽中遇到需要提問、翻譯或總結(jié)時(shí),直接點(diǎn)擊“問問豆包”,就能輕松喚起,獲得幫助。豆包還即將上線“文檔編輯器”功能,采取全新的交互方式,生成文檔后,用戶可以在畫布中自由編輯,讓AI針對(duì)特定詞語(yǔ)和段落優(yōu)化改寫,也可以一鍵全文潤(rùn)色、調(diào)整長(zhǎng)度,全網(wǎng)搜圖等,讓創(chuàng)作更輕松。行業(yè)研究·信息服務(wù)行業(yè)35(3)豆包模型能力更強(qiáng),所以更“快”豆包的快,究其根本,是背后的豆包大模型幫助用戶做了意圖識(shí)別、信息收集、處理、整合和分析。當(dāng)用戶提出較為復(fù)雜的搜索或?qū)懽餍枨髸r(shí),豆包快速識(shí)別用戶意圖,推理并拆解內(nèi)容,再進(jìn)行多步驟分析和推理,并調(diào)度搜索,呈現(xiàn)總結(jié)后的結(jié)果。同時(shí),豆包還能將搜索到的文本信息與視頻內(nèi)容相結(jié)合,為用戶提供更加豐富和直觀的體驗(yàn)。此外,字節(jié)還投入了大量資源為豆包引流。根據(jù)第一財(cái)經(jīng)雜志官方百家號(hào)援引廣告情報(bào)分析平臺(tái)AppGrowing統(tǒng)計(jì),豆包智能助手2024年4月、5月的投放金額接近1800萬(wàn)元,等到2024年6月上旬,投放金額飆升至1.24億元。2024年6月開啟大規(guī)模買量投流后,豆包月活躍用戶(MAU)迅速超過競(jìng)爭(zhēng)對(duì)手。與此同時(shí),字節(jié)還限制了豆包的競(jìng)對(duì)產(chǎn)品在抖音平臺(tái)的廣告投放。行業(yè)研究·信息服務(wù)行業(yè)36我們認(rèn)為,總結(jié)來(lái)講,豆包的功能發(fā)展全面,并且多端覆蓋,使用門檻又低,日常場(chǎng)景夠用,再疊加字節(jié)強(qiáng)大的廣告投放和流量效應(yīng),豆包的關(guān)注度持續(xù)提升也就是情理之中的事情了。而豆包也遠(yuǎn)不是字節(jié)在AI應(yīng)用唯一的布局。根據(jù)第一財(cái)經(jīng)雜志官方百家號(hào),字節(jié)目前還在正常運(yùn)營(yíng)的AI應(yīng)用大約20款,其中絕大部分是在2024年以后發(fā)布的。行業(yè)研究·信息服務(wù)行業(yè)37研發(fā)團(tuán)隊(duì)產(chǎn)品研發(fā)團(tuán)隊(duì)AnyDoor(海外)應(yīng)用應(yīng)用視頻剪輯視頻剪輯TikTok抖音AI分身(KOL內(nèi)測(cè))TikTokCozeCoze(海外)模型分享社區(qū)硬件硬件字節(jié)的AI應(yīng)用不僅在數(shù)量上突出,在市場(chǎng)認(rèn)可度上也擁有領(lǐng)先地位。硅谷知名投資機(jī)構(gòu)a16z,其每6個(gè)月會(huì)深入挖掘數(shù)據(jù),分別評(píng)選出50款領(lǐng)先的生成式AIWeb應(yīng)用和50款領(lǐng)先的生成式AI移動(dòng)應(yīng)用,豆包在2024年8月份的最新榜單中同時(shí)出現(xiàn)在了AIWeb應(yīng)用和AI移動(dòng)應(yīng)用兩個(gè)榜單中。此外,字節(jié)跳動(dòng)旗下還有4個(gè)應(yīng)用上榜。在生成式AIWeb應(yīng)用榜單,除豆包外,AI智能體開發(fā)平臺(tái)Coze(海外版的“扣子”)、教育類AI應(yīng)用Gauth上榜。行業(yè)研究·信息服務(wù)行業(yè)38在生成式AIApp應(yīng)用榜單,除豆包外,豆包海外版Cici、圖片編輯類的AI應(yīng)用Hypic上榜。行業(yè)研究·信息服務(wù)行業(yè)39根據(jù)新浪財(cái)經(jīng),NeurIPS2024大會(huì)上,前OpenAI聯(lián)合創(chuàng)始人、SSI創(chuàng)始人IlyaSutskever發(fā)表演講時(shí)表示,預(yù)訓(xùn)練作為AI模型開發(fā)的第一階段即將結(jié)束。在此,我們不評(píng)價(jià)Ilya言論正確與否,我們認(rèn)為,從海內(nèi)外AI大模型發(fā)展速度來(lái)看,客觀上,AI技術(shù)逐漸從陡峭進(jìn)入到平緩區(qū)間,AI商業(yè)化落地已經(jīng)成為事實(shí)上AI發(fā)展的下一階段。我們認(rèn)為,過去幾個(gè)月來(lái),字節(jié)通過成熟的產(chǎn)品技術(shù),親民的產(chǎn)品定位,龐大的流量投入打造了豆包這一目前國(guó)內(nèi)用戶量最大的AI應(yīng)用,這使得字節(jié)已經(jīng)走出了一條AI應(yīng)用發(fā)展的成功道路,獲得了領(lǐng)先于其他競(jìng)爭(zhēng)對(duì)手的獨(dú)特的AI應(yīng)用落地經(jīng)驗(yàn)??紤]到字節(jié)強(qiáng)大的資本體量和對(duì)AI商業(yè)化的高度重視,字節(jié)目前20余款A(yù)I應(yīng)用也許只是個(gè)開始,字節(jié)已經(jīng)成為了事實(shí)上的中國(guó)AI商業(yè)化旗手,正在AI發(fā)展的道路上行以致遠(yuǎn)。建議關(guān)注:金山辦公、新致軟件、漢得信息、合合信息、萬(wàn)興科技、虹軟科技、新國(guó)都、當(dāng)虹科技、同花順、福昕軟件、泛微網(wǎng)絡(luò)、致遠(yuǎn)互聯(lián)、三六零、商湯-W、科大訊飛、邁富時(shí)、鼎捷數(shù)智、賽意信息、中國(guó)軟件國(guó)際、海康威視、大華股份、潤(rùn)澤科技、浪潮信息。風(fēng)險(xiǎn)提示:AI技術(shù)的發(fā)展不及預(yù)期,AI商業(yè)落地不及預(yù)期,市場(chǎng)競(jìng)爭(zhēng)加劇的風(fēng)險(xiǎn)。行業(yè)研究·信息服務(wù)行業(yè)40APPENDIX1SummaryInvestmentHighlights:Doubao’spursuitofa‘strongermodel’continues.In2023,DoubaofoundationmodellaunchedinternallyatByteDance,usedinover50businessunits.ByMay2024,ByteDanceofficiallyreleasedtheDoubaomodelfamily,achievingsignificantadvancementsinlanguage,multimodalunderstanding,andcodegeneration.ByDecember2024,Doubao’scapabilitiesmatchedGPT-4o,rankingfirstinFlagEval’sdialoguemodellist.Doubao’srapidupgradesandperformanceimprovementshavebecomeacornerstoneofByteDanceAI,drivenbyrelentlesstechnicalinvestment,expandingapplicationboundariesandlayingafoundationforfuturegrowth.Themodel’sleadingedgeisexpectedtogrow.‘Lowerprices’and‘easierimplementation’makeDoubaoaccessibleacrossindustries.InMay2024,Doubao’smainmodelpricedatRMB0.0008perthousandtokens,99.3%cheaperthanindustrystandards.Thefamilymaintainedlowpricing,withvisualunderstandingatRMB0.003perthousandtokens,85%belowaverage,processing284imagesforRMB1.ToolslikeCozeplatformsupportAIapplicationdevelopment,withover1millionactivedevelopers.ByDecember2024,dailytokencallsexceeded4trillion,growing33timesin7months,especiallyinemergingsectorslikeautomotiveandsmartdevices.ByteDanceAI’sgoalsof‘strongermodels’,‘lowerprices’,and‘easierimplementation’aredrivingrapidindustryadoption,heraldinganAIapplicationboom.BeyondDoubao,ByteDance’sAIcommercialstrategyisadvancing.DoubaoapplaunchedinAugust2023,reaching59.98millionMAUbyNovember2024,leadingdomesticallyandrankingsecondgloballyafterChatGPT.Doubao’scomprehensivefeatures,lowusagethreshold,andByteDance’sadvertisingpowerdrivemassivetraffic.ByteDanceoperatesaround20AIapplications,with6listedina16z’stop100generativeAIapps.AItechnologyisstabilizing,andcommercializationisthenextphase.DoubaoprovidesByteDancewithuniquesuccessinAIapplicationdeployment.WithstrongcapitalandfocusonAIcommercialization,ByteDanceisaleaderinChina’sAImarket,poisedforlong-termsuccess.Recomme

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論