版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
年全球AIGC
產(chǎn)業(yè)全景報(bào)告2024Global
AIGC
Industry
Report報(bào)告背景2024年,生成式AI已全面進(jìn)入應(yīng)用規(guī)模化推廣,探索新場(chǎng)景和商業(yè)模式的新發(fā)展階段
。
伴隨AI大模型的普及程度不斷加深
,
AIGC產(chǎn)業(yè)發(fā)展重點(diǎn)從去年關(guān)注度最高的模型層向場(chǎng)景應(yīng)用層轉(zhuǎn)變
。
AIGC為營(yíng)銷、
傳媒、
金融、
醫(yī)療、教育、
娛樂(lè)、
辦公、
制造、
科學(xué)發(fā)現(xiàn)等多個(gè)領(lǐng)域帶來(lái)前所未有的變革。搭載大模型的AI
PC、AI手機(jī)、
智能汽車相繼推出,為用戶帶來(lái)更加便捷的使用體驗(yàn)。此外,具身智能也成為今年關(guān)注度頗高的領(lǐng)域,未來(lái)AI模型與人形機(jī)器人將密切融合,產(chǎn)生更多應(yīng)用場(chǎng)景與商業(yè)機(jī)會(huì)。在此背景下,天津市人工智能學(xué)會(huì)、
至頂科技、
至頂智庫(kù)聯(lián)合發(fā)布《2024年全球AIGC產(chǎn)業(yè)全景報(bào)告》
,報(bào)告從人類語(yǔ)言和機(jī)
器語(yǔ)言的發(fā)展歷程出發(fā),全面展現(xiàn)全球AIGC產(chǎn)業(yè)的發(fā)展歷程
,對(duì)AIGC典型技術(shù)及產(chǎn)品成熟度進(jìn)行研判
,對(duì)AIGC產(chǎn)業(yè)投融資情況進(jìn)
行梳理,具體展現(xiàn)AIGC各細(xì)分場(chǎng)景的應(yīng)用情況,最后報(bào)告提出全球AIGC產(chǎn)業(yè)的八大前沿趨勢(shì)。
為政府部門、
行業(yè)從業(yè)者、
教育工
作者以及社會(huì)公眾更好了解2024年AIGC的發(fā)展進(jìn)程提供參考。天津市人工智能學(xué)會(huì)、至頂科技、至頂智庫(kù)2024年11月?2024.11ZD
Insights
2報(bào)告目錄1.
產(chǎn)業(yè)概況篇2.
基礎(chǔ)設(shè)施篇3.
場(chǎng)景應(yīng)用篇4.
用戶調(diào)研篇5.
前沿趨勢(shì)篇開(kāi)篇:伴隨人類語(yǔ)言的發(fā)展,機(jī)器語(yǔ)言演進(jìn)到自然語(yǔ)言階段語(yǔ)言發(fā)展歷程分為三大階段。語(yǔ)言1.0時(shí)代:
從人類語(yǔ)言誕生到公元前16世紀(jì)殷商時(shí)期甲骨文的出現(xiàn),文字成為人類交流的重要方式;語(yǔ)言2.0時(shí)代:
從蔡倫發(fā)明造紙術(shù)到世界第一臺(tái)電子計(jì)算機(jī)誕生,語(yǔ)言開(kāi)始通過(guò)各類機(jī)器實(shí)現(xiàn)傳播;語(yǔ)言3.0時(shí)代:
伴隨NLP及生成式AI等技術(shù)的快速發(fā)展與應(yīng)用落地,機(jī)器生成和創(chuàng)造語(yǔ)言的方式成為了可能。機(jī)器語(yǔ)言發(fā)展歷經(jīng)五大階段,從二進(jìn)制代碼發(fā)展到自然語(yǔ)言時(shí)代,新的“機(jī)器語(yǔ)言”交互方式誕生。公元前16世紀(jì):甲骨文公元前2900年:古埃及象形文字公元前3200-2600年:
楔形文字新石器時(shí)代中期以
后:中國(guó)象形文字公元前10萬(wàn)年-公元前16世紀(jì)1946年:第一臺(tái)電子計(jì)算機(jī)1876年:貝爾發(fā)明第一部電話1837年:美國(guó)人摩爾斯和兩個(gè)英
國(guó)工程師庫(kù)克
、
懷斯頓
同時(shí)發(fā)明電報(bào)公元1041-1048年間:
畢
昇發(fā)明活字印刷術(shù)自然語(yǔ)言伴隨人工智能技術(shù)的發(fā)展
,使
用自然語(yǔ)言替代原有機(jī)器語(yǔ)言
編程的方式成為可能,開(kāi)發(fā)者
可以使用自然語(yǔ)言編寫(xiě)指令,
然后由大型語(yǔ)言模型將其轉(zhuǎn)換
為計(jì)算機(jī)可以執(zhí)行的代碼
。
未
來(lái)將使更多人無(wú)需學(xué)習(xí)復(fù)雜的
編程語(yǔ)法也能輕松創(chuàng)建程序。解釋型高級(jí)編程語(yǔ)言解釋型高級(jí)編程語(yǔ)言如
Python
、
Ruby
等
,不
需要預(yù)編譯,可以在運(yùn)
行時(shí)解釋執(zhí)行,加快了
開(kāi)發(fā)速度
。
通常具有豐
富的庫(kù)和框架,使得開(kāi)
發(fā)者能夠更容易地實(shí)現(xiàn)
各種功能。2001年:Bengio等人提出前饋神經(jīng)網(wǎng)絡(luò)1969年:互聯(lián)網(wǎng)出現(xiàn)1950年:?2024.11ZD
Insights
2017年:Transformer架構(gòu)提出2022年:OpenAI發(fā)布ChatGPT人類語(yǔ)言3.0時(shí)代人類語(yǔ)言1.0時(shí)代人類語(yǔ)言2.0時(shí)代機(jī)器語(yǔ)言5.0時(shí)代機(jī)器語(yǔ)言1.0時(shí)代機(jī)器語(yǔ)言3.0時(shí)代機(jī)器語(yǔ)言4.0時(shí)代機(jī)器語(yǔ)言2.0時(shí)代自然語(yǔ)言公元105年-20世紀(jì)40年代公元105年:漢朝蔡倫發(fā)明造紙術(shù)資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。1972年高級(jí)編程語(yǔ)言公元前10萬(wàn)年:人類原始語(yǔ)言誕生1940年代二進(jìn)制代碼20世紀(jì)50年代至今1950年代助記符號(hào)艾倫·圖靈提出圖靈測(cè)試1990年代XCHANL2022年DECCLR4AIG
C
成熟度曲線AIG
C
領(lǐng)域最新進(jìn)展AIG
C
產(chǎn)業(yè)投融資情況產(chǎn)業(yè)概況篇AIG
C
產(chǎn)業(yè)全景圖譜AIG
C
發(fā)展路線圖AIG
C
產(chǎn)業(yè)政策環(huán)境1.1
2024年全球AIGC產(chǎn)業(yè)全景圖譜天津市人工智能學(xué)會(huì)、
至頂科技、
至頂智庫(kù)聯(lián)合發(fā)布2024年全球AIGC產(chǎn)業(yè)全景圖譜。圖譜主要分為基礎(chǔ)設(shè)施層(AI服務(wù)器
、
AI計(jì)算集群
、AI芯片
、
MaaS平臺(tái)
、AI數(shù)據(jù)服務(wù))
;模型層
(通用大模型、行業(yè)大模型);場(chǎng)景應(yīng)用層(智能助手、金融、
醫(yī)療、
辦公、教育、
奧運(yùn)、
智能汽車、
營(yíng)銷、
影視、
法律、政務(wù))
。
圖譜中涉及各領(lǐng)域全球代表性企業(yè)和相關(guān)機(jī)構(gòu),為讀者提供更為詳實(shí)的
參考信息。相比去年,基礎(chǔ)設(shè)施層新增MaaS平臺(tái)和AI數(shù)據(jù)服務(wù);模型層新增通用大模型和行業(yè)大模型的類別劃
分;場(chǎng)景應(yīng)用層按細(xì)分場(chǎng)景進(jìn)行劃分。2024年全球AIGC產(chǎn)業(yè)全景圖譜所涉及的企業(yè)數(shù)量分布24
17
15
14
14
6
7
7
10
8
5通用大模型行業(yè)大模型4151基礎(chǔ)設(shè)施層AI服務(wù)器AI計(jì)算集群AI芯片MaaS平臺(tái)AI數(shù)據(jù)服務(wù)6912
12
10
資料來(lái)源:至頂智庫(kù)整理繪制。
6場(chǎng)景應(yīng)用層模型層?2024.11ZD
Insights
智能助手金融醫(yī)療辦公教育奧運(yùn)智能汽車營(yíng)銷影視法律政務(wù)社會(huì)關(guān)注度4.39億數(shù)字人圖表說(shuō)明:萌芽階段:
技術(shù)/產(chǎn)品處于早期,推出時(shí)間短,應(yīng)用
場(chǎng)景少,普及度不高。爬升階段:
技術(shù)/產(chǎn)品持續(xù)迭代,有相關(guān)應(yīng)用場(chǎng)景,
有一定普及度。成熟階段:
技術(shù)/產(chǎn)品成熟穩(wěn)定,應(yīng)用場(chǎng)景多,普及
度高。AI手機(jī)/PC/智能汽車:
特指搭載AI大模型的各類終端AIGC應(yīng)用的成熟度。社會(huì)關(guān)注度:選取2024年微信指數(shù)最高點(diǎn)數(shù)值,體現(xiàn)
社會(huì)對(duì)于某項(xiàng)技術(shù)/產(chǎn)品的關(guān)注程度。圖中圓圈大小
反映社會(huì)關(guān)注度高低。統(tǒng)計(jì)數(shù)據(jù)截至2024年11月。AIGC技術(shù)產(chǎn)品萌芽階段AIGC技術(shù)產(chǎn)品爬升階段AIGC技術(shù)產(chǎn)品成熟階段
圖表來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料及專家調(diào)研整理繪制。?2024.11ZD
Insights
1.2
至頂AIGC成熟度曲線(2024)社會(huì)關(guān)注度6.69億社會(huì)關(guān)注度
3億c
視頻生成
模型端側(cè)模型社會(huì)關(guān)注度
7200萬(wàn)RAG
。
提示工程
。
微調(diào)?社會(huì)關(guān)注度
7446萬(wàn)人形機(jī)器人智能汽車AI手機(jī)社會(huì)關(guān)注度
9.6萬(wàn)社會(huì)關(guān)注度
11萬(wàn)社會(huì)關(guān)注度
761萬(wàn)社會(huì)關(guān)注度
33萬(wàn)社會(huì)關(guān)注度
120萬(wàn)社會(huì)關(guān)注度
630萬(wàn)社會(huì)關(guān)注度
43萬(wàn)社會(huì)關(guān)注度
1020萬(wàn)圖像生成
模型社會(huì)關(guān)注度
7322萬(wàn).AI
Agent大語(yǔ)言模型合成數(shù)據(jù)AI
PC71.3規(guī)模定律(ScalingLaw)將持續(xù)推動(dòng)AIGC產(chǎn)業(yè)發(fā)展規(guī)模定律是指隨著訓(xùn)練數(shù)據(jù)
、
模型大小和計(jì)算資源的增加,大語(yǔ)言模型的性能會(huì)有所提升的規(guī)律
,
2020年由OpenAI提出;2022年,GoogleDeepMind研究固定成本下最優(yōu)的模型參數(shù)量和訓(xùn)練數(shù)據(jù)量,得出訓(xùn)練數(shù)據(jù)量應(yīng)當(dāng)和參數(shù)量同等提升,并訓(xùn)練出Chinchilla模型。伴隨OpenAI
o1模型的發(fā)布,ScalingLaw從模型訓(xùn)練擴(kuò)展演進(jìn)到推理擴(kuò)展階段。MMLU評(píng)分
全球主流大模型性能表現(xiàn)符合規(guī)模定律
Falcon
180B
U-PaLM
540B
1800億參數(shù)
,
3.5萬(wàn)億token
,3.76e24
Flops
?2024.11ZD
Insights
Gopher
0.4B
70億參數(shù)
,
2萬(wàn)億token
,8.4e22
Flops
10090807060504030201002800億參數(shù)
,3000億token,6.31e23
Flops700億參數(shù)
,1.4萬(wàn)億token,5.76e23
Flops400億參數(shù)
,1萬(wàn)億token,2.4e23
FlopsLLaMA
2
34B●
Falcon
40B
LLaMA
33B110100100010000資料來(lái)源:
MMLU,Epoch
AI,至頂智庫(kù)整理繪制。Mistral
7BQwen
7B●BLOOM
176BRoBERTa-base
125M●ChinchillaGeminiUltra~1760BGLM
130B●Gopher
280BQwen1.5
72BLLaMA
65BLLaMA
2
13BLLaMA
2
7B參數(shù)量8Google企業(yè)名稱企業(yè)LOGO總部
所在
地生成式AI產(chǎn)業(yè)主要細(xì)分領(lǐng)域AI芯片AI計(jì)算集群MaaS平臺(tái)AI大模型AI場(chǎng)景應(yīng)用/解決方案閉源開(kāi)源輕量智能助手辦公金融醫(yī)療汽車教育營(yíng)銷商湯
中國(guó)
o
o
oo
o
ooo
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。
9?2024.11ZD
Insights
1.4全球科技領(lǐng)軍企業(yè)在AIGC產(chǎn)業(yè)的布局韓國(guó)企業(yè)韓國(guó)√騰訊
Tencent騰訊
阿里云
C-〕阿里云火山引擎京東華為科大訊飛C
Metaintel.Qual
cowwMetaOpenAI蘋果英偉達(dá)英特爾高通美國(guó)
。
美國(guó)
。
美國(guó)美國(guó)
美國(guó)
美國(guó)
美國(guó)
美國(guó)中國(guó)中國(guó)
中國(guó)
中國(guó)
中國(guó)
中國(guó)亞馬遜云科技
微軟●●√●√
√√●●
●√√√
√●中國(guó)√美國(guó)企業(yè)中國(guó)企業(yè)谷歌美國(guó)三星百度√√√√√√2017年,伴隨Transformer的出現(xiàn),AI大模型在全球掀起開(kāi)發(fā)浪潮
。
2022年11月,ChatGPT的正式發(fā)布
,加速了各類科技企業(yè)開(kāi)發(fā)大模型的進(jìn)度,以谷歌、
Meta、
OpenAI
、Anthropic、百度、
阿里、騰訊、
科大訊飛、
智譜等國(guó)內(nèi)外領(lǐng)軍科技企業(yè),推出語(yǔ)言、
圖像、視覺(jué)、
多模態(tài)等各種類型的AI大模型,主流模型具有生成各類文案、
圖像、視頻等能力。
此外
,適用于
金融、
醫(yī)療、教育、
營(yíng)銷、客服等領(lǐng)域的行業(yè)大模型也層出不窮
,不斷推動(dòng)商業(yè)化落地進(jìn)程。1.5全球AIGC產(chǎn)業(yè)發(fā)展路線圖(2015-2024)
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。
10?2024.11ZD
Insights
Transformer
BERT
Ernie
1.02020.5發(fā)布GPT-32020.6
Gshard
CodeGeeX
OPT-175B發(fā)布GPT-2發(fā)布GPT-1
2020.102020.112022.112015.122017.62018.10
Ernie2.0
Ernie
3.02022.8Make-a-Video
視頻生成模型DALL·E圖像生成模型DALL·E2圖像生成模型2022201720212019202020182015
RoBERTa2021.5
2021.1發(fā)布ChatGPT2022.9
OpenAI成立GLM-130B2021.12WebGLMGLM-10B2022.42018.62021.72022.52021.92019.22019.72019.3LaMDAGLaMGLMmT5文心大模型4.0工具版Gemma
2
型
i-
i
視頻
Mistral
Large
Mixtral
8x22BGrok-1.5
GLM-4
2024.2
Grok-2
豆包大模型
Grok-1.5V
Llama
3
Claude
3
Opus
Gemini
1.5Grok-2
mini
r
2
GPT-4o
ia1.5
ProGemmGeminMogeeaNLstrastraMM生成模型Sora發(fā)布型min型側(cè)量端Ph輕4
0Turbo文心大模圖像生成模型
文心大模型4.0AndesGPT
端側(cè)模型OPPO2023.6
2023.71.5全球AIGC產(chǎn)業(yè)發(fā)展路線圖(2015-2024)
Claude3
Haiku
Claude3
Sonnet2024.42024.62024.3?2024.11ZD
Insights
Gemini
Live圖像智能語(yǔ)音助手
Pixel
Studio生成應(yīng)用谷歌AI手機(jī)搭載Gemini模型
TensorG4AI手機(jī)芯片Gemini
1.0UltraGemini
1.0ProGemini
1.0Nano輕量模型/端側(cè)模型Phi-3圖像生成模型Veo視頻生成模型Gemini
1.5
Flash
輕量模型Llama3.2視覺(jué)模型
(11B和90B)文本生成模型1B和3B)日日新SenseNova5.5大模型體系日日新
5.5Lite端側(cè)模型OpenAI與FinancialTimes達(dá)成合作,提升ChatGPT體驗(yàn)OpenAI與Apple達(dá)成合作,未來(lái)蘋果產(chǎn)品將搭載ChatGPTQwen2.5開(kāi)源通義萬(wàn)相發(fā)布視頻
生成模型CodeGeeX4
代碼生成模型
CogVideoX視頻生成模型2023.82023.52023.92023.10Qwen-72BQwen-1.8BQwen-Audio
(音頻大模型)資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。訊飛星火V3.5
星火語(yǔ)音大模型
星火開(kāi)源-13BAI芯片MTIAv1PaLM2ChatGPT
Enterprise
企業(yè)級(jí)產(chǎn)品推出Claude2.1長(zhǎng)文本200KToken日日新SenseNova
大模型體系2023.3ChatGPT
Plus訂
閱服務(wù)推出CogVLM
ChatGLM3
智譜清言Ernie
3.5
端側(cè)模型2024.92024.8蔚來(lái)NOMI
GPT
端側(cè)模型CM3leon
文生圖模型
Llama2日日新SenseNova4.0大模型體系日日新SenseNova5.0大模型體系理想Mind
GPT
端側(cè)模型豆包·視頻生成
模型藍(lán)心大模型1B
端側(cè)模型Emu視頻生成模型Qwen-VL視覺(jué)語(yǔ)言模型20232024Microsoft
Copilot智能助理GPT-4o
mini
SearchGPTChatGLM2
智譜清言O(shè)penAIo1
推理模型ERNIE
Bot
文心一言發(fā)布GPT
StoreClaudePro
Mistral
7BMetaAI
智能助理Phi-3.5輕量模型騰訊混元大模型訊飛星火V1.5訊飛星火V2.0訊飛星火V1.0訊飛星火V4.0訊飛星火V3.0通義千問(wèn)2.5通義千問(wèn)2.0通義千問(wèn)1.0小米MiLMMixtral
8x7BImagen3VisualGLMClaude3.52023.122023.11ERNIE4.0Llama3.1ChatGLMDALL-E32024.72024.12024.52023.42023.2PaLM-ELlama
1SonnetClaudeClaudeGPT-4112024年10月Ministral
3B/8B包括Ministral3B和Ministral8B兩種
輕量級(jí)模型,均支持128k上下文且
性能媲美Gemma
2、Llama
3.1開(kāi)源模
型。Ministral8B具有特殊的交錯(cuò)滑
動(dòng)窗口注意力機(jī)制(SWA),可實(shí)現(xiàn)更
快和內(nèi)存高效的推理。2024年7月Mistral
Large
21230億參數(shù)的大小使其能夠在單
個(gè)節(jié)點(diǎn)上以大吞吐量運(yùn)行
。Mistral
Large2擁有128k上下文窗口,支持
英語(yǔ)、法語(yǔ)、
中文等數(shù)十種語(yǔ)言及80多種編程語(yǔ)言,在代碼和推理、指令遵循、
多輪對(duì)話等方面表現(xiàn)突
出。Mistral
Large
2允許用于研究和非商業(yè)用途的使用和修改。2024年4月Mixtral
8x22BMixtral8x22B是一個(gè)稀疏專家混合
(SMoE)
模型,僅使用
1410億激活參
數(shù)中的390億,具有高成本效率
。
Mixtral8x22B精通英語(yǔ)
、
法語(yǔ)
、
意
大利語(yǔ)
、德語(yǔ)和西班牙語(yǔ)
,具有很
強(qiáng)的數(shù)學(xué)和編碼能力
,64K
token上
下文窗口允許從大型文檔中精確調(diào)
用信息。2024年6月多模態(tài)模型
Claude
3.5
SonnetClaude
3.5Sonnet
的運(yùn)行速度是Claude
3
Opus
的兩倍,且推理、
閱
讀理解、數(shù)學(xué)、科學(xué)和編碼能力更
強(qiáng),也是Anthropic迄今最強(qiáng)的視覺(jué)
模型;Claude.ai
新增了Artifacts
功
能。
Artifacts
是
一
項(xiàng)
擴(kuò)
展
用戶
與
Claude
交互方式的新功能。用戶可
以實(shí)時(shí)查看
、
編輯和構(gòu)建Claude的創(chuàng)作,并將生成的內(nèi)容無(wú)縫集成
到項(xiàng)目和工作流程中。2024年3月多模態(tài)模型Claude
3Claude3Opus是最智能的模型
,在
高度復(fù)雜的任務(wù)上具有市場(chǎng)最佳的
性能;
Claude3Sonnet在智能和速
度之間實(shí)現(xiàn)理想的平衡;
Claude3
Haiku是最快、最緊湊的模型。2024年9月推理模型
OpenAIo1OpenAI
o1在處理物理學(xué)、化學(xué)和生物學(xué)領(lǐng)域的復(fù)雜問(wèn)題時(shí)展現(xiàn)出
了接近博士的專業(yè)能力。在國(guó)際
奧林匹克數(shù)學(xué)競(jìng)賽中,展現(xiàn)出
83%的準(zhǔn)確率水平
。
其編程能力
還在Codeforces競(jìng)賽中表現(xiàn)超過(guò)
89%的人類選手。2024年5月多模態(tài)模型GPT-4oGPT-4o采用更自然的人機(jī)交互
,接受文本、音頻、
圖像和視頻的任意組合作為輸入
,并生成文本、音頻和圖像的任意組合輸出。2024年2月視頻生成模型Sora視頻生成模型Sora能夠生成時(shí)長(zhǎng)一
分鐘的高保真視頻
。OpenAI在可變
持續(xù)時(shí)間、分辨率和寬高比的視頻
和圖像上聯(lián)合訓(xùn)練文本調(diào)節(jié)擴(kuò)散模
型,能在時(shí)間上向前或向后擴(kuò)展視
頻;可修改輸入視頻的風(fēng)格和環(huán)境;
可連接兩個(gè)輸入視頻,在不同主題
和場(chǎng)景構(gòu)成的視頻之間無(wú)縫過(guò)渡。2024年8月Gemma
2輕量級(jí)輕量級(jí)Gemma
2
2B
擁有20億參數(shù),具有內(nèi)置的安全改進(jìn)以及性能和
效率的強(qiáng)大平衡。
可在各種硬件上高效運(yùn)行,從邊緣設(shè)備和筆記本
電腦到使用
VertexAI
和Google
KubernetesEngine
(GKE)
的強(qiáng)大云
部署。
可根據(jù)商業(yè)友好的Gemma條款進(jìn)行研究和商業(yè)應(yīng)用。2024年6月視覺(jué)語(yǔ)言模型PaliGemma及開(kāi)源模型Gemma
2PaliGemma是開(kāi)放式視覺(jué)語(yǔ)言模型,可在廣泛的視覺(jué)語(yǔ)言任務(wù)中實(shí)現(xiàn)卓越的微調(diào)性能,包括為圖片和短視頻描述生成、視覺(jué)問(wèn)答、理解圖像中的文本、對(duì)象檢測(cè)和對(duì)象分割;Gemma
2開(kāi)源9B和27B版本,其中Gemma
2
27B性能與
Llama
3
70B相媲
美,大小不到Llama
3
70B
的一半。2024年5月多模態(tài)
Gemini
1.5Flash1.5Flash是通過(guò)API提供的速度最快
的Gemini模型,比
1.5
Pro
更輕量級(jí)
但具有強(qiáng)大的多模態(tài)推理能力,在
總結(jié)摘要、聊天應(yīng)用、
圖像和視頻字幕生成以及從長(zhǎng)文檔和表格中提取數(shù)據(jù)等方面表現(xiàn)出色。,2024年5月視頻生成模型VeoVeo
可生成時(shí)間超過(guò)一分鐘的1080p
分辨率視頻。包括生成查詢網(wǎng)絡(luò)
(GQN)、
DVD-GAN
、
Imagen-Video
、
Phenaki
、
WALT
、
VideoPoet和Lumiere
,提高質(zhì)量和輸出分辨率。2024年5月圖像生成模型Imagen
3Imagen
3是Google最高質(zhì)量的文本到
圖像模型,可生成高細(xì)節(jié)水平、逼真的圖像,與之前的模型相比,分
散注意力的視覺(jué)干擾更少。2024年2月開(kāi)源模型
GemmaGemma更加輕量,擁有2B和7B版本模型權(quán)重也一并開(kāi)源,且允許商用。
采用與Gemini模型相同技術(shù)構(gòu)建。2024年2月Gemini
1.5Gemini
1.5采用新的專家混合(MoE)
架構(gòu)
,使訓(xùn)練和服務(wù)更加高效
。
其中
Gemini1.5Pro是中型多模態(tài)模型,配備了標(biāo)準(zhǔn)的
128k
token上下文窗口。2024年9月開(kāi)源模型Llama
3.2包括視覺(jué)模型(11B和90B)和文本
模型(1B和3B)
,提供預(yù)訓(xùn)練與對(duì)
齊版本
,可通過(guò)torchtune進(jìn)行微調(diào)
,
也可使用torchchat在本地部署
,還
可通過(guò)Meta
AI進(jìn)行使用。2024年7月開(kāi)源模型Llama
3.1Llama3.1405B使用15萬(wàn)億token在超
過(guò)16000個(gè)H100GPU上訓(xùn)練
,上下文長(zhǎng)度擴(kuò)展到128K。2024年4月開(kāi)源模型Llama
3具有80億和700億參數(shù)
,預(yù)訓(xùn)練數(shù)
據(jù)集達(dá)到15萬(wàn)億token進(jìn)行訓(xùn)練,
訓(xùn)練數(shù)據(jù)來(lái)源于30余種語(yǔ)言。1.62024年全球領(lǐng)軍科技企業(yè)在AIGC領(lǐng)域的最新進(jìn)展2024年4月小尺寸模型Phi-3
mini可用于手機(jī)上運(yùn)行的小尺寸模型
,
其中Phi-3mini擁有38億參數(shù),經(jīng)
過(guò)
3.3
萬(wàn)億token訓(xùn)練。Phi-3-mini有兩種上下文長(zhǎng)度變體
:4K和
128K
token。?2024.11ZD
Insights
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。你open
AlO
MetaGoogleGoogleAN
THRO
P\C122024年10月訊飛星火4.0Turbo文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、
多模態(tài)能力均超過(guò)GPT-4
Turbo,數(shù)
學(xué)和代碼能力超越GPT-4o,效率相
對(duì)提升50%,國(guó)內(nèi)外中英文14項(xiàng)主
流測(cè)試集中實(shí)現(xiàn)9項(xiàng)第一。2024年6月訊飛星火大模型V4.0實(shí)現(xiàn)對(duì)標(biāo)GPT4-Turbo
,在文本生成、
語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力等方面實(shí)現(xiàn)超越。2024年1月訊飛星火大模型V3.5模型在語(yǔ)言理解、文本生成、知識(shí)問(wèn)答、邏輯推理,數(shù)學(xué)能力、
代碼能力和多模態(tài)能力七個(gè)方面進(jìn)行全面升級(jí),其中語(yǔ)言理解、
數(shù)學(xué)能力超過(guò)GPT-4Turbo。代碼
達(dá)到GPT-4Turbo
96%,多模態(tài)理
解達(dá)到GPT-4V
91%。2024年1月星火語(yǔ)音大模型在中文、英語(yǔ)、法語(yǔ)、俄語(yǔ)等首批37個(gè)主流透種的語(yǔ)音識(shí)劇效果
超過(guò)OpenAl
WhisperV3。在多語(yǔ)種
語(yǔ)音合成方面,星火語(yǔ)音大模型
的首批40個(gè)語(yǔ)種平均MOS分絕對(duì)提
升0.25,擬人度超83%。2024年9月開(kāi)源模型Qwen2.5通義大模型家族已全面涵蓋語(yǔ)言
、
圖像、視頻、音頻等
全
模
態(tài)
。
Qwen2.5全系列模型都在18T
token數(shù)
據(jù)上進(jìn)行預(yù)訓(xùn)練
,Qwen2.5-72B模型
在MMLU-rudex
基準(zhǔn)
、
MBPP基準(zhǔn)和
MATH
基準(zhǔn)的得分高達(dá)86.8
、
88.2
、
83.1。通義萬(wàn)相發(fā)布視頻生成模型文生視頻中,支持多語(yǔ)言輸入和多種比例生成
,并可以通過(guò)靈感
擴(kuò)寫(xiě)功能豐富視頻內(nèi)容表現(xiàn)力;圖生視頻中,支持將上傳圖片按
照比例轉(zhuǎn)化為動(dòng)態(tài)視頻
,并能通
過(guò)提示詞控制視頻運(yùn)動(dòng)。2024年5月通義千問(wèn)2.5通義千問(wèn)2.5版本的理解能力、邏輯推理、指令遵循、代碼能力分
別提升9%、
16%、
19%,10%。2024年4月開(kāi)源模型Qwen1.5-32BQwen1.5-32B在MMLU、GSM8K、HumanEval以及BBH等多種任務(wù)上展
現(xiàn)出頗具競(jìng)爭(zhēng)力的表現(xiàn),優(yōu)于其他
30B級(jí)別模型。2024年3月開(kāi)源模型Qwen1.5開(kāi)源
0.5B
、1.8B、
4B
、7B
、14B
和
72B共計(jì)6個(gè)不同規(guī)模的Base和Chat模型。2024年7月飛槳框架3.0飛槳框架3.0
是面向大模型
、
異構(gòu)多芯進(jìn)行專屬設(shè)計(jì),向下適配異構(gòu)多芯,充分釋放硬件潛能;
向上一體化支撐大模型的訓(xùn)練、推理。
同時(shí)具有動(dòng)靜統(tǒng)一自動(dòng)并行、編譯器
自動(dòng)優(yōu)化、大模型訓(xùn)推一體、
大模型多硬件適配四大能力
,全面地提升了服務(wù)產(chǎn)業(yè)的能力。2024年6月文心大模型4.0Turbo網(wǎng)頁(yè)版、APP、API
陸續(xù)開(kāi)放,通過(guò)數(shù)據(jù)、基礎(chǔ)模型、對(duì)齊技術(shù)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)等核心技術(shù)的持續(xù)創(chuàng)新
,速度更快,效果更好。2024年4月文心大模型4.0工具版在工具版上,可以通過(guò)自然語(yǔ)言交互,進(jìn)行文檔問(wèn)答、數(shù)據(jù)分析、代
碼執(zhí)行。提供基于大模型來(lái)開(kāi)發(fā)各種應(yīng)用的工具
,包括智能體開(kāi)發(fā)工具AgentBuilder
,AI原生應(yīng)用開(kāi)發(fā)
工具AppBuilder,以及各種尺寸的
模型定制工具M(jìn)odelBuilder。2024年4月智艙大模型2.0智艙大模型2.0采用全新MoE架構(gòu),可支持本地化部署
,并配套專屬開(kāi)發(fā)工具鏈,支持車企高效定制品牌特色,基于智艙體驗(yàn)打造差異化競(jìng)爭(zhēng)力。2024年10月基座大模型GLM-4-PlusGLM-4-Plus
在各大語(yǔ)言文本能力
數(shù)據(jù)集上獲得與
GPT-4o
及405B
Llama3.1
相當(dāng)?shù)乃?,在語(yǔ)言理
解、邏輯推理、指令遵循、長(zhǎng)文
本輸出方面都有較大突破。2024年7月視頻生成模型CogVideoX智譜發(fā)布AI
視頻模型「清影」
,30秒將任意文圖生成視頻
,并開(kāi)源與「清影」
同源的視頻生成模型CogVideoX。2024年7月代碼生成模型CodeGeeX4開(kāi)源CodeGeeX4-ALL-9B
,集代碼補(bǔ)
全和生成、代碼問(wèn)答、代碼解釋器、
工具調(diào)用、聯(lián)網(wǎng)搜索、項(xiàng)目級(jí)代碼問(wèn)答等能力于一體的代碼大模型。2024年1月GLM-4GLM-4
,整體性能相比GLM3全面提
升60%
,支持更長(zhǎng)上下文
、
更強(qiáng)的多模態(tài),支持更快推理速度,更多
并發(fā),降低推理成本。GLM-4實(shí)現(xiàn)自主根據(jù)用戶意圖,
自動(dòng)理解、規(guī)
劃復(fù)雜指令,
自由調(diào)用網(wǎng)頁(yè)瀏覽器、
Code
Interpreter代碼解釋器和多模
態(tài)文生圖大模型,以完成復(fù)雜任務(wù)。2024年9月豆包·視頻生成模型遵從復(fù)雜prompt
,解鎖時(shí)序性多拍
動(dòng)作指令與多個(gè)主體間的交互能力。
具備多鏡頭語(yǔ)言能力,并能完成在一個(gè)prompt內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換。支持多種視頻風(fēng)格
,還包含六種不同比例的視頻。2024年5月豆包大模型發(fā)布9款豆包系列大模型
,包括豆包通用模型Pro/Lite
、
角色扮演模
型、語(yǔ)音合成模型、聲音復(fù)刻模型、
語(yǔ)音識(shí)別模型、文生圖
模型
、Functioncall模型
、向量化模型
。
其中豆包通用模型pro支持128k長(zhǎng)文
本,全系列可精調(diào)
,具備更強(qiáng)的理解、
生成、邏輯等綜合能力。2024年9月騰訊混元Turbo相比于前一代混元Turbo模型,新一代的訓(xùn)練效率提升108%,推理效
率提升100%,推理成本則降低為前
一代的一半。在多個(gè)基準(zhǔn)的測(cè)試上
已能夠?qū)?biāo)GPT-4o。2024年5月AI助手元寶基于騰訊混元大模型
,具備看
、
聽(tīng)
、說(shuō)等多模態(tài)能力
,在知識(shí)學(xué)
習(xí)
、
生活百科
、
職場(chǎng)辦公
、趣味
創(chuàng)作等多個(gè)領(lǐng)域提高效率。1.62024年中國(guó)領(lǐng)軍科技企業(yè)在AIGC領(lǐng)域的最新進(jìn)展2024年5月Baichuan
4發(fā)布最新一代基座大模型
Baichuan4
,
同時(shí)推出首款A(yù)I助手“百小應(yīng)”。
Baichuan4
相較Baichuan
3在各項(xiàng)能力上均有極大提升
,其中
通用能力提升超過(guò)10%,數(shù)學(xué)和代
碼能力分別提升14%和9%。2024年7月日日新SenseNova
5.5日日新5.5具有6000億參數(shù),綜合
性能較「
日日新5.0
」提升30%。
交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對(duì)
標(biāo)GPT-4o
;「
日日新
5o」,流式多模態(tài)交互,帶來(lái)全新AI交互模
式;端側(cè)模型升級(jí),發(fā)布日日新
5.5
Lite。2024年10月Yi-LightningYi-Lightning在ChatbotArena榜單中
以1287的競(jìng)技場(chǎng)分?jǐn)?shù)位列大語(yǔ)言模型性能的世界第6
,在數(shù)學(xué)模塊位
列世界第3,超越GPT-4o以及Claude
3.5Sonnet等行業(yè)內(nèi)頂尖模型。?2024.11ZD
Insights
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。C-〕阿里云Tencent騰訊131.7測(cè)試集成為評(píng)判AI模型性能的重要手段大模型測(cè)試集是評(píng)估和提升人工智能模型性能的重要工具
,為開(kāi)發(fā)者提供標(biāo)準(zhǔn)化平臺(tái),用于量化和比較不同模型的性能,有助于加速模型的迭代
和優(yōu)化。
相關(guān)測(cè)試集通常涵蓋多個(gè)領(lǐng)域和任務(wù),
以確保全面評(píng)估模型的通用性和專業(yè)性。
按類別來(lái)看,全球AI大模型測(cè)試集分為綜合考試類、
理解推理類、
數(shù)學(xué)科學(xué)類、代碼類。其中,綜合考試類的MMLU(Massive
Multitask
Language
Understanding)測(cè)試集使用較為廣泛,
由加州大學(xué)
伯克利分校于2020年9月發(fā)布,涵蓋57個(gè)學(xué)科,從人文到社科到理工多個(gè)大類的綜合知識(shí)能力。具體如下表所示。全球主流AI大模型測(cè)試集理解&推理HellaSwag英文艾倫人工智能研究所BBH英文GoogleWinoGrande英文華盛頓大學(xué)/艾倫人工智能研究所RACE-H英文卡內(nèi)基梅隆大學(xué)數(shù)學(xué)&科學(xué)GSM8K英文OpenAIMATH英文加州大學(xué)伯克利分校GPQA英文紐約大學(xué)、Cohere、Anthropic代碼HumanEval英文
OpenAI
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。
14?2024.11ZD
Insights
加州大學(xué)伯克利分校上海交通大學(xué)/微軟亞洲研究院/墨爾本大學(xué)艾倫人工智能研究所清華大學(xué)/愛(ài)丁堡大學(xué)/上海交通大學(xué)MMLUCMMLU
ARC-C
C-Eval英文中文
英文
中文發(fā)布單位綜合考試測(cè)試集語(yǔ)種類別發(fā)布時(shí)間政策名稱發(fā)布機(jī)構(gòu)政策內(nèi)容美國(guó)2024年4月Futureof
ArtificialIntelligenceInnovation
Actof2024《2024年人工智能創(chuàng)新法案》美國(guó)國(guó)會(huì)成立美國(guó)人工智能安全研究所,
旨在制定確保國(guó)家安全、
公共安全和個(gè)人權(quán)利的人工智能
標(biāo)準(zhǔn)。
創(chuàng)建人工智能測(cè)試計(jì)劃,幫助發(fā)現(xiàn)人工智能生態(tài)系統(tǒng)中的漏洞
。
組建人工智能創(chuàng)新
和標(biāo)準(zhǔn)聯(lián)盟,鼓勵(lì)人工智能創(chuàng)新合作,協(xié)調(diào)各國(guó)人工智能標(biāo)準(zhǔn)
。由美國(guó)國(guó)家科學(xué)基金會(huì)指
導(dǎo)啟動(dòng)雙邊和多邊人工智能研究合作
,這一發(fā)展將推動(dòng)協(xié)調(diào)創(chuàng)新和安全人工智能發(fā)展。2024年1月The
California
ArtificialIntelligenceTransparency
Act《加州人工智能透明度法案》美國(guó)加州議會(huì)旨在賦予消費(fèi)者識(shí)別AI生成產(chǎn)品的能力,
以降低AI生成內(nèi)容可能被濫用的風(fēng)險(xiǎn)
。
要求大型AI生成內(nèi)容提供商對(duì)其生成的圖像、
視頻、
音頻等媒體內(nèi)容添加水印,并為消費(fèi)者提供相
應(yīng)的查詢平臺(tái)和查詢服務(wù),確保消費(fèi)者擁有對(duì)產(chǎn)品必要信息的知情權(quán)
。
該法案標(biāo)志著美國(guó)
加州在為人工智能生成產(chǎn)品制定明確準(zhǔn)則方面邁出了重要一步。2023年5月National
ArtificialIntelligence
ResearchandDevelopment
Strategic
Plan《國(guó)家人工智能開(kāi)發(fā)戰(zhàn)略計(jì)劃》美國(guó)白宮旨在確保人工智能技術(shù)的發(fā)展符合國(guó)家的價(jià)值觀、
保護(hù)公民權(quán)利、
促進(jìn)經(jīng)濟(jì)增長(zhǎng)并保護(hù)國(guó)
家安全。
該計(jì)劃提出培養(yǎng)聯(lián)邦機(jī)器學(xué)習(xí)方法
,提高模型通信和從多個(gè)設(shè)備更新到共享的全
局模型的效率。
研究可擴(kuò)展通用人工智能系統(tǒng),不斷創(chuàng)新推出基礎(chǔ)模型在語(yǔ)言和圖像任務(wù)
上的應(yīng)用,解決在數(shù)據(jù)庫(kù)上訓(xùn)練模型的隱私問(wèn)題,提升大模型的有效性、
可靠性、
安全性。歐盟2024年9月Councilof
Europe
Framework
ConventiononArtificialIntelligenceand
HumanRights,Democracy
andthe
Ruleof
Law《人工智能與人權(quán)、民主及法治框架公約》歐盟委員會(huì)旨在確保人工智能活動(dòng)符合人權(quán)、民主和法治。
公約促進(jìn)成員國(guó)間以及全球范圍內(nèi)的合作
,
以強(qiáng)化共同價(jià)值觀;關(guān)切人工智能發(fā)展可能導(dǎo)致的歧視和經(jīng)濟(jì)
、
社會(huì)不平等;強(qiáng)調(diào)人工智
能系統(tǒng)的透明度和負(fù)責(zé)創(chuàng)新的重要性;國(guó)家需采取措施
,保障人工智能活動(dòng)中對(duì)隱私和個(gè)
人數(shù)據(jù)的保護(hù);
各成員國(guó)需通過(guò)法律和行政手段,確保人工智能系統(tǒng)不危害民主進(jìn)程和法
律的尊重;指定開(kāi)展國(guó)際合作和機(jī)制監(jiān)督,
以確保其條款的有效實(shí)施。2024年7月EU
ArtificialIntelligence
Act《歐盟人工智能法案》歐盟委員會(huì)該法案根據(jù)風(fēng)險(xiǎn)將人工智能分類為四個(gè)等級(jí):不可接受風(fēng)險(xiǎn)的AI(如社會(huì)評(píng)分系統(tǒng)和操控
性AI)
被禁止;
高風(fēng)險(xiǎn)AI系統(tǒng)受到嚴(yán)格監(jiān)管;
有限風(fēng)險(xiǎn)AI系統(tǒng)則面臨較輕的透明度義務(wù);最小風(fēng)險(xiǎn)AI(如大多數(shù)現(xiàn)有應(yīng)用)
不受監(jiān)管
。
高風(fēng)險(xiǎn)AI系統(tǒng)的主要責(zé)任在于提供者(開(kāi)發(fā)
者)
,無(wú)論其是否在歐盟內(nèi),服務(wù)提供者承擔(dān)相關(guān)義務(wù)。
通用AI模型的提供者需提供技術(shù)
文檔和使用說(shuō)明,并遵守版權(quán)指令,存在系統(tǒng)性風(fēng)險(xiǎn)的模型還需進(jìn)行評(píng)估和網(wǎng)絡(luò)安全保護(hù)。日本2024年4月《商業(yè)人工智能指南1.0》日本總務(wù)省、日本經(jīng)濟(jì)產(chǎn)業(yè)省旨在應(yīng)對(duì)生成式人工智能技術(shù)變化,并提供統(tǒng)一的人工智能治理指導(dǎo)原則
。
該指南草案建
議人工智能開(kāi)發(fā)人員收集和處理合理的數(shù)據(jù)以用于模型的學(xué)習(xí);定期評(píng)估AI模型的輸入和
輸出,
以監(jiān)測(cè)任何生成的偏見(jiàn);還應(yīng)當(dāng)向利益相關(guān)方披露用于訓(xùn)練AI的數(shù)據(jù)收集方法以及AI模型的訓(xùn)練方法;確保AI商業(yè)參與者之間的合作,從價(jià)值鏈和風(fēng)險(xiǎn)鏈的角度出發(fā)。
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。
15
?2024.11ZD
Insights
1.8全球AIGC產(chǎn)業(yè)發(fā)展的政策環(huán)境2023年以來(lái)全球發(fā)布的AIGC相關(guān)政策發(fā)布時(shí)間政策名稱發(fā)布機(jī)構(gòu)政策內(nèi)容國(guó)家層面2024年6月《國(guó)家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)
》工業(yè)和信息化部、中央網(wǎng)信辦、國(guó)家
發(fā)改委、國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)指南提出機(jī)器學(xué)習(xí)、
知識(shí)圖譜、
大模型、
自然語(yǔ)言處理、
計(jì)算機(jī)視覺(jué)等關(guān)鍵技術(shù)的標(biāo)準(zhǔn),
其中大模型標(biāo)準(zhǔn)包括大模型通用技術(shù)要求、
評(píng)測(cè)指標(biāo)與方法、
服務(wù)能力成熟度評(píng)估、
生成
內(nèi)容評(píng)價(jià)等。
政策還對(duì)包括基礎(chǔ)安全,數(shù)據(jù)、
算法和模型安全,
網(wǎng)絡(luò)、
技術(shù)和系統(tǒng)安全等
與人工智能模型相關(guān)的安全標(biāo)準(zhǔn)進(jìn)行規(guī)范。2023年7月《生成式人工智能服務(wù)管理暫行辦法》國(guó)家網(wǎng)信辦、國(guó)家發(fā)改委、教育部、
科技部、工業(yè)和信息化部、公安部、國(guó)家廣電總局鼓勵(lì)生成式人工智能技術(shù)在各行業(yè)、
各領(lǐng)域的創(chuàng)新應(yīng)用,生成積極健康、向上向善的優(yōu)質(zhì)
內(nèi)容,探索優(yōu)化應(yīng)用場(chǎng)景,構(gòu)建應(yīng)用生態(tài)體系。
生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開(kāi)展
預(yù)訓(xùn)練、
優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng),應(yīng)遵守:
使用具有合法來(lái)源的數(shù)據(jù)和基礎(chǔ)模型;
不得侵害他人依法享有的知識(shí)產(chǎn)權(quán);采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量。地方層面北京2024年7月《北京市推動(dòng)“人工智能+”行動(dòng)計(jì)劃
(2024-2025年)
》北京市發(fā)展和改革委員會(huì)、北京市經(jīng)濟(jì)和信息化局、北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)到2025年,力爭(zhēng)形成3-5個(gè)先進(jìn)可用、
自主可控的基礎(chǔ)大模型產(chǎn)品、
100個(gè)優(yōu)秀的行業(yè)大模
型產(chǎn)品和1000個(gè)行業(yè)成功案例。圍繞機(jī)器人、
教育、醫(yī)療、
金融、
文化、
交通等領(lǐng)域組織
實(shí)施一批綜合型、
標(biāo)桿性重大工程,建立各行業(yè)大模型平臺(tái),促進(jìn)大模型核心理論與技術(shù)
突破,增強(qiáng)人工智能工程化能力。2024年3月《北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)關(guān)于加快打造AI原生
產(chǎn)業(yè)創(chuàng)新高地的若干政策》北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)管理委員會(huì)到2026年,集聚人工智能產(chǎn)業(yè)鏈企業(yè)100家,建成人工智能算力
10000PFlops
。
加快推進(jìn)算
力基礎(chǔ)設(shè)施建設(shè),鼓勵(lì)打造國(guó)產(chǎn)算力底座。
支持頭部企業(yè)圍繞多模態(tài)通用模型基礎(chǔ)架構(gòu)、多模態(tài)學(xué)習(xí)算法
、
對(duì)齊調(diào)優(yōu)等領(lǐng)域開(kāi)展大模型關(guān)鍵技術(shù)攻關(guān)
。
大力開(kāi)展
“大模型+”行動(dòng)
,
推動(dòng)“大模型+自動(dòng)駕駛”
、
“大模型+機(jī)器人”
、
“大模型+工業(yè)制造”等場(chǎng)景應(yīng)用。2023年5月《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的
若干措施》北京市人民政府辦公廳建設(shè)北京人工智能公共算力中心,形成規(guī)模化先進(jìn)算力供給能力。圍繞模型構(gòu)建、
訓(xùn)練、
調(diào)優(yōu)對(duì)齊、
推理部署等環(huán)節(jié),積極探索基礎(chǔ)模型架構(gòu)創(chuàng)新,研究大模型高效并行訓(xùn)練技術(shù)
和認(rèn)知推理、
指令學(xué)習(xí)、
人類意圖對(duì)齊等調(diào)優(yōu)方法,研發(fā)支持百億參數(shù)模型推理的高效壓
縮和端側(cè)部署技術(shù),形成完整高效的技術(shù)體系,鼓勵(lì)開(kāi)源技術(shù)生態(tài)建設(shè)。
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。
?2024.11ZD
Insights
1.9
中國(guó)AIGC產(chǎn)業(yè)發(fā)展的政策環(huán)境2023年以來(lái)中國(guó)發(fā)布的AIGC相關(guān)政策16發(fā)布時(shí)間政策名稱發(fā)布機(jī)構(gòu)政策內(nèi)容地方層面上海2024年3月《上海市智能算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展
“算
力浦江”智算行動(dòng)實(shí)施方案(2024-2025年)》上海市通信管理局、上海網(wǎng)信辦、上
海市發(fā)改委、上海市數(shù)據(jù)局、上海市
教委、上海市科委、上海市衛(wèi)健委、
上海市市場(chǎng)監(jiān)管局、上海市國(guó)資委、
上海市交通委、中國(guó)人民銀行上海總部到2025年,智能算力規(guī)模超過(guò)30EFlops,
占比達(dá)到總算力的50%以上,算力網(wǎng)絡(luò)節(jié)點(diǎn)間單向
網(wǎng)絡(luò)時(shí)延控制在1毫秒以內(nèi)
。
鼓勵(lì)基礎(chǔ)電信企業(yè)跨地區(qū)提供智算服務(wù),推動(dòng)智算芯片全面
兼容國(guó)產(chǎn)訓(xùn)練框架,推動(dòng)大模型多維并行訓(xùn)練優(yōu)化、
模型快速適配、
模型異構(gòu)推理部署等
技術(shù)和工具研發(fā),推動(dòng)打造智能算力與工業(yè)、
城市治理、
教育科研等應(yīng)用場(chǎng)景的創(chuàng)新融合。2023年10月《上海市推動(dòng)人工智能大模型創(chuàng)新發(fā)展若干
措施(2023-2025年)
》上海市經(jīng)濟(jì)和信息化委員會(huì)、上海市
發(fā)展和改革委員會(huì)、上海市科學(xué)技術(shù)
委員會(huì)、上海網(wǎng)信辦、上海市財(cái)政局支持引進(jìn)高水平創(chuàng)新企業(yè),支持本市創(chuàng)新主體打造具有國(guó)際競(jìng)爭(zhēng)力的大模型
,鼓勵(lì)形成數(shù)
據(jù)飛輪,加速模型迭代。
應(yīng)用層面,重點(diǎn)支持在智能制造、
生物醫(yī)藥、
集成電路、
智能化
教育教學(xué)、
科技金融、
設(shè)計(jì)創(chuàng)意、
自動(dòng)駕駛、
機(jī)器人、
數(shù)字政府等領(lǐng)域構(gòu)建示范應(yīng)用場(chǎng)景
,
打造標(biāo)桿性大模型產(chǎn)品和服務(wù)。深圳2024年9月《深圳市前海深港現(xiàn)代服務(wù)業(yè)合作區(qū)管理局
關(guān)于支持人工智能高質(zhì)量發(fā)展高水平應(yīng)用的若干措施》深圳市前海深港現(xiàn)代服務(wù)業(yè)合作區(qū)
管理局鼓勵(lì)企業(yè)建設(shè)智能算力中心和智能算力調(diào)度平臺(tái),支持企業(yè)基于國(guó)產(chǎn)人工智能軟件底座打
造共性技術(shù)服務(wù)平臺(tái),鼓勵(lì)開(kāi)展人工智能語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言理解等領(lǐng)域通用
關(guān)鍵技術(shù)開(kāi)發(fā)
。圍繞制造、
金融、
物流、
商務(wù)等重點(diǎn)領(lǐng)域支持
“大模型+產(chǎn)業(yè)”應(yīng)用創(chuàng)新。2024年7月《深圳市加快打造人工智能先鋒城市
行動(dòng)方案》深圳市工業(yè)和信息化局鼓勵(lì)開(kāi)展大模型架構(gòu)、
大模型超級(jí)智能、
超級(jí)對(duì)齊等技術(shù)創(chuàng)新,打造全鏈路自研大模型技
術(shù)體系。
研發(fā)多模態(tài)具身智能大模型,開(kāi)發(fā)具身智能機(jī)器人
“大腦”,推動(dòng)具身智能大模
型與機(jī)器人本體深度結(jié)合,鼓勵(lì)打造具有商業(yè)價(jià)值的整機(jī)產(chǎn)品。
在數(shù)字政府、
教育、
醫(yī)療、
氣象、
智慧城市、
環(huán)衛(wèi)、
科研、
制造、
金融、
低空經(jīng)濟(jì)、
智能網(wǎng)聯(lián)汽車、
現(xiàn)代時(shí)尚、
游戲
動(dòng)漫、
文旅、網(wǎng)絡(luò)安全等領(lǐng)域,鼓勵(lì)企業(yè)聯(lián)合研發(fā)行業(yè)大模型。2023年5月《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2023-2024年)
》中共深圳市委、深圳市人民政府聚焦通用大模型、
智能算力芯片、
智能傳感器、
智能機(jī)器人、
智能網(wǎng)聯(lián)汽車等領(lǐng)域,重點(diǎn)
支持打造基于國(guó)內(nèi)外芯片和算法的開(kāi)源通用大模型;支持重點(diǎn)企業(yè)持續(xù)研發(fā)和迭代商用通
用大模型;開(kāi)展通用型具身智能機(jī)器人的研發(fā)和應(yīng)用。
資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。
17
?2024.11ZD
Insights
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東石油化工學(xué)院《工程管理基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東汕頭幼兒師范高等??茖W(xué)?!毒扑{(diào)制與酒吧管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 七年級(jí)上冊(cè)《第四章 整式的加減章末小結(jié)與考點(diǎn)檢測(cè)》課件
- 廣東農(nóng)工商職業(yè)技術(shù)學(xué)院《信息論與密碼》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東南方職業(yè)學(xué)院《日本商務(wù)禮儀教程》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東理工職業(yè)學(xué)院《新零售物流管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 【創(chuàng)新設(shè)計(jì)】2021年高考化學(xué)總復(fù)習(xí)(江西版)配套文檔:第二章-化學(xué)物質(zhì)及其變化-化學(xué)物質(zhì)及其變化
- 七年級(jí)下冊(cè)人教版語(yǔ)文書(shū)
- 《肝膽疾病的護(hù)理》課件
- 【與名師對(duì)話】2021屆高考化學(xué)(課標(biāo)版)二輪復(fù)習(xí)階段測(cè)評(píng)(一)
- 2024-2025學(xué)年語(yǔ)文二年級(jí)上冊(cè) 部編版期末測(cè)試卷(含答案)
- 煤炭供應(yīng)項(xiàng)目(運(yùn)輸供貨方案)
- 醫(yī)院搶救領(lǐng)導(dǎo)工作小組制度
- 2024-2030年中國(guó)游艇產(chǎn)業(yè)發(fā)展?fàn)顩r規(guī)劃分析報(bào)告權(quán)威版
- 新能源汽車充電樁項(xiàng)目可行性研究報(bào)告模板及范文
- 上海市縣(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)人教版摸底考試((上下)學(xué)期)試卷及答案
- 電力市場(chǎng)概論張利課后參考答案
- 無(wú)人機(jī)項(xiàng)目建設(shè)規(guī)劃投資計(jì)劃書(shū)
- 2024版首診負(fù)責(zé)制度課件
- 幼兒園班級(jí)管理中的沖突解決策略研究
- 【7上英YL】蕪湖市2023-2024學(xué)年七年級(jí)上學(xué)期英語(yǔ)期中素質(zhì)教育評(píng)估試卷
評(píng)論
0/150
提交評(píng)論