【智頂科技】2024年全球AIGC產(chǎn)業(yè)全景報(bào)告_第1頁(yè)
【智頂科技】2024年全球AIGC產(chǎn)業(yè)全景報(bào)告_第2頁(yè)
【智頂科技】2024年全球AIGC產(chǎn)業(yè)全景報(bào)告_第3頁(yè)
【智頂科技】2024年全球AIGC產(chǎn)業(yè)全景報(bào)告_第4頁(yè)
【智頂科技】2024年全球AIGC產(chǎn)業(yè)全景報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

年全球AIGC

產(chǎn)業(yè)全景報(bào)告2024Global

AIGC

Industry

Report報(bào)告背景2024年,生成式AI已全面進(jìn)入應(yīng)用規(guī)模化推廣,探索新場(chǎng)景和商業(yè)模式的新發(fā)展階段

。

伴隨AI大模型的普及程度不斷加深

AIGC產(chǎn)業(yè)發(fā)展重點(diǎn)從去年關(guān)注度最高的模型層向場(chǎng)景應(yīng)用層轉(zhuǎn)變

。

AIGC為營(yíng)銷、

傳媒、

金融、

醫(yī)療、教育、

娛樂(lè)、

辦公、

制造、

科學(xué)發(fā)現(xiàn)等多個(gè)領(lǐng)域帶來(lái)前所未有的變革。搭載大模型的AI

PC、AI手機(jī)、

智能汽車相繼推出,為用戶帶來(lái)更加便捷的使用體驗(yàn)。此外,具身智能也成為今年關(guān)注度頗高的領(lǐng)域,未來(lái)AI模型與人形機(jī)器人將密切融合,產(chǎn)生更多應(yīng)用場(chǎng)景與商業(yè)機(jī)會(huì)。在此背景下,天津市人工智能學(xué)會(huì)、

至頂科技、

至頂智庫(kù)聯(lián)合發(fā)布《2024年全球AIGC產(chǎn)業(yè)全景報(bào)告》

,報(bào)告從人類語(yǔ)言和機(jī)

器語(yǔ)言的發(fā)展歷程出發(fā),全面展現(xiàn)全球AIGC產(chǎn)業(yè)的發(fā)展歷程

,對(duì)AIGC典型技術(shù)及產(chǎn)品成熟度進(jìn)行研判

,對(duì)AIGC產(chǎn)業(yè)投融資情況進(jìn)

行梳理,具體展現(xiàn)AIGC各細(xì)分場(chǎng)景的應(yīng)用情況,最后報(bào)告提出全球AIGC產(chǎn)業(yè)的八大前沿趨勢(shì)。

為政府部門、

行業(yè)從業(yè)者、

教育工

作者以及社會(huì)公眾更好了解2024年AIGC的發(fā)展進(jìn)程提供參考。天津市人工智能學(xué)會(huì)、至頂科技、至頂智庫(kù)2024年11月?2024.11ZD

Insights

2報(bào)告目錄1.

產(chǎn)業(yè)概況篇2.

基礎(chǔ)設(shè)施篇3.

場(chǎng)景應(yīng)用篇4.

用戶調(diào)研篇5.

前沿趨勢(shì)篇開(kāi)篇:伴隨人類語(yǔ)言的發(fā)展,機(jī)器語(yǔ)言演進(jìn)到自然語(yǔ)言階段語(yǔ)言發(fā)展歷程分為三大階段。語(yǔ)言1.0時(shí)代:

從人類語(yǔ)言誕生到公元前16世紀(jì)殷商時(shí)期甲骨文的出現(xiàn),文字成為人類交流的重要方式;語(yǔ)言2.0時(shí)代:

從蔡倫發(fā)明造紙術(shù)到世界第一臺(tái)電子計(jì)算機(jī)誕生,語(yǔ)言開(kāi)始通過(guò)各類機(jī)器實(shí)現(xiàn)傳播;語(yǔ)言3.0時(shí)代:

伴隨NLP及生成式AI等技術(shù)的快速發(fā)展與應(yīng)用落地,機(jī)器生成和創(chuàng)造語(yǔ)言的方式成為了可能。機(jī)器語(yǔ)言發(fā)展歷經(jīng)五大階段,從二進(jìn)制代碼發(fā)展到自然語(yǔ)言時(shí)代,新的“機(jī)器語(yǔ)言”交互方式誕生。公元前16世紀(jì):甲骨文公元前2900年:古埃及象形文字公元前3200-2600年:

楔形文字新石器時(shí)代中期以

后:中國(guó)象形文字公元前10萬(wàn)年-公元前16世紀(jì)1946年:第一臺(tái)電子計(jì)算機(jī)1876年:貝爾發(fā)明第一部電話1837年:美國(guó)人摩爾斯和兩個(gè)英

國(guó)工程師庫(kù)克

、

懷斯頓

同時(shí)發(fā)明電報(bào)公元1041-1048年間:

昇發(fā)明活字印刷術(shù)自然語(yǔ)言伴隨人工智能技術(shù)的發(fā)展

,使

用自然語(yǔ)言替代原有機(jī)器語(yǔ)言

編程的方式成為可能,開(kāi)發(fā)者

可以使用自然語(yǔ)言編寫(xiě)指令,

然后由大型語(yǔ)言模型將其轉(zhuǎn)換

為計(jì)算機(jī)可以執(zhí)行的代碼

來(lái)將使更多人無(wú)需學(xué)習(xí)復(fù)雜的

編程語(yǔ)法也能輕松創(chuàng)建程序。解釋型高級(jí)編程語(yǔ)言解釋型高級(jí)編程語(yǔ)言如

Python

Ruby

,不

需要預(yù)編譯,可以在運(yùn)

行時(shí)解釋執(zhí)行,加快了

開(kāi)發(fā)速度

。

通常具有豐

富的庫(kù)和框架,使得開(kāi)

發(fā)者能夠更容易地實(shí)現(xiàn)

各種功能。2001年:Bengio等人提出前饋神經(jīng)網(wǎng)絡(luò)1969年:互聯(lián)網(wǎng)出現(xiàn)1950年:?2024.11ZD

Insights

2017年:Transformer架構(gòu)提出2022年:OpenAI發(fā)布ChatGPT人類語(yǔ)言3.0時(shí)代人類語(yǔ)言1.0時(shí)代人類語(yǔ)言2.0時(shí)代機(jī)器語(yǔ)言5.0時(shí)代機(jī)器語(yǔ)言1.0時(shí)代機(jī)器語(yǔ)言3.0時(shí)代機(jī)器語(yǔ)言4.0時(shí)代機(jī)器語(yǔ)言2.0時(shí)代自然語(yǔ)言公元105年-20世紀(jì)40年代公元105年:漢朝蔡倫發(fā)明造紙術(shù)資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。1972年高級(jí)編程語(yǔ)言公元前10萬(wàn)年:人類原始語(yǔ)言誕生1940年代二進(jìn)制代碼20世紀(jì)50年代至今1950年代助記符號(hào)艾倫·圖靈提出圖靈測(cè)試1990年代XCHANL2022年DECCLR4AIG

C

成熟度曲線AIG

C

領(lǐng)域最新進(jìn)展AIG

C

產(chǎn)業(yè)投融資情況產(chǎn)業(yè)概況篇AIG

C

產(chǎn)業(yè)全景圖譜AIG

C

發(fā)展路線圖AIG

C

產(chǎn)業(yè)政策環(huán)境1.1

2024年全球AIGC產(chǎn)業(yè)全景圖譜天津市人工智能學(xué)會(huì)、

至頂科技、

至頂智庫(kù)聯(lián)合發(fā)布2024年全球AIGC產(chǎn)業(yè)全景圖譜。圖譜主要分為基礎(chǔ)設(shè)施層(AI服務(wù)器

AI計(jì)算集群

、AI芯片

、

MaaS平臺(tái)

、AI數(shù)據(jù)服務(wù))

;模型層

(通用大模型、行業(yè)大模型);場(chǎng)景應(yīng)用層(智能助手、金融、

醫(yī)療、

辦公、教育、

奧運(yùn)、

智能汽車、

營(yíng)銷、

影視、

法律、政務(wù))

。

圖譜中涉及各領(lǐng)域全球代表性企業(yè)和相關(guān)機(jī)構(gòu),為讀者提供更為詳實(shí)的

參考信息。相比去年,基礎(chǔ)設(shè)施層新增MaaS平臺(tái)和AI數(shù)據(jù)服務(wù);模型層新增通用大模型和行業(yè)大模型的類別劃

分;場(chǎng)景應(yīng)用層按細(xì)分場(chǎng)景進(jìn)行劃分。2024年全球AIGC產(chǎn)業(yè)全景圖譜所涉及的企業(yè)數(shù)量分布24

17

15

14

14

6

7

7

10

8

5通用大模型行業(yè)大模型4151基礎(chǔ)設(shè)施層AI服務(wù)器AI計(jì)算集群AI芯片MaaS平臺(tái)AI數(shù)據(jù)服務(wù)6912

12

10

資料來(lái)源:至頂智庫(kù)整理繪制。

6場(chǎng)景應(yīng)用層模型層?2024.11ZD

Insights

智能助手金融醫(yī)療辦公教育奧運(yùn)智能汽車營(yíng)銷影視法律政務(wù)社會(huì)關(guān)注度4.39億數(shù)字人圖表說(shuō)明:萌芽階段:

技術(shù)/產(chǎn)品處于早期,推出時(shí)間短,應(yīng)用

場(chǎng)景少,普及度不高。爬升階段:

技術(shù)/產(chǎn)品持續(xù)迭代,有相關(guān)應(yīng)用場(chǎng)景,

有一定普及度。成熟階段:

技術(shù)/產(chǎn)品成熟穩(wěn)定,應(yīng)用場(chǎng)景多,普及

度高。AI手機(jī)/PC/智能汽車:

特指搭載AI大模型的各類終端AIGC應(yīng)用的成熟度。社會(huì)關(guān)注度:選取2024年微信指數(shù)最高點(diǎn)數(shù)值,體現(xiàn)

社會(huì)對(duì)于某項(xiàng)技術(shù)/產(chǎn)品的關(guān)注程度。圖中圓圈大小

反映社會(huì)關(guān)注度高低。統(tǒng)計(jì)數(shù)據(jù)截至2024年11月。AIGC技術(shù)產(chǎn)品萌芽階段AIGC技術(shù)產(chǎn)品爬升階段AIGC技術(shù)產(chǎn)品成熟階段

圖表來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料及專家調(diào)研整理繪制。?2024.11ZD

Insights

1.2

至頂AIGC成熟度曲線(2024)社會(huì)關(guān)注度6.69億社會(huì)關(guān)注度

3億c

視頻生成

模型端側(cè)模型社會(huì)關(guān)注度

7200萬(wàn)RAG

提示工程

。

微調(diào)?社會(huì)關(guān)注度

7446萬(wàn)人形機(jī)器人智能汽車AI手機(jī)社會(huì)關(guān)注度

9.6萬(wàn)社會(huì)關(guān)注度

11萬(wàn)社會(huì)關(guān)注度

761萬(wàn)社會(huì)關(guān)注度

33萬(wàn)社會(huì)關(guān)注度

120萬(wàn)社會(huì)關(guān)注度

630萬(wàn)社會(huì)關(guān)注度

43萬(wàn)社會(huì)關(guān)注度

1020萬(wàn)圖像生成

模型社會(huì)關(guān)注度

7322萬(wàn).AI

Agent大語(yǔ)言模型合成數(shù)據(jù)AI

PC71.3規(guī)模定律(ScalingLaw)將持續(xù)推動(dòng)AIGC產(chǎn)業(yè)發(fā)展規(guī)模定律是指隨著訓(xùn)練數(shù)據(jù)

模型大小和計(jì)算資源的增加,大語(yǔ)言模型的性能會(huì)有所提升的規(guī)律

,

2020年由OpenAI提出;2022年,GoogleDeepMind研究固定成本下最優(yōu)的模型參數(shù)量和訓(xùn)練數(shù)據(jù)量,得出訓(xùn)練數(shù)據(jù)量應(yīng)當(dāng)和參數(shù)量同等提升,并訓(xùn)練出Chinchilla模型。伴隨OpenAI

o1模型的發(fā)布,ScalingLaw從模型訓(xùn)練擴(kuò)展演進(jìn)到推理擴(kuò)展階段。MMLU評(píng)分

全球主流大模型性能表現(xiàn)符合規(guī)模定律

Falcon

180B

U-PaLM

540B

1800億參數(shù)

,

3.5萬(wàn)億token

,3.76e24

Flops

?2024.11ZD

Insights

Gopher

0.4B

70億參數(shù)

,

2萬(wàn)億token

,8.4e22

Flops

10090807060504030201002800億參數(shù)

,3000億token,6.31e23

Flops700億參數(shù)

,1.4萬(wàn)億token,5.76e23

Flops400億參數(shù)

,1萬(wàn)億token,2.4e23

FlopsLLaMA

2

34B●

Falcon

40B

LLaMA

33B110100100010000資料來(lái)源:

MMLU,Epoch

AI,至頂智庫(kù)整理繪制。Mistral

7BQwen

7B●BLOOM

176BRoBERTa-base

125M●ChinchillaGeminiUltra~1760BGLM

130B●Gopher

280BQwen1.5

72BLLaMA

65BLLaMA

2

13BLLaMA

2

7B參數(shù)量8Google企業(yè)名稱企業(yè)LOGO總部

所在

地生成式AI產(chǎn)業(yè)主要細(xì)分領(lǐng)域AI芯片AI計(jì)算集群MaaS平臺(tái)AI大模型AI場(chǎng)景應(yīng)用/解決方案閉源開(kāi)源輕量智能助手辦公金融醫(yī)療汽車教育營(yíng)銷商湯

中國(guó)

o

o

oo

o

ooo

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。

9?2024.11ZD

Insights

1.4全球科技領(lǐng)軍企業(yè)在AIGC產(chǎn)業(yè)的布局韓國(guó)企業(yè)韓國(guó)√騰訊

Tencent騰訊

阿里云

C-〕阿里云火山引擎京東華為科大訊飛C

Metaintel.Qual

cowwMetaOpenAI蘋果英偉達(dá)英特爾高通美國(guó)

美國(guó)

。

美國(guó)美國(guó)

美國(guó)

美國(guó)

美國(guó)

美國(guó)中國(guó)中國(guó)

中國(guó)

中國(guó)

中國(guó)

中國(guó)亞馬遜云科技

微軟●●√●√

√√●●

●√√√

√●中國(guó)√美國(guó)企業(yè)中國(guó)企業(yè)谷歌美國(guó)三星百度√√√√√√2017年,伴隨Transformer的出現(xiàn),AI大模型在全球掀起開(kāi)發(fā)浪潮

。

2022年11月,ChatGPT的正式發(fā)布

,加速了各類科技企業(yè)開(kāi)發(fā)大模型的進(jìn)度,以谷歌、

Meta、

OpenAI

、Anthropic、百度、

阿里、騰訊、

科大訊飛、

智譜等國(guó)內(nèi)外領(lǐng)軍科技企業(yè),推出語(yǔ)言、

圖像、視覺(jué)、

多模態(tài)等各種類型的AI大模型,主流模型具有生成各類文案、

圖像、視頻等能力。

此外

,適用于

金融、

醫(yī)療、教育、

營(yíng)銷、客服等領(lǐng)域的行業(yè)大模型也層出不窮

,不斷推動(dòng)商業(yè)化落地進(jìn)程。1.5全球AIGC產(chǎn)業(yè)發(fā)展路線圖(2015-2024)

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。

10?2024.11ZD

Insights

Transformer

BERT

Ernie

1.02020.5發(fā)布GPT-32020.6

Gshard

CodeGeeX

OPT-175B發(fā)布GPT-2發(fā)布GPT-1

2020.102020.112022.112015.122017.62018.10

Ernie2.0

Ernie

3.02022.8Make-a-Video

視頻生成模型DALL·E圖像生成模型DALL·E2圖像生成模型2022201720212019202020182015

RoBERTa2021.5

2021.1發(fā)布ChatGPT2022.9

OpenAI成立GLM-130B2021.12WebGLMGLM-10B2022.42018.62021.72022.52021.92019.22019.72019.3LaMDAGLaMGLMmT5文心大模型4.0工具版Gemma

2

i-

i

視頻

Mistral

Large

Mixtral

8x22BGrok-1.5

GLM-4

2024.2

Grok-2

豆包大模型

Grok-1.5V

Llama

3

Claude

3

Opus

Gemini

1.5Grok-2

mini

r

2

GPT-4o

ia1.5

ProGemmGeminMogeeaNLstrastraMM生成模型Sora發(fā)布型min型側(cè)量端Ph輕4

0Turbo文心大模圖像生成模型

文心大模型4.0AndesGPT

端側(cè)模型OPPO2023.6

2023.71.5全球AIGC產(chǎn)業(yè)發(fā)展路線圖(2015-2024)

Claude3

Haiku

Claude3

Sonnet2024.42024.62024.3?2024.11ZD

Insights

Gemini

Live圖像智能語(yǔ)音助手

Pixel

Studio生成應(yīng)用谷歌AI手機(jī)搭載Gemini模型

TensorG4AI手機(jī)芯片Gemini

1.0UltraGemini

1.0ProGemini

1.0Nano輕量模型/端側(cè)模型Phi-3圖像生成模型Veo視頻生成模型Gemini

1.5

Flash

輕量模型Llama3.2視覺(jué)模型

(11B和90B)文本生成模型1B和3B)日日新SenseNova5.5大模型體系日日新

5.5Lite端側(cè)模型OpenAI與FinancialTimes達(dá)成合作,提升ChatGPT體驗(yàn)OpenAI與Apple達(dá)成合作,未來(lái)蘋果產(chǎn)品將搭載ChatGPTQwen2.5開(kāi)源通義萬(wàn)相發(fā)布視頻

生成模型CodeGeeX4

代碼生成模型

CogVideoX視頻生成模型2023.82023.52023.92023.10Qwen-72BQwen-1.8BQwen-Audio

(音頻大模型)資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。訊飛星火V3.5

星火語(yǔ)音大模型

星火開(kāi)源-13BAI芯片MTIAv1PaLM2ChatGPT

Enterprise

企業(yè)級(jí)產(chǎn)品推出Claude2.1長(zhǎng)文本200KToken日日新SenseNova

大模型體系2023.3ChatGPT

Plus訂

閱服務(wù)推出CogVLM

ChatGLM3

智譜清言Ernie

3.5

端側(cè)模型2024.92024.8蔚來(lái)NOMI

GPT

端側(cè)模型CM3leon

文生圖模型

Llama2日日新SenseNova4.0大模型體系日日新SenseNova5.0大模型體系理想Mind

GPT

端側(cè)模型豆包·視頻生成

模型藍(lán)心大模型1B

端側(cè)模型Emu視頻生成模型Qwen-VL視覺(jué)語(yǔ)言模型20232024Microsoft

Copilot智能助理GPT-4o

mini

SearchGPTChatGLM2

智譜清言O(shè)penAIo1

推理模型ERNIE

Bot

文心一言發(fā)布GPT

StoreClaudePro

Mistral

7BMetaAI

智能助理Phi-3.5輕量模型騰訊混元大模型訊飛星火V1.5訊飛星火V2.0訊飛星火V1.0訊飛星火V4.0訊飛星火V3.0通義千問(wèn)2.5通義千問(wèn)2.0通義千問(wèn)1.0小米MiLMMixtral

8x7BImagen3VisualGLMClaude3.52023.122023.11ERNIE4.0Llama3.1ChatGLMDALL-E32024.72024.12024.52023.42023.2PaLM-ELlama

1SonnetClaudeClaudeGPT-4112024年10月Ministral

3B/8B包括Ministral3B和Ministral8B兩種

輕量級(jí)模型,均支持128k上下文且

性能媲美Gemma

2、Llama

3.1開(kāi)源模

型。Ministral8B具有特殊的交錯(cuò)滑

動(dòng)窗口注意力機(jī)制(SWA),可實(shí)現(xiàn)更

快和內(nèi)存高效的推理。2024年7月Mistral

Large

21230億參數(shù)的大小使其能夠在單

個(gè)節(jié)點(diǎn)上以大吞吐量運(yùn)行

。Mistral

Large2擁有128k上下文窗口,支持

英語(yǔ)、法語(yǔ)、

中文等數(shù)十種語(yǔ)言及80多種編程語(yǔ)言,在代碼和推理、指令遵循、

多輪對(duì)話等方面表現(xiàn)突

出。Mistral

Large

2允許用于研究和非商業(yè)用途的使用和修改。2024年4月Mixtral

8x22BMixtral8x22B是一個(gè)稀疏專家混合

(SMoE)

模型,僅使用

1410億激活參

數(shù)中的390億,具有高成本效率

。

Mixtral8x22B精通英語(yǔ)

、

法語(yǔ)

、

大利語(yǔ)

、德語(yǔ)和西班牙語(yǔ)

,具有很

強(qiáng)的數(shù)學(xué)和編碼能力

,64K

token上

下文窗口允許從大型文檔中精確調(diào)

用信息。2024年6月多模態(tài)模型

Claude

3.5

SonnetClaude

3.5Sonnet

的運(yùn)行速度是Claude

3

Opus

的兩倍,且推理、

讀理解、數(shù)學(xué)、科學(xué)和編碼能力更

強(qiáng),也是Anthropic迄今最強(qiáng)的視覺(jué)

模型;Claude.ai

新增了Artifacts

能。

Artifacts

項(xiàng)

擴(kuò)

用戶

Claude

交互方式的新功能。用戶可

以實(shí)時(shí)查看

、

編輯和構(gòu)建Claude的創(chuàng)作,并將生成的內(nèi)容無(wú)縫集成

到項(xiàng)目和工作流程中。2024年3月多模態(tài)模型Claude

3Claude3Opus是最智能的模型

,在

高度復(fù)雜的任務(wù)上具有市場(chǎng)最佳的

性能;

Claude3Sonnet在智能和速

度之間實(shí)現(xiàn)理想的平衡;

Claude3

Haiku是最快、最緊湊的模型。2024年9月推理模型

OpenAIo1OpenAI

o1在處理物理學(xué)、化學(xué)和生物學(xué)領(lǐng)域的復(fù)雜問(wèn)題時(shí)展現(xiàn)出

了接近博士的專業(yè)能力。在國(guó)際

奧林匹克數(shù)學(xué)競(jìng)賽中,展現(xiàn)出

83%的準(zhǔn)確率水平

。

其編程能力

還在Codeforces競(jìng)賽中表現(xiàn)超過(guò)

89%的人類選手。2024年5月多模態(tài)模型GPT-4oGPT-4o采用更自然的人機(jī)交互

,接受文本、音頻、

圖像和視頻的任意組合作為輸入

,并生成文本、音頻和圖像的任意組合輸出。2024年2月視頻生成模型Sora視頻生成模型Sora能夠生成時(shí)長(zhǎng)一

分鐘的高保真視頻

。OpenAI在可變

持續(xù)時(shí)間、分辨率和寬高比的視頻

和圖像上聯(lián)合訓(xùn)練文本調(diào)節(jié)擴(kuò)散模

型,能在時(shí)間上向前或向后擴(kuò)展視

頻;可修改輸入視頻的風(fēng)格和環(huán)境;

可連接兩個(gè)輸入視頻,在不同主題

和場(chǎng)景構(gòu)成的視頻之間無(wú)縫過(guò)渡。2024年8月Gemma

2輕量級(jí)輕量級(jí)Gemma

2

2B

擁有20億參數(shù),具有內(nèi)置的安全改進(jìn)以及性能和

效率的強(qiáng)大平衡。

可在各種硬件上高效運(yùn)行,從邊緣設(shè)備和筆記本

電腦到使用

VertexAI

和Google

KubernetesEngine

(GKE)

的強(qiáng)大云

部署。

可根據(jù)商業(yè)友好的Gemma條款進(jìn)行研究和商業(yè)應(yīng)用。2024年6月視覺(jué)語(yǔ)言模型PaliGemma及開(kāi)源模型Gemma

2PaliGemma是開(kāi)放式視覺(jué)語(yǔ)言模型,可在廣泛的視覺(jué)語(yǔ)言任務(wù)中實(shí)現(xiàn)卓越的微調(diào)性能,包括為圖片和短視頻描述生成、視覺(jué)問(wèn)答、理解圖像中的文本、對(duì)象檢測(cè)和對(duì)象分割;Gemma

2開(kāi)源9B和27B版本,其中Gemma

2

27B性能與

Llama

3

70B相媲

美,大小不到Llama

3

70B

的一半。2024年5月多模態(tài)

Gemini

1.5Flash1.5Flash是通過(guò)API提供的速度最快

的Gemini模型,比

1.5

Pro

更輕量級(jí)

但具有強(qiáng)大的多模態(tài)推理能力,在

總結(jié)摘要、聊天應(yīng)用、

圖像和視頻字幕生成以及從長(zhǎng)文檔和表格中提取數(shù)據(jù)等方面表現(xiàn)出色。,2024年5月視頻生成模型VeoVeo

可生成時(shí)間超過(guò)一分鐘的1080p

分辨率視頻。包括生成查詢網(wǎng)絡(luò)

(GQN)、

DVD-GAN

、

Imagen-Video

、

Phenaki

、

WALT

VideoPoet和Lumiere

,提高質(zhì)量和輸出分辨率。2024年5月圖像生成模型Imagen

3Imagen

3是Google最高質(zhì)量的文本到

圖像模型,可生成高細(xì)節(jié)水平、逼真的圖像,與之前的模型相比,分

散注意力的視覺(jué)干擾更少。2024年2月開(kāi)源模型

GemmaGemma更加輕量,擁有2B和7B版本模型權(quán)重也一并開(kāi)源,且允許商用。

采用與Gemini模型相同技術(shù)構(gòu)建。2024年2月Gemini

1.5Gemini

1.5采用新的專家混合(MoE)

架構(gòu)

,使訓(xùn)練和服務(wù)更加高效

。

其中

Gemini1.5Pro是中型多模態(tài)模型,配備了標(biāo)準(zhǔn)的

128k

token上下文窗口。2024年9月開(kāi)源模型Llama

3.2包括視覺(jué)模型(11B和90B)和文本

模型(1B和3B)

,提供預(yù)訓(xùn)練與對(duì)

齊版本

,可通過(guò)torchtune進(jìn)行微調(diào)

也可使用torchchat在本地部署

,還

可通過(guò)Meta

AI進(jìn)行使用。2024年7月開(kāi)源模型Llama

3.1Llama3.1405B使用15萬(wàn)億token在超

過(guò)16000個(gè)H100GPU上訓(xùn)練

,上下文長(zhǎng)度擴(kuò)展到128K。2024年4月開(kāi)源模型Llama

3具有80億和700億參數(shù)

,預(yù)訓(xùn)練數(shù)

據(jù)集達(dá)到15萬(wàn)億token進(jìn)行訓(xùn)練,

訓(xùn)練數(shù)據(jù)來(lái)源于30余種語(yǔ)言。1.62024年全球領(lǐng)軍科技企業(yè)在AIGC領(lǐng)域的最新進(jìn)展2024年4月小尺寸模型Phi-3

mini可用于手機(jī)上運(yùn)行的小尺寸模型

,

其中Phi-3mini擁有38億參數(shù),經(jīng)

過(guò)

3.3

萬(wàn)億token訓(xùn)練。Phi-3-mini有兩種上下文長(zhǎng)度變體

:4K和

128K

token。?2024.11ZD

Insights

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。你open

AlO

MetaGoogleGoogleAN

THRO

P\C122024年10月訊飛星火4.0Turbo文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、

多模態(tài)能力均超過(guò)GPT-4

Turbo,數(shù)

學(xué)和代碼能力超越GPT-4o,效率相

對(duì)提升50%,國(guó)內(nèi)外中英文14項(xiàng)主

流測(cè)試集中實(shí)現(xiàn)9項(xiàng)第一。2024年6月訊飛星火大模型V4.0實(shí)現(xiàn)對(duì)標(biāo)GPT4-Turbo

,在文本生成、

語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力等方面實(shí)現(xiàn)超越。2024年1月訊飛星火大模型V3.5模型在語(yǔ)言理解、文本生成、知識(shí)問(wèn)答、邏輯推理,數(shù)學(xué)能力、

代碼能力和多模態(tài)能力七個(gè)方面進(jìn)行全面升級(jí),其中語(yǔ)言理解、

數(shù)學(xué)能力超過(guò)GPT-4Turbo。代碼

達(dá)到GPT-4Turbo

96%,多模態(tài)理

解達(dá)到GPT-4V

91%。2024年1月星火語(yǔ)音大模型在中文、英語(yǔ)、法語(yǔ)、俄語(yǔ)等首批37個(gè)主流透種的語(yǔ)音識(shí)劇效果

超過(guò)OpenAl

WhisperV3。在多語(yǔ)種

語(yǔ)音合成方面,星火語(yǔ)音大模型

的首批40個(gè)語(yǔ)種平均MOS分絕對(duì)提

升0.25,擬人度超83%。2024年9月開(kāi)源模型Qwen2.5通義大模型家族已全面涵蓋語(yǔ)言

圖像、視頻、音頻等

態(tài)

。

Qwen2.5全系列模型都在18T

token數(shù)

據(jù)上進(jìn)行預(yù)訓(xùn)練

,Qwen2.5-72B模型

在MMLU-rudex

基準(zhǔn)

、

MBPP基準(zhǔn)和

MATH

基準(zhǔn)的得分高達(dá)86.8

、

88.2

83.1。通義萬(wàn)相發(fā)布視頻生成模型文生視頻中,支持多語(yǔ)言輸入和多種比例生成

,并可以通過(guò)靈感

擴(kuò)寫(xiě)功能豐富視頻內(nèi)容表現(xiàn)力;圖生視頻中,支持將上傳圖片按

照比例轉(zhuǎn)化為動(dòng)態(tài)視頻

,并能通

過(guò)提示詞控制視頻運(yùn)動(dòng)。2024年5月通義千問(wèn)2.5通義千問(wèn)2.5版本的理解能力、邏輯推理、指令遵循、代碼能力分

別提升9%、

16%、

19%,10%。2024年4月開(kāi)源模型Qwen1.5-32BQwen1.5-32B在MMLU、GSM8K、HumanEval以及BBH等多種任務(wù)上展

現(xiàn)出頗具競(jìng)爭(zhēng)力的表現(xiàn),優(yōu)于其他

30B級(jí)別模型。2024年3月開(kāi)源模型Qwen1.5開(kāi)源

0.5B

、1.8B、

4B

、7B

、14B

72B共計(jì)6個(gè)不同規(guī)模的Base和Chat模型。2024年7月飛槳框架3.0飛槳框架3.0

是面向大模型

、

異構(gòu)多芯進(jìn)行專屬設(shè)計(jì),向下適配異構(gòu)多芯,充分釋放硬件潛能;

向上一體化支撐大模型的訓(xùn)練、推理。

同時(shí)具有動(dòng)靜統(tǒng)一自動(dòng)并行、編譯器

自動(dòng)優(yōu)化、大模型訓(xùn)推一體、

大模型多硬件適配四大能力

,全面地提升了服務(wù)產(chǎn)業(yè)的能力。2024年6月文心大模型4.0Turbo網(wǎng)頁(yè)版、APP、API

陸續(xù)開(kāi)放,通過(guò)數(shù)據(jù)、基礎(chǔ)模型、對(duì)齊技術(shù)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)等核心技術(shù)的持續(xù)創(chuàng)新

,速度更快,效果更好。2024年4月文心大模型4.0工具版在工具版上,可以通過(guò)自然語(yǔ)言交互,進(jìn)行文檔問(wèn)答、數(shù)據(jù)分析、代

碼執(zhí)行。提供基于大模型來(lái)開(kāi)發(fā)各種應(yīng)用的工具

,包括智能體開(kāi)發(fā)工具AgentBuilder

,AI原生應(yīng)用開(kāi)發(fā)

工具AppBuilder,以及各種尺寸的

模型定制工具M(jìn)odelBuilder。2024年4月智艙大模型2.0智艙大模型2.0采用全新MoE架構(gòu),可支持本地化部署

,并配套專屬開(kāi)發(fā)工具鏈,支持車企高效定制品牌特色,基于智艙體驗(yàn)打造差異化競(jìng)爭(zhēng)力。2024年10月基座大模型GLM-4-PlusGLM-4-Plus

在各大語(yǔ)言文本能力

數(shù)據(jù)集上獲得與

GPT-4o

及405B

Llama3.1

相當(dāng)?shù)乃?,在語(yǔ)言理

解、邏輯推理、指令遵循、長(zhǎng)文

本輸出方面都有較大突破。2024年7月視頻生成模型CogVideoX智譜發(fā)布AI

視頻模型「清影」

,30秒將任意文圖生成視頻

,并開(kāi)源與「清影」

同源的視頻生成模型CogVideoX。2024年7月代碼生成模型CodeGeeX4開(kāi)源CodeGeeX4-ALL-9B

,集代碼補(bǔ)

全和生成、代碼問(wèn)答、代碼解釋器、

工具調(diào)用、聯(lián)網(wǎng)搜索、項(xiàng)目級(jí)代碼問(wèn)答等能力于一體的代碼大模型。2024年1月GLM-4GLM-4

,整體性能相比GLM3全面提

升60%

,支持更長(zhǎng)上下文

、

更強(qiáng)的多模態(tài),支持更快推理速度,更多

并發(fā),降低推理成本。GLM-4實(shí)現(xiàn)自主根據(jù)用戶意圖,

自動(dòng)理解、規(guī)

劃復(fù)雜指令,

自由調(diào)用網(wǎng)頁(yè)瀏覽器、

Code

Interpreter代碼解釋器和多模

態(tài)文生圖大模型,以完成復(fù)雜任務(wù)。2024年9月豆包·視頻生成模型遵從復(fù)雜prompt

,解鎖時(shí)序性多拍

動(dòng)作指令與多個(gè)主體間的交互能力。

具備多鏡頭語(yǔ)言能力,并能完成在一個(gè)prompt內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換。支持多種視頻風(fēng)格

,還包含六種不同比例的視頻。2024年5月豆包大模型發(fā)布9款豆包系列大模型

,包括豆包通用模型Pro/Lite

角色扮演模

型、語(yǔ)音合成模型、聲音復(fù)刻模型、

語(yǔ)音識(shí)別模型、文生圖

模型

、Functioncall模型

、向量化模型

。

其中豆包通用模型pro支持128k長(zhǎng)文

本,全系列可精調(diào)

,具備更強(qiáng)的理解、

生成、邏輯等綜合能力。2024年9月騰訊混元Turbo相比于前一代混元Turbo模型,新一代的訓(xùn)練效率提升108%,推理效

率提升100%,推理成本則降低為前

一代的一半。在多個(gè)基準(zhǔn)的測(cè)試上

已能夠?qū)?biāo)GPT-4o。2024年5月AI助手元寶基于騰訊混元大模型

,具備看

、

聽(tīng)

、說(shuō)等多模態(tài)能力

,在知識(shí)學(xué)

習(xí)

、

生活百科

、

職場(chǎng)辦公

、趣味

創(chuàng)作等多個(gè)領(lǐng)域提高效率。1.62024年中國(guó)領(lǐng)軍科技企業(yè)在AIGC領(lǐng)域的最新進(jìn)展2024年5月Baichuan

4發(fā)布最新一代基座大模型

Baichuan4

,

同時(shí)推出首款A(yù)I助手“百小應(yīng)”。

Baichuan4

相較Baichuan

3在各項(xiàng)能力上均有極大提升

,其中

通用能力提升超過(guò)10%,數(shù)學(xué)和代

碼能力分別提升14%和9%。2024年7月日日新SenseNova

5.5日日新5.5具有6000億參數(shù),綜合

性能較「

日日新5.0

」提升30%。

交互效果和多項(xiàng)核心指標(biāo)實(shí)現(xiàn)對(duì)

標(biāo)GPT-4o

;「

日日新

5o」,流式多模態(tài)交互,帶來(lái)全新AI交互模

式;端側(cè)模型升級(jí),發(fā)布日日新

5.5

Lite。2024年10月Yi-LightningYi-Lightning在ChatbotArena榜單中

以1287的競(jìng)技場(chǎng)分?jǐn)?shù)位列大語(yǔ)言模型性能的世界第6

,在數(shù)學(xué)模塊位

列世界第3,超越GPT-4o以及Claude

3.5Sonnet等行業(yè)內(nèi)頂尖模型。?2024.11ZD

Insights

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。C-〕阿里云Tencent騰訊131.7測(cè)試集成為評(píng)判AI模型性能的重要手段大模型測(cè)試集是評(píng)估和提升人工智能模型性能的重要工具

,為開(kāi)發(fā)者提供標(biāo)準(zhǔn)化平臺(tái),用于量化和比較不同模型的性能,有助于加速模型的迭代

和優(yōu)化。

相關(guān)測(cè)試集通常涵蓋多個(gè)領(lǐng)域和任務(wù),

以確保全面評(píng)估模型的通用性和專業(yè)性。

按類別來(lái)看,全球AI大模型測(cè)試集分為綜合考試類、

理解推理類、

數(shù)學(xué)科學(xué)類、代碼類。其中,綜合考試類的MMLU(Massive

Multitask

Language

Understanding)測(cè)試集使用較為廣泛,

由加州大學(xué)

伯克利分校于2020年9月發(fā)布,涵蓋57個(gè)學(xué)科,從人文到社科到理工多個(gè)大類的綜合知識(shí)能力。具體如下表所示。全球主流AI大模型測(cè)試集理解&推理HellaSwag英文艾倫人工智能研究所BBH英文GoogleWinoGrande英文華盛頓大學(xué)/艾倫人工智能研究所RACE-H英文卡內(nèi)基梅隆大學(xué)數(shù)學(xué)&科學(xué)GSM8K英文OpenAIMATH英文加州大學(xué)伯克利分校GPQA英文紐約大學(xué)、Cohere、Anthropic代碼HumanEval英文

OpenAI

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。

14?2024.11ZD

Insights

加州大學(xué)伯克利分校上海交通大學(xué)/微軟亞洲研究院/墨爾本大學(xué)艾倫人工智能研究所清華大學(xué)/愛(ài)丁堡大學(xué)/上海交通大學(xué)MMLUCMMLU

ARC-C

C-Eval英文中文

英文

中文發(fā)布單位綜合考試測(cè)試集語(yǔ)種類別發(fā)布時(shí)間政策名稱發(fā)布機(jī)構(gòu)政策內(nèi)容美國(guó)2024年4月Futureof

ArtificialIntelligenceInnovation

Actof2024《2024年人工智能創(chuàng)新法案》美國(guó)國(guó)會(huì)成立美國(guó)人工智能安全研究所,

旨在制定確保國(guó)家安全、

公共安全和個(gè)人權(quán)利的人工智能

標(biāo)準(zhǔn)。

創(chuàng)建人工智能測(cè)試計(jì)劃,幫助發(fā)現(xiàn)人工智能生態(tài)系統(tǒng)中的漏洞

。

組建人工智能創(chuàng)新

和標(biāo)準(zhǔn)聯(lián)盟,鼓勵(lì)人工智能創(chuàng)新合作,協(xié)調(diào)各國(guó)人工智能標(biāo)準(zhǔn)

。由美國(guó)國(guó)家科學(xué)基金會(huì)指

導(dǎo)啟動(dòng)雙邊和多邊人工智能研究合作

,這一發(fā)展將推動(dòng)協(xié)調(diào)創(chuàng)新和安全人工智能發(fā)展。2024年1月The

California

ArtificialIntelligenceTransparency

Act《加州人工智能透明度法案》美國(guó)加州議會(huì)旨在賦予消費(fèi)者識(shí)別AI生成產(chǎn)品的能力,

以降低AI生成內(nèi)容可能被濫用的風(fēng)險(xiǎn)

。

要求大型AI生成內(nèi)容提供商對(duì)其生成的圖像、

視頻、

音頻等媒體內(nèi)容添加水印,并為消費(fèi)者提供相

應(yīng)的查詢平臺(tái)和查詢服務(wù),確保消費(fèi)者擁有對(duì)產(chǎn)品必要信息的知情權(quán)

。

該法案標(biāo)志著美國(guó)

加州在為人工智能生成產(chǎn)品制定明確準(zhǔn)則方面邁出了重要一步。2023年5月National

ArtificialIntelligence

ResearchandDevelopment

Strategic

Plan《國(guó)家人工智能開(kāi)發(fā)戰(zhàn)略計(jì)劃》美國(guó)白宮旨在確保人工智能技術(shù)的發(fā)展符合國(guó)家的價(jià)值觀、

保護(hù)公民權(quán)利、

促進(jìn)經(jīng)濟(jì)增長(zhǎng)并保護(hù)國(guó)

家安全。

該計(jì)劃提出培養(yǎng)聯(lián)邦機(jī)器學(xué)習(xí)方法

,提高模型通信和從多個(gè)設(shè)備更新到共享的全

局模型的效率。

研究可擴(kuò)展通用人工智能系統(tǒng),不斷創(chuàng)新推出基礎(chǔ)模型在語(yǔ)言和圖像任務(wù)

上的應(yīng)用,解決在數(shù)據(jù)庫(kù)上訓(xùn)練模型的隱私問(wèn)題,提升大模型的有效性、

可靠性、

安全性。歐盟2024年9月Councilof

Europe

Framework

ConventiononArtificialIntelligenceand

HumanRights,Democracy

andthe

Ruleof

Law《人工智能與人權(quán)、民主及法治框架公約》歐盟委員會(huì)旨在確保人工智能活動(dòng)符合人權(quán)、民主和法治。

公約促進(jìn)成員國(guó)間以及全球范圍內(nèi)的合作

以強(qiáng)化共同價(jià)值觀;關(guān)切人工智能發(fā)展可能導(dǎo)致的歧視和經(jīng)濟(jì)

社會(huì)不平等;強(qiáng)調(diào)人工智

能系統(tǒng)的透明度和負(fù)責(zé)創(chuàng)新的重要性;國(guó)家需采取措施

,保障人工智能活動(dòng)中對(duì)隱私和個(gè)

人數(shù)據(jù)的保護(hù);

各成員國(guó)需通過(guò)法律和行政手段,確保人工智能系統(tǒng)不危害民主進(jìn)程和法

律的尊重;指定開(kāi)展國(guó)際合作和機(jī)制監(jiān)督,

以確保其條款的有效實(shí)施。2024年7月EU

ArtificialIntelligence

Act《歐盟人工智能法案》歐盟委員會(huì)該法案根據(jù)風(fēng)險(xiǎn)將人工智能分類為四個(gè)等級(jí):不可接受風(fēng)險(xiǎn)的AI(如社會(huì)評(píng)分系統(tǒng)和操控

性AI)

被禁止;

高風(fēng)險(xiǎn)AI系統(tǒng)受到嚴(yán)格監(jiān)管;

有限風(fēng)險(xiǎn)AI系統(tǒng)則面臨較輕的透明度義務(wù);最小風(fēng)險(xiǎn)AI(如大多數(shù)現(xiàn)有應(yīng)用)

不受監(jiān)管

。

高風(fēng)險(xiǎn)AI系統(tǒng)的主要責(zé)任在于提供者(開(kāi)發(fā)

者)

,無(wú)論其是否在歐盟內(nèi),服務(wù)提供者承擔(dān)相關(guān)義務(wù)。

通用AI模型的提供者需提供技術(shù)

文檔和使用說(shuō)明,并遵守版權(quán)指令,存在系統(tǒng)性風(fēng)險(xiǎn)的模型還需進(jìn)行評(píng)估和網(wǎng)絡(luò)安全保護(hù)。日本2024年4月《商業(yè)人工智能指南1.0》日本總務(wù)省、日本經(jīng)濟(jì)產(chǎn)業(yè)省旨在應(yīng)對(duì)生成式人工智能技術(shù)變化,并提供統(tǒng)一的人工智能治理指導(dǎo)原則

。

該指南草案建

議人工智能開(kāi)發(fā)人員收集和處理合理的數(shù)據(jù)以用于模型的學(xué)習(xí);定期評(píng)估AI模型的輸入和

輸出,

以監(jiān)測(cè)任何生成的偏見(jiàn);還應(yīng)當(dāng)向利益相關(guān)方披露用于訓(xùn)練AI的數(shù)據(jù)收集方法以及AI模型的訓(xùn)練方法;確保AI商業(yè)參與者之間的合作,從價(jià)值鏈和風(fēng)險(xiǎn)鏈的角度出發(fā)。

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。

15

?2024.11ZD

Insights

1.8全球AIGC產(chǎn)業(yè)發(fā)展的政策環(huán)境2023年以來(lái)全球發(fā)布的AIGC相關(guān)政策發(fā)布時(shí)間政策名稱發(fā)布機(jī)構(gòu)政策內(nèi)容國(guó)家層面2024年6月《國(guó)家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)

》工業(yè)和信息化部、中央網(wǎng)信辦、國(guó)家

發(fā)改委、國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)指南提出機(jī)器學(xué)習(xí)、

知識(shí)圖譜、

大模型、

自然語(yǔ)言處理、

計(jì)算機(jī)視覺(jué)等關(guān)鍵技術(shù)的標(biāo)準(zhǔn),

其中大模型標(biāo)準(zhǔn)包括大模型通用技術(shù)要求、

評(píng)測(cè)指標(biāo)與方法、

服務(wù)能力成熟度評(píng)估、

生成

內(nèi)容評(píng)價(jià)等。

政策還對(duì)包括基礎(chǔ)安全,數(shù)據(jù)、

算法和模型安全,

網(wǎng)絡(luò)、

技術(shù)和系統(tǒng)安全等

與人工智能模型相關(guān)的安全標(biāo)準(zhǔn)進(jìn)行規(guī)范。2023年7月《生成式人工智能服務(wù)管理暫行辦法》國(guó)家網(wǎng)信辦、國(guó)家發(fā)改委、教育部、

科技部、工業(yè)和信息化部、公安部、國(guó)家廣電總局鼓勵(lì)生成式人工智能技術(shù)在各行業(yè)、

各領(lǐng)域的創(chuàng)新應(yīng)用,生成積極健康、向上向善的優(yōu)質(zhì)

內(nèi)容,探索優(yōu)化應(yīng)用場(chǎng)景,構(gòu)建應(yīng)用生態(tài)體系。

生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開(kāi)展

預(yù)訓(xùn)練、

優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng),應(yīng)遵守:

使用具有合法來(lái)源的數(shù)據(jù)和基礎(chǔ)模型;

不得侵害他人依法享有的知識(shí)產(chǎn)權(quán);采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量。地方層面北京2024年7月《北京市推動(dòng)“人工智能+”行動(dòng)計(jì)劃

(2024-2025年)

》北京市發(fā)展和改革委員會(huì)、北京市經(jīng)濟(jì)和信息化局、北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)到2025年,力爭(zhēng)形成3-5個(gè)先進(jìn)可用、

自主可控的基礎(chǔ)大模型產(chǎn)品、

100個(gè)優(yōu)秀的行業(yè)大模

型產(chǎn)品和1000個(gè)行業(yè)成功案例。圍繞機(jī)器人、

教育、醫(yī)療、

金融、

文化、

交通等領(lǐng)域組織

實(shí)施一批綜合型、

標(biāo)桿性重大工程,建立各行業(yè)大模型平臺(tái),促進(jìn)大模型核心理論與技術(shù)

突破,增強(qiáng)人工智能工程化能力。2024年3月《北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)關(guān)于加快打造AI原生

產(chǎn)業(yè)創(chuàng)新高地的若干政策》北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)管理委員會(huì)到2026年,集聚人工智能產(chǎn)業(yè)鏈企業(yè)100家,建成人工智能算力

10000PFlops

。

加快推進(jìn)算

力基礎(chǔ)設(shè)施建設(shè),鼓勵(lì)打造國(guó)產(chǎn)算力底座。

支持頭部企業(yè)圍繞多模態(tài)通用模型基礎(chǔ)架構(gòu)、多模態(tài)學(xué)習(xí)算法

對(duì)齊調(diào)優(yōu)等領(lǐng)域開(kāi)展大模型關(guān)鍵技術(shù)攻關(guān)

。

大力開(kāi)展

“大模型+”行動(dòng)

推動(dòng)“大模型+自動(dòng)駕駛”

、

“大模型+機(jī)器人”

“大模型+工業(yè)制造”等場(chǎng)景應(yīng)用。2023年5月《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的

若干措施》北京市人民政府辦公廳建設(shè)北京人工智能公共算力中心,形成規(guī)模化先進(jìn)算力供給能力。圍繞模型構(gòu)建、

訓(xùn)練、

調(diào)優(yōu)對(duì)齊、

推理部署等環(huán)節(jié),積極探索基礎(chǔ)模型架構(gòu)創(chuàng)新,研究大模型高效并行訓(xùn)練技術(shù)

和認(rèn)知推理、

指令學(xué)習(xí)、

人類意圖對(duì)齊等調(diào)優(yōu)方法,研發(fā)支持百億參數(shù)模型推理的高效壓

縮和端側(cè)部署技術(shù),形成完整高效的技術(shù)體系,鼓勵(lì)開(kāi)源技術(shù)生態(tài)建設(shè)。

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。

?2024.11ZD

Insights

1.9

中國(guó)AIGC產(chǎn)業(yè)發(fā)展的政策環(huán)境2023年以來(lái)中國(guó)發(fā)布的AIGC相關(guān)政策16發(fā)布時(shí)間政策名稱發(fā)布機(jī)構(gòu)政策內(nèi)容地方層面上海2024年3月《上海市智能算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展

“算

力浦江”智算行動(dòng)實(shí)施方案(2024-2025年)》上海市通信管理局、上海網(wǎng)信辦、上

海市發(fā)改委、上海市數(shù)據(jù)局、上海市

教委、上海市科委、上海市衛(wèi)健委、

上海市市場(chǎng)監(jiān)管局、上海市國(guó)資委、

上海市交通委、中國(guó)人民銀行上海總部到2025年,智能算力規(guī)模超過(guò)30EFlops,

占比達(dá)到總算力的50%以上,算力網(wǎng)絡(luò)節(jié)點(diǎn)間單向

網(wǎng)絡(luò)時(shí)延控制在1毫秒以內(nèi)

。

鼓勵(lì)基礎(chǔ)電信企業(yè)跨地區(qū)提供智算服務(wù),推動(dòng)智算芯片全面

兼容國(guó)產(chǎn)訓(xùn)練框架,推動(dòng)大模型多維并行訓(xùn)練優(yōu)化、

模型快速適配、

模型異構(gòu)推理部署等

技術(shù)和工具研發(fā),推動(dòng)打造智能算力與工業(yè)、

城市治理、

教育科研等應(yīng)用場(chǎng)景的創(chuàng)新融合。2023年10月《上海市推動(dòng)人工智能大模型創(chuàng)新發(fā)展若干

措施(2023-2025年)

》上海市經(jīng)濟(jì)和信息化委員會(huì)、上海市

發(fā)展和改革委員會(huì)、上海市科學(xué)技術(shù)

委員會(huì)、上海網(wǎng)信辦、上海市財(cái)政局支持引進(jìn)高水平創(chuàng)新企業(yè),支持本市創(chuàng)新主體打造具有國(guó)際競(jìng)爭(zhēng)力的大模型

,鼓勵(lì)形成數(shù)

據(jù)飛輪,加速模型迭代。

應(yīng)用層面,重點(diǎn)支持在智能制造、

生物醫(yī)藥、

集成電路、

智能化

教育教學(xué)、

科技金融、

設(shè)計(jì)創(chuàng)意、

自動(dòng)駕駛、

機(jī)器人、

數(shù)字政府等領(lǐng)域構(gòu)建示范應(yīng)用場(chǎng)景

,

打造標(biāo)桿性大模型產(chǎn)品和服務(wù)。深圳2024年9月《深圳市前海深港現(xiàn)代服務(wù)業(yè)合作區(qū)管理局

關(guān)于支持人工智能高質(zhì)量發(fā)展高水平應(yīng)用的若干措施》深圳市前海深港現(xiàn)代服務(wù)業(yè)合作區(qū)

管理局鼓勵(lì)企業(yè)建設(shè)智能算力中心和智能算力調(diào)度平臺(tái),支持企業(yè)基于國(guó)產(chǎn)人工智能軟件底座打

造共性技術(shù)服務(wù)平臺(tái),鼓勵(lì)開(kāi)展人工智能語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言理解等領(lǐng)域通用

關(guān)鍵技術(shù)開(kāi)發(fā)

。圍繞制造、

金融、

物流、

商務(wù)等重點(diǎn)領(lǐng)域支持

“大模型+產(chǎn)業(yè)”應(yīng)用創(chuàng)新。2024年7月《深圳市加快打造人工智能先鋒城市

行動(dòng)方案》深圳市工業(yè)和信息化局鼓勵(lì)開(kāi)展大模型架構(gòu)、

大模型超級(jí)智能、

超級(jí)對(duì)齊等技術(shù)創(chuàng)新,打造全鏈路自研大模型技

術(shù)體系。

研發(fā)多模態(tài)具身智能大模型,開(kāi)發(fā)具身智能機(jī)器人

“大腦”,推動(dòng)具身智能大模

型與機(jī)器人本體深度結(jié)合,鼓勵(lì)打造具有商業(yè)價(jià)值的整機(jī)產(chǎn)品。

在數(shù)字政府、

教育、

醫(yī)療、

氣象、

智慧城市、

環(huán)衛(wèi)、

科研、

制造、

金融、

低空經(jīng)濟(jì)、

智能網(wǎng)聯(lián)汽車、

現(xiàn)代時(shí)尚、

游戲

動(dòng)漫、

文旅、網(wǎng)絡(luò)安全等領(lǐng)域,鼓勵(lì)企業(yè)聯(lián)合研發(fā)行業(yè)大模型。2023年5月《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2023-2024年)

》中共深圳市委、深圳市人民政府聚焦通用大模型、

智能算力芯片、

智能傳感器、

智能機(jī)器人、

智能網(wǎng)聯(lián)汽車等領(lǐng)域,重點(diǎn)

支持打造基于國(guó)內(nèi)外芯片和算法的開(kāi)源通用大模型;支持重點(diǎn)企業(yè)持續(xù)研發(fā)和迭代商用通

用大模型;開(kāi)展通用型具身智能機(jī)器人的研發(fā)和應(yīng)用。

資料來(lái)源:至頂智庫(kù)結(jié)合公開(kāi)資料整理繪制。

17

?2024.11ZD

Insights

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論