人工智能發(fā)展報(bào)告(2024年)_第1頁(yè)
人工智能發(fā)展報(bào)告(2024年)_第2頁(yè)
人工智能發(fā)展報(bào)告(2024年)_第3頁(yè)
人工智能發(fā)展報(bào)告(2024年)_第4頁(yè)
人工智能發(fā)展報(bào)告(2024年)_第5頁(yè)
已閱讀5頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

目 錄一、總體態(tài)勢(shì) 1(一)人工智能技術(shù)演進(jìn)走向新范式 1(二)人工智能工程化邁向新階段 2(三)人工智能安全治理工作緊密推進(jìn) 4(四)人工智能產(chǎn)業(yè)穩(wěn)中有進(jìn)迎來(lái)新動(dòng)能 5二、技術(shù)創(chuàng)新 8(一)基礎(chǔ)模型仍在快速演進(jìn)迭代 8(二)計(jì)算平臺(tái)與模型創(chuàng)新緊密耦合 16(三)工具鏈不斷完善加速大模型研發(fā)應(yīng)用 21(四)高質(zhì)量多模態(tài)數(shù)據(jù)集成為模型能力提升的關(guān)鍵 26三、應(yīng)用賦能 32(一)人工智能賦能階段性特征顯現(xiàn) 32(二)重點(diǎn)行業(yè)人工智能應(yīng)用走深向?qū)?36(三)體系化推動(dòng)人工智能落地應(yīng)用成為共識(shí) 38四、安全治理 44(一)人工智能技術(shù)應(yīng)用帶來(lái)多重挑戰(zhàn) 45(二)全球人工智能安全治理正處于“從原則走向?qū)嵺`”的關(guān)鍵階段 47五、發(fā)展展望 54圖目錄圖1全球人工智能產(chǎn)業(yè)規(guī)模(單位:億美元) 6圖2全球生成式人工智能投融資規(guī)模(單位:億美元) 7圖3語(yǔ)言、視覺(jué)和多模態(tài)三類(lèi)基礎(chǔ)模型布局 8圖4大模型工具鏈架構(gòu)圖 22圖5不同階段的具體數(shù)據(jù)需求情況 26圖6基于百個(gè)優(yōu)秀案例統(tǒng)計(jì)的AI應(yīng)用產(chǎn)業(yè)鏈分布 35圖7人工智能風(fēng)險(xiǎn)管理體系 44圖8人工智能風(fēng)險(xiǎn)示例 45表目錄表1語(yǔ)言大模型演進(jìn)迭代情況 10表2語(yǔ)言大模型調(diào)整及解決方案 12表3多模態(tài)模型技術(shù)路線(xiàn)表 15一、總體態(tài)勢(shì)人工智能浪潮席卷全球,正以前所未有的速度、廣度和深度改變生產(chǎn)生活方式。世界主要國(guó)家紛紛將推進(jìn)人工智能技術(shù)創(chuàng)新與應(yīng)用作為國(guó)家戰(zhàn)略的重要方向,我國(guó)高度重視人工智能在培育新質(zhì)生產(chǎn)力、塑造新動(dòng)能方面的重要作用。習(xí)近平總書(shū)記指出,人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,將對(duì)全球經(jīng)濟(jì)社會(huì)20241(一)人工智能技術(shù)演進(jìn)走向新范式以Transformer都能夠顯著增強(qiáng)模型的復(fù)雜性和處理能力。二是多任務(wù)適應(yīng)。大模型支持多任務(wù)多模態(tài)能力持續(xù)增強(qiáng),可執(zhí)行任務(wù)已經(jīng)從文本對(duì)話(huà)拓展到多模態(tài)理解、多模態(tài)生成等場(chǎng)景。三是能力可塑。通用大模型在訓(xùn)練階段通過(guò)結(jié)合增量預(yù)訓(xùn)練、有監(jiān)督微調(diào)、知識(shí)圖譜等方法,實(shí)現(xiàn)將專(zhuān)業(yè)數(shù)據(jù)和知識(shí)注入模型中,提升大模型在專(zhuān)業(yè)領(lǐng)域的應(yīng)用能力;在推理階段,通過(guò)引入檢索增強(qiáng)生成、提示詞工程和智能體等技術(shù),將更豐富的上下文信息和專(zhuān)業(yè)知識(shí)引入模型推理過(guò)程,解決更復(fù)雜的推理任務(wù),優(yōu)化模型表現(xiàn)。具體從大模型算法演進(jìn)態(tài)勢(shì)看,深挖現(xiàn)有體系架構(gòu)潛力,以實(shí)現(xiàn)理解推理能力和訓(xùn)練效率倍增仍是當(dāng)前發(fā)展主線(xiàn)。模型研發(fā)主體(Transformer和模型改造(如擴(kuò)大上下文窗口、思維鏈復(fù)雜推理、優(yōu)化注意力模塊、網(wǎng)絡(luò)架構(gòu)稀疏化、多模態(tài)特征對(duì)齊與統(tǒng)一理解等)展開(kāi)創(chuàng)新升級(jí),OpenAIo1模型通過(guò)模仿人腦思考的思維過(guò)程,顯著提升數(shù)學(xué)、物理、編程等復(fù)雜任務(wù)的性能水平。與Transformer圖神經(jīng)網(wǎng)絡(luò)的GraphCast、GNoMEPINNDeepONet(二)人工智能工程化邁向新階段工程化技術(shù)是推動(dòng)人工智能從實(shí)驗(yàn)室走向生產(chǎn)環(huán)境的關(guān)鍵橋梁,也是人工智能在垂直行業(yè)應(yīng)用落地的必經(jīng)之路。在此過(guò)程中,人工智能工具鏈發(fā)揮著核心作用,其覆蓋數(shù)據(jù)處理、模型訓(xùn)練微調(diào)、部署推理、應(yīng)用開(kāi)發(fā)、監(jiān)控運(yùn)維和安全可信全流程,是實(shí)現(xiàn)智能化轉(zhuǎn)型的基礎(chǔ)設(shè)施和加速器。當(dāng)前,人工智能工程化的重點(diǎn)逐漸從大模型的訓(xùn)練微調(diào)向應(yīng)用開(kāi)發(fā)和落地轉(zhuǎn)變,構(gòu)建起圍繞大模型及其應(yīng)用的工具鏈,標(biāo)志著人工智能工程化進(jìn)入了新的產(chǎn)業(yè)化階段。開(kāi)發(fā)工具鏈加速大模型技術(shù)迭代速度。開(kāi)發(fā)工具鏈作為連接算DeepSpeed、Megatron-LM等分布式訓(xùn)練框架通過(guò)支持更豐富的并行策略,以及更豐富的計(jì)算加速策略,有效支持產(chǎn)業(yè)界超大規(guī)模模型的預(yù)訓(xùn)練。同時(shí),訓(xùn)練框架?chē)@參數(shù)高效微調(diào)等方面的技術(shù)創(chuàng)新,可以有效降低計(jì)算和存儲(chǔ)成本。在推理方面,開(kāi)發(fā)工具鏈聚焦優(yōu)化量化、剪枝等壓縮技術(shù)持續(xù)突破,加速推理過(guò)程并降低部署成本。同時(shí),開(kāi)發(fā)工具通過(guò)完善并行推理、混合精度推理、推理緩存等技術(shù),可以有效降低計(jì)算資源消耗,提升推理服務(wù)速度。應(yīng)用工具鏈拓展大模型應(yīng)用廣度。大模型應(yīng)用工具主要圍繞增強(qiáng)生成(RAG)及多組件融合等核心要素持續(xù)創(chuàng)新。Agent的引入,實(shí)現(xiàn)了復(fù)雜任務(wù)的自動(dòng)化執(zhí)行與智能決策;多模型編排則有效RAG(三)人工智能安全治理工作緊密推進(jìn)在人工智能飛速發(fā)展的浪潮下,全球人工智能治理合作持續(xù)升溫,各國(guó)政府、國(guó)際組織、私營(yíng)部門(mén)及社會(huì)各界攜手并進(jìn),各主要全球人工智能安全治理合作愈發(fā)緊密,各主要經(jīng)濟(jì)體治理體系漸趨明晰。國(guó)際合作方面,交流合作更加頻繁,強(qiáng)調(diào)“負(fù)責(zé)任”、普惠發(fā)展理念。聯(lián)合國(guó)在全球人工智能治理中發(fā)揮主渠道作用,二十國(guó)集團(tuán)、七國(guó)集團(tuán)等密集推出人工智能治理舉措,人工智能安全峰會(huì)聚焦安全議題提供全球?qū)υ?huà)平臺(tái)。與此同時(shí),全球積極推動(dòng)人工智能普惠發(fā)展。聯(lián)合國(guó)大會(huì)通過(guò)了關(guān)于人工智能的里程碑式?jīng)Q議加快實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo),我國(guó)發(fā)起“一帶一路”倡議、搭建“數(shù)-普惠計(jì)劃》,都致力于讓人工智能為全人類(lèi)帶來(lái)“惠益”。治理體系方面,各主要經(jīng)濟(jì)體治理體系漸趨明晰,旨在維護(hù)本土產(chǎn)業(yè)發(fā)展需要。我國(guó)兼顧人工智能發(fā)展與安全,提出建立人工智能安全監(jiān)管(1.0版)》。歐盟出臺(tái)《人工智能法案》構(gòu)建統(tǒng)一治理格局,美國(guó)發(fā)布拜登行政令推行行業(yè)自律的治理架構(gòu),英國(guó)、新加坡、日本等國(guó)加人工智能安全前瞻研究和產(chǎn)業(yè)實(shí)踐深度結(jié)合,安全技術(shù)應(yīng)用能力明顯提升。前瞻研究方面,麻省理工學(xué)院、伯克利大學(xué)和南洋理工大學(xué)等研究機(jī)構(gòu)提出模型間對(duì)抗新范式,深入探索人工智能模型自身安全邊界。清華大學(xué)、北京大學(xué)和騰訊等機(jī)構(gòu)積極開(kāi)發(fā)新型模型水印算法,增強(qiáng)人工智能應(yīng)用的安全可追溯性。產(chǎn)業(yè)實(shí)踐方面,DioptraInspect型能力和整體模型安全,新加坡迭代AI(四)人工智能產(chǎn)業(yè)穩(wěn)中有進(jìn)迎來(lái)新動(dòng)能IDC623321.5%11IDC有兩個(gè)方面的重要原因。一是大模型涌現(xiàn)式發(fā)展,為人工智能產(chǎn)業(yè)202320222Gartner80%的企業(yè)將使用生成式人工智能API,或部署生成來(lái)源:IDC圖1全球人工智能產(chǎn)業(yè)規(guī)模(單位:億美元)202431684%。在全球融資緊縮的背景下,受益于大模型發(fā)展和企業(yè)融資帶動(dòng),人工智能領(lǐng)20224.5%202412.1%。2023252億202292023年所有人工智能相關(guān)投資的約2基于斯坦福大學(xué)EcosystemGraphs數(shù)據(jù)及頭部企業(yè)發(fā)布事件統(tǒng)計(jì)四分之一3。2024年上半年,全球金額最大的10筆融資事件中有6筆為大模型企業(yè)融資,金額總計(jì)達(dá)135億美元。來(lái)源:TheAIIndex2024AnnualReport圖2全球生成式人工智能投融資規(guī)模(單位:億美元)人工智能創(chuàng)業(yè)企業(yè)發(fā)展持續(xù)創(chuàng)新高。人工智能創(chuàng)業(yè)企業(yè)是智能化時(shí)代影響技術(shù)產(chǎn)業(yè)格局的生力軍,也是推動(dòng)全球人工智能產(chǎn)業(yè)生2024242202415家,占所有新增獨(dú)角40%業(yè)務(wù)領(lǐng)域涵蓋生物制藥(XairaTherapeutics)、軟件開(kāi)發(fā)(如Cognition((Perplexity)、(如SakanaAI)技術(shù)實(shí)力和發(fā)展前景已獲得市場(chǎng)認(rèn)可,其中AsteraLabs、出門(mén)問(wèn)問(wèn)20243TheAIIndex2024AnnualReport二、技術(shù)創(chuàng)新(一)基礎(chǔ)模型仍在快速演進(jìn)迭代縮放定律驅(qū)動(dòng)下的模型能力持續(xù)提升,基礎(chǔ)大模型的語(yǔ)言、視ChatGPT的出20232024OpenAI來(lái)源:中國(guó)信息通信研究院圖3語(yǔ)言、視覺(jué)和多模態(tài)三類(lèi)基礎(chǔ)模型布局問(wèn)題上仍面臨挑戰(zhàn)2023820206月1750億個(gè)參數(shù),20242月面壁智能發(fā)布MiniCPM-2.4B24億,86MoEMoE目前,谷歌的Gemini-1.5ProMistralAI8x7B8x22BMoEStep-2MoE架構(gòu),已成為當(dāng)前大模型的重要演進(jìn)趨勢(shì)。四是通過(guò)強(qiáng)化學(xué)習(xí)(Reinforcement(ChainofThought,CoT)20249月OpenAIo1系STEM領(lǐng)域的推理能力顯著增強(qiáng)),還具有了自我反思與錯(cuò)誤修正能力,表1語(yǔ)言大模型演進(jìn)迭代情況公司模型上下文長(zhǎng)度MetaAILlama28kLlama3.1128kOpenAIGPT-432kGPT-4Turbo128ko1/o1mini128kAnthropicClaude3.5200k阿里云Qwen8kQwen-1.532kQwen-2.5128k百度ERINE4.08kERINE4.0Turbo128k上海AI實(shí)驗(yàn)室書(shū)生浦語(yǔ)8k書(shū)生浦語(yǔ)2.0200k谷歌Gemini-1.032kGemini-1.51000k(100萬(wàn))語(yǔ)言大模型雖然在文本理解與生成、復(fù)雜邏輯推理任務(wù)上取得了突破,但在幻覺(jué)問(wèn)題、訓(xùn)練成本方面仍然面臨挑戰(zhàn)。一是復(fù)雜邏輯推理和泛化能力仍需強(qiáng)化。OpenAIo1系列模型為例,雖然OpenAI通過(guò)強(qiáng)化學(xué)習(xí)和思維鏈等技術(shù)方案使得o1系列模型在STEM領(lǐng)域的推理能力得到大幅提升,但在開(kāi)放性、復(fù)雜度更高的問(wèn)題和場(chǎng)景中泛化能力仍然不強(qiáng)。一方面,可以通過(guò)在特定領(lǐng)域的(RAG)RAG模型結(jié)合了檢索機(jī)制和生成機(jī)制,能夠從大量外部數(shù)據(jù)庫(kù)中檢索相關(guān)信息,并結(jié)合這些信息進(jìn)行生成,從而提高內(nèi)容的準(zhǔn)確性;增強(qiáng)長(zhǎng)上下文處理能力,大模型通過(guò)處理長(zhǎng)文本信息,更好地理解上下文及復(fù)雜的邏輯關(guān)系和情境,減少生成幻覺(jué)的風(fēng)險(xiǎn)。三是訓(xùn)練成本仍然偏高。當(dāng)前大模型的訓(xùn)練成本仍然偏高,這主要體現(xiàn)在數(shù)據(jù)需求、算力消耗及基礎(chǔ)架構(gòu)上。在數(shù)據(jù)層面,大模型需要大量的數(shù)據(jù)來(lái)進(jìn)行有效的預(yù)訓(xùn)練,數(shù)據(jù)的收集、標(biāo)注、清洗和預(yù)處理都需要大量的時(shí)間和資源。此外,高質(zhì)量數(shù)據(jù)往往需要人工標(biāo)注,不僅耗時(shí)而且成本高昂,尤其是在需要專(zhuān)業(yè)知識(shí)的領(lǐng)域。在算力層面,訓(xùn)練GPU以犧牲其他方面性能為代價(jià),如計(jì)算效率、內(nèi)存占用等,目前還沒(méi)有出現(xiàn)一種能夠全面超越現(xiàn)有Transformer架構(gòu)的基礎(chǔ)單元。表2語(yǔ)言大模型調(diào)整及解決方案挑戰(zhàn)方向主要解決思路復(fù)雜推理問(wèn)題幻覺(jué)問(wèn)題訓(xùn)練成本問(wèn)題視覺(jué)大模型:Transformer賦能圖像理解,擴(kuò)散模型實(shí)現(xiàn)圖像生成TransformerTransformer模型首次將圖像適配到TransformerImageNetCNN在視覺(jué)領(lǐng)域基礎(chǔ)架構(gòu)的地位。目前,業(yè)界主要聚焦模型結(jié)構(gòu)和下游任務(wù)兩方面對(duì)SwinTransformer、MetaMAE、DeiT、SAM、DINO2、蘇黎世聯(lián)邦理工學(xué)院的PVTMcGillCvT網(wǎng)絡(luò)結(jié)構(gòu),在圖像分類(lèi)、目標(biāo)檢測(cè)與分割、圖像檢索、深度估計(jì)等傳統(tǒng)視覺(jué)任務(wù)上取得突破。ViT為代表的判別式視覺(jué)大模型仍面臨以下幾個(gè)方面的挑戰(zhàn)。一是計(jì)算Transformer復(fù)雜度,對(duì)計(jì)算資源有較高要求。二是訓(xùn)練數(shù)據(jù)依賴(lài)性強(qiáng)等視覺(jué)大模型需要大規(guī)模數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練以獲得更好的性能,在小數(shù)據(jù)集上的表現(xiàn)可能不佳。三是自監(jiān)督學(xué)習(xí)挑戰(zhàn),自監(jiān)督學(xué)習(xí)是視覺(jué)大模型訓(xùn)練的關(guān)鍵環(huán)節(jié),但如何有效地設(shè)計(jì)自監(jiān)督任務(wù)以充分挖掘數(shù)據(jù)特性與模型潛力仍然是一個(gè)開(kāi)放性問(wèn)題。四是模型部署與推理加速,為了在實(shí)際應(yīng)用中部署視覺(jué)大模型,需要有效的模型壓縮擴(kuò)散模型成為圖像生成領(lǐng)域的主流方案,展現(xiàn)巨大應(yīng)用潛力。擴(kuò)散模型(DiffusionModels)基于馬爾科夫鏈的擴(kuò)散過(guò)程逐步從噪聲中重構(gòu)出所需的數(shù)據(jù),廣泛應(yīng)用于高質(zhì)量圖像與視頻的生成、編輯與修復(fù)等場(chǎng)景。擴(kuò)散模型相較傳統(tǒng)生成模型在以下三方面展現(xiàn)優(yōu)勢(shì):一是高質(zhì)量樣本生成,擴(kuò)散模型能夠生成高分辨率、高保真度(GAN)等傳統(tǒng)生成模型相比,擴(kuò)散模型的訓(xùn)練過(guò)程更為穩(wěn)定,減少了模式如文本描述、草圖等)來(lái)引導(dǎo)圖像的生成方向和風(fēng)格,支持生成多樣化的圖像樣本,包括藝術(shù)創(chuàng)作、風(fēng)格遷移等多種創(chuàng)新應(yīng)用。目前頭部人工智能廠(chǎng)商聚焦通過(guò)擴(kuò)散模型持續(xù)提升圖像生成能力,包括StabilityAI的StableDiffusionOpenAI的Imagen等。與此同時(shí),以擴(kuò)散模型為代表的生成式視覺(jué)大模型仍面臨以下三個(gè)方面的挑戰(zhàn):一是推理速度,擴(kuò)散模型的推理過(guò)程需要多個(gè)步驟迭代生成,導(dǎo)致推理時(shí)間較長(zhǎng)。二是幻覺(jué)問(wèn)題,當(dāng)前模型存在生成圖像內(nèi)容與客觀(guān)事實(shí)不符的情況。三是評(píng)估指標(biāo),當(dāng)前擴(kuò)散模型生成樣本的評(píng)估主要基于FID分?jǐn)?shù),這一指標(biāo)反映圖像全局的表征能力,無(wú)法全面反映樣本的細(xì)節(jié)恢復(fù)效果和多樣性。多模態(tài)模型:四種實(shí)現(xiàn)方式探索交叉模態(tài)處理多模態(tài)大模型融合了多種感知途徑與表達(dá)形態(tài),能夠同時(shí)處理文本、圖像、語(yǔ)音等多種數(shù)據(jù),并進(jìn)行深度的語(yǔ)義理解和交叉模態(tài)處理,具備深度人機(jī)交互和全面智能應(yīng)用的潛力,是通用智能的重要實(shí)現(xiàn)路徑。多模態(tài)大模型主要有四種實(shí)現(xiàn)方式,按模型實(shí)現(xiàn)功能可以分為理解類(lèi)與生成類(lèi)兩條主要路徑。一是多模態(tài)理解模型。多模態(tài)理解模型對(duì)齊視覺(jué)特征與文本特征實(shí)現(xiàn)跨模態(tài)的統(tǒng)一理解,分為以下兩類(lèi)技術(shù)路線(xiàn)。一方面,基于語(yǔ)言大模型底座,配合多類(lèi)外部專(zhuān)家模型共同實(shí)現(xiàn)多模態(tài)處理。如微軟的ChatGPT模型將OpenAIChatGPT22種不同的視覺(jué)基礎(chǔ)模型(VFM)相結(jié)合,使用戶(hù)能夠超越語(yǔ)言限制,實(shí)現(xiàn)多模PaLM-E模型利用現(xiàn)有LLM入轉(zhuǎn)化為L(zhǎng)LMCLIP模型通過(guò)對(duì)比學(xué)習(xí),將圖像與文本通過(guò)各自的預(yù)訓(xùn)練模型獲得的編碼向量在向量空間上對(duì)齊,從而理解和推理圖像和文本之間的關(guān)系,被廣泛用于圖像檢索、視覺(jué)問(wèn)答、圖像生成等領(lǐng)域。二是多模態(tài)生成模型。多模態(tài)生成模型基于對(duì)不同模態(tài)信息的理解,具備文本、圖像、視頻、語(yǔ)音信息的生成能力,能夠根據(jù)輸入指令創(chuàng)造新的數(shù)據(jù)內(nèi)容或增強(qiáng)現(xiàn)有數(shù)據(jù)的表達(dá)能力,分為以下兩優(yōu)勢(shì),成為視頻生成模型主流架構(gòu)。DiT架構(gòu)用Transformer代替了傳統(tǒng)擴(kuò)散模型中基于卷積網(wǎng)絡(luò)的U-Net。TransformerOpenAI的Sora1080POpenAI的Gemini均采用了端到端單體模型的方式學(xué)習(xí)文能夠根據(jù)手機(jī)拍攝視覺(jué)信息與用戶(hù)對(duì)話(huà)交互實(shí)現(xiàn)多模態(tài)統(tǒng)320ms,表3多模態(tài)模型技術(shù)路線(xiàn)表類(lèi)型路線(xiàn)典型多模態(tài)理解語(yǔ)言大模型調(diào)度微軟VisualChatGPT谷歌PaLM-E跨模態(tài)特征對(duì)齊OpenAICLIP微軟KOSMOSDeepMindFlamingoSalesforceBLIP多模態(tài)生成擴(kuò)散模型StabilityAIStableDiffusionOpenAIDALL·EOpenAISora快手KLINGRunwayGen-3端到端理解與生成架構(gòu)谷歌GeminiOpenAIGPT-4o(二)計(jì)算平臺(tái)與模型創(chuàng)新緊密耦合模型創(chuàng)新依賴(lài)計(jì)算平臺(tái),協(xié)同價(jià)值凸顯以大模型為代表的通用智能范式正在驅(qū)動(dòng)人工智能計(jì)算平臺(tái)升級(jí)。當(dāng)前,“大模型+大算力+大數(shù)據(jù)”成為可能實(shí)現(xiàn)通用智能的主要路線(xiàn)之一,基礎(chǔ)大模型底座的智能水平與迭代速度成為各國(guó)科技競(jìng)爭(zhēng)的戰(zhàn)略焦點(diǎn)。然而,大模型目前仍是一種實(shí)驗(yàn)科學(xué)裝置,升級(jí)Llama3.1-405B為例,使1.6NVIDIAH100GPU15.6Ttoken54466AISHPerf54TheLlama3HerdofModels,MetaLlamaTeam.5AISHPerf:PerformanceBenchmarksofArtificialIntelligenceSoftwareandHardware正面向大模型訓(xùn)練、推理需求加速迭代升級(jí),模型輕量化部署、混合精度計(jì)算、分布式訓(xùn)練策略?xún)?yōu)化等新特性是近期軟硬件產(chǎn)品升級(jí)迭代重點(diǎn),廠(chǎng)商積極推動(dòng)不同模型網(wǎng)絡(luò)架構(gòu)與硬件的深度適配。大模型技術(shù)的原始創(chuàng)新和應(yīng)用迭代落地高度依賴(lài)先進(jìn)的軟硬件協(xié)同技術(shù)生態(tài)體系。一方面,模型原始創(chuàng)新與底層硬件協(xié)同顯著加強(qiáng),構(gòu)建新的模型結(jié)構(gòu)與組件往往需考慮底層硬件的支持程度,如FlashAttention、FlashDecoding等創(chuàng)新技術(shù)。另一方面,面向差異化的賦能場(chǎng)景,需要軟硬件系統(tǒng)結(jié)合場(chǎng)景需求特點(diǎn)在訓(xùn)練、推理等環(huán)節(jié)高度協(xié)同,從算力集群調(diào)度、框架分布式新發(fā)力點(diǎn)目前,PapersWithCode2020951%2023960%20%3%左右。從技術(shù)能力來(lái)看,2022年底發(fā)布的50%2000250個(gè)左右,僅需一行代碼即可實(shí)現(xiàn)1.52Transformers模型訓(xùn)練加速,大幅提升大模型支持能力,編譯效率大幅提升,受到業(yè)界廣泛歡迎,逐漸擴(kuò)大與近年來(lái)國(guó)內(nèi)涌現(xiàn)了一批如百度飛槳、華為昇思、一流OneFlow、之江天樞等開(kāi)發(fā)框架,支撐構(gòu)建一批更加符合本土產(chǎn)業(yè)特色和場(chǎng)景需求的解決方案。隨著人工智能進(jìn)入大規(guī)模賦能新型工業(yè)化階段,國(guó)產(chǎn)深度學(xué)習(xí)框架迎來(lái)新一輪發(fā)展機(jī)遇,向行業(yè)融合滲透不斷加強(qiáng)。107086萬(wàn)個(gè)模型,23.5Mindspore780萬(wàn),總PR97.7k大規(guī)模分布式訓(xùn)練成為框架的新發(fā)力點(diǎn),一批大模型加速框架顯現(xiàn)。當(dāng)前,開(kāi)發(fā)框架主要面向大模型分布式訓(xùn)練異構(gòu)資源管理調(diào)度、多節(jié)點(diǎn)任務(wù)調(diào)度等方面完成優(yōu)化,呈現(xiàn)兩種發(fā)展路線(xiàn),一是基于原有框架實(shí)現(xiàn)分布式訓(xùn)練功能,例如,微軟DeepSpeed、英偉達(dá)Megatron基于PyTorch強(qiáng)化大模型分布式支持能力、提升訓(xùn)練效率。其中,微軟DeepSpeed針對(duì)分布式訓(xùn)練中計(jì)算資源稀缺問(wèn)題,提升異構(gòu)硬件統(tǒng)籌調(diào)度能力,豐富計(jì)算資源供給。DeepSpeed在多GPU系統(tǒng)上展現(xiàn)出較好的分布式擴(kuò)展性,相較于Megatron,其應(yīng)用更為廣泛,包括計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、推薦系統(tǒng)等,旨在提高大模型的訓(xùn)練速度和效率。二是集成分布式能力的一體化通用發(fā)展路線(xiàn),例如,百度飛槳框架原生支持超大規(guī)模分布式訓(xùn)練能力,推出端到端自適應(yīng)分布式訓(xùn)練技術(shù),實(shí)現(xiàn)了低成本自動(dòng)并行開(kāi)發(fā)、最優(yōu)并行策略自動(dòng)選擇和異步流水調(diào)度,突破了模型結(jié)構(gòu)和硬件環(huán)境多樣導(dǎo)致的分布式訓(xùn)練策略開(kāi)發(fā)復(fù)雜、訓(xùn)練性能調(diào)優(yōu)難的技術(shù)瓶頸。大模型熱潮進(jìn)一步推動(dòng)計(jì)算底座迭代升級(jí)。大模型計(jì)算特性對(duì)硬件要求極高,帶來(lái)分布式訓(xùn)練支持、混合精度計(jì)算支持、高速互聯(lián)通信等新要求新挑戰(zhàn),驅(qū)動(dòng)計(jì)算底座迭代升級(jí),呈現(xiàn)三大趨勢(shì)特Transformer如英HooperTransformer引擎提升算法計(jì)算性能,并利用啟發(fā)式算法實(shí)現(xiàn)數(shù)據(jù)精度動(dòng)態(tài)切換(Blackwell架構(gòu)二代Transformer引擎已支持FP8FP6FP4性能的前提下降低計(jì)算總量;芯片創(chuàng)業(yè)公司Etched推出僅支持TransformerSohu芯片,犧牲編程能力提升計(jì)算速度,推理吞吐量達(dá)到H10020倍。隨著大模型參數(shù)持續(xù)增長(zhǎng)、輸入輸出數(shù)據(jù)長(zhǎng)度快速提升,模型參數(shù)和計(jì)算緩存kvAMDMI300X顯存容量和顯存帶寬提升幅度(240%×H100),均超過(guò)算力提升幅度(220%×H100@FP16)。三是強(qiáng)調(diào)軟硬協(xié)同升級(jí)釋放硬AMDROCm6.2的vLLMInstinctAI推理能力;英偉FlashAttention3H100芯片動(dòng)態(tài)warpFP8精度支持等特性,相比FlashAttention2速度1.5-2倍。多方試圖破局,出現(xiàn)三類(lèi)挑戰(zhàn)者。盡管目前英偉達(dá)壟斷人工智能計(jì)算生態(tài),但面對(duì)高昂的采購(gòu)成本和龐大的市場(chǎng)空間,各方持續(xù)AMDAMDInstinctMI325X芯片、英特爾Gaudi2寬、性?xún)r(jià)比等方面形成差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。Cerebras、Groq、d-Matrix、Graphcore等為代表的芯片初創(chuàng)企業(yè),嘗試通過(guò)超大尺寸芯片、存內(nèi)計(jì)算、近存計(jì)算等非常規(guī)技術(shù)路線(xiàn)取得突破,已獲得OpenAIMetaTPU已更新至第五代(TPUv5p),支持多模態(tài)大模型Gemini訓(xùn)練;微軟推出MAIA5nm發(fā)布首款自研推理芯片MTIA7nm工藝ASIC芯片,與自身160TOPS/W(三)工具鏈不斷完善加速大模型研發(fā)應(yīng)用大模型工具鏈?zhǔn)侵敢幌盗屑苫能浖ぞ吆推脚_(tái),旨在支持大模型開(kāi)發(fā)構(gòu)建、訓(xùn)練優(yōu)化、應(yīng)用開(kāi)發(fā)、部署推理和運(yùn)維管理全流程。工具鏈的持續(xù)升級(jí)對(duì)于大模型開(kāi)發(fā)和應(yīng)用至關(guān)重要,是構(gòu)建模型服務(wù)體系(ModelasaService,MaaS)的平臺(tái)能力支撐,目標(biāo)是靈活便捷供給大模型服務(wù)。首先,工具鏈不斷升級(jí),能夠有效應(yīng)對(duì)大規(guī)模模型訓(xùn)練的復(fù)雜性挑戰(zhàn),提高訓(xùn)練效率和推理效能。其次,Agent框架、圖4大模型工具鏈架構(gòu)圖

來(lái)源:中國(guó)信息通信研究院模型訓(xùn)練工具:加速模型生產(chǎn)質(zhì)效變革訓(xùn)練工具能力全面升級(jí),有效支撐大規(guī)模訓(xùn)練任務(wù)。一方面,為了更加高效地完成大模型訓(xùn)練任務(wù),涌現(xiàn)出多種訓(xùn)練加速技術(shù)。Adafactor、FlashAttentionDeepSpeed支持的算子融合、梯度積累技術(shù)等技術(shù),能夠在資源有限的情況下,通過(guò)優(yōu)化計(jì)算策略,加速計(jì)算過(guò)程。此外,收斂性?xún)?yōu)化技術(shù)通過(guò)提高模型的收斂速度,提升模型訓(xùn)練效率,并提高模型的泛化能力。目前,主流的深度學(xué)習(xí)訓(xùn)練框架均支持收斂性?xún)?yōu)化技術(shù),如DeepSpeed、JAX等均支持AdamAdagrad在特定場(chǎng)景的適應(yīng)性,業(yè)界推出多種微調(diào)技術(shù)以提升訓(xùn)練效率。目全量微調(diào)精度高、泛化能力強(qiáng),但計(jì)算成本較高,一般適用于精度需求較高的復(fù)雜任務(wù)場(chǎng)景。參數(shù)高效微調(diào)能夠顯著節(jié)省訓(xùn)練時(shí)間和計(jì)算資源,適用于資源受限或者需要快速部署迭代的場(chǎng)景,已經(jīng)成為產(chǎn)(LoRA)、(Prefix模型推理工具:提升模型部署推理效能推理工具能力不斷升級(jí)優(yōu)化,為大模型落地提供高效支撐。一是模型壓縮工具持續(xù)整合更多壓縮技術(shù)。大模型通常需經(jīng)過(guò)模型壓縮以適應(yīng)更廣泛更多樣化的部署環(huán)境,如何兼顧壓縮比例與性能損耗是關(guān)鍵。以量化、剪枝為代表的壓縮技術(shù)持續(xù)演進(jìn),通過(guò)低比特量化、稀疏化、模型結(jié)構(gòu)搜索、參數(shù)自動(dòng)尋優(yōu)等方式實(shí)現(xiàn)模型訓(xùn)練ACT(AutoCompression可實(shí)現(xiàn)壓縮流程自動(dòng)化6,商湯的神經(jīng)網(wǎng)絡(luò)量化工具PPQ76PaddleSlim/example/auto_compressionatdevelop·PaddlePaddle/PaddleSlim()7openppl-public/ppq:PPLQuantizationTool(PPQ)isapowerfulofflineneuralnetworkquantizationtool.()推理場(chǎng)景的低時(shí)延、高吞吐要求,從顯存優(yōu)化、高性能算子、服務(wù)調(diào)度等多個(gè)維度進(jìn)行優(yōu)化設(shè)計(jì),已成為當(dāng)前大模型部署推理的主要工具,如伯克利大學(xué)LMSYSORG(LanguageModelSystemsGenerationInference)DeepSpeedDeepSpeed-MII等。我國(guó)科LLMGPU和華為NPU卡8DashInferCPU卡上的高效推理9,螞蟻GLake10+2.3倍。AI應(yīng)用大模型服務(wù)化供給加速了智能技術(shù)的普惠化落地,激發(fā)了基于大小模型的智能應(yīng)用開(kāi)發(fā)需求。與傳統(tǒng)應(yīng)用軟件開(kāi)發(fā)相比,智能應(yīng)用開(kāi)發(fā)在應(yīng)用模式方面轉(zhuǎn)變?yōu)橐阅P蜑楹诵?,在開(kāi)發(fā)方式方面演變成零代碼、低代碼等多種形式,以滿(mǎn)足不同技術(shù)能力的用戶(hù)群體需求。以上變化對(duì)模型應(yīng)用的開(kāi)發(fā)提出了新的要求,一方面,開(kāi)發(fā)所8/pcg-mlp/KsanaLLM/blob/main/README_cn.md9https:///headlines/article/49710/intelligent-machine-learning/glakeAgent、RAGAI應(yīng)用開(kāi)發(fā)框架,大小模型組合成為應(yīng)用落地的主要技術(shù)方式。同時(shí),搜索、格式轉(zhuǎn)化等工具插件將模型的能力進(jìn)行延伸,在應(yīng)用中扮演著越來(lái)越重要的作用。另一方面,快速變化的市場(chǎng)需求對(duì)應(yīng)用開(kāi)發(fā)效率的提高更為迫切。面對(duì)新需求與新變化,模型應(yīng)用開(kāi)發(fā)工具逐步走向市場(chǎng),并幫助用戶(hù)快速搭建豐富AI如,百度智能云千帆AppBuilder構(gòu)建AI60款各類(lèi)型的插件,可以極大地拓展AIBot用開(kāi)發(fā)平臺(tái)集成了很多開(kāi)源框架,并提供了豐富的API和工具,滿(mǎn)AI中包括、Keras、ColabAPI,(四)高質(zhì)量多模態(tài)數(shù)據(jù)集成為模型能力提升關(guān)鍵大模型發(fā)展已經(jīng)進(jìn)入多模態(tài)融合階段,作為人工智能學(xué)習(xí)、訓(xùn)練和驗(yàn)證的“燃料”基礎(chǔ),大規(guī)模、高質(zhì)量、多模態(tài)數(shù)據(jù)集對(duì)于多模態(tài)大模型能力提升愈加重要,以數(shù)據(jù)為中心的人工智能時(shí)代正在SalesforceResearchtoken的史上最大多模態(tài)開(kāi)源數(shù)據(jù)集集為基礎(chǔ)預(yù)訓(xùn)練的XGen-MM模型在視覺(jué)描述、視覺(jué)問(wèn)答、多圖像推理等基準(zhǔn)性能方面取得了顯著提升。為加速構(gòu)建人工智能高質(zhì)量數(shù)據(jù)集,面向大模型的新一代數(shù)據(jù)工程成為核心技術(shù)手段。大模型的數(shù)據(jù)工程涵蓋訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、質(zhì)量評(píng)估、數(shù)據(jù)合成、開(kāi)放共享等全生命周期,不僅需要保證數(shù)據(jù)的數(shù)量和多樣性,更要強(qiáng)調(diào)數(shù)據(jù)的質(zhì)量和有效性,并通過(guò)嚴(yán)格的數(shù)來(lái)源:中國(guó)信息通信研究院圖5不同階段的具體數(shù)據(jù)需求情況發(fā)展方向數(shù)據(jù)預(yù)處理技術(shù)正朝向多模態(tài)融合、智能化、實(shí)時(shí)性全面進(jìn)化的方向發(fā)展。一是多模態(tài)詞元化序列向量有效融合。隨著大模型向多模態(tài)方向發(fā)展,預(yù)處理技術(shù)逐漸整合文本、圖像、音頻、視頻等多種類(lèi)型的數(shù)據(jù),探索建立模型識(shí)別的多模態(tài)統(tǒng)一詞元序列空間方法,實(shí)現(xiàn)高效、一致、標(biāo)準(zhǔn)的預(yù)處理流程,以支撐模型對(duì)復(fù)雜多源的未來(lái)亟需利用AIApacheSpark大模型發(fā)展需要新一代高水平數(shù)據(jù)標(biāo)注。當(dāng)前,隨著深度學(xué)習(xí)和人工智能模型的復(fù)雜度提升,對(duì)高質(zhì)量、精細(xì)化標(biāo)注數(shù)據(jù)的需求愈發(fā)迫切,這不僅要求數(shù)據(jù)標(biāo)注技術(shù)能夠高效處理大規(guī)模數(shù)據(jù)集,還需要具備對(duì)多模態(tài)數(shù)據(jù)(如圖像、語(yǔ)音、視頻及文本)和跨領(lǐng)域數(shù)據(jù)綜合處理的能力,數(shù)據(jù)標(biāo)注逐漸向?qū)I(yè)化、智能化、多模態(tài)方向發(fā)展。一是自動(dòng)化與智能化標(biāo)注工具創(chuàng)新成為焦點(diǎn)。當(dāng)前,基于計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等技術(shù)的自動(dòng)標(biāo)注工具快速涌現(xiàn),這些工具利用算法初步完成標(biāo)注,再由人工進(jìn)行校驗(yàn)和修正,可大幅提高標(biāo)注效率,降低成本。比如國(guó)內(nèi)數(shù)據(jù)標(biāo)注企業(yè)海天瑞聲已建成一,AI多模態(tài)聯(lián)合標(biāo)注,正在成為數(shù)據(jù)標(biāo)注的新趨勢(shì)。例如,由HumanSignal開(kāi)發(fā)的LabelStudio語(yǔ)音等多模態(tài)數(shù)據(jù)標(biāo)注,廣泛應(yīng)用于NLP、CV顯著提高了AIAI-訓(xùn)練模型精度,還能指導(dǎo)標(biāo)注策略的動(dòng)態(tài)調(diào)整,確保標(biāo)注工作更加高效和具有針對(duì)性。四是跨學(xué)科融合深度和廣度進(jìn)一步拓展。隨著人工智能技術(shù)的不斷發(fā)展,越來(lái)越多的重點(diǎn)行業(yè)領(lǐng)域開(kāi)始應(yīng)用數(shù)據(jù)標(biāo)注技術(shù),不同行業(yè)領(lǐng)域的數(shù)據(jù)標(biāo)注需求呈現(xiàn)多樣化和專(zhuān)業(yè)化的特點(diǎn),需要跨領(lǐng)域的專(zhuān)業(yè)知識(shí)和技術(shù)支持。當(dāng)前,人工智能數(shù)據(jù)集質(zhì)量評(píng)估需求體現(xiàn)在完整性、準(zhǔn)確性、一致性、時(shí)效性和可解釋性等多個(gè)方面,評(píng)估技術(shù)發(fā)展趨勢(shì)主要聚焦以下幾個(gè)關(guān)鍵方向:一是質(zhì)量評(píng)估與反饋機(jī)制深度融合。數(shù)據(jù)質(zhì)量評(píng)估引入客觀(guān)的數(shù)據(jù)質(zhì)量評(píng)估指標(biāo)和模型反饋機(jī)制,使得數(shù)據(jù)使用者可以評(píng)價(jià)數(shù)據(jù)集的實(shí)際綜合表現(xiàn),并反饋給數(shù)據(jù)提供者以改進(jìn)20246LLM63%。二是多模態(tài)數(shù)據(jù)質(zhì)量評(píng)估框架快速發(fā)展。針對(duì)圖像、語(yǔ)音、文本等多種類(lèi)型數(shù)據(jù),設(shè)計(jì)發(fā)展了綜合評(píng)估模型,確??缒B(tài)數(shù)據(jù)的一致性和互補(bǔ)性。通過(guò)融合計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和語(yǔ)音識(shí)別技術(shù),實(shí)現(xiàn)多維度數(shù)據(jù)質(zhì)量的全面評(píng)估。三是偏差與公平性評(píng)估成為數(shù)據(jù)質(zhì)量評(píng)估重要組成部分。鑒于A(yíng)I保障AI利用實(shí)時(shí)分析和流處理技術(shù)連續(xù)評(píng)估數(shù)據(jù)質(zhì)量,即時(shí)反饋數(shù)據(jù)問(wèn)題,支持快速響應(yīng)。這不僅有助于維護(hù)數(shù)據(jù)的時(shí)效性和準(zhǔn)確性,也確保了AI當(dāng)前,大模型的訓(xùn)練數(shù)據(jù)嚴(yán)重依賴(lài)現(xiàn)有的互聯(lián)網(wǎng)公開(kāi)數(shù)據(jù)。有2026用。根據(jù)Gartner2024用于A(yíng)I2030年,合成數(shù)據(jù)將成為AI模型所使用數(shù)據(jù)的主要來(lái)源11。20246月,英偉達(dá)正式發(fā)布全新開(kāi)源模型Nemotron-4340BBaseInstruct和獎(jiǎng)RewardInstruct的訓(xùn)練僅依賴(lài)298%以上訓(xùn)練數(shù)據(jù)都是通過(guò)Nemotron-4340BSDGPipeline專(zhuān)用數(shù)據(jù)管道合成。11artn,MvrikrhFotbotrlta-SnthtictalstheFuureofl,"inro,JitendraSubramanyam,24June2021當(dāng)前,合成數(shù)據(jù)技術(shù)創(chuàng)新主要呈現(xiàn)以下幾大趨勢(shì):一是合成數(shù)據(jù)模型走向深度進(jìn)化。傳統(tǒng)的數(shù)據(jù)合成方法多依賴(lài)統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的基本原理,當(dāng)前數(shù)據(jù)合成技術(shù)聚焦于深度學(xué)習(xí)算法模型,特別是生成對(duì)抗網(wǎng)絡(luò)(GANs)的廣泛應(yīng)用。GANs通過(guò)一對(duì)競(jìng)爭(zhēng)性神經(jīng)網(wǎng)絡(luò)—生成器和判別器的博弈過(guò)程,實(shí)現(xiàn)了前所未有的數(shù)據(jù)真實(shí)度與多樣性,諸如StyleGANBigGAN多模態(tài)合成技術(shù)通過(guò)整合不同模態(tài)的特征表示,能夠同時(shí)生成聲音、視頻、3D機(jī)構(gòu)、醫(yī)療保健等行業(yè)利用AI三、應(yīng)用賦能隨著大模型時(shí)代到來(lái),人工智能技術(shù)能力快速迭代,持續(xù)推動(dòng)各行各業(yè)的發(fā)展路徑變革,全面帶動(dòng)大規(guī)模產(chǎn)業(yè)升級(jí)。在傳統(tǒng)專(zhuān)用智能應(yīng)用基礎(chǔ)上,大模型通過(guò)進(jìn)一步提供智能對(duì)話(huà)、文本創(chuàng)作、圖像生成和視頻生成等通用能力,提升賦能經(jīng)濟(jì)發(fā)展、民生服務(wù)、科學(xué)發(fā)現(xiàn)等各領(lǐng)域的深度和廣度,將對(duì)全球經(jīng)濟(jì)社會(huì)發(fā)展和人類(lèi)文明進(jìn)步產(chǎn)生深遠(yuǎn)影響。(一)人工智能賦能階段性特征顯現(xiàn)專(zhuān)用智能應(yīng)用逐步成熟,通用智能落地前景廣闊。一方面,專(zhuān)用小模型與行業(yè)場(chǎng)景融合深入。通常來(lái)看,小模型包括傳統(tǒng)結(jié)構(gòu)小模型及小參數(shù)預(yù)訓(xùn)練模型兩類(lèi)。其中,傳統(tǒng)結(jié)構(gòu)小模型網(wǎng)絡(luò)結(jié)構(gòu)以卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等為核心,在圖像識(shí)別、語(yǔ)音識(shí)別等任務(wù)中接近到人類(lèi)水平,由于其規(guī)模較小,訓(xùn)練及推理成本低,目前已在實(shí)際生產(chǎn)中廣泛部署應(yīng)用。隨著人工智能技術(shù)需求增長(zhǎng),長(zhǎng)大模型的價(jià)值并非“替代”傳統(tǒng)小模型,未來(lái)人工智能應(yīng)用將呈現(xiàn)“大小模型協(xié)同”發(fā)展態(tài)勢(shì)。面向企業(yè)側(cè)和消費(fèi)側(cè)的應(yīng)用展現(xiàn)出不同的發(fā)展態(tài)勢(shì)。面向企業(yè)側(cè),大模型應(yīng)用更注重專(zhuān)業(yè)定制和效益反饋。我國(guó)提倡在社會(huì)生產(chǎn)領(lǐng)域和大眾消費(fèi)領(lǐng)域共同推進(jìn)人工智能發(fā)展,這與我國(guó)產(chǎn)業(yè)結(jié)構(gòu)特/202472416.83%8AI52%的公司專(zhuān)注于圖像、視頻、音樂(lè)、語(yǔ)音等多種模式內(nèi)容的生1258%,即產(chǎn)業(yè)鏈兩端的研發(fā)設(shè)計(jì)和運(yùn)營(yíng)服務(wù)等知識(shí)密集型、服務(wù)密集型環(huán)節(jié)落地相對(duì)較快,生產(chǎn)制造等中間環(huán)節(jié)相對(duì)較慢。從兩端環(huán)節(jié)看,一方面,科學(xué)研究、研發(fā)設(shè)計(jì)等知識(shí)密集型場(chǎng)景理論基礎(chǔ)堅(jiān)實(shí),且(forResearchandDevelopment)的作用得以充分發(fā)揮。例如,某藥物分子大模型可以減少新藥研發(fā)中對(duì)小分子化合物的人工篩選計(jì)算量,使先導(dǎo)藥70%。另一方面,營(yíng)銷(xiāo)、運(yùn)營(yíng)等服務(wù)密集型場(chǎng)景跨行業(yè)通用性較強(qiáng),成為大部分行業(yè)企業(yè)首選的大模型“試點(diǎn)”場(chǎng)景。以某醫(yī)療大模型為例,在診前階7×24TCL90%60%。來(lái)源:中國(guó)信息通信研究院圖6基于百個(gè)優(yōu)秀案例統(tǒng)計(jì)的AI應(yīng)用產(chǎn)業(yè)鏈分布總體而言,當(dāng)前大模型技術(shù)條件下,落地應(yīng)用并非適用所有場(chǎng)景。目前大模型適用的場(chǎng)景側(cè)重于對(duì)話(huà)交互、創(chuàng)意生成、知識(shí)管理類(lèi),而對(duì)于可解釋要求高、確定性要求高、實(shí)時(shí)性要求高、場(chǎng)景動(dòng)態(tài)性高、樣本數(shù)據(jù)不易獲取的場(chǎng)景,大模型如何有效應(yīng)用還需要進(jìn)弱解”(二)重點(diǎn)行業(yè)人工智能應(yīng)用走深向?qū)嵮b備行業(yè)重點(diǎn)關(guān)注研發(fā)與制造流程優(yōu)化、產(chǎn)品智能化升級(jí)等方向,逐步滲透并重塑生產(chǎn)模式。一是優(yōu)化智能制造流程。人工智能技術(shù)通過(guò)與工業(yè)軟件、工業(yè)控制系統(tǒng)等關(guān)鍵工業(yè)要素的深度融合,AnyLogic66%。二是提升智能產(chǎn)品與服務(wù)價(jià)值。汽車(chē)、軌道交通、工程機(jī)械等裝備逐步向智能化產(chǎn)品演進(jìn),基于視覺(jué)的環(huán)境識(shí)別成為目前主要探索方向。航空和交通領(lǐng)域成為開(kāi)展增值服務(wù)的重點(diǎn)行業(yè),如國(guó)外某航天公司飛行器座艙內(nèi)的AI驅(qū)動(dòng)系統(tǒng)可以通過(guò)評(píng)估和通知燃油水平、系統(tǒng)狀態(tài)、天氣狀況和其他基本參數(shù)來(lái)幫助優(yōu)化實(shí)時(shí)飛行路徑。三是產(chǎn)品設(shè)計(jì)與仿真優(yōu)化。人工智能輔助設(shè)計(jì)軟件能夠根據(jù)市場(chǎng)需求快速AI找到最佳的設(shè)計(jì)路徑,消除原結(jié)構(gòu)太重和產(chǎn)品質(zhì)41個(gè),重量減輕18.8%消費(fèi)品行業(yè)聚焦產(chǎn)品創(chuàng)新與智能化營(yíng)銷(xiāo)管理,正逐步改變消費(fèi)ProductGPT營(yíng)銷(xiāo)大模型,結(jié)合商品特性與熱門(mén)趨勢(shì),可在幾分鐘內(nèi)生成富有創(chuàng)意80%。另一方面,基于自然語(yǔ)言處理技術(shù)24小時(shí)不間斷地為用戶(hù)提供咨詢(xún)解答、訂單跟蹤等服務(wù),提升服務(wù)效率與用戶(hù)體驗(yàn)。三是供應(yīng)鏈管理智能化。人工智能的應(yīng)用使消費(fèi)品供應(yīng)鏈變得更加智能與透明,從原材料采購(gòu)到生產(chǎn)、物流、銷(xiāo)售等各AI的生產(chǎn)計(jì)劃。例如,京東物流利用大模型的數(shù)智化供應(yīng)鏈技術(shù)聚焦從智能規(guī)劃到智能倉(cāng)儲(chǔ)與運(yùn)配,再到智能客服與營(yíng)銷(xiāo)的全鏈路降85%95%,庫(kù)存30天。原材料行業(yè)聚焦生產(chǎn)過(guò)程管控優(yōu)化,利用人工智能技術(shù)逐步改的精度和效率。例如,加拿大的GoldSpotDiscoveries(三)體系化推動(dòng)人工智能落地應(yīng)用成為共識(shí)當(dāng)前,人工智能應(yīng)用持續(xù)走深向?qū)?,行業(yè)大模型已在金融、醫(yī)療、教育、零售、能源等多個(gè)行業(yè)領(lǐng)域?qū)崿F(xiàn)了初步應(yīng)用,并產(chǎn)生了明顯的經(jīng)濟(jì)效益和社會(huì)效益。通過(guò)總結(jié)多方案例,大模型在落地應(yīng)開(kāi)展戰(zhàn)略需求分析是企業(yè)布局大模型的前提大模型作為引領(lǐng)時(shí)代發(fā)展的戰(zhàn)略性技術(shù),已成為各行各業(yè)競(jìng)相發(fā)展的焦點(diǎn)。企業(yè)希望通過(guò)布局大模型對(duì)傳統(tǒng)的業(yè)務(wù)流程、組織架構(gòu)和經(jīng)營(yíng)模式進(jìn)行全面升級(jí)和改造,以提升運(yùn)營(yíng)效率、降低成本、增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力,并更好地滿(mǎn)足客戶(hù)需求。在布局大模型之前,企業(yè)通常全方位開(kāi)展戰(zhàn)略需求分析,統(tǒng)籌規(guī)劃大模型所需各類(lèi)資源,進(jìn)而為大模型落地應(yīng)用提供有利支撐。比如,思必馳科技股份有限公司在深入分析軌交領(lǐng)域的智慧乘客服務(wù)、智慧運(yùn)營(yíng)運(yùn)維需求后,將自研DFM-2明確選型方案是企業(yè)研發(fā)大模型的關(guān)鍵一步大模型的能力構(gòu)建是一項(xiàng)復(fù)雜的系統(tǒng)性工程,往往牽一發(fā)而動(dòng)全身,根據(jù)自身切實(shí)需求明確大模型技術(shù)選型可以為企業(yè)后續(xù)模型研發(fā)和應(yīng)用夯實(shí)基礎(chǔ)。通過(guò)分析百度“文心一言”、阿里“通義千問(wèn)”等通用大模型和度小滿(mǎn)“軒轅”、中石油“昆侖”等行業(yè)大模基于所選模型生態(tài)通過(guò)搭配標(biāo)準(zhǔn)化的接口和豐富的工具包可以進(jìn)一步提高模型開(kāi)發(fā)的質(zhì)量。合理的模型部署策略是模型穩(wěn)定可靠運(yùn)行AI理、決策的要求較高,推理算力充足,可以選擇較大的模型,如Qwen-72BLlama-3如Qwen-7B、Llama-38B。建設(shè)企業(yè)人工智能能力平臺(tái)是工程落地的核心人工智能能力平臺(tái)正在成為企業(yè)全面智能化轉(zhuǎn)型的基礎(chǔ)底座。AI并提升智能應(yīng)用的構(gòu)建、部署和維護(hù)效率,從而推動(dòng)企業(yè)全面智能AI資產(chǎn)等。對(duì)于初創(chuàng)企業(yè),AI設(shè)施。通過(guò)敏捷開(kāi)發(fā)模式,企業(yè)能夠在短期內(nèi)推出最小可行產(chǎn)品Docker和Kubernetes保AI這種方式快速構(gòu)建可復(fù)用和擴(kuò)展的AIAIAIAI構(gòu)建智能體應(yīng)用進(jìn)一步釋放大模型應(yīng)用潛能智能體作為將大模型轉(zhuǎn)變?yōu)樯a(chǎn)力的主要應(yīng)用形態(tài),通過(guò)智能體工具調(diào)用、智能體工作流、智能體人機(jī)交互等方式,能夠快速理解和響應(yīng)產(chǎn)業(yè)需求,拓寬大模型應(yīng)用場(chǎng)景,為企業(yè)的數(shù)字化轉(zhuǎn)型和智能化升級(jí)提供強(qiáng)大助力。智能體工具調(diào)用有效解決大模型“有腦無(wú)手”的問(wèn)題。大模型在感知、認(rèn)知、推理等方面表現(xiàn)出色,但仍缺乏將決策轉(zhuǎn)化為實(shí)際行動(dòng)的能力。智能體可以實(shí)現(xiàn)意圖理解、任務(wù)分解、任務(wù)規(guī)劃,可通過(guò)調(diào)用小模型、實(shí)用工具或檢索數(shù)據(jù)庫(kù)等完成具體任務(wù)。智能體工作流進(jìn)一步推動(dòng)模型高質(zhì)量輸出。智能體工作流在任務(wù)執(zhí)行過(guò)程中可以將任務(wù)拆分為不同步驟,通過(guò)合理規(guī)劃和多次迭代,實(shí)現(xiàn)更高質(zhì)量的模型輸出,確保任務(wù)順利完成。比如,在評(píng)測(cè)大模型代碼生成能力的HumanEval數(shù)據(jù)集上,GPT-3.5(67.0%,上搭配智能體工作流,。智能體人機(jī)交互實(shí)現(xiàn)人類(lèi)和智能體的優(yōu)勢(shì)互補(bǔ)。人類(lèi)在模糊概念理解、創(chuàng)造性思維、情感判斷等方面具有特定優(yōu)勢(shì),智能體在數(shù)據(jù)處理、任務(wù)規(guī)劃、推理決策等方面更具優(yōu)勢(shì)。通過(guò)交互式學(xué)習(xí),智能體可以逐步積累更多的人類(lèi)經(jīng)驗(yàn),實(shí)現(xiàn)AI生產(chǎn)過(guò)程規(guī)范化機(jī)器學(xué)習(xí)研發(fā)運(yùn)營(yíng)體系(MLOps)作為一種系統(tǒng)性方法論,在MLOps工具和平臺(tái),如Extended(TFX)MLflowKubeflowMLOps和持續(xù)運(yùn)營(yíng),提高業(yè)務(wù)響應(yīng)速度,從而系統(tǒng)性解決模型煙囪式生產(chǎn)周期長(zhǎng)、生產(chǎn)過(guò)程和資產(chǎn)管理欠缺、跨團(tuán)隊(duì)協(xié)作難等問(wèn)題。而大模型時(shí)代的景,通過(guò)MLOps體系管理和運(yùn)營(yíng)AI模型,可從每筆交易中動(dòng)態(tài)學(xué)習(xí),從而提高檢測(cè)可疑活動(dòng)的能力,顯著增強(qiáng)欺詐檢測(cè)能力。某企MLOps注重風(fēng)險(xiǎn)管理為大模型落地保駕護(hù)航人工智能技術(shù)的應(yīng)用場(chǎng)景持續(xù)拓寬的同時(shí),新型人工智能技術(shù)應(yīng)用風(fēng)險(xiǎn)持續(xù)涌現(xiàn),全球?qū)⑷斯ぶ悄馨踩卫砹袨椤皟?yōu)先議題”。對(duì)于產(chǎn)業(yè)界而言,亟需從風(fēng)險(xiǎn)管理和流程管控的角度出發(fā),構(gòu)建一套精準(zhǔn)識(shí)別、全面防范、有效管控人工智能風(fēng)險(xiǎn)的治理落地方案。--ISO/IEC42001心資產(chǎn)進(jìn)行全流程加密,對(duì)模型生成內(nèi)容進(jìn)行評(píng)估測(cè)試以及對(duì)惡意內(nèi)容進(jìn)行過(guò)濾等方式應(yīng)對(duì)人工智能安全風(fēng)險(xiǎn)。在流程管控方面,打圖7人工智能風(fēng)險(xiǎn)管理體系

來(lái)源:中國(guó)信息通信研究院四、安全治理人工智能在服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展的同時(shí),也誘發(fā)出數(shù)據(jù)安全、隱私保護(hù)、虛假信息傳播、勞動(dòng)力取代、科技倫理挑戰(zhàn)等諸多風(fēng)險(xiǎn)。為尋求應(yīng)對(duì)策略,全球紛紛調(diào)整人工智能安全治理布局??v覽全球舉措,國(guó)際合作愈發(fā)緊密,各國(guó)治理進(jìn)程不斷提速,產(chǎn)業(yè)組織發(fā)揮重要作用,安全技術(shù)體系逐步完善,全球人工智能安全治理正處于。(一)人工智能技術(shù)應(yīng)用帶來(lái)多重挑戰(zhàn)得益于算法不斷突破、預(yù)訓(xùn)練大模型迅猛發(fā)展、多模態(tài)技術(shù)融圖8人工智能風(fēng)險(xiǎn)示例

來(lái)源:中國(guó)信息通信研究院人工智能的自身安全主要是人工智能技術(shù)系統(tǒng)的安全問(wèn)題,涉及技術(shù)系統(tǒng)部署所依賴(lài)的傳統(tǒng)基礎(chǔ)設(shè)施,以及模型、框架等人工智能系統(tǒng)特有的部分。因此,人工智能技術(shù)系統(tǒng)一方面面臨傳統(tǒng)的信DDoS“”Ray的安全漏洞,數(shù)千家網(wǎng)絡(luò)服務(wù)器遭受攻擊,超過(guò)10人工智能的衍生安全問(wèn)題主要是由于技術(shù)系統(tǒng)風(fēng)險(xiǎn)管控不當(dāng),以及技術(shù)系統(tǒng)被濫用、誤用或遭到外部攻擊,對(duì)個(gè)人組織、國(guó)家社202312https://www.oligo.security/blog/shadowray-attack-ai-workloads-actively-exploited-in-the-wild131.115014人工智能模型性能突破需大量、高效的算力支持,但模型訓(xùn)練導(dǎo)致大量GPT訓(xùn)練為例,1750億個(gè)參數(shù)的12875521516。(二)的關(guān)鍵階段國(guó)際組織推動(dòng)形成共識(shí)文件。聯(lián)合國(guó)成立“人工智能高級(jí)別咨詢(xún)機(jī)構(gòu)”,負(fù)責(zé)分析人工智能?chē)?guó)際治理并提出政策建議。2024年,聯(lián)合國(guó)大會(huì)先后通過(guò)《抓住安全、可靠和值得信賴(lài)的人工智能系統(tǒng)13https:///newsDetail_forward_2324538914https:///newsDetail_forward_2530630815https:///newsDetail_forward_2703290116https:///newsDetail_forward_23722410帶來(lái)的機(jī)遇,促進(jìn)可持續(xù)發(fā)展》,以及中國(guó)主提的《加強(qiáng)人工智能能力建設(shè)國(guó)際合作》決議,為全球提供制度藍(lán)圖。同時(shí),不斷推動(dòng)20249(OECD)20245月更新人工智能治理原則,推動(dòng)人工智能重要定義達(dá)成共識(shí)。金磚國(guó)2023820232820245272024重要抓手歐盟采取統(tǒng)一立法治理架構(gòu),布局風(fēng)險(xiǎn)管理等標(biāo)準(zhǔn)配套舉措。20245202351020249美國(guó)沿襲行業(yè)自律治理方案,開(kāi)展安全測(cè)試夯實(shí)技術(shù)監(jiān)管。架202310號(hào)行政令,發(fā)布全面的人工智能治理方法,明確了各監(jiān)管機(jī)構(gòu)的行2024月,促使16家領(lǐng)先公司自愿承諾推動(dòng)安全、可靠和可信的人工智能發(fā)展的工作。行動(dòng)上,政府積極推動(dòng)安全測(cè)試號(hào)行政令明確提出由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)NIST制定指導(dǎo)方針和最佳實(shí)踐,以促進(jìn)開(kāi)發(fā)和部署安全、可靠和值得信賴(lài)的人工智能系統(tǒng)的行業(yè)共識(shí)標(biāo)準(zhǔn),包括創(chuàng)建評(píng)估和審計(jì)人工智能20248月,10472023320245Inspect新加坡實(shí)施溫和干預(yù)方案,打造可驗(yàn)證的安全測(cè)試機(jī)制。體系。2019120245。22年5I20245AI。整體上,從框架規(guī)范到精準(zhǔn)治理的體系建設(shè)。我國(guó)遵循《新一代人工智能治理原則——發(fā)展負(fù)責(zé)任的人工智能》《新一代人工智能倫試行》等文件,加強(qiáng)科技倫理審查和監(jiān)管。與此同時(shí),延續(xù)人工智能治理《生成式人工智能服務(wù)管理暫行辦法》,發(fā)布《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法(征求意見(jiàn)稿)》,聚焦互聯(lián)網(wǎng)信息服務(wù)等重點(diǎn)領(lǐng)域的監(jiān)管。措施上,通過(guò)安全評(píng)估、備案等舉措,保障信息服務(wù)領(lǐng)域2024481919個(gè)深度合成算法、190產(chǎn)業(yè)組織發(fā)揮技術(shù)研究和治理協(xié)同優(yōu)勢(shì)產(chǎn)業(yè)組織積極發(fā)揮技術(shù)研究和治理協(xié)同優(yōu)勢(shì),通過(guò)發(fā)布治理框架,制定標(biāo)準(zhǔn)規(guī)范等多種形式促進(jìn)人工智能治理。18AINow研究所等機(jī)構(gòu)聯(lián)合發(fā)布“零信任人工智202312月,中國(guó)信息通信研究院依托中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)籌建安全治理委員會(huì),發(fā)布“人工智能

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論