




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
智能計算中心創(chuàng)新發(fā)展指南目錄前言 01基礎(chǔ)篇 02一、智算中心概述 03(一)定義 03(二)主要作用 03推進AI產(chǎn)業(yè)化 03賦能產(chǎn)業(yè)AI化 03助力治理智能化 04促進產(chǎn)業(yè)集群化 04(三)效益分析 04二、智算中心發(fā)展新趨勢 06(一)智能算力的發(fā)展需求快速擴大 06(二)通用智能的算法模型快速演進 06(三)普適普惠的服務生態(tài)逐步構(gòu)建 07(四)綠色低碳的發(fā)展格局加速形成 07三、建設智算中心的必要性分析 09(一)我國智算中心政策形勢 09.人工智能發(fā)展環(huán)境良好,算力發(fā)展基礎(chǔ)逐漸夯實 09.東數(shù)西算”工程全面實施,智算中心建設提速 10(二)建設智算中心的現(xiàn)實意義 10智算中心已成為提升國際競爭力的關(guān)鍵基礎(chǔ)設施 10智算中心已成為數(shù)字經(jīng)濟高質(zhì)量發(fā)展的重要支撐 10智算中心已成為構(gòu)建智慧城市的必然選擇 11技術(shù)篇 13一、體系架構(gòu) 14(一)總體架構(gòu) 14(二)技術(shù)演進 14AI芯片 15AI服務器 15AI集群 15AI大模型 15智算OS 16軟件生態(tài) 16(三)建設架構(gòu) 17二、技術(shù)路線 18(一)以算力基建化為主體 18面向潛在算力需求,適度超前規(guī)模化部署算力資源 18聚焦異構(gòu)加速技術(shù),提升高性能人工智能計算能力 18兼顧軟硬一體協(xié)同,構(gòu)建智算中心多元融合型架 18(二)以算法基建化為引領(lǐng) 18面向千行百業(yè)發(fā)展需求,提供多類型預置行業(yè)算法 18面向模型即服務應用需求,構(gòu)建大規(guī)模預訓練AI模型 19面向可持續(xù)化發(fā)展需求,推進AI模型不斷演進升級 19面向算法高效調(diào)用需求,提供專業(yè)化開發(fā)部署支撐 19(三)以服務智件化為依托 19提供多元算力調(diào)度服務,實現(xiàn)算力調(diào)度“智件化” 19提供簡便算法模型服務,實現(xiàn)算法供給“智件化” 20提供開放生態(tài)環(huán)境服務,實現(xiàn)供需對接“智件化” 20(四)以設施綠色化為支撐 采用先進節(jié)能技術(shù),全面降低智算中心能耗 采用綠色清潔能源,從源頭上實現(xiàn)綠色低碳 應用篇 21一、智算中心激發(fā)AI產(chǎn)業(yè)化創(chuàng)新活力 22(一)自動駕駛 22(二)機器人 22(三)元宇宙 22虛擬數(shù)字人 23數(shù)字孿生 23二、智算中心助力產(chǎn)業(yè)AI化走深向?qū)?24(一)智慧醫(yī)療 24(二)文娛創(chuàng)作 24(三)智慧科研 25生命科學 25大規(guī)模分子模擬 25數(shù)值計算 25建設篇 26一、建設類型與策略 27(一)建設原則 27(二)依據(jù)建設方式分類建設 27新建智算中心 已建數(shù)據(jù)中心升級 27(三)依據(jù)功能定位分類建設 產(chǎn)業(yè)合作平臺 產(chǎn)業(yè)園區(qū) 28二、建設運營模式 (一)主流建設模式 獨立投資建設模式 29由第三方出資的建設模式 29基于特殊項目公司的建設運營(SPV)模式 29(二)主流運營服務模式 29運營方選擇 29運營服務類型 30運營服務內(nèi)容 30基礎(chǔ)篇作為新型基礎(chǔ)設施和新的能力支撐,智算中心在數(shù)字時代承擔著重要使命?;A(chǔ)篇從智算中心定義、主要作用、發(fā)展趨勢等方面,著重闡述了數(shù)字經(jīng)濟時代建設智算中心的必要性和重要意義。智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南PAGE04PAGE04一、智算中心概述(一)定義智算中心是基于最新人工智能理論,采用領(lǐng)先的人工智能計算架構(gòu),提供人工智能應用所需算力服務、數(shù)據(jù)服務和算法服務的公共算力新型基礎(chǔ)設施,通過算力的生產(chǎn)、聚合、調(diào)度和釋放,高效支撐數(shù)據(jù)開放共享、智能生態(tài)建設、產(chǎn)業(yè)創(chuàng)新聚集,有力促進AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化及政府治理智能化。智算中心以多種異構(gòu)方式共同發(fā)展的AI服務器算力機組為算力底座,不斷提升智能計算能力和速度,滿足人工智能應用場景下大規(guī)模、多線并行的計算需求。智算中心圍繞“算力生產(chǎn)、算力聚合、算力調(diào)度、算力釋放”四個核心業(yè)務功能,為各行業(yè)各領(lǐng)域人工智能應用提供穩(wěn)定的技術(shù)支撐,打造可持續(xù)發(fā)展的算力生態(tài)。(二)主要作用智算中心作為信息基礎(chǔ)設施的重要組成部分,為快速增長的人工智能算力需求提供必不可少的基礎(chǔ)支撐,在推進AI產(chǎn)業(yè)化、賦能產(chǎn)業(yè)AI化、助力治理智能化、促進產(chǎn)業(yè)集群化等方面發(fā)揮了顯著作用,是數(shù)字經(jīng)濟時代促進產(chǎn)業(yè)轉(zhuǎn)型升級、優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、提升城市競爭力的關(guān)鍵。推進AI產(chǎn)業(yè)化人工智能產(chǎn)業(yè)在算力支撐下快速發(fā)展。國際數(shù)據(jù)公司(IDC)的數(shù)據(jù)顯示,到2026場規(guī)模將達到123.4億美元。智算中心的人工智能加速計算能力能夠有效支持AI訓練、AI推理、數(shù)據(jù)壓縮、圖像編碼、視頻編碼,為人工智能大模型開發(fā)、訓練等提供密集型、大規(guī)模計算服務,較云計算中心、超算中心更能滿足日益豐富的人工智能算力需求。智算中心的人工智能專用算力服務、數(shù)據(jù)服務和算法服務為開展人工智能理論創(chuàng)新與關(guān)鍵共性技術(shù)研發(fā)提供支撐,為企業(yè)、高校等各類研發(fā)機構(gòu)創(chuàng)造了低成本、高可靠、便捷簡易的人工智能應用開發(fā)與場景試驗條件,最終促進人工智能技術(shù)的成果轉(zhuǎn)化,已成為推進AI產(chǎn)業(yè)化的重要引擎。
賦能產(chǎn)業(yè)AI化智算中心能夠以強大的硬件支撐和軟件服務促進農(nóng)業(yè)生產(chǎn)效率提升,是推動我國農(nóng)業(yè)高質(zhì)量發(fā)展的重要力量。農(nóng)業(yè)農(nóng)村部印發(fā)的《“十四五”全國農(nóng)業(yè)農(nóng)村信息化發(fā)展規(guī)劃》提出,到2025年,農(nóng)業(yè)生產(chǎn)信息化率達到27%。針對農(nóng)業(yè)生產(chǎn)過程中的土壤條件、氣象、降水、農(nóng)作物生長等信息采集與處理需求,智算中心可以提供數(shù)字農(nóng)業(yè)專有算法,分析各類傳感器、氣象衛(wèi)星、結(jié)構(gòu)化視頻監(jiān)控等數(shù)據(jù),為農(nóng)業(yè)生產(chǎn)提供強力輔助。智算中心的算力支撐和算法服務可以賦能工業(yè)轉(zhuǎn)型發(fā)展。近年來,工業(yè)對人工智能的需求持續(xù)增加,通過將人工智能技術(shù)融入工業(yè)生產(chǎn),改造工業(yè)的生產(chǎn)方式和決策模式,降低工業(yè)生產(chǎn)成本,實現(xiàn)提質(zhì)增效。智算中心可以為智能制造、傳感與檢測、設備維護預測、工業(yè)機器人、智能化生產(chǎn)等多個應用場景提供算力和算法服務,并促進人工智能企業(yè)與傳統(tǒng)工業(yè)企業(yè)的深度對接合作。智算中心可以推動生活服務業(yè)向質(zhì)優(yōu)面廣發(fā)展。國務院印發(fā)的《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》提出,到2025年,生活性服務業(yè)多元化拓展顯著加快,電子商務交易規(guī)模要達到46萬億元。在消費互聯(lián)網(wǎng)快速發(fā)展的趨勢下,智算中心能夠為新零售、電子商務、智能家居、智能駕駛等應用場景提供技術(shù)支撐,帶動生活性服務業(yè)的智慧化升級。智算中心的研發(fā)與孵化功能可以為新業(yè)態(tài)提供土壤。智算中心廣泛賦能科學研究、產(chǎn)業(yè)發(fā)展、城市運行等多元場景,可以為日益豐富、個性化的數(shù)字產(chǎn)品或服務的研發(fā)提供必要的基礎(chǔ)設施支撐,帶動智能網(wǎng)聯(lián)汽車、數(shù)字交易、元宇宙等新業(yè)態(tài)的蓬勃發(fā)展。同時,智算中心以其模塊化的軟件助力治理智能化智算中心能夠為日益豐富的城市公共服務和城市治理智慧化應用提供智算能力支撐。通過應用智算中心的計算平臺、框架和底層算法,在政務服務、健康醫(yī)療、教育科研等公共服務領(lǐng)域和交通治理、災害預警、生態(tài)環(huán)境監(jiān)測、應急處置等城市治理領(lǐng)域推進業(yè)務與計算機視覺、自然語言處理、機器學習等人工智能技術(shù)的融合,實現(xiàn)公共服務便捷化、城市治理精準化,提升公眾的獲得感和幸福感。促進產(chǎn)業(yè)集群化智能技術(shù)研發(fā)、應用轉(zhuǎn)化、人才培養(yǎng)、企業(yè)孵化等功能。通過加強與高校、科研院所、各行業(yè)各領(lǐng)域優(yōu)勢企業(yè)協(xié)作,提
供創(chuàng)新孵化服務、技術(shù)轉(zhuǎn)移服務、人員培訓服務,培育數(shù)據(jù)處理、數(shù)據(jù)分析、運營服務等領(lǐng)域的人才與企業(yè),能夠進一步聚合當?shù)厝斯ぶ悄艿难邪l(fā)優(yōu)勢、人才優(yōu)勢、產(chǎn)品優(yōu)勢與產(chǎn)基于智算中心的專業(yè)人才資源、創(chuàng)新資源,以建設配套產(chǎn)業(yè)園區(qū)等形式為產(chǎn)業(yè)鏈上下游參與方協(xié)同合作提供優(yōu)質(zhì)環(huán)境,可有效加強與IT和土建基礎(chǔ)設施供應商等上游參與者,以及智算服務供應商、云服務供應商、互聯(lián)網(wǎng)數(shù)據(jù)中心(Inter-netDataCenter,簡稱IDC)服務商等中游相關(guān)產(chǎn)業(yè)的協(xié)同,并服務于互聯(lián)網(wǎng)、金融、電信、交通等行業(yè)用戶的人工智能應用需求,實現(xiàn)對自動駕駛、機器人、元宇宙、智慧醫(yī)療、文娛創(chuàng)作、智慧科研等下游相關(guān)產(chǎn)業(yè)的帶動。AI服務器供應商存儲設備供應商網(wǎng)絡設備供應商數(shù)據(jù)中心管理系統(tǒng)供應商...AI服務器供應商存儲設備供應商網(wǎng)絡設備供應商數(shù)據(jù)中心管理系統(tǒng)供應商IDC服務商云服務供應商智算服務供應商行業(yè)產(chǎn)業(yè)自動駕駛互聯(lián)網(wǎng)機器人金融元宇宙電信智慧醫(yī)療交通文娛創(chuàng)作智慧科研......IT......土建基礎(chǔ)設施電信運營商制冷系統(tǒng)供應商供配電系統(tǒng)供應商土建及施工承包商圖1智算中心產(chǎn)業(yè)鏈(三)效益分析人工智能作為數(shù)字經(jīng)濟時代的核心生產(chǎn)力,在各地積極布局數(shù)字經(jīng)濟的趨勢下迎來了飛速發(fā)展?!秶鴦赵宏P(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》(國發(fā)〔2017〕35號)提出要“推進人工智能理論、技術(shù)與應用;到2025年,人工智能核心產(chǎn)業(yè)規(guī)模超過4,000億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過5萬億元;到2030年,人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元,帶動相關(guān)產(chǎn)業(yè)規(guī)模超過10萬億元”。預計2020年至2030年我國人工
萬億元109876543210
2020 2025E 2030E智能核心產(chǎn)業(yè)規(guī)模的年均復合增長率達20.9%、帶動相關(guān)產(chǎn)業(yè)規(guī)模的年均復合增長率達25.9%。
人工智能核心產(chǎn)業(yè)規(guī)模帶動相關(guān)產(chǎn)業(yè)規(guī)模圖2人工智能核心產(chǎn)業(yè)規(guī)模與帶動相關(guān)產(chǎn)業(yè)規(guī)模智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南圖3智算中心項目經(jīng)濟社會效益
人工智能是創(chuàng)新的加速器,承載人工智能計算的智算中心可以為各類技術(shù)創(chuàng)新提供支撐。一方面,智算中心可以為構(gòu)建安全可信、可復用的技術(shù)研發(fā)環(huán)境提供算力設施支撐,為各領(lǐng)域科技研發(fā)提供智能計算服務,加速科技研發(fā)的進程。另一方面,智算中心是新一代信息技術(shù)的集成應用載體,智算中心的快速建設推廣與規(guī)?;瘧脤⑼苿油ㄐ欧站W(wǎng)絡、大數(shù)據(jù)、人工智能等技術(shù)的快速迭代,從而促進技術(shù)創(chuàng)新。80%應用水平的情況下,城市/設投入的增長量對創(chuàng)新產(chǎn)出的貢獻率約為14%-17%2。孵化企業(yè)AI36-42倍AI2.9-3.4倍孵化企業(yè)AI36-42倍AI2.9-3.4倍降低創(chuàng)新成本居民收 域 板 80%/投資可帶動人工智能核心產(chǎn)業(yè)增長約2.9-3.4倍、帶動相關(guān)產(chǎn)業(yè)增長約36-42倍1。算智算中心的潛在投資規(guī)模,結(jié)合2025年我國人工智能服務器市場規(guī)模、人工智能核心產(chǎn)業(yè)及相關(guān)產(chǎn)業(yè)規(guī)模等預測數(shù)據(jù),在智算中心實現(xiàn)80%應用水平的條件下,綜合測算得出智算中心投資對產(chǎn)業(yè)的帶動水平?;鶞蕯?shù)值,結(jié)合近年我國人工智能投入規(guī)模數(shù)據(jù),估算創(chuàng)新產(chǎn)出區(qū)間值;以此為基礎(chǔ),在智算中心實現(xiàn)80%用水平的條件下,估算智算中心建設投入的增長量對創(chuàng)新產(chǎn)出的貢獻率。智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南0606二、智算中心發(fā)展新趨勢(一)智能算力的發(fā)展需求快速擴大算力資源是數(shù)字經(jīng)濟發(fā)展的重要底座。隨著數(shù)字經(jīng)濟蓬勃發(fā)展,數(shù)字化新事物、新業(yè)態(tài)、新模式推動應用場景趨向多元化發(fā)展,算力規(guī)模不斷擴大,算力需求持續(xù)攀升。智能算力需求規(guī)??焖僭鲩L。5G人工智能等信息技術(shù)加速發(fā)展帶動數(shù)據(jù)量爆炸式增長。隨著人工智能技術(shù)的高速發(fā)展,智能化正以前所未有的速度重塑各行各業(yè),我國算力結(jié)構(gòu)也隨之不斷演化,對智能算力的需2021-2026年期間,預計中國智能算力規(guī)模年復合增長率達52.3%,同期通用算力規(guī)模年復合增長率為18.5%。未來80%的場景都將基于人工智能,所占據(jù)的算力資源將主要由智算中心承載。未來80%的場景都將基于人工智能,所占據(jù)的算力資源將主要由智算中心承載。百億億次浮點運算/秒(EFLOPS)
的產(chǎn)業(yè)、服務和治理。智算中心是具有強公共屬性的開放服務平臺,能夠?qū)崿F(xiàn)對大區(qū)域的數(shù)字化輻射帶動,成為經(jīng)濟發(fā)展的新動力引擎。隨著“東數(shù)西算”工程、新型基礎(chǔ)設施等國家政策規(guī)劃出臺,我國智算中心掀起落地熱潮。當前我國超過30個城市正在建設或提出建設智算中心,整體布局以東部地區(qū)為主,并逐漸向中西部地區(qū)拓展。未來,隨著我國智算中心布局的持續(xù)優(yōu)化與完善,以及人工智能應用場景的不斷創(chuàng)新和解鎖,智能算力需求將得到更大釋放,智算中心的賦能作用將被進一步激發(fā)。復雜場景計算需要多元算力的開發(fā)生態(tài)體系。智算中心的芯片、服務器、固件、操作系統(tǒng)等可能由多方提供,易存在多型號硬件無法兼容、軟件投入和應用難以支撐上層業(yè)務發(fā)展等問題,嚴重制約了智算中心的應用。因此,智算中心應該兼容適配更多技術(shù)體系,通過開源、開放的方式建立可兼容底層硬件差異的異構(gòu)開發(fā)平臺,突破異構(gòu)算力適配、異構(gòu)算力調(diào)度等關(guān)鍵技術(shù),加速基礎(chǔ)軟件、商用軟件和開源軟件的生態(tài)構(gòu)建,與各領(lǐng)域的知識模型、機理模型、物理模型相疊加,做到從硬件到軟件、從芯片到架構(gòu)、從建設模式到應用服務開放化、標準化,打通人工智能軟硬件產(chǎn)業(yè)鏈,從而加速人工智能算力技術(shù)和產(chǎn)業(yè)生態(tài)形成。8006004002000
2019
2020
2021
1,271.4922.8640.7922.8640.7427.0268.0155.231.775.0
(二)通用智能的算法模型快速演進算法的快速演進正改變傳統(tǒng)計算范式。大模型加速人工智能在千行百業(yè)中應用。大規(guī)模、大參數(shù)量預訓練模型的出現(xiàn)不斷提升人工智能模型的認知能力?!邦A訓練大模型+下游任務微調(diào)”的新范式已成為解決人工智圖4我國智能算力發(fā)展情況模數(shù)據(jù)處理和高性能智能計算支撐,將經(jīng)濟、社會、產(chǎn)業(yè)中各種模型、經(jīng)驗固化下來,形成新的生產(chǎn)力,并支撐智能化
能技術(shù)落地難問題的突破口,加速推進人工智能實用化、通用化和普惠化發(fā)展進程。自2011年以來,全球人工智能領(lǐng)軍企業(yè)和研究機構(gòu)紛紛加入人工智能大模型研究,人工智能模型參數(shù)急劇增長。在短短三四年時間內(nèi),參數(shù)規(guī)??焖購膬|級突破至萬億級。代表性大模型如谷歌發(fā)布的BERT,OpenAI發(fā)布的GPT-3、ChatGPT等。通過構(gòu)建大模型提升人工智能處IDC、浪潮信息,《2022-2023,2022年智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南0707理性能、增強人工智能通用性、加速人工智能廣泛應用已成為各界共識,未來大模型將覆蓋更多生產(chǎn)生活領(lǐng)域,賦能千行百業(yè)的智能化升級。多模態(tài)智能計算成為實現(xiàn)通用人工智能的關(guān)鍵。每一種信息的來源或者形式,都可以稱為一種模態(tài)。例如,人有觸覺、聽覺、視覺、嗅覺,信息的媒介有語音、視頻、文字等。多模態(tài)學習更貼近人類對多感知模態(tài)的認知過程,通過學習多種模態(tài)的數(shù)據(jù),可以突破自然語言處理和計算機視覺的界限,在圖文生成、看圖問答等視覺語言任務上具有更強的表現(xiàn)。當前,多模態(tài)大模型引發(fā)了業(yè)界廣泛的關(guān)注,并在以文生圖等領(lǐng)域取得了巨大進步,代表性模型有OpenAI發(fā)布的DALLE-2等。人工智能正在從語音、文字、視覺等單模態(tài)智能,向著多種模態(tài)融合發(fā)展。構(gòu)建以多模態(tài)融合技術(shù)為核心的感知、控制、交互能力,是實現(xiàn)通用人工智能的重人工智能正在從語音、文字、視覺等單模態(tài)智能,向著多種模態(tài)融合發(fā)展。構(gòu)建以多模態(tài)融合技術(shù)為核心的感知、控制、交互能力,是實現(xiàn)通用人工智能的重要探索方向。
智能模型可以實現(xiàn)在眾多場景通用、泛化和規(guī)?;瘡椭?,只需結(jié)合領(lǐng)域數(shù)據(jù)進行調(diào)整和增量學習,即可形成具有良好精度和性能的下游應用,助力各行業(yè)智能化升級,實現(xiàn)智能算法應用的普適化。(四)綠色低碳的發(fā)展格局加速形成在“碳中和、碳達峰”目標背景下,建設技術(shù)先進、綠色低碳的智算中心成為踐行綠色發(fā)展理念的大勢所趨。算力基礎(chǔ)設施的能效指標更加嚴格具體。我國數(shù)據(jù)中心總體上還處于小而散的粗放建設階段,大型、超大型數(shù)據(jù)中心占比不高。據(jù)統(tǒng)計,2021年度全國數(shù)據(jù)中心平均PUE為1.49,有相當數(shù)量的數(shù)據(jù)中心PUE超過甚至2.0。為約束大型算力基礎(chǔ)設施的能效,國家發(fā)改委、科技部、工信部、國家能源局等多部門陸續(xù)出臺文件,對新建大型、超大型數(shù)據(jù)中心的PUE要求已從2017年的降至2021年的以下,國家樞紐節(jié)點平均PUE更是要求進一步降到1.25以下。“東數(shù)西算”工程要求東部地區(qū)PUE目標不超過西部地區(qū)不超過能效指標更加嚴格。PUE值要求PUE值要求年份2022年,上海市《關(guān)于推進本市數(shù)據(jù)中心健康有序發(fā)展的實施意PUE2017(PUE)2019年,工信部等《關(guān)于加強綠色數(shù)據(jù)中心建設的指導意見》,提出“新建大型、超大型數(shù)據(jù)中心的電能使用效率值達到1.4以下”2021年,工信部《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》,提出“新建大型及以上數(shù)據(jù)中心PUE降低到1.3以下智算中心作為經(jīng)濟社會重要的算力載體,正向標準化、低成本、低門檻方向發(fā)展,形成集算力、算法、數(shù)據(jù)、運營于算力服務普惠化?!皷|數(shù)西算”工程的實施,帶動數(shù)據(jù)、算力跨域流動,實現(xiàn)產(chǎn)業(yè)躍升和區(qū)域平衡發(fā)展。算力服務作為算力輸出的關(guān)鍵,以多種場景化云服務為代表,成為全新的交付形式。算力的分布決定了企業(yè)能否獲得最高性價比的算力,基于分布式云技術(shù),近源交付云資源,在一定程度上降低算力成本的同時,將算力輸出進工廠、社區(qū)和鄉(xiāng)村,以
12017 2018
2019
2020
2021
2022算力服務的方式布局到用戶身邊,用戶按業(yè)務需求采購算力、存儲、帶寬等專業(yè)服務,實現(xiàn)無處不在的計算。工智能需要與各行業(yè)的業(yè)務流程、信息系統(tǒng)、生產(chǎn)系統(tǒng)等深度結(jié)合才能產(chǎn)生價值,存在一定應用門檻,在一定程度上阻礙了各行業(yè)的智能化轉(zhuǎn)型升級。依托智算中心的超大規(guī)模預訓練能力,各行業(yè)人工智能應用將不必從零開始開發(fā)。人工
圖5國家和地方政策對大型算力基礎(chǔ)設施PUE值要求演變節(jié)能降耗的先進技術(shù)成為發(fā)展重點。智算中心具有高功率密度屬性,隨著服務器主流芯片的功耗不斷增長,用于AI訓練的機器單機柜功率密度將大幅增加,傳統(tǒng)的風冷模式已無法滿足智算中心的制冷散熱需求,液冷技術(shù)的應用為智算中心綠色化運轉(zhuǎn)提供了解決思路。液冷是指借助高比熱容的液體單志廣、何寶宏、張云泉,《國家“東數(shù)西算”工程背景下新型算力基礎(chǔ)設施發(fā)展研究報告》,2022年智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南PAGE11PAGE11液冷技術(shù)對于密度高、規(guī)模大、散熱需求高的智算中心優(yōu)勢明顯,隨著AI服務器功率密度的提升和智算中心應用場景的不斷拓展,液冷技術(shù)將得到進一步推廣應用。作為熱量傳輸介質(zhì)滿足服務器等IT設備散熱需求的一種冷卻方式,比傳統(tǒng)風冷具備更強的冷卻能力,其冷卻力是空氣的1,000-3,000倍,熱傳導能力是空氣的25倍。同等散熱水平時,液冷系統(tǒng)相比傳統(tǒng)風冷系統(tǒng)約節(jié)電30%-50%,數(shù)據(jù)中心PUE值可降至液冷技術(shù)對于密度高、規(guī)模大、散熱需求高的智算中心優(yōu)勢明顯,隨著AI服務器功率密度的提升和智算中心應用場景的不斷拓展,液冷技術(shù)將得到進一步推廣應用。三、建設智算中心的必要性分析(一)我國智算中心政策形勢1.人工智能發(fā)展環(huán)境良好,算力發(fā)展基礎(chǔ)逐漸夯實從發(fā)展政策層面看,我國高度重視人工智能產(chǎn)業(yè)發(fā)展,習近平總書記在中共中央政治局第九次集體學習時強調(diào),人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,要促進
其同經(jīng)濟社會發(fā)展深度融合,推動我國新一代人工智能健康發(fā)展。2017年以來,從中央到國家部委,密集出臺了一系列人工智能發(fā)展政策,內(nèi)容涉及人工智能基礎(chǔ)設施、標準體系、應用場景、人才培育等人工智能發(fā)展的多個方面,初步形成較為完整的政策體系,為加快推動人工智能應用,助力穩(wěn)經(jīng)濟,培育新的經(jīng)濟增長點指明方向。表12017-2022年我國人工智能產(chǎn)業(yè)相關(guān)政策發(fā)布時間政策名稱發(fā)布單位主要內(nèi)容2022年8月《關(guān)于支持建設新一代人工智能示范應用場景的通知》科技部等六部門支持建設智慧農(nóng)場、智能港口、智能礦山、智能工廠、智慧家居、智能教育、自動駕駛、智能診療、智慧法院、智能供應鏈等10個示范應用場景。2022年7月《關(guān)于加快場景創(chuàng)新以人工智能高水平應用促進經(jīng)濟高質(zhì)量發(fā)展的指導意見》科技部等六部門圍繞高端高效智能經(jīng)濟、安全便捷智能社會建設、高水平科研活動、國家重大活動和重大工程,著力打造人工智能重大場景。2021年12月《“十四五”國家信息化規(guī)劃》中央網(wǎng)絡安全和信息化委員會探索建立人工智能的治理原則和標準,統(tǒng)籌建設面向人工智能等的算力和算法中心。加強人工智能關(guān)鍵前沿領(lǐng)域的戰(zhàn)略研究布局和技術(shù)融通創(chuàng)新。加大對人工智能的立法研究。培育壯大人工智能新興數(shù)字產(chǎn)業(yè),推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等同各產(chǎn)業(yè)深度融合。2021年7月《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023)》工信部用3經(jīng)濟增長相適應的新型數(shù)據(jù)中心發(fā)展格局。2021年5月《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》發(fā)改委等四部門統(tǒng)籌圍繞國家重大區(qū)域發(fā)展戰(zhàn)略,根據(jù)能源結(jié)構(gòu)、產(chǎn)業(yè)布局、市場發(fā)展、氣候環(huán)境等,在京津冀、長三角、粵港澳大灣區(qū)、成渝,以及貴州、內(nèi)蒙古、甘肅、寧夏等地布局建設全國一體化算力網(wǎng)絡國家樞紐節(jié)點(簡稱“國家樞紐節(jié)點”),發(fā)展數(shù)據(jù)中心集群,引導數(shù)據(jù)中心集約化、規(guī)?;?、綠色化發(fā)展。國家樞紐節(jié)點之間進一步打通網(wǎng)絡傳輸通道,加快實施“東數(shù)西算”工程,提升跨區(qū)域算力調(diào)度水平。2021年3月《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035全國人大加強新一代人工智能科技攻關(guān),加強關(guān)鍵數(shù)字技術(shù)創(chuàng)新應用,聚焦人工智能關(guān)鍵算法研發(fā),培育壯大人工智能產(chǎn)業(yè)。年遠景目標綱要》2020年9月《國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設工作指引(修訂版)》科技部開展人工智能技術(shù)應用示范,人工智能政策實驗、人工智能社會實驗,積極推進人工智能基礎(chǔ)設施建設。到2023年,布局建設20個左右試驗區(qū),打造一批具有重大引領(lǐng)帶動作用的人工智能創(chuàng)新高地。2020年7月《國家新一代人工智能標準體系建設指南》發(fā)改委等五部門到2023和領(lǐng)域進行推進。建設人工智能標準試驗驗證平臺,提供公共服務能力。2019年3月《關(guān)于促進人工智能和實體經(jīng)濟深度融合的指導意見》中央深改委促進人工智能和實體經(jīng)濟深度融合,結(jié)合不同行業(yè)、不同區(qū)域特點,探索創(chuàng)新成果應用轉(zhuǎn)化的路徑和方法,構(gòu)建數(shù)據(jù)驅(qū)動、人機協(xié)同、跨界融合、共創(chuàng)分享的智能經(jīng)濟形態(tài)。2017年12月《促進新一代人工智能產(chǎn)業(yè)發(fā)展(2018-2020年工信部力爭到2020年,實現(xiàn)人工智能重點產(chǎn)品規(guī)?;l(fā)展、人工智能整體核心基礎(chǔ)能力顯著增強、智能制造深化發(fā)展、人工智能產(chǎn)業(yè)支撐體系基本建立。2017年7月《新一代人工智能發(fā)展規(guī)劃》國務院構(gòu)建泛在安全高效的智能化基礎(chǔ)設施體系。先進城市率先出臺智算中心相關(guān)政策北京、上海、廣州等城市也紛紛出臺政策推進智算中心建設。例如,北京市提出:“新建一批計算型數(shù)據(jù)中心和人工智能算力中心,到2023年,培育成為人工先進城市率先出臺智算中心相關(guān)政策北京、上海、廣州等城市也紛紛出臺政策推進智算中心建設。例如,北京市提出:“新建一批計算型數(shù)據(jù)中心和人工智能算力中心,到2023年,培育成為人工智能算力樞紐”;上海市提出:“布局建設一批具有高性能、高吞吐的人工智能算力中心,推動公共算力服務平臺建設,推動構(gòu)建跨域、跨運營主體的算力資源池,構(gòu)建智能計算生態(tài)”。能開放創(chuàng)新平臺,涉及基礎(chǔ)計算架構(gòu)、智能醫(yī)療、智能供應鏈和智能城市治理等多個領(lǐng)域;在北京、上海等地建設了多個新一代人工智能創(chuàng)新發(fā)展的試驗區(qū),通過試驗區(qū)建設推動人工智能技術(shù)應用的發(fā)展,促進人工智能創(chuàng)新創(chuàng)業(yè),促進傳統(tǒng)產(chǎn)業(yè)智能化升級。圍繞AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化的發(fā)展思路,人工智能產(chǎn)業(yè)已初步形成以異構(gòu)芯片、算力設施、算法模型、產(chǎn)業(yè)應用為核心的結(jié)構(gòu)體系。2.“東數(shù)西算”工程全面實施,智算中心建設提速“東數(shù)西算”工程對我國的長遠發(fā)展有重要的戰(zhàn)略意義,將助力我國全面推進算力基礎(chǔ)設施化。針對當前我國算力資源分布不均衡局面,2021年國家發(fā)改委等四部委聯(lián)合發(fā)布了《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》,明確提出在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節(jié)點,實施“東數(shù)西算”工程,構(gòu)建全國一體化大數(shù)據(jù)中心體系。區(qū)別于傳統(tǒng)意義上的數(shù)據(jù)中心,一體化大數(shù)據(jù)中心體系統(tǒng)籌推進東西算力資源的協(xié)調(diào)調(diào)度,一方面能夠驅(qū)動數(shù)據(jù)中心集約化、綠色化、均衡化發(fā)展,另一方面構(gòu)建了含數(shù)據(jù)中心、網(wǎng)絡、云、人工智能、安全等多個要素的基礎(chǔ)設施體系,是傳統(tǒng)數(shù)據(jù)中心的升級版,是新基建的發(fā)展典范。智算中心業(yè)務是全國一體化大數(shù)據(jù)中心建設和“東數(shù)西算”工程的核心關(guān)鍵。無論是全國一體化大數(shù)據(jù)中心布局還是“東數(shù)西算”工程建設,其背后都是以實現(xiàn)集群間高效算力調(diào)度為目標的復雜巨系統(tǒng)優(yōu)化調(diào)度問題。當前,算力可分為通用算力、智能算力和超算算力三種類型,與此相對應的是基礎(chǔ)計算、智能計算和超級計算(HPC)三種計算模式。通用算力主要用于計算復雜度適中的云計算、邊緣計算類場
(二)建設智算中心的現(xiàn)實意義1.智算中心已成為提升國際競爭力的關(guān)鍵基礎(chǔ)設施算力對各國在新科技革命和產(chǎn)業(yè)變革下提升國際競爭力起著基礎(chǔ)支撐作用,也是衡量綜合國力的一個重要指標。世界各國高度重視人工智能算力基礎(chǔ)設施的規(guī)劃布局,并積極引導算力設施建設和算力應用開發(fā),推進算力產(chǎn)業(yè)本土化進程。正如人均GDP指標可以衡量一個國家經(jīng)濟發(fā)展的程度一樣,人均算力水平的高低也可以衡量其智能化水平。據(jù)統(tǒng)計,當前美國、英國、德國等國家人均算力普遍高于1,000GFLOPS/人,處于較高水平;日本、西班牙、智利、意大利、GFLOPS/人,屬于中等算力國家。結(jié)合IMD對于世界各國智能化水平的評估結(jié)果,發(fā)現(xiàn)人均算力水平與國家智能化水平呈現(xiàn)高度正向相關(guān)。智能算力水平是國家智能化、數(shù)字化發(fā)展水平的集中體現(xiàn),是數(shù)字化應用建設及發(fā)展的底層基礎(chǔ)?!?021-2022全球計算力指數(shù)評估報告》數(shù)據(jù)顯示,美國、日本、德國、英國等15個國家在AI算力上的支出占總算力支出比重從2016年的9%增加到了12%,預計到2025年AI算力占比將達到25%。按照當前發(fā)展趨勢,在人均算力中智能算力所占的比重將會逐年增長,人均智能算力水平的高低與國家經(jīng)濟社會發(fā)展將會是緊耦合的綁定關(guān)系,成為綜合國力發(fā)展的重要表現(xiàn)。2.智算中心已成為數(shù)字經(jīng)濟高質(zhì)量發(fā)展的重要支撐當前,我國數(shù)字經(jīng)濟蓬勃發(fā)展,算力作為一種關(guān)鍵技術(shù)進步力量,將帶來巨大的技術(shù)變革與賦能效應。各行業(yè)數(shù)字化轉(zhuǎn)型升級進度逐步加快,全社會數(shù)據(jù)總量爆發(fā)式增長,進而激發(fā)超大規(guī)模數(shù)據(jù)資源計算、存儲和應用需求的大幅提升。因此,算力已成為挖掘數(shù)據(jù)要素價值,推動數(shù)字經(jīng)濟發(fā)展的重要驅(qū)動力,智算中心的戰(zhàn)略性地位愈發(fā)凸顯。GDS$)美國中國意大利日本法國英國德國馬來西亞GDS$)美國中國意大利日本法國英國德國馬來西亞南非韓國巴西印度加拿大0304050607080計算力指數(shù)9025,00020,00015,00010,0005,0000領(lǐng)跑者國家 追趕者國家 起步者國家
長,智能算力將成為影響計算力指數(shù)的決定性因素。《2022-2023中國人工智能計算力發(fā)展評估報告》數(shù)據(jù)顯示,2022年,中國人工智能在互聯(lián)網(wǎng)、金融、政府、電信和制造等各個行業(yè)應用滲透度較2021年明顯提升,其中電信行業(yè)的人工智能滲透度從2021年的45增長到51,制造行業(yè)的人工智能滲透度從40增長到45。在未來,人工智能技術(shù)將更加深入地應用到行業(yè)場景中,智能算力將進一步帶動產(chǎn)業(yè)發(fā)展,成為拉動GDP增長的關(guān)鍵力量。圖6計算力指數(shù)與GDP回歸分析趨勢隨著新一代信息技術(shù)的高速發(fā)展,智算中心已成為體系化和復雜性程度極高的聚集地,具有典型的技術(shù)密集型特征。尤其是高新技術(shù)的研發(fā)過程中,高度復雜的計算場景需要更多高性能算力支撐。在“東數(shù)西算”工程全面啟動的背景下,協(xié)同推進智算中心建設,加快東西算力資源的協(xié)調(diào)調(diào)度,通過智算中心提供普惠算力,將有利于聚合人工智能產(chǎn)業(yè)鏈的要素資源和創(chuàng)新人才,推動AI產(chǎn)業(yè)化,打造科技創(chuàng)新的區(qū)域增長極和周邊輻射帶。通過智算中心的系統(tǒng)優(yōu)化布局,實現(xiàn)全國算力、網(wǎng)絡、數(shù)據(jù)、能源等協(xié)同聯(lián)動,推動產(chǎn)業(yè)AI化,促進信息、裝備、能源等行業(yè)突破核心關(guān)鍵技術(shù)瓶頸,搶占技術(shù)創(chuàng)新制高點,實現(xiàn)產(chǎn)品快速迭代和規(guī)?;瘧?,提升科技創(chuàng)新領(lǐng)域的影響力與競爭力。
3.智算中心已成為構(gòu)建智慧城市的必然選擇泛在的算力是承載智慧城市建設的基石。智算中心作為公共算力基礎(chǔ)設施,面向政府、行業(yè)、企業(yè)、公眾等多用戶群體,提供人工智能應用所需的算力服務、數(shù)據(jù)服務和算法服務。在算力、數(shù)據(jù)和算法服務的共性支撐下,政府部門有效提升數(shù)據(jù)匯聚共享和開放應用能力,與各類社會主體深度分析挖掘城市治理、政務服務、民生事業(yè)等領(lǐng)域應用需求,打造各種人工智能應用場景,廣泛服務于城市數(shù)字化轉(zhuǎn)型的方方面面,如社會治理、智慧安防、智能出行、移動支付、智慧工廠、智慧農(nóng)業(yè)等,充分支撐政府治理體系和治理能力現(xiàn)代化建設,發(fā)揮新型基礎(chǔ)設施的社會價值。IDC、浪潮信息、清華全球產(chǎn)業(yè)院,《2021-2022全球計算力指數(shù)評估報告》,2022年城市大腦城市大腦社會治理智慧能源智慧醫(yī)療環(huán)境監(jiān)測智慧教育移動支付智能出行智能工廠圖7智算中心服務的智慧城市應用領(lǐng)域技術(shù)篇智算中心建設通過領(lǐng)先的體系架構(gòu)設計,以算力基建化為主體、以算法基建化為引領(lǐng)、以服務智件化為依托,以設施綠色化為支撐,從基建、硬件、軟件、算法、服務等全環(huán)節(jié)開展關(guān)鍵技術(shù)落地與應用。智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南1414一、體系架構(gòu)AI產(chǎn)業(yè)化AI芯片AI產(chǎn)業(yè)化AI芯片機器人…最新人工智能理論深度學習自監(jiān)督學習強化學習自動機器學習跨媒體多模態(tài)…算力輸出算力生態(tài)算力芯片算力機組ASIC 軟件生態(tài)Benchmark算力輸出算力生態(tài)算力芯片算力機組ASIC 軟件生態(tài)BenchmarkAI訓練算力AI推理算力成熟豐富 強大高效易用CPUGPUFPGA先進多樣AI訓練服務器AI推理服務器算力聚合智能存儲智能網(wǎng)絡算力集群AI計算集群高IOPS智能管理軟件定義存儲網(wǎng)絡虛擬化網(wǎng)絡卸載RDMA軟件定義網(wǎng)絡算力服務算力調(diào)度算力池化開發(fā)訓練服務模型推理服務共享超分負載均衡容器化虛擬化FPGAASIC算力資源算力標準化內(nèi)存計算CPU GPU細粒度切分AI服務AI工具AI算法AI場景在線服務自動機器學習平臺深度 強化 自監(jiān)督學習 學習 學習機器學習語音自然語言處理開發(fā)接口推理引擎框架方法數(shù)據(jù)模型模型高吞吐圖像視頻模型文件高效高效GANCNN RNN GNN算力生產(chǎn)供應平臺 數(shù)據(jù)開放共享平臺 智能生態(tài)建設平臺 產(chǎn)業(yè)創(chuàng)新聚集平臺平臺算法服務算力服務數(shù)據(jù)服務服務智能化…領(lǐng)先AI芯片AI資源調(diào)度…生產(chǎn)算力2020年12能計算中心規(guī)劃建設指南》,重點圍繞基礎(chǔ)、支撐、功能和目標四大部分,創(chuàng)新性地提出了智算中心總體架構(gòu)。其中,基礎(chǔ)部分是支撐智算中心建設與應用的先進人工智能理論和計算架構(gòu);支撐部分圍繞智算中心算力生產(chǎn)、聚合、調(diào)度、釋放的作業(yè)邏輯展開;功能部分提供算力生產(chǎn)供應、數(shù)據(jù)開放共享、智能生態(tài)建設和產(chǎn)業(yè)創(chuàng)新聚集四大平臺,以及數(shù)據(jù)、算力和算法三大服務;整體目標是促進AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化及政府治理智能化。
(二)技術(shù)演進智算中心的發(fā)展基于最新人工智能理論和領(lǐng)先的人工智能計算架構(gòu),算力技術(shù)與算法模型是其中的核心關(guān)鍵,算力技術(shù)以AI芯片、AI服務器、AI集群為載體,而當前算法模型的發(fā)展趨勢以AI大模型為代表。在此基礎(chǔ)上,以智算中心操作系統(tǒng)作為智算中心的“神經(jīng)中樞”,對算力資源池進行高效管理和智能調(diào)度,使智算中心更好地對外提供算力、數(shù)據(jù)和算法產(chǎn)業(yè)AI化…釋放算力調(diào)度算力產(chǎn)業(yè)AI化…釋放算力調(diào)度算力聚合算力智算中心作業(yè)環(huán)節(jié)國家信息中心、浪潮信息,《智能計算中心規(guī)劃建設指南》,2020年智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南PAGE15PAGE15等服務,支撐各類智慧應用場景落地。除此之外,軟件生態(tài)是智算中心“好用、用好”的關(guān)鍵支撐。1.AI芯片基于AI芯片的加速計算是當前AI計算的主流模式。AI芯片通過和AI算法的協(xié)同設計來滿足AI計算對算力的超高需求。當前主流的AI加速計算主要是采用CPU系統(tǒng)搭載GPU、FPGA、ASIC等異構(gòu)加速芯片。AI計算加速芯片發(fā)端于GPU芯片,GPU計算設計的大量算術(shù)邏輯單元(ALU)可對以張量計算為主的深度學習計算提供很好的加速效果。隨著GPU芯片在AI計算加速中的應用逐步深入,GPU芯片本身也根據(jù)AI計算的特點,進行了針對性的創(chuàng)新設計,如張量計算單元、TF32/BF16度、引擎(TransformerEngine)等。近年來,國產(chǎn)AI加速芯片廠商持續(xù)發(fā)力,在該領(lǐng)域取得了快速進展,相關(guān)產(chǎn)品陸續(xù)發(fā)布,覆蓋了AI推理和AI訓練需求,其中既有基于通用GPU架構(gòu)的芯片,也有基于ASIC架構(gòu)的芯片,另外也出現(xiàn)了類腦架構(gòu)芯片,總體上呈現(xiàn)出多元化的發(fā)展趨勢。但是,當前國產(chǎn)AI芯片在產(chǎn)品性能和軟件生態(tài)等方面與國際領(lǐng)先水平還存在差距,亟待進一步完善加強??傮w而言,國產(chǎn)AI芯片正在努力從“可用”走向“好用”。2.AI服務器AI服務器是智算中心的算力機組。當前AICPU+AI加速芯片的異構(gòu)架構(gòu),通過集成多顆AI加速芯片實現(xiàn)超高計算性能。為滿足各領(lǐng)域場景和復雜的AI模型的計算需求,AI服務器對計算芯片間互聯(lián)、擴展性有極高要求。AI服務器內(nèi)基于特定協(xié)議進行多加速器間高速互聯(lián)通信已成為高端AI訓練服務器的標準架構(gòu)。目前業(yè)界以NVLink和OAM兩種高速互聯(lián)架構(gòu)為主,其中NVLink是NVIDIA開發(fā)并推出的一種私有通信協(xié)議,其采用點對點結(jié)構(gòu)、串列傳輸,可以達到數(shù)百GB/s的P2P互聯(lián)帶寬,極大地提升了模型并行訓練的效率和性能。OAM是國際開放計算組織OCP定義的一種開放的、用于跨AI加速器間的高速通信互聯(lián)協(xié)議,卡間互聯(lián)聚合帶寬可高達896GB/s。浪潮信息基于開放OAM架構(gòu)研發(fā)的AI服務器NF5498,率先完成與國際和國內(nèi)多家AI芯片產(chǎn)品的開發(fā)適配,并已在多個智算中心實現(xiàn)大規(guī)模落地部署。
3.AI集群大模型參數(shù)量和訓練數(shù)據(jù)復雜性快速增長,對智算系統(tǒng)提出大規(guī)模算力擴展需求。通過充分考慮大模型分布式訓練對于計算、網(wǎng)絡和存儲的需求特點,可以設計構(gòu)建高性能可擴展、高速互聯(lián)、存算平衡的AI集群來滿足尖端的AI計算需求。AI集群采用模塊化方法構(gòu)建,可以實現(xiàn)大規(guī)模的算力擴展。AI集群的基本算力單元是AI服務器。數(shù)十臺AI服務器可以組成單個POD計算模組,POD內(nèi)部通過多塊支持RDMA技術(shù)的POD計算模組為單位實現(xiàn)橫向擴AI集群的構(gòu)建主要采用低延遲、高帶寬的網(wǎng)絡互連。為了滿足大模型訓練常用的數(shù)據(jù)并行、模型并行、流水線并行等混合并行策略的通信需求,需要為芯片間和節(jié)點間提供低延遲、高帶寬的互聯(lián)。另外,還要針對大模型的并行訓練算法通信模式做出相應的組網(wǎng)拓撲上的優(yōu)化,比如對于深度學習常用的全局梯度歸約通信操作,可以使用全局環(huán)狀網(wǎng)絡設計,配置多塊高速網(wǎng)卡,實現(xiàn)跨AI服務器節(jié)點的AI芯片間RDMA互聯(lián),消除混合并行算法的計算瓶頸。AI集群的構(gòu)建需要配置面向AI高性能、高擴展、多層級的智能存儲,為各種數(shù)據(jù)訪問需求提供優(yōu)化性能。智能存儲具備隨需擴展功能,實現(xiàn)高IOPS處理能力,支持RDMA技術(shù),同時實現(xiàn)高聚合帶寬。4.AI大模型超大規(guī)模智能模型,簡稱大模型,是近年興起的一種新的人工智能計算范式。和傳統(tǒng)AI模型相比,大模型的訓練使用了更多的數(shù)據(jù),具有更好的泛化性,可以應用到更廣泛的下游任務中。按照應用場景劃分,AI大模型主要包括語言大模型、視覺大模型和多模態(tài)大模型等。自然語言處理是首個應用大模型的領(lǐng)域,BERT是大模型的早期代表。隨著大模型在自然語言的理解和生成領(lǐng)域成功應用,推動了語言大模型向更大的模型參數(shù)規(guī)模和更大訓練數(shù)據(jù)規(guī)模的方向發(fā)展。當前,語言大模型的單體模型參數(shù)已經(jīng)達到千億級別,訓練數(shù)據(jù)集規(guī)模也達到了TB級別,訓練所需計算資源超過PetaFlop/s-day(PD)。業(yè)界典型的自然語言大模型有GPT-3、源、悟道和文心等。自然語言大模型已經(jīng)廣泛應用于個人知識管理、輿情檢測、商業(yè)報告生成、金列的創(chuàng)新應用場景,如劇本殺、反網(wǎng)絡詐騙、公文寫作等。算機視覺領(lǐng)域,通過構(gòu)建更大的預訓練模型,使其可以適用于目標檢測、語義分割、異常檢測等廣泛的視覺任務。在算法架構(gòu)上,視覺大模型采用以Transformer架構(gòu)為主體的神經(jīng)網(wǎng)絡架構(gòu)和自監(jiān)督的訓練方法以及十億級的無標注圖片數(shù)據(jù)進行訓練。當前業(yè)界已經(jīng)出現(xiàn)了越來越多的通用視覺大模型和面向特定領(lǐng)域的視覺大模型。視覺大模型也已廣泛應用于自動駕駛、智能安防、醫(yī)學影像等領(lǐng)域。隨著大模型技術(shù)在語言、視覺等多個領(lǐng)域應用,融合多個模態(tài)的多模態(tài)大模型也逐漸成為了業(yè)界關(guān)注的重點?;诙嗄B(tài)大模型的以文生圖技術(shù)也迅速發(fā)展,代表性模型有DALLE-2StableDi?usion(AIGeneratedContent,AIGC)已成為下一AI5.智算OS智算OS,智算中心基礎(chǔ)設施資源池進行高效管理和智能調(diào)度的產(chǎn)品方案,可以使智算中心更好地對外提供算力、數(shù)據(jù)、算法、智件等服務,有效降低算力使用門檻,提升資源調(diào)度效率,支撐各類智慧應用場景落地,是智算中心的“中樞神經(jīng)”。智算OS務層、業(yè)務系統(tǒng)層?;A(chǔ)設施層主要實現(xiàn)將異構(gòu)算力、數(shù)據(jù)存儲、框架模型等轉(zhuǎn)化為有效的算力與服務資源,算力資源池能夠聚合并進行標準化和細粒度切分,以滿足上層不同類型智能應用對算力的多元化需求,并通過異構(gòu)資源管理和調(diào)度技術(shù),提升可同時支撐的智算業(yè)務規(guī)模。平臺服務層主要提供AI訓練與推理服務、數(shù)據(jù)治理服務、運營運維服務等,并通過智算OS實現(xiàn)自動化、智能化,有效擺脫人力束縛,促進算力高效釋放并轉(zhuǎn)化為生產(chǎn)力。業(yè)務系統(tǒng)層是面向用戶端的統(tǒng)一服務入口,向下整合各層級核心功能,為用戶提供多元化、高質(zhì)量的智算服務,滿足生產(chǎn)中不同階段、不同場景的智算需求。智算OS臺,融合國際、國內(nèi)先進人工智能技術(shù),形成標準化、模塊
化的模型、中間件及應用軟件,以開放接口、模型庫、算法包等方式向用戶提供如行業(yè)大模型、自動駕駛、元宇宙、智慧科研等人工智能服務,促進人工智能技術(shù)成果的開放與共享,構(gòu)建開放的智算生態(tài)。6.軟件生態(tài)智算中心能夠滿足前沿AI計算需求、提升AI創(chuàng)新和生產(chǎn)效率、豐富行業(yè)AI應用、促進AI產(chǎn)業(yè)快速發(fā)展的主要前提。深度學習的加速計算始于GPU,構(gòu)建于GPU之上的CUDA件棧為深度學習的算法開發(fā)提供了極大的便利。CUDA軟件棧為深度學習的應用開發(fā)和計算加速提供了豐富的底層支撐,如張量和卷積計算加速、芯片互聯(lián)通信加速、數(shù)據(jù)預處理加速、模型低精度推理加速等。在此基礎(chǔ)上,學術(shù)界和工業(yè)界已經(jīng)構(gòu)建龐大的開源、開放、共享的AI軟件生態(tài),有力促進和加速全球AI技術(shù)與應用的蓬勃發(fā)展。和的使用較為廣泛。TensorFlow因其豐富的模型開發(fā)和應用部署組件而在工業(yè)界廣泛應用,PyTorch由于其易用性和靈活性在前沿算法開發(fā)和學術(shù)創(chuàng)新研究領(lǐng)域取得了領(lǐng)先地位。國內(nèi)的AI科技公司也在開發(fā)和推廣深度學習框架。其中百度開發(fā)的飛槳提供了兼具靈活和效率的開發(fā)機制,并聯(lián)合開源社區(qū)打造了一系列覆蓋主流產(chǎn)業(yè)應用需求的工業(yè)級模型,目前在國內(nèi)已得到較多的采用。在深度學習框架之上,為了適應計算機視覺任務、自然語言大模型等特定場景的應用開發(fā)需求,業(yè)界構(gòu)建了一系列的開源開發(fā)庫,比如面向目標檢測任務的mmdetection、面向大模型訓練任務的Megatron-LM、DeepSpeed,以及面向自監(jiān)督學習的VISSL等。這些軟件庫進一步簡化了模型訓練和應用開發(fā)的難度,已成為當前人工智能計算的重要軟件底座。業(yè)界前沿的知名AI算法,如ChatGPT、DALLE-2、StableDi?usion等都是在這樣的架構(gòu)下實現(xiàn)的。隨著國產(chǎn)AI入軟件生態(tài)建設,力求實現(xiàn)好用、易用的軟件開發(fā)和應用生態(tài)。但總的來說,當前國產(chǎn)AI計算軟件生態(tài)起步較晚,基礎(chǔ)薄弱,還需持續(xù)不斷加大投入,在各個層面加強建設完善。賦能AI產(chǎn)業(yè)化產(chǎn)業(yè)AI化賦能AI產(chǎn)業(yè)化產(chǎn)業(yè)AI化治理智能化產(chǎn)業(yè)集群化AIAI開發(fā)部署開發(fā)部署算法模型算法模型基礎(chǔ)支撐基礎(chǔ)支撐
釋放算力服務智件化數(shù)據(jù)服務算力服務釋放算力服務智件化數(shù)據(jù)服務算力服務算法服務生態(tài)服務算力服務智件算法服務智件供需對接智件……數(shù)據(jù)管理模型開發(fā)模型訓練模型管理模型服務開發(fā)者社區(qū)實例分割目標檢測語音識別圖像分類人臉識別實例分割目標檢測語音識別圖像分類人臉識別視頻感知機器翻譯情感分析…… 型 型 預訓練大模型單模態(tài)、多模態(tài)、超模態(tài)有監(jiān)督學習無監(jiān)督學習半監(jiān)督學習強化學習自監(jiān)督學習交互式主動學習分布式訓練框架高性能推理框架分布式訓練框架高性能推理框架AI預置行業(yè)算法海量數(shù)據(jù)清洗系統(tǒng)AI預置行業(yè)算法海量數(shù)據(jù)清洗系統(tǒng)調(diào)度算力算力管理算力監(jiān)控算力調(diào)度算力運營調(diào)度算力算力管理算力監(jiān)控算力調(diào)度算力運營……
按需定義 智能調(diào)軟件定義計算
按需定義智能調(diào)度軟件定義存儲
按需定義 智能調(diào)度軟件定義網(wǎng)絡聚合算力算力基建化標準化接入 標準化接入 標準化接入聚合算力算力基建化計算資源池化 異構(gòu)內(nèi)存分級池化 存儲池化 網(wǎng)絡連接生產(chǎn)算力硬件重構(gòu)生產(chǎn)算力
…… 算力芯片
AI服務器CPUGPUFPGAASICCPUGPUFPGAASIC
DRAMPMemDRAMPMemSSDHBMAEPHDD……
核心交換機接入交換機智能網(wǎng)卡……智能網(wǎng)絡集中散熱 集中管理 集中供電設施綠色化液冷系統(tǒng) 集成冷站 模塊化機房 預置化數(shù)據(jù)中心 綠色供電設施 ……設施綠色化圖9智算中心建設架構(gòu)算法基建化本指南在智算中心總體架構(gòu)的基礎(chǔ)上,聚焦智算中心建設與應用中涉及的關(guān)鍵技術(shù),進一步提出智算中心建設架構(gòu)。智算中心建設架構(gòu)由四大關(guān)鍵環(huán)節(jié)組成,分別是算力基建化、算法基建化、服務智件化、設施綠色化,“四化”相互支撐、相互協(xié)調(diào),共同構(gòu)建起智算中心高效運行體系。算法基建化
同時,在總體架構(gòu)三項服務、三項目標的基礎(chǔ)上,進一步拓展豐富智算中心的功能和目標,實現(xiàn)對外提供數(shù)據(jù)服務、算力服務、算法服務、生態(tài)服務四大服務,支撐達成AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化、治理智能化、產(chǎn)業(yè)集群化四大目標。二、技術(shù)路線智算中心建設的關(guān)鍵技術(shù)涉及與其建設和應用相關(guān)的各類基建、硬件、軟件、算法、服務等,體現(xiàn)在智算中心算力基建化、算法基建化、服務智件化、設施綠色化過程中。(一)以算力基建化為主體以智算中心為代表的算力基礎(chǔ)設施能夠有效促進AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,是支撐數(shù)字經(jīng)濟發(fā)展的重要基礎(chǔ)底座。為了讓AI真正地賦能到千行百業(yè),并推動產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型發(fā)展,智算中心要具備對外提供高性價比、普惠、安全算力資源的能力,使AI算力像水、電一樣成為城市的公共基礎(chǔ)資源,供政府、企業(yè)、公眾自主取用。算力基建化供給成為支撐產(chǎn)業(yè)轉(zhuǎn)型升級以及創(chuàng)新發(fā)展的剛性需求和必然選擇。1.面向潛在算力需求,適度超前規(guī)?;渴鹚懔Y源數(shù)據(jù)量的爆炸式增長以及萬億參數(shù)大模型的出現(xiàn),使智能算力需求呈現(xiàn)高速增長態(tài)勢,并為算力基礎(chǔ)設施帶來巨大挑戰(zhàn)。在數(shù)據(jù)量方面,IDC發(fā)布的《數(shù)據(jù)時代2025》預測,到2025175ZB,而中國數(shù)據(jù)量的平均增速快于全球3%,預計到2025年將增至48.6ZB,占全球數(shù)據(jù)圈的27.8%。在模型方面,當前1萬億參數(shù)的單體模型需要1EFLOPS級算力(FP16)計算約50天,10萬億參數(shù)的單體模型10EFLOPS(FP16)計算約50天。因此在智算中心的規(guī)劃建設中,需要聚焦當前算力應用需求,同時面向未來數(shù)據(jù)量和大模型大參數(shù)量增長空間,適度超前,部署滿足AI訓練、AI推理等大規(guī)模計算需求的強大AI算力機組,構(gòu)建算力集群,提供大規(guī)模彈性算力。2.聚焦異構(gòu)加速技術(shù),提升高性能人工智能計算能力自2012年以來,人工智能訓練任務所需的算力每3.43個月就會翻倍,大大突破了傳統(tǒng)以每18個月為周期實現(xiàn)芯片性能翻番的摩爾定律,這對人工智能計算架構(gòu)的性能提出了更高的要求。AI芯片是生產(chǎn)算力環(huán)節(jié)的關(guān)鍵組件,為AI訓練和AI推理輸出強大、高效、易用的計算力。目前,AI芯片主要包括GPU、FPGA、ASIC、類腦芯片四大類,其中類腦芯片仍在探索階段,因此多元異構(gòu)芯片成為提升算力的關(guān)鍵手段。主流的人工智能計算架構(gòu)是以CPU+AI芯片為主體的異構(gòu)架構(gòu),通
過將CPU與多種計算單元(如GPU、FPGA、ASIC等)集成,充分融合了CPU等傳統(tǒng)的通用計算單元和高性能專用計算單元的優(yōu)點,可以同時兼顧AI模型的高效訓練和精準推理能力。異構(gòu)架構(gòu)具有高性能、高效率、低功耗等顯著優(yōu)點,使AI芯片在未來人工智能算法不斷迭代更新的情況下,依舊能保持較好的兼容性和可擴展性,在一定程度上延長了AI芯片的生命周期。3.兼顧軟硬一體協(xié)同,構(gòu)建智算中心多元融合型架構(gòu)人工智能計算場景和計算架構(gòu)的多元化要求智算中心從硬件、軟件、軟硬協(xié)同等層面開展優(yōu)化,提供彈性、可伸縮擴展的算力聚合能力,依據(jù)不同類型智能應用對算力的不同需求,提供更高效、更便捷的算力調(diào)度能力。采用融合架構(gòu)進行整體設計是智算中心的發(fā)展方向。具體而言,在硬件層面,通過硬件重構(gòu)實現(xiàn)資源池化,結(jié)合新型超高速內(nèi)外部互連技術(shù)、池化融合、異構(gòu)存儲介質(zhì)等,推動多元異構(gòu)智能算力設施的高速互聯(lián),形成高效池化的智算中心,實現(xiàn)多元計算資源高效協(xié)同;在軟件層面,通過軟件定義,將不同的資源池組成專業(yè)的服務器、存儲、網(wǎng)絡系統(tǒng),實現(xiàn)重構(gòu)硬件資源池的高效化、智能化管理,使智算中心的業(yè)務資源調(diào)度更為靈活、運維管理能力更強。在安全方面,智算中心可以依托隱私安全計算等技術(shù),提供完善的隱私和數(shù)據(jù)保護解決方案,實現(xiàn)計算、存儲、網(wǎng)絡等多層級、全方位的資源隔離與安全防護。(二)以算法基建化為引領(lǐng)建設適度超前的算力基礎(chǔ)設施,不僅體現(xiàn)在算力層面,也體現(xiàn)在算法層面,這是釋放算力環(huán)節(jié)的關(guān)鍵。人工智能算法正面臨著豐富化、專業(yè)化和巨量化的挑戰(zhàn),智算中心通過提供預置行業(yè)算法、構(gòu)建預訓練大模型、推進算法模型持續(xù)升級、提供專業(yè)化數(shù)據(jù)和算法服務,讓更多的用戶享受普適普惠的智能計算服務。1.面向千行百業(yè)發(fā)展需求,提供多類型預置行業(yè)算法AI落地面臨開發(fā)成本、技術(shù)門檻高的難題,算法模型平均構(gòu)建時間為3個月,同時算法還需要快速的迭代,再加上AI新算法、新理論層出不窮,行業(yè)用戶的智慧轉(zhuǎn)型存在著巨大的技術(shù)壁壘。智算中心應圍繞政務服務、智慧城市、智能制造、自動駕駛、語言智能等重點領(lǐng)域,在AI平臺內(nèi)預置實例分割、目標檢測、邊緣檢測、圖像分類、人臉識別、視頻感知、自動問答、機器翻譯、輿情分析、情感分析、語音識別、協(xié)同過濾、交通路線規(guī)劃等常用行業(yè)算法模型,并從軟硬件方面對行業(yè)算法做性能優(yōu)化,從而幫助各行各業(yè)智慧應用加速落地,推動行業(yè)智能化轉(zhuǎn)型加速。2.面向模型即服務應用需求,構(gòu)建大規(guī)模預訓練AI模型在產(chǎn)業(yè)AI每一個場景都做一個模型,即“有1萬個場景就有1萬個模型”。然而隨著以BET、GPT-3、DAL·E、源.0等為代表的高泛化能力和高通用性的大模型的出現(xiàn),一個模型可以覆蓋眾多場景?!邦A訓練大模型+下游任務微調(diào)”的AI工程化模式已型化、輕量化的落地運作。3.面向可持續(xù)化發(fā)展需求,推進AI模型不斷演進升級從感知機到深度神經(jīng)網(wǎng)絡,從全連接網(wǎng)絡到模型剪枝、知識蒸餾、注意力機制,從有監(jiān)督學習、無監(jiān)督學習到強化學習、自監(jiān)督學習,人工智能理論算法模型在持續(xù)深化發(fā)展中。當前,人工智能算法正從單模態(tài)、有監(jiān)督學習向多模態(tài)、自監(jiān)督學習演進。自監(jiān)督學習無需標注數(shù)據(jù),可以直接從無標簽數(shù)據(jù)中自行學習,極大降低了人工標注成本。多模態(tài)學習更貼近人類對多感知模態(tài)的認知過程,通過學習多種模態(tài)的數(shù)據(jù),可以突破自然語言處理和計算機視覺的界限,在圖文生成、看圖問答等視覺語言任務上具有更強表現(xiàn)。隨著人工智能相關(guān)技術(shù)和應用需求的不斷升級,智算中心所提供的算法模型也應持續(xù)迭代升級,與時俱進,保持算法模型的先進性。未來,人工智能算法將朝著多模態(tài)、交互式主動學習、規(guī)劃、實踐的方向發(fā)展,以期實現(xiàn)真正的認知智能。4.面向算法高效調(diào)用需求,提供專業(yè)化開發(fā)部署支撐智算中心除了提供深度學習、強化學習等常見AI算法模型
外,還應提供專業(yè)化基礎(chǔ)支撐和開發(fā)部署服務能力,以支撐AI算法模型的便捷調(diào)用和部署。為了滿足算法模型對大規(guī)模高質(zhì)量海量數(shù)據(jù)集的需求,智算中心應搭載海量數(shù)據(jù)清洗系統(tǒng),提供全流程自動化數(shù)據(jù)處理系統(tǒng),實現(xiàn)智能高效的數(shù)據(jù)處理和過濾。為了滿足AI算法模型高效訓練和使用的需求,智算中心在基礎(chǔ)支撐層面應部署分布式訓練框架、高性能推理框架,在開發(fā)部署層面應提供數(shù)據(jù)管理、模型開發(fā)、模型訓練、模型管理等關(guān)鍵模塊,以模型API服務、領(lǐng)域模型、工具包、會話式開放框架、開發(fā)者社區(qū)等形式,形成強大的AI算法服務支撐能力。(三)以服務智件化為依托隨著人工智能應用場景持續(xù)拓展和開發(fā)用戶不斷普及,對智能計算需求大幅提升、算法模型功能不斷強化的同時,人工智能算法開發(fā)和模型訓練正在從專業(yè)化、高門檻向泛在化、易用型轉(zhuǎn)變,智算中心的發(fā)展將由傳統(tǒng)的硬件、軟件向“智件”升級拓展。“智件”是指智算中心提供人工智能推廣應用的中間件產(chǎn)品和服務。傳統(tǒng)用戶進行人工智能應用時,除了需要提供業(yè)務數(shù)據(jù),還需提供算法模型并進行代碼開發(fā),“智件”的構(gòu)建可以改變這種服務模式,通過可視化操作界面,以及低代碼開發(fā)甚至無代碼開發(fā)的模式,為用戶提供功能豐富、使用便捷的人工智能算力調(diào)度、算法供給和個性化開發(fā)服務,實現(xiàn)“帶著數(shù)據(jù)來、拿著成果走”的效果。1.提供多元算力調(diào)度服務,實現(xiàn)算力調(diào)度“智件化”算力是智算中心提供的核心產(chǎn)品和服務。面向不同用戶的不同算力需求,智算中心應提供“智件化”算力服務,讓用戶無需關(guān)注底層算力芯片和技術(shù)細節(jié),通過用戶交互界面,選擇業(yè)務場景類別、算法模型大小等參數(shù),獲得不同算力需求下的計算時間預估、服務費用測算等針對性算力服務方案。一方面,算力服務虛擬化,弱化底層算力芯片供給的技術(shù)差異性,為用戶提供標準化的算力供給服務。通過抽象芯片架構(gòu)并融合算力特性將提供底層計算能力的GPU、FPGA、ASIC等AI芯片進行統(tǒng)一管理和調(diào)度,以PFLOPS、EFLOPS作為計算能力單位向用戶提供算力服務,讓用戶可以更便捷地調(diào)度算力,進行AI應用部署。另一方面,算力服務協(xié)同調(diào)度,要強化對外的算力調(diào)度與服務能力。在構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系和“東數(shù)西算”工程的背景和要求下,智算中心可以作為算力基礎(chǔ)單元,通過云服務方式融入全國算力調(diào)度體系中,滿足更大范圍、更強算力調(diào)度需求。2.提供簡便算法模型服務,實現(xiàn)算法供給“智件化”有扎實的理論功底,還要有高超的編程技術(shù),門檻極高。算法模型是人工智能應用的靈魂,也是智算中心提供服務的主要輸出物。從計算智能到感知智能,再到認知智能,人工智能的應用模型越來越復雜,從公共服務到社會治理再到產(chǎn)業(yè)發(fā)展,人工智能的應用需求越來越廣泛,對人工智能模型和算法的要求也越來越高。為了緩解人工智能模型訓練成本高、技術(shù)門檻高的問題,智算中心應加強算法供給服務模式的創(chuàng)新,開發(fā)可視化操作界面,用戶通過API、模塊化代碼即可獲得所需的人工智能應用效果,減輕代碼開發(fā)壓力,使用戶無需關(guān)注算法和模型本身的復雜技術(shù)細節(jié),只需聚焦相應業(yè)務領(lǐng)域的業(yè)務邏輯和數(shù)據(jù)就能實現(xiàn)人工智能應用。用戶可以基于“智件化”的算法模型進行探索和創(chuàng)新,開發(fā)出適用于各種場景的新型智能應用。3.提供開放生態(tài)環(huán)境服務,實現(xiàn)供需對接“智件化”明顯,為滿足部分用戶和場景對于人工智能算法優(yōu)化、系統(tǒng)優(yōu)化服務的個性化需求,智算中心應構(gòu)建開放合作生態(tài),加大數(shù)據(jù)資源供給,聚焦先進的技術(shù)并適配典型場景應用。一方面,加大數(shù)據(jù)供給,數(shù)據(jù)是人工智能應用的基礎(chǔ),智算中心應打造數(shù)據(jù)共享平臺,推動計算機視覺、自然語言處理、重點行業(yè)領(lǐng)域等高質(zhì)量公開數(shù)據(jù)集的匯聚,為用戶人工智能應用提供增值性數(shù)據(jù)服務。另一方面,開放發(fā)展生態(tài),圍繞滿足不同用戶個性化人工智能應用需求,智算中心應將其計算平臺、資源平臺和算法平臺對外開放,聚集行業(yè)內(nèi)領(lǐng)先企業(yè)的力量,及時響應用戶個性化需求,提升智算中心技術(shù)能力的同時形成新的產(chǎn)業(yè)和生產(chǎn)力。(四)以設施綠色化為支撐能耗是衡量智算中心發(fā)展水平的重要維度之一?!疤歼_峰、碳中和”目標背景下,國家和地方持續(xù)出臺政策,進一
步規(guī)范數(shù)據(jù)中心的能耗水平和平均電能利用效率(PUE)。為了進一步降低智算中心能耗,設施綠色化是智算中心建設的必然選擇。設施綠色化主要包括設備節(jié)能化、能源供給綠色化等方面。1.采用先進節(jié)能技術(shù),全面降低智算中心能耗制冷設備和IT設備是智算中心主要的能耗來源。液冷技術(shù)采用冷卻液和工作流體對發(fā)熱設備進行冷卻,利用高比熱容的液體代替空氣,提升了制冷效率,降低制冷能耗。液冷技術(shù)是智算中心制冷的主要發(fā)展趨勢。數(shù)據(jù)中心采用全棧布局液冷,冷板式液冷、熱管式液冷、浸沒式液冷等先進液冷技術(shù),構(gòu)建包含一次側(cè)二次側(cè)液冷循環(huán)、CDU等的智算中心液冷整體解決方案,可以進一步降低能耗、降低PUE,實現(xiàn)綠色化。液冷智算中心采用余熱回收技術(shù),可以為智算中心自身以及鄰近區(qū)域供暖,進一步提升能源利用效率。此外,智算中心采用高壓直流、集中供電等高效供配電系統(tǒng)、能效環(huán)境集成檢測等高效輔助系統(tǒng)、智能監(jiān)控運維系統(tǒng)等綠色管理系統(tǒng)可以進一步降低能耗。2.采用綠色清潔能源,從源頭上實現(xiàn)綠色低碳一方面,智算中心的大部分業(yè)務負載,特別是企業(yè)負載,在時間上主要集中于白天工作時段,與光伏、風電的主要發(fā)電時段匹配性較高,無需過多儲能與調(diào)峰,使得智算中心在運用光伏、風電等綠色電力方面具有天然優(yōu)勢。采用綠色電力供給的智算中心綜合運用線性規(guī)劃、混合整數(shù)規(guī)劃、啟發(fā)式算法等多種能耗管理方法,可以在降低碳排放的同時也節(jié)約電價成本。智算中心采用優(yōu)化調(diào)度與需求響應控制策略,還可作為需求側(cè)可調(diào)載荷參與電力需求側(cè)響應,不僅提升智算中心自身能源利用效率,而且提升新型電力系統(tǒng)需求側(cè)資源優(yōu)化配置效率。另一方面,智算中心所在的建筑物、園區(qū)空間大,可以充分利用,發(fā)展屋頂光伏、園區(qū)風電等可再生能源發(fā)電設施,優(yōu)化能源綠色供給格局。應用分布式光伏發(fā)電、分布式燃氣供能等技術(shù)可以提升智算中心園區(qū)綠色化水平。小型智算中心還可以利用模塊化氫燃料電池、太陽能板房等技術(shù)優(yōu)化能源供給格局。應用篇自2020年《智能計算中心規(guī)劃建設指南》發(fā)布以來,識別檢測、語音交互、智能客服等智能應用在各行業(yè)領(lǐng)域得到了廣泛使用,以自動駕駛為代表的高算力需求場景從實驗環(huán)境逐步走向試點應用階段,而以元宇宙、智慧科研(AIforScience)進大眾視野,并帶來無限發(fā)展可能。作為支撐人工智能應用的關(guān)鍵基礎(chǔ)設施,智算中心匯聚數(shù)據(jù)、算力、算法等要素,通過生產(chǎn)算力、聚合算力、調(diào)度算力、釋放算力等關(guān)鍵環(huán)節(jié),實現(xiàn)“以數(shù)據(jù)輸入,讓智能輸出”,助力AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,讓智能計算真正惠及經(jīng)濟社會發(fā)展。智能計算中心創(chuàng)新發(fā)展指南智能計算中心創(chuàng)新發(fā)展指南PAGE22PAGE22一、智算中心激發(fā)AI產(chǎn)業(yè)化創(chuàng)新活力(一)自動駕駛自動駕駛是汽車智能化和自動化的高級形態(tài),作為AI技術(shù)備受關(guān)注的重要落腳點,被公認是汽車出行產(chǎn)業(yè)的未來方向之一。自動駕駛場景的實現(xiàn),需要通過感知融合、虛擬路測(模擬仿真)、高精地圖、車路協(xié)同等核心技術(shù)將數(shù)字世界與實體路況進行深度融合,基于人工智能技術(shù),讓車輛能夠像人類駕駛員一樣準確地識別車道、行人、障礙物等駕駛環(huán)境中的關(guān)鍵信息,并及時對周圍運動單元的潛在軌跡做出預判。自動駕駛落地需要超大AI算力支持自動駕駛需要通過對車身多個傳感器的數(shù)據(jù)進行感知和融合,并在此基礎(chǔ)上對自動駕駛車輛的行為進行決策和控制,其中涉及大量AI算法、機器視覺與傳感器數(shù)據(jù)整合分析、面向各類算力平臺及傳感器配置方案的適配能力等。為了提升自動駕駛系統(tǒng)的感知和決策性能,當前通行的做法是在數(shù)據(jù)中心端基于海量的道路采集數(shù)據(jù)來進行感知模型訓練和仿真測試。隨著AI技術(shù)的發(fā)展,通過AI算法對多傳感器的數(shù)據(jù)以及多模態(tài)的數(shù)據(jù)進行融合感知,已經(jīng)成為了當前主流的發(fā)展趨勢。另外自監(jiān)督大模型的技術(shù)也在逐步地引入到自動駕駛場景中。這都使得自動駕駛感知模型的訓練算力消耗遠大于一般的計算機視覺感知模型。比如,Tesla構(gòu)建的L2級別的FSD自動駕駛?cè)诤细兄P偷挠柧毷褂昧税偃f量級的道路采集視頻片段,算力投入約為500PD。隨著自動駕駛級別從L2到L4的提升,對算力的需求將進一步提高。算力供給是自動駕駛系統(tǒng)得以大規(guī)模落地和進一步商業(yè)化的前提條件。自動駕駛產(chǎn)業(yè)的集成化、規(guī)模化發(fā)展需要由智算中心提供超大算力、先進AI算法等支撐。智算中心提供的普惠算力可以極大降低自動駕駛所需算力的成本,同時加速自動駕駛新技術(shù)與新產(chǎn)品的研發(fā)、測試和應用。(二)機器人工業(yè)機器人、服務機器人和特種機器人。作為一種重要的智
能硬件,隨著計算機視覺、機器學習、智能語音等多種智能算法技術(shù)的進步,機器人產(chǎn)業(yè)也將實現(xiàn)飛速的發(fā)展?!吨袊鴻C器人產(chǎn)業(yè)發(fā)展報告(2022年)》數(shù)據(jù)顯示,2022年中國機器人市場規(guī)模約為174億美元,五年年均增長率達到22%,其中工業(yè)機器人和服務機器人市場規(guī)模均保持增長,二者呈現(xiàn)出齊頭并進、快速發(fā)展的態(tài)勢?!癆I算法+AI算力”支撐機器人從量變到質(zhì)變機器人與新一代信息技術(shù)的融合逐漸深入,機器人的感知、計算、執(zhí)行能力都得到了大幅提升,處理實際問題的穩(wěn)定性和可靠性也進一步提高,這背后離不開人工智能技術(shù)和強大算力的支撐。機器人需要和環(huán)境進行交互感知以及決策控制,和環(huán)境的交互感知不僅涉及到視覺、聽覺等多個模態(tài),也會涉及到不同模態(tài)的感知融合,這都需要AI算法作為底層支撐。為了實現(xiàn)相應的感知和決策算法,一般會在數(shù)據(jù)中心端構(gòu)建真實世界數(shù)據(jù)采集→AI模型構(gòu)建→孿生世界的決策控制模型訓練→真實世界驗證測試的閉環(huán),來逐步地提升機器人在真實世界的感知和決策能力。用于學習和訓練的數(shù)據(jù)越多,算法迭代得越完善,機器人的決策準確度將越高。智算中心的算力服務可以為機器人的大規(guī)模模型訓練和預測提供強大算力支撐,智算中心的算法服務可以實現(xiàn)機器人智能化應用算法模型的敏捷開發(fā)和快速訓練上線,為機器人產(chǎn)業(yè)的高質(zhì)量發(fā)展提供全方位支撐。(三)元宇宙元宇宙是基于數(shù)字技術(shù)進行創(chuàng)造和連接,與現(xiàn)實空間映射交互形成的虛擬空間,是整合多種新技術(shù)而產(chǎn)生的下一代互聯(lián)網(wǎng)應用和數(shù)字形態(tài)的新型社會體系。元宇宙在5G、人工智能、物聯(lián)網(wǎng)、AR/VR、云計算、區(qū)塊鏈等技術(shù)及產(chǎn)品的支持下,為現(xiàn)實世界構(gòu)建數(shù)字化虛擬平行世界,為用戶提供沉浸式交互體驗,大幅提升各行業(yè)生產(chǎn)效率。智算中心是支撐元宇宙實現(xiàn)的關(guān)鍵基礎(chǔ)設施元宇宙的沉浸式體驗離不開擴展現(xiàn)實、人工智能、區(qū)塊鏈等元宇宙核心技術(shù)的支持,對系統(tǒng)的計算、存儲、帶寬、功耗等都提出了極高的要求,其所需消耗的算力資源也是巨量的。元宇宙的協(xié)同創(chuàng)建、高精仿真、實時渲染、智能交互等環(huán)節(jié)都需要大量算力做支撐,想要真正邁入虛擬和現(xiàn)實融合的3D互聯(lián)網(wǎng)時代,元宇宙對算力的需求將呈指數(shù)級增長,這遠遠超過了通用CPU的發(fā)展速度。傳統(tǒng)以提升CPU時鐘頻率和內(nèi)核數(shù)量來提高計算性能的方式遇到了瓶頸,形成了巨大的算力缺口。元宇宙從本質(zhì)上看是對算力的重構(gòu),這部分算力缺口需要由智算中心來彌補,從而不斷提升元宇宙場景的性能和能效。1.虛擬數(shù)字人機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等技術(shù)生成,具備類人外貌、交互能力等高度擬人化特征,是元宇宙的重要組成部分。虛擬數(shù)字人正逐步“闖入”現(xiàn)實不同,已經(jīng)出現(xiàn)了虛擬主播、虛擬偶像等娛樂型數(shù)字人,虛擬教師等教育型數(shù)字人,虛擬客服、虛擬導游等助手型數(shù)字人,替身演員、虛擬演員等影視數(shù)字人應用。據(jù)《虛擬數(shù)字人深度產(chǎn)業(yè)報告》預測,2030年我國虛擬數(shù)字人整體市場規(guī)模將達到2,700億元。智算中心助力虛擬數(shù)字人應對AI算力和算法挑戰(zhàn)量的算力支撐。當前,虛擬數(shù)字人的建模以基于3D建模軟件的手工建模+真人驅(qū)動為主。隨著AIGC等AIAI算法的自動建模將逐步替代手工建模,成為數(shù)字人建模的主要方式。與此同時,基于AI算法的數(shù)字人驅(qū)動也將逐步替代當前以“中之人”驅(qū)動為主的真人驅(qū)動方式。與此同時,視覺感知、語音識別和語音合成以及自然語言處理等多種AI算法在數(shù)字人中的應用,將推動數(shù)字人向“數(shù)智人”轉(zhuǎn)變,也是虛
擬數(shù)字人應用普及的關(guān)鍵。智算中心可以為虛擬數(shù)字人制作、感知交互提供強大的算力和算法支撐,加速虛擬數(shù)字人產(chǎn)業(yè)的商業(yè)化落地。2.數(shù)字孿生據(jù),集成多學科、多尺度的仿真過程,以數(shù)字化方式創(chuàng)建物理實體的虛擬鏡像,通過模擬、驗證、預測和控制物理實體全生命周期行為,實現(xiàn)在物理空間的最優(yōu)決策。數(shù)字孿生是構(gòu)建元宇宙數(shù)字空間的基礎(chǔ)數(shù)字孿生在元宇宙的發(fā)展進程中扮演著重要角色,是元宇宙耦合物理世界的基石。元宇宙的目標是構(gòu)建一個與現(xiàn)實物理世界高度貼合的甚至是超越現(xiàn)實世界的虛擬世界,因此需要通過海量數(shù)據(jù)模擬和強大算力來實現(xiàn)的數(shù)字空間創(chuàng)造,這個過程中的核心關(guān)鍵就是數(shù)字孿生。數(shù)字孿生技術(shù)能夠以極致細節(jié)的方式將現(xiàn)實世界映射到虛擬世界中。因此,數(shù)字孿生技術(shù)的成熟度在一定程度上決定了元宇宙在虛實映射與虛實交互上的發(fā)展?jié)摿?。強大算力是?shù)字孿生高效穩(wěn)定運行的重要支撐數(shù)字孿生的應用十分廣泛。例如,數(shù)字孿生城市可以在虛擬世界模擬仿真城市管理、產(chǎn)業(yè)發(fā)展、消防應急、環(huán)境變化等情況,為現(xiàn)實中關(guān)鍵問題的決策提供技術(shù)支撐,提升城市規(guī)劃和城市治理的效率和精準度。在元宇宙中,大規(guī)模、高度復雜的數(shù)字孿生空間的構(gòu)建,以及現(xiàn)實世界和數(shù)字世界的實時交互,需要有強大且物理準確的高精度仿真算力和實時高清3D渲染算力作為支撐。隨著AI技術(shù)的發(fā)展,基于AI算法的高精仿真逐步替代了傳統(tǒng)基于數(shù)值求解算法的仿真系統(tǒng),成為了數(shù)字孿生系統(tǒng)的核心底層支撐技術(shù)。智算中心可以為大規(guī)模數(shù)字孿生提供專業(yè)化的算力和應用支持,支撐數(shù)字孿生空間的實時創(chuàng)建、復雜模型的高效運行,以及逼真仿真環(huán)境的快速生成。二、智算中心助力產(chǎn)業(yè)AI化走深向?qū)崳ㄒ唬┲腔坩t(yī)療國家統(tǒng)計局《2021年國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》顯示,2021年全年總診療人次85.3億人次,基本醫(yī)療保險覆蓋13.6億人。然而,各個地區(qū)醫(yī)療服務水平參差不齊,醫(yī)療服務資源不均等現(xiàn)象普遍存在,基層患者尤其是偏遠地區(qū)的患者難以獲得高質(zhì)量的醫(yī)療救治。AI輔助診斷助力解決診療“三大難題”當前,醫(yī)療診斷主要面臨三大挑戰(zhàn):一是數(shù)據(jù)量巨大。粗略估算診療人次所對應的就醫(yī)環(huán)節(jié)及相應的醫(yī)療數(shù)據(jù)質(zhì)量,加上血壓、心率、體重、心電圖等醫(yī)療監(jiān)測數(shù)據(jù),規(guī)模早已突破TB級,并且以“秒”為單位持續(xù)更新疊加,需要強有力的算力支撐平臺。二是數(shù)據(jù)結(jié)構(gòu)多元。不僅包含大量醫(yī)學術(shù)語、專業(yè)名稱,還包括文檔、影像、視頻等非結(jié)構(gòu)化數(shù)據(jù),對AI服務器等新型智能計算硬件要求較高。三是數(shù)據(jù)實時處理要求高。醫(yī)療服務中存在大量時間性強和決策周期短的應用場景,如臨床中的診療和用藥建議、健康指標預警等,對在線計算、實時處理的需求顯著,亟需構(gòu)建強大的算力平臺支撐基于醫(yī)療健康領(lǐng)域數(shù)據(jù)規(guī)?;R圖譜。醫(yī)療機構(gòu)通過引入AI輔助診療,可實現(xiàn)診斷、治療工作的智能化。從算力需求看,人工智能輔助診療應用涉及海量圖形數(shù)據(jù)的處理,所需的算力要求較高。智算中心具備的強大算力可以支持大規(guī)模、高難度的模型訓練,全方位支撐海量醫(yī)療影像數(shù)據(jù)的分析挖掘和精準診斷,能夠有效縮短診斷時間,提高診療效率。(二)文娛創(chuàng)作近年來,AI在文娛創(chuàng)作方面有諸多突破,通過融合人工智能、認知心理學、哲學和藝術(shù)等多個學科,可完成詩詞、繪畫、音樂、影視、小說等創(chuàng)作。人工智能正在逐漸改變文娛創(chuàng)作的發(fā)展范式對藝術(shù)家來說,靈感極為可貴并難以捕捉,當文娛創(chuàng)作
遇上人工智能,整個行業(yè)迸發(fā)出了全新的生機和活力。AI技術(shù)將是未來數(shù)字化創(chuàng)作的重要生產(chǎn)工具。當前出現(xiàn)的創(chuàng)作生態(tài)可分為專業(yè)生成內(nèi)容(ProfessionallyGeneratedContent,簡稱PGC)、用戶生成內(nèi)容(UserGeneratedContent,簡稱UGC)、AI輔助生產(chǎn)內(nèi)容和AIGC。其中,PGC和UGC都是以人為主體的創(chuàng)作模式,PGC是由專業(yè)人士進行內(nèi)容創(chuàng)作,成本較UGC降低了生產(chǎn)成本,滿足了個性化需求,但存在不可控因素。從長期來看,數(shù)字內(nèi)容生成的需求會愈發(fā)強烈,但是人腦處理信息的能力有限,當以人力為主的內(nèi)容生產(chǎn)潛力逐漸消耗殆盡,以AI為主的內(nèi)容生產(chǎn)模式將彌補數(shù)字世界內(nèi)容供需的缺口。Gartner數(shù)據(jù)顯示,到2023年將有20%的內(nèi)容由AI創(chuàng)作生成,預計到2025年生成式AI產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%。AIGC將成為數(shù)字內(nèi)容生產(chǎn)的長期發(fā)展方向AIGC是一種通過生成對抗網(wǎng)絡、深度學習、大型預訓練模型等人工智能技術(shù)挖掘數(shù)據(jù)中的規(guī)律,并通過適當?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。深度學習技術(shù)(如深度學習模型CLIP等)的突破為AIGC商業(yè)落地提供了可能,而數(shù)字內(nèi)容、數(shù)字資產(chǎn)等領(lǐng)域的快速發(fā)展又進一步加速了AIGC的應用與優(yōu)化。利用AIGC技術(shù)可以生成多種模態(tài)的數(shù)字作品,如AI寫作(文本)、AI繪畫(圖像)、AI作曲(音頻)、AI換臉(視頻)等。同時,AIGC技術(shù)也可以實現(xiàn)由文字生成圖像、文字生成視頻、圖像/GameAI類綜合型場景創(chuàng)作。AIGC的出現(xiàn)使數(shù)字內(nèi)容創(chuàng)作的生產(chǎn)效率和互動性得到了進一步提升。隨著人工智能技術(shù)的不斷升級以及算力、數(shù)據(jù)、算法等要素的持續(xù)迭代,未來AIGC技術(shù)將持續(xù)賦能各類文化創(chuàng)意、生產(chǎn)生活,為數(shù)字內(nèi)容生產(chǎn)帶來巨大AI大模型和開放平臺為文娛創(chuàng)作提供技術(shù)支撐隨著各類AI大模型及支持開發(fā)者創(chuàng)作的各類AI陸續(xù)上線,用戶可以獲取涵蓋開源模型API、高質(zhì)量中文數(shù)據(jù)集、模型訓練代碼、推理代碼、應用代碼、面向AI芯片的模型移植開發(fā)等內(nèi)容的多場景服務。大模型開放平臺的出現(xiàn)極大地降低了文娛類AI應用的開發(fā)門檻,即使是幾乎沒有任何編程經(jīng)驗的文娛創(chuàng)作者,通過在平臺上進行簡單學習,也可以快速實現(xiàn)文娛類AI應用的開發(fā)。AI大模型和AI開源
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 初中物理實驗班《大氣壓強實驗操作指導》
- 企業(yè)服務質(zhì)量管理實戰(zhàn)指南
- 工作流程優(yōu)化辦公空間需求表
- 項目執(zhí)行過程中的經(jīng)驗教訓總結(jié)與成果展示
- 寓言故事中的社會現(xiàn)象解讀與反思
- 藝術(shù)創(chuàng)作繪畫技巧知識題庫
- 智能制造產(chǎn)業(yè)鏈協(xié)同合作協(xié)議
- 制造業(yè)自動化技術(shù)應用題庫
- 企業(yè)研發(fā)新產(chǎn)品試制合同
- 商務會議中的合作往來文書范本
- 硬筆書法全冊教案共20課時
- 人民幣上的風景名勝課件
- 小學雙減作業(yè)設計小學語文五年級下冊第八單元作業(yè)設計案例
- 2.0MWp屋頂太陽能分布式光伏發(fā)電項目監(jiān)理大綱2
- 山的飛花令經(jīng)典1000首小學
- 煉油廠化工廠車間崗位勝任力素質(zhì)模型設計
- 電子課件-《市場營銷》-A45-2298完整版教學課件全書電子講義(最新)
- 紅土鎳礦濕法冶煉技術(shù)綜述
- 隧道開挖作業(yè)臺車計算書
- 水利水電工程金屬結(jié)構(gòu)與機電設備安裝安全技術(shù)規(guī)程
- 新視野大學英語讀寫譯4U校園第一單元課后測試答案
評論
0/150
提交評論