版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
智算中心作為信息基礎(chǔ)設(shè)施的重要組成部分,通過算力的生產(chǎn)、聚合、調(diào)度和釋放,能夠?yàn)榭焖僭鲩L的人工智能算力需求提供基礎(chǔ)支撐,在推進(jìn)AI產(chǎn)業(yè)化、賦能產(chǎn)業(yè)AI化、助力治理智能化、促進(jìn)產(chǎn)業(yè)集群化等方面具有顯著作用,是數(shù)字經(jīng)濟(jì)時代促進(jìn)科技創(chuàng)新、優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、提升國家競爭力的重要支撐。中國智算中心產(chǎn)業(yè)迎來重要發(fā)展機(jī)遇。工業(yè)和信息化部、中央網(wǎng)信辦、教育部、國家衛(wèi)生健康委、中國人民銀行、國務(wù)院國資委等六部門聯(lián)合印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》明確提出,到2025年,我國算力規(guī)模超過300EFLOPS,智能算力占比達(dá)到35%。在政策指引與市場需求的共同推動下,智算中心產(chǎn)業(yè)進(jìn)入快速發(fā)展期,大批智算中心項(xiàng)長。未來,隨著人工智能、大數(shù)據(jù)等新興技術(shù)驅(qū)動下的應(yīng)用場景日益豐富,AI硬件、算力服務(wù)、模型應(yīng)用等產(chǎn)業(yè)鏈重要環(huán)節(jié)的商業(yè)模式不斷創(chuàng)新發(fā)展,智算中心產(chǎn)業(yè)生態(tài)將加速形成,并向供給優(yōu)化、數(shù)實(shí)融合、綠色低碳、產(chǎn)業(yè)協(xié)同等方向演進(jìn)。為深入剖析中國智算中心產(chǎn)業(yè)發(fā)展現(xiàn)狀,精準(zhǔn)把握智算中心產(chǎn)業(yè)未來發(fā)展態(tài)勢,中國通信工業(yè)協(xié)會數(shù)據(jù)中心委員會集合智算中心產(chǎn)業(yè)專家資源和產(chǎn)業(yè)鏈力量,聯(lián)合發(fā)布《中國智算中心產(chǎn)業(yè)發(fā)展白皮書(2024)》。本白皮書立足于我國智算中心產(chǎn)業(yè)實(shí)際,展望未來,為共創(chuàng)智能計算新時代、建設(shè)數(shù)字中國貢獻(xiàn)力量。本白皮書全面梳理我國智算中心產(chǎn)業(yè)發(fā)展的現(xiàn)狀、趨勢、機(jī)遇與挑戰(zhàn),系統(tǒng)剖析智算中心建設(shè)、運(yùn)營面臨的新形勢、新要求,希望為智算中心產(chǎn)業(yè)相關(guān)管理機(jī)構(gòu)、行業(yè)協(xié)會、產(chǎn)業(yè)從業(yè)者等提供參考。3中國通信工業(yè)協(xié)會數(shù)據(jù)中心委員會張家口市人民政府蕪湖市人民政府韶關(guān)市人民政府烏蘭察布市人民政府慶陽市人民政府大同市人民政府內(nèi)蒙古和林格爾新區(qū)管理委員會中國長江三峽集團(tuán)有限公司中科院建筑設(shè)計研究院有限公司中國建設(shè)銀行股份有限公司北京科智咨詢有限公司上海寶信數(shù)據(jù)中心有限公司秦淮數(shù)據(jù)集團(tuán)北京數(shù)道智算科技有限公司北京世紀(jì)互聯(lián)寬帶數(shù)據(jù)中心有限公司科華數(shù)據(jù)股份有限公司科大訊飛股份有限公司河南昆侖技術(shù)有限公司潤澤科技發(fā)展有限公司博大數(shù)據(jù)服務(wù)(深圳)有限公司聯(lián)想(北京)有限公司北京中科合盈數(shù)據(jù)科技有限公司南方電網(wǎng)大數(shù)據(jù)服務(wù)有限公司聯(lián)通(廣東)產(chǎn)業(yè)互聯(lián)網(wǎng)有限公司杭州星臨科技有限責(zé)任公司廣東美的暖通設(shè)備有限公司四川省天府云數(shù)據(jù)科技有限責(zé)任公司北京泰豪智能工程有限公司濰柴重機(jī)股份有限公司中電系統(tǒng)建設(shè)工程有限公司恒華數(shù)字科技集團(tuán)有限公司深圳市中電電力技術(shù)股份有限公司廣州市匯源通信建設(shè)監(jiān)理有限公司中建三局第一建設(shè)安裝有限公司雙登集團(tuán)股份有限公司蘭洋(寧波)科技有限公司廣州尚航信息科技股份有限公司華章數(shù)據(jù)技術(shù)有限公司中世順科技(北京)股份有限公司潤建股份有限公司浙江潔普智匯能源科技有限公司廣東申菱環(huán)境系統(tǒng)股份有限公司鵬博士電信傳媒集團(tuán)股份有限公司盛達(dá)全球暢服(深圳)科技有限公司公誠管理咨詢有限公司金和平張福林張曉雪潘建初甄鑒張澤銳趙文博方虹珺周超輝孫東旺許志德鄧國峰王元月于景淇郭俊峰鞠昌斌任國斌楊彥超張學(xué)超唐巨光周洪聰周科翔蘭滿桔張勁松邵南軍侯興澤5一、智算中心產(chǎn)業(yè)發(fā)展背景及內(nèi)涵 (一)智算中心產(chǎn)業(yè)發(fā)展背景 (二)智算中心產(chǎn)業(yè)內(nèi)涵 二、全球智算產(chǎn)業(yè)步入快速發(fā)展新階段… (一)人工智能驅(qū)動智算規(guī)模擴(kuò)張… (二)AI芯片技術(shù)迭代奠定智算基礎(chǔ) (三)大模型加速人工智能與產(chǎn)業(yè)融合… 三、中國智算中心產(chǎn)業(yè)迎來黃金發(fā)展期 (一)新型基礎(chǔ)設(shè)施賦能數(shù)字經(jīng)濟(jì)發(fā)展 (二)政策推動智算中心合理有序建設(shè) (三)大模型應(yīng)用深化行業(yè)數(shù)字化轉(zhuǎn)型 四、中國智算中心產(chǎn)業(yè)發(fā)展現(xiàn)狀 (一)智算中心市場規(guī)模持續(xù)擴(kuò)大 (二)各類投資主體積極投建智算中心 (三)智算中心商業(yè)模式不斷演進(jìn)… (四)產(chǎn)業(yè)發(fā)展持續(xù)踐行綠色低碳理念… 五、AI時代算力中心建設(shè)開啟新篇章 (一)人工智能發(fā)展對算力中心建設(shè)提出更高要求 (二)技術(shù)創(chuàng)新加速AI硬件國產(chǎn)替代 (三)高效網(wǎng)絡(luò)架構(gòu)推動算網(wǎng)融合… (四)功率密度提升促進(jìn)高效制冷實(shí)踐 (五)新型供配電系統(tǒng)重塑能源應(yīng)用 六、智算中心運(yùn)營服務(wù)向高效安全方向發(fā)展 (一)算力資源高效調(diào)度 (二)數(shù)據(jù)安全多重保障 (三)運(yùn)維平臺智能可視 七、中國智算中心產(chǎn)業(yè)發(fā)展展望與倡議… (一)中國智算中心產(chǎn)業(yè)發(fā)展展望 (二)中國智算中心產(chǎn)業(yè)發(fā)展倡議… 附:中國智算中心典型項(xiàng)目案例 圖表1:中國智算中心產(chǎn)業(yè)鏈 圖表2:中國智算中心相關(guān)政策梳理 圖表3:2020-2028年中國智算中心市場規(guī)模及預(yù)測 圖表4:中國投運(yùn)/在建/規(guī)劃智算中心項(xiàng)目區(qū)域分布 圖表5:中國智算中心項(xiàng)目主體分布(按項(xiàng)目數(shù)量)… 圖表6:中國智算中心項(xiàng)目主體分布(按算力規(guī)模)… 圖表7:智算中心建設(shè)主體類別及優(yōu)劣勢 圖表8:智算中心商業(yè)模式類別 圖表9:智算中心總體架構(gòu) 圖表10:AI芯片(GPU、FPGA、ASIC)主要特點(diǎn) 圖表11:主流高性能芯片特性對比 圖表12:InfiniBand和ROCE方案比較 圖表13:數(shù)據(jù)中心液冷技術(shù)方案對比 圖表14:中國高性能算力中心先進(jìn)制冷方案應(yīng)用案例 圖表15:算力資源調(diào)度與管理架構(gòu) 人工智能作為引領(lǐng)未來的戰(zhàn)略性技術(shù),逐步成為衡量國家國際競爭力的重要領(lǐng)域,高性能算力是人工智能發(fā)展的重要組成部分。從全球范圍看,各國紛紛制定人工智能相關(guān)的戰(zhàn)略和政策,推動高性能算力發(fā)展。如美國成立智算中心基礎(chǔ)設(shè)施特別工作組、歐盟出臺《歐洲高性能計算共同計劃》、日本發(fā)布《人工智能戰(zhàn)略2022》等。在當(dāng)前復(fù)雜的國際競爭形勢下,發(fā)展人工智能產(chǎn)業(yè),有利于在新一輪國際科技競爭中掌握主導(dǎo)權(quán)。我國高度重視人工智能發(fā)展,黨的十八大以來,不斷完善人工智能發(fā)展頂層設(shè)計。自2017年,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,明確堅(jiān)持人工智能研發(fā)攻關(guān)、產(chǎn)品應(yīng)用和產(chǎn)業(yè)培育"三位一體"推進(jìn),全面支撐科技、經(jīng)濟(jì)、社會發(fā)展和國家安全,部署構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢,加快建設(shè)創(chuàng)新型國家和世界科技強(qiáng)國。到2024年,全國兩會政府工作報告強(qiáng)調(diào)人工智能在推動經(jīng)濟(jì)社會發(fā)展中的重要作用,提出強(qiáng)化基礎(chǔ)研究、拓展應(yīng)用領(lǐng)域、加強(qiáng)人才培養(yǎng)等,促進(jìn)人工智能與實(shí)體經(jīng)濟(jì)深度融合。國家在政策層面全方位推進(jìn)人工智能產(chǎn)業(yè)發(fā)展。智算中心是人工智能發(fā)展的關(guān)鍵基礎(chǔ)設(shè)施,是帶動社會科技創(chuàng)新、經(jīng)濟(jì)發(fā)展以及社會治理水平提升,賦能全產(chǎn)業(yè)鏈發(fā)展的重要力量。智算中心能夠?yàn)榛A(chǔ)研究和應(yīng)用開發(fā)提供先進(jìn)計算能力,同時加速5G、大數(shù)據(jù)等新一代信息技術(shù)的迭代發(fā)展;推動人工智能與各行業(yè)融合創(chuàng)新,推動制造、教育、金融、能源等9領(lǐng)域的數(shù)字化轉(zhuǎn)型,提升產(chǎn)業(yè)發(fā)展數(shù)字化智能化水平;促進(jìn)人才培養(yǎng)和資源整合,加快地區(qū)人工智能產(chǎn)業(yè)集聚發(fā)展;助力智慧城市建設(shè)、公共安全保障和政務(wù)服務(wù)優(yōu)化,提升社會治理水平。智算中心產(chǎn)業(yè)成為我國提升國際競爭力、建設(shè)創(chuàng)新型國家的重要支撐。自生成式人工智能問世以來,國內(nèi)人工智能大模型快速發(fā)展。截至2024年11月,國家網(wǎng)信辦備案的生成式人工智能大模型已達(dá)到252個,通用大模型和垂類應(yīng)用大模型訓(xùn)練的智算算力需求迅速增加。目前,通用大模型和垂類應(yīng)用大模型的已經(jīng)逐步商用,開始賦能千行百業(yè)。未來,人工智能大模型與產(chǎn)業(yè)必將走向深度融合,產(chǎn)業(yè)智算算力需求將得到充分釋放。在人工智能快速發(fā)展的帶動下,智算中心產(chǎn)業(yè)投資迅速增加。截至2024年11月,全國已投運(yùn)的智算中心項(xiàng)目近150個,在建及規(guī)劃建設(shè)的智算中心項(xiàng)目近400個。智算中心是基于人工智能計算架構(gòu),提供人工智能應(yīng)用所需算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)的算力基礎(chǔ)設(shè)施,融合高性能計算設(shè)備、高速網(wǎng)絡(luò)以及先進(jìn)的軟件系統(tǒng),為人工智能訓(xùn)練和推理提供高效、穩(wěn)定的計算環(huán)境。智算中心的主要功能包括:提供強(qiáng)大的計算能力:智算中心采用專門的AI算力硬件,如GPU、NPU、TPU等,以支持高效的AI計算任務(wù)。高效的數(shù)據(jù)處理:智算中心融合了高性能計算設(shè)備和高速網(wǎng)絡(luò),能夠處理大規(guī)模的數(shù)據(jù)集和復(fù)雜的計算任務(wù)。支持多種AI應(yīng)用:智算中心適用于計算機(jī)視覺、自然語言處理、機(jī)器學(xué)習(xí)狹義上,智算中心是通用算力中心的升級,在傳統(tǒng)機(jī)房的基礎(chǔ)上部署AI算力以提供服務(wù)。廣義地說,智算中心是提供人工智能應(yīng)用所需算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)的新型算力基礎(chǔ)設(shè)施,包含基礎(chǔ)層、平臺層和應(yīng)用層。其中,基礎(chǔ)部分是支撐智算中心建設(shè)與應(yīng)用的先進(jìn)人工智能理論和計算架構(gòu);平臺部分圍繞智算中心算力生產(chǎn)、聚合、調(diào)度、釋放的作業(yè)邏輯展開;應(yīng)用層提供算力生產(chǎn)供應(yīng)、數(shù)據(jù)開放共享、智能生態(tài)建設(shè)和產(chǎn)業(yè)創(chuàng)新聚集。智算中心產(chǎn)業(yè)鏈涵蓋從AI芯片/服務(wù)器等設(shè)計制造、基礎(chǔ)設(shè)施建設(shè),到智算服務(wù)提供,以及生成式大模型研發(fā)及基于大模型的行業(yè)應(yīng)用。在上游環(huán)節(jié),主要包括土建基礎(chǔ)設(shè)施和IT基礎(chǔ)架構(gòu)的建設(shè)。土建基礎(chǔ)設(shè)施涵蓋土建施工、制冷系統(tǒng)、供配電系統(tǒng)和電信運(yùn)營等,為智算中心提供穩(wěn)定可靠的物理環(huán)境;IT基礎(chǔ)架構(gòu)包括芯片設(shè)計制造、AI服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備和數(shù)據(jù)中心管理系統(tǒng)等,它們共同構(gòu)成智算中心的計算、存儲和通信基礎(chǔ)。AI芯片作為智能算力的核心,技術(shù)壁壘高,在GPU、FPGA、TPU、NPU等細(xì)分領(lǐng)在中游環(huán)節(jié),智算服務(wù)提供商、云服務(wù)供應(yīng)商和IDC服務(wù)商等基于自身優(yōu)勢,提供智算服務(wù)及運(yùn)維解決方案。主流云服務(wù)供應(yīng)商不僅自建大型智算中心,還加速布局AI大模型,以提供更高效、更智能的服務(wù)。IDC服務(wù)商也依托云網(wǎng)資源優(yōu)勢參與智算建設(shè),提供智算、超算、通算等多樣化的算力服務(wù)及一體化運(yùn)維解決方案。部分云服務(wù)商與科技公司利用自身技術(shù)壁壘提供大模型及平臺服務(wù),為下游用戶提供更加豐富、智能的算力服務(wù)。動駕駛、機(jī)器人、元宇宙、智慧醫(yī)療、文娛創(chuàng)作、智慧科研等相關(guān)產(chǎn)業(yè)發(fā)展。通過提供智能算力和算法,加速新技術(shù)的研發(fā)和商業(yè)化進(jìn)程,推動產(chǎn)業(yè)創(chuàng)新進(jìn)步。隨著各行業(yè)積極探索生成式人工智能應(yīng)用創(chuàng)新點(diǎn),大模型應(yīng)用場景逐步拓展。在海外市場,大模型主要在傳媒、游戲、機(jī)器人、辦公等領(lǐng)域落地應(yīng)用。國內(nèi)市場大模型應(yīng)用則主要聚焦于金融、醫(yī)療、傳媒、游戲、汽車等領(lǐng)域。全球智算產(chǎn)業(yè)步入快速發(fā)展新階段大模型參數(shù)量實(shí)現(xiàn)指數(shù)級增長,推理和訓(xùn)練以海量數(shù)據(jù)為基礎(chǔ),全球范圍內(nèi)大模型應(yīng)用推動數(shù)據(jù)量激增,數(shù)據(jù)類型和來源更加豐富。在數(shù)據(jù)量、大模型復(fù)雜算法以及應(yīng)用場景的推動下,承載AI計算能力的智算中心進(jìn)入快速擴(kuò)張階段。國際科技巨頭微軟、谷歌、亞馬遜,國內(nèi)互聯(lián)網(wǎng)企業(yè)阿里、騰訊、字節(jié)跳動,以及基礎(chǔ)電信運(yùn)營商等,紛紛在全球多個區(qū)域建設(shè)智能計算中心以拓展AI云服務(wù)或滿足自身AI業(yè)務(wù)發(fā)展需求,其他各類主體也積極投資建設(shè)智算中心。2023年全球智能算力規(guī)模增速超過算力總規(guī)模增速,隨著技術(shù)的不斷進(jìn)步和需求的持續(xù)擴(kuò)大,智算中心建設(shè)加速推進(jìn),智能算力將繼續(xù)保持快速增長勢頭。高性能芯片技術(shù)快速迭代創(chuàng)新,為人工智能發(fā)展提供保障,進(jìn)而帶動智算中心發(fā)展。Nvidia作為全球GPU算力芯片市場領(lǐng)導(dǎo)者,代表性產(chǎn)品V100、A100、H100技術(shù)指標(biāo)處于領(lǐng)先水平,最新產(chǎn)品BlQckwellGPU采用先進(jìn)的4納米工藝,提供高達(dá)20petaflops的FP4運(yùn)算能力。其他科技巨頭如AMD、英特爾、微軟、亞馬遜和谷歌也在AI芯片領(lǐng)域展開競爭。同時,中國AI芯片國產(chǎn)化進(jìn)程正加速發(fā)展,華為、寒武紀(jì)、海光信息、景嘉微以及阿里、百度等企業(yè)不僅在自研AI芯片技術(shù)上取得重要進(jìn)展,還通過產(chǎn)品集成、行業(yè)解決方案及生態(tài)伙伴合作等方式推動國產(chǎn)AI芯片商業(yè)化應(yīng)用,為智能算力發(fā)展提供堅(jiān)實(shí)基礎(chǔ)。隨著人工智能技術(shù)的快速發(fā)展,以及人工智能與5G、物聯(lián)網(wǎng)、邊緣計算等技術(shù)的不斷融合,高性能芯片也將迎來技術(shù)創(chuàng)新的新高潮。生成式人工智能應(yīng)用蓬勃發(fā)展。隨著AIGC技術(shù)不斷進(jìn)步,大模型商業(yè)化應(yīng)用場景從文生文、文生圖應(yīng)用逐步擴(kuò)展至音頻生成、視頻生成、多模態(tài)生成類,以及面向不同行業(yè)領(lǐng)域或用戶群體的工具類應(yīng)用,如代碼生成、copilot、數(shù)字人、營銷工具、聊天助手等。通用大模型適用性廣,包括chatGPT、訊飛星火認(rèn)業(yè)、基礎(chǔ)電信運(yùn)營商、大型央國企等正加速推動垂類大模型研發(fā)落地。據(jù)測算,2024年全球生成式人工智能市場規(guī)模將達(dá)到400億美元,到2030年有望增長到1.5萬億美元,2022-2030年復(fù)合年增長率高達(dá)83%。未來AIGC將加速在更多場景商業(yè)化落地,如廣告、游戲、自媒體等內(nèi)容創(chuàng)作領(lǐng)域以及金融、電迎來黃金發(fā)展期智算中心是基于最新人工智能理論,采用領(lǐng)先的人工智能計算架構(gòu),提供人工智能應(yīng)用所需算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)的新型算力基礎(chǔ)設(shè)施。智算中心以算力技術(shù)和算法模型為關(guān)鍵核心,算力技術(shù)以AI芯片、AI服務(wù)器、AI集群為載體,算法模型則以AI大模型為主要代表。智算中心在提供高效算力資源和服務(wù)的基礎(chǔ)上,聚焦區(qū)域產(chǎn)業(yè)創(chuàng)新發(fā)展。智算中心項(xiàng)目具有良好的社會經(jīng)濟(jì)效益,對技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展的帶動作用明顯。根據(jù)國家信息中心數(shù)據(jù),在智算中心實(shí)現(xiàn)80%應(yīng)用水平的情況下,城市/地區(qū)在智算中心建設(shè)投入的增長量對創(chuàng)新產(chǎn)出的貢獻(xiàn)率約為14%17%;預(yù)計2020年至2030年我國人工智能核心產(chǎn)業(yè)規(guī)模的年均復(fù)合增長率達(dá)20.9%,帶動相關(guān)產(chǎn)業(yè)規(guī)模的年均復(fù)合增長率達(dá)25.9%政府高度重視智算中心建設(shè),密集出臺相關(guān)政策。為推動智算中心有序發(fā)展,國家出臺多項(xiàng)政策統(tǒng)籌建設(shè)面向人工智能領(lǐng)域的算力和算法中心,打造智能算力、通用算法和開發(fā)平臺一體化的新型智能基礎(chǔ)設(shè)施。各地政府積極響應(yīng),紛紛發(fā)布相關(guān)政策加快智算中心產(chǎn)業(yè)發(fā)展。智算政策聚焦關(guān)鍵領(lǐng)域,如高端高效智能經(jīng)濟(jì)、安全便捷智能社會建設(shè)等,著力打造人工智能重點(diǎn)應(yīng)用場景,推動智算中心在關(guān)鍵領(lǐng)域的應(yīng)用和普及,促進(jìn)數(shù)字化轉(zhuǎn)型。2017年《新一代人工智能發(fā)展規(guī)劃》出臺,首次將智能計算中心提升到國家戰(zhàn)略層面,明確提出"建立人工智能超級計算中心"的戰(zhàn)略目標(biāo)中心的發(fā)展奠定政策基礎(chǔ)。2020年,國家發(fā)改委將智能計算中心納入新型基礎(chǔ)設(shè)施建設(shè)范疇,激發(fā)各地智算中心投資熱情。在政策推動下,多地政府開始積極落地智能計算中心項(xiàng)目,智算中心進(jìn)入快速擴(kuò)張期。2022年"東數(shù)西算"工程實(shí)施以來,國家政策明確對全國算力資源進(jìn)行統(tǒng)籌和智能調(diào)度,對智能計算中心發(fā)展的引導(dǎo)力度進(jìn)一步加強(qiáng)。2024年9月,工信部等十一部門發(fā)布《關(guān)于推動新型信息基礎(chǔ)設(shè)施協(xié)調(diào)發(fā)展有關(guān)事項(xiàng)的通知》,強(qiáng)調(diào)逐步提升智能算力占比,東部發(fā)達(dá)地區(qū)先行先試、探索5G-A、人工智能等建設(shè)和應(yīng)用新模式,西部地區(qū)在綜合成本優(yōu)勢明顯地區(qū)合理布局重大算力設(shè)施,探索建設(shè)超大型人工智能訓(xùn)練算力設(shè)施。圖表2:中國智算中心相關(guān)政策梳理2017.8國務(wù)院《新一代人工智能發(fā)展規(guī)劃》布局前沿基礎(chǔ)理論研究,建立新一代人工智能關(guān)鍵共性技術(shù)體系,統(tǒng)籌布局人工智能創(chuàng)新平臺,建立人工智能超級計算中心、大規(guī)模超級智能計算支撐環(huán)境2020.4國家發(fā)改委新聞施、融合基礎(chǔ)設(shè)施、創(chuàng)新基礎(chǔ)設(shè)施三個方面信息基礎(chǔ)設(shè)施包括以數(shù)據(jù)中心、智能計算中心為代表的算力基礎(chǔ)設(shè)施等。2021.1國務(wù)院《建設(shè)高標(biāo)準(zhǔn)市案》加大新型基礎(chǔ)設(shè)施投資力度,推動第五代移動通信、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施,人工智智能計算中心等算力基礎(chǔ)設(shè)施建設(shè)。2021.7工信部《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》加快提升算力算效水平。引導(dǎo)新型數(shù)據(jù)中心集約化高密化、智能化建設(shè),穩(wěn)步提高數(shù)據(jù)中心單體規(guī)模、單機(jī)架功率,加快高性能、智能計算中心部署,推動CPU、GPU等異構(gòu)算力提升,逐步提高自主研發(fā)算力的部署比例,推進(jìn)新型數(shù)據(jù)中心算力供應(yīng)多元化,支撐各類智能應(yīng)用。強(qiáng)化標(biāo)準(zhǔn)支撐引領(lǐng)。加快推進(jìn)邊緣數(shù)據(jù)中心、智能計算中心等標(biāo)準(zhǔn)建設(shè),支撐新技術(shù)新應(yīng)用落地。2021.12全和信息化委員會《"十四五"國家信息化規(guī)劃》加強(qiáng)信息技術(shù)專利創(chuàng)新。圍繞大數(shù)據(jù)中心、智能計算中心等領(lǐng)域加強(qiáng)高價值專利培育。構(gòu)建云網(wǎng)融合的新型算力設(shè)施。統(tǒng)籌建設(shè)面向區(qū)塊鏈和人工智能等的算力和算法中心。2021.12國務(wù)院《"十四五"數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》推動智能計算中心有序發(fā)展,打造智能算力、通用算法和開發(fā)平臺一體化的新型智能基礎(chǔ)設(shè)施,面向政務(wù)服務(wù)、智慧城市、智能制造、自動駕駛、語言智能等重點(diǎn)新興領(lǐng)域,提供體系化的人工智能服務(wù)。2022.1國務(wù)院《關(guān)于印發(fā)全國一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南的通知》鼓勵各地區(qū)各部門推進(jìn)數(shù)據(jù)基礎(chǔ)能力建設(shè),積極構(gòu)建數(shù)據(jù)安全存儲、數(shù)據(jù)存證、隱私計算等支撐體系,推動大數(shù)據(jù)挖掘分析、智能計算、數(shù)據(jù)安全與隱私保護(hù)等核心技術(shù)攻關(guān)。2022.8科技部、財《企業(yè)技術(shù)創(chuàng)新能力提升行動方案(2022-2023年)》推動國家超算中心,智能計算中心等面向企業(yè)提供低成本算力服務(wù)。2022.11國務(wù)院《關(guān)于數(shù)字經(jīng)濟(jì)算力基礎(chǔ)設(shè)施達(dá)到世界領(lǐng)先水平。建成一批國家新一代人工智能公共算力開放創(chuàng)新平臺,以低成本算力服務(wù)支撐中小企業(yè)發(fā)展需求。2023.2國務(wù)院《數(shù)字中國建設(shè)整體布局規(guī)劃》系統(tǒng)優(yōu)化算力基礎(chǔ)設(shè)施布局,促進(jìn)東西部算力高效互補(bǔ)和協(xié)同聯(lián)動,引導(dǎo)通用數(shù)據(jù)中心、超算中心、智能計算中心、邊緣數(shù)據(jù)中心等合理梯次布局。2024.9工信部等十《關(guān)于推動新型信息基礎(chǔ)設(shè)施協(xié)調(diào)發(fā)展有關(guān)事項(xiàng)的通知》優(yōu)化布局算力基礎(chǔ)設(shè)施,引導(dǎo)面向全國、區(qū)域提供服務(wù)的大型及超大型數(shù)據(jù)中心、智能計算中心、超算中心在樞紐節(jié)點(diǎn)部署。逐步提升智能算力占比。達(dá)地區(qū)先行先試、探索5G-A、人工智能等建設(shè)和應(yīng)用新模式,西部地區(qū)在綜合成本優(yōu)勢明顯地區(qū)合理布局重大算力設(shè)施,探索建設(shè)超大型人工智能訓(xùn)練算力設(shè)施。信息來源:科智咨詢整理人工智能大模型在數(shù)量、類別、參數(shù)方面不斷發(fā)展,效率和能力不斷提升,為千行百業(yè)數(shù)字化轉(zhuǎn)型提供人工智能解決方案。截至2024年7月底,全國范圍內(nèi)已有197個生成式人工智能服務(wù)完成備案,10億參數(shù)規(guī)模以上大模型數(shù)量已超100個。通用大模型任務(wù)處理能力不斷提升,文本理解和生成能力增強(qiáng),圖像識別更加精準(zhǔn);行業(yè)大模型深耕專業(yè)場景,百度、騰訊、華為、京東、網(wǎng)易等企業(yè)已發(fā)布適用于特定領(lǐng)域的行業(yè)大模型,提高業(yè)務(wù)效率。在參數(shù)方面,大語言模型的參數(shù)規(guī)模已從億增長到千億,甚至達(dá)到萬億級別,模型的計算效率和性能也逐步提高,在推動經(jīng)濟(jì)社會數(shù)字化轉(zhuǎn)型方面發(fā)揮重要作用。目前,人工智能大模型正在由開發(fā)階段步入行業(yè)應(yīng)用階段,為金融、醫(yī)療、教育、制造、交通、能源等多個行業(yè)的數(shù)字化轉(zhuǎn)型提供了有力支撐。企業(yè)可利用大模型對數(shù)據(jù)進(jìn)行深度挖掘,優(yōu)化業(yè)務(wù)流程,提高運(yùn)營效率。如制造業(yè)大模型可以用于生產(chǎn)線故障預(yù)測、生產(chǎn)計劃優(yōu)化等,從而降低生產(chǎn)成本,提高生產(chǎn)效率。金融機(jī)構(gòu)可利用大模型創(chuàng)新業(yè)務(wù)模式,制定金融產(chǎn)品開發(fā)策略,并為客戶提供分析和建議等。在教育、娛樂等領(lǐng)域,大模型可提供智能問答、個性化推薦等服務(wù),滿足用戶需求。在需求推動下中國智算中心市場投資規(guī)模高速增長。2022年生成式人工智能大模型推向市場,在國內(nèi)引起AIGC發(fā)展熱潮,大模型訓(xùn)練對智能算力的需求迅速攀升。2023年起國內(nèi)頭部互聯(lián)網(wǎng)企業(yè)及科技公司加速AIGC布局,政府也牽頭建設(shè)公共智能算力中心,賦能社會數(shù)字化轉(zhuǎn)型需求,全國智算中心投資火熱,智算中心市場規(guī)模大幅增長。2023年中國智算中心市場投資規(guī)模達(dá)879億,同比增長90%以上。預(yù)計2024年國產(chǎn)化芯片產(chǎn)能提升,智算算力供給瓶頸將逐漸緩解。未來,AI大模型應(yīng)用場景不斷豐富,商用進(jìn)程加快,智算中心市場增長動力逐漸由訓(xùn)練切換至推理,市場進(jìn)入平穩(wěn)增長期,預(yù)計2028年中國智算中心市場投資規(guī)模有望達(dá)到2886億元。圖表3:2020-2028年中國智算中心市場規(guī)模及預(yù)測(億元)注:智算中心市場規(guī)模包含算力(AI服務(wù)器)、存儲+網(wǎng)絡(luò)設(shè)備、基礎(chǔ)設(shè)施(機(jī)房、風(fēng)火水電等)、算法(軟件平臺、數(shù)據(jù)服務(wù))領(lǐng)域的投資。截至2024年8月,中國智算中心項(xiàng)目超過300個,已公布算力規(guī)模超50萬PFlops從已投用、在建、規(guī)劃的智算中心項(xiàng)目來看,全國各省智算中心總計300余個,約三分之一智算中心項(xiàng)目規(guī)劃算力大于500PFlops,主要為政府或基礎(chǔ)電信運(yùn)營商投建項(xiàng)目。2024年當(dāng)年投運(yùn)項(xiàng)目數(shù)量超過50個,60%以上為地方政府、國資平臺及電信運(yùn)營商項(xiàng)目,總計新增算力規(guī)模約為2萬PFlops。在區(qū)域分布上,智算中心項(xiàng)目主要集中在東部地區(qū)。中國智算中心產(chǎn)業(yè)發(fā)展具有明顯區(qū)域特征,東部地區(qū)集聚大量高科技企業(yè),"AI+行業(yè)"應(yīng)用進(jìn)程較快,為人工智能發(fā)展提供豐富的應(yīng)用場景和數(shù)據(jù)資源,智算需求集中。同時,大模型訓(xùn)練和推理通常涉及多卡構(gòu)成的算力集群,集群節(jié)點(diǎn)之間網(wǎng)絡(luò)通信壓力大,出于算力高效性和維護(hù)便利性考慮,當(dāng)前大量智算中心項(xiàng)目落地東部發(fā)達(dá)地區(qū)。截至2024年8月底,江蘇省智算中心項(xiàng)目數(shù)量最多,其次為廣東及山東省;京津冀、長三角及廣東省智算中心項(xiàng)目合計超過120個,占比超40%。圖表4:中國投運(yùn)/在建/規(guī)劃智算中心項(xiàng)目區(qū)域分布(截至2024年8月)大模型與行業(yè)深入融合發(fā)展,AI推理需求將快速提升,帶動一線城市、區(qū)域經(jīng)濟(jì)中心及周邊地區(qū)等智算中心部署。AI訓(xùn)練需求對于網(wǎng)絡(luò)時延要求相對推理較低,在大規(guī)模部署階段將更加注重經(jīng)濟(jì)性,將帶動基于AI訓(xùn)練的智算中心項(xiàng)目落地成本更低的"東數(shù)西算"西部集群地區(qū)。同時,近兩年政策強(qiáng)調(diào)統(tǒng)籌算力資源布局,推動區(qū)域協(xié)同發(fā)展。2024年8月《工業(yè)和信息化部等十一部門關(guān)于推動新型信息基礎(chǔ)設(shè)施協(xié)調(diào)發(fā)展有關(guān)事項(xiàng)的通知》提出,東部發(fā)達(dá)地區(qū)先行先試、探索5G-A、人工智能等建設(shè)和應(yīng)用新模式,中西部和東北地區(qū)加快千兆城市建設(shè),實(shí)現(xiàn)5G、千兆光網(wǎng)均衡發(fā)展,西部地區(qū)在綜合成本優(yōu)勢明顯地區(qū)合理布局重大算力設(shè)施,探索建設(shè)超大型人工智能訓(xùn)練算力設(shè)施。長期來看,智算中心市場發(fā)展重心將逐漸向中西部經(jīng)濟(jì)中心及東數(shù)西算集群地區(qū)轉(zhuǎn)移。根據(jù)智算中心項(xiàng)目數(shù)量統(tǒng)計,截至2024年8月,全國投運(yùn)、在建及規(guī)劃的智算中心中,地方政府和基礎(chǔ)電信運(yùn)營商主導(dǎo)建設(shè)的智算中心項(xiàng)目占比超過50%,互聯(lián)網(wǎng)及云廠商項(xiàng)目數(shù)量占比約為17.7%,地方政府及基礎(chǔ)電信運(yùn)營商是智算中心主要參與方。各地方政府一方面響應(yīng)國家戰(zhàn)略,優(yōu)化算力資源配置,實(shí)現(xiàn)東西部算力資源的高效互補(bǔ)和協(xié)同聯(lián)動;另一方面,智算中心作為數(shù)字時代區(qū)域基礎(chǔ)設(shè)施的重要組成部分,能夠?yàn)閰^(qū)域技術(shù)創(chuàng)新、產(chǎn)業(yè)轉(zhuǎn)型升級和數(shù)字經(jīng)濟(jì)發(fā)展提供重要支撐?;A(chǔ)電信運(yùn)營商兼具網(wǎng)絡(luò)提供商與算力中心服務(wù)商雙重身份,"東數(shù)西算"工程啟動后,基礎(chǔ)電信運(yùn)營加快建設(shè)智算中心,提供網(wǎng)絡(luò)及算力基礎(chǔ)設(shè)施支持。從業(yè)務(wù)發(fā)展層面看,電信運(yùn)營商在傳統(tǒng)業(yè)務(wù)增長放緩的情況下加大在算力領(lǐng)域的布局,著力發(fā)展業(yè)務(wù)第二增長曲線。圖表5:中國智算中心項(xiàng)目主體分布(按項(xiàng)目數(shù)量,截至2024年8月)從智算中心算力規(guī)模來看,互聯(lián)網(wǎng)及云廠商在智算中心投資建設(shè)中占據(jù)重要地位??萍季揞^在人工智能計算中心的建設(shè)中扮演重要角色,許多大型科技公司如阿里巴巴和騰訊,都在人工智能計算中心投入大量的資源?;ヂ?lián)網(wǎng)及云廠商建設(shè)的智算中心規(guī)模較大,多為萬卡集群,智算中心具備大規(guī)模、可擴(kuò)展性、綠色化等特征,滿足互聯(lián)網(wǎng)及云業(yè)務(wù)長遠(yuǎn)發(fā)展需求。企業(yè)主體在智算中心建設(shè)中可以提供強(qiáng)大的資金、技術(shù)支持和市場應(yīng)用,以及市場化的管理運(yùn)營機(jī)制,相比于政府等國資平臺更注重效率和效益,有助于提高智算中心的運(yùn)營效率和服務(wù)質(zhì)量。截至2024年8月,全國投運(yùn)、在建及規(guī)劃的智算中心中,互聯(lián)網(wǎng)及云廠商建設(shè)的智算中心規(guī)模占比超過30%,其次為基礎(chǔ)電信運(yùn)營商,占比約為25.6%。圖表6:中國智算中心項(xiàng)目主體分布(按算力規(guī)模,截至2024年8月)不同主體的智算中心功能定位及布局訴求存在差異。政府主導(dǎo)建設(shè)的人工智能計算中心主要服務(wù)于地方人工智能大模型研發(fā)應(yīng)用及相關(guān)領(lǐng)域數(shù)字化轉(zhuǎn)型,加速產(chǎn)業(yè)發(fā)展、城市治理、公共服務(wù)等各方面智能化進(jìn)程,推動智慧醫(yī)療、智慧交通、金融科技、無人駕駛等各領(lǐng)域數(shù)智化水平。基礎(chǔ)電信運(yùn)營商投資建設(shè)的智算中心成為政府算力基礎(chǔ)設(shè)施的良好補(bǔ)充,承擔(dān)國家算力網(wǎng)絡(luò)建設(shè)任務(wù)的同時滿足自身算力需要及算力業(yè)務(wù)拓展需求。大型云廠商如騰訊云、阿里云、百度云等,具有完善的供應(yīng)鏈資源、扎實(shí)的技術(shù)能力以及豐富的客戶資源,出于滿足集團(tuán)AI發(fā)展需求及云業(yè)務(wù)拓展考慮,建設(shè)智算中心。此外,浪潮、協(xié)鑫等產(chǎn)業(yè)上游供應(yīng)商,商湯等AI科創(chuàng)企業(yè),理想、小鵬等下游應(yīng)用企業(yè)等基于產(chǎn)圖表7:智算中心建設(shè)主體類別及優(yōu)劣勢地方政府響應(yīng)國家戰(zhàn)略,推動政策落地;促進(jìn)區(qū)域產(chǎn)業(yè)發(fā)展優(yōu)勢:政策、資金、產(chǎn)業(yè)園區(qū)客戶北京/上海/廣州/武漢/天津/重慶/長沙/南京/西安/成都/合肥等30多個城市劣勢:缺乏IT技術(shù)、供應(yīng)鏈經(jīng)驗(yàn)、運(yùn)營能力不足互聯(lián)網(wǎng)及云電信運(yùn)營商滿足自身大模型訓(xùn)練需求;拓展算力業(yè)務(wù)優(yōu)勢:充足的資金、技術(shù)和客戶資源,豐富的軟件供應(yīng)鏈資源,較成熟的云算力業(yè)務(wù)模式騰訊合肥智算中心/百度陽泉智算中心/阿里飛天云智能華東算力中心等;中國電信武清智算中心/中國聯(lián)通蕪湖智算中心/中國移動武漢智算中心等客戶形成競爭互斥第三方IDC尋求業(yè)務(wù)增長優(yōu)勢:豐富的IDC機(jī)房資源,IDC一體化建設(shè)運(yùn)營能力潤澤國際信息港A-11云博大數(shù)據(jù)深圳前海智算劣勢:缺乏IT供應(yīng)鏈資源和算力服務(wù)器廠商/芯片渠道商縱向一體化優(yōu)勢:AI芯片、服務(wù)器等硬件資源獲取能力協(xié)鑫智算(上海)中心浪潮新疆克拉瑪依智算劣勢:缺乏IDC供應(yīng)鏈和機(jī)房建設(shè)運(yùn)營能力AI企業(yè)、應(yīng)用企業(yè)縱向一體化優(yōu)勢:算法及相關(guān)軟件能力,客戶資源和應(yīng)用場景積累商湯臨港AIDC理想汽車智算中心劣勢:缺乏AI芯片貨源、IDC資源跨界企業(yè)戰(zhàn)略轉(zhuǎn)型/發(fā)展新業(yè)務(wù)優(yōu)勢:一般與芯片廠商、渠道商英博數(shù)科北京AI創(chuàng)新賦能中心威星智能貴安智算中心恒潤股份蕪湖智算中心劣勢:缺乏IDC資源和持續(xù)穩(wěn)定現(xiàn)階段,智能算力在快速增長的同時存在供需匹配問題,部分智能算力資源利用率較低。規(guī)劃和實(shí)際需求之間存在差距,如算力架構(gòu)設(shè)計不合理,或技術(shù)更新迭代后設(shè)備無法滿足新的計算要求,可能導(dǎo)致智算中心資源閑置。部分智算中心由于市場推廣不足或服務(wù)類型單一等,算力資源未能得到充分利用。智算需求具有場景多樣化、高度定制化特征,同時智算中心涵蓋從底層基礎(chǔ)設(shè)施到上層應(yīng)用各個方面,衍生出多元化的智算中心服務(wù)體系。智算中心服務(wù)包括機(jī)房托管服務(wù)、算力租賃服務(wù)、AI平臺服務(wù)、模型定制服務(wù)及AI應(yīng)用服務(wù)。圖表8:智算中心商業(yè)模式類別IQQS基礎(chǔ)設(shè)施機(jī)房托管服務(wù)在傳統(tǒng)數(shù)據(jù)中心機(jī)房托管基礎(chǔ)上,提供更高功耗、配電和網(wǎng)絡(luò)定制智算轉(zhuǎn)型的數(shù)據(jù)中心服務(wù)商、中立的智算中心服務(wù)商等頭部云商及AI公算力租賃服務(wù)以云服務(wù)形式租賃智能算力,按使用時間和規(guī)模收費(fèi)云廠轉(zhuǎn)型的智算服務(wù)商、中立的智算中心服務(wù)商等IT公司、非連續(xù)需求的科研機(jī)構(gòu)等PQQS平臺即服務(wù)AI平臺服務(wù)提供人工智能應(yīng)用開發(fā)工頭部IT公司中小企業(yè)和開發(fā)者M(jìn)QQS模型即服務(wù)模型定制服務(wù)模型定制、精調(diào)、部署等AI大模型全流程服務(wù)成熟的大模型供應(yīng)商(具有AI大模型技術(shù)能力)中小垂直行業(yè)企業(yè)saQS軟件即服務(wù)AI應(yīng)用服務(wù)直接應(yīng)用于企業(yè)業(yè)務(wù),提供人工智能分析、決策等服務(wù)具有AI能力的垂直行業(yè)頭部企業(yè)小型垂直行業(yè)企業(yè)機(jī)房托管服務(wù)與傳統(tǒng)數(shù)據(jù)中心服務(wù)模式類型相同,但需要面向智算的特點(diǎn)進(jìn)行深度定制。例如,為了滿足AI訓(xùn)練對高功耗、高密度計算的需求,智算中心的機(jī)房托管服務(wù)在功耗管理、配電系統(tǒng)、網(wǎng)絡(luò)架構(gòu)等方面進(jìn)行了優(yōu)化升級。算力租賃服務(wù)是指通過云服務(wù)的形式,將算力以按需付費(fèi)的方式提供給用戶,降低了算力使用的門檻和成本。這種服務(wù)模式不僅滿足了中小企業(yè)在研發(fā)、測試階段的算力需求,也為科研機(jī)構(gòu)提供了靈活、高效的算力支持。AI平臺服務(wù)提供基于智算能力的PQQS(平臺即服務(wù))服務(wù),主要包括人工智能應(yīng)用開發(fā)工具和平臺。這些工具和平臺通常包含了數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型評估、模型部署等全生命周期的管理功能,幫助開發(fā)者快速構(gòu)建、優(yōu)化和部署AI應(yīng)用。模型定制服務(wù)提供基于智算能力的MQQS(模型即服務(wù))層服務(wù),主要提供從模型定制、精調(diào)到部署的全方位服務(wù),這種服務(wù)模式不僅提高了AI模型的準(zhǔn)確性和效率,還為企業(yè)帶來了更大的商業(yè)價值。AI應(yīng)用服務(wù)是基于智算能力的SQQS(軟件即服務(wù))層服務(wù),SQQS層直接應(yīng)用于企業(yè)業(yè)務(wù)場景中,提供人工智能分析、決策等智能化服務(wù),供應(yīng)方通常為具有AI能力的垂直行業(yè)頭部企業(yè),這類企業(yè)基于自身在特定領(lǐng)域的深厚積累和專機(jī)柜托管以及算力租賃服務(wù)是當(dāng)前智算中心市場的主流商業(yè)模式。在產(chǎn)業(yè)發(fā)展初期,智算中心一般為算力用戶和傳統(tǒng)IDC客戶提供機(jī)柜托管服務(wù)。算力用戶的服務(wù)器由用戶自行解決,這類用戶多為云廠、AI企業(yè)、高校或科研機(jī)構(gòu),通常單次采購規(guī)模較小。占比35%左右,其它均為自用。在租賃的算力中,約80%被用于大型模型的訓(xùn)練,約20%則用于小模型的訓(xùn)練和推理任務(wù)。在區(qū)域分布上,60%的智算需求集中在北上廣深一線城市。智算算力租賃業(yè)務(wù)的興起一是由于短期內(nèi)智算資源供給能力不足,特別是以GPU為代表的AI芯片的緊缺;二是自建智算中心投資規(guī)模大、運(yùn)維能力要求較高,算力使用綜合成本高。大多數(shù)中小企業(yè)在發(fā)展AI模型和應(yīng)用的過程中面臨算力瓶頸,算力租賃業(yè)務(wù)迎來發(fā)展機(jī)遇。從客戶群體來看,AI企業(yè)、行業(yè)應(yīng)用企業(yè)、高??蒲袡C(jī)構(gòu)、解決方案提供商發(fā)布的大模型數(shù)量多,但互聯(lián)網(wǎng)企業(yè)模型落地最快。AI企業(yè)以及高??蒲袡C(jī)構(gòu)掌握AI算法技術(shù),但極少擁有算力,通常以租賃算力為主;互聯(lián)網(wǎng)企業(yè)AI技術(shù)件廠商具有硬件終端解決方案和用戶數(shù)據(jù),部分有智算設(shè)施。目前來看,AI企業(yè)和高??蒲袡C(jī)構(gòu)是智算租賃市場的主要客戶群體,此外各行業(yè)頭部企業(yè)也可能成為重要的潛在客戶。算力租賃市場競爭較為激烈,存在上游芯片廠商、下游AI企業(yè)、地方政府、上市公司新進(jìn)入者、云廠商五大力量。AI企業(yè)現(xiàn)階段集中力量開發(fā)大模型產(chǎn)品,市場給新進(jìn)入者留下窗口期,芯片廠商、地方政智算領(lǐng)域,但相較之下,云廠商、AI企業(yè)擁有客戶、數(shù)據(jù)、MQQS業(yè)務(wù),競爭力明顯強(qiáng)于地方政府與上市公司。隨著大模型競爭格局逐步明朗,云廠商將依托平臺、生態(tài)力量、規(guī)模效應(yīng)全面拓展智算市場,小規(guī)模智算租企業(yè)將被收算力綠色化發(fā)展已成為我國數(shù)字經(jīng)濟(jì)發(fā)展的重要課題。"雙碳"目標(biāo)提出中心和5G等新型基礎(chǔ)設(shè)施綠色高質(zhì)量發(fā)展實(shí)施方案》、《數(shù)據(jù)中心節(jié)能診斷服務(wù)指南(2023)》、《數(shù)據(jù)中心綠色低碳發(fā)展專項(xiàng)行動計劃》等進(jìn)一步落實(shí)數(shù)據(jù)中心能效監(jiān)管,對PUE等指標(biāo)提出明確要求,推動產(chǎn)業(yè)綠色低碳發(fā)展。同時,東數(shù)西算工程的實(shí)施促進(jìn)了西部地區(qū)的風(fēng)能、太陽能等可再生能源的消納,通過優(yōu)化算力基礎(chǔ)設(shè)施布局,提升算力中心綠色能源應(yīng)用比例,實(shí)現(xiàn)能源的合理分配和利用。2023年度國家綠色數(shù)據(jù)中心名單重點(diǎn)新增智算中心領(lǐng)域,引導(dǎo)產(chǎn)業(yè)加快綠色智算中心建設(shè)。當(dāng)前,我國智算中心逐步加強(qiáng)綠色節(jié)能技術(shù)應(yīng)用,提升算力性能和能源利用效率。在綠色I(xiàn)T設(shè)備方面,通過部署整機(jī)柜服務(wù)器、冷板式液冷服務(wù)器等,降低服務(wù)器能源消耗。如深圳百旺信智算中心應(yīng)用一體化芯片仿真設(shè)計整機(jī)柜服務(wù)器,實(shí)現(xiàn)單柜算力40PFlops,提升服務(wù)器使用效率,同時達(dá)到節(jié)能效果;中國電信京津冀智能算力中心冷板式液冷萬卡資源池全年P(guān)UE值為1.15,單位算力能耗為1.5KW/P。在綠色能源利用上,智算中心利用當(dāng)?shù)氐木G電智算中心依托慶陽創(chuàng)新的"源網(wǎng)荷儲碳數(shù)"電力系統(tǒng)和新風(fēng)自然冷卻技術(shù),將PUE穩(wěn)定控制在1.2以下。在智算中心運(yùn)營上,采用高效間接蒸發(fā)離心式變頻水冷、封閉冷通道等先進(jìn)制冷技術(shù),實(shí)現(xiàn)智算中心散熱能耗降低50%以上。部分智算中心建立智能化管理平臺,實(shí)時監(jiān)控機(jī)房運(yùn)行狀態(tài),精確控制制冷和供電系統(tǒng),推動制冷耗電量下降8%15%,保障智算中心安全穩(wěn)定與低碳運(yùn)行。如中國電信安徽智算中心A1樓通過優(yōu)化任務(wù)調(diào)度、負(fù)載均衡等技術(shù),提高信息設(shè)備利用率。面對巨大耗電量,智算中心綠色化水平仍有較大提升空間。高性能服務(wù)器單位能耗遠(yuǎn)高于傳統(tǒng)服務(wù)器,千億參數(shù)大模型訓(xùn)練階段用電或超過百萬度。在政策指導(dǎo)下,智算中心產(chǎn)業(yè)繼續(xù)貫徹落實(shí)綠色低碳要求,統(tǒng)籌推進(jìn)算力與電力融合發(fā)展,充分考慮與電力基礎(chǔ)設(shè)施的協(xié)同布局,加強(qiáng)能源需求側(cè)管理和供給側(cè)優(yōu)化,夯實(shí)國家數(shù)字基礎(chǔ)設(shè)施,推動綠色算力發(fā)展。高度耦合是智算中心與傳統(tǒng)數(shù)據(jù)中心建設(shè)架構(gòu)的根本區(qū)別。傳統(tǒng)數(shù)據(jù)中心在數(shù)據(jù)中心基礎(chǔ)設(shè)施、算力、網(wǎng)絡(luò)通信、存儲、軟件與平臺等環(huán)節(jié)可采用獨(dú)立采購建設(shè)的模式,各環(huán)節(jié)之間協(xié)同性較弱。智算中心主要業(yè)務(wù)場景要求高并行,單一訓(xùn)練任務(wù)以整個算力集群為基礎(chǔ),因此算力基礎(chǔ)層內(nèi)部的設(shè)計和運(yùn)行是高度耦合的,計算、存儲及網(wǎng)絡(luò)須緊密協(xié)同。在生產(chǎn)算力環(huán)節(jié),IT規(guī)劃設(shè)計須綜合考慮算力用途、算力類型、算力規(guī)模,以架構(gòu)的確定性應(yīng)對各類異構(gòu)算力需求,提升計算效率和靈活性。存儲與數(shù)據(jù)方面,存儲系統(tǒng)不僅要能夠處理PB級的數(shù)據(jù)量,還要在數(shù)據(jù)采集、清洗、訓(xùn)練及推理的每個環(huán)節(jié),都能提供高速、可靠的數(shù)據(jù)訪問。另外,通信網(wǎng)絡(luò)對智算集群的吞吐量和性能起關(guān)鍵作用,智算中心核心業(yè)務(wù)場景大模型訓(xùn)練中的大規(guī)模參數(shù)對算力和顯存都提出了更高的要求,智算中心需要配套建設(shè)低時延、大帶寬、長期穩(wěn)定性、大規(guī)模擴(kuò)展性和可運(yùn)維的高性能網(wǎng)絡(luò)。圖表9:智算中心總體架構(gòu)信息來源:國家信息中心高密機(jī)柜對智算中心基礎(chǔ)設(shè)施整體布局規(guī)劃、供電、制冷、承重等帶來挑戰(zhàn)。高密部署導(dǎo)致IT機(jī)房面積占比大幅縮小,為支持多元算力的混合部署,應(yīng)規(guī)劃好空間布局以容納不同冷卻技術(shù)和不同功率密度的算力設(shè)備。供電方面,高功率、大電流輸電損耗凸顯,對變壓器、母排、線纜等電力傳輸設(shè)備要求更高,可采用電力模塊替代變壓器、低壓配電、UPS、輸出配電等多個獨(dú)立的產(chǎn)品,或采用高壓直流方式提升輸配電效率。制冷方案選擇要綜合成本、PUE、可靠性等多方因素,風(fēng)冷仍占據(jù)重要地位,液冷方案是未來主流方向。在承重方面,由于單機(jī)柜密度提升及制冷方案的變化,在設(shè)計智算中心時需要提高建筑承重負(fù)載,合理布局功能區(qū)域和設(shè)備,并考慮未來可能的擴(kuò)展和設(shè)備更新。智算中心常見應(yīng)用場景為訓(xùn)練和推理,根據(jù)其對算力精度的需求的差異分為FP32、TF32、FP16、BF16、INT8等。進(jìn)行智算中心算力規(guī)劃應(yīng)根據(jù)具體的模型參數(shù)量,計算出訓(xùn)練、推理場景對GPU顯存大小的需求;根據(jù)GPU單卡算力和卡間通信帶寬設(shè)計合理的并行方案,并用于芯片服務(wù)器的選型和集群網(wǎng)絡(luò)方案設(shè)計。AI芯片技術(shù)迭代速度快,遠(yuǎn)超過基礎(chǔ)設(shè)施建設(shè)速度,智算中心算力規(guī)劃應(yīng)充分考慮核心硬件設(shè)備技術(shù)更新,保持與時俱進(jìn),滿足實(shí)際應(yīng)用需要。在滿足大規(guī)模計算集群的連接需求方面,智算中心網(wǎng)絡(luò)正迅速向十萬乃至數(shù)十萬卡互聯(lián)演進(jìn),參數(shù)面網(wǎng)絡(luò)的接入速率已從200GE提升至400GE乃至800GE。高性能網(wǎng)絡(luò)有利于保障集群智算節(jié)點(diǎn)間的通信效率,以滿足更高性能和更大規(guī)模的算力需求。低延時需求:RDMA技術(shù)通過繞過操作系統(tǒng)內(nèi)核,讓一臺主機(jī)可以直接訪問另外一臺主機(jī)的內(nèi)存,從而降低多機(jī)多卡間端到端通信時延。實(shí)現(xiàn)RDMA的方式有InfiniBand、ROCEv1、ROCEv2、iwARP四種,當(dāng)前智算中心的RDMA技術(shù)主要采用的方案為InfiniBand和ROCEv2兩種。高帶寬需求:智算中心需要處理海量數(shù)據(jù),網(wǎng)絡(luò)設(shè)備的吞吐能力、端口帶寬及密度需要全面提升,確保數(shù)據(jù)在訓(xùn)練和推理過程中的快速傳輸。穩(wěn)定性需求:大模型分布式訓(xùn)練任務(wù)有可能需要數(shù)天或數(shù)周,網(wǎng)絡(luò)不穩(wěn)定將會影響整個訓(xùn)練任務(wù)的進(jìn)度??蛇\(yùn)維需求:在成百上千張GPU卡的智算集群中,網(wǎng)絡(luò)架構(gòu)的復(fù)雜性、運(yùn)維是否簡單穩(wěn)定并且有足夠的工具來管理集群是需要重點(diǎn)考慮的維度。海量文件存儲系統(tǒng)需要具備幾方面的特點(diǎn),一是要求彈性擴(kuò)展,滿足存儲集群增加節(jié)點(diǎn)的需要,二是橫向擴(kuò)展時合理的數(shù)據(jù)分布,三是擴(kuò)縮容穩(wěn)定性、易運(yùn)維。在AI訓(xùn)練過程中,高效的數(shù)據(jù)讀有利于提升整體訓(xùn)練效率。大模型訓(xùn)練的主要文件包括樣本文件、checkpoint文件、模型文件,整體數(shù)據(jù)量很大,對讀寫的要求也非常高。NPU/GPU直通存儲技術(shù)簡化CPU內(nèi)存緩沖和復(fù)制過程,大幅縮短數(shù)據(jù)讀寫時間。在AI推理階段,面對高并發(fā)、長序列的推理場景,以KVCQche(鍵值緩存)為中心的多級緩存加速技術(shù)能夠優(yōu)化數(shù)據(jù)訪問路徑,提升系統(tǒng)的整體性能和響應(yīng)速度,從而更好地滿足大模型應(yīng)用的需求。智能算力的核心是CPU、GPU、FPGA、ASIC等各類計算芯片。AI芯片內(nèi)核數(shù)量多,擅長并行計算,滿足AI算法所需的大量并行處理能力,并顯著提升計算效率和靈活性。智算服務(wù)器CPU+GPU、CPU+FPGA、CPU+Asrc等異構(gòu)形式,以充分發(fā)揮不同算力芯片在性能、成本和能耗上的優(yōu)勢。圖表10:AI芯片(GPU、FPGA、ASIC)主要特點(diǎn)FPGAASIC定義圖形處理器,用于圖形渲染、并行計算、AI訓(xùn)練和推理現(xiàn)場可編程門陣列,可編程邏輯解決方案,適用于快速原型設(shè)計和特定應(yīng)用專用集成電路,為特定應(yīng)用定制設(shè)計的芯片相對較高,尤其是高性能GPU耗優(yōu)化能耗并行處理能力采用數(shù)量眾多的計算單元和超長流水線,具備高并行結(jié)構(gòu),通過多核并行計算支撐大算力需求具有高度實(shí)時性和靈活行和任務(wù)并行計算專為特定任務(wù)設(shè)計,高度并行化。靈活性和可拓展性靈活性較高,可通過軟件編程實(shí)現(xiàn)不同功能;可拓展性好,可通過多GPU擴(kuò)展計算能力靈活性很高,可現(xiàn)場編程改變硬件邏輯;可拓展性好,可通過外部接口和其他系統(tǒng)組件連接靈活性低,制造完成后功能固定;可拓展性差可定制性通用性強(qiáng),可通過軟件更新實(shí)現(xiàn)一定程度的定制;已有成熟產(chǎn)品線半定制化,可編程靈活度全定制化,完全根據(jù)特定應(yīng)制造周期。成本取決于性能需求中等,取決于FPGA的規(guī)模和復(fù)雜度應(yīng)用場景游戲、深度學(xué)習(xí)、數(shù)據(jù)加密貨幣挖礦、高性能計算、特定算法加速等NVIDIA、AMDxilinx、IntelGoogle、華為、寒武紀(jì)信息來源:科智咨詢整理在高端芯片限制不斷收緊的背景下,國產(chǎn)化芯片加速自主發(fā)展。AI服務(wù)器核心在于高性能芯片,參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)隨著AI大模型的發(fā)展呈現(xiàn)指數(shù)級增長,相較于大量疊加服務(wù)器臺數(shù),提升芯片性能同樣芯片領(lǐng)軍企業(yè)主要包括寒武紀(jì)、海光信息、景嘉微、華為海思等,寒武紀(jì)思元370芯片、昆侖芯科技昆侖二代AI芯片以及阿里平頭哥含光800芯片等在性能上進(jìn)一步縮小與國際先進(jìn)水平的差距,并在特定應(yīng)用場景中展現(xiàn)出優(yōu)勢;華為AI芯片異騰910在算力上和英偉達(dá)A100性能基本相當(dāng)。整體而言國內(nèi)AI芯片與海外龍頭企業(yè)產(chǎn)品仍存在較大差距,長期來看國產(chǎn)自研AI芯片有望逐步成為國內(nèi)AI產(chǎn)業(yè)發(fā)展的重要支撐,有望圍繞產(chǎn)品形成算力、算法、應(yīng)用一體化的開放生態(tài)。未來智算中心將集成更多的人工智能處理能力,推動技術(shù)融合與創(chuàng)新。圖表11:主流高性能芯片特性對比英偉達(dá)A100624TOPS@INT82TOPS/W312Ampere1935GB/S英偉達(dá)H1003958TOPS@INT81979Hopper3TB/SAMDMI100184.6TOPS@INT80.6TOPS/W184.6CDNA1.2TB/SAscend910512TOPS@INT82TOPS/W320HUAWEIDQVinci寒武紀(jì)思元370256TOPS@INT8MLuarch03614.4GB/S海光信息GPGPU1024GB/S百度昆侖昆侖2256TOPS@INT82.1TOPS/W128XPU-R平頭哥含光800825TOPS@INT8信息來源:科智咨詢整理目前國產(chǎn)化AI芯片仍處起步發(fā)展階段,在科學(xué)研究和產(chǎn)業(yè)應(yīng)用方面具有廣闊的創(chuàng)新空間。下一代AI芯片開發(fā)需著力在以下方面獲得突破:架構(gòu)創(chuàng)新,可重構(gòu)芯片、存算一體、類腦智能等新興架構(gòu)的研究突破有望提升芯片性能;感存算一體,在傳感器端開始對信號做初步處理,減少后端芯片的壓力;通過融合計算單元與存儲單元,減少數(shù)據(jù)訪問和搬運(yùn),顯著提升能效并降低功耗;新型存儲器,為了降低數(shù)據(jù)頻繁交換導(dǎo)致的延遲和功耗,以存儲為中心的計算架構(gòu)逐漸興起,成為AI芯片的一大新興技術(shù)路線;復(fù)雜AI算子支持,探索能夠高效分解和映射TrQnsformer等復(fù)雜結(jié)構(gòu)的芯片架構(gòu),實(shí)現(xiàn)算法與硬件的協(xié)同優(yōu)化;稀疏化計算能力,利用神經(jīng)網(wǎng)絡(luò)中的稀疏性,減少無效計算,優(yōu)化功耗;云邊AI芯片協(xié)同,邊緣計算節(jié)省云端服務(wù)器帶寬和算力成本,帶來更多交互方式、更強(qiáng)的安全保護(hù)。提升智算中心算力利用率和集群可用度,需要構(gòu)建超高速、超大規(guī)模的組網(wǎng)架構(gòu)。超高速網(wǎng)絡(luò)技術(shù)通過提供更高的帶寬,減少網(wǎng)絡(luò)延遲,確保大規(guī)模集群中的數(shù)據(jù)傳輸更加高效。超大規(guī)模組網(wǎng)架構(gòu)技術(shù)確保規(guī)模集群中的數(shù)據(jù)傳輸穩(wěn)定性和可靠性,能夠?qū)崿F(xiàn)十萬卡以上的超高速網(wǎng)絡(luò)互聯(lián)。當(dāng)前智算中心的RDMA技術(shù)主要采用InfiniBand和ROCEV2協(xié)議。RDMA(RemoteDirectMemoryAccess,遠(yuǎn)程直接內(nèi)存訪問)是一種用于高性能網(wǎng)絡(luò)通信的技術(shù),相比傳統(tǒng)的網(wǎng)絡(luò)通信方式,RDMA具有更低的延遲、更高的帶寬和更低的CPU利用率等優(yōu)點(diǎn),可顯著提高網(wǎng)絡(luò)通信的性能和效率。ROCE方案相較InfiniBand方案通用性更強(qiáng),除用于構(gòu)建高性能網(wǎng)絡(luò)外,還可以在傳統(tǒng)的以太網(wǎng)絡(luò)中使用,但在交換機(jī)的Headroom、PFC、ECN等相關(guān)參數(shù)的配置比較復(fù)雜,因此在萬卡以上的超大規(guī)模場景下ROCE網(wǎng)絡(luò)吞吐性能較InfiniBQn方案相對更弱。ROCE提供了一種成本效益高的解決方案,可以利用現(xiàn)有的以太網(wǎng)基礎(chǔ)設(shè)施,價格相對更低;InfiniBand性能突出,適合對網(wǎng)絡(luò)性能有極高要求的應(yīng)用場景。總體而言,智算中心網(wǎng)絡(luò)架構(gòu)的選擇取決于具體的應(yīng)用需求、預(yù)算和現(xiàn)有基礎(chǔ)設(shè)施。圖表12:InfiniBand和ROCE方案比較RoCE協(xié)議基礎(chǔ)獨(dú)立于以太網(wǎng),專為高性能計算(HPC)環(huán)境設(shè)計基于以太網(wǎng),ROCEv2版本支持跨VLAN和IP子網(wǎng)通信,克服了ROCEv1的局限提供更高的帶寬和更低的延遲,最高可達(dá)200Gbps提供低延遲和高吞吐量,但通常低于InfiniBand。ROCEv2的最大帶寬為100Gbps易用性和可擴(kuò)展性通常需要專門的硬件支持,部署成本較高可以利用現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,易于部署和擴(kuò)展容錯性和可靠性使用星型拓?fù)浣Y(jié)構(gòu)和鏈路聚合,提供冗余路徑和高級的容錯機(jī)制提供多路徑技術(shù)和糾錯重傳機(jī)制,確保數(shù)據(jù)傳輸?shù)目煽啃杂布С种饕蒑ellQnox提供支持,提供全面的硬件和軟件解決方案有多家供應(yīng)商提供支持ROCE的網(wǎng)絡(luò)適配器和交換機(jī)"東數(shù)西算"工程實(shí)施以來,國家政策持續(xù)推動全國一體化算力網(wǎng)絡(luò)建設(shè)。2023年12月發(fā)布的《國家發(fā)展改革委等部門關(guān)于深入實(shí)施"東數(shù)西算"工程加快構(gòu)建全國一體化算力網(wǎng)的實(shí)施意見》指出,加快建設(shè)跨區(qū)域、多層次算力高速直連網(wǎng)絡(luò),積極推進(jìn)算網(wǎng)深度融合;建立跨區(qū)域算力資源調(diào)度機(jī)制,構(gòu)建立體聯(lián)動的算力調(diào)度體系,促進(jìn)東中西部算力資源實(shí)現(xiàn)供需平衡。為推動算網(wǎng)協(xié)同、加快全國一體化算力網(wǎng)絡(luò)建設(shè),算力網(wǎng)絡(luò)建設(shè)需要做到彈性、敏捷、無損、安全、感知。算力網(wǎng)絡(luò)需具備彈性帶寬需求,適應(yīng)不同計算場景的帶寬變化。具備泛在算力敏捷接入的能力,提升用戶的算力獲取效率。AI芯片性能提升帶動服務(wù)器及單機(jī)柜功耗大幅增加,液冷方案成為智算中心制冷更優(yōu)選擇。傳統(tǒng)風(fēng)冷系統(tǒng)的散熱效率無法與高功率機(jī)柜的散熱需求相匹配,一方面,受數(shù)據(jù)中心建筑面積與單位運(yùn)營成本等因素的影響,數(shù)據(jù)中心單機(jī)柜功率密度將持續(xù)上升,在AIGC的推動下單機(jī)柜功率上升速度有望較預(yù)期更快。另一方面,風(fēng)冷方式移熱速率較低,相對于風(fēng)冷散熱,液冷能更好地支持20KW以上高密機(jī)柜冷卻,提高換熱效率,實(shí)現(xiàn)數(shù)據(jù)中心PUE低至1.2以下,符合機(jī)房高密度演進(jìn)趨勢,同時促進(jìn)數(shù)據(jù)中心減少碳排放。液冷技術(shù)類型根據(jù)冷卻液和發(fā)熱設(shè)備接觸換熱方式的不同,可劃分為冷板式液冷、浸沒式液冷和噴淋式液冷。相較于其他液冷技術(shù)路線,冷板式液冷應(yīng)用更加普遍。據(jù)科智咨詢統(tǒng)計,冷板式液冷方案應(yīng)用比例達(dá)到91%,是現(xiàn)階段及未來較長一段時間的主流液冷技術(shù)形式。2022年,冷板式數(shù)據(jù)中心市場規(guī)模達(dá)到90.5億元,同比增長45.4%.目前冷板式液冷數(shù)據(jù)中心已形成相對成熟的解決方案,通過冷板和CDU帶走IT設(shè)備超過80%的熱量;不需要對數(shù)據(jù)中心機(jī)房進(jìn)行大規(guī)模改造;散熱效率高,可降低PUE至1.2以下;液體不與設(shè)備接觸,可靠性高、易展開維護(hù)性設(shè)計,噪音低,空間利用率高、且熱能可回收。與浸沒式液冷相比,熱交換受到冷板的限制,節(jié)能效果相對降低。但浸沒式液冷和噴淋式液冷直接接觸冷卻液,兼容性差,專用機(jī)柜對于管路要求高,維護(hù)復(fù)雜,且存在冷卻液揮發(fā)的問題,運(yùn)行成本較高。圖表13:數(shù)據(jù)中心液冷技術(shù)方案對比接觸形式冷卻液不接觸發(fā)熱體,采用導(dǎo)熱板傳熱冷卻液浸泡發(fā)熱體冷卻液噴淋發(fā)熱體建設(shè)成本主要成本在換熱系統(tǒng)和式相比,成本高通過改造機(jī)柜增加必須裝置,成本較小服務(wù)器改造成本改造成本高運(yùn)維成本運(yùn)維成本低運(yùn)維成本適中運(yùn)維成本適中冷卻液冷卻液使用量大,對冷卻液安全性要求高冷卻液用量適中,要求高服務(wù)器兼容性根據(jù)服務(wù)器定制冷板,兼容所有機(jī)器兼容性測試根據(jù)冷卻液不同,需進(jìn)行兼容性測試?yán)寐试胍舫潭容^低低較低環(huán)境影響無冷卻液相變過程可能會導(dǎo)致氣體蒸發(fā)外散冷卻液霧滴和氣體可能散發(fā)到機(jī)箱外冷卻效果較好優(yōu)秀優(yōu)秀使用場景無限制有限制應(yīng)用程度目前應(yīng)用最廣泛適用于對功率密度、節(jié)能性要求較高的大型數(shù)據(jù)中心不適合高密度服務(wù)器和超大規(guī)模數(shù)據(jù)中心,現(xiàn)階段落地應(yīng)用相對較少主流曙光數(shù)創(chuàng)廣東合一液冷方案在算力中心的規(guī)?;瘧?yīng)用仍處于初級階段,目前為小規(guī)模部署。經(jīng)前期積淀,液冷產(chǎn)品及技術(shù)解決方案基本成型,但最終技術(shù)選型還需要經(jīng)過一定周期的驗(yàn)證和市場篩選。超算中心及部分頭部互聯(lián)網(wǎng)企業(yè)開展液冷試點(diǎn)應(yīng)用,積極尋求技術(shù)驗(yàn)證、產(chǎn)品適配等方面的生態(tài)協(xié)作,為液冷大規(guī)模商用提供寶貴經(jīng)驗(yàn)和良好的示范帶動作用,加速液冷產(chǎn)業(yè)發(fā)展。圖表14:中國高性能算力中心先進(jìn)制冷方案應(yīng)用案例(部分)天府智算西南算風(fēng)冷項(xiàng)目使用42kw智算風(fēng)冷算力倉,采用冷熱通道全密封+列間空調(diào)高溫進(jìn)水模式,將冷熱氣流循環(huán)與外界環(huán)境進(jìn)行隔離。相比傳統(tǒng)數(shù)據(jù)中心,進(jìn)水溫度提高至18℃,制冷系統(tǒng)能效比提升10%以上。通過AI智能管控平臺實(shí)現(xiàn)制冷系統(tǒng)聯(lián)動調(diào)優(yōu),整體節(jié)能25%以上,風(fēng)冷散熱PUE大幅降低。漢智算中心風(fēng)冷+液冷采用風(fēng)冷+液冷混合散熱方案,其中對主要發(fā)熱源CPU和內(nèi)存進(jìn)行液冷設(shè)計,解決服務(wù)器90%的散熱問題。在機(jī)房空調(diào)和冷板液冷技術(shù)雙重影響下,CPU核心的溫度低于常規(guī)風(fēng)冷機(jī)型,保障CPU在低溫條件下實(shí)現(xiàn)超頻運(yùn)行。廈門大學(xué)嘉實(shí)驗(yàn)室智算數(shù)據(jù)中心風(fēng)冷+液冷采用冷板式液冷系統(tǒng)+風(fēng)冷列間空調(diào)的制冷系統(tǒng)架構(gòu),風(fēng)液比80%,整系統(tǒng)按2N架構(gòu)進(jìn)行配置。PUE實(shí)時智能自動化調(diào)優(yōu),降低數(shù)據(jù)中心運(yùn)行維護(hù)成本,實(shí)現(xiàn)節(jié)能減排。京東云華北(廊冷板式液冷整機(jī)柜冷板式液冷技術(shù)將室外冷源直接注入服務(wù)器主板芯片進(jìn)行冷卻,達(dá)成系統(tǒng)去冷機(jī)化。CPU散熱由冷卻液通過室內(nèi)板式換熱器換熱后,可直接利用室外冷卻塔進(jìn)行散熱,實(shí)現(xiàn)全年運(yùn)行PUE低于1.1,基礎(chǔ)設(shè)施能耗節(jié)省可達(dá)30%,對應(yīng)碳排放總量減少10%以上。綠色智算中心浸沒式液冷芯片滿功耗平均核溫65±2℃,PUE≤1.1,在靈活擴(kuò)容、模塊組裝、安全可靠的前提下,結(jié)合先進(jìn)的溫控系統(tǒng)和管路布局等設(shè)計,有效解決服務(wù)器高熱流密度的散熱難題。在復(fù)雜環(huán)境和空間受限等非理想條件下實(shí)現(xiàn)全鏈路集成快速部署。浸沒式液冷通過嵌入式液冷單元,盲插總線架構(gòu),實(shí)現(xiàn)全場景PUE≤1.15,實(shí)現(xiàn)綠色低碳,可支持部署萬億參數(shù)大模型。信息來源:科智咨詢整理未來,隨著液冷技術(shù)的逐漸成熟,浸沒式冷卻帶來的液體泄漏風(fēng)險和運(yùn)維成本預(yù)計逐步降低,液冷系統(tǒng)的其他配套設(shè)施也有望因技術(shù)進(jìn)步和規(guī)模生產(chǎn)推動成本進(jìn)一步下降。全棧式液冷有望在更多的領(lǐng)域得到應(yīng)用,從硬件到軟件,整個系統(tǒng)設(shè)計更加高效節(jié)能。企業(yè)和研究機(jī)構(gòu)將積極開展長周期、大規(guī)模的液冷部署試驗(yàn),收集和分析實(shí)際運(yùn)行數(shù)據(jù)以評估液冷技術(shù)的性能和可靠性,發(fā)現(xiàn)并解決潛在的問題和風(fēng)險。更多行業(yè)標(biāo)準(zhǔn)的制定與落地帶動產(chǎn)業(yè)鏈有序發(fā)展,提升產(chǎn)業(yè)價值鏈地位。各設(shè)備和服務(wù)廠商正積極推動行業(yè)標(biāo)準(zhǔn)化,全力打造更開放的液冷生態(tài)。隨著機(jī)柜功率密度的增大,智算中心供電架構(gòu)要求逐漸發(fā)生變化,智算中心的規(guī)劃建設(shè)將更加注重供電系統(tǒng)的容錯性、可靠性,確保系統(tǒng)正常運(yùn)行。智算中心供配電架構(gòu)設(shè)計需要統(tǒng)籌考慮相關(guān)設(shè)備的負(fù)荷容量、上下級開關(guān)保護(hù)配合、供電系統(tǒng)的檢修計劃、故障隔離等因素,并優(yōu)化拓?fù)浣Y(jié)構(gòu)設(shè)計,配置完善的自動控制系統(tǒng),提高系統(tǒng)可用性。采用更靈活可靠的電力架構(gòu)提升供配電系統(tǒng)效率。一是一體化電源/電力模塊。傳統(tǒng)數(shù)據(jù)中心的供配電系統(tǒng)普遍采用分散式的結(jié)構(gòu),設(shè)備分散部署,占用面積大,線纜線路長、損耗大,后續(xù)的線纜檢修和系統(tǒng)擴(kuò)容難度高。一體化電源或者電力模塊設(shè)備將中壓柜、變壓器、UPS、HVDC、饋電等預(yù)制集成交付,縮短供電鏈路和施工周期,使供電系統(tǒng)的供電效率提高約1%。二是直流供電模式。2NHVDC供電架構(gòu)中,每臺高壓直流電源設(shè)備均可獨(dú)立承擔(dān)系統(tǒng)的全部負(fù)載,提供了最高級別的冗余和可靠性,相比傳統(tǒng)的交流電源系統(tǒng)通常具有更高的轉(zhuǎn)換效率和更低的能耗。10KV交流直轉(zhuǎn)240V直流供電架構(gòu)中,移相變壓器柔性集成了10kv交流的配電,隔離變壓、模塊化整流器和輸出配電等環(huán)節(jié),優(yōu)化供電鏈路,系統(tǒng)容量可根據(jù)需求進(jìn)行靈活配置。三是DR/RR供電架構(gòu)。傳統(tǒng)數(shù)據(jù)中心主流的供電架構(gòu)是2N架構(gòu),RR架構(gòu)為N+1配置,可使智算中心供電系統(tǒng)的利用率從50%提升到N/(N+1),同時占地面積減少(N-1)/2N。DR架構(gòu)中配電設(shè)備使用減少接近25%,電源設(shè)備成本低,但每套系統(tǒng)需要物理隔離,土建成本較DR架構(gòu)高。在人工智能時代,智算中心供配電系統(tǒng)向融合、綠色、智能方向發(fā)展。超融合設(shè)計下的一體化電源縮短供電鏈路長度,集約高效、交付周期短,具有重要的應(yīng)用和推廣價值。結(jié)合源網(wǎng)荷儲、AI調(diào)優(yōu)、智能電網(wǎng)等技術(shù),提升智算中心能源利用效率和新型電力系統(tǒng)需求側(cè)資源優(yōu)化配置效率。通過源網(wǎng)荷儲一體化的方式,將新能源發(fā)電的不連續(xù)性和用電負(fù)荷的穩(wěn)定性要求相匹配,提升綠電使用比例和系統(tǒng)運(yùn)行效率。利用AI技術(shù)進(jìn)行電力負(fù)荷預(yù)測、故障檢測和優(yōu)化調(diào)度,結(jié)合先進(jìn)AI算法實(shí)現(xiàn)對輸電線路的精準(zhǔn)分析和故障預(yù)警,提升供配電系統(tǒng)管理的科學(xué)化與精細(xì)化水平,降低維護(hù)成本。智能電網(wǎng)技術(shù)有利于智算中心供配電系統(tǒng)與外部電網(wǎng)進(jìn)行更為緊密的互動與協(xié)作,優(yōu)化電力調(diào)度,提高電力使用效率和可靠性。六、智算中心運(yùn)營服務(wù)向高效安全方向發(fā)展為高效利用各類計算資源,優(yōu)化算力使用效率并降低成本,需要在算力集群中對計算資源進(jìn)行分配和管理,即算力調(diào)度。算力調(diào)度以算力感知為基礎(chǔ),感知并整合算力節(jié)點(diǎn)收集的算力資源信息,統(tǒng)一表達(dá)為包含計算、網(wǎng)絡(luò)、存儲等多維度資源的綜合模型,利用算網(wǎng)編排技術(shù)實(shí)現(xiàn)復(fù)雜算力業(yè)務(wù)的路徑編排,按需分配、實(shí)時調(diào)度不同區(qū)位、不同運(yùn)營主體、不同架構(gòu)的算力資源。算力交易平臺連接算力買方與賣方,根據(jù)用戶的差異化需求,實(shí)現(xiàn)智能、公平、開放、算力調(diào)度體系強(qiáng)調(diào)按需分配和靈活調(diào)度計算資源、存儲資源及網(wǎng)絡(luò)資源,并加強(qiáng)網(wǎng)絡(luò)安全管理。支持彈性分配以適應(yīng)任務(wù)不同、變化多端的動態(tài)需求,加強(qiáng)算力、網(wǎng)絡(luò)和安全系統(tǒng)間的協(xié)同防御,利用人工智能提升安全技術(shù)手段與應(yīng)急處置能力。為了提高資源利用率和系統(tǒng)性能,算力調(diào)度系統(tǒng)需要實(shí)現(xiàn)負(fù)載均衡,并利用虛擬化技術(shù)實(shí)現(xiàn)資源的隔離和共享。全國算力調(diào)度統(tǒng)籌全國不同地區(qū)算力,促進(jìn)東西部算力資源高效配置,達(dá)成全國算力基礎(chǔ)設(shè)施化的目標(biāo)。從算力調(diào)度的范圍來看,算力調(diào)度涉及區(qū)域內(nèi)算力調(diào)度、跨區(qū)域算力調(diào)度、云邊端協(xié)同調(diào)度及算力和電力的協(xié)同調(diào)度。以城市算力網(wǎng)建設(shè)為基礎(chǔ),繼而"連點(diǎn)成片"形成區(qū)域算力網(wǎng),各區(qū)域算力網(wǎng)按照統(tǒng)一標(biāo)準(zhǔn)互聯(lián)互通,最終形成全國一體化的算力網(wǎng)體系,實(shí)現(xiàn)漸進(jìn)式落地。圖表15:算力資源調(diào)度與管理架構(gòu)智算中心是提供算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù),推動人工智能產(chǎn)業(yè)發(fā)展的算力基礎(chǔ)設(shè)施,其安全可信環(huán)境的構(gòu)建關(guān)乎個人權(quán)益、產(chǎn)業(yè)發(fā)展和社會運(yùn)行。智算中心應(yīng)全面推進(jìn)數(shù)據(jù)安全技術(shù)應(yīng)用,通過加密技術(shù)、匿名化技術(shù)等,加強(qiáng)數(shù)據(jù)安全保護(hù)和管理,實(shí)現(xiàn)對多種資源的全方位隔離與防護(hù)。利用深度包檢測(DPI)技術(shù)、數(shù)據(jù)丟失預(yù)防(DLP)等對網(wǎng)絡(luò)流量、行為日志、數(shù)據(jù)流轉(zhuǎn)、共享接口等安全監(jiān)測分析。利用先進(jìn)的人工智能和機(jī)器學(xué)習(xí)技術(shù)提高網(wǎng)絡(luò)安全防護(hù)系統(tǒng)的智能水平,實(shí)現(xiàn)智能化分析、防御、自主捕捉及未知風(fēng)險應(yīng)對,提供更加動態(tài)和前瞻性的安全保護(hù)。智算中心可通過建設(shè)內(nèi)外部安全管理體系保障數(shù)據(jù)安全。在智算中心內(nèi)部,加強(qiáng)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的可靠性和高效性,同時積極利用數(shù)據(jù)安全技術(shù)如身份識別、數(shù)據(jù)加密、數(shù)據(jù)脫敏、數(shù)據(jù)流動管理等,以及數(shù)據(jù)服務(wù)與內(nèi)容安全技術(shù)如數(shù)據(jù)交易技術(shù)管理、開放共享管理、人工智能深度防偽、數(shù)據(jù)內(nèi)容合規(guī)等,提高智算中心從數(shù)據(jù)采集到算力應(yīng)用層面的安全可靠。在外部層面,加強(qiáng)數(shù)據(jù)中心異地容災(zāi)備份建設(shè),利用分布的公有云,將新建IT系統(tǒng)和容災(zāi)系統(tǒng)同時部署在云上,降低數(shù)據(jù)丟失風(fēng)險,保障業(yè)務(wù)連續(xù)性和數(shù)據(jù)資產(chǎn)安全。通過實(shí)時監(jiān)控及時發(fā)現(xiàn)和解決設(shè)備故障,確保智算中心不間斷平穩(wěn)運(yùn)行。運(yùn)維監(jiān)控需兼顧實(shí)時性和準(zhǔn)確性兩大要素,若監(jiān)控頻率過高,可能會對系統(tǒng)性能造成不利影響,反之,若監(jiān)控間隔過長則可能導(dǎo)致關(guān)鍵事件的遺漏。智算中心運(yùn)維監(jiān)控與故障處理應(yīng)更加高效,需要進(jìn)行跨域故障感知和分析。通過對系統(tǒng)運(yùn)行狀態(tài)的持續(xù)監(jiān)測,監(jiān)控智算中心計算、存儲、網(wǎng)絡(luò)、光模塊等設(shè)備的運(yùn)行級網(wǎng)絡(luò)流量分析、存儲故障和性能分析等,迅速準(zhǔn)確確定故障位置,從而縮短故障診斷時間,最大化防止訓(xùn)練任務(wù)中斷。建立高效故障修復(fù)流程,發(fā)生故障時能夠立即采取相應(yīng)措施恢復(fù)系統(tǒng)的穩(wěn)定運(yùn)行,縮短系統(tǒng)停機(jī)時間。根據(jù)實(shí)際需求定制化運(yùn)維平臺配置,包括監(jiān)控指標(biāo)、報警規(guī)則、數(shù)據(jù)展示方式等,建立簡潔、直觀的界面,便于運(yùn)維人員快速響應(yīng)并處理問題。智能運(yùn)維以數(shù)據(jù)為基礎(chǔ),以算法為支撐,以場景為導(dǎo)向,為數(shù)據(jù)中心運(yùn)維管理提供智能化解決方案,實(shí)時分析和處理問題。大型超大型智算中心承載的業(yè)務(wù)和數(shù)據(jù)量巨大,智能化運(yùn)維體系的構(gòu)建有利于提升智算中心運(yùn)行的穩(wěn)定性及動化運(yùn)維工具通過平臺建設(shè),將大量重復(fù)性的運(yùn)維活動轉(zhuǎn)化為自動化操作,提高運(yùn)維效率,增強(qiáng)運(yùn)維過程的可視化智算中心智能化運(yùn)維解決方案應(yīng)具備如下特點(diǎn)。一是統(tǒng)一運(yùn)維,提供智算中心一站式IT服務(wù)。二是數(shù)據(jù)驅(qū)動,聚合獨(dú)立的運(yùn)維數(shù)據(jù)形成運(yùn)維大數(shù)據(jù),并結(jié)合AI分析能力,實(shí)現(xiàn)對智算中心運(yùn)維態(tài)勢的分析及可視化,支持運(yùn)維決策。三是全局可視化,提供從平臺層到底層硬件基礎(chǔ)設(shè)施的全棧監(jiān)控可視化。四是自動化及智能化,提供自動化工具鏈,并對智算中心運(yùn)行態(tài)勢進(jìn)行智能化預(yù)測,形成故障應(yīng)對機(jī)制,快速修復(fù)漏洞。五是安全合規(guī),保障智算中心運(yùn)維過程中的數(shù)據(jù)安全、隱私保護(hù)、合規(guī)管理等方面符合相關(guān)法規(guī)和標(biāo)準(zhǔn),降低法律風(fēng)險。智能運(yùn)維方案的核心部分為智算中心基礎(chǔ)設(shè)施管理(DCIM)、數(shù)字化運(yùn)維服務(wù)管理平臺(DOSM),并在此基礎(chǔ)上搭建精細(xì)化運(yùn)維工作管理架構(gòu),提升智算中心智能化水平和運(yùn)營效率。發(fā)展展望與倡議智算中心產(chǎn)業(yè)發(fā)展環(huán)境持續(xù)優(yōu)化。政策推動新型智能基礎(chǔ)設(shè)施建設(shè),以更好支撐社會經(jīng)濟(jì)發(fā)展需求,包括AI軟硬件、智算服務(wù)、大模型應(yīng)用在內(nèi)的產(chǎn)業(yè)鏈各環(huán)節(jié)有望獲得更多政策支持。算電協(xié)同建設(shè)推進(jìn),新型電力系統(tǒng)與算力樞紐節(jié)點(diǎn)資源將進(jìn)一步融合銜接,保障電力資源供給,促進(jìn)算力綠色化高效運(yùn)行。全國一體化算力網(wǎng)絡(luò)建設(shè)全面提速,為智算中心提供泛在連接、靈活高效的互聯(lián)網(wǎng)絡(luò)。AI應(yīng)用規(guī)模落地激發(fā)智算需求增長。AI大模型商業(yè)化應(yīng)用場景不斷拓展,前沿數(shù)字技術(shù)逐步轉(zhuǎn)向大規(guī)模行業(yè)應(yīng)用階段,參數(shù)規(guī)??焖購膬|級突破至萬億級,產(chǎn)生大規(guī)模智算算力需求。近年來中國智算中心建設(shè)火熱,目前全國已有超過30個城市正在積極推進(jìn)智算中心建設(shè)或規(guī)劃。未來隨著人工智能應(yīng)用場景的持續(xù)創(chuàng)新和拓展,智算中心將更好賦能社會經(jīng)濟(jì)發(fā)展。綜合的智算生態(tài)服務(wù)將成為主流模式。隨著AI技術(shù)的不斷演進(jìn)與智算生態(tài)的日益成熟,智算中心各服務(wù)類型之間將實(shí)現(xiàn)更加緊密的協(xié)同與融合。綜合技術(shù)能力強(qiáng)的科技公司或具有IT基礎(chǔ)的智算中心集成方有望基于完善的智算中心生態(tài),提供uIQas+paas+Maas+SQQS"的全棧式綜合智算生態(tài)服務(wù)。深度整合的服務(wù)模式不僅能夠提升服務(wù)效率和用戶體驗(yàn),也將促進(jìn)技術(shù)創(chuàng)新與產(chǎn)業(yè)升級的良性循環(huán)。多元普惠的算力生態(tài)體系逐步構(gòu)建。AI軟硬件協(xié)同性進(jìn)一步提高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 云存儲加密通信隱私保護(hù)-洞察分析
- 2023年-2024年員工三級安全培訓(xùn)考試題及參考答案【滿分必刷】
- 物業(yè)服務(wù)智能化評價體系-洞察分析
- 2023年項(xiàng)目部安全管理人員安全培訓(xùn)考試題附完整答案【各地真題】
- 細(xì)胞器間的膜運(yùn)輸調(diào)控-洞察分析
- 水利BIM集成技術(shù)優(yōu)化-洞察分析
- 網(wǎng)絡(luò)協(xié)議差錯檢測-洞察分析
- 污水處理中抗生素殘留分析-洞察分析
- 網(wǎng)站銷售合作協(xié)議書
- 臨時場地出租協(xié)議
- 2025年包鋼集團(tuán)公司招聘筆試參考題庫含答案解析
- 內(nèi)蒙古呼和浩特市2024屆九年級上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 【合同范本】補(bǔ)充協(xié)議-面積差補(bǔ)款-預(yù)售版
- 藝術(shù)(音樂、美術(shù))專業(yè)人才需求情況調(diào)研報告
- [QC成果]提高剪力墻施工質(zhì)量一次合格率
- 移印工作業(yè)指導(dǎo)書
- 樂高基礎(chǔ)篇樂高積木和搭建種類專題培訓(xùn)課件
- 低血糖的觀察和護(hù)理課件
- 事故形成的冰山理論
- 溶解度曲線教學(xué)設(shè)計
- 硅膠產(chǎn)品工藝流程圖
評論
0/150
提交評論