華為 2024 版數(shù)據(jù)中心2030_第1頁
華為 2024 版數(shù)據(jù)中心2030_第2頁
華為 2024 版數(shù)據(jù)中心2030_第3頁
華為 2024 版數(shù)據(jù)中心2030_第4頁
華為 2024 版數(shù)據(jù)中心2030_第5頁
已閱讀5頁,還剩157頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

HUAWEI2024版數(shù)據(jù)中心構建萬物互聯(lián)的智能世界數(shù)據(jù)中心010102 學界稱這個現(xiàn)象為“涌現(xiàn)”。正是這個性能的突變,讓人工智能的發(fā)展階段從感知理解世界到生成創(chuàng) 工智能、云計算等新一代信息通信技術的重要載體,已經(jīng)成為新型數(shù)字基礎設施的算力底座,具有空以及全球可持續(xù)發(fā)展目標下對于碳減排的要求,將迫使未來的數(shù)據(jù)中心必須在更優(yōu)的計算架構、以及過去三十年,超大寬帶與成本約束的矛盾推動了聯(lián)接產(chǎn)業(yè)的高速發(fā)展,5G、F5G等改變世界;未來應對算力需求和資源約束的主矛盾,系統(tǒng)級和架構級的技術、產(chǎn)品和方案創(chuàng)新必將涌現(xiàn),也將成為未03該報告從算力需求與資源約束的核心矛盾出發(fā),描繪了未來十年影響數(shù)據(jù)中心發(fā)展的五大未來場景,提出了圍繞“數(shù)效、人效、算效、能效和運效”等五效提升的發(fā)展方向;同時,該報告在業(yè)界首次定義了未來數(shù)據(jù)中心的技術特征,系統(tǒng)性闡述了數(shù)據(jù)中心所涉及到云服務、計算、存儲、網(wǎng)絡、能源等全棧技術可能的挑戰(zhàn)與創(chuàng)新方向,并明確提出了未來數(shù)據(jù)中心建設的參考架構。希望這份報告能為全吳軍在《智能時代》中提到,在歷次技術革命中,一個人、一家企業(yè)、甚至一個國家,可以選擇的道路只有兩條,要么加入浪潮,成為前2%的人;要么觀望徘徊,被淘汰。毫無疑問,未來10年將充040713AIforAll,創(chuàng)造新生產(chǎn)力 14 15 16 16 17 17 18 19 19 2105愿景與關鍵技術特征23愿景24關鍵技術特征251.多樣泛在252.安全智慧303.零碳節(jié)能364.柔性資源415.對等互聯(lián)506.系統(tǒng)摩爾57新型數(shù)據(jù)中心參考架構65新基礎設施,供電制冷走向全天候綠色零碳67新算力底座,構建以數(shù)據(jù)為中心多樣算力系統(tǒng)68新資源調度,應用為中心實現(xiàn)柔性調度68新數(shù)據(jù)管理,數(shù)據(jù)全局可視助力高效流通70新協(xié)同服務,開放架構融入社會化算力70新智能管理,AI驅動實現(xiàn)DC自動運維71發(fā)展與倡議75 78 80060708數(shù)據(jù)中心作為人工智能、云計算等新一代信息通信技術的重要載體,已經(jīng)成為新型數(shù)字基礎設施的算a算力需求十年百倍增長,算力分布進一步極化人類將迎來YB數(shù)據(jù)時代:全球通用計算算力將產(chǎn)業(yè)正進入新一輪快速發(fā)展期,我們預測,未來三年內,全球超大型數(shù)據(jù)中心數(shù)量將突破1000個,并將保持快速增長;同時,隨著自動駕駛、智能制造、元宇宙等應用的普及,邊緣數(shù)據(jù)中心如同農(nóng)業(yè)經(jīng)濟的核心競爭力是建立在從勞動力人口到大規(guī)模水利設施再到機械化持續(xù)提升生產(chǎn)效率的基礎上一樣,算力的規(guī)模和效率也已經(jīng)成為發(fā)展數(shù)字經(jīng)濟的核心競爭力。當前全球正處在千科學和大工業(yè)都朝著多維度、高精度的大規(guī)模數(shù)據(jù)分析方向發(fā)展:如石油勘探領域深度偏移等場景下單位面積勘探區(qū)的算力需求將增長10倍以上。AI、區(qū)塊鏈等技術支撐的行業(yè)智能化將帶來算力需求的爆炸式增長,從數(shù)字化球拍每一次揮動的感知、記錄和處理,到普惠金融每一次微型交易的客戶畫像、信用評估,都需要高效算力的支持。未來各行業(yè)在算力領域的投資占比將快速增長,以銀行業(yè)為例,根據(jù)有關預測億元,其中AI與云計算是重點投資領域,二者09數(shù)據(jù)中心2030aAI驅動數(shù)據(jù)中心發(fā)生全景式革命華為預測,到2030年全球AI計算算力將超過105ZFLOPS(FP16):AI計算算力成為數(shù)據(jù)中心發(fā)展的最大驅動力和決定性因素。未來5到10繪畫、語音、圖像、視頻等領域的理解力超過人類平均水平,并與互聯(lián)網(wǎng)和智能設備深度融合,深度改變全社會的消費模式和行為。AI技術與生產(chǎn)率之間顯著的“擴散滯后”效應逐漸減弱,通用大模型能力將嵌入生產(chǎn)力和生產(chǎn)工具、行業(yè)大模型和場景化AI等多路徑融合,AI技術創(chuàng)新對商業(yè)價值的影響將變得更加廣泛和不可預測。通用大模型多模態(tài)泛化下的訓練算力需求將保持遠超摩爾定律的陡峭增長趨勢,需要數(shù)據(jù)中心在算力規(guī)模、架構、算法優(yōu)化、跨網(wǎng)協(xié)同等領域持續(xù)創(chuàng)新和快速迭代。展望未來,AI的發(fā)展將加速平臺型企業(yè)超級數(shù)據(jù)中心和國家級算力網(wǎng)數(shù)據(jù)中心總耗電量在ICT行業(yè)占比超80%,為保障數(shù)據(jù)中心行業(yè)的可持續(xù)發(fā)展,首先需要提升能源使用效率、實現(xiàn)綠色低碳。多個國家、國際組織發(fā)布數(shù)據(jù)中心相關政策,如美國政府通歐洲數(shù)據(jù)中心運營商和行業(yè)協(xié)會在《歐洲的氣候心碳中和。中國出臺《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》推動構建全國一體化大數(shù)據(jù)中心,啟動“東數(shù)西算”工程,促進數(shù)據(jù)中心綠色可持續(xù)發(fā)展,加快節(jié)能低碳技術出臺和技術的持續(xù)發(fā)展,越來越多的先進節(jié)能技術將更廣泛地應用到數(shù)據(jù)中心,推動PUE的進未來隨著風光水等清潔能源占比的不斷增加,通過數(shù)據(jù)中心微電網(wǎng)“源網(wǎng)荷儲”的協(xié)同還可以進其次除了自身降低碳排放之外,數(shù)據(jù)中心還可以為其他行業(yè)的智能化轉型賦能,成為全社會降碳將幫助減少全球總碳排放的20%,是自身排放10數(shù)據(jù)中心2030a超出物理數(shù)據(jù)中心邊界,多流協(xié)同的數(shù)據(jù)中一方面,規(guī)模化、中長期需求預測困難、技術迭代加速等成為所有骨干數(shù)據(jù)中心運營企業(yè)和領先數(shù)字化企業(yè)的共同挑戰(zhàn)。數(shù)百萬臺服務器的云數(shù)據(jù)中心、數(shù)十萬臺服務器規(guī)模的行業(yè)數(shù)據(jù)中心將高密度任務涌現(xiàn),土地、能耗獲得的不確定性等因素使得基于超大單體、以10年為周期的數(shù)據(jù)中心規(guī)劃模式難以為繼。未來分階段、模塊化、集群化、服務化,邏輯上統(tǒng)一,物理上分布的數(shù)據(jù)中心新建設模式將逐漸普及。另一方面高性能計算的需求也隨之不斷提升,影視渲染、效果圖渲染等批量計算任務,基因測序、風機工況模擬等科學計算任務以及AI訓練等可并行的計算任務,往往需要消耗大量的算力資源和運算時間。計算規(guī)模可變動的特點,針對這類需求可以通過實時傳遞價格信號,激勵用戶選擇電力價格較低的時間段進行整體運算;也可以通過斷點續(xù)訓、可續(xù)渲染技術,在計算任務執(zhí)行的過程中暫停乃通過任務流、信息流、能量流的精準關聯(lián)和多流螞蟻大腦一般只有0.2毫瓦的能耗,但是能夠做相比之下,目前自動駕駛汽車還需要幾十瓦甚至幾百瓦來進行計算,在能效上與生物界相比還有很大的差距。應對十年百倍算力增長需求與能耗約束之間的矛盾,未來數(shù)據(jù)中心需要打破馮·諾依曼架構,基于新架構、新部件發(fā)展適應性與高效性的新計算模式。在信息計算領域,已經(jīng)發(fā)展出了十幾種廣泛使用的計算模式,例如無線和光通信里大量使用基于快速傅里葉變換的蝶形計算模式;路由器里大量使用基于邏輯狀態(tài)轉移的有限狀態(tài)機計算模式;在智能計算領域,除了統(tǒng)計計算之外,業(yè)界正在研究數(shù)理邏輯計算、幾何流形計算、博弈計算等更高效的新計算模式,實現(xiàn)在特定場景下,計算能效的百倍提升。下一代數(shù)據(jù)中心還將構建“算存網(wǎng)安”多技術協(xié)同的全新存算墻的約束,從單設備到集群化、從單節(jié)點到網(wǎng)絡化,通過系統(tǒng)級創(chuàng)新、軟硬協(xié)同實現(xiàn)數(shù)11數(shù)據(jù)中心2030代代圖1-1算力需求與資源約束挑戰(zhàn)面向2030,數(shù)字經(jīng)濟加速發(fā)展對于算力的需求將呈現(xiàn)十年百倍的指數(shù)級增長;而與此同時,單芯片摩爾定律的失效,以及全球可持續(xù)發(fā)展對于碳減排的硬性要求,將成為制約數(shù)據(jù)中心未來發(fā)展的主要因素。可以預見,圍繞算力需求和資源約束挑戰(zhàn)的創(chuàng)新將成為未來數(shù)據(jù)中心發(fā)展的主旋律。先進數(shù)字化企業(yè)和數(shù)字化國家,將在單個數(shù)據(jù)中心、數(shù)據(jù)中心集群、數(shù)據(jù)中心之間的“微中宏”觀、多層次進行系統(tǒng)化創(chuàng)新,實現(xiàn)企業(yè)級或者國家級的“一臺計算機”,通過整體效率的提升將算力供給和資源約束之間的剪刀差最大化,121314數(shù)據(jù)中心幾乎涉及信息生活的所有方面,從科學研究的突破創(chuàng)新到生產(chǎn)生活的智能高效,都需要數(shù)據(jù)中心提供更強大的算力,處理更多的數(shù)據(jù),算力需求將呈現(xiàn)遠超摩爾定律的陡峭增長。與此同時,為aAIforAll,創(chuàng)造新生產(chǎn)力過去,人類在科學的邊界之內,不斷發(fā)現(xiàn)萬物規(guī)律,并創(chuàng)造生產(chǎn)工具,推動社會從農(nóng)耕文明、工業(yè)文明進入到數(shù)字文明的數(shù)字化階段。未來,AI以更高的效率和更快的速度進行分析和創(chuàng)造,將人類善于分析,但AI可能做的更好?!胺治鲂虯I”已經(jīng)得到廣泛應用,可以分析一組數(shù)據(jù),一組圖片,并在其中找到模式,用于多種用途,無人類擅長創(chuàng)造,但AI可能做的更快。隨著“生成式AI”的快速發(fā)展,AI已經(jīng)開始創(chuàng)造有意義和美麗的東西,如寫詩、繪圖,并且效率更高。生成式AI在圖像生成領域的進展來自擴散模型領域的進展來自于ChatGPT,這是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓練的文本生成深度學習模型,用于問答、文本摘要生成、機器翻譯、分類、代碼生成和對話的AI。在代碼生成領域的進展則人類工程師,這標志著AI代碼生成系統(tǒng),首次15數(shù)據(jù)中心2030預測結果,對比傳統(tǒng)的HPC數(shù)值預報方法,在某金融企業(yè)基于AI大模型實現(xiàn)了準確率達90%的企業(yè)財務智能預警,較傳統(tǒng)機器學習模型準確率提升了11%。AI大模型正逐步從智能對話、短文創(chuàng)作、圖片生成等消費應用場景,擴展到辦公、編程、營銷、設計、搜索等商業(yè)應用場景,并將進一步擴展到金融風控、智能客服、輔助診斷、醫(yī)療咨詢等企業(yè)應用場景,為千行萬業(yè)注入熟悉的土地、植物、空氣、陽光一樣無處不在:“一輛會自己行駛的汽車、一個會自己做飯的機器人、一個會自己管理的通信網(wǎng)絡、一個會自我優(yōu)化的軟件平臺”將會成為人們日常生活的一部幾千年前科學以歸納為主,通過觀測和實驗來描述自然現(xiàn)象;過去數(shù)百年出現(xiàn)了理論研究分支,利用數(shù)學模型進行分析;過去數(shù)十年出現(xiàn)了計算21世紀初期,新的信息技術已促使新范式的誕通過將理論、實驗和計算仿真統(tǒng)一起來,由儀器收集或仿真計算產(chǎn)生數(shù)據(jù)、由軟件處理數(shù)據(jù)、由計算機存儲信息和知識、科學家通過數(shù)據(jù)管理和數(shù)據(jù)密集型科學研究,將產(chǎn)生海量數(shù)據(jù)需要分析處理,如模擬腦神經(jīng)網(wǎng)絡,探索人腦上億個神經(jīng)的數(shù)據(jù)吞吐量;自動駕駛車輛每天將產(chǎn)生數(shù)十TB數(shù)據(jù)用于訓練視覺識別算法;用電子顯微鏡重建大腦中的突觸網(wǎng)絡,1立方毫米大腦的圖像量數(shù)據(jù)中分析發(fā)現(xiàn)新天體。PB級數(shù)據(jù)使我們可以做到?jīng)]有模型和假設就可以分析數(shù)據(jù),將數(shù)據(jù)丟進巨大的計算機集群中,只要有相互關系的數(shù)據(jù),統(tǒng)計分析算法可以發(fā)現(xiàn)過去的科學方法發(fā)現(xiàn)科學數(shù)據(jù)已成為科學研究的關鍵成果和重要的戰(zhàn)略性資源,面對噴薄而出的數(shù)據(jù)需求和數(shù)據(jù)量,16數(shù)據(jù)中心2030如何存儲、管理、共享這些科學數(shù)據(jù),成了全球科學家關注的熱點,也是下一代數(shù)據(jù)中心的重要傳統(tǒng)的存儲子系統(tǒng)已經(jīng)難以滿足海量數(shù)據(jù)處理的而簡單地將數(shù)據(jù)進行分塊處理并不能滿足數(shù)據(jù)密目前許多具體科學研究中所面臨的最大問題,不是缺少數(shù)據(jù),而是面對太多的數(shù)據(jù),卻不知道如當前的超級計算機、計算集群、超級分布式數(shù)據(jù)庫、基于互聯(lián)網(wǎng)的云計算等并沒有完全解決這些一是由實向虛,基于虛擬世界對于現(xiàn)實世界的模仿,通過構建沉浸式數(shù)字體驗,增強現(xiàn)實生活的數(shù)字體驗,強調實現(xiàn)真實體驗的數(shù)字化。在移動互聯(lián)網(wǎng)時代,主要通過文字、圖片、視頻等2D形式建立虛擬世界,而未來在元宇宙時代,將真實物理世界在虛擬世界實現(xiàn)數(shù)字化重造,建立虛二是由虛向實,超脫對于現(xiàn)實世界的模仿,基于虛擬世界的自我創(chuàng)造,不但能夠形成獨立于現(xiàn)實實現(xiàn)數(shù)字體驗的真實化。如增強現(xiàn)實游戲通過設置與品牌聯(lián)動特定地點發(fā)放限量購物券的方式,幫助品牌方吸引消費者關注,實現(xiàn)數(shù)字體驗對真從技術層面來看,虛實融合的多維互動體驗離不開計算機圖形圖像的多維空間計算能力支持和低延遲網(wǎng)絡服務。同時,它還需要強大的人工智能認知能力的輔助,以及泛在通達的數(shù)據(jù)連接,計算和網(wǎng)絡的能力將直接決定了虛實融合的深度和面向千行萬業(yè)的數(shù)字孿生是數(shù)據(jù)中心的重要應用場景。根據(jù)第三方預測,全球數(shù)字孿生市場空間仿真、渲染、大數(shù)據(jù)、人工智能等新一代信息技術的綜合集成應用,是數(shù)字經(jīng)濟發(fā)展的重點領域之一。伴隨各行業(yè)智能化的推進,城市、制造、交通、水利、能源的數(shù)字孿生應用需求快速增長,從端云兩側同時拉動數(shù)據(jù)中心算力需求。其中,基于WebGL的數(shù)字孿生應用快速發(fā)展,帶來終端的升級需求;基于云渲染的數(shù)字孿生應用,帶來云端算力的快速增長。應對算力快速發(fā)展的需求,應從加強算力供給、提升集約化利用水平、加強17數(shù)據(jù)中心2030過去10年內,智能手機和移動互聯(lián)網(wǎng)重塑了人類生活方式和企業(yè)生產(chǎn)模式;今天,智能化和電氣化正在重構汽車行業(yè)的核心競爭力和生態(tài)。重塑和重構的背后是強大的算力、算法和數(shù)據(jù)構成的數(shù)據(jù)智能,是敏捷迭代、彈性伸縮、韌性自愈的云原生的IT系統(tǒng)。未來隨著大模型AI、萬物與現(xiàn)實世界結合更緊密的千行萬業(yè)也將快步進入各行業(yè)的領先者和現(xiàn)有分工的顛覆者正在憑借前瞻性思維實現(xiàn)更深層次的智能化,推動云原生特流程、組織精細化、敏捷化的全新競爭力。隨著數(shù)字系統(tǒng)越來越復雜、發(fā)布變更頻度越來越高、算力越來越密集、分布越來越廣泛,企業(yè)將越來越依賴平臺能力,越來越多的企業(yè)將全面擁抱云普惠化的云原生技術給傳統(tǒng)的企業(yè)甚至個體帶來將生產(chǎn)、經(jīng)營活動現(xiàn)代化的機遇,消除數(shù)字化鴻溝,提供簡單、經(jīng)濟而又專業(yè)、個性的智能化路徑。當云端算力、數(shù)據(jù)服務API、涂鴉化的IOT控制流程設計、商品化的行業(yè)AI算法組合時,每個擁抱變化的企業(yè)獲得與領先者同步的智能化在全球積極應對氣候變化目標下,綠色低碳成為數(shù)據(jù)中心的重要發(fā)展方向,大部分國家或地區(qū)均在單體數(shù)據(jù)中心領域相繼發(fā)布了相應政策。中國通過實施“東數(shù)西算”工程,積極探索構建形成圍繞綠色可持續(xù)發(fā)展,數(shù)據(jù)中心相關企業(yè)已經(jīng)開發(fā)了大量創(chuàng)新技術來實現(xiàn)基礎設施建設與運營過程中的高效化和低碳化,并且已經(jīng)在現(xiàn)有或新建的數(shù)據(jù)中心中實施。如蘋果公司在數(shù)據(jù)中心范圍內部署分布式太陽能、風能、沼氣等可再生能源發(fā)電設施,以及與可再生能源電站簽署長期采購協(xié)議,為自有數(shù)據(jù)中心供電,通過一系列措施實現(xiàn)數(shù)據(jù)中心使用100%可再生能源。微軟公司在智能云綠色數(shù)據(jù)中心建設時提出需要在選址、18數(shù)據(jù)中心2030華為云貴安數(shù)據(jù)中心采用自然冷卻技術,包括直通風制冷和部分高密度服務器就近利用湖水散熱,并通過余熱回收利用技術等將數(shù)據(jù)中心的熱量進行采集,用于辦公區(qū)取暖,在設計中既充分結合了貴州自然條件的優(yōu)勢,也融入了綠色低碳實現(xiàn)“能源流”、“數(shù)據(jù)流”和“業(yè)務流”的多流協(xié)同,是面向2030年構建高能效數(shù)據(jù)中心的綜合考慮技術和商業(yè)可行性,單核硅基芯片的計算能力將在3納米達到極限。由于經(jīng)濟性原因,核后迅速失效。這將推動算力架構從單設備多核向多設備網(wǎng)絡化演進。此外,受網(wǎng)絡技術發(fā)展及網(wǎng)絡帶寬成本約束,邊緣的算力部署也將成為數(shù)據(jù)中心新的場景,最終形成云邊泛在、多級化算過去半個世紀,集成電路產(chǎn)業(yè)在摩爾定律的指引下飛速發(fā)展,算力一直保持著大跨度提升。在硬件主導算力快速提升的時代,計算過于依賴底層算力,對架構和代碼優(yōu)化重視不足,高級語言不斷出現(xiàn),程序執(zhí)行效率越來越低,而這恰恰為未來從“軟硬協(xié)同”層面提升計算性能留下了優(yōu)化空間。主流芯片和設備廠商已經(jīng)紛紛開始通過軟硬聯(lián)合優(yōu)化來提升整體計算性能。業(yè)界認為,硬硬協(xié)同”能帶來兩個數(shù)量級的整體性能提升。華為云的異構計算服務,通過軟件優(yōu)化硬件直通能力,能夠顯著降低因計算資源虛擬化造成的性能計算領域,未來十年,我們將看到比過去50年面向2030,通過中心集群軟硬協(xié)同優(yōu)化、云邊多級算力資源協(xié)作等提升算效是數(shù)據(jù)中心未來的19數(shù)據(jù)中心2030未來數(shù)據(jù)中心的發(fā)展對網(wǎng)絡將提出更高的要求。傳統(tǒng)網(wǎng)絡在業(yè)務配置和資源管理上不具備足夠的靈活性,造成數(shù)據(jù)中心內和數(shù)據(jù)中心之間的算力資源利用率低,從而產(chǎn)生巨大的浪費。尤其是在模型參數(shù)也會變得非常大,為了讓訓練效率更高,往往需要上百張GPU卡來放置一個大模型作為一個數(shù)據(jù)并行組,訓練大模型的時候往往需要很多個這樣的數(shù)據(jù)并行組來縮短訓練的時間。當GPU數(shù)量擴展到成千上萬的時候,性能不僅構建高性能網(wǎng)絡,提高數(shù)據(jù)在計算、存儲之間的),要的是在數(shù)據(jù)包轉發(fā)過程中實現(xiàn)無損化,即不允許出現(xiàn)數(shù)據(jù)包的丟失。業(yè)界實驗發(fā)現(xiàn),數(shù)據(jù)每丟為了實現(xiàn)網(wǎng)絡無損化,網(wǎng)絡和計算、存儲業(yè)務系統(tǒng)之間的協(xié)同越來越重要。在數(shù)據(jù)中心內,業(yè)界已有廠家在分布式存儲、集中式存儲、高性能計算等場景下實踐了“網(wǎng)存協(xié)同”和“網(wǎng)算協(xié)同”的創(chuàng)新方案。在數(shù)據(jù)中心之間,領先的電信運營商也提出了算力網(wǎng)絡的方案,在感知應用、感知算力需求的基礎上,利用全光、端到端切片、彈性調度等技術,針對分布式存儲、跨節(jié)點分布式計算等場景,提供零丟包的業(yè)務保障能力,為算生產(chǎn)要素反映了人類社會不同發(fā)展階段的生產(chǎn)力水平。數(shù)據(jù)作為新型生產(chǎn)要素,是數(shù)字化、網(wǎng)絡化、智能化的基礎,已快速融入生產(chǎn)、分配、流通、消費和社會服務管理等各個環(huán)節(jié),深刻改變著生產(chǎn)、生活和社會治理方式。數(shù)據(jù)的規(guī)模爆發(fā)式增長,不僅在數(shù)字經(jīng)濟發(fā)展中的地位和作用凸顯,而且對傳統(tǒng)生產(chǎn)方式變革具有重大影響:將催生新產(chǎn)業(yè)、新業(yè)態(tài)、新模式,成為驅動經(jīng)濟社在產(chǎn)業(yè)數(shù)字化方面,社會化將打破企業(yè)邊界,使獲取數(shù)據(jù)、運用數(shù)據(jù)的能力成為業(yè)務創(chuàng)新和提升用戶體驗的關鍵。銷售平臺可以根據(jù)買家的瀏覽記錄做出精準推送以提高銷量;制造企業(yè)可以通過分析生產(chǎn)流水線數(shù)據(jù)對生產(chǎn)情況及時做出調整以提高生產(chǎn)效率;家居公司可以通過分析客戶的生活習慣數(shù)據(jù)創(chuàng)造“智慧家庭”以提高生活服務質量,種種應用展示出數(shù)據(jù)在被有效的挖掘、整合后可能產(chǎn)生巨大的價值。業(yè)界有觀點認為,數(shù)20數(shù)據(jù)中心2030據(jù)將逐漸成為與人、技術、流程同樣重要的第四大核心競爭力??缙髽I(yè)邊界的數(shù)據(jù)共享和交換在當下已經(jīng)比較流行,未來主要的變化是多領域數(shù)政府征信信息、關聯(lián)人信息、農(nóng)田信息、農(nóng)資信息,數(shù)據(jù)來源包括同行、政府、農(nóng)資供應商、衛(wèi)星遙感、互聯(lián)網(wǎng)等,數(shù)據(jù)的交易將從點到點的原在政府和公共事業(yè)數(shù)字化方面,社會化可以加速社會治理精準化和人性化。以中國政府的城市一網(wǎng)通管為例,一方面需要構建政企一體、多源整合的政務數(shù)據(jù)和社會化數(shù)據(jù)平臺化對接機制,充分利用電信、供電、供水等公共數(shù)據(jù);另外一方面需要豐富政府側的數(shù)據(jù)創(chuàng)建和數(shù)據(jù)共享能力,不同部門的攝像頭、傳感器、等成為24小時的與傳統(tǒng)生產(chǎn)要素相比,數(shù)據(jù)要素表現(xiàn)出一系列新特征:首先具有非稀缺性,數(shù)據(jù)海量且能夠重復使用;其次具有較強流動性,數(shù)據(jù)要素的流動速可以在一定范圍按照一定權限重復使用。未來社會數(shù)據(jù)將通過“可用又可見”與“可用不可見”相結合的方式形成常態(tài)化跨企業(yè)、跨行業(yè)對接機數(shù)據(jù)社會化能夠在流動、分享、加工和處理的過程創(chuàng)造出新價值,但海量數(shù)據(jù)的匯集也將有可能帶來嚴重的安全風險,基礎設施一旦發(fā)生安全問題,將造成嚴重的后果,如2021年歐洲某云服務提供商的數(shù)據(jù)中心發(fā)生火災,造成360萬網(wǎng)站癱瘓,部分數(shù)據(jù)永久性丟失,社會損失巨大。如何有效利用和保護數(shù)據(jù)已經(jīng)成為數(shù)字經(jīng)濟安全穩(wěn)定運行的關注點。只有不斷更新數(shù)據(jù)安全技術和管理方式,應對快速變化的安全需求,并加強數(shù)據(jù)中心及其相關的基礎網(wǎng)絡、云平臺、數(shù)據(jù)和應用的一體化安全保障能力,才可以確?;A設21數(shù)據(jù)中心2030傳統(tǒng)數(shù)據(jù)中心的運維模式以人為核心,人的能力將成為未來數(shù)據(jù)中心的運維瓶頸。根據(jù)中國信通院2023年最新研究顯示,數(shù)據(jù)中心故障宕機場中心業(yè)務的增長,規(guī)模也越來越大,傳統(tǒng)以人為中國團體標準《數(shù)據(jù)中心基礎設施智能化運行管理評估方法》中將數(shù)據(jù)中心自動化運行發(fā)展從全部人工運行的初級階段到全自動運行的高級階段分為五個等級,我們預測,到2030年,領先的數(shù)據(jù)中心運維水平將達到L4高度運行自動化階段。在這一級別將實現(xiàn)自動預測性排障和分析、全自動應急處置及AI能效管理,在運行態(tài)幾乎實現(xiàn)無人化的前提是數(shù)據(jù)中心全生命周期實現(xiàn)數(shù)字化、網(wǎng)絡化和智能化?;谥悄軄碇螖?shù)據(jù)中心的規(guī)則設計,建設實施和運維運營。面向機器人技術的快速發(fā)展,極簡高效、人機協(xié)同的YesYesYesYesYesYes有運行模式限制時完全執(zhí)行運行操作任務,但有運行模式限制時完全執(zhí)行運行操作任務,但YesYesYesYes圖2-1數(shù)據(jù)中心自動化發(fā)展的五個階段222324人類社會正加速邁向智能世界,跨越式發(fā)展已經(jīng)是全行業(yè)的共同訴求。數(shù)據(jù)中心是新型數(shù)字基礎設施的算力底座,也是加速數(shù)字經(jīng)濟發(fā)展的“發(fā)動機”。未來十年,數(shù)據(jù)中心既要實現(xiàn)百倍算力提升,以滿足快速增長的智能化業(yè)務需求,還要實現(xiàn)百倍能效提升,以我們認為,未來新型數(shù)據(jù)中心將具備多樣泛在、安全智慧、零碳節(jié)能、柔性資源、系統(tǒng)摩爾、對等互2030圖3-1數(shù)據(jù)中心2030的關鍵特征25數(shù)據(jù)中心2030a1.多樣泛在未來數(shù)據(jù)中心的發(fā)展將出現(xiàn)兩極分化,一方面超大型集約化數(shù)據(jù)中心的建設將持續(xù)增長;預計到2030年,單個集群提供的有效通用算力將達70EFLOPS,有效的人工智能算力將達方面滿足各行業(yè)低時延、數(shù)據(jù)安全需求的輕量級生產(chǎn)設備通過物聯(lián)化和數(shù)字化后,接入輕邊緣的比例將超過80%。同時面向新場景,多種創(chuàng)新型數(shù)據(jù)中心也將出現(xiàn),如太空數(shù)據(jù)中心、海底數(shù)據(jù)中心等。多種形態(tài)滿足不同場景部署需求的數(shù)據(jù)中心將為數(shù)字經(jīng)濟的發(fā)展提供源源不斷的新動1)大集群集約化樞紐數(shù)據(jù)中心部署的服務器規(guī)模達到萬臺甚至十萬臺,對服務器的部署運維效率提出了很高的要求。傳統(tǒng)的數(shù)據(jù)中心按照服務器為單位進接網(wǎng)線/光模塊/光纖,資產(chǎn)錄入等一系列工序后才能部署上線。從運維來看,一個運維人員即使維護一千臺服務器,考慮班次等因素數(shù)據(jù)中心也需要配置近百人的運維團隊。傳統(tǒng)的部署和運維方式已經(jīng)不能滿足未來超大數(shù)據(jù)中心的要求。從單服務器走向計算集群,以機柜為單位進行包裝、運輸、部署,以機柜甚至整個數(shù)據(jù)中心為單位進行運維,可以大幅提升部署效率,并降低運·預制化交付:把服務器安裝工作從數(shù)據(jù)中心前移到生產(chǎn)線可以全流程的提高效率、降低成本。在生產(chǎn)過程中就可以按照實際配置進行拷機測試,測試更完備,并可以增加溫度應力等現(xiàn)場不當出現(xiàn)故障時,維修效率也更高,同時整柜運輸比服務器單臺運輸,包裝成本、倉儲成·整機柜工程:機柜內采用集中供電,電源模塊全局池化的技術,根據(jù)負載動態(tài)調節(jié)電源始終工作在最佳效率區(qū)間。通過動態(tài)調節(jié)供電和儲能,應對算力峰值時的突發(fā)用電需求。如使用機柜內置水冷門或者使用液冷技術,將散熱能力26數(shù)據(jù)中心2030·集群新背板:機柜采用線纜背板替代光模塊/光纖,實現(xiàn)通過預制化交付、整機柜工程、集群新背板等創(chuàng)新,實現(xiàn)服務器全盲插,杜絕手工接線錯誤,實現(xiàn)集群的自動化運維,滿足未來大型數(shù)據(jù)中心算2)輕邊緣隨著以云為底座的數(shù)字化、智能化從互聯(lián)網(wǎng)行業(yè)物智聯(lián)場景。超大規(guī)模集約化的數(shù)據(jù)中心承載的應用和數(shù)據(jù)已無法保障遍布任意位置的消費者智處理需要,亟待將云的彈性資源、應用服務及智能推理能力從超大規(guī)模中心延伸到距離各類接入輕邊緣的形態(tài)包括“輕量級邊緣集群”與“輕量級邊緣服務與應用”兩類。前者由云服務商提供小規(guī)模的硬件算力集群,并分布式部署在合適的網(wǎng)絡位置,將全棧云服務的部分核心能力如彈性虛機/容器、存儲、網(wǎng)絡,中間件、數(shù)據(jù)庫、媒體處理、流數(shù)據(jù)處理及AI推理等時延敏感類服務及應用軟件通過物理或邏輯專線從中心云服務區(qū)擴展到邊緣集群站點;后者則以更為輕量化的容器、函數(shù)形式,將中心服務區(qū)的中間件、數(shù)據(jù)庫、媒體處理、流數(shù)據(jù)處理及AI推理等時延敏企業(yè)客戶、家庭客戶、個人消費者及任意第三方提供的硬件及OS環(huán)境上,并可通過開放互聯(lián)網(wǎng)務區(qū)的連接。后者不與邊緣算力硬件及中心到邊緣的物理專線綁定,因此更為輕量和靈活,而前者從全棧云中心服務區(qū)下沉,其云服務與應用能·輕量級邊緣集群第一類是具備公網(wǎng)Internet就近接入開放式公共輕量邊緣。其特點是支持將公有云資源池、云服務及網(wǎng)絡接入能力下沉位置,提供小規(guī)模(數(shù)臺服務器)起步,并可擴展(數(shù)千服務器)的大帶寬、低時延、高性能邊緣云能力。其核心技術特征在于:以將多家運營商網(wǎng)絡接入,為城市區(qū)域提供特別面向視頻渲染、邊緣AI推理、云手機/異構算力下沉到邊緣,大幅度提升邊緣數(shù)據(jù)27數(shù)據(jù)中心2030處理的效率3)云邊協(xié)同,邊緣計算和滿足邊緣側高頻低時延大帶寬的熱數(shù)據(jù)處理能力后,將低頻溫冷數(shù)據(jù)傳輸至中心云進行處理歸檔,實現(xiàn)分級處理;使能中心云的基礎服務和高階服務擴展到邊緣基礎設施上,實現(xiàn)中心-邊緣協(xié)同、全網(wǎng)算力調度、全網(wǎng)第二類是特定企業(yè)云租戶獨占,不對外呈現(xiàn)Internet公網(wǎng)出口的輕量邊緣。除低時延保障之外,更強調本地合規(guī)和多地區(qū)分支部署與云中心統(tǒng)一管理等訴求。通過將公有云端基礎設施與云服務高度集成后,部署到用戶機房,在用戶本地提供標準化的全棧公有云服務能力。面向各類企業(yè)用戶業(yè)務和場景需求,通過高度集成的硬件和靈活適配的云服務軟件,為用戶在距離業(yè)務更近的位置,提供綜合性、一致性的云服務體驗。其核心技術體現(xiàn)在1)高集成度:包含適用于多種環(huán)境、多種場景,復用公有云標準的計算和存儲服務器,為用戶提供標準化彈性算力彈性部署:針對邊緣場景進行獨立設計,搭配輕量邊緣專用的融合節(jié)點機型,提供單站Serverless等場景,提供的定制化的輕量級硬件支持。此類輕量邊緣需要企業(yè)用戶與公有云服務商共同維護基礎設施可靠性,保障·輕量級邊緣服務與應用云以服務和應用的形態(tài)從大規(guī)模中心服務區(qū)擴展延伸到最終用戶近端的輕量級邊緣,由于與硬件解耦,可充分利用全球數(shù)千異構邊緣節(jié)點,百萬服務器資源,不依賴于硬件、),從而驅動云上應用可更廣泛地服務于千行萬業(yè)??梢詾閷崟r新媒體應用提供就近接入,量的高級邊緣函數(shù)能力,使得對實時交互有要求的媒體業(yè)務、機器人業(yè)務、WEB3等業(yè)務邏輯天然運行在邊緣,構建起算子在邊緣內、邊緣與邊緣、邊緣與云之間跨地域、跨28數(shù)據(jù)中心20303)新型態(tài)隨著大數(shù)據(jù)、人工智能、元宇宙為代表的數(shù)字經(jīng)濟高速發(fā)展,數(shù)據(jù)中心一方面要匹配用戶對低時延、極致體驗的業(yè)務訴求,又要應對土地緊缺和輕邊緣的兩級化發(fā)展方向之外,業(yè)界也正在探索·運營商接入網(wǎng)絡邊緣數(shù)據(jù)中心運營商接入網(wǎng)絡邊緣數(shù)據(jù)中心是一種近幾年新出現(xiàn)的創(chuàng)新型形態(tài),它通過在接入網(wǎng)絡邊緣節(jié)點提供用戶所需的服務和計算功能,使應用服務和內容更靠近用戶,并實現(xiàn)與網(wǎng)絡協(xié)同,為用戶提供可靠、極致的業(yè)務體驗。根據(jù)華為預測,2030年全球運營商部署的計算能力,并且部署在離用戶接入網(wǎng)絡更近的地方,因此可以大大降低內容數(shù)據(jù)分發(fā)的延遲,為用戶提供更快速、更流暢的業(yè)務體區(qū)縣,能夠在邊緣節(jié)點對數(shù)據(jù)進行本地化處理,避免數(shù)據(jù)跨越網(wǎng)絡傳輸,實現(xiàn)了屬地化管理,確保企業(yè)核心數(shù)據(jù)資產(chǎn)的安全性,做到了可視、可管、合法合規(guī),從而充分保護的網(wǎng)絡連接,根據(jù)業(yè)務需求和網(wǎng)絡狀態(tài),動態(tài)調整網(wǎng)絡東西向連接和南北向路徑,避免單點故障,支持就近接入,實現(xiàn)最優(yōu)化的連接效果,為用戶提供更可靠、更穩(wěn)定的數(shù)據(jù)了虛擬機、容器、裸金屬、網(wǎng)絡、存儲等多網(wǎng)、業(yè)的集成發(fā)放自動化,最小化邊緣數(shù)據(jù)中心的管理維護成本,實現(xiàn)邊緣業(yè)務的快速開發(fā)、快速部署。支持統(tǒng)一的北向接口,方便端、網(wǎng)、邊、云一體化的性能統(tǒng)計和故障MEC數(shù)據(jù)中心具有獨特的應用場景和技術實踐:在內容分發(fā)領域,MEC能夠為裸眼3D、XR等業(yè)務提供更流暢、更清晰的觀看實時、高效的數(shù)據(jù)推理能力,為企業(yè)提供更年,中國運營商已經(jīng)部署了超過1200多個MEC節(jié)點,覆蓋了中國90%以上的地市。一體化邊緣硬件,優(yōu)化邊緣業(yè)務體驗,是未·海底數(shù)據(jù)中心數(shù)據(jù)中心運行過程會產(chǎn)生巨大的熱量,散熱29數(shù)據(jù)中心2030制冷所帶來的耗電量極大,約占總能耗的三分之一。為了節(jié)約能耗支出,把數(shù)據(jù)中心放在水下,利用海水冷卻給“服務器”降溫,成為降低數(shù)據(jù)中心能耗的解決方案之一。海底數(shù)據(jù)中心在提供數(shù)據(jù)信息存儲、計算、傳輸服務的同時,實現(xiàn)了綠色、節(jié)能、高效的和陸地數(shù)據(jù)中心相比,海底數(shù)據(jù)中心具有很大的優(yōu)勢。首先,海底數(shù)據(jù)中心具有節(jié)省資源的優(yōu)勢,海水作為數(shù)據(jù)中心的自然冷源,將其產(chǎn)生的熱量利用周圍的流動水帶走。由于海水的比熱容較高,數(shù)據(jù)中心對水溫的影響變化可以忽略不計。這一做法,不僅對環(huán)境的影響較小,也極大的降低了數(shù)據(jù)中心用于散熱制冷的能量消耗:中國首個海底數(shù)據(jù)海底數(shù)據(jù)中心無需蒸發(fā)散熱,減少了冷卻塔和冷水系統(tǒng),水資源消耗為零,且大部分設施位于海底,土地資源消耗極少,僅為傳統(tǒng)數(shù)據(jù)中心的十分之一。其次,海底數(shù)據(jù)中心具有低時延的優(yōu)勢,全球主要的互聯(lián)網(wǎng)公司、高新科技企業(yè)云大多部署在沿海發(fā)達地區(qū),建立靠近用戶的水下數(shù)據(jù)中心能夠縮短數(shù)據(jù)的傳輸距離,降低傳輸時延,有效滿足工業(yè)互聯(lián)網(wǎng)、遠程醫(yī)療等沿海發(fā)達地區(qū)的地價昂貴,數(shù)據(jù)中心建在海底能夠大大降低土地成本。在運營過程中,能源消耗降低,電費大幅減少,運營成本急海底數(shù)據(jù)中心優(yōu)勢明顯,正在逐步進行商業(yè)化探索:2023年3月全球首個商用數(shù)據(jù)中心海底艙在中國海南正式運行,是全球最大的海底數(shù)據(jù)艙,有望成為數(shù)據(jù)中心綠色發(fā)展·太空數(shù)據(jù)中心隨著無人值守和自我管理型數(shù)據(jù)中心日益受到大家關注,太空作為網(wǎng)絡的極端邊緣和無人值守計算的理想運行地點,逐漸成為數(shù)據(jù)中心建設的目標地點之一。隨著太空商業(yè)化的不斷發(fā)展,衛(wèi)星提供電路、廣播、導航等服務逐漸普及,使部署太空數(shù)據(jù)中心成為可能。未來十年,多個商業(yè)空間站和數(shù)千顆衛(wèi)星將發(fā)射進入近地軌道。業(yè)界正在研究將數(shù)據(jù)中心送入太空軌道運行的可能性,打造一個由數(shù)據(jù)中心、邊緣計算組成的為太空軌道數(shù)據(jù)中心部署到太空存在著一定的優(yōu)勢,其成長空間有望被打開。第一,數(shù)據(jù)中心將更30數(shù)據(jù)中心2030加綠色高效,太空中太陽能儲量豐富,能源效率更高,可以更加穩(wěn)定持續(xù)的為數(shù)據(jù)中心進行供電,從而減輕地球的能源壓力,降低二氧化碳的排放。太空低溫環(huán)境會使數(shù)據(jù)中第二,太空數(shù)據(jù)中心建設會提高太空數(shù)據(jù)的利用效率和傳輸速率,減少衛(wèi)星與地面間傳輸?shù)臄?shù)據(jù)量。地球的近地軌道資源逐步被占滿,低軌衛(wèi)星的數(shù)目越來越多,產(chǎn)生的數(shù)據(jù)量越來越大,衛(wèi)星數(shù)據(jù)傳輸?shù)拇翱谄谥饾u被壓縮,未來衛(wèi)星數(shù)據(jù)很難在有限時間內被完全傳輸。在太空中部署數(shù)據(jù)中心,使數(shù)據(jù)靠近計算端和應用端,數(shù)據(jù)在太空中直接完成有利于邊緣計算,系統(tǒng)效率不斷提升,進一步降低服務延遲。第三,太空數(shù)據(jù)中心運營成本低,數(shù)據(jù)安全性高。數(shù)據(jù)中心的主要運營成本包括維護和能源,太空的固有環(huán)境優(yōu)勢會大大降低數(shù)據(jù)中心的運營成本。干擾和攔截衛(wèi)星發(fā)送的數(shù)據(jù)更加具有挑戰(zhàn)性,衛(wèi)星太空數(shù)據(jù)中心的建設目前也存在一些問題。比如太空數(shù)據(jù)中心的建設成本過高,從研發(fā)到發(fā)射將耗費至少10億元人民幣,對應的這對服務器的整體可靠性和抗輻射性提出了更高的要求:專用計算芯片的創(chuàng)新,磁隨機到2030年,隨著有效載荷送上太空的成本進一步降低,在太空建設數(shù)據(jù)中心的可能性a2.安全智慧1)高安全數(shù)字經(jīng)濟的核心技術涉及數(shù)據(jù)、算法與算力三個要素,確保上述三個要素的安全與合規(guī)是數(shù)字經(jīng)濟發(fā)展的基礎。數(shù)據(jù)中心作為數(shù)字經(jīng)濟的基礎設施,不僅是承載上述三個要素的平臺,同時也是數(shù)據(jù)流通交易的平臺,因此,數(shù)據(jù)中心必須在系網(wǎng)絡等數(shù)據(jù)處理的全過程,覆蓋從芯片到應用全數(shù)據(jù)中心的數(shù)據(jù)基礎設施需要在設計上充分考慮存儲,傳輸過程中,能夠根據(jù)不同的數(shù)據(jù)價值和合規(guī)要求配套不同的安全策略,保證數(shù)據(jù)在數(shù)據(jù)中心內的全生命周期的安全合規(guī),可管可控。同數(shù)據(jù)中心需要提供基于零信任理念的安全方案,數(shù)據(jù)在傳輸和落盤過程中需要提供加密能力,整個密碼學體系需要充分考慮到抗量子計算攻擊的風險。對于高價值數(shù)據(jù)提供基于機密計算,聯(lián)邦學習,同態(tài)加密等使用態(tài)的保護方案,實現(xiàn)可用31數(shù)據(jù)中心2030高價值數(shù)據(jù)的防護要具備更強的抗攻擊能力,高價值數(shù)據(jù)與普通數(shù)據(jù)隔離存儲,高價值數(shù)據(jù)的完整性,機密性保護方案,比如WORM,秘鑰管理和分發(fā)的機制,需要考慮提供軟硬結合的安全面向2030年,除了傳統(tǒng)的設備安全、網(wǎng)絡安全之外,可信計算、機密計算和AI大模型時代的·新計算范式下的可信計算期,其巧妙的應用了密碼學原理解決了軟件完整性保護與加密密鑰保存問題。但其已經(jīng)越來越難以有效支撐針對云化虛擬機、異構主流開源社區(qū)已經(jīng)開始支持軟件TPM虛擬務需要依靠軟件libTPM模擬,缺乏硬件可為徹底解決針對虛擬機、異構計算環(huán)境的軟件完整性度量問題,需要擴展當前可信計算多實例,在此基礎上不僅可以為多個VM提供軟件完整性度量服務,也可以為可信計算整性度量服務,最終實現(xiàn)以硬件可信根為基礎的,支持云化、異構計算環(huán)境的可信計算可信計算TPM標準可信計算TPM標準廠商A信多廠商B圖3-2新計算范式下的可信計算32數(shù)據(jù)中心2030·數(shù)字經(jīng)濟時代的異構機密計算機密計算是在基于硬件的可信執(zhí)行環(huán)境(TEE)內運行代碼,以保證環(huán)境內數(shù)據(jù)的機密性、完整性以及運算過程機密性的新計算模式。數(shù)字經(jīng)濟時代對機密計算的需求來自多個方面,其一,是來自企業(yè)與用戶的互信需求,需要在用戶不依賴企業(yè)計算環(huán)境可信的前提下保護用戶數(shù)據(jù)安全及隱私,典型場景如云上的內鬼管理員作案;其二,來自企業(yè)自身的防御需求,在不可信的環(huán)境中通過有效手段來保護企業(yè)數(shù)據(jù)安全,典型場景如部署在公共場所的邊緣計算設備中的密鑰管理保護;其三,來自機構之間數(shù)據(jù)共享的需求,在互相不暴露各自數(shù)據(jù)的前提下,仍然能進行數(shù)據(jù)合作,典型場景如多方計算與當前,隨著全球范圍內數(shù)據(jù)與隱私保護法律法規(guī)的陸續(xù)出臺,機密計算技術已經(jīng)逐漸被業(yè)界認可和接受,越來越多的企業(yè)青睞于軟硬件結合的數(shù)據(jù)安全隱私保護解決方案,為數(shù)據(jù)共享和交換構建安全可信的計算環(huán)境。然而,當前的機密計算技術落地主要覆蓋的如在手機、平板等端側設備上的支付、人臉識別應用,或在云上采用機密虛擬機或者機密容器實現(xiàn)的區(qū)塊鏈、密鑰管理等應用。面向數(shù)字經(jīng)濟時代的大規(guī)模數(shù)據(jù)的通用計算和AI計算場景,機密計算仍然處在試點和探索到2030年,隨著大數(shù)據(jù)應用的進一步成熟數(shù)據(jù)共享進而挖掘數(shù)據(jù)價值,訓練更精準的大模型等場景會變得更加普遍。機密計算技術可以在大規(guī)模的數(shù)據(jù)分享與計算過程中既用不可見”,因此有望成為未來數(shù)據(jù)安全的主流技術。為了能夠高效率的適配大模型、中心的機密計算技術將會逐步演變至以數(shù)據(jù)為中心的異構機密計算技術,同時兼容已有的大模型軟件框架,支持多樣化算力設備如具體來說,面向2030的異構機密計算架構有以(1)安全算力與普通算力生態(tài)完全兼容且可靈活配置,同樣的計算任務和數(shù)據(jù),可以由用戶靈活選擇是否部署安全算力,不會因為采用了機密計算技術而帶來應用和軟件生(2)安全算力從CPU內的可信執(zhí)行環(huán)境加速和卸載,并兼容已有的軟件生態(tài),又能通過訪問控制、通信加密等手段保障異構計(3)安全算力從單節(jié)點擴展至多節(jié)點,在整個數(shù)據(jù)中心實現(xiàn)安全算力的靈活調度,完成算力資源的統(tǒng)一管理,從而有效滿足多機33數(shù)據(jù)中心2030·大模型時代的AI安全新生態(tài)隨著以ChatGPT為代表的大模型時代的到來,AI將在更多的領域發(fā)揮關鍵性的作用,從根本上改變人類的生活和工作方式。當各設施行業(yè),AI承載了越來越多的商業(yè)價值,就會誘生出各種新型的安全威脅與攻擊手擊,如數(shù)據(jù)投毒(藥餌)、模型后門、對抗樣本、模型萃取,以及專門針對大語言模型AI技術有意識或無意識的濫用,如將AI用),社會、行業(yè)以及廣大用戶普遍關心的問題。全球主要國家、地區(qū)、國際標準組織也在著效監(jiān)管的方式與方法。2021年,歐盟率先發(fā)布了《歐盟AI法》草案,對高風險AI系健壯性和網(wǎng)絡安全方面的要求。針對大模型府也出臺了《互聯(lián)網(wǎng)信息服務深度合成管理在此大背景下,業(yè)界迫切需要針對AI業(yè)務發(fā)展中遇到的安全問題、安全威脅,提出創(chuàng)新的安全(1)AI全生命周期安全:將安全融入到AI的整個生命周期中,將安全治理的理念貫徹與治理為起點,通過持續(xù)的模型安全測評與(2)用AI保護AI:由于傳統(tǒng)安全手段無法感知和防御對抗樣本、提示注入等新型AI需要基于深度神經(jīng)網(wǎng)絡的強大的端到端學習與防御各種安全攻擊,從而實現(xiàn)“用魔法打(3)面向監(jiān)管的透明可回溯的技術:針對AI加強監(jiān)管,以避免或減弱其對人類社會的識。借助于創(chuàng)新的透明責任可回溯技術,在34數(shù)據(jù)中心20302)高可靠高可靠的數(shù)據(jù)中心是支撐數(shù)字經(jīng)濟發(fā)展的重要基同城級的高可靠,走向更大范圍的跨域高可靠;從主要關注數(shù)據(jù)級高可靠,走向關注業(yè)務連續(xù)性的業(yè)務級高可靠,系統(tǒng)級和業(yè)務級可用性均將達為實現(xiàn)數(shù)據(jù)中心跨域、業(yè)務級高可靠,需要研究·多DC數(shù)據(jù)一致性保障當前通過雙活、同步復制等技術基本能解決單DC集群內、同城雙DC集群間的數(shù)據(jù)一致性問題,但無法解決一致性與遠距離時延未來,面對遠距離跨域數(shù)據(jù)中心間的數(shù)據(jù)一致性保障,將需要進一步探索超低時延光網(wǎng)絡傳輸技術、多DC分布式數(shù)據(jù)庫技術、以及結合時序化、精準時鐘同步等技術,并考遠距離、大規(guī)模、靈活的多DC數(shù)據(jù)一致性·多DC異地多活數(shù)據(jù)中心多地多活技術的實現(xiàn)是一個系統(tǒng)工算資源層端到端的實現(xiàn)業(yè)務多活分擔、精準未來,隨著云計算、低時延大帶寬網(wǎng)絡互聯(lián)技術的不斷發(fā)展,跨多個數(shù)據(jù)中心的資源池將整合成一個“虛擬數(shù)據(jù)中心”,上層業(yè)務的部署將對地域無感知,即業(yè)務的的連續(xù)性也將實現(xiàn)去地域化,具備多DC異·基于AI的高可靠當前,通過預設操作、人工決策、手動觸發(fā)等進行數(shù)據(jù)中心故障切換和應急管理的方環(huán)境相結合,同時與供電網(wǎng)絡、地震感知系統(tǒng)等外部環(huán)境以及安全態(tài)勢等要素結合,再法,進行災難關聯(lián)智能預測,并做到自動化預防響應。在發(fā)生故障和災難時自主開展全鏈條自愈恢復,進而在隱患影響到業(yè)務前,執(zhí)行有效預判并開展計劃性、應急性響應,提前解決影響業(yè)務運行的問題。做到要素全量感知、過程全監(jiān)控、決策智能化、切換自動化、指揮可視化,實現(xiàn)全面合規(guī)的災備運通過多DC數(shù)據(jù)一致性技術、端到端多地多提升跨DC業(yè)務連續(xù)性保障能力,充分調度35數(shù)據(jù)中心20303)高智能數(shù)據(jù)中心投資飛速增長,規(guī)模日益增大、密度不斷提升,數(shù)據(jù)中心的復雜程度越來越高,數(shù)據(jù)中心的大型化增加了數(shù)據(jù)中心的建設運營的復雜度使能數(shù)據(jù)中心規(guī)劃、建設、運營全生命周期,促·AI使能AI技術用于數(shù)據(jù)中心規(guī)劃、建設、運營全生命周期,能夠大大提高數(shù)據(jù)中心的建設運營統(tǒng)與數(shù)據(jù)中心供電、制冷系統(tǒng)結合能顯著降低數(shù)據(jù)中心的能耗、降低運行故障率、提升運營效率:例如AI技術和UPS結合大幅提高數(shù)據(jù)中心的用電質量,UPS對輸入電網(wǎng)和輸出負載質量相關主要參數(shù)進行實時跟蹤,AI技術和數(shù)據(jù)中心內各個系統(tǒng)和部件的進一步融合,推進數(shù)據(jù)中心運營更加高效。應用智能運維,有效提高數(shù)據(jù)中心運營的流程化和標準化,提升運維管理效率。網(wǎng)絡智能運維是數(shù)據(jù)中心智能運維最重要的應用場景之一,可持續(xù)推動網(wǎng)絡可視、可管、可控能力對數(shù)據(jù)中心網(wǎng)絡的管控、自動運維及優(yōu)化,對各類網(wǎng)絡故障進行恢復自愈,對阻塞進行管理,同時支持網(wǎng)絡自我調優(yōu)和自我演進,為用戶提供更加優(yōu)質的網(wǎng)絡服務。網(wǎng)絡自身形成面向任意場景具備執(zhí)行、監(jiān)視分析和決策能力,完全實現(xiàn)閉環(huán)管理和自動化能力,·數(shù)據(jù)中心數(shù)字孿生數(shù)字孿生技術借助歷史數(shù)據(jù)、實時數(shù)據(jù)、算法模型等,實現(xiàn)對物理實體全生命周期的模擬、驗證、預測、優(yōu)化、控制。數(shù)字孿生技術在數(shù)據(jù)中心的應用將大幅提升數(shù)據(jù)中心自動化、智能化水平,給數(shù)據(jù)中心所面臨的安全運營、節(jié)能減排等挑戰(zhàn)帶來極具競爭力的解決方案。數(shù)字孿生技術在數(shù)據(jù)中心設計階段的應用主要包括仿真評估和3D可視等,隨著技術的進一步發(fā)展,數(shù)字孿生技術還將實現(xiàn)設計方案的自動優(yōu)化。在數(shù)據(jù)中心建設安全進行管理,實現(xiàn)進度過程可視,人力物力協(xié)同,提升這一階段的智能化水平。在數(shù)據(jù)中心運維階段,數(shù)字孿生可視化利用3D技術,將孿生體對象,包括園區(qū)建筑、機房強弱電鏈路等,通過數(shù)據(jù)處理和建模仿真實容量、鏈路、告警等信息的可視化,并對數(shù)據(jù)進行模擬、分析、預測和驗證,提供決策隨著數(shù)據(jù)中心大型化、集中化的發(fā)展,傳統(tǒng)向具有數(shù)字化、網(wǎng)絡化、智能化特征的數(shù)據(jù)能于數(shù)據(jù)中心全生命周期,以實現(xiàn)投資效益與運營效率的最大化,無疑是大勢所趨。智能運維機器人等新技術的使用進一步實現(xiàn)了解放了運維人力,預計在2030年,業(yè)界領先的數(shù)據(jù)中心自動化運行能力將發(fā)展到L4級,幾乎達到“無人化”。數(shù)據(jù)中心的高智36數(shù)據(jù)中心20303.零碳節(jié)能1)綠供電數(shù)據(jù)中心整體的碳排放量較大,對于數(shù)據(jù)中心服務商,高能耗也意味著更多經(jīng)營成本。隨著“碳中和”逐漸成為全球的共識,數(shù)據(jù)中心將加速向綠色低碳的方向邁進:綠電的發(fā)展為數(shù)據(jù)中心提供了更加豐富、優(yōu)惠的電能供給,全面助力數(shù)據(jù)中心零碳目標的實現(xiàn)。隨著全球綠色低碳發(fā)展政策的不斷強化,風能、太陽能等清潔能源在數(shù)據(jù)中心能源結構中所占比例將會提升,預計到2030年,大型數(shù)據(jù)中心綠電使用率將達到·提高綠電采用率風電產(chǎn)業(yè)是可循環(huán)新能源產(chǎn)業(yè),作為一種可再生能源,其分布廣、無污染的特性有效控制了不斷增加的能源供給對環(huán)境所帶來的影響。在全球能源過度消耗的生態(tài)環(huán)境下,對新能源的研究和利用已成為世界熱門話題。風力發(fā)電是新能源發(fā)電技術中最具規(guī)模開發(fā)和商業(yè)化發(fā)展前景的發(fā)電方式,目前各國都在加大對風力發(fā)電及其相關的技術研究。全球風電行業(yè)年度市場增長率達40%,已有一百多個國家涉足到風電行業(yè),該行業(yè)已經(jīng)數(shù)據(jù)中心產(chǎn)業(yè)的綠色低碳需求,給風電企業(yè)提供了穩(wěn)定的消納空間,使數(shù)據(jù)中心和新能源企業(yè)能夠協(xié)同發(fā)展。例如,中國烏蘭察布地區(qū)周邊的風電資源豐富、裝機充裕、電價低,可實現(xiàn)清潔能源供電,華為早在2013年就在烏蘭察布建設了數(shù)據(jù)中心,利用風電(2)光伏價在規(guī)?;瘮U張中基本與煤價持平)、技術性和公眾認可度方面取得了巨大的進步,光伏發(fā)電能夠為解決氣候問題、降低能源使用分布式光伏可以在數(shù)據(jù)中心就近建設、就近供電,進而減少供電成本。由于分布式光伏主要建設在建筑屋頂,不會額外占用土地資源,使其可以在數(shù)據(jù)中心建筑屋頂建設。目前,光伏發(fā)電越來越多的應用于數(shù)據(jù)中心輔助設施或次要負荷的供電,如照明、電梯、監(jiān)控系統(tǒng)等。而“光伏+儲能”和“光伏+電網(wǎng)”等多種互補模式可以不間斷的為數(shù)據(jù)中心提供清潔電能,滿足數(shù)據(jù)中心晝夜不停(3)水電水電作為一種清潔、可再生的能源,在優(yōu)化電力結構、保障電力安全運行、降低電力資源消耗、提高電力經(jīng)濟效益等方面具有重大不僅能夠用清潔能源對數(shù)據(jù)中心進行供電,還能就地取材利用水資源幫助數(shù)據(jù)中心冷卻。為了降低能耗及成本,中國很多數(shù)據(jù)中心位于水電資源豐富的地區(qū):位于中國三峽地區(qū)的東岳廟數(shù)據(jù)中心,運行時所需要的能源完全來自于附近的三峽水電站,并且它的冷卻也直接應用三峽水庫中的水,解決了數(shù)37數(shù)據(jù)中心2030·動態(tài)微電網(wǎng)利用風能、水能、太陽能等綠色能源對數(shù)據(jù)中心供電、能源可持續(xù)發(fā)展以及綠色低碳目標的達成具有重要意義。然而,綠色能源的利用具有不可預測性,不能長時間持續(xù)穩(wěn)定的供電,可能會導致電力系統(tǒng)的波動甚至崩微電網(wǎng)是指由分布式電源、儲能裝置、能量轉換裝置、相關負荷和監(jiān)控、保護裝置匯集而成的小型發(fā)配電系統(tǒng)。數(shù)據(jù)中心微電網(wǎng)在綠色能源充足之時就近消納,省去在電網(wǎng)中傳輸?shù)膿p耗,提高能源的使用效率,并和電網(wǎng)單點連接,在能源供應不穩(wěn)定時,利用電網(wǎng)供電。微電網(wǎng)采用先進的控制方式以及大可控負荷連接在一起,使得它對于電網(wǎng)系統(tǒng)成為一個可控負荷,并且可以施行并網(wǎng)和獨立兩種運行方式,充分維護了微電網(wǎng)和大電目前數(shù)據(jù)中心微電網(wǎng)已經(jīng)有很多實踐,例如中國張北云計算基地綠色能源中心新能源微面向2030,隨著微電網(wǎng)關鍵技術的進一步研發(fā)以及數(shù)據(jù)中心綠色低碳發(fā)展的進一步推2)新儲能儲能技術通過“削峰填谷”,成為降低數(shù)據(jù)中心電力成本的重要方式。數(shù)據(jù)中心能耗高,電力成本占運營總成本的60%-70%,供電公司通常會提供波峰或者波谷電價,數(shù)據(jù)中心可利用儲能系統(tǒng)在波谷時存儲電力,并在高峰期利用,以降低數(shù)據(jù)中心用電成本。國際能源署發(fā)布的《2022年世界能源展望》報告顯示,隨著越來越多國家開始加速能源轉型,許多國家和地區(qū)制定了可再生能源發(fā)展目標及規(guī)劃,加速能源轉型。根據(jù)法國政府計劃,到2030年,法國可再生能源發(fā)電場。日本最新版能源基本計劃提出,2030年可再生能源發(fā)電占比將提高到36%至38%。全球可再生能源產(chǎn)業(yè)進入一個快速發(fā)展期,可再生能源的滲透率越高,平衡電力系統(tǒng)負荷需求越大,·鋰進鉛退隨著數(shù)據(jù)中心對內部空間容量管理及高效運營的需求逐漸加強,以提升數(shù)據(jù)中心功率密度為目標的數(shù)據(jù)中心改造方式正在成為推動數(shù)據(jù)中心升級的重要路徑。在數(shù)據(jù)中心儲能方面,鋰離子電池以其高能量密度、高輸出電壓及高安全性特點迅速成為替代當前數(shù)據(jù)中心鉛蓄電池的下一代儲能設施:目前越來38數(shù)據(jù)中心2030越多的數(shù)據(jù)中心開始指定鋰離子電池作為供電單元。相較于傳統(tǒng)鉛蓄電池,鋰離子電池具有諸多優(yōu)勢,在體積方面,鋰離子電池體積小、重量輕,數(shù)據(jù)中心運營人員可直接將鋰離子電池放在更高位置而無需采用加固地板;在占地面積方面,鋰離子電池占用空間僅有鉛蓄電池的三分之一,能夠更好地適應模塊化數(shù)據(jù)中心機房環(huán)境,輕便靈活的特點使用壽命意味著數(shù)據(jù)中心電池更換及維護成本將得到極大地降低;在安全可靠性方面,當前主流的數(shù)據(jù)中心鋰離子采用長壽命的磷酸鐵鋰電芯及四級架構系統(tǒng)保護方法,電池充放電性能能夠得到有效保障;在電池管理方面,鋰離子電池可與更為先進的電池監(jiān)控供電池運維時間、健康狀態(tài)等信息。隨著市電供電環(huán)境的日益完善,數(shù)據(jù)中心儲能電池使用場景將不斷減少,鋰離子電池的應用能夠有效壓縮數(shù)據(jù)中心電池運維管理成本,助力數(shù)據(jù)中心安全高效管理,未來必將得到更·氫儲能氫能由于燃燒時不排放溫室氣體和細粉塵,與全球碳減排戰(zhàn)略相契合:和光伏和風電等可再生能源相比,氫能可以克服其波動性和間歇性的短板,成為世界能源轉型的關鍵補充。氫儲能在全球范圍內正得到越來越多的關注和應用:全球已經(jīng)有20多個國家和地電力儲能方式目前主要有抽水蓄能、鋰電子電池等等,與其他儲能方式比,氫儲能具有放電時間長、規(guī)?;瘍湫詢r比高、儲運方式靈活、不會破壞生態(tài)環(huán)境等優(yōu)勢。另外,氫儲能應用場景豐富,在電源側,氫儲能可以減少棄電、平抑波動;在電網(wǎng)側,氫儲能可以為電網(wǎng)運行調峰容量和緩解輸變線路阻承載著支撐各行業(yè)實現(xiàn)智能化轉型的重要使命,因此保障數(shù)據(jù)中心的安全具有重要的戰(zhàn)略意義。在使用氫能供電時,數(shù)據(jù)中心面臨的主要風險是氫氣泄漏導致燃燒、爆炸,造成對數(shù)據(jù)中心的物理性傷害。因此,如何有隨著氫能的不斷發(fā)展,已經(jīng)有一些企業(yè)在數(shù)據(jù)中心中應用,比如業(yè)界某公司的數(shù)據(jù)中心代柴油發(fā)電機作為備用電源。氫儲能目前仍處于起步階段,隨著氫能的不斷發(fā)展完善,39數(shù)據(jù)中心20303)液制冷制冷系統(tǒng)是數(shù)據(jù)中心除IT設備之外的第二大耗能部分:數(shù)據(jù)中心的IT設備在運行時持續(xù)產(chǎn)生熱量,在超出額定功率和范圍時會導致服務器宕機引起業(yè)務中斷、設備壽命縮短等一系列問題,所以需要通過制冷系統(tǒng)用來維持IT設備的正常其發(fā)展以綠色節(jié)能為導向,朝著融合技術創(chuàng)新、模塊化和集成化方向發(fā)展,并通過智能化的手段與IT設備的運行狀況相結合,進行動態(tài)的適配液冷技術多適用于高功率、高密度數(shù)據(jù)中心,數(shù)據(jù)中心的液冷技術目前處于探索階段,總體發(fā)展趨勢良好。隨著數(shù)據(jù)中心機柜平均功率密度的逐年上升,對液冷技術的需求也就不斷增加,液冷數(shù)據(jù)中心的市場規(guī)模持續(xù)擴大。液冷技術的應用不僅有助于數(shù)據(jù)中心的節(jié)能和降噪,也有助于提升單位空間的服務器密度,從而提升數(shù)據(jù)中心的·全液冷技術全液冷目前主要有冷板式液冷、浸沒式液冷和噴淋式液冷三種技術路線。冷板式液冷技術是通過冷板將發(fā)熱元器件的熱量間接傳遞給封閉在循環(huán)管路中的冷卻液體,通過冷卻液體將熱量帶走的一種實現(xiàn)方式。在該項技術中,工作液體與被冷卻對象分離,工作液體與電子器件不直接接觸,而是通過液冷板等高效導熱部件將被冷卻對象的熱量傳遞到冷卻液中,因此冷板式液冷技術又稱為間接浸沒式液冷是最近幾年備受業(yè)界關注的新型散熱技術:它主要是采用特定的冷卻液作為熱量。同時,冷卻液通過循環(huán)過程與外部冷源進行熱交換,將熱量釋放到環(huán)境中去。由于架構特殊,浸沒式液冷具有獨特的優(yōu)勢。首先,浸沒式液冷的冷卻液與發(fā)熱設備直接接觸,散熱效率較高;第二,冷卻液具有較高的導熱率和比熱容,運行溫度變化較?。粯O大地提升能源的使用效率。這種散熱方式同風冷相比,密度更高、更節(jié)能、防噪音效噴淋式液冷通過在服務器內部部署噴淋模塊,使用一種對人、IT設備和環(huán)境無害無腐蝕的絕緣液體,有針對性的對發(fā)熱器件進行噴淋降溫的解決方案。噴淋液冷具有器件集成度高、散熱效率強、高效節(jié)能和靜音的特之一。在傳統(tǒng)機房部署液冷會帶來部署成本和部署難度方面的問題。浸沒式和噴淋式液冷還需的友好程度等。而冷板式液冷不需要昂貴的水冷機組,在減少總體擁有成本的同時,可40數(shù)據(jù)中心2030·風液混合風液混合數(shù)據(jù)中心是由于目前液冷成本還較式。因此這兩種方案混合部署,能夠帶來成風液混合成為數(shù)據(jù)中心制冷技術發(fā)展新趨 勢,未來數(shù)據(jù)中心市場將出現(xiàn)“風冷+液冷”混合發(fā)展的新格局:風冷技術不會被液冷技 術完全取代,客戶會根據(jù)不同需求,選擇不 同的數(shù)據(jù)中心制冷方案。對于部署了較低單 機柜功率的數(shù)據(jù)中心,客戶依然會選擇風冷 的制冷方式。而針對超算、能源勘測等高密 度大規(guī)模計算需求,綜合考慮成本因素,靈 活地選擇冷板和浸沒的混合液冷,部分功耗 大的部件和設備改用液冷的解決方案也將成為選擇??偠灾?,液冷技術將與風冷技術 ·極致PUE“能耗指標”及“碳排放指標”成為數(shù)據(jù)中心的核心競爭力所在,挖掘數(shù)據(jù)中心的節(jié)能減排潛力,提升數(shù)據(jù)中心建設的能效標準至數(shù)據(jù)中心有自己的特質,不僅分地域特點,也要分行業(yè)特點。數(shù)據(jù)中心從規(guī)劃設計、部署實施到管理運維全生命周期采用關鍵系統(tǒng)·最優(yōu)WUE水資源是人類賴以生存和發(fā)展的基本元素,是維系生態(tài)系統(tǒng)和支撐社會經(jīng)濟發(fā)展不可替代的戰(zhàn)略資源,數(shù)據(jù)中心是耗水大戶,尋求PUE和WUE的平衡,實現(xiàn)最優(yōu)WUE極其多耗水能幫助數(shù)據(jù)中心實現(xiàn)更優(yōu)的PUE,因此,必須基于實際的業(yè)務訴求、地理環(huán)境,在PUE和WUE之間尋求平衡,實現(xiàn)最優(yōu)則減少用水,并通過收集雨水、廢水處理循環(huán)利用、減少機組濕工況運行的時間等開源41數(shù)據(jù)中心20304.柔性資源隨著公有云、行業(yè)云、私有云作為數(shù)字化、智能化平臺底座在全球各行業(yè)的廣泛深度普及,加之興未艾與爆炸式增長,云化架構將成為未來數(shù)據(jù)中心基礎設施的“標配”之一,即通過在全球分布式數(shù)據(jù)中心硬件之上疊加云操作系統(tǒng)軟件,為千行萬業(yè)、政企客戶以及多樣化業(yè)務應用提供多化算力、存力、運力共享,以及動態(tài)隨需而變的計算”、“泛協(xié)作”的方向持續(xù)演進,從而實現(xiàn)1)全池化通過超大規(guī)模資源池化,實現(xiàn)多租、多應用對數(shù)據(jù)中心算力、存力、運力資源的最大化共享,是云最本質的特征之一,然而,由于當前云數(shù)據(jù)中心架構與技術的制約,計算、存儲、網(wǎng)絡資源雖限制了規(guī)模化、集約化共享效率的進一步提升。因此,未來5-10年云數(shù)據(jù)中心的“全池化”是主要趨勢,具體體現(xiàn)在:跨硬件代次CPU統(tǒng)一池化、跨節(jié)點內存統(tǒng)一池化、存儲統(tǒng)一池化(存算分離)、異構算力統(tǒng)一池化,及DCN網(wǎng)絡統(tǒng)·跨硬件代次CPU池化當前云數(shù)據(jù)中心的算力供給仍采用“以資源為中心”的模式,將CPU代次信息透傳給面向最終云租戶的彈性虛擬機及容器,不此間無法動態(tài)共享的“獨立資源池”,而云租戶在消費算力時總是傾向于選擇最新CPU代次的虛擬機、容器,必然導致不同硬件CPU代次的“獨立資源池”之間存在分配率不均衡問題,特別不利于仍處于可靠性浴盆的有效利舊及價值轉換。為應對上述挑戰(zhàn),下一代數(shù)據(jù)中心需將算力供給轉變?yōu)椤耙詰脼橹行摹蹦J?,將一定CPU代差范圍內的算力資源進行統(tǒng)一整合,通過云算力服務足云租戶應用性能SLA的前提下實現(xiàn) 通用算力池通用算力池圖3-3云數(shù)據(jù)中心全池化框架42數(shù)據(jù)中心2030·跨節(jié)點內存池化云數(shù)據(jù)中心算力基于預定義的系列化Flavor規(guī)格,將特定大小的內存資源與特定數(shù)量的CPU核資源綁定,在匹配硬件規(guī)格的服務器節(jié)點內進行分配從而實現(xiàn)最小化的資源碎多影響應用性能,而內存不足則可能引發(fā)應用運行異常甚至失敗,也因此導致彈性虛擬機、容器中大量過配置的內存資源只能保持閑置而無法得到充分利用。若考慮引入內存超分,在部分服務器面臨動態(tài)內存資源不足時,如果網(wǎng)絡時延和帶寬能力可支撐,則完全可通過網(wǎng)絡向算力集群內其他服務器“借用”空閑內存資源。而隨著百納秒級超低時延、百GB級超大帶寬遠端內存異步訪問網(wǎng)絡技術(UB/RDMA)的不斷成熟與發(fā)展,使得打破服務器物理邊界實現(xiàn)面向虛擬機、容器無感的統(tǒng)一內存資源分配與讀寫訪問成為可能??紤]到跨服務器遠端內存訪問依存慢1-2個數(shù)量級,并會帶來應用性能下降普適于對應用性能劣化有一定忍耐度(如性性能敏感的多租戶虛機/容器復用場景,跨節(jié)點內存池化并非最佳選擇,需考慮通過極速毫秒級遷移,及時進行內存資源騰挪,從·跨異構海量數(shù)據(jù)的存儲&緩存池化基于統(tǒng)一的去中心化跨可用區(qū)分布式K-V存儲引擎,當前云數(shù)據(jù)中心實現(xiàn)了塊存儲、對象存儲、文件存儲等面向基礎非結構化數(shù)據(jù)列存數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫、多維數(shù)據(jù)倉庫、圖數(shù)據(jù)、時序數(shù)據(jù)庫等半結構化、結構化數(shù)據(jù)服務,軟件架構仍多采用存算合一模式,也即同時覆蓋了計算側的數(shù)據(jù)查詢、變更、分析處理,以及存儲側的數(shù)據(jù)持久化可靠性、可用性保障、并行IO讀寫,以及業(yè)務無損的彈性容量管理等功能,由此帶來了一系列問題與挑戰(zhàn)1)不同數(shù)據(jù)處理與分析場景下對計算及存儲資源的彈性擴縮容器需求不同步2)計算側與存儲側跨節(jié)點數(shù)據(jù)冗余機制存在沖突導致部分數(shù)據(jù)庫、數(shù)倉及大數(shù)據(jù)集群只能使用存算一體的服務器硬件類型,無法與其他計算類云服務及租戶應用共享通用算力資源,也無法充分享受軟件定義彈性存儲服務帶來便利3)計數(shù)據(jù)訪問性能存在瓶頸4)云租戶數(shù)據(jù)全生命周期流水線數(shù)據(jù)處理與分析的不同階段之間的數(shù)據(jù)資產(chǎn)難以共享,跨階段數(shù)據(jù)拷貝代價大,多份數(shù)據(jù)冗余存儲成本高5)跨云可用區(qū)多活部署架構計算層數(shù)據(jù)冗余處理邏輯復雜度高等。應對上述挑戰(zhàn),未來云數(shù)據(jù)中心通過一份數(shù)據(jù)拷貝跨不同數(shù)據(jù)計算引擎共享、近計算統(tǒng)一池化緩存、近數(shù)據(jù)分布式算子卸載、跨異構計算引擎的統(tǒng)一元數(shù)據(jù)管理、智能化數(shù)據(jù)分層存儲等關鍵措施實現(xiàn)跨結構化、半結構化及非結構化海量數(shù)據(jù)43數(shù)據(jù)中心2030·異構算力池化隨著AI大模型及元宇宙數(shù)字孿生時代的到來,云上GPU/NPU異構算力將逐步取代通用CPU成為AI大模型訓練推理,以及數(shù)字其需求量必將迎來指數(shù)型爆炸式增長。然而當前主從計算架構下GPU/NPU作為服務NPU卡形式與特定數(shù)量CPU核綁定作為云主機或云容器實例提供給云租戶和開發(fā)者。對于單塊GPU/NPU卡及多卡GPU服務器無法勝任的大模型訓練場景,必須依賴服務網(wǎng)絡來實現(xiàn)更大范圍GPU卡集群之間的緊基于數(shù)據(jù)中心網(wǎng)絡異步RDMA/UB的百微秒級超低時延、10倍降低尾時延、以及百T級超大帶寬網(wǎng)絡技術方面的突破,實現(xiàn)了幅提升了大模型訓練性價比。而通過軟件定義的GPU/NPU池化算力,一方面可將一顆物理加速芯片(GPU或ASIC)切分為幾個到幾十個互相隔離的小的計算單元,也可將分布在不同物理服務器上的GPU/NPU芯片聚合給一個操作系統(tǒng)(物理機/虛擬機)或CPU與GPU設備的解耦,通過異構算力的統(tǒng)一池化,可提供更有彈性的GPU/NPU資·DCN網(wǎng)絡池化云數(shù)據(jù)中心采用疊加在物理交換網(wǎng)絡之上的分布式軟件定義Overlay網(wǎng)絡,實現(xiàn)了云數(shù)據(jù)中心DCN網(wǎng)絡的全面池化,支撐了百萬級服務器物理網(wǎng)絡互聯(lián)規(guī)模下千萬級虛機、百萬級租戶VPC虛擬網(wǎng)絡,在統(tǒng)一物理網(wǎng)絡之上的,彈性按需動態(tài)復用,突破了傳統(tǒng)硬件路由器及網(wǎng)關節(jié)點的水平擴展規(guī)模瓶頸,并實現(xiàn)了云業(yè)務負載邏輯網(wǎng)絡地址與物理網(wǎng)絡地址的解耦,以及高度靈活的網(wǎng)絡互云數(shù)據(jù)中心普遍采用了Overlay軟件定義網(wǎng)絡與Underlay物理網(wǎng)絡的分層式架構,從而增加了云數(shù)據(jù)中心內多租戶、多應用網(wǎng)絡技術棧的復雜度,當云租戶應用的網(wǎng)絡連接出現(xiàn)故障后,端到端故障定位也面臨更大挑戰(zhàn)。此外,當前云數(shù)據(jù)中心內承載多租戶、多應用之間業(yè)務流量的網(wǎng)絡傳輸及路由層,仍沿襲了互聯(lián)網(wǎng)上存在了數(shù)十年并廣泛應用的TCP/IP協(xié)議棧,盡管云數(shù)據(jù)中心已將以太/IP的服務器網(wǎng)絡端口升級到百G級,物理交換機容量升級到T級,并引入了用戶態(tài)租戶Overlay虛擬網(wǎng)絡的吞吐及時延性能,但從云租戶與應用端到端網(wǎng)絡QoS視角來網(wǎng)絡包收發(fā)處理延遲與資源開銷,以及丟包場景下低效的重傳機制,已越來越無法適應AI大模型訓練推理、元宇宙仿真渲染、搜索推廣等日益普及的緊耦合、大顆粒云應用內部的分布式并發(fā)處理單元/微服務之間對極大帶寬、極低時延、可預測網(wǎng)絡延遲與丟包性能日益苛刻的要求,也制約了存儲、內存及異構計算資源全池化效率的進一步提升。雖然業(yè)內已有RDMA網(wǎng)絡技術可以部

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論