數(shù)據(jù)中心算力技術(shù)要求和測(cè)評(píng)方法_第1頁(yè)
數(shù)據(jù)中心算力技術(shù)要求和測(cè)評(píng)方法_第2頁(yè)
數(shù)據(jù)中心算力技術(shù)要求和測(cè)評(píng)方法_第3頁(yè)
數(shù)據(jù)中心算力技術(shù)要求和測(cè)評(píng)方法_第4頁(yè)
數(shù)據(jù)中心算力技術(shù)要求和測(cè)評(píng)方法_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1數(shù)據(jù)中心算力技術(shù)要求和測(cè)評(píng)方法本文件規(guī)定了面向數(shù)據(jù)中心算力全生命周期,覆蓋算力接入、算力度量、算力調(diào)度、算力運(yùn)營(yíng)等的技術(shù)要求以及算力測(cè)評(píng)方法。本文件適用于數(shù)據(jù)中心規(guī)劃、設(shè)計(jì)、建設(shè)、運(yùn)維等環(huán)節(jié)。2規(guī)范性引用文件下列文件中的內(nèi)容通過(guò)文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件。僅該日期對(duì)應(yīng)的版本適用于本文件,不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T43331-2023互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術(shù)和分級(jí)要求3術(shù)語(yǔ)和定義下列術(shù)語(yǔ)和定義適用于本文件數(shù)據(jù)中心datacenter由計(jì)算機(jī)場(chǎng)地(機(jī)房),其他基礎(chǔ)設(shè)施、信息系統(tǒng)軟硬件、信息資源(數(shù)據(jù))和人員以及相應(yīng)的規(guī)章制度組成的實(shí)體。服務(wù)器對(duì)數(shù)據(jù)進(jìn)行處理并實(shí)現(xiàn)結(jié)果輸出的一種能力,是衡量設(shè)備或系統(tǒng)計(jì)算能力的一個(gè)綜合指標(biāo),數(shù)值越大代表綜合計(jì)算能力越強(qiáng),包含以CPU為代表的通用計(jì)算能力和以GPU為代表的高性能算力。數(shù)據(jù)中心算力與功率的比值,即“數(shù)據(jù)中心單位功率所產(chǎn)生的算力”,是同時(shí)考慮計(jì)算性能與功率的一種效率。數(shù)值越大,代表單位功率的算力越強(qiáng),效能越高。算力度量hashratemeasurement對(duì)不同計(jì)算類型的異構(gòu)算力資源進(jìn)行統(tǒng)一抽象描述,實(shí)現(xiàn)異構(gòu)物理資源的統(tǒng)一資源描述,形成算力能力模板,為算力路由、算力設(shè)備管理、算力計(jì)費(fèi)等提供標(biāo)準(zhǔn)的算力度量規(guī)則。通過(guò)對(duì)不同業(yè)務(wù)的算力資源和算力需求進(jìn)行匹配,使合理的算力去處理相應(yīng)數(shù)據(jù)的一種以多樣性算力為基礎(chǔ),以算力網(wǎng)絡(luò)為連接,以供給有效算力求,算力服務(wù)需滿足綠色、共享、智能、可信等特征才能更好地支撐算力的典型應(yīng)用場(chǎng)景。包含算力設(shè)備的注冊(cè)、OAM(操作維護(hù)管理)、運(yùn)營(yíng)等。統(tǒng)一的管理面可以對(duì)網(wǎng)絡(luò)和算力進(jìn)行管理4縮略語(yǔ)下列縮略語(yǔ)適用于本文件AI:人工智能(artificialintelligence)ASIC:專用集成電路(applicationspecificintegratedcircuit)CE:算效(computationalefficiency)CP:算力(computationalpower)CPM:算力管理(computationalpowermanagement)FPGA:現(xiàn)場(chǎng)可編程門陣列(fieldprogrammablegatearray)HPC:高性能計(jì)算(highperfornancecomputing)HPL:高性能浮點(diǎn)運(yùn)算(highperfornaneelinpack)GPU:圖形處理器(graphicsprocessingunit)HM:算力度量(hashratemeasurenent)NPU:神經(jīng)網(wǎng)絡(luò)處理器(NeuralnetworkProcessingUnit)SLA:服務(wù)等級(jí)協(xié)議(service-levelagreement)5數(shù)據(jù)中心算力接入算力資源的感知主要指對(duì)數(shù)據(jù)中心物理設(shè)備算力能力的感知與抽象,便于上層應(yīng)用對(duì)與存儲(chǔ)等算力資源的統(tǒng)一協(xié)調(diào)調(diào)度,對(duì)分布式,動(dòng)態(tài)的數(shù)據(jù)中心算力資源進(jìn)行多維度的進(jìn)行按需實(shí)時(shí)調(diào)用,快速實(shí)現(xiàn)業(yè)務(wù)部署。算力資源的感知與抽象應(yīng)滿足以下要求。b)對(duì)不同維度的算力資源進(jìn)行感知,如計(jì)算能力(算力)與功耗水平(算效):c)對(duì)異構(gòu)物理算力資源建立統(tǒng)一的算力資源描述模型,根據(jù)不同需求與應(yīng)用的算力指標(biāo),與該算d)對(duì)數(shù)據(jù)中心算力資源提供統(tǒng)一的算力資源標(biāo)識(shí),便于上層應(yīng)用的統(tǒng)一識(shí)別與調(diào)用。包括消費(fèi)和生產(chǎn)兩類需求。消費(fèi)類需求水平通過(guò)移動(dòng)互聯(lián)網(wǎng)月來(lái)呈現(xiàn):生產(chǎn)需求可通過(guò)產(chǎn)數(shù)規(guī)模指標(biāo)。應(yīng)用場(chǎng)景需求能夠中文全稱M1lionInstructionsPerDhrystoneMillionInstructiFloating-pointOperationsPerSec中文全稱4超算算力(CPa):指超級(jí)計(jì)算機(jī)輸出的計(jì)算能力,超級(jí)計(jì)算利用并行工作的多臺(tái)計(jì)算機(jī)系統(tǒng)的集中式計(jì)算資源,并通過(guò)專用的操作系統(tǒng)來(lái)處理極端復(fù)雜或數(shù)據(jù)密集型的問(wèn)題,計(jì)算系統(tǒng)由CPU和智算算力(CPw算):指通過(guò)使用大規(guī)模異構(gòu)算力資源,包括CPU輸出的計(jì)算能力和智能算力6.3算力評(píng)級(jí)6.3.1算力評(píng)級(jí)概述數(shù)據(jù)中心的算力評(píng)級(jí)是指對(duì)數(shù)據(jù)中心服務(wù)器算力進(jìn)行綜合測(cè)算,并根據(jù)總分得到數(shù)據(jù)等級(jí)。根據(jù)得分對(duì)通用算力、超算算力、智算算力進(jìn)行1~5級(jí)的評(píng)級(jí),其中1級(jí)為最低等級(jí),5級(jí)為最高等表4算力評(píng)級(jí)1級(jí)國(guó)內(nèi)落后國(guó)內(nèi)領(lǐng)先國(guó)際領(lǐng)先7.1算力智能調(diào)度引擎規(guī)范作業(yè)調(diào)度包括一級(jí)調(diào)度和二級(jí)調(diào)度。一級(jí)調(diào)度系統(tǒng)根據(jù)二級(jí)調(diào)度系統(tǒng)提供的集群狀態(tài)態(tài),能夠通過(guò)最優(yōu)調(diào)度策略將用戶作業(yè)下發(fā)到某個(gè)目標(biāo)資源池集群進(jìn)行排隊(duì),再由該計(jì)算集群的二級(jí)調(diào)度系統(tǒng)進(jìn)行調(diào)度。通過(guò)統(tǒng)一接口進(jìn)行對(duì)接兩層調(diào)度系統(tǒng)。作業(yè)狀態(tài)應(yīng)包括提交后等待調(diào)度狀態(tài)、調(diào)度后下發(fā)到目標(biāo)集群狀態(tài)、目標(biāo)集群等待調(diào)度執(zhí)行狀態(tài)、目標(biāo)集群執(zhí)行狀態(tài)、目標(biāo)集群結(jié)束狀態(tài)。作業(yè)調(diào)度過(guò)程應(yīng)主要圍繞作業(yè)生命周期,推動(dòng)作業(yè)狀態(tài)的跳轉(zhuǎn),直到作業(yè)達(dá)到結(jié)束狀接口接口b(見(jiàn)圖2)接口c(見(jiàn)圖2)入接口d(見(jiàn)圖2)3)分布式通信模塊接口深度學(xué)習(xí)訓(xùn)練框架與異構(gòu)硬件設(shè)備適配后的軟硬件平臺(tái)應(yīng)具備多能力:應(yīng)提供對(duì)應(yīng)軟/硬件環(huán)境下的深度學(xué)習(xí)開發(fā)框架鏡像、容器編譯鏡像,支持安裝,卸載功能支持容器內(nèi)運(yùn)行環(huán)內(nèi)源碼編譯:宜支持異構(gòu)CPU編譯并支持純CPU訓(xùn)練場(chǎng)景,支持CPU算子深度學(xué)習(xí)訓(xùn)練框架與異構(gòu)硬件設(shè)備適配后的軟硬件平臺(tái)應(yīng)支持在圖像分類、目標(biāo)檢測(cè)、圖像分割、語(yǔ)義表示、機(jī)器翻譯、視頻分類、智能推薦等應(yīng)用領(lǐng)深度學(xué)習(xí)訓(xùn)練框架與異構(gòu)硬件設(shè)備適配后的軟硬件平臺(tái)應(yīng)在訓(xùn)練與穩(wěn)定性、可靠性、大規(guī)模分布式等方面達(dá)到要深度學(xué)習(xí)框架在多硬件接入適配工作上應(yīng)滿足易擴(kuò)展性的技術(shù)要8算力調(diào)度適用場(chǎng)景主要有資源直接調(diào)度場(chǎng)景、資源間接調(diào)用場(chǎng)景、業(yè)務(wù)調(diào)用場(chǎng)景、用戶驅(qū)動(dòng)業(yè)務(wù)調(diào)用場(chǎng)景。具體如下:a)資源直接調(diào)用場(chǎng)景:用戶通過(guò)算力網(wǎng)絡(luò)發(fā)布業(yè)務(wù)需求,并可直接尋找到匹配需求的算力基礎(chǔ)資源節(jié)點(diǎn)。算力網(wǎng)絡(luò)在用戶與基礎(chǔ)資源之間建立有效的資源鏈接,用戶可直接調(diào)用基礎(chǔ)資源:b)資源間接調(diào)用場(chǎng)景:用戶并不直接與算力網(wǎng)絡(luò)直接交互,而是通過(guò)具體的業(yè)務(wù)平臺(tái)實(shí)現(xiàn)。業(yè)務(wù)平臺(tái)通過(guò)算力網(wǎng)絡(luò)發(fā)布服務(wù)需求,尋找匹配服務(wù)需求的算力基礎(chǔ)資源,并建立資源連接。用戶單純通過(guò)業(yè)務(wù)平臺(tái)使用相應(yīng)的業(yè)務(wù)服務(wù)即可:c)業(yè)務(wù)調(diào)用場(chǎng)景:業(yè)務(wù)提供方已事先在算力網(wǎng)絡(luò)中某個(gè)節(jié)點(diǎn)位置完成了業(yè)務(wù)部署,并通過(guò)算力網(wǎng)絡(luò)完成業(yè)務(wù)信息發(fā)布。用戶通過(guò)算力網(wǎng)絡(luò)發(fā)起服務(wù)需求后,在算力網(wǎng)絡(luò)中直接匹配到滿足需求的業(yè)務(wù)信息,并直接調(diào)用相應(yīng)的業(yè)務(wù)服務(wù):d)用戶驅(qū)動(dòng)業(yè)務(wù)調(diào)用場(chǎng)景:通過(guò)細(xì)化上述幾個(gè)場(chǎng)景后衍化得到,即用戶驅(qū)動(dòng)業(yè)務(wù)調(diào)用場(chǎng)景。該場(chǎng)景下盡管業(yè)務(wù)需求依然由用戶在算力網(wǎng)絡(luò)中發(fā)布,并直接尋找到匹配需求的算力基礎(chǔ)資源節(jié)點(diǎn),但用戶自身并不直接負(fù)責(zé)業(yè)務(wù)服務(wù)提供和部署。用戶將匹配到的節(jié)點(diǎn)信息告知相應(yīng)的(第三方)業(yè)務(wù)平臺(tái)完成相應(yīng)的部署,并實(shí)現(xiàn)服務(wù)調(diào)用。8數(shù)據(jù)中心算力運(yùn)營(yíng)8.1算力服務(wù)規(guī)則8.1.1自服務(wù)能力算力服務(wù)平臺(tái)應(yīng)具備自服務(wù)能力包括但不限于:a)用戶可通過(guò)公開平臺(tái)訪問(wèn)算力資源;b)用戶可自行在平臺(tái)進(jìn)行咨詢、試用、選購(gòu)、售后等服務(wù);c)用戶可進(jìn)行算力、數(shù)據(jù)、軟件等資源管理、監(jiān)控與調(diào)整;d)用戶可進(jìn)行組織、人員、對(duì)賬等運(yùn)營(yíng)服務(wù)。8.1.2按需服務(wù)算力服務(wù)平臺(tái)應(yīng)具備按雷服務(wù)的能力,包括但不限于:a)用戶可根據(jù)需求進(jìn)行資源選擇及使用;b)用戶可根據(jù)需求進(jìn)行資源計(jì)量計(jì)費(fèi)c)算力服務(wù)平臺(tái)可根據(jù)資源使用情況進(jìn)行彈性伸縮。8.2算力管理規(guī)則算力服務(wù)應(yīng)具備統(tǒng)一的用戶及任務(wù)管理能力,包括但不限于a)具備統(tǒng)一的用戶管理和用戶環(huán)境配置:b)具備多種優(yōu)先級(jí)的資源調(diào)度策略;c)具備多種策略管理能力,為作業(yè)請(qǐng)求提供最佳資源。算力服務(wù)應(yīng)具備算力服務(wù)調(diào)度的能力,包括但不限于:a)應(yīng)具有統(tǒng)一的管理中心,進(jìn)行用戶、編排策略、服務(wù)目錄、定價(jià)管理等:b)應(yīng)具有統(tǒng)一協(xié)同中心,能夠進(jìn)行系統(tǒng)監(jiān)視、數(shù)據(jù)管理、作業(yè)管理等;9c)應(yīng)能夠協(xié)同多種算力引擎。9算力測(cè)評(píng)方法9.1通用算力測(cè)評(píng)9.1.1通用算力測(cè)評(píng)方法現(xiàn)代通用計(jì)算服務(wù)器典型應(yīng)用場(chǎng)景的性能需求a)評(píng)價(jià)指標(biāo)體系個(gè)秒b)綜合評(píng)分方法采用加權(quán)算術(shù)平均數(shù)計(jì)算法實(shí)現(xiàn)對(duì)系統(tǒng)每個(gè)維度的性能評(píng)分參考基礎(chǔ)配置,見(jiàn)附錄A,根據(jù)公式(1)將實(shí)測(cè)數(shù)據(jù)通過(guò)歸一化方法換算為無(wú)量綱的指標(biāo)得分,另外當(dāng)指標(biāo)值大于基準(zhǔn)平臺(tái)參考值時(shí),指標(biāo)得分取100。將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(2)計(jì)算綜合得分w,T——不同測(cè)試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄B。9.1.2通用算力評(píng)級(jí)根據(jù)得分對(duì)通用算力進(jìn)行1~5級(jí)的評(píng)級(jí),其中1級(jí)為最低等級(jí),5級(jí)為最高等級(jí)。具體分級(jí)情況見(jiàn)表10。9.2.1超算算力測(cè)試方法根據(jù)待測(cè)集群的HPL性能將系統(tǒng)規(guī)模分為大超算算力測(cè)試指標(biāo)涵蓋浮點(diǎn)性能、稀疏線性系統(tǒng)性能、存儲(chǔ)系統(tǒng)帶寬、網(wǎng)絡(luò)帶寬、AI推理及訓(xùn)練力寬寬遲測(cè)試系統(tǒng)使用MaskR-CNN模型在C參考基礎(chǔ)配置,見(jiàn)附錄C,根據(jù)公式(3)將實(shí)測(cè)數(shù)據(jù)通過(guò)歸一化方法換算為無(wú)量綱的指標(biāo)得分,另式中:將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(4)計(jì)算綜合得分w,P?——指標(biāo)i在被測(cè)集群上的性能得分;T——不同測(cè)試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄D。9.2.2超算算力評(píng)級(jí)根據(jù)得分對(duì)超算算力進(jìn)行1~5級(jí)的評(píng)級(jí),其中1級(jí)為最低等級(jí),5級(jí)為最高等級(jí),具體分級(jí)情況見(jiàn)表13。9.3智算算力測(cè)評(píng)9.3.1智算算力評(píng)測(cè)工具智算算力測(cè)試主要分為訓(xùn)練性能測(cè)試和推理性能測(cè)試,評(píng)測(cè)工具主要包括模型和14和表15.a)訓(xùn)練測(cè)試模型訓(xùn)練性能測(cè)試所用模型及數(shù)據(jù)集如表14.目標(biāo)檢測(cè)目標(biāo)檢測(cè)目標(biāo)檢測(cè)能nrecall練的性能參考基礎(chǔ)配置,見(jiàn)附錄E.1,根據(jù)公式(5)將實(shí)測(cè)數(shù)據(jù)通過(guò)歸一化方法換算為無(wú)量綱的指標(biāo)得分另外當(dāng)指標(biāo)值大于基準(zhǔn)平臺(tái)參考值時(shí),指標(biāo)得分取100。將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(6)計(jì)算綜合得分w。P——指標(biāo)i在被測(cè)集群上的性能得分;T——不同測(cè)試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄F.1。b)推理性能測(cè)試推理性能測(cè)試主要包括不同種類推理任務(wù)的性能測(cè)試,推理任務(wù)具體包括:圖像分類、目標(biāo)檢測(cè)、型目標(biāo)檢測(cè)能1.1數(shù)據(jù)集上的推理性能參考基礎(chǔ)配置,見(jiàn)附錄E.2,根據(jù)公式(7)將實(shí)測(cè)數(shù)據(jù)通過(guò)歸一化方法換算為無(wú)量綱的指標(biāo)得分。另外當(dāng)指標(biāo)值大于基準(zhǔn)平臺(tái)參考值時(shí),指標(biāo)得分取100。將各項(xiàng)指標(biāo)得分和權(quán)重代入公式(8)計(jì)算綜合得分w。T——不同測(cè)試指標(biāo)的權(quán)重,權(quán)重取值可參考附錄F.2。9.3.3智算算力評(píng)級(jí)智算算力按照訓(xùn)練類和推理類進(jìn)行分別評(píng)級(jí),其中1級(jí)為最低等級(jí),5級(jí)為最高等a)訓(xùn)練類評(píng)級(jí)通用算力基準(zhǔn)平臺(tái)性能參考值A(chǔ).1基準(zhǔn)平臺(tái)性能參考通用算力基準(zhǔn)平臺(tái)性能參考值如表A.1所示表A.1基準(zhǔn)平臺(tái)性能參考(根據(jù)IntelXeon4214)超算算力基準(zhǔn)平臺(tái)性能參考值C.1基準(zhǔn)平臺(tái)性能參考超算算力基準(zhǔn)平臺(tái)性能參考值如表C.1所示。表C.1基準(zhǔn)平臺(tái)性能參考值(根據(jù)top500排名的指標(biāo)值)網(wǎng)絡(luò)系統(tǒng)帶寬8網(wǎng)絡(luò)系統(tǒng)帶寬

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論