ODCC:2023數(shù)據(jù)中心自適應(yīng)AI節(jié)能白皮書(shū)_第1頁(yè)
ODCC:2023數(shù)據(jù)中心自適應(yīng)AI節(jié)能白皮書(shū)_第2頁(yè)
ODCC:2023數(shù)據(jù)中心自適應(yīng)AI節(jié)能白皮書(shū)_第3頁(yè)
ODCC:2023數(shù)據(jù)中心自適應(yīng)AI節(jié)能白皮書(shū)_第4頁(yè)
ODCC:2023數(shù)據(jù)中心自適應(yīng)AI節(jié)能白皮書(shū)_第5頁(yè)
已閱讀5頁(yè),還剩152頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

11版權(quán)聲明ODCC(開(kāi)放數(shù)據(jù)中心委員會(huì))發(fā)布的各項(xiàng)成果,受《著作權(quán)法》保護(hù),轉(zhuǎn)載、摘編或利用其它方式使用ODCC成果中的文字或者觀點(diǎn)的,應(yīng)注明對(duì)于未經(jīng)著作權(quán)人書(shū)面同意而實(shí)施的剽竊、復(fù)制、修改、銷售、改編、匯編和翻譯出版等侵權(quán)行為,ODCC及有關(guān)單位將追究其法律責(zé)任,感謝各單位I編寫(xiě)組“新基建”政策的頒布實(shí)施,使云計(jì)算和大數(shù)據(jù)得到了快速的發(fā)展,數(shù)據(jù)中心建設(shè)迎來(lái)了前所未有的增長(zhǎng)。新建數(shù)據(jù)中心的建設(shè)規(guī)模越來(lái)越大,對(duì)數(shù)據(jù)中心的可靠性、設(shè)備性能和能源效率的要求逐步提高;而在存量數(shù)據(jù)中心中,能效和老化問(wèn)題日益凸顯,改造需求激增?!半p碳”等一系列政策的出臺(tái),更加推動(dòng)了數(shù)據(jù)中心的管理成本也越來(lái)越高,降低數(shù)據(jù)中心運(yùn)營(yíng)管理成本逐漸成為人們關(guān)人工智能技術(shù)發(fā)展突飛猛進(jìn),使得其在數(shù)據(jù)中心基礎(chǔ)設(shè)施領(lǐng)域中也得到了初步的應(yīng)用。一方面,人工智能技術(shù)在數(shù)據(jù)中心中可以提高數(shù)據(jù)中心的效率,降低運(yùn)營(yíng)成本,優(yōu)化決策。例如,智能算法能源管理、智能機(jī)器人巡檢設(shè)備、自動(dòng)化程序故障排查等技術(shù)可智另一方面,智能化的安全監(jiān)控和風(fēng)險(xiǎn)評(píng)估可防止故障和宕機(jī)事件,本白皮書(shū)將對(duì)數(shù)據(jù)中心人工智能技術(shù)的發(fā)展現(xiàn)狀、應(yīng)用情況、未來(lái)趨勢(shì)進(jìn)行討論和梳理,聚焦利用AI技術(shù)自適應(yīng)地進(jìn)行不同場(chǎng)景下的空調(diào)群控節(jié)能方案,從數(shù)據(jù)、算力、算法等幾個(gè)方面進(jìn)行展開(kāi)由于時(shí)間倉(cāng)促,水平所限,錯(cuò)誤和不足之處在所難免,歡迎各數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC I II III 1 1 5 5 5 7 10 10 12 13 13 15 16 18 18 20 21 23 23數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC 31 34 36 37 38 39 41 41 41 42 44 45 45 48 52 55 55 56 59 61 61 62 64 64V數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC 65 66 67 68 70數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)本白皮書(shū)對(duì)數(shù)據(jù)中心人工智能技術(shù)的發(fā)展現(xiàn)狀、應(yīng)用情況、未來(lái)趨勢(shì)進(jìn)行了詳細(xì)的梳理,探索如何使用人工智能技術(shù)來(lái)優(yōu)化數(shù)據(jù)中心的管理和運(yùn)行,主要聚焦在利用AI技術(shù)自適應(yīng)地進(jìn)行不同場(chǎng)景算法(Algorithms)一組用于人工智能、神經(jīng)網(wǎng)絡(luò)或其他機(jī)器的規(guī)則或指令,以幫助它人工智能(ArtificialIntelligence)模擬人腦運(yùn)作的學(xué)習(xí)模型,用于解決傳統(tǒng)計(jì)算機(jī)系統(tǒng)難以解決的任聊天機(jī)器人(Chatbots)通過(guò)文本對(duì)話或語(yǔ)音命令模擬與人類用戶進(jìn)行對(duì)話的計(jì)算機(jī)程序,1數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC決策樹(shù)(DecisionTree)基于分支的樹(shù)模型,繪制決策及其可能后果的模型圖,與流程圖類深度學(xué)習(xí)(DeepLearning)機(jī)器通過(guò)由層疊信息層組成的人工神經(jīng)網(wǎng)絡(luò)自主模仿人類思維模式認(rèn)知計(jì)算(CognitiveComputing)模仿人類大腦思維方式的計(jì)算模型,通過(guò)使用數(shù)據(jù)挖掘、自然語(yǔ)言機(jī)器智能(MachineIntelligence)機(jī)器感知(MachinePerception)系統(tǒng)接收和解釋來(lái)自外部世界數(shù)據(jù)的能力,類似于人類使用感官。利用計(jì)算機(jī)算法和統(tǒng)計(jì)模型,讓計(jì)算機(jī)能夠理解強(qiáng)化學(xué)習(xí)(ReinforcementLearning)一種機(jī)器學(xué)習(xí)技術(shù),通過(guò)試錯(cuò)過(guò)程中不斷調(diào)整行為,讓計(jì)算機(jī)自動(dòng)2數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC監(jiān)督學(xué)習(xí)(SupervisedLearning)機(jī)器學(xué)習(xí)的一種,其輸出數(shù)據(jù)集訓(xùn)練機(jī)器產(chǎn)生所需的算法,如老師無(wú)監(jiān)督學(xué)習(xí)(UnsupervisedLearning)一種機(jī)器學(xué)習(xí)算法,通過(guò)不帶標(biāo)簽響應(yīng)的輸入數(shù)據(jù)組成的數(shù)據(jù)集進(jìn)計(jì)算機(jī)視覺(jué)(ComputerVision)預(yù)測(cè)分析(PredictiveAnalytics)利用統(tǒng)計(jì)模型和數(shù)據(jù)挖掘技術(shù),預(yù)測(cè)未來(lái)事件的可模式識(shí)別(PatternRecognition)聚類分析(ClusterAnalysis)利用統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)技術(shù),將數(shù)據(jù)分為相似的組,從而識(shí)別數(shù)人工智能優(yōu)化(AIOptimization)3數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC一種理解順序信息、識(shí)別模式、并根據(jù)這些計(jì)算產(chǎn)生輸出的神經(jīng)網(wǎng)4數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC人工智能(AI)是計(jì)算機(jī)科學(xué)的一個(gè)分支,致力于研究和開(kāi)發(fā)起源階段(1943-1955):1943年,WarrenMcCulloch和WalterPitts提出了人工神經(jīng)網(wǎng)絡(luò)的概念,這是AI研究的起點(diǎn)。1950年,Al名的《計(jì)算機(jī)器與智能》論文,提出了“圖靈測(cè)試”概念,成為AI初創(chuàng)階段(1956-1969):1956年,約翰·麥卡錫、馬文·明斯基、納撒尼爾·羅切斯特和克勞德·香農(nóng)等人在達(dá)特茅斯會(huì)議上共同發(fā)起了人工智能領(lǐng)域的AI程序,如邏輯理論家、通用問(wèn)題求解器等。這一時(shí)期的AI研究知識(shí)表示與專家系統(tǒng)階段(1970-1985):AI研究重心轉(zhuǎn)向了知識(shí)表示和推理。研究者們開(kāi)始開(kāi)發(fā)基于知識(shí)的專家系統(tǒng),如MYCIN、DENDRAL等,這些系統(tǒng)能夠在特定領(lǐng)域內(nèi)5數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC解決復(fù)雜問(wèn)題。在這一階段,AI得到了廣泛關(guān)注,并在醫(yī)學(xué)、化學(xué)連接主義與神經(jīng)網(wǎng)絡(luò)復(fù)興階段(1986-1999):傳播算法,使得多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練成為可能。同時(shí),遺傳算法、機(jī)器學(xué)習(xí)與大數(shù)據(jù)階段(2000-2010):隨著計(jì)算能力的提高和大數(shù)據(jù)的興起,機(jī)器學(xué)習(xí)技術(shù)得到了飛速發(fā)展。支持向量機(jī)、隨機(jī)森林、AdaBoost等機(jī)器學(xué)習(xí)算法應(yīng)運(yùn)而生,廣泛應(yīng)用于各種領(lǐng)域。在這一階段,研究者們開(kāi)始關(guān)注數(shù)據(jù)驅(qū)動(dòng)的方法,通過(guò)從大量數(shù)據(jù)中學(xué)習(xí)模式和特征來(lái)實(shí)現(xiàn)智能。同時(shí),AI領(lǐng)域的核心技術(shù)逐步拓展至自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)):2012年,AlexKrizhevsky等人提出了AlexNet,一種基于卷挑戰(zhàn)賽。自此,深度學(xué)習(xí)技術(shù)在AI領(lǐng)域掀起了一場(chǎng)革命。隨后,6數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC言系列模型在自然語(yǔ)言處理領(lǐng)域創(chuàng)造了諸多紀(jì)錄。同時(shí),AlphaGo綜上所述,人工智能技術(shù)經(jīng)歷了多個(gè)階段的發(fā)展,從起源到現(xiàn)在的深度學(xué)習(xí)革命,AI不斷拓展其在各個(gè)領(lǐng)域的應(yīng)用,并取得了顯著的突破。未來(lái),隨著技術(shù)的進(jìn)一步發(fā)展,AI有望在更多領(lǐng)域發(fā)揮出于對(duì)數(shù)據(jù)中心安全性的考慮,本白皮書(shū)主要聚焦于當(dāng)前已成計(jì)算機(jī)視覺(jué)(ComputerVision)計(jì)算機(jī)視覺(jué)是一種利用計(jì)算機(jī)和數(shù)字圖像處理技術(shù)來(lái)模擬和自動(dòng)識(shí)別人類視覺(jué)的過(guò)程,它主要研究如何讓計(jì)算機(jī)“看懂”圖像和視頻內(nèi)容。主要任務(wù)包括圖像分類、目標(biāo)檢測(cè)、目標(biāo)跟蹤、語(yǔ)義分尤其是卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像處理任務(wù)上表現(xiàn)優(yōu)異,例如AlexNet、VGG、ResNet等。在醫(yī)療影像、安防監(jiān)控、自動(dòng)駕駛等領(lǐng)語(yǔ)音識(shí)別(SpeechRecognition)7數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC它涉及到聲學(xué)模型、語(yǔ)言模型等多個(gè)方面。近年來(lái),深度學(xué)習(xí)技術(shù)在語(yǔ)音識(shí)別領(lǐng)域取得了顯著成果。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在處理時(shí)序信息方面有優(yōu)勢(shì),因此在語(yǔ)音識(shí)別領(lǐng)域自然語(yǔ)言處理是一種研究如何讓計(jì)算機(jī)理解、生成和處理人類自然語(yǔ)言的方法。它能夠進(jìn)行自然語(yǔ)言合成理解、詞性標(biāo)注、命名實(shí)體識(shí)別、句法分析、情感分析、機(jī)器翻譯等。近年來(lái),Tranform-專家推薦系統(tǒng)(ExpertRecommendationSystem)推薦系統(tǒng)是一種利用機(jī)器學(xué)習(xí)和人工智能技術(shù),通過(guò)分析用戶的行為和興趣,為用戶提供個(gè)性化的信息、產(chǎn)品或服務(wù)推薦。主要技術(shù)包括基于內(nèi)容的推薦、協(xié)同過(guò)濾、矩陣分解、深度學(xué)習(xí)等。近年來(lái),深度學(xué)習(xí)技術(shù)在推薦系統(tǒng)中的應(yīng)用逐漸增多,如利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)用戶和物品的高維表示,提高推薦效果。推薦系統(tǒng)已經(jīng)工業(yè)控制(IndustrialControl)工業(yè)控制技術(shù)主要關(guān)注如何在實(shí)際生產(chǎn)過(guò)程中實(shí)現(xiàn)對(duì)設(shè)備和系統(tǒng)的有效控制。在工業(yè)控制領(lǐng)域,人工智能技術(shù)可以應(yīng)用于優(yōu)化算8數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC法、故障診斷、預(yù)測(cè)性維護(hù)等方面。目前,人工智能技術(shù)已經(jīng)在工業(yè)控制領(lǐng)域取得了實(shí)質(zhì)性進(jìn)展,逐步成為各個(gè)環(huán)節(jié)的關(guān)鍵支持,尤深度學(xué)習(xí)和模型預(yù)測(cè)控制等,實(shí)現(xiàn)了自動(dòng)化質(zhì)量檢測(cè)、故障預(yù)測(cè)和能源優(yōu)化,提高生產(chǎn)效率和降低成本。工業(yè)機(jī)器人在人工智能的支持下取得了顯著發(fā)展,實(shí)現(xiàn)了更高水平的人機(jī)協(xié)作和生產(chǎn)自動(dòng)化。同時(shí),人工智能技術(shù)在供應(yīng)鏈管理中的應(yīng)用,也提高了供應(yīng)鏈透明其他數(shù)字技術(shù)自動(dòng)化了大約75%的生產(chǎn)過(guò)程,從而大大提高了生產(chǎn)BMW使用AI進(jìn)行質(zhì)量控制。在其生產(chǎn)線上,機(jī)器視覺(jué)系統(tǒng)可以檢測(cè)車(chē)輛的漆面是否存在任何缺陷或不規(guī)則性,從而自動(dòng)檢測(cè)可能海爾運(yùn)用工業(yè)物聯(lián)網(wǎng)和AI技術(shù),對(duì)自己的生產(chǎn)線進(jìn)行數(shù)字化改生產(chǎn)計(jì)劃、生產(chǎn)執(zhí)行等一系列環(huán)節(jié)的優(yōu)化,從而實(shí)現(xiàn)了靈活生產(chǎn)和盡管AI在多個(gè)領(lǐng)域表現(xiàn)出卓越的能力,其在工業(yè)控制領(lǐng)域的應(yīng)9數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC用相較而言卻顯得較少。此種現(xiàn)象主要由一些固有難題所致,首要數(shù)據(jù)的準(zhǔn)確度對(duì)AI模型的預(yù)測(cè)和決策至關(guān)重要,任何誤差都可能影響效率和質(zhì)量。標(biāo)準(zhǔn)化的數(shù)據(jù)可以促進(jìn)數(shù)據(jù)交換,為AI應(yīng)用奠定基礎(chǔ)。而安全性則關(guān)乎重要設(shè)施和設(shè)備,一旦出現(xiàn)問(wèn)題,后果嚴(yán)重。其中,制冷系統(tǒng)是數(shù)據(jù)中心能耗的主要部分。如何提高數(shù)據(jù)中心制冷系統(tǒng)的能效,是行業(yè)面臨的重要挑戰(zhàn)。越來(lái)越多的數(shù)據(jù)中心開(kāi)始尋求創(chuàng)新解決方案,而人工智能(AI)技術(shù)的崛起,為這個(gè)問(wèn)題帶來(lái)了新的可能性。AI能夠?qū)崟r(shí)收集并處理大量數(shù)據(jù),預(yù)測(cè)和控制制冷系統(tǒng)的工作狀態(tài),從而實(shí)現(xiàn)能源的優(yōu)化利用。在本白皮書(shū)中,我們將深入探討AI技術(shù)在數(shù)據(jù)中心制冷系統(tǒng)中的具體應(yīng)用和潛力,展目前,AI技術(shù)在數(shù)據(jù)中心領(lǐng)域的應(yīng)用主要在能耗管理、故障診斷、安全監(jiān)測(cè)、輔助運(yùn)維等幾個(gè)方面,下面將結(jié)合在這幾個(gè)方面的在能耗管理方面,人工智能技術(shù)已在數(shù)據(jù)中心能耗分析和預(yù)測(cè)數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC領(lǐng)域取得進(jìn)展。通過(guò)收集歷史能耗數(shù)據(jù)、機(jī)房溫濕度和氣象數(shù)據(jù)等多種因素,構(gòu)建預(yù)測(cè)模型。利用預(yù)測(cè)模型對(duì)未來(lái)能耗進(jìn)行預(yù)測(cè),并依據(jù)預(yù)測(cè)結(jié)果對(duì)能耗進(jìn)行調(diào)整與優(yōu)化,實(shí)現(xiàn)有效的能耗管理,從而盡管目前這些模型在應(yīng)對(duì)數(shù)據(jù)種類缺失、缺乏豐富算法模型和算法組合靈活性不足,人工智能技術(shù)在數(shù)據(jù)中心能耗管理及優(yōu)化方以利用機(jī)器學(xué)習(xí)技術(shù)優(yōu)化數(shù)據(jù)中心能耗管理為例。在數(shù)據(jù)中心能耗管理的場(chǎng)景中,可以將歷史能耗數(shù)據(jù)、天氣數(shù)據(jù)以及其他可能影響能耗的因素作為輸入,來(lái)訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)模型。這個(gè)模型可能使用監(jiān)督學(xué)習(xí)的方式,即根據(jù)已知的輸入(比如氣溫、濕度、負(fù)載量等)和輸出(實(shí)際能耗)進(jìn)行學(xué)習(xí)。訓(xùn)練完成后,模型將能根據(jù)輸入的天氣數(shù)據(jù)和預(yù)期負(fù)載量等信息,預(yù)測(cè)未來(lái)某一時(shí)間點(diǎn)的數(shù)據(jù)中心能耗。依據(jù)這一預(yù)測(cè)結(jié)果,數(shù)據(jù)中心可以更加精確地調(diào)整其能源策略,例如優(yōu)化設(shè)備的運(yùn)行狀態(tài)、調(diào)度任務(wù)的執(zhí)行順序,甚至調(diào)整冷卻系統(tǒng)的運(yùn)行方式,從而實(shí)現(xiàn)更高效的能源管理。因此,機(jī)Google利用其TensorFlow機(jī)器學(xué)習(xí)框架,通過(guò)分析數(shù)據(jù)中心的負(fù)載模式和服務(wù)器資源利用率,對(duì)任務(wù)的分配和調(diào)度策略進(jìn)行自動(dòng)調(diào)整,從而優(yōu)化了能源管理并實(shí)現(xiàn)了能源利用的最大化,通過(guò)使用機(jī)器學(xué)習(xí)技術(shù),Google成功地將其數(shù)據(jù)中心的冷卻能耗降低了數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC40%。但這種方法在冷凍水系統(tǒng)的應(yīng)用中經(jīng)常要進(jìn)行針對(duì)性的調(diào)整,需要專業(yè)的人員參與和現(xiàn)場(chǎng)調(diào)試,這是對(duì)新技術(shù)普適性應(yīng)用的常見(jiàn)挑戰(zhàn)。在算力需求方面,系統(tǒng)可能需要一些特定的場(chǎng)景才能發(fā)揮最大效能,但隨著硬件技術(shù)的不斷進(jìn)步,這也讓我們看到了AI技術(shù)在在故障分析方面,數(shù)據(jù)中心設(shè)備故障是數(shù)據(jù)中心運(yùn)營(yíng)中常見(jiàn)的問(wèn)題,AI技術(shù)可以分析設(shè)備運(yùn)行數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行分析處理,提前預(yù)測(cè)硬件故障,進(jìn)而可以提前進(jìn)行預(yù)測(cè)性維護(hù),避免數(shù)據(jù)中心的服務(wù)中斷和數(shù)據(jù)丟失,從而提高數(shù)據(jù)中然而,目前這些技術(shù)普遍存在處理數(shù)據(jù)不完整、模型泛化能力以深度學(xué)習(xí)技術(shù)對(duì)數(shù)據(jù)中心進(jìn)行故障檢測(cè)為例,深度學(xué)習(xí)技術(shù)能夠通過(guò)訓(xùn)練模型實(shí)現(xiàn)自動(dòng)化設(shè)備故障識(shí)別。該模型通過(guò)學(xué)習(xí)設(shè)備進(jìn)一步地,根據(jù)識(shí)別結(jié)果,可以提供相應(yīng)的維修措施以確保數(shù)據(jù)中心的穩(wěn)定運(yùn)行。但是,深度學(xué)習(xí)方法在處理大量實(shí)時(shí)數(shù)據(jù)時(shí)可能面臨計(jì)算資源和實(shí)時(shí)性的挑戰(zhàn)。此外,當(dāng)數(shù)據(jù)缺失或存在噪聲時(shí),模型的預(yù)測(cè)準(zhǔn)確性可能受到影響。雖然AI技術(shù)在數(shù)據(jù)中心故障檢測(cè)方數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC對(duì)數(shù)據(jù)中心的資源進(jìn)行智能調(diào)度,實(shí)現(xiàn)資源的最優(yōu)利用和分配,提例如,可以使用強(qiáng)化學(xué)習(xí)算法對(duì)服務(wù)器的資源分配和管理進(jìn)行優(yōu)化,提高資源利用效率和數(shù)據(jù)中心的服務(wù)質(zhì)量。以服務(wù)器負(fù)載均衡為例,數(shù)據(jù)中心中的不同服務(wù)器可能承載不同數(shù)量和類型的工作負(fù)載,從而導(dǎo)致負(fù)載不均衡現(xiàn)象。應(yīng)用強(qiáng)化學(xué)習(xí)技術(shù),可以通過(guò)觀在某些場(chǎng)景下,現(xiàn)有的算法模型可能不夠豐富,無(wú)法滿足不同場(chǎng)景信息安全方面,數(shù)據(jù)中心正逐漸采用人工智能技術(shù)實(shí)現(xiàn)安全監(jiān)測(cè)和威脅防范,通過(guò)AI技術(shù)對(duì)數(shù)據(jù)中心的網(wǎng)絡(luò)流量進(jìn)行深度學(xué)習(xí)分析,以及對(duì)數(shù)據(jù)中心的安全事件數(shù)據(jù)的結(jié)合,利用機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行處理,自動(dòng)檢測(cè)安全事件,實(shí)現(xiàn)對(duì)數(shù)據(jù)中心的安全監(jiān)測(cè)和威脅防范,從而提高數(shù)據(jù)中心的安全性。例如,可以使用深度學(xué)習(xí)算法對(duì)網(wǎng)絡(luò)流量進(jìn)行分類和分析,檢測(cè)出潛在的安盡管AI技術(shù)在數(shù)據(jù)中心安全監(jiān)測(cè)方面具有很大潛力,其應(yīng)用仍數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC報(bào),而新型或未知的攻擊方式可能無(wú)法被現(xiàn)有算法檢測(cè)到。此外,AI系統(tǒng)的訓(xùn)練和部署需要大量的計(jì)算資源和數(shù)據(jù),可能導(dǎo)致較高的阿里云是最早采用了人工智能技術(shù)以提升數(shù)據(jù)中心的安全性的廠家之一。其AI驅(qū)動(dòng)的安全系統(tǒng)結(jié)合了深度學(xué)習(xí)和機(jī)器學(xué)習(xí)算法,對(duì)大規(guī)模的網(wǎng)絡(luò)流量進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析,成功地自動(dòng)檢測(cè)出潛在會(huì)立即發(fā)出預(yù)警并啟動(dòng)防護(hù)措施。這種自動(dòng)化的響應(yīng)機(jī)制顯著提升了阿里云數(shù)據(jù)中心的安全性和穩(wěn)定性,確保了業(yè)務(wù)的連續(xù)性和數(shù)據(jù)時(shí),訓(xùn)練和部署這種復(fù)雜的AI系統(tǒng)需要大量的計(jì)算資源和數(shù)據(jù),可微軟的Azure數(shù)據(jù)中心同樣采用了深度學(xué)習(xí)算法,對(duì)網(wǎng)絡(luò)流量進(jìn)行實(shí)時(shí)監(jiān)測(cè),發(fā)現(xiàn)并阻止了一些潛在的網(wǎng)絡(luò)攻擊行為。但目前這些算法可能對(duì)一些復(fù)雜、隱蔽或新型的攻擊手段表現(xiàn)出不足,需要Facebook的深度學(xué)習(xí)故障診斷系統(tǒng)可以通過(guò)監(jiān)測(cè)服務(wù)器運(yùn)行狀況和異常行為,識(shí)別故障和潛在的風(fēng)險(xiǎn),并及時(shí)進(jìn)行修復(fù)。該系統(tǒng)使用了基于深度學(xué)習(xí)的異常檢測(cè)算法和預(yù)測(cè)模型,以提高數(shù)據(jù)中心的可靠性和穩(wěn)定性。然而,同樣的,在實(shí)際應(yīng)用中,這些模型可能需要大量的訓(xùn)練數(shù)據(jù)和計(jì)算資源,同時(shí),它們可能在面對(duì)一些特殊數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC綜合運(yùn)維方面,數(shù)據(jù)中心正嘗試采用人工智能技術(shù)實(shí)現(xiàn)自動(dòng)化輔助運(yùn)維,以提高運(yùn)維效率和質(zhì)量。用戶能夠通過(guò)自然語(yǔ)言與數(shù)據(jù)中心交互,實(shí)現(xiàn)自動(dòng)化理解用戶需求并執(zhí)行相應(yīng)操作,但自然語(yǔ)言處理技術(shù)在理解復(fù)雜、模糊或不規(guī)范的語(yǔ)言表述時(shí)可能出現(xiàn)誤解或以自然語(yǔ)言理解技術(shù)為例,該技術(shù)能將用戶的自然語(yǔ)言需求轉(zhuǎn)化為相應(yīng)命令,實(shí)現(xiàn)自動(dòng)化執(zhí)行。在數(shù)據(jù)中心運(yùn)維過(guò)程中,自然語(yǔ)言處理技術(shù)可協(xié)助運(yùn)維人員迅速獲取和分析系統(tǒng)狀態(tài)信息,執(zhí)行故障排查和修復(fù)任務(wù),但可能受限于當(dāng)前技術(shù)水平,難以應(yīng)對(duì)一些復(fù)雜或特殊的問(wèn)題。此外,借助自然語(yǔ)言處理技術(shù),數(shù)據(jù)中心還可實(shí)現(xiàn)與其他智能系統(tǒng)的無(wú)縫對(duì)接,但技術(shù)之間的兼容性和集成仍需要進(jìn)而轉(zhuǎn)化為相應(yīng)的命令進(jìn)行自動(dòng)化執(zhí)行。當(dāng)運(yùn)維人員與“智能運(yùn)維助手”交互,請(qǐng)求系統(tǒng)狀態(tài)報(bào)告或執(zhí)行某項(xiàng)維護(hù)任務(wù)時(shí),比如重啟服務(wù)器,"智能運(yùn)維助手"能快速執(zhí)行并提供反饋,這大大提高了運(yùn)維效率和質(zhì)量。除了基礎(chǔ)的運(yùn)維任務(wù),"智能運(yùn)維助手"還具備與其他智能系統(tǒng)的無(wú)縫對(duì)接能力,這進(jìn)一步推動(dòng)了數(shù)據(jù)中心的自動(dòng)化運(yùn)數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC維進(jìn)程。目前,AI在進(jìn)行輔助運(yùn)維方面的工作IBM的Watson平臺(tái)是另一個(gè)典型的應(yīng)用案例,它基于人工智能心日志管理時(shí),它可以對(duì)大量日志信息進(jìn)行分析和處理,協(xié)助運(yùn)維(三)小結(jié)經(jīng)過(guò)對(duì)人工智能的歷史發(fā)展以及現(xiàn)狀的探討,無(wú)論是在能效優(yōu)化、故障預(yù)測(cè),還是在安全監(jiān)測(cè)、輔助運(yùn)維方面,不難看出AI技術(shù)已深入到數(shù)據(jù)中心的各個(gè)領(lǐng)域,AI的影響力都日益顯現(xiàn)?,F(xiàn)代數(shù)據(jù)其中,就本白皮書(shū)重點(diǎn)關(guān)注的能效方面而言,人工智能技術(shù)正在廣泛應(yīng)用于提升數(shù)據(jù)中心的能源效率。通過(guò)對(duì)數(shù)據(jù)中心PUE的組將AI節(jié)能技術(shù)聚焦應(yīng)用在制冷系統(tǒng)上,無(wú)疑是一種極具成效的降低然而,必須認(rèn)識(shí)到,任何AI技術(shù)的實(shí)施都離不開(kāi)強(qiáng)大的算法、穩(wěn)定的算力和合理的數(shù)據(jù)結(jié)構(gòu)的支持。因此,接下來(lái)的內(nèi)容將聚焦于AI技術(shù)的算法、算力和數(shù)據(jù)結(jié)構(gòu)的深度探討。通過(guò)這一過(guò)程,我們期待進(jìn)一步理解AI的內(nèi)在工作機(jī)制,以利用AI技術(shù)更好地提升數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC反映AI節(jié)能技術(shù)在降低數(shù)據(jù)中心總能源消耗方面的表現(xiàn)。通常用PLF或者整體PUE來(lái)衡量,也可用空調(diào)能耗或整體能耗節(jié)省百分反映AI節(jié)能技術(shù)在投資回報(bào)方面的表現(xiàn)。通常用投資回報(bào)率(ROI)來(lái)衡量,全面考慮初投資、維護(hù)成本、電費(fèi)節(jié)省及相關(guān)的風(fēng)反映AI節(jié)能技術(shù)在保證數(shù)據(jù)中心正常運(yùn)行和系統(tǒng)穩(wěn)定性方面的反映AI節(jié)能技術(shù)在應(yīng)對(duì)數(shù)據(jù)中心規(guī)模變化和應(yīng)用場(chǎng)景多樣性方面的表現(xiàn)差異,通常用不同測(cè)試場(chǎng)景下節(jié)能效果百分比的標(biāo)準(zhǔn)離差(用來(lái)衡量數(shù)據(jù)分布的離散程度的一種指標(biāo))率來(lái)衡反映AI節(jié)能系統(tǒng)可隨數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)周期的規(guī)模和結(jié)構(gòu)數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC命周期進(jìn)行平滑投入和擴(kuò)容。反映AI節(jié)能技術(shù)對(duì)于所使用的基礎(chǔ)設(shè)施關(guān)鍵數(shù)據(jù)的保護(hù)能力。反映AI節(jié)能技術(shù)在預(yù)測(cè)設(shè)備參數(shù)變化趨勢(shì)、預(yù)防設(shè)備故障、提高基礎(chǔ)設(shè)施可用性的能力。通常用預(yù)測(cè)的準(zhǔn)確性、預(yù)測(cè)提前時(shí)間和反映一個(gè)算法或模型產(chǎn)生的預(yù)測(cè)或決策可以被人類理解和解釋的程度,主要體現(xiàn)在如何讓算法的工作原理通過(guò)特征值展示以及圖形可視化等方式讓人類用戶更加透明和容易理12345678通過(guò)對(duì)數(shù)據(jù)中心存在問(wèn)題及發(fā)展趨勢(shì)的分析,結(jié)合AI在數(shù)據(jù)中心領(lǐng)域的應(yīng)用情況,不難發(fā)現(xiàn)當(dāng)前節(jié)能性、經(jīng)濟(jì)性、安全性3個(gè)維現(xiàn)在數(shù)據(jù)中心的能源消耗主要集中在設(shè)備運(yùn)行和冷卻系統(tǒng)。傳統(tǒng)數(shù)據(jù)中心的能源管理方式存在采集數(shù)據(jù)單一、收斂速度慢、場(chǎng)景適應(yīng)性差等問(wèn)題,可能無(wú)法充分發(fā)揮節(jié)能潛力,存在能源浪費(fèi)。例如,傳統(tǒng)的冷卻系統(tǒng)往往采用固定的冷卻策略,無(wú)法根據(jù)設(shè)備的實(shí)在采用AI節(jié)能技術(shù)時(shí),可能會(huì)面臨一定程度的初期的投資上升,投資回報(bào)可能不會(huì)立即顯現(xiàn)。例如,AI技術(shù)的引入需要購(gòu)買(mǎi)新的硬件設(shè)備,進(jìn)行系統(tǒng)升級(jí),以及對(duì)員工進(jìn)行培訓(xùn),這些都會(huì)增加初期的投資成本。為確保長(zhǎng)期收益,需要充分評(píng)估投資回報(bào)率(ROI)。數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC由于AI的不可解釋性,給AI的安全措施設(shè)計(jì)和實(shí)現(xiàn)帶來(lái)了很目前解決此問(wèn)題的思路主要有控制邏輯隔離,底層保底邏輯和減緩控制步長(zhǎng)幾種主要思路,通過(guò)綜合利用幾種技術(shù)思路,通過(guò)綜綜上,針對(duì)這些問(wèn)題和改進(jìn)方法,可以根據(jù)具體數(shù)據(jù)中心的環(huán)向的突破,還需要在具體的技術(shù)路徑上進(jìn)行擇優(yōu),通常實(shí)現(xiàn)AI技術(shù)的運(yùn)行,需要確定其數(shù)據(jù)采集方式、算法模型以及部署架構(gòu)三部分內(nèi)容,因此,本文將主要從采集方式、算法模型以及部署架構(gòu)來(lái)進(jìn)(三)數(shù)據(jù)采集方式對(duì)比數(shù)據(jù)采集方式的設(shè)計(jì)將直接影響到傳感器數(shù)量、算法部署思路數(shù)據(jù)中心的數(shù)據(jù)采集主要可通過(guò)兩種方式實(shí)現(xiàn):直接采集,間數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC這種方式通常涉及到在數(shù)據(jù)中心設(shè)備上安裝傳感器,例如溫度傳感器或濕度傳感器,這些傳感器可以直接從設(shè)備中收集數(shù)據(jù)。此外,還可以使用網(wǎng)絡(luò)設(shè)備,如交換機(jī)和路由器,通過(guò)SNMP協(xié)議直接直接采集具備數(shù)據(jù)準(zhǔn)確性高的優(yōu)點(diǎn),可以直接獲取設(shè)備的實(shí)際運(yùn)行狀態(tài),如溫度、濕度、功率消耗等,對(duì)于及時(shí)發(fā)現(xiàn)和處理問(wèn)題很有幫助。但其安裝和維護(hù)成本較高,可能需要額外的硬件設(shè)備和安裝工作。另外,如果設(shè)備數(shù)量眾多,直接采集可能會(huì)產(chǎn)生大量的數(shù)據(jù)中心分系統(tǒng)眾多,在數(shù)據(jù)獲取時(shí)可以充分考慮利用其他子許多數(shù)據(jù)中心設(shè)備,包括存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備和電源設(shè)備,都提供了可以查詢和管理設(shè)備狀態(tài)和配置的系統(tǒng)或網(wǎng)絡(luò)接口。這些接口通常支持標(biāo)準(zhǔn)的網(wǎng)絡(luò)協(xié)議,如HTTP,SNMP或者RESTfulAPI,我許多現(xiàn)代數(shù)據(jù)中心設(shè)備都支持標(biāo)準(zhǔn)的接口和協(xié)議,可以方便地集成到數(shù)據(jù)采集系統(tǒng)中。但是需要額外的網(wǎng)絡(luò)資源和計(jì)算資源來(lái)處理接口查詢和數(shù)據(jù)傳輸。另外,不同設(shè)備的接口和協(xié)議可能有所不由于機(jī)房現(xiàn)場(chǎng)實(shí)際數(shù)據(jù)采集環(huán)境的復(fù)雜性,在實(shí)際應(yīng)用中,可數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC能需要結(jié)合使用多種數(shù)據(jù)采集方式,以滿足數(shù)據(jù)中心的監(jiān)控和管理(四)主要算法模型對(duì)比基于機(jī)器學(xué)習(xí)的自動(dòng)控制算法趨于成熟,并逐漸多樣化。其中認(rèn)可度較高,效果較為出眾的算法主要包括:神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型、MPC模型、老虎機(jī)、強(qiáng)化學(xué)習(xí)等等。近年來(lái),諸如維諦、谷歌、華為等等越來(lái)越多的企業(yè),將這些優(yōu)秀的機(jī)器學(xué)習(xí)控制技術(shù)引進(jìn)數(shù)據(jù)中心進(jìn)行能效優(yōu)化。但不同企業(yè)的數(shù)據(jù)中心規(guī)模、配置及其歷史數(shù)據(jù)擁有量各不相同,從而對(duì)算法的需求不同,針對(duì)于此,這里對(duì)不分調(diào)節(jié)和微分調(diào)節(jié)。其中比例調(diào)節(jié)立即產(chǎn)生作用以減少偏差,積分PID控制可通過(guò)位置式或增量式公式實(shí)現(xiàn),下面公式為其中一種形PID控制已有多年的應(yīng)用歷史,應(yīng)用廣泛,效果可靠。在工業(yè)數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC控制中,PID控制常常作為第一選擇,解決了大部分問(wèn)題。無(wú)需訓(xùn)練學(xué)習(xí)、收斂速度快、可解釋性強(qiáng)、穩(wěn)定可靠等諸多優(yōu)點(diǎn),1)PID控制作為一種反饋控制方式僅僅根據(jù)被調(diào)量和目標(biāo)值之模糊控制是一種以模糊集合論、模糊語(yǔ)言變量和模糊邏輯推理為基礎(chǔ)的計(jì)算機(jī)數(shù)字控制技術(shù)。它是模糊數(shù)學(xué)同控制理論相結(jié)合的產(chǎn)物,同時(shí)也是智能控制的重要組成部分。它模仿人的思維方式,是一種將專家經(jīng)驗(yàn)規(guī)則轉(zhuǎn)化為控制策略的理論方法,特別適用于難數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC在過(guò)去有段時(shí)間甚至非常流行。然而,可能由于數(shù)學(xué)理論仍待進(jìn)一模糊控制的優(yōu)點(diǎn)非常明顯,可解釋性強(qiáng)、收斂速度快。模糊控制的缺點(diǎn)也非常明顯,過(guò)分依賴專家經(jīng)驗(yàn),而人的經(jīng)驗(yàn)不總是可靠因此模糊控制主要適合解決復(fù)雜而無(wú)法建立精確數(shù)學(xué)模型系統(tǒng)的控制問(wèn)題,它是處理推理系統(tǒng)和控制系統(tǒng)中不精確和不確定性的當(dāng)神經(jīng)網(wǎng)絡(luò)層數(shù)較低時(shí),特征提取和記憶能力變?nèi)?,退化成線性或簡(jiǎn)單的非線性模型,因此較多時(shí)候神經(jīng)網(wǎng)絡(luò)模型特指有一定深度的網(wǎng)絡(luò)結(jié)構(gòu)。這類模型對(duì)樣本量有一定的要求,收斂時(shí)間較長(zhǎng)。因此這類模型適用于有大量歷史樣本的數(shù)據(jù)中心,通過(guò)歷史樣本的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型一般包含兩類神經(jīng)網(wǎng)絡(luò),每類神經(jīng)網(wǎng)絡(luò)包含一個(gè)或多個(gè),其中一類優(yōu)化網(wǎng)絡(luò)用于預(yù)測(cè)優(yōu)化目標(biāo),例如:PUE、能其中狀態(tài)量通常包含狀態(tài)變量和擾動(dòng)變量,狀態(tài)變量如壓差、溫度等,擾動(dòng)變量如負(fù)載功率、室外溫度等。其中控制變量通常為當(dāng)神經(jīng)網(wǎng)絡(luò)層數(shù)較低時(shí),特征提取和記憶能力變?nèi)?,退化成線性或簡(jiǎn)單的非線性模型,因此較多時(shí)候神經(jīng)網(wǎng)絡(luò)模型特指有一定深度的網(wǎng)絡(luò)結(jié)構(gòu)。這類模型對(duì)樣本量有一定的要求,收斂時(shí)間較長(zhǎng)。因此這類模型適用于有大量歷史樣本的數(shù)據(jù)中心,通過(guò)歷史樣本的MPC模型(ModelPredictiveControl),由預(yù)測(cè)模型和優(yōu)化算法組成,預(yù)測(cè)模型用于滾動(dòng)預(yù)測(cè)未來(lái)幾步的系統(tǒng)狀態(tài),優(yōu)化算法根據(jù)預(yù)測(cè)的未來(lái)狀態(tài)進(jìn)行最優(yōu)控制u的求解,并選擇最近一步的控?cái)?shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCCMPC模型的基本思想:利用一個(gè)已有的模型、系統(tǒng)當(dāng)前的狀態(tài)和未來(lái)的控制量,來(lái)預(yù)測(cè)系統(tǒng)未來(lái)的輸出,然后與期望的系統(tǒng)輸出做比較,得到一個(gè)損失函數(shù),優(yōu)化選擇使損失值(代價(jià))最小的控):xt1=Akxt?kk=1+Bkut?k+cd[t?1]k=1狀態(tài)變量,是希望預(yù)測(cè)和管理的數(shù)值,如壓差、溫度等等。其中u是控制變量,是希望算法模型推薦的控制變量,如風(fēng)扇轉(zhuǎn)速、泵轉(zhuǎn)速、水閥開(kāi)度等等。其中d是擾動(dòng)變量,是無(wú)法控制的事件或環(huán)境MPC模型在優(yōu)化時(shí)會(huì)同時(shí)考慮約束條件,優(yōu)化控制的目標(biāo)是滿足約束條件限制的前提下,選擇使損失(代價(jià))函數(shù)最小的控制量u。在數(shù)據(jù)中心類項(xiàng)目中,在定義損失函數(shù)時(shí)通常是器件轉(zhuǎn)速越小越節(jié)能則損失函數(shù)值越小,在定義約束條件時(shí)通常希望溫度靠近某一設(shè)定點(diǎn)附近。MPC模型的優(yōu)化解法有二次規(guī)劃或?qū)ε紗?wèn)題的求解方MPC模型對(duì)樣本量要求不高,能較快的實(shí)現(xiàn)收斂,另外,當(dāng)系統(tǒng)預(yù)測(cè)模型以過(guò)去多個(gè)時(shí)刻作為輸入時(shí)(如,令上文T>1),還具數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC有很好的魯棒性。對(duì)于數(shù)據(jù)中心推薦控制,是一種不錯(cuò)的選擇。但老虎機(jī),又稱Bandit算法,也是機(jī)器學(xué)習(xí)的一個(gè)重要分支,和強(qiáng)化學(xué)習(xí)有一定的聯(lián)系,甚至可以認(rèn)為是早期的強(qiáng)化學(xué)習(xí)。Sutton最早的老虎機(jī)模型,基本認(rèn)為是病理學(xué)家Thompson在1933年對(duì)于被分到藥效較差的新藥的那一組病人并不公平。老虎機(jī)模型減小了藥效差、增大了藥效好的新藥的使用概率?,F(xiàn)在,老虎機(jī)模型在搜索和推薦方面的應(yīng)用很多。最近較出名的工作是LiLihong發(fā)這里結(jié)合數(shù)據(jù)中心簡(jiǎn)單介紹下UCB(UpperConfidenceBound,置信區(qū)間上界)算法。UCB對(duì)數(shù)據(jù)中心不同配置下的穩(wěn)定態(tài)使用分?jǐn)?shù)或收益進(jìn)行評(píng)價(jià),然后選擇分?jǐn)?shù)最高的臂進(jìn)行推薦,得到反饋后jt+其中jt表示t次UCB推薦后到目前為止的第j種配置下的平均分?jǐn)?shù)或收益,t是目前為止的總次數(shù),Tj,t是第j種配置在t次中被選中的次數(shù)。加號(hào)左邊反應(yīng)了平均收益,平均收益越大被容易被數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC無(wú)論用于數(shù)據(jù)中心自動(dòng)控制的冷啟動(dòng),還是作為其常規(guī)控制,都是強(qiáng)化學(xué)習(xí)的基本原理是,如果Agent的某個(gè)行為策略導(dǎo)致環(huán)境正的獎(jiǎng)勵(lì)(強(qiáng)化信號(hào)),那么Agent以后產(chǎn)生這個(gè)行為策略的趨勢(shì)便會(huì)加強(qiáng)。Agent的目標(biāo)是在每個(gè)離散狀態(tài)發(fā)現(xiàn)最優(yōu)策略以使期望如下圖所示的一種AC框架的強(qiáng)化學(xué)習(xí)模型:其中價(jià)值網(wǎng)絡(luò)用于對(duì)數(shù)據(jù)中心狀態(tài)進(jìn)行評(píng)價(jià),能耗越低溫度越好則獎(jiǎng)勵(lì)越大,反之亦然;其中策略網(wǎng)絡(luò)用于根據(jù)數(shù)據(jù)中心當(dāng)前狀態(tài)選取行為動(dòng)作,對(duì)于導(dǎo)致獎(jiǎng)勵(lì)最大的行為被選取的概率最大。通??梢?jiàn)的策略網(wǎng)絡(luò)擬合了一個(gè)概率分布,越好的行為被選擇的概率越大,對(duì)于其它行為也有微小的概率被選擇,這樣做的好處在于,模型同時(shí)具備利用和探索能力,當(dāng)室外環(huán)境或負(fù)載功率發(fā)生變化時(shí),能找到新形勢(shì)下的最強(qiáng)化學(xué)習(xí)的優(yōu)點(diǎn)在于,它是一種比較通用的范式,能解決各種優(yōu)化控制和智能推薦問(wèn)題。但該算法尚不是非常成熟且門(mén)檻較高,需要算法人員具備較高的設(shè)計(jì)能力,并且建立恰當(dāng)?shù)莫?jiǎng)勵(lì)函數(shù)不是一件容易的事。另外該算法模型學(xué)習(xí)效率相對(duì)較低,對(duì)樣本和學(xué)習(xí)時(shí)間有較大要求。另外由于數(shù)據(jù)中心不像游戲,無(wú)法并發(fā)大量的不斷交互,因此這類模型建議用于有大量歷史樣本的數(shù)據(jù)中心,通過(guò)機(jī) 優(yōu)化算法在算法模型中具有重要地位,是計(jì)算機(jī)尋優(yōu)求解的最主要手段。但考慮到其運(yùn)用過(guò)于廣泛,種類過(guò)于繁多,技術(shù)過(guò)于細(xì)數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC優(yōu)化算法種類繁多,優(yōu)化算法可分為進(jìn)化算法和數(shù)學(xué)優(yōu)化算法進(jìn)化算法是仿照生物進(jìn)化規(guī)律,通過(guò)繁殖、競(jìng)爭(zhēng)、再繁殖、再競(jìng)爭(zhēng),實(shí)現(xiàn)優(yōu)勝劣汰,一步步逼近復(fù)雜工程技術(shù)問(wèn)題的最優(yōu)解。從果蠅算法、模擬退火算法、螢火蟲(chóng)算法等等。其中遺傳算法是當(dāng)前遺傳算法(簡(jiǎn)稱GA)起源于對(duì)生物系統(tǒng)所進(jìn)行的計(jì)算機(jī)模擬研究,是一種隨機(jī)全局搜索優(yōu)化方法,它模擬了自然選擇和遺傳中發(fā)生的復(fù)制、交叉和變異等現(xiàn)象,從一組隨機(jī)初始種群出發(fā),通過(guò)隨機(jī)選擇、交叉和變異操作,產(chǎn)生一群更適合環(huán)境的個(gè)體,使群體進(jìn)化到搜索空間中越來(lái)越好的區(qū)域,這樣不斷繁衍進(jìn)化,最后收斂到數(shù)學(xué)優(yōu)化算法是利用微積分、運(yùn)籌學(xué)、拓?fù)鋵W(xué)等數(shù)學(xué)知識(shí)尋找梯度優(yōu)化、Adam、拉格朗日優(yōu)化、線性規(guī)劃、動(dòng)態(tài)規(guī)劃等等。其中數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC1)流派不同:進(jìn)化算法和數(shù)學(xué)優(yōu)化算法分屬兩個(gè)不同流派,都有應(yīng)用案例。但由于神經(jīng)網(wǎng)絡(luò)大放異彩,部分?jǐn)?shù)學(xué)優(yōu)化算法作為神2)數(shù)學(xué)前提不同:進(jìn)化算法只需計(jì)算目標(biāo)函數(shù)的值即可,對(duì)優(yōu)化問(wèn)題本身的性質(zhì)要求是非常低的。數(shù)學(xué)優(yōu)化算法往往依賴于一大堆的條件,例如是否為凸優(yōu)化,目標(biāo)函數(shù)是否可微,目標(biāo)函數(shù)導(dǎo)數(shù)3)運(yùn)算復(fù)雜度不同:進(jìn)化算法需要不斷搜索、循環(huán)迭代,因此因此應(yīng)用范圍小于進(jìn)化算法。進(jìn)化算法基本可以運(yùn)用于所有優(yōu)化問(wèn)題,然而沒(méi)有充分利用問(wèn)題的數(shù)學(xué)性質(zhì),運(yùn)算速度慢。另外盡管進(jìn)化算法采用了變異等諸多手段,收斂不到全局最優(yōu)的可能性仍然存5)應(yīng)用場(chǎng)景不同:對(duì)于數(shù)學(xué)前提較好的優(yōu)化問(wèn)題,使用數(shù)學(xué)優(yōu)化算法速度快,而且相對(duì)容易保證全局最優(yōu)。但現(xiàn)實(shí)中也存在這樣的問(wèn)題,目標(biāo)函數(shù)數(shù)學(xué)性質(zhì)不好,非凸不連續(xù),或者直接無(wú)法知道數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC化算法無(wú)能為力,也以進(jìn)化算法為宜。另外,在神經(jīng)網(wǎng)絡(luò)領(lǐng)域,也出現(xiàn)了使用進(jìn)化算法進(jìn)行超參數(shù)調(diào)優(yōu)的例子,緩解了進(jìn)化算法的尷值得一提的是,隨著時(shí)代的發(fā)展,算力不斷提升將利好進(jìn)化算法。但算力也永遠(yuǎn)存在瓶頸,不過(guò)到一個(gè)新的位置罷了。因此,工“黑盒”和“白盒”是用于描述算法或系統(tǒng)的透明度的術(shù)語(yǔ)?!昂诤小敝傅氖且粋€(gè)系統(tǒng)或算法,其中內(nèi)部的工作機(jī)制是隱藏或不透明的。用戶只能看到輸入和輸出,而不能看到內(nèi)部如何進(jìn)行處簡(jiǎn)單性:用戶不需要了解內(nèi)部的工作原理,只需要關(guān)心輸入和通用性:由于不強(qiáng)調(diào)內(nèi)部的工作機(jī)制,因此黑盒方法往往更加靈活性:內(nèi)部實(shí)現(xiàn)可以在不影響外部接口的情況下進(jìn)行修改或數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC不透明:無(wú)法確定系統(tǒng)或算法為何會(huì)產(chǎn)生特定的輸出,這可能信任問(wèn)題:由于缺乏透明度,用戶可能難以完全信任系統(tǒng)或算“白盒”指的是一個(gè)系統(tǒng)或算法,其中內(nèi)部的工作機(jī)制是透明可調(diào)試性:由于內(nèi)部工作機(jī)制是知道的,因此更容易定位和修可定制性:了解內(nèi)部機(jī)制可以使用戶或開(kāi)發(fā)者針對(duì)特定應(yīng)用進(jìn)可能過(guò)于特定:由于太過(guò)側(cè)重于內(nèi)部機(jī)制,白盒方法可能不如數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC資源消耗:由于需要維護(hù)更多的細(xì)節(jié)信息,白盒方法可能需要在機(jī)器學(xué)習(xí)領(lǐng)域,例如深度學(xué)習(xí)模型通常被視為“黑盒”,因?yàn)樗鼈兊膬?nèi)部工作機(jī)制(即如何從輸入數(shù)據(jù)中學(xué)習(xí))對(duì)大多數(shù)用戶來(lái)說(shuō)都是不透明的,盡管其結(jié)構(gòu)和算法是已知的。而傳統(tǒng)的算法,如決策樹(shù),由于它們的決策過(guò)程較為直觀和可解釋,通常被視為在選擇使用黑盒還是白盒方法時(shí),要根據(jù)特定的應(yīng)用和需求進(jìn)行權(quán)衡。例如,如果需要一個(gè)可以提供可解釋性的系統(tǒng),白盒可能是更好的選擇。如果需要一個(gè)可以快速部署且對(duì)內(nèi)部工作機(jī)制不太解釋性,有利于安全策略的設(shè)計(jì)和人機(jī)協(xié)同控制,而黑盒算法具有更強(qiáng)的場(chǎng)景適應(yīng)性,同時(shí),白盒算法的設(shè)計(jì)需要更強(qiáng)的專家經(jīng)驗(yàn)支(五)算法部署架構(gòu)對(duì)比當(dāng)前算法部署主要有三種架構(gòu):邊緣部署,私有云中心部署及互聯(lián)網(wǎng)云部署。由于數(shù)據(jù)中心安全性要求較高,常見(jiàn)的主要有邊緣部署和私有云中心部署。隨著人工智能的飛速發(fā)展和大模型技術(shù)的不斷突破,部分算法任務(wù)遷移至互聯(lián)網(wǎng)云部署或?qū)⒊蔀橐环N趨勢(shì)。數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC但對(duì)于不同的算法任務(wù),應(yīng)綜合考慮算力需求、安全要求等等,對(duì)邊緣部署直接將算法模型部署在本地末端計(jì)算設(shè)備上,該末端計(jì)算設(shè)備往往通過(guò)串口、網(wǎng)絡(luò)等與溫濕度傳感器、壓力傳感器、空調(diào)、電表等直接相連,并完成數(shù)據(jù)采集、控制執(zhí)行等任務(wù)。這里將末端計(jì)算設(shè)備稱為邊緣監(jiān)控管理平臺(tái),并將機(jī)柜、溫濕度傳感器、邊緣部署是將算法直接部署在與末端系統(tǒng)直接相連的邊緣監(jiān)控管理平臺(tái)上,其中邊緣監(jiān)控管理平臺(tái)與末端系統(tǒng)一對(duì)一相連。以MDC場(chǎng)景下的算法部署為例,下面是MDC末端系統(tǒng)與邊緣監(jiān)控管理將算法模型部署于邊緣監(jiān)控管理平臺(tái)上有這樣的好處:比如數(shù)據(jù)傳輸距離短,延遲小,不容易受到數(shù)據(jù)傳輸中斷的影響,安全程數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC但是出于成本考慮邊緣監(jiān)控管理平臺(tái)往往性能不高,對(duì)算法的支持能力有限,比如無(wú)法流暢的運(yùn)行較深的神經(jīng)網(wǎng)絡(luò)模型。另外,因?yàn)槟┒讼到y(tǒng)與邊緣監(jiān)控管理平臺(tái)呈一對(duì)一的對(duì)應(yīng)關(guān)系,所以它不因此,邊緣部署特別適合于算力要求小,安全要求高的算法模型:比如單一MDC中末端空調(diào)的開(kāi)關(guān)控制、末端空調(diào)壓縮機(jī)風(fēng)機(jī)或本地中心部署將算法模型部署于本地中心監(jiān)控管理平臺(tái)上(或稱中心服務(wù)器,中心計(jì)算設(shè)備),一個(gè)中心監(jiān)控管理平臺(tái)與多個(gè)末端監(jiān)控管理平臺(tái)通過(guò)局域網(wǎng)相連,并通過(guò)末端監(jiān)控管理平臺(tái)間接實(shí)現(xiàn)對(duì)末端系統(tǒng)的優(yōu)化。同樣以MDC場(chǎng)景為例,中心監(jiān)控管理平臺(tái)、將算法模型部署于本地中心監(jiān)控管理平臺(tái):有利于充分利用多數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC末端系統(tǒng)數(shù)據(jù);有利于從更大層面對(duì)數(shù)據(jù)中心進(jìn)行節(jié)能控制;同時(shí)由于中心監(jiān)控管理平臺(tái)個(gè)數(shù)較少,這還便于提高算力支持能力,同時(shí)不至于成本增加太多;另外由于沒(méi)有使用公網(wǎng),整個(gè)系統(tǒng)仍然保因此,中心部署特別適合于算力要求適中,安全要求中等甚至較高,有多系統(tǒng)協(xié)作需求的算法任務(wù):比如冷機(jī)出水溫度設(shè)定點(diǎn)的另外,中心節(jié)能控制是對(duì)邊緣節(jié)能控制的進(jìn)一步完善,但不宜作為邊緣控制的完全替代。在中心監(jiān)控管理平臺(tái)通信故障時(shí),末端系統(tǒng)和邊緣監(jiān)控管理平臺(tái)仍應(yīng)可正常運(yùn)行。因此末端邊緣系統(tǒng)控制建議保留其完備性、高實(shí)時(shí)性和高可靠性。出于此考慮,諸如空調(diào)互聯(lián)網(wǎng)云將算法模型部署于網(wǎng)絡(luò)云平臺(tái)上,可以同時(shí)跟眾多本地中心監(jiān)控管理平臺(tái)、本地邊緣監(jiān)控管理平臺(tái)通過(guò)互聯(lián)網(wǎng)相連。如云平臺(tái)的巨大優(yōu)勢(shì)有利于收集數(shù)據(jù)和優(yōu)化算法模型。另外由于真正大算力所需的硬件成本非常昂貴,為了經(jīng)濟(jì)效益,前面的邊緣部署和中心部署終歸算力有限,因此,如大模型之類的算法模型只有云平臺(tái)可以支持。而隨著人工智能的發(fā)展,大模型越來(lái)越成熟,但云平臺(tái)數(shù)據(jù)傳輸距離長(zhǎng)、安全性差、穩(wěn)定性低、不可控因素因此,網(wǎng)絡(luò)云部署特別適合于模型較大,用于改善用戶感受而最后,云平臺(tái)還可用于遠(yuǎn)程更新邊緣算法模型,有利于算法版本的迅速迭代,收益變現(xiàn)。但對(duì)于數(shù)據(jù)中心這樣一個(gè)安全要求較高40數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC在一個(gè)空調(diào)循環(huán)周期中,壓縮機(jī)只有一半周期的時(shí)間在運(yùn)行,41數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC因此室內(nèi)風(fēng)機(jī)有一半周期無(wú)實(shí)際效果。所有空調(diào)的壓縮機(jī)的啟停都是根據(jù)回風(fēng)溫度來(lái)進(jìn)行控制,但根據(jù)測(cè)量,該空調(diào)的回風(fēng)溫度與實(shí)際溫度相差較大。這種溫度差異導(dǎo)致了壓縮機(jī)重復(fù)的啟停,空調(diào)壓縮機(jī)啟動(dòng)瞬間的工作電流是正常運(yùn)行狀態(tài)下的4-7倍,最終加大空調(diào)的能耗。與此同時(shí),在機(jī)房?jī)?nèi),機(jī)柜頂端處的溫度傳感器溫度達(dá)因此,由于回風(fēng)溫度控制與實(shí)際溫度存在差異,再加上壓縮機(jī)本案例AI技術(shù)應(yīng)用設(shè)計(jì)旨在通過(guò)現(xiàn)場(chǎng)采集器對(duì)基站空調(diào)進(jìn)行節(jié)方案總體設(shè)計(jì)上以空調(diào)建模+機(jī)器學(xué)習(xí)為主,同時(shí)輔助參數(shù)自動(dòng)優(yōu)化調(diào)節(jié)。保證場(chǎng)景最優(yōu)節(jié)能效果同時(shí),減少對(duì)算力和傳感器的依賴,可通過(guò)現(xiàn)有的監(jiān)控采集傳感設(shè)備,提高了整體投資回收期。安全方面與空調(diào)底層控制邏輯緊密耦合,時(shí)刻監(jiān)控安全便捷,避免影該方案通過(guò)在采集器上加載節(jié)能管理軟件,根據(jù)設(shè)定的控制邏輯對(duì)基站空調(diào)進(jìn)行監(jiān)控,包括空調(diào)運(yùn)行狀態(tài)及開(kāi)關(guān)機(jī)控制,以及機(jī)房環(huán)境溫度監(jiān)測(cè)。算法通過(guò)減少壓縮機(jī)啟動(dòng)次數(shù)、提高制冷效率、減少室內(nèi)風(fēng)機(jī)運(yùn)行時(shí)間等方式,在保障通信42數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC海拔、所處位置環(huán)境等因素影響,算法設(shè)計(jì)上需要著重考慮控制安全。算法采用中心-邊緣的方式,算法尋優(yōu)推理在中心完成,并同步到邊緣智能控制主機(jī)來(lái)執(zhí)行,執(zhí)行包括空調(diào)啟停、空調(diào)啟停溫度設(shè)基站算法在中心采用大模型方式,通過(guò)基站所屬地理位置、面積、建筑物類型,空調(diào)類型、空調(diào)數(shù)量、室外溫濕度、電源輸出負(fù)載、基站業(yè)務(wù)類型等參數(shù)進(jìn)行分類。針對(duì)不同分類首先通過(guò)氣流組織仿真算法建立初始模型,算法在運(yùn)行過(guò)程中不斷采樣新數(shù)據(jù)進(jìn)行最佳算法模型,在探測(cè)到室外溫濕度、負(fù)載等數(shù)據(jù)變化超出一定閾邊緣節(jié)能軟件內(nèi)置溫度預(yù)測(cè)嵌入式AI模型和保護(hù)策略,在預(yù)測(cè)到有高溫風(fēng)險(xiǎn)后,自動(dòng)啟動(dòng)安全保護(hù)策略。邊緣預(yù)測(cè)算法采用嵌入數(shù)據(jù)主要包括空調(diào)的開(kāi)關(guān)機(jī)狀態(tài),送回風(fēng)溫度,溫濕度傳感器的溫度和濕度等。同時(shí),通過(guò)優(yōu)化基站溫度采集位置,基于采集的機(jī)房溫度來(lái)控制空調(diào)運(yùn)行,避免因氣流組織問(wèn)題引起的回風(fēng)溫度不43數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC首先,根據(jù)控制邏輯開(kāi)發(fā)節(jié)能管理軟件,并加載到智能采集器中進(jìn)行調(diào)試。然后,在動(dòng)環(huán)監(jiān)控中正式啟動(dòng)基站空調(diào)節(jié)能運(yùn)行及管本方案在設(shè)計(jì)上充分考慮了安全因素。所有空調(diào)、溫濕度傳感器以及電表均接入同一個(gè)采集器,使得數(shù)據(jù)的采集和控制統(tǒng)一,避免了與平臺(tái)數(shù)據(jù)傳輸?shù)娘L(fēng)險(xiǎn),提高了控制命令下發(fā)的速度。此外,方案優(yōu)化調(diào)整了原有監(jiān)控方案的溫度告警機(jī)制,避免出現(xiàn)局部熱點(diǎn)在未啟用AI節(jié)能系統(tǒng)之前,該運(yùn)營(yíng)商基站機(jī)房在冬季最冷的月機(jī)房的日用電量降低至233kwh,相較于改造前,制冷系統(tǒng)的能化情況,全年AI節(jié)能效果預(yù)計(jì)節(jié)約電費(fèi):12×1891×0.7=15884元/年。降低了能源消耗,提高了經(jīng)濟(jì)效益。此外,該方案還有助于解44數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC決局部熱點(diǎn)問(wèn)題,消除過(guò)熱隱患,保障數(shù)據(jù)中心的穩(wěn)定運(yùn)行?;贏I強(qiáng)化學(xué)習(xí)算法的空調(diào)節(jié)能控制解決方案的成功應(yīng)用,顯示了人工在基站場(chǎng)景中,安全設(shè)置是首要考慮的因素。首先,控制策略被下放到采集器中,以避免軟件誤操作帶來(lái)的影響。其次,采集器收集的數(shù)據(jù)被存儲(chǔ)在本地,并進(jìn)行清洗、篩選等預(yù)處理以及算法訓(xùn)實(shí)際后續(xù)應(yīng)用中,現(xiàn)場(chǎng)可以根據(jù)情況在兩種45數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC由于線上業(yè)務(wù)活躍度的晝夜差異性,機(jī)房中的服務(wù)器工作功率也隨之明顯不同,冷凝器側(cè)熱交換效率在不同時(shí)間段有所差異,同但原有的空調(diào)控制策略相對(duì)較為粗糙,雖然將機(jī)房的溫度控制在正常范圍內(nèi),但由于空調(diào)熱交換效率和服務(wù)器散熱需求在不同時(shí)間段46對(duì)該機(jī)房進(jìn)行改造前,服務(wù)器負(fù)荷處于高位運(yùn)行狀態(tài),總負(fù)載功率約98kW,整體溫度正常,但備機(jī)空調(diào)未自動(dòng)打開(kāi),空調(diào)運(yùn)行在對(duì)機(jī)房進(jìn)行節(jié)能改造的歷史數(shù)據(jù)分析過(guò)程中,發(fā)現(xiàn)機(jī)房的微模塊在運(yùn)行過(guò)程中,由于對(duì)吹和近似對(duì)吹的空調(diào)互相干擾,導(dǎo)致其工作狀態(tài)收斂于周期性波動(dòng)。此外,微模塊采用了送風(fēng)控制,但是由于自然環(huán)境溫度和負(fù)載功率的變化,不同時(shí)間段的回風(fēng)側(cè)溫度會(huì)出現(xiàn)時(shí)高時(shí)低的現(xiàn)象。這些現(xiàn)狀下,機(jī)房存在以下幾個(gè)問(wèn)題:當(dāng)回風(fēng)側(cè)溫度偏低時(shí),會(huì)導(dǎo)致冷量的浪費(fèi),使得模塊工作在較高的pPUE狀態(tài)。同時(shí),空調(diào)器件被單獨(dú)的空調(diào)自身控制,空調(diào)間相互影響形成競(jìng)爭(zhēng)運(yùn)行,也會(huì)收斂于周期性波動(dòng)。這種情況下,溫度會(huì)在不斷47對(duì)該機(jī)房進(jìn)行改造前,空調(diào)器件由空調(diào)自身單獨(dú)控制,空調(diào)相在對(duì)機(jī)房現(xiàn)狀的分析中,發(fā)現(xiàn)原始的空調(diào)開(kāi)關(guān)策略過(guò)于粗糙,即僅在空調(diào)溫度測(cè)點(diǎn)或關(guān)聯(lián)傳感器測(cè)點(diǎn)溫度過(guò)高或過(guò)低時(shí)才進(jìn)行開(kāi)48數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC考慮到服務(wù)器負(fù)載功率在不同時(shí)間段有大的差異,引入負(fù)載功率作為輸入?yún)?shù)之一。同時(shí),許多數(shù)據(jù)中心難以獲取室外溫度,因此選擇引入空調(diào)送回風(fēng)溫度、機(jī)柜送回風(fēng)溫度等,使得算法能夠間接學(xué)具體的方案包括:使用負(fù)載功率、空調(diào)送風(fēng)溫度、空調(diào)回風(fēng)溫度、機(jī)柜送風(fēng)溫度、機(jī)柜回風(fēng)溫度、傳感器以及空調(diào)位置信息等特征及其復(fù)合特征作為算法輸入。綜合考慮空調(diào)功率、溫度與目標(biāo)值的偏離程度、溫場(chǎng)均勻程度作為算法自優(yōu)化的評(píng)價(jià)或收益反饋。同時(shí),空調(diào)開(kāi)機(jī)個(gè)數(shù)、開(kāi)機(jī)位置、及溫度設(shè)定點(diǎn)被用作調(diào)節(jié)手段,即算法采用由LinUCB和xgboost組合而成的級(jí)聯(lián)算法模型,其中LinUCB用于進(jìn)行能效探索優(yōu)化,而xgboost用于進(jìn)行溫于空調(diào)無(wú)法頻繁開(kāi)關(guān),樣本間隔長(zhǎng)且收集困難,采用了收斂速度較快的LinUCB,尤其是采用級(jí)聯(lián)模型進(jìn)一步提升收斂效率。考慮到特49數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC定數(shù)據(jù)中心樣本不易獲取,不能進(jìn)行批量訓(xùn)練,因此沒(méi)有采用新興的強(qiáng)化學(xué)習(xí)算法,而是選擇更快更穩(wěn)定的LinUCB。然而,LinUCB仍然具有強(qiáng)化學(xué)習(xí)的探索能力,能適應(yīng)自然環(huán)境的變化。xgboost用于滿足自然環(huán)境、負(fù)載功率及開(kāi)關(guān)機(jī)變化引起的溫度調(diào)節(jié)需求。并通過(guò)對(duì)機(jī)房現(xiàn)狀的分析,由于初始空調(diào)器件被自身單獨(dú)控制并相互干擾,因此考慮利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)對(duì)不同空調(diào)器件的統(tǒng)一群體控制。這種方法不僅解決了設(shè)備之間控制的相互干擾問(wèn)題,而且還能使空調(diào)設(shè)備之間和設(shè)備內(nèi)部的各個(gè)組件協(xié)同工作,以實(shí)現(xiàn)節(jié)能效果。同時(shí),將能效和溫度作為評(píng)估或反饋的共同指標(biāo),兼顧節(jié)能和溫度控制,避免回風(fēng)側(cè)溫度過(guò)低。空調(diào)器件級(jí)協(xié)作方式如下圖具體方案:將負(fù)載功率、機(jī)柜送風(fēng)溫度、機(jī)柜回風(fēng)溫度以及壓綜合考慮空調(diào)能耗、溫度與目標(biāo)值的偏離程度以及溫度場(chǎng)的均勻程度作為算法自優(yōu)化的評(píng)價(jià)或反饋。將壓縮機(jī)容量、風(fēng)機(jī)轉(zhuǎn)速(或水算法采用模型預(yù)測(cè)控制(MPC)模型。首先構(gòu)建系統(tǒng)模型,以映射溫度、設(shè)備輸出和負(fù)載功率之間的關(guān)系。然后,使用拉格朗日優(yōu)化方法尋找適宜的溫度和更低的能耗的設(shè)備輸出組合。這種方法穩(wěn)定,收斂速度快,并具有良好的魯棒性。在建模過(guò)程中,使用過(guò)去一段時(shí)間內(nèi)多個(gè)時(shí)刻的狀態(tài)作為輸入,以增強(qiáng)模型的抗干擾能力和理解變化趨勢(shì)的能力。同時(shí),使用未來(lái)一段時(shí)間內(nèi)多個(gè)時(shí)刻的預(yù)測(cè)結(jié)果共同作為反饋,以提高模型的長(zhǎng)期收益能力。此外,還引入了探索機(jī)制,以幫助模型不斷優(yōu)化。最后,對(duì)特征工程、初始化以及通過(guò)對(duì)兩種場(chǎng)景方案的對(duì)比分析,建議在微模塊場(chǎng)景下黑盒模型和白盒模型聯(lián)合使用,但仍然是可分別單獨(dú)使用的。其中白盒模型是細(xì)顆粒度調(diào)節(jié),是底層器件的微調(diào);其中黑盒模型是粗顆粒度該機(jī)房經(jīng)過(guò)改造后空調(diào)的開(kāi)關(guān)能力更加細(xì)致。由于當(dāng)前負(fù)荷較高,改造后自動(dòng)開(kāi)啟了空調(diào)備機(jī),并進(jìn)行溫度設(shè)定點(diǎn)調(diào)整,節(jié)能效果約為(18.1-15.9)/18.1數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC另外通過(guò)對(duì)空調(diào)EER曲線的分析,發(fā)現(xiàn)在極端場(chǎng)景下,方案的該機(jī)房經(jīng)過(guò)改造后,對(duì)氣流組織、溫度場(chǎng)、冷量分配的調(diào)節(jié)更加細(xì)膩,可對(duì)冷熱通道分區(qū)域調(diào)節(jié),對(duì)于冷通道或熱通道可參考機(jī)柜溫度進(jìn)行精確調(diào)節(jié)。同時(shí)改造后,空調(diào)的輸出更加穩(wěn)定。節(jié)能效果約為(18.07-15.65)/18.07通過(guò)比較AI開(kāi)啟前后的冷熱通道平均溫度,從下圖可以看出AI在允許的范圍內(nèi)適當(dāng)提升了熱通道溫度,但這并不是簡(jiǎn)單的以熱根據(jù)工作經(jīng)驗(yàn)和數(shù)據(jù),存在某些工況場(chǎng)景的熱通道溫度可能更低,因此節(jié)能空間有更大的潛力。然而,算法實(shí)際上是通過(guò)器件協(xié)作和能耗反饋實(shí)現(xiàn)節(jié)能的,即使熱通道溫度相同,適當(dāng)?shù)谋壤途送猓珹I開(kāi)啟后,4臺(tái)空調(diào)的壓縮機(jī)波動(dòng)更小,運(yùn)行更穩(wěn)定如(三)房間級(jí)場(chǎng)景案例位置與布局:坐落于華東地區(qū),屬于夏季炎熱、冬季寒冷的氣總負(fù)載約為252KVA,負(fù)載上架率大致在30%-40%,A機(jī)房配備8臺(tái)房間級(jí)風(fēng)冷空調(diào)。B機(jī)房與A機(jī)房位于同一建筑物的不同樓層,占地面積與機(jī)柜數(shù)量均與A機(jī)房相同,但具有7個(gè)封閉冷通道微模塊),數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC但同樣存在局部熱點(diǎn)和溫度分布不均的問(wèn)題??照{(diào)設(shè)備在較長(zhǎng)時(shí)間內(nèi)保持穩(wěn)定狀態(tài),溫度設(shè)定未發(fā)生變化,導(dǎo)致了大量的制冷冗余和該解決方案旨在應(yīng)用基于AI強(qiáng)化學(xué)習(xí)算法的空調(diào)節(jié)能控間級(jí)空調(diào)系統(tǒng)中,以提升已建設(shè)的動(dòng)力環(huán)境集中監(jiān)控管理系統(tǒng)的空方案總體設(shè)計(jì)上為專家經(jīng)驗(yàn)+神經(jīng)網(wǎng)絡(luò)+強(qiáng)化學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)+強(qiáng)化學(xué)習(xí)保證場(chǎng)景最優(yōu)節(jié)能效果,同時(shí)專家經(jīng)驗(yàn)的加入提高了整體的從安全性方面看,專家經(jīng)驗(yàn)也為保底策略的設(shè)計(jì)和合理調(diào)節(jié)步長(zhǎng)的進(jìn)行AI強(qiáng)化學(xué)習(xí),以實(shí)現(xiàn)對(duì)空調(diào)的節(jié)能控制。算法涉及的狀態(tài)、控制和獎(jiǎng)勵(lì)要素包括開(kāi)關(guān)機(jī)狀態(tài)、進(jìn)/出風(fēng)溫濕度、冷/熱通道溫濕度等。為保障運(yùn)行安全,AI算法中引入了安全保障機(jī)制。采集溫濕度傳感器的溫濕度數(shù)據(jù)、空調(diào)的送回風(fēng)和功率、風(fēng)機(jī)和壓縮機(jī)的開(kāi)度數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC及其他相關(guān)控制參數(shù)。該策略解決了冷通道熱點(diǎn)問(wèn)題,改善了空調(diào)IDC機(jī)房場(chǎng)景各異,包括送風(fēng)方式、機(jī)柜封閉方式、空調(diào)變頻與否以及空調(diào)使用壽命等等,機(jī)房負(fù)載隨時(shí)間變化頻繁,為了實(shí)現(xiàn)見(jiàn)效快、安全運(yùn)行、自適應(yīng)長(zhǎng)期穩(wěn)定節(jié)能等目標(biāo),采取組合算法方式,節(jié)能系統(tǒng)內(nèi)置算法自動(dòng)評(píng)估模塊,在不同階段、不同環(huán)境下對(duì)節(jié)能系統(tǒng)同時(shí)內(nèi)置算法自動(dòng)訓(xùn)練模塊,在超出一定的閾值后,自動(dòng)算法的一般原則是運(yùn)行的初始階段,此時(shí)有效樣本數(shù)據(jù)有限,采用專家經(jīng)驗(yàn)、機(jī)理模型和輕量級(jí)機(jī)器學(xué)習(xí)算法,使控制策略可以有效的控制在安全區(qū)間,具備更好的趨勢(shì)性,避免少樣本大模型下的嚴(yán)重控制策略偏離。輕量級(jí)機(jī)器學(xué)習(xí)算法主要包括遺傳算法、粒子群算法、模擬退火、強(qiáng)化學(xué)習(xí)以及算法組合尋優(yōu)。在系統(tǒng)評(píng)估算法到達(dá)切換點(diǎn)之后,即可以轉(zhuǎn)入第二階段算法,此時(shí)具備一定的數(shù)算法一般采用深度神經(jīng)網(wǎng)絡(luò)。最后一個(gè)階段采用深度強(qiáng)化學(xué)習(xí),通過(guò)遷移學(xué)習(xí)先把以后的節(jié)能策略遷移到深度強(qiáng)化學(xué)習(xí)模型。模型評(píng)估管理平臺(tái)依據(jù)機(jī)房實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行評(píng)估和切換,不是所有機(jī)房都按照以上第一、二、三階段運(yùn)行,如果始終不具備進(jìn)一步切換條算法的另外一個(gè)核心在于評(píng)價(jià)函數(shù),評(píng)價(jià)函數(shù)一般包含機(jī)房所有溫濕度實(shí)時(shí)值、當(dāng)前策略下的空調(diào)能耗水平。由于場(chǎng)地溫濕度傳感器的數(shù)量布置不一樣,評(píng)價(jià)函數(shù)需要針對(duì)性進(jìn)行編寫(xiě),機(jī)房也可能對(duì)恒溫恒濕有更高要求,此時(shí)評(píng)估函數(shù)的權(quán)值則需要優(yōu)化調(diào)整。溫濕度的評(píng)價(jià)函數(shù)可以采用多次方程或者高斯分布等數(shù)學(xué)技能,越溫濕度傳感器是采集機(jī)房環(huán)境溫度的關(guān)鍵設(shè)備。在此場(chǎng)景中,部署了104個(gè)溫濕度傳感器,在每一列機(jī)柜的前后各部署4個(gè)溫濕度傳感器,同時(shí)兼顧冷熱通道的溫度。此外,共有6臺(tái)空調(diào),能采集到算法所需的相關(guān)數(shù)據(jù),同時(shí)滿足下發(fā)控制命令的功能。最后,電表也是衡量節(jié)能前后的重要設(shè)備,每一列機(jī)柜和空調(diào)上都安裝了數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC除節(jié)能控制外,評(píng)估AI算法是否能解決局部患。通過(guò)對(duì)機(jī)房進(jìn)行氣流組織分析,發(fā)現(xiàn)存在明顯的局部熱點(diǎn)和氣AI業(yè)務(wù)軟件部署階段,基于現(xiàn)有監(jiān)控平臺(tái)提取兩個(gè)月數(shù)據(jù)進(jìn)行AI業(yè)務(wù)評(píng)估階段,從熱點(diǎn)消除情況和能源效率改進(jìn)狀況兩個(gè)方數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC兩個(gè)機(jī)房的空調(diào)能源效率分別提升了18%和15%,AI模式相較于常規(guī)模式在夏季最熱月分別可節(jié)電8643度/月、9470度/月,降低了能源消耗,提高了經(jīng)濟(jì)效益。此外,該方案還有助于解決局部熱制解決方案具有更高的智能化水平和優(yōu)化效果,能夠根據(jù)實(shí)時(shí)環(huán)境狀態(tài)和反饋信息調(diào)整控制策略,提高空調(diào)運(yùn)行效率。此外,AI算法的快速學(xué)習(xí)收斂和控制穩(wěn)定性特點(diǎn),使得節(jié)能效果更為顯著且可持續(xù)。在采用AI強(qiáng)化學(xué)習(xí)算法后,冷通道溫度沒(méi)情況,A機(jī)房整個(gè)冷通道的四個(gè)溫度傳感器反饋的溫度基本維持在數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC25-26攝氏度左右,B機(jī)房所有微模塊冷通道的四個(gè)溫度傳感器反饋的溫度基本維持在26-27攝氏度左右,既保證了熱點(diǎn)的消除,也保證了通道溫度的均衡。在此前提下,空調(diào)的電能有了明顯的下降,整體pPUE也有明顯的下降,實(shí)現(xiàn)了在保證安全的前在數(shù)據(jù)中心AI節(jié)能中,安全是所有工作的前提。本場(chǎng)景下的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)中心的本地,極大地保證了數(shù)據(jù)的安全性。同時(shí),通過(guò)溫度告警以及設(shè)備通訊等多種告警模式,在出現(xiàn)熱點(diǎn)以及其他問(wèn)題時(shí)可以及時(shí)發(fā)現(xiàn)并處理。最后,軟件中還加入了保底策略以及策(四)樓宇級(jí)場(chǎng)景案例位置與布局該數(shù)據(jù)中心位于西南地區(qū),屬于亞熱帶季風(fēng)氣候區(qū),氣候溫暖濕潤(rùn)。整棟?rùn)C(jī)樓占地約900平方米,包括一樓的高低壓配電房,二三樓的業(yè)務(wù)機(jī)房,四樓的通訊機(jī)房以及頂層的水冷設(shè)備。機(jī)樓內(nèi)置數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC該系統(tǒng)包括兩個(gè)螺桿冷水機(jī)組,10個(gè)閥門(mén)和10個(gè)水泵,以及盡管機(jī)柜的上架率目前較低,但由于空調(diào)設(shè)備在較長(zhǎng)時(shí)間內(nèi)保持穩(wěn)定狀態(tài),且溫度設(shè)定未發(fā)生變化,可能存在大量的制冷冗余和溫度分布不均的問(wèn)題。溫濕度傳感器反饋的數(shù)據(jù)表明負(fù)載較高的地方溫度已經(jīng)超過(guò)了29攝氏度,負(fù)載較低的地方溫度只有24攝氏度左右。但所有空調(diào)的送回風(fēng)溫度設(shè)置都是相同的,造成冷量的極大浪費(fèi)。目前,機(jī)樓的整體PUE(功率使用效率)為2.04,這表明在本應(yīng)用案例的AI節(jié)能水冷機(jī)樓方案實(shí)施,旨在通過(guò)基于AI強(qiáng)化學(xué)習(xí)算法的空調(diào)節(jié)能控制,提升已建設(shè)的動(dòng)力環(huán)境集中監(jiān)控管理方案總體設(shè)計(jì)上為機(jī)理建模+神經(jīng)網(wǎng)絡(luò)+強(qiáng)化學(xué)習(xí)。由于冷凍水系統(tǒng)過(guò)程參量巨大,機(jī)理建??梢杂行Ы⒘恐凹s束關(guān)系,對(duì)以有效調(diào)節(jié)算法參數(shù),保證場(chǎng)景最優(yōu)節(jié)能效果,充分適應(yīng)復(fù)雜冷凍水場(chǎng)景下的房間差異。最終保證了實(shí)際方案的適應(yīng)性和整體投資回?cái)?shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC方案通過(guò)在監(jiān)控管理系統(tǒng)上加載AI強(qiáng)化學(xué)控制和獎(jiǎng)勵(lì)要素包括開(kāi)關(guān)機(jī)狀態(tài)、進(jìn)/出風(fēng)溫濕度、冷/熱通道溫濕度,以及冷水系統(tǒng)的閥門(mén)開(kāi)度、進(jìn)出水溫度、進(jìn)出水流量、壓縮機(jī)開(kāi)度、水泵功率、頻率和室外干濕球溫度等。為保障運(yùn)行安全,AI系統(tǒng)。采集的數(shù)據(jù)主要包括空調(diào)的開(kāi)關(guān)機(jī)狀態(tài)、送回風(fēng)溫度,溫濕度傳感器的溫度和濕度,以及冷水系統(tǒng)的閥門(mén)開(kāi)度、進(jìn)出水溫度、進(jìn)出水流量、壓縮機(jī)開(kāi)度、水泵功率、頻率和室外干濕球溫度等。四樓的房間共包含59個(gè)溫度傳感器,包括微模塊中的16個(gè)溫濕度數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)ODCC進(jìn)步,AI算法的迭代將不斷完善克服現(xiàn)有挑戰(zhàn),提高對(duì)復(fù)雜場(chǎng)景和新型威脅的識(shí)別能力。未來(lái),AI技術(shù)在數(shù)據(jù)中心領(lǐng)域的發(fā)展將呈現(xiàn)更高的自動(dòng)化程度、智能化管理和綠色節(jié)能性。實(shí)現(xiàn)進(jìn)一步優(yōu)化資AI技術(shù)將助力數(shù)據(jù)中心實(shí)現(xiàn)更高的能源效率和環(huán)境友好性,降未來(lái)的智能供配電系統(tǒng)將進(jìn)一步實(shí)現(xiàn)自動(dòng)化與智能化,例如通數(shù)據(jù)中心將采用更先進(jìn)的AI技術(shù)來(lái)優(yōu)化能源管理,實(shí)現(xiàn)更高的微電網(wǎng)集成與優(yōu)化實(shí)現(xiàn)對(duì)多種能源類型(如太陽(yáng)能、風(fēng)能、蓄電池等)的優(yōu)化調(diào)度。這將有助于提高能源利用率,降低能源成本,同時(shí)增強(qiáng)數(shù)據(jù)中心的數(shù)據(jù)中心自適應(yīng)AI節(jié)能技術(shù)白皮書(shū)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論