(7)IT運(yùn)維管理:ITIL先鋒論壇-行業(yè)IT運(yùn)維白皮書-監(jiān)控技術(shù)規(guī)范_第1頁
(7)IT運(yùn)維管理:ITIL先鋒論壇-行業(yè)IT運(yùn)維白皮書-監(jiān)控技術(shù)規(guī)范_第2頁
(7)IT運(yùn)維管理:ITIL先鋒論壇-行業(yè)IT運(yùn)維白皮書-監(jiān)控技術(shù)規(guī)范_第3頁
(7)IT運(yùn)維管理:ITIL先鋒論壇-行業(yè)IT運(yùn)維白皮書-監(jiān)控技術(shù)規(guī)范_第4頁
(7)IT運(yùn)維管理:ITIL先鋒論壇-行業(yè)IT運(yùn)維白皮書-監(jiān)控技術(shù)規(guī)范_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1概述 5 5 5 5 5 8 8 8 8 11 11 11 12 13 16 16 16 17 17 17 18 18 19 20 21 21 21文檔版本01(2019) 223物理資源監(jiān)控 23 23 24 25 25 25 26 26 26 27 28 28 29 30 30 30 30 31 32 32 32 32 33 33 33 33 34 35 36 36 37 37 38 39 39 40 41 43 43 1概述1.1目的本文件描述了華為統(tǒng)一運(yùn)維服務(wù)在監(jiān)控IT資源方面的技術(shù)標(biāo)準(zhǔn),以便為客戶提供對(duì)各種IT資源的統(tǒng)一監(jiān)控能力。監(jiān)控對(duì)象主要包括機(jī)房動(dòng)力環(huán)境、物理資源、云基礎(chǔ)資源、應(yīng)用系統(tǒng)運(yùn)行環(huán)境以及應(yīng)用系統(tǒng)資源等。1.2適用對(duì)象本白皮書適用于華為行業(yè)運(yùn)維服務(wù)銷售和服務(wù)交付等相關(guān)人員。1.3術(shù)語、定義和縮略語1.3.1術(shù)語和定義以下術(shù)語和定義適用于本文件。彈性云服務(wù)器由CPU、內(nèi)存、鏡像、云硬盤組成的一種可隨時(shí)獲取、彈性可擴(kuò)展的計(jì)算服務(wù)器云硬盤是一種虛擬塊存儲(chǔ)服務(wù),主要給彈性云服務(wù)器和裸金屬服務(wù)器提供塊存儲(chǔ)空間裸金屬服務(wù)器是用于向用戶提供獨(dú)享的裸金屬服務(wù)器,以減少虛擬化層帶來的應(yīng)用計(jì)算機(jī)軟件,旨在實(shí)現(xiàn)特定的業(yè)務(wù)功能。對(duì)象存儲(chǔ)服務(wù)是一個(gè)基于對(duì)象的海量存儲(chǔ)服務(wù),為您提供海量、安全、高可靠、低成本的數(shù)據(jù)存儲(chǔ)能力。WASWebSphereApplicationServer,即IBM的WebSphere應(yīng)用程序服務(wù)器。線程池異常當(dāng)前使用webcontainer線程數(shù)超過最大值一定比例。GC異常GC(GarbageCollection)時(shí)長(zhǎng)超長(zhǎng)。SDK軟件開發(fā)工具包(SoftwareDevelopmentKit,SDK)一般是一些被軟件工程師用于為特定的軟件包、軟件框架、硬件平臺(tái)、作業(yè)系統(tǒng)等創(chuàng)建應(yīng)用軟件的開發(fā)工具的集合。崩潰崩潰(Crash)是指應(yīng)用在運(yùn)行過程中出現(xiàn)的強(qiáng)制關(guān)閉(ForceClosing)現(xiàn)象,從而打斷用戶正在進(jìn)行的操作??D卡頓(ApplicationNotResponding,即應(yīng)用無響應(yīng))一般由于應(yīng)用程序主線程執(zhí)行時(shí),長(zhǎng)時(shí)間沒有響應(yīng)(通常是15秒~30秒左右),系統(tǒng)就會(huì)彈出ANR的提示窗口,供用戶選擇繼續(xù)等待還是結(jié)束應(yīng)用程序。DEMDigitalExperienceMonitoring(DEM)是應(yīng)用程序性能監(jiān)控領(lǐng)域新出現(xiàn)的技術(shù)。主要是站在使用者的角度來監(jiān)控應(yīng)用系統(tǒng)的健康狀態(tài),重點(diǎn)關(guān)注用戶體驗(yàn),如訪問成功與否、響應(yīng)性能等STMSyntheticTransactionMonitoring(STM)。模擬用戶通過URL來訪問應(yīng)用,包括常規(guī)訪問和簡(jiǎn)單事務(wù),可以提供通達(dá)性、成功率、響應(yīng)性能的監(jiān)控指標(biāo),并基于相關(guān)指標(biāo)進(jìn)行告警設(shè)置;可以提供諸如DNS查詢、TCP建連、首屏、首頁等復(fù)雜指標(biāo)供調(diào)查分析。監(jiān)控點(diǎn)分布式部署于Internet或內(nèi)網(wǎng)的用戶側(cè),可以通過幾十到上百個(gè)監(jiān)控代理節(jié)點(diǎn)提供服務(wù),申請(qǐng)人可以自主選擇需要發(fā)起的監(jiān)控點(diǎn)分布情況、監(jiān)控頻率等RUMRealUserMonitoring(RUM)。通過客戶端嵌碼的方式收集真實(shí)用戶使用應(yīng)用系統(tǒng)的體驗(yàn)數(shù)據(jù),如性能、訪問失敗等;移動(dòng)APP通過預(yù)埋SDK的方式實(shí)現(xiàn),網(wǎng)頁應(yīng)用需要在系統(tǒng)后臺(tái)植入JS代碼,瀏覽器訪問時(shí)自動(dòng)加載。此服務(wù)部署前必須通過兼容性測(cè)試,并確保采集的數(shù)據(jù)遵守用戶隱私相關(guān)的要求。主機(jī)硬件服務(wù)器硬件(PhysicalHardware),包括不限于機(jī)架服務(wù)器、刀片服務(wù)器等的硬件設(shè)備。塊存儲(chǔ)BlockStorage:指在一個(gè)RAID(獨(dú)立磁盤冗余陣列)集中,一個(gè)控制器加入一組磁盤驅(qū)動(dòng)器,然后提供固定大小的RAID塊作為L(zhǎng)UN(邏輯單元號(hào))的卷。文件存儲(chǔ)FileStorage:指NAS存儲(chǔ)設(shè)備。對(duì)象存儲(chǔ)ObjectStorage:用來描述解決和處理離散單元的方法的通用術(shù)語,這些離散單元被稱作為對(duì)象。SAN交換機(jī)SANSwitch:指FCSAN網(wǎng)絡(luò)中的交換機(jī)設(shè)備。虛擬化平臺(tái)Hypervisor:物理設(shè)備上部署的虛擬化層,提供VM服務(wù)。操作系統(tǒng)OperatingSystem:如Linux、Windows、AIX等。不間斷電源(UninterruptiblePowerSystem):一種含有儲(chǔ)能裝置,以逆變器為主要組成部分的恒壓恒頻的不間斷電源。主要用于給計(jì)算機(jī)、計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)或其它電力電子設(shè)備提供不間斷的電源分配單元(PowerDistributionUnit):具備對(duì)電流、電壓及接口的分配和對(duì)開關(guān)控制、電路中的各種參數(shù)監(jiān)視、線路切換承載限制、電源插口匹配安裝、線纜、空間及電涌防護(hù)、極性控制的管理功能。RPDU機(jī)柜級(jí)電源分配單元(RackPowerDistributionUnit):安裝在機(jī)柜內(nèi)部,具備對(duì)電流、電壓及接口的分配和對(duì)開關(guān)控制、電路中各種參數(shù)監(jiān)視。STS靜態(tài)轉(zhuǎn)換開關(guān)(StaticTransferSwitch):在兩個(gè)獨(dú)立的同步的交流電源之間進(jìn)行快速自動(dòng)切換的開關(guān),以便向關(guān)鍵設(shè)備(比如信息技術(shù)設(shè)備)提供不間斷的交流電源。機(jī)房環(huán)境指IT設(shè)備運(yùn)行的機(jī)房基礎(chǔ)環(huán)境,包括溫濕度、塵埃、照明、噪聲、電磁場(chǎng)干擾、振動(dòng)、漏水等。精密空調(diào)精密空調(diào)(PrecisionAir-condition):對(duì)環(huán)境溫度、濕度、空氣潔凈度和空氣分布進(jìn)行綜合控制的空氣調(diào)節(jié)設(shè)備。BAS樓宇自動(dòng)化系統(tǒng)(BuildingAutomationSystem):對(duì)樓宇的設(shè)施和環(huán)境進(jìn)行監(jiān)測(cè)和自動(dòng)控制的系統(tǒng)。液冷單元(LiquidCoolingUnit):一種制冷單元,后端接冷水系統(tǒng),通過水冷的方式,將封閉空間內(nèi)的溫度降低。加濕器加濕器:是一種增加房間內(nèi)濕度的儀器,當(dāng)機(jī)房濕度過低時(shí)容易引起靜電,所以機(jī)房?jī)?nèi)為保持恒濕需要使用加濕器。 本規(guī)范描述了IT機(jī)房設(shè)施與環(huán)境監(jiān)控的監(jiān)控對(duì)象以及部分監(jiān)控指標(biāo)的含義,確保IT機(jī)房?jī)?nèi)的重要設(shè)施與機(jī)房環(huán)境按要求納入監(jiān)控,以保障IT機(jī)房穩(wěn)定可靠運(yùn)行。2.1監(jiān)控對(duì)象納管2.1.1監(jiān)控對(duì)象范圍監(jiān)控對(duì)象為數(shù)據(jù)中心關(guān)鍵基礎(chǔ)設(shè)施,主要包括:l供配電設(shè)施:市電進(jìn)線柜、中低壓配電柜、直流屏、變壓器、UPS、HVDC、電池、精密配電柜、RPDU、STS、ATS、發(fā)電機(jī)組及供油系統(tǒng)等;l暖通和制冷設(shè)施:制冷主機(jī)、水泵、冷卻塔、板換、閥門、群控系統(tǒng)、精密空l機(jī)房環(huán)境:機(jī)柜、溫濕度、漏水、空氣質(zhì)量等;l安防和消防設(shè)施:門禁、視頻監(jiān)控、VESDA、煙感、溫感、消防主機(jī)等。監(jiān)控范圍主要包括:l性能指標(biāo)數(shù)據(jù):設(shè)備運(yùn)行參數(shù)指標(biāo),用于綜合管理(記錄、分析、診斷等)的數(shù)據(jù),如電流、溫度、壓力等;l告警數(shù)據(jù):設(shè)備運(yùn)行異常告警,如設(shè)備故障、關(guān)鍵狀態(tài)改變、指標(biāo)超限值等。2.1.2納管方案通過設(shè)備智能監(jiān)控卡采集監(jiān)控?cái)?shù)據(jù)機(jī)房設(shè)施和環(huán)境監(jiān)控設(shè)備配置智能監(jiān)控卡,監(jiān)控平臺(tái)通過智能監(jiān)控卡提供的接口協(xié)議采集監(jiān)控?cái)?shù)據(jù)。比如提供SNMP監(jiān)控協(xié)議接口的智能監(jiān)控卡,可通過該方式將監(jiān)控?cái)?shù)SNMP監(jiān)控卡需滿足如下技術(shù)規(guī)范:l監(jiān)控卡支持SNMP協(xié)議,既能主動(dòng)發(fā)trap,也能接受上位機(jī)輪詢;l至少支持兩種管理模式,如web、telnet或其它;l至少支持兩種權(quán)限用戶的設(shè)定,一種只讀,一種完全控制。l允許遠(yuǎn)程設(shè)置或修改用戶名/密碼、SNMPcommunity以及NMS主機(jī)IP;l設(shè)備易于升級(jí)和維護(hù),升級(jí)后配置不會(huì)改變或提供配置平滑遷移機(jī)制;l電源支持當(dāng)?shù)仉娫礃?biāo)準(zhǔn)(如中國(guó)區(qū)50HZ/220Vl系統(tǒng)有對(duì)時(shí)功能,確保時(shí)間準(zhǔn)確。通過本地管理單元(系統(tǒng))采集監(jiān)控?cái)?shù)據(jù)機(jī)房設(shè)施和環(huán)境監(jiān)控設(shè)備提供監(jiān)控?cái)?shù)據(jù)采集功能,由每個(gè)機(jī)房?jī)?nèi)部署的本地管理單元(系統(tǒng))采集監(jiān)控?cái)?shù)據(jù),然后通過集成接口匯集到IT監(jiān)控平臺(tái)。本地管理單元(系統(tǒng))需滿足如下技術(shù)規(guī)范:l支持B/S架構(gòu),可以通過瀏覽器運(yùn)程訪問系統(tǒng),查看系統(tǒng)中所有已監(jiān)控設(shè)備的參l至少支持兩種權(quán)限用戶的設(shè)定,一種只讀,一種完全控制;l通過權(quán)限驗(yàn)證后,可以遠(yuǎn)程修改系統(tǒng)配置(如監(jiān)控頻率、設(shè)備告警級(jí)別等);l有“北向”接口,可以將告警數(shù)據(jù)與性能指標(biāo)數(shù)據(jù)通過北向接口發(fā)送至IT監(jiān)控系l系統(tǒng)易于升級(jí)和維護(hù),升級(jí)后配置不會(huì)改變或提供配置平滑遷移機(jī)制;l系統(tǒng)自身狀態(tài)異常以及與下接設(shè)備通訊異常都會(huì)有告警產(chǎn)生;l多個(gè)本地管理單元(系統(tǒng))與IT監(jiān)控系統(tǒng)做集成時(shí),要有識(shí)別每個(gè)來源系統(tǒng)的標(biāo)l系統(tǒng)有對(duì)時(shí)功能,確保時(shí)間準(zhǔn)確。通過子系統(tǒng)集成通過子系統(tǒng)采集處理后集成到監(jiān)控管理平臺(tái),相關(guān)子系統(tǒng)包括:冷機(jī)群控系統(tǒng)(一般與冷機(jī)廠家相同電能系統(tǒng)/SCADA,發(fā)電機(jī)控制系統(tǒng),燃油系統(tǒng)PLC,BA等。這些子系統(tǒng)可以獨(dú)立運(yùn)行控制同時(shí)將相關(guān)參數(shù)通過北向接口傳遞給監(jiān)控管理平臺(tái)。文檔版本01(2019)2.2監(jiān)控指標(biāo)2.2.1配電柜類別指標(biāo)含義交流主路N-PE電壓指標(biāo)電流諧波畸變率指標(biāo)電壓諧波畸變率指標(biāo)頻率指標(biāo)輸入電流指標(biāo)輸入相電壓指標(biāo)單相輸入功率因數(shù)指標(biāo)輸入線電壓指標(biāo)單相輸入有功功率指標(biāo)單相輸入無功功率指標(biāo)總輸入功率因數(shù)指標(biāo)總輸入有功電能指標(biāo)總輸入有功功率指標(biāo)總輸入無功功率指標(biāo)總輸入視在功率指標(biāo)母排溫度指標(biāo)隔離變壓器三相溫度輸入電源負(fù)載率指標(biāo)輸入開關(guān)狀態(tài)指標(biāo)單相支路、三相支路、雙火線支路輸出電流指標(biāo),單相支路、三相支路、雙火線支路輸出電流百分比輸出開關(guān)狀態(tài)指標(biāo),單相支路、三相支路、雙火線支路輸出有功電能指標(biāo),單相支路、三相支路、雙火線支路輸出有功功率指標(biāo),單相支路、三相支路、雙火線支路輸出支路開關(guān)溫度指標(biāo),單相支路、三相支路、雙火線支路2.2.2UPS類別指標(biāo)含義機(jī)架式UPS設(shè)備/模塊化UPS設(shè)備/塔式UPS備電時(shí)間指標(biāo)供電狀態(tài)指標(biāo)環(huán)境濕度指標(biāo)環(huán)境溫度指標(biāo)逆變運(yùn)行時(shí)間指標(biāo)旁路運(yùn)行時(shí)間指標(biāo)運(yùn)行模式指標(biāo)輸入制式指標(biāo)輸出制式指標(biāo)系統(tǒng)維修空開狀態(tài)指標(biāo)系統(tǒng)輸入狀態(tài)指標(biāo)UPS并機(jī)系統(tǒng)有功功率指標(biāo)系統(tǒng)視在功率指標(biāo)系統(tǒng)無功功率指標(biāo)系統(tǒng)輸出有功功率指標(biāo)系統(tǒng)輸出視在功率指標(biāo)UPS設(shè)備單相輸入模塊/UPS設(shè)備單相旁路輸入模塊指標(biāo)指標(biāo)功率因數(shù)指標(biāo)開關(guān)狀態(tài)指標(biāo)頻率指標(biāo)UPS設(shè)備單相輸負(fù)載率指標(biāo)功率因數(shù)指標(biāo)開關(guān)狀態(tài)指標(biāo)頻率指標(biāo)輸出電流指標(biāo)輸出電壓指標(biāo)輸出有功功率指標(biāo)UPS設(shè)備三相輸入模塊/UPS設(shè)備三相旁路輸入模塊開關(guān)狀態(tài)指標(biāo)輸入相電流指標(biāo)輸入相電壓指標(biāo)輸入功率因數(shù)指標(biāo)輸入線電壓指標(biāo)輸入頻率指標(biāo)UPS設(shè)備三相輸相電流指標(biāo)電流諧波畸變率指標(biāo)相電壓指標(biāo)電壓諧波畸變率指標(biāo)峰值比指標(biāo)負(fù)載率指標(biāo)功率因數(shù)指標(biāo)開關(guān)狀態(tài)指標(biāo)頻率指標(biāo)線電壓指標(biāo)輸出有功功率指標(biāo)輸出視在功率指標(biāo)2.2.3發(fā)電機(jī)組類別指標(biāo)含義發(fā)電機(jī)組發(fā)電量指標(biāo)累計(jì)運(yùn)行時(shí)間指標(biāo)起動(dòng)方式指標(biāo)維護(hù)保養(yǎng)剩余小時(shí)數(shù)指標(biāo)發(fā)電機(jī)組啟停狀態(tài)發(fā)電機(jī)運(yùn)行轉(zhuǎn)速發(fā)電機(jī)組手自動(dòng)狀態(tài)手動(dòng)、自動(dòng)發(fā)動(dòng)機(jī)發(fā)動(dòng)機(jī)運(yùn)行狀態(tài)待機(jī)、運(yùn)行、故障發(fā)動(dòng)機(jī)轉(zhuǎn)速指標(biāo)機(jī)房溫度指標(biāo)進(jìn)氣溫度指標(biāo)冷卻液溫度指標(biāo)冷卻液液位指標(biāo)啟動(dòng)次數(shù)指標(biāo)啟動(dòng)電池電壓指標(biāo)潤(rùn)滑油溫度指標(biāo)潤(rùn)滑油壓力指標(biāo)交流發(fā)電機(jī)發(fā)電頻率指標(biāo)負(fù)載率指標(biāo)單相功率因數(shù)指標(biāo)輸出電流指標(biāo)輸出相電壓指標(biāo)輸出無功功率指標(biāo)輸出線電壓指標(biāo)輸出單相有功功率指標(biāo)正向有功電能指標(biāo)總功率因數(shù)指標(biāo)總有功功率指標(biāo)燃油供應(yīng)系統(tǒng)儲(chǔ)油罐液位指標(biāo)儲(chǔ)油罐油溫指標(biāo)發(fā)動(dòng)機(jī)燃油余量指標(biāo)發(fā)動(dòng)機(jī)油溫指標(biāo)發(fā)動(dòng)機(jī)油箱液位指標(biāo)加油裝置油位百分比指標(biāo)油泵運(yùn)行狀態(tài)指標(biāo):運(yùn)行、停止、故障發(fā)電機(jī)并機(jī)柜相電壓指標(biāo)頻率指標(biāo)輸出開關(guān)狀態(tài)指標(biāo)線電壓指標(biāo)總有功功率指標(biāo)并機(jī)控制方式手動(dòng)、自動(dòng)發(fā)電機(jī)接地電阻柜接地故障電流指標(biāo)類別指標(biāo)含義冷凍水空調(diào)、風(fēng)冷空調(diào)、雙冷源空調(diào)當(dāng)前濕度指標(biāo)當(dāng)前溫度指標(biāo)溫度設(shè)定值濕度設(shè)定值額定制冷量指標(biāo)風(fēng)量指標(biāo),僅風(fēng)冷空調(diào)風(fēng)機(jī)輸出指標(biāo)平均回風(fēng)濕度指標(biāo)平均回風(fēng)溫度指標(biāo)機(jī)組開關(guān)機(jī)狀態(tài)指標(biāo)加熱輸出指標(biāo)加濕輸出指標(biāo)控制輸出百分比指標(biāo)群控狀態(tài)指標(biāo)平均送風(fēng)濕度指標(biāo)平均送風(fēng)溫度指標(biāo)溫濕度控制類型(回風(fēng),送風(fēng),冷通道,熱通道)指標(biāo)制冷量指標(biāo)制冷輸出指標(biāo)制冷劑狀態(tài)指標(biāo),僅風(fēng)冷空調(diào)除濕輸出指標(biāo),僅風(fēng)冷空調(diào)最佳水溫建議值指標(biāo),僅水冷空調(diào)風(fēng)側(cè)平均壓差指標(biāo)風(fēng)機(jī)數(shù)量指標(biāo)加濕器數(shù)量指標(biāo)加熱器數(shù)量指標(biāo)壓縮機(jī)數(shù)量指標(biāo),僅風(fēng)冷空調(diào)供水溫度指標(biāo),僅水冷空調(diào)回水溫度指標(biāo),僅水冷空調(diào)空調(diào)功率指標(biāo),僅水冷空調(diào)表冷器(盤管)——僅水冷空調(diào),雙冷源空調(diào)出水溫度指標(biāo)進(jìn)水溫度指標(biāo)空調(diào)水閥——僅水冷空調(diào),雙冷源空調(diào)出水溫度指標(biāo)進(jìn)水溫度指標(biāo)水閥累計(jì)運(yùn)行時(shí)間指標(biāo)水閥運(yùn)行狀態(tài)指標(biāo)水閥開度指標(biāo)空調(diào)群控——僅風(fēng)冷空調(diào)、雙冷源空調(diào)本群組實(shí)際備機(jī)機(jī)組數(shù)目指標(biāo)本群組實(shí)際機(jī)組數(shù)目指標(biāo)本群組實(shí)際運(yùn)行機(jī)組數(shù)目指標(biāo)群控模式指標(biāo)變頻壓縮機(jī)、定頻壓縮機(jī)——僅風(fēng)冷空調(diào)、雙冷排氣溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)排氣壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)啟動(dòng)次數(shù)指標(biāo),變頻壓縮機(jī)源空調(diào)吸氣溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)吸氣壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)相電流指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)累計(jì)運(yùn)行時(shí)間指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)轉(zhuǎn)速指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)狀態(tài)指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)液管溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)輸入頻率指標(biāo),變頻壓縮機(jī)冷凝壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)冷凝溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)蒸發(fā)壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)蒸發(fā)溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)導(dǎo)葉開度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)一級(jí)壓縮導(dǎo)葉開度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)二級(jí)壓縮導(dǎo)葉開度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)三級(jí)壓縮導(dǎo)葉開度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)一級(jí)壓縮蒸發(fā)壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)二級(jí)壓縮蒸發(fā)壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)三級(jí)壓縮蒸發(fā)壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)一級(jí)壓縮冷凝壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)二級(jí)壓縮冷凝壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)三級(jí)壓縮冷凝壓力指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)一級(jí)壓縮蒸發(fā)溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)二級(jí)壓縮蒸發(fā)溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)三級(jí)壓縮蒸發(fā)溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)一級(jí)壓縮冷凝溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)二級(jí)壓縮冷凝溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)三級(jí)壓縮冷凝溫度指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)運(yùn)行頻率指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)類型指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)油壓差指標(biāo),變頻壓縮機(jī)電子膨脹閥——僅風(fēng)冷空調(diào)、雙冷源空調(diào)累計(jì)運(yùn)行時(shí)間指標(biāo)運(yùn)行狀態(tài)指標(biāo)熱力膨脹閥——僅風(fēng)冷空調(diào)、雙冷源空調(diào)累計(jì)運(yùn)行時(shí)間指標(biāo)運(yùn)行狀態(tài)指標(biāo)冷凝器(含室外風(fēng)機(jī))——僅風(fēng)冷空調(diào)、雙冷源空調(diào)累計(jì)運(yùn)行時(shí)間指標(biāo)室外風(fēng)機(jī)運(yùn)行狀態(tài)指標(biāo)室外溫度指標(biāo)蒸發(fā)器(含室內(nèi)風(fēng)機(jī))風(fēng)側(cè)壓差指標(biāo)開關(guān)機(jī)狀態(tài)指標(biāo)控制輸出百分比指標(biāo)累計(jì)運(yùn)行時(shí)間指標(biāo)運(yùn)行轉(zhuǎn)速指標(biāo)電極加濕器加濕運(yùn)行狀態(tài)指標(biāo)累計(jì)運(yùn)行時(shí)間指標(biāo)電源模塊相電壓指標(biāo)電源頻率指標(biāo)總有功電能指標(biāo)總有功功率指標(biāo)相電流指標(biāo)加熱器電加熱累計(jì)運(yùn)行時(shí)間指標(biāo)電加熱運(yùn)行狀態(tài)指標(biāo)強(qiáng)排水設(shè)備冷凝水泵累計(jì)運(yùn)行時(shí)間指標(biāo)冷凝水泵運(yùn)行狀態(tài)指標(biāo)濕膜加濕器加濕濕膜累計(jì)運(yùn)行時(shí)間指標(biāo)加濕水泵累計(jì)運(yùn)行時(shí)間指標(biāo)加濕運(yùn)行狀態(tài)指標(biāo)空調(diào)末端——空調(diào)回風(fēng)、空調(diào)送風(fēng)、冷通道、熱通道當(dāng)前濕度指標(biāo)當(dāng)前溫度指標(biāo)類別指標(biāo)含義門指標(biāo)鎖供電狀態(tài)指標(biāo)開關(guān)狀態(tài)指標(biāo)通信狀態(tài)指標(biāo)工作狀態(tài)指標(biāo)鎖ID指標(biāo)鎖類型指標(biāo)指紋機(jī)ID指標(biāo)刷卡機(jī)ID指標(biāo)鍵盤ID指標(biāo)類別指標(biāo)含義消防工作模式自動(dòng)、手動(dòng)火災(zāi)狀態(tài)正常、告警2.2.7漏水檢測(cè)類別指標(biāo)含義漏水檢測(cè)狀態(tài)指標(biāo)檢測(cè)繩電阻率指標(biāo)泄露距離指標(biāo)類別指標(biāo)含義溫濕度當(dāng)前濕度指標(biāo)當(dāng)前溫度指標(biāo)2.3監(jiān)控告警2.3.1配電柜類別指標(biāo)含義精密配電柜輸入開關(guān)斷開交流主路主開關(guān)跳閘電流總諧波畸變率母排溫度高隔離變壓器三相溫度高電流互感器接線反告警,非指標(biāo)L1相電壓低告警,非指標(biāo)L1相電壓高告警,非指標(biāo)L2相電壓低告警,非指標(biāo)L2相電壓高告警,非指標(biāo)L3相電壓低告警,非指標(biāo)L3相電壓高告警,非指標(biāo)防雷異常告警,非指標(biāo)L1過載告警,非指標(biāo)L2過載告警,非指標(biāo)L3過載告警,非指標(biāo)開關(guān)斷開告警,非指標(biāo)開關(guān)脫扣故障告警,非指標(biāo)頻率異常告警,非指標(biāo)主路缺相告警,非指標(biāo)單相支路、三相支路、雙火線支路輸出支路接線端子高溫告警告警,非指標(biāo)輸出支路開關(guān)溫度高輸出支路開關(guān)斷開告警,非指標(biāo)輸出支路異常告警,非指標(biāo)輸出支路過載告警,非指標(biāo)隔離變壓器溫度高零地電壓超限設(shè)備通訊異常2.3.2UPS類別指標(biāo)含義機(jī)架式UPS設(shè)備/模塊化UPS設(shè)備/塔式UPS系統(tǒng)維修空開合閘防塵維護(hù)提醒告警,非指標(biāo)機(jī)架輸出過載告警,非指標(biāo)緊急關(guān)機(jī)告警,非指標(biāo)UPS休眠UPS轉(zhuǎn)電池供電UPS轉(zhuǎn)旁路供電母線電容壽命預(yù)告警告警,非指標(biāo)UPS故障告警UPS電池開關(guān)斷開設(shè)備通訊異常UPS設(shè)備單相輸入模塊/UPS設(shè)備單相旁路輸入模塊主路電壓異常告警,非指標(biāo)主路零線缺失告警,非指標(biāo)主路欠壓告警,非指標(biāo)輸入防雷告警告警,非指標(biāo)UPS設(shè)備單相輸輸出過載告警,非指標(biāo)電流總諧波畸變率超限輸出電壓低輸出電壓高輸出頻率異常UPS設(shè)備三相輸入模塊/UPS設(shè)備三相旁路輸入模塊開關(guān)狀態(tài)指標(biāo)主路電壓異常告警,非指標(biāo)旁路電壓異常告警,非指標(biāo)主路零線缺失告警,非指標(biāo)主路欠壓告警,非指標(biāo)主路相序反告警,非指標(biāo)輸入防雷告警告警,非指標(biāo)UPS設(shè)備三相輸輸出過載電流總諧波畸變率超限輸出電壓低輸出電壓高輸出頻率異常2.3.3電池類別指標(biāo)含義電池機(jī)房氫氣濃度過高告警,非指標(biāo)電池維護(hù)提醒告警,非指標(biāo)電池備電時(shí)間預(yù)告警告警,非指標(biāo)電池充電過流告警,非指標(biāo)電池電壓異常告警,非指標(biāo)電池放電終止告警,非指標(biāo)電池故障告警,非指標(biāo)電池環(huán)境低溫告警,非指標(biāo)電池環(huán)境高溫告警,非指標(biāo)電池接地故障告警,非指標(biāo)電池接反告警,非指標(biāo)電池單體高溫告警告警,非指標(biāo)內(nèi)阻異常告警告警,非指標(biāo)電壓異常告警告警,非指標(biāo)2.3.4發(fā)電機(jī)組類別指標(biāo)含義發(fā)電機(jī)組控制系統(tǒng)異常告警,非指標(biāo)發(fā)動(dòng)機(jī)超速告警告警,非指標(biāo)低速告警告警,非指標(biāo)電池電壓低告警告警,非指標(biāo)電池電壓高告警告警,非指標(biāo)發(fā)動(dòng)機(jī)高溫告警告警,非指標(biāo)緊急停機(jī)告警,非指標(biāo)進(jìn)氣系統(tǒng)異常告警,非指標(biāo)冷卻液溫度異常告警,非指標(biāo)冷卻液液位異常告警,非指標(biāo)啟動(dòng)失敗告警,非指標(biāo)潤(rùn)滑油低油位告警告警,非指標(biāo)潤(rùn)滑油油壓告警告警,非指標(biāo)交流發(fā)電機(jī)頻率異常告警,非指標(biāo)輸出相電壓低告警,非指標(biāo)輸出相電壓高告警,非指標(biāo)短路告警,非指標(biāo)輸出過載告警,非指標(biāo)燃油供應(yīng)系統(tǒng)漏油告警告警,非指標(biāo)油泵故障告警,非指標(biāo)燃油低油位告警告警,非指標(biāo)燃油系統(tǒng)異常告警,非指標(biāo)潤(rùn)滑油低油位告警告警,非指標(biāo)潤(rùn)滑油高油位告警告警,非指標(biāo)潤(rùn)滑油油壓告警告警,非指標(biāo)發(fā)電機(jī)并機(jī)柜并機(jī)控制方式不在自動(dòng)位并機(jī)失敗告警告警,非指標(biāo)開關(guān)斷開告警,非指標(biāo)開關(guān)脫扣故障告警,非指標(biāo)發(fā)電機(jī)接地電阻柜接地故障告警告警,非指標(biāo)2.3.5空調(diào)類別指標(biāo)含義冷凍水空調(diào)、風(fēng)冷空調(diào)、雙冷源空調(diào)供水溫度高告警,非指標(biāo)遠(yuǎn)程關(guān)機(jī)告警告警,非指標(biāo)送風(fēng)高溫告警告警,非指標(biāo),僅水冷空調(diào)回風(fēng)高溫告警告警,非指標(biāo),僅水冷空調(diào)表冷器(盤管)——僅水冷空調(diào),雙冷源空調(diào)出水低溫告警告警,非指標(biāo)出水高溫告警告警,非指標(biāo)無制冷量輸出告警告警,非指標(biāo)空調(diào)水閥——僅水冷空調(diào),雙冷源空調(diào)進(jìn)水低溫告警告警,非指標(biāo)進(jìn)水高溫告警告警,非指標(biāo)冷凍水閥異常告警告警,非指標(biāo)空調(diào)群控——僅風(fēng)冷空調(diào)、雙冷源空調(diào)群控組網(wǎng)失敗告警,非指標(biāo)群組機(jī)組數(shù)目不匹配告警告警,非指標(biāo)變頻壓縮機(jī)、定頻壓縮機(jī)——僅風(fēng)冷空調(diào)、雙冷源空調(diào)壓縮機(jī)驅(qū)動(dòng)模塊過熱告警告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)排氣高壓告警告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)吸氣低壓告警告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)低壓告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)高壓告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)故障告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)排氣高溫告警告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)壓縮機(jī)驅(qū)動(dòng)告警告警,非指標(biāo),變頻壓縮機(jī),定頻壓縮機(jī)電子膨脹閥——僅風(fēng)冷空調(diào)、雙冷源空調(diào)EEV驅(qū)動(dòng)告警告警,非指標(biāo)EEV驅(qū)動(dòng)故障鎖定告警告警,非指標(biāo)EEV驅(qū)動(dòng)通信中斷告警告警,非指標(biāo)熱力膨脹閥——僅風(fēng)冷空調(diào)、雙冷源空調(diào)熱力膨脹閥故障告警,非指標(biāo)冷凝器(含室外風(fēng)機(jī))——僅風(fēng)冷空調(diào)、雙冷源空調(diào)室外風(fēng)機(jī)堵轉(zhuǎn)告警告警,非指標(biāo)室外風(fēng)機(jī)過溫告警告警,非指標(biāo)室外風(fēng)機(jī)驅(qū)動(dòng)電控盒過溫告警告警,非指標(biāo)室外風(fēng)機(jī)驅(qū)動(dòng)告警告警,非指標(biāo)室外風(fēng)機(jī)驅(qū)動(dòng)逆變功率器件過溫告警告警,非指標(biāo)蒸發(fā)器(含室內(nèi)風(fēng)機(jī))室內(nèi)風(fēng)機(jī)超速告警告警,非指標(biāo)室內(nèi)風(fēng)機(jī)故障告警告警,非指標(biāo)室內(nèi)風(fēng)機(jī)運(yùn)行超時(shí)告警告警,非指標(biāo)電極加濕器供水異常告警告警,非指標(biāo)加濕水泵異常告警告警,非指標(biāo)進(jìn)水電磁閥故障告警告警,非指標(biāo)電源模塊電源L1相過壓告警,非指標(biāo)電源L1相欠壓告警,非指標(biāo)電源L1相缺相告警,非指標(biāo)電源L2相過壓告警,非指標(biāo)電源L2相欠壓告警,非指標(biāo)電源L2相缺相告警,非指標(biāo)電源L3相過壓告警,非指標(biāo)電源L3相欠壓告警,非指標(biāo)電源L3相缺相告警,非指標(biāo)頻率異常告警,非指標(biāo)加熱器電加熱高溫告警告警,非指標(biāo)強(qiáng)排水設(shè)備水滿告警告警,非指標(biāo)濕膜加濕器加濕器供水故障告警,非指標(biāo)空調(diào)末端——空調(diào)回風(fēng)、空調(diào)送風(fēng)、冷通道、熱通道風(fēng)扇異常過濾網(wǎng)堵塞排水故障設(shè)備通訊異常類別指標(biāo)含義門非法開門告警告警開門超時(shí)告警告警2.3.7消防類別指標(biāo)含義消防火災(zāi)告警告警控制器故障告警2.3.8漏水檢測(cè)類別指標(biāo)含義漏水監(jiān)測(cè)泄露報(bào)警告警類別指標(biāo)含義溫濕度濕度超閥值告警溫度超閥值告警 3物理資源監(jiān)控物理資源監(jiān)控主要提供對(duì)服務(wù)器、網(wǎng)絡(luò)、安全設(shè)備等硬件資源的運(yùn)行狀監(jiān)控、各類性能指標(biāo)監(jiān)控、硬件告警信息監(jiān)控等。3.1服務(wù)器服務(wù)器是指在局域網(wǎng)中運(yùn)行管理軟件的計(jì)算機(jī),它控制著對(duì)網(wǎng)絡(luò)及其上資源(例如:打印機(jī)和磁盤驅(qū)動(dòng)器)的訪問,并且它也向網(wǎng)絡(luò)中的工作站計(jì)算機(jī)提供資源。可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位CPU使用率%用戶空間CPU使用率%內(nèi)核空間CPU使用率%空閑CPU使用率%其他CPU使用率%Nice進(jìn)程CPU使用率%IOWait狀態(tài)占比%CPU中斷時(shí)間占比%CPU軟中斷時(shí)間占比%1分鐘平均負(fù)載Tasks/CPU5分鐘平均負(fù)載Tasks/CPU15分鐘平均負(fù)載Tasks/CPU可用內(nèi)存內(nèi)存使用率%空閑內(nèi)存量Buffers占用量Cached占用量磁盤存儲(chǔ)總量磁盤剩余存儲(chǔ)量磁盤已用存儲(chǔ)量磁盤使用率%inode空間大小-inode已使用空間-inode已使用占比%磁盤讀速率KByte/s磁盤讀操作速率Requests/Second磁盤寫速率KByte/s磁盤寫操作速率Requests/Second磁盤I/O使用率%寫操作平均耗時(shí)ms/Count讀操作平均耗時(shí)ms/Count出網(wǎng)帶寬bits/s入網(wǎng)帶寬bits/s網(wǎng)卡包發(fā)送速率Counts/s網(wǎng)卡包接收速率Counts/s接收誤包率%發(fā)送誤包率%接收丟包率%發(fā)送丟包率%活躍設(shè)備數(shù)-工作設(shè)備數(shù)-失敗設(shè)備數(shù)-備用設(shè)備數(shù)-設(shè)備狀態(tài)-CPU使用率%內(nèi)存使用率%網(wǎng)絡(luò)流入速率網(wǎng)絡(luò)流出速率網(wǎng)絡(luò)丟包百分比%磁盤IO寫入磁盤IO讀出磁盤使用率%磁盤寫iopsrequest/s磁盤讀iopsrequest/s3.2宿主機(jī)部署了Hypervisor虛擬軟件的計(jì)算設(shè)備,它提供了虛擬機(jī)使用的物理資源。通常在一個(gè)宿主機(jī)上可以創(chuàng)建多個(gè)虛擬機(jī),創(chuàng)建虛擬機(jī)的個(gè)數(shù)取決于宿主機(jī)本身的硬件配置和需要?jiǎng)?chuàng)建的虛擬機(jī)規(guī)格大小??杀O(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位CPU使用率%內(nèi)存使用率%網(wǎng)絡(luò)流入速率網(wǎng)絡(luò)流出速率磁盤IO寫入磁盤IO讀出磁盤使用率%磁盤寫iopsrequest/s磁盤讀iopsrequest/s3.3網(wǎng)絡(luò)設(shè)備3.3.1網(wǎng)絡(luò)設(shè)備網(wǎng)絡(luò)設(shè)備包括路由器、交換機(jī)、防火墻和負(fù)載均衡設(shè)備等。可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位網(wǎng)絡(luò)設(shè)備平均CPU利用率%網(wǎng)絡(luò)設(shè)備平均內(nèi)存利用率%網(wǎng)絡(luò)設(shè)備響應(yīng)時(shí)間網(wǎng)絡(luò)設(shè)備當(dāng)日不可達(dá)比率%網(wǎng)絡(luò)設(shè)備當(dāng)前會(huì)話新建速率record/s網(wǎng)絡(luò)設(shè)備當(dāng)前會(huì)話總數(shù)record網(wǎng)絡(luò)設(shè)備網(wǎng)絡(luò)流量值3.3.2網(wǎng)絡(luò)設(shè)備端口可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位端口速率端口CRC錯(cuò)誤per端口發(fā)送linkreset錯(cuò)誤per端口接收linkreset錯(cuò)誤per端口linkreset錯(cuò)誤總數(shù)per端口class3discard錯(cuò)誤c端口syncloss錯(cuò)誤per端口接收利用率%端口緩沖信用量per端口接收速率端口發(fā)送利用率%端口帶寬利用率%端口linkfailure錯(cuò)誤per端口signalloss錯(cuò)誤per端口總error數(shù)per端口發(fā)送速率3.4.1塊存儲(chǔ)可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位硬件故障存儲(chǔ)前端口平均每秒IO次數(shù)request/s存儲(chǔ)前端口平均每秒數(shù)據(jù)流量存儲(chǔ)前端口IO的平均響應(yīng)時(shí)間CacheWritePending存儲(chǔ)寫等待百分比%存儲(chǔ)控制器CPU利用率%后端磁盤繁忙程度百分比%存儲(chǔ)前端口讀IOPS與寫IOPS比例存儲(chǔ)前端口平均IOsize大小存儲(chǔ)Cache利用率%存儲(chǔ)Cache讀命中率%存儲(chǔ)已分配容量/總可用容量%存儲(chǔ)復(fù)制鏈路的流量主機(jī)組的平均每秒IOPSrequest/s主機(jī)組的平均每秒流量主機(jī)LUN平均響應(yīng)時(shí)間監(jiān)控單個(gè)主機(jī)多個(gè)HBA卡的流量差異IPSAN前端口ping監(jiān)控3.4.2SAN交換機(jī)可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位SAN交換機(jī)端口流量SAN交換機(jī)端口的狀態(tài)監(jiān)控SAN端口SFP功率衰減監(jiān)控dBmSAN端口crc_errSAN端口enc_outSAN端口disc_c3SAN端口Link_failSAN端口loss_syncSAN端口loss_sig硬件故障(包括風(fēng)扇、CP板、電源等)3.4.3文件存儲(chǔ)可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位硬件故障(包括控制器、硬盤、風(fēng)扇、HA狀態(tài)服務(wù)異常(CIFS、NFS、ISCSI服務(wù)是NAS總?cè)萘课募到y(tǒng)利用率%pool容量利用率% 云基礎(chǔ)資源是云計(jì)算平臺(tái)IaaS層定義的各類型資源,包括虛擬機(jī)、容器、分布式塊存儲(chǔ)、負(fù)載均衡等。云基礎(chǔ)資源的監(jiān)控主要關(guān)注相關(guān)資源的運(yùn)行狀態(tài)、性能指標(biāo)、使用情況、容量等方面。4.1計(jì)算資源監(jiān)控4.1.1彈性云服務(wù)器可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位CPU使用率%內(nèi)存使用率%網(wǎng)絡(luò)流入速率網(wǎng)絡(luò)流出速率網(wǎng)絡(luò)平均帶寬MB/s網(wǎng)絡(luò)丟包百分比%云硬盤使用率%云硬盤IO寫入云硬盤IO讀出云硬盤平均寫時(shí)延云硬盤平均讀時(shí)延云硬盤平均IO利用率%磁盤讀操作速率MB/s磁盤寫操作速率MB/s帶外網(wǎng)絡(luò)流入速率帶外網(wǎng)絡(luò)流出速率GPU利用率%顯存使用率%性能狀態(tài)CPU額度使用(AWS)CPU額度余額(AWS)剩余CPU信用額度(Azure)已用CPU信用額度(Azure)4.1.2裸金屬服務(wù)器可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位用戶空間CPU使用率%內(nèi)核空間CPU使用率%空閑CPU使用率%其他CPU使用率%Nice進(jìn)程CPU使用率%iowait狀態(tài)占比%CPU中斷時(shí)間占比%CPU軟中斷時(shí)間占比%1分鐘平均負(fù)載Tasks/CPU5分鐘平均負(fù)載Tasks/CPU15分鐘平均負(fù)載Tasks/CPU可用內(nèi)存內(nèi)存使用率%空閑內(nèi)存量Buffers占用量Cached占用量磁盤存儲(chǔ)總量磁盤剩余存儲(chǔ)量磁盤已用存儲(chǔ)量磁盤使用率%inode空間大小-inode已使用空間-inode已使用占比%磁盤讀速率KByte/s磁盤讀操作速率Requests/Second磁盤寫速率KByte/s磁盤寫操作速率Requests/Second磁盤I/O使用率%寫操作平均耗時(shí)ms/Count讀操作平均耗時(shí)ms/Count出網(wǎng)帶寬bits/s入網(wǎng)帶寬bits/s網(wǎng)卡包發(fā)送速率Counts/s網(wǎng)卡包接收速率Counts/s接收誤包率%發(fā)送誤包率%接收丟包率%發(fā)送丟包率%活躍設(shè)備數(shù)-工作設(shè)備數(shù)-失敗設(shè)備數(shù)-備用設(shè)備數(shù)-設(shè)備狀態(tài)-4.1.3容器資源監(jiān)控可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位CPU核總量(cpuCoreLimit)CoreCPU核占用(cpuCoreUsed)CoreCPU使用率(cpuUsage)%內(nèi)存總量(memCapacity)Mebibytes物理內(nèi)存使用量(memUsed)Mebibytes物理內(nèi)存使用率(memUsage)%磁盤寫入率(diskWriteRate)Bytes/Second磁盤讀取速率(diskReadRate)Bytes/Second數(shù)據(jù)接收速率(recvBytesRate)Bytes/Second數(shù)據(jù)發(fā)送速率(sendBytesRate)Bytes/Second4.2存儲(chǔ)資源監(jiān)控4.2.1對(duì)象存儲(chǔ)服務(wù)可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位下載流量Byte上傳流量ByteGET類請(qǐng)求次數(shù)CountsPUT類請(qǐng)求次數(shù)CountsGET類請(qǐng)求首字節(jié)平均時(shí)延4xx異常次數(shù)Counts5xx異常次數(shù)Counts4.3.1彈性IP可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位上行流量上行帶寬下行流量下行帶寬4.3.2彈性負(fù)載均衡可監(jiān)控指標(biāo)如下:采集指標(biāo)指標(biāo)單位并發(fā)連接數(shù)count活躍連接數(shù)count非活躍連接數(shù)count新建連接數(shù)count流入數(shù)據(jù)包數(shù)pps流出數(shù)據(jù)包數(shù)pps網(wǎng)絡(luò)流入流速Bps網(wǎng)絡(luò)流出流速Bps異常主機(jī)數(shù)count正常主機(jī)數(shù)count 5應(yīng)用系統(tǒng)運(yùn)行環(huán)境監(jiān)控5.1操作系統(tǒng)5.1.1通用監(jiān)控指標(biāo)可監(jiān)控指標(biāo)如下:采集指標(biāo)含義主機(jī)IP可達(dá)業(yè)務(wù)IP主機(jī)端口可達(dá)22;WindowsTCP3389)CPU利用率CPU資源利用率文件系統(tǒng)利用率記錄文件系統(tǒng)利用率,系統(tǒng)卷超過閾值告警主機(jī)時(shí)間與標(biāo)準(zhǔn)時(shí)鐘源的差距定時(shí)任務(wù)執(zhí)行情況關(guān)注任務(wù)是否正常調(diào)度網(wǎng)卡丟包記錄網(wǎng)卡丟包網(wǎng)卡雙上連(只適用于物理機(jī))綁定成員數(shù)量是否大于1網(wǎng)絡(luò)狀態(tài)網(wǎng)卡狀態(tài)變化存儲(chǔ)IO響應(yīng)時(shí)間只有外置存儲(chǔ)設(shè)置告警網(wǎng)卡利用率網(wǎng)卡利用率網(wǎng)絡(luò)連接數(shù)建立的tcp連接數(shù)主機(jī)ntp狀態(tài)ntp服務(wù)運(yùn)行狀態(tài)5.1.2Linux可監(jiān)控指標(biāo)如下:采集指標(biāo)含義Swap利用率Swap利用率關(guān)鍵服務(wù)狀態(tài)ntpd、crond、sshd、syslogd文件系統(tǒng)只讀狀態(tài)文件系統(tǒng)只讀;/etc/fstab中條目狀態(tài)NFS卷狀態(tài)NFS掛載是否正常NFS請(qǐng)求數(shù)主機(jī)對(duì)NFS卷發(fā)起的請(qǐng)求內(nèi)存利用率計(jì)算內(nèi)存利用率,去Buffer/Cache關(guān)鍵配置文件監(jiān)控關(guān)鍵配置文件修改(例如/etc/sysctl.conf)根據(jù)關(guān)鍵字告警/var/log/messages/var/log/mcelog5.1.3Windows可監(jiān)控指標(biāo)如下:采集指標(biāo)含義內(nèi)存利用率內(nèi)存的實(shí)時(shí)占用率脫域OS脫域的情況關(guān)鍵服務(wù)狀態(tài)Schedule、W32Time、LanmanServer、TermService空閑物理內(nèi)存空閑物理內(nèi)存page_pool容量監(jiān)控page_pool大小non_page_pool容量監(jiān)控non_page_pool大小文件系統(tǒng)剩余空間文件系統(tǒng)剩余空間磁盤隊(duì)列長(zhǎng)度記錄磁盤的隊(duì)列長(zhǎng)度系統(tǒng)Handle數(shù)記錄系統(tǒng)的總handle數(shù)量系統(tǒng)Thread數(shù)記錄系統(tǒng)的總Thread數(shù)量5.2.1Nginx監(jiān)控可監(jiān)控指標(biāo)如下:采集指標(biāo)含義端口連通性80、443端口進(jìn)程狀態(tài)進(jìn)程是否存在當(dāng)前active的客戶端連接數(shù)Nginx當(dāng)前在處理的連接用戶訪問量某URL有多少用戶訪問當(dāng)前TCP連接數(shù)TCP連接數(shù)URL響應(yīng)時(shí)長(zhǎng)URL響應(yīng)時(shí)長(zhǎng)訪問返回http狀態(tài)碼為40x、50x的URL訪問返回http狀態(tài)碼為40x、50x的URL可監(jiān)控指標(biāo)如下:采集指標(biāo)含義端口連通性端口連通性website狀態(tài)website狀態(tài)ApplicationPool狀態(tài)ApplicationPool狀態(tài)特定進(jìn)程CPU利用率W3WP進(jìn)程的CPU利用率特定進(jìn)程內(nèi)存使用量W3WP進(jìn)程的內(nèi)存使用量當(dāng)前請(qǐng)求數(shù)RequestsCurrent,即當(dāng)前執(zhí)行請(qǐng)求數(shù)當(dāng)前請(qǐng)求等待數(shù)RequestsQueued,即當(dāng)前請(qǐng)求等待數(shù)當(dāng)前拒絕處理的請(qǐng)求數(shù)RequestsRejected,即拒絕處理的請(qǐng)求數(shù)當(dāng)前連接數(shù)currentconnection,即當(dāng)前TCP連接數(shù)當(dāng)前活動(dòng)session數(shù)SessionActive,即當(dāng)前活動(dòng)session數(shù)每秒請(qǐng)求數(shù)Requests/Sec,每秒請(qǐng)求數(shù)請(qǐng)求執(zhí)行時(shí)間RequestExecutionTime,即最近請(qǐng)求頁面執(zhí)行時(shí)間請(qǐng)求等待時(shí)間RequestWaitTime,即請(qǐng)求等待時(shí)間GC調(diào)用時(shí)間占比.NETCLRMemory/%TimeinGC,即GC調(diào)用時(shí)間占比分代GC數(shù)#GenxCollection(x=(0,1,2)),即分代GC數(shù)每秒CLR拋出異常數(shù)ExceptionThrown,即每秒CLR拋出異連接池可用連接數(shù)NumberOfFreeConnections,即連接池可用連接數(shù)5.2.3WAS可監(jiān)控指標(biāo)如下:采集指標(biāo)含義實(shí)例連通性實(shí)例端口的連通性WebContainer線程池利用率WebContainer線程池使用量超過最大值一定比例數(shù)據(jù)源連接池等待隊(duì)列數(shù)據(jù)源連接請(qǐng)求不能及時(shí)響應(yīng)GC異常GC時(shí)長(zhǎng)超長(zhǎng)jdk版本jdk版本W(wǎng)AS版本W(wǎng)AS版本Java堆內(nèi)存利用率Java堆使用量超過最大值一定比例數(shù)據(jù)源連接池利用率數(shù)據(jù)源連接池使用量超過最大值一定比例MQ及Tibco連接池異常MQ或Tibco連接數(shù)超過限制JVM堆使用大小JVM堆使用大小,JVMUsedMemoryWebContainer并發(fā)活動(dòng)的線程數(shù)WebContainerActiveCountWebContainer池中線程數(shù)WebContainerPoolSize數(shù)據(jù)源連接池大小DatasourceConnectionPoolPoolSize數(shù)據(jù)源連接池空閑連接數(shù)DatasourceConnectionPoolFreePoolSize并發(fā)活動(dòng)的全局事務(wù)數(shù)并發(fā)活動(dòng)的全局事務(wù)數(shù),TransactionActiveCount已提交的全局事務(wù)數(shù)CommittedCount回滾的全局事務(wù)數(shù)RolledbackCount請(qǐng)求當(dāng)前訪問的會(huì)話總數(shù)ServletSessionModuleActiveCount當(dāng)前存活的會(huì)話總數(shù)ServletSessionModuleLiveCountJVM堆空閑量JVM堆棧空閑量,JVMFreeMemoryJVM已運(yùn)行時(shí)間(秒)JVM已運(yùn)行時(shí)間,JVMUptime(該指標(biāo)可判斷最近JVM是否重啟)JVM的CPU利用率單個(gè)JVM進(jìn)程的CPU利用率數(shù)據(jù)源連接池創(chuàng)建的連接總數(shù)DatasourceConnectionPoolCreateCount數(shù)據(jù)源連接池已關(guān)閉的連接總數(shù)DatasourceConnectionPoolCloseCount數(shù)據(jù)源連接池等待連接的并發(fā)線程數(shù)DatasourceConnectionPoolWaitingThreadCount數(shù)據(jù)源正使用的池的平均百分率DatasourceConnectionPoolPercentUsed數(shù)據(jù)源使用連接的平均時(shí)間(毫秒)DatasourceConnectionPoolUseTime數(shù)據(jù)源在允許連接之前的平均等待時(shí)間DatasourceConnectionPoolWaitTime可監(jiān)控指標(biāo)如下:采集指標(biāo)含義實(shí)例監(jiān)聽端口連通性端口是否正常監(jiān)聽jdk版本jdk版本tomcat版本tomcat版本處理http請(qǐng)求繁忙線程數(shù)(ThreadPool_currentThreadsBusy)處理http請(qǐng)求當(dāng)前線程池大小(ThreadPool_currentThreadCount)處理HTTP請(qǐng)求最大線程數(shù)(ThreadPool_maxThreads)處理http請(qǐng)求繁忙線程占比(ThreadPool_currentThreadsBusy/ThreadPool_maxThreads)JVM線程數(shù)JVM線程數(shù)(Threading_ThreadCount)JVM堆使用大小JVM堆使用大小(HeapMemoryUsage_usedMemory)JVM堆最大值JVM堆最大值(HeapMemoryUsage_maxMemory)JVM堆占用率(HeapMemoryUsage_usedMemory/HeapMemoryUsage_maxMemory)當(dāng)前活動(dòng)會(huì)話數(shù)(Manager_activeSessions)gc耗時(shí)阻塞應(yīng)用線程的gc耗時(shí)5.2.5MQ可監(jiān)控指標(biāo)如下:采集指標(biāo)含義端口連通性1414/1515等MQestablished通道數(shù)超過一定數(shù)量告警隊(duì)列深度MQ隊(duì)列堵塞的消息條數(shù)進(jìn)程狀態(tài)進(jìn)程狀態(tài)隊(duì)列消費(fèi)方數(shù)量隊(duì)列消費(fèi)方數(shù)量隊(duì)列深度比例MQ隊(duì)列堵塞消息占最大隊(duì)列深度比例5.2.6KAFKA可監(jiān)控指標(biāo)如下:采集指標(biāo)含義Port連通性端口26328\9092可達(dá)FetchConsumerResponseSendTimeMsFetch-Consumer發(fā)送響應(yīng)花費(fèi)的時(shí)間FetchConsumerLocalTimeMsFetch-Consumer在leader處理請(qǐng)求花的FetchConsumerRequestQueueTimeMsFetch-Consumer在請(qǐng)求隊(duì)列中的等待時(shí)間FetchConsumerRequestsPerSecFetch-consumer的請(qǐng)求速率(次數(shù)/秒)FetchConsumerRemoteTimeMsFetch-Consumer等待follower花費(fèi)的時(shí)間FetchConsumerTotalTimeMsFetch-Consumer耗費(fèi)的所有時(shí)間FetchFollowerResponseSendTimeMsFetch-Follower發(fā)送響應(yīng)花費(fèi)的時(shí)間FetchFollowerLocalTimeMsFetch-Follower在leader處理請(qǐng)求花的時(shí)間FetchFollowerRequestQueueTimeMsFetch-Follower在請(qǐng)求隊(duì)列中的等待時(shí)間FetchFollowerRequestsPerSecFetch-follower的請(qǐng)求速率(次數(shù)/秒)FetchFollowerRemoteTimeMsFetch-Follower等待follower花費(fèi)的時(shí)間FetchFollowerTotalTimeMsFetch-Follower耗費(fèi)的所有時(shí)間ReplicaFetcherManagerReplicafollower落后leaderreplica的最大的消息數(shù)量ReplicaManagerIsrExpandsPerSecISR的擴(kuò)大(expansion)速率ReplicaManagerIsrShrinksPerSecISR的收縮(shrink)速率ReplicaManagerReplicaManagerLeader的replica的數(shù)量RequestMetricsResponseSendTimeMsproducer發(fā)送響應(yīng)花費(fèi)的時(shí)間RequestMetricsLocalTimeMsproducer在leader處理請(qǐng)求花的時(shí)間RequestMetricsRequestQueueTimeMsproducer在請(qǐng)求隊(duì)列中的等待時(shí)間RequestMetricsRequestsPerSecproducer的請(qǐng)求速率(次數(shù)/秒)5.2.7Zookeeper可監(jiān)控指標(biāo)如下:采集指標(biāo)含義zk_running_ok運(yùn)行狀態(tài)ZK端口連通性端口連接(自動(dòng)發(fā)現(xiàn))zk_znode_countZnode數(shù)量zk_watch_countzk注冊(cè)觀察者數(shù)量zk_server_state主/從zk_packets_sent每次采樣周期Package發(fā)送數(shù)zk_packets_received每次采樣周期接收包數(shù)量zk_outstanding_requests請(qǐng)求堆積數(shù)zk_open_file_descriptor_countZk打開文件數(shù)量zk_num_alive_connections活躍連接數(shù)zk_min_latency最小延遲zk_max_latency最大延遲zk_max_file_descriptor_count系統(tǒng)最大文件打開數(shù)目/ulimitzk_ephemerals_count臨時(shí)節(jié)點(diǎn)數(shù)量zk_avg_latency平均延遲zk_open_file_pecentage_of_maxZk打開文件數(shù)量占最大數(shù)量比例5.2.8Redis可監(jiān)控指標(biāo)如下:采集指標(biāo)含義redis狀態(tài)redis端口狀態(tài)(自動(dòng)發(fā)現(xiàn))redis內(nèi)存使用率redis已經(jīng)使用的內(nèi)存大于一定比例,通過used_memory_rate來判斷判斷redis在集群中是主還是從connected_clients客戶端連接數(shù)keyspaceredis鍵空間大小(keys)最大內(nèi)存redis設(shè)置的maxmemory,redis能夠使用的最大內(nèi)存used_memoryredis已經(jīng)使用的內(nèi)存bgsave_in_progress后臺(tái)進(jìn)行中的save操作的數(shù)量blocked_clients正在等待阻塞命令changes_since_last_save上次保存數(shù)據(jù)庫之后,執(zhí)行命令的次數(shù)evicted_keys運(yùn)行以來刪除過的key的數(shù)量expired_keys運(yùn)行以來過期的key的數(shù)量expires帶有生存期的key的數(shù)量keyspace_hits命中key的次數(shù)keyspace_misses沒命中key的次數(shù)latest_fork_usec上次導(dǎo)出rdb快照,持久化花費(fèi)微秒total_commands_processed運(yùn)行以來執(zhí)行過的命令的總數(shù)量total_connections_received運(yùn)行以來連接過的客戶端的總數(shù)量used_cpu_sysRedis服務(wù)器耗費(fèi)的系統(tǒng)CPUused_cpu_sys_children后臺(tái)進(jìn)程耗費(fèi)的系統(tǒng)CPURedis節(jié)點(diǎn)磁盤使用率Redis的每個(gè)節(jié)點(diǎn)的磁盤的已經(jīng)使用比例5.2.9Memcached可監(jiān)控指標(biāo)如下:采集指標(biāo)含義MEMCACHE端口連通性端口可達(dá)(自動(dòng)發(fā)現(xiàn))curr_connections_percentage表示當(dāng)前系統(tǒng)打開的連接數(shù)占總連接數(shù)的比例curr_items表示當(dāng)前緩存中存放的所有緩存對(duì)象的數(shù)量。不包括目前已經(jīng)從緩存中刪除的對(duì)象total_items表示從memcached服務(wù)啟動(dòng)到當(dāng)前時(shí)間,系統(tǒng)存儲(chǔ)過的所有對(duì)象的數(shù)量,包括目前已經(jīng)從緩存中刪除的對(duì)象curr_connections表示當(dāng)前系統(tǒng)打開的連接數(shù)total_connections表示從memcached服務(wù)啟動(dòng)到當(dāng)前時(shí)間,系統(tǒng)打開過的連接的總數(shù)connection_structures表示從memcached服務(wù)啟動(dòng)到當(dāng)前時(shí)間,被服務(wù)器分配的連接結(jié)構(gòu)的數(shù)量cmd_get累積獲取數(shù)據(jù)的數(shù)量cmd_set累積保存數(shù)據(jù)的樹立數(shù)量get_hits表示獲取數(shù)據(jù)成功的次數(shù)get_misses表示獲取數(shù)據(jù)失敗的次數(shù)evictions為了給新的數(shù)據(jù)項(xiàng)目釋放空間,從緩存移除的緩存對(duì)象的數(shù)目bytes_readmemcached服務(wù)器從網(wǎng)絡(luò)讀取的總的字節(jié)數(shù)bytes_writtenmemcached服務(wù)器發(fā)送到網(wǎng)絡(luò)的總的字節(jié)數(shù)threads被請(qǐng)求的工作線程的總數(shù)量bytes表示系統(tǒng)存儲(chǔ)緩存對(duì)象所使用的存儲(chǔ)空間,單位為字節(jié)limit_maxbytesmemcached服務(wù)緩存允許使用的最大字節(jié)數(shù)5.3數(shù)據(jù)庫5.3.1Oracle可監(jiān)控指標(biāo)如下:采集指標(biāo)含義實(shí)例連通性數(shù)據(jù)庫平臺(tái)中存在數(shù)據(jù)庫不能正常創(chuàng)建連接Listener偵聽端口端口連通性集群資源狀態(tài)CRS中存在狀態(tài)為OFFLINE的資源數(shù)據(jù)文件狀態(tài)數(shù)據(jù)庫中存在狀態(tài)為非ONLINE的數(shù)據(jù)文件雙活環(huán)境同步轉(zhuǎn)異步FSFO狀態(tài)異常alert錯(cuò)誤日志alert日志中檢查到“corrupt/ora-04031"關(guān)鍵詞數(shù)據(jù)文件利用率參數(shù)設(shè)置不合理(db_files)process使用率參數(shù)設(shè)置不合理(processes)activesession連續(xù)3次活動(dòng)會(huì)話超過max(60,CPU_CORES*2),監(jiān)控頻率為1分鐘一次單個(gè)表空間最大文件數(shù)單個(gè)表空間下的文件數(shù)超過800個(gè)歸檔空間錄利用率存放歸檔日志的diskgroup利用率高于80%且可用空間小于1T;ASM存儲(chǔ)利用率存放數(shù)據(jù)文件的diskgroup利用率高于90%且可用空間小于1T;非循環(huán)的sequence使用率sequence利用率超過80%分區(qū)的使用量#N/Atemp利用率臨時(shí)表空間利用率超過80%flashback空間使用率FlashbackRecoveryArea(閃回區(qū))利用率超過80%大事務(wù)占undo數(shù)據(jù)庫中存在消耗undo超過35G的大事務(wù)副庫同步延遲雙活環(huán)境主備同步延遲超過10分鐘Asm_disk_StatusASMdisk的header_status不是’MEMBER’或者’CANDIDATE’Instance_Status實(shí)例狀態(tài)Config_Tablespace_Usage表空間利用率超過90%且可用空間小于Config_Undo_TBS_UsageUndo表空間利用率超過80%Config_Wait_Eventcachelock,閾值為40個(gè)Asm_disk_Count同一個(gè)diskgroup的failgroup下的asmdisk數(shù)量不一致Asm_disk_Size同一個(gè)diskgroup的asmdisk的total_mb不一致或者free_mb大小差異超過15%Os_SwapOS層面連續(xù)3次swapout+swapin>100Os_CpuCPU利用率連續(xù)15分鐘超過85%Broker_Errorobserver配置報(bào)錯(cuò)IO_Capacity數(shù)據(jù)庫主機(jī)實(shí)際IO流量超過IO通道能力的70%Obj_Timestamp_Mismatch引

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論