




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
目錄第1章項目概況 31.1.項目總體背景 31.2.系統(tǒng)維護內(nèi)容 31.3.項目的總體思路 31.3.1.整體思路 31.3.2.達到的效果 31.4.總體要求 31.5.需求分析 31.6.建設目標 3第2章綜合運維管理系統(tǒng)功能 32.1.綜合運維系統(tǒng)架構(gòu)圖 32.2.綜合監(jiān)控 32.2.1.綜合監(jiān)控的優(yōu)勢和亮點 32.2.2.管理監(jiān)控與值班監(jiān)控的功能 32.2.3.設備運行的功能 32.2.4.線路流量的功能 32.3.主機系統(tǒng)服務資源管理 32.3.1.系統(tǒng)和通用應用數(shù)據(jù)采集 32.3.2.主機管理 32.3.3.數(shù)據(jù)庫管理 32.3.4.中間件管理 32.3.5.應用管理 32.4.存儲管理 32.4.1.存儲管理的優(yōu)勢和亮點 32.4.2.部署方式 32.5.故障告警管理 32.5.1.故障管理的優(yōu)勢和亮點 32.5.2.我司故障管理詳細介紹 32.5.3.基線數(shù)據(jù)管理的功能 32.5.4.告警日志查詢的功能 32.5.5.輔助查詢的功能 32.5.6.ARP干擾設置的功能 32.5.7.其他告警 32.6.報表管理 32.6.1.報表管理的優(yōu)勢和亮點 32.6.2.報表內(nèi)容說明 32.6.3.報表展現(xiàn)類別說明 32.6.4.報表提供方式 32.7.機房管理 32.8.統(tǒng)一監(jiān)控平臺 32.8.1.服務拓撲展現(xiàn)功能說明 32.8.2.運行展現(xiàn)功能說明 32.8.3.告警展現(xiàn)功能說明 32.9.系統(tǒng)管理 32.9.1.系統(tǒng)管理的優(yōu)勢和亮點 32.9.2.用戶管理的功能 32.9.3.用戶操作審計的功能 32.9.4.當前在線用戶的功能 32.9.5.當前用戶編輯的功能 32.9.6.網(wǎng)管郵件發(fā)送帳號的功能 32.10.交通運維管理功能 32.10.1.服務臺 32.10.2.事件管理 32.10.3.問題管理 32.10.4.變更管理 32.10.5.發(fā)布管理 32.10.6.資產(chǎn)配置管理 32.10.7.作業(yè)管理 32.10.8.知識管理 32.10.9.服務級別管理 32.10.10.排班管理 32.11.硬件&基礎軟件 32.11.1.硬件構(gòu)成 32.11.2.故障恢復 3第3章項目管理與實施計劃 33.1.項目總則 33.2.項目組織機構(gòu) 33.2.1.組織架構(gòu)保證 33.2.2.人員穩(wěn)定 33.3.項目進度計劃 33.4.項目范圍內(nèi)容 33.5.項目實施地點 33.6.項目進度管理 33.7.項目合同變更管理 33.8.項目質(zhì)量管理 33.9.服務內(nèi)容 33.10.項目管理 33.11.項目交付成果 33.12.實施準備 33.13.實施人員清單 33.14.實施工作進度計劃 33.15.實施技術(shù)資料 3第4章培訓方案 34.1.培訓總論 34.2.培訓內(nèi)容 34.2.1.培訓課程表 34.2.2.課程內(nèi)容簡介 3項目概況系統(tǒng)維護內(nèi)容xxx轄區(qū)內(nèi)道路上總隊與支隊自建視為所有科技管控設備、執(zhí)法站科技設備及系統(tǒng),統(tǒng)一到云南省公安廳交通管理警察總隊布置科技信息化有關(guān)平臺。項目總體思路整體思路項目要在整體統(tǒng)一規(guī)劃基本上,采用分階段、分環(huán)節(jié)方略對既有信息系統(tǒng)進行建設,實現(xiàn)網(wǎng)絡設備集中監(jiān)管和維護,通過集中布置管理方式、實現(xiàn)對網(wǎng)絡設備集中監(jiān)管,全面建成實現(xiàn)一體化統(tǒng)一信息系統(tǒng)交通運維系統(tǒng)平臺,實現(xiàn)整個道路交通管理基本設施集中監(jiān)控、集中管理和集中維護,全面提高交通管理基本設施運營、管理和維護水平。達到效果綜合運維管理系統(tǒng)全面建設,將為基于信息化系統(tǒng)各項業(yè)務和工作順利開展提供堅實技術(shù)支撐,為交警尋常工作提供良好環(huán)境和堅實基本保障,交通管理部門作為項目成果使用者、管理者和直接受益者,將從不同角度和層面感受到項目所產(chǎn)生變革,詳細價值體現(xiàn)為:予以交通管理部門一種全局化管理視角,可以杜絕信息系統(tǒng)運轉(zhuǎn)過程中黑箱現(xiàn)象,避免管理死角浮現(xiàn)。通過簡樸直觀圖形管控手段代替老式上不直觀、不和諧管理界面,通過圖形、動畫、數(shù)據(jù)等多媒體手段集成全方位呈現(xiàn)整體信息系統(tǒng)動態(tài)運轉(zhuǎn)狀況,讓管理人員對信息系統(tǒng)運營狀況做到全局掌握和實時理解,及時發(fā)現(xiàn)異?;騿栴},從而迅速介入和及時解決,做到問題早發(fā)現(xiàn)、早解決,提高對設備運營管理質(zhì)量和保障能力。提供對多廠商、跨平臺異構(gòu)交通管理系統(tǒng)統(tǒng)一管理支持,由管理平臺屏蔽它們底層差別性,采用統(tǒng)一管理維護方式,從而簡化管理、減少管理難度,避免重復投資導致資金揮霍,實現(xiàn)經(jīng)濟好省。管理覆蓋全面,實現(xiàn)對構(gòu)成各要素、各環(huán)節(jié)進行全面監(jiān)控,重要是數(shù)據(jù)互換平臺(網(wǎng)絡)、安全,管理平臺開放體系架構(gòu)和高度可擴展性不但可以充分滿足當前管理需要,并且可以充分適應將來管理發(fā)展變化,迅速實現(xiàn)對新技術(shù)、產(chǎn)品支持和適應,保護既有投資,實現(xiàn)向后兼容性。提供豐富呈現(xiàn)和分析手段,資源使用、系統(tǒng)負荷壓力分布一目了然,為有效評估和科學評價提供協(xié)助,保證資源分派與使用更加科學合理;提高交通管理部門響應速度和支持保障能力,具備從容應對各種突發(fā)事件能力,通過統(tǒng)一平臺積極檢測監(jiān)控,實現(xiàn)各種問題及時發(fā)現(xiàn)、分析、定位并提供一系列管理手段協(xié)助實現(xiàn)故障迅速診斷和精準定位,協(xié)助管理維護人員迅速鎖定故障根因素,從而采用對的辦法迅速排障,最大限度減少故障對業(yè)務運轉(zhuǎn)影響;為多部門、多專業(yè)進行高效協(xié)同提供統(tǒng)一平臺,使不同崗位和專業(yè)管理人員,各司其職,互相協(xié)調(diào),互相監(jiān)督,運轉(zhuǎn)流暢,使信息運維管理工作步入管理規(guī)范化、管理科學化和辦公當代化軌道;詳實運營維護數(shù)據(jù)為履行量化精細管理奠定了基本,解決了交通管理部門進行有效績效考核困難,為上級部門和主管領(lǐng)導客觀評價交通管理部門工作成效提供了有力論據(jù),也有助于交通管理部門客觀檢查、審視自身工作,總結(jié)成績、經(jīng)驗,發(fā)現(xiàn)局限性,制定改進籌劃,持續(xù)改進、提高和優(yōu)化信息管理維護工作;精確掌握問題、故障多發(fā)點,從設計、運營、管理等多環(huán)節(jié)切入尋找影響系統(tǒng)正常、穩(wěn)定和可靠運轉(zhuǎn)核心因素,為進一步優(yōu)化、升級、改造提供有力數(shù)據(jù)支持,從而保證信息管理和決策科學性。集成安全管理,統(tǒng)一管理監(jiān)控入口,及時捕獲影響系統(tǒng)安全各種風險因素,提高信息系統(tǒng)整體安全性和結(jié)實性;變被動響應為積極監(jiān)控;變事后修復為事前防止;變復雜操作維護為簡樸管理;變孤立分散管理為集中統(tǒng)一管理;全面扭轉(zhuǎn)交通管理部門在運維工作中被動局面,借助于統(tǒng)一信息內(nèi)網(wǎng)監(jiān)管平臺有力支撐,有力推動交通管理部門朝著“全面實現(xiàn)以防止為主、修復為輔積極式管理”目的邁進。該項目建設完畢后,將會對運營維護和管理水平整體提高發(fā)揮積極推動和增進作用,做到故障早發(fā)現(xiàn)、早解決,保證計算機網(wǎng)絡持續(xù)、可靠、安全運營,減少發(fā)生故障也許性,提高信息運維部門運營管理水平和服務保障能力,為信息運維綜合監(jiān)管系統(tǒng)持續(xù)建設與進一步應用提供強有力支持與保障??傮w規(guī)定結(jié)合項目特點綜合運維管理系統(tǒng)規(guī)定如下:實時掌握網(wǎng)絡性能數(shù)據(jù)和故障信息,其中性能數(shù)據(jù)獲取時間不高于5分鐘,告警數(shù)據(jù)獲取時間不高于30秒。準時間段(天/周/月/季度/年)記錄分析網(wǎng)絡運營狀況,支持設備性能和鏈路性能圖表。實現(xiàn)全路段系統(tǒng)匯總運營記錄分析,例如CPU平均使用狀況、內(nèi)存最大使用狀況等。分析數(shù)據(jù)可以層層下鉆,看到各個網(wǎng)絡設備有關(guān)指標分析狀況。也可以分析某段時間內(nèi)不同區(qū)域不同指標狀況。實時監(jiān)控、呈現(xiàn)網(wǎng)絡設備核心指標變化狀況。支持統(tǒng)一告警臺視圖呈現(xiàn),可將監(jiān)控所有內(nèi)容所產(chǎn)生事件匯總到統(tǒng)一呈現(xiàn)界面,并可通過事件點擊追溯到事故資源詳細指標信息中。核心網(wǎng)絡實時監(jiān)控和分析呈現(xiàn)是對核心網(wǎng)絡數(shù)據(jù)進一步記錄分析,更好地理解核心網(wǎng)絡系統(tǒng)運營狀況、分析異常數(shù)據(jù)變動原始數(shù)據(jù)因素。核心網(wǎng)絡分析呈現(xiàn)通過數(shù)據(jù)抽取對業(yè)務數(shù)據(jù)進行分析成果呈現(xiàn),同步提供分析所需要細粒度數(shù)據(jù)和匯總數(shù)據(jù)。網(wǎng)絡實時監(jiān)控和分析呈現(xiàn)能準時間段(天/周/月/季度/年)記錄分析網(wǎng)絡指標狀況,分析數(shù)據(jù)可在時間維度逐級向下查看詳細數(shù)據(jù)。(1)系統(tǒng)需提供各種記錄分析手段,如排序、同比、環(huán)比等而無需輸入任何分析公式(2)監(jiān)控信息刷新頻率可以按照顧客需要進行靈活調(diào)節(jié)(3)滿足實時抽取核心數(shù)據(jù),按日批量和增量抽取明細數(shù)據(jù)(4)監(jiān)控信息刷新頻率可以按照顧客需要進行靈活調(diào)節(jié)需求分析依照需求來看,實際運維工作中是有某些管理工具進行監(jiān)控工作。但是從實際運維管理工作需求角度出發(fā),既有管理工具存在較多問題,這種問題體當前工具互相之間缺少關(guān)聯(lián)性,工具非定制性導致采集數(shù)據(jù)和實際運維工作存在較大偏差,因而對于綜合運維管理系統(tǒng)需求集中體當前如下幾種方面:所有交通管理設備均納入綜合運維管理系統(tǒng)管理綜合運維管理系統(tǒng)一方面需要是將所有交通管理設備均納入管理,這是運維工作管理基本和核心。只有當所有設備都在管理范疇內(nèi),對其進行監(jiān)控、告警、記錄、分析、報表才有實際意義。當前雖然有了某些監(jiān)控工具,但從實際狀況來看,并未將所有設備納入監(jiān)控范疇,從監(jiān)控自身角度存在較大缺失。全面增強基本監(jiān)控KPI網(wǎng)絡管理系統(tǒng)必要掙脫依賴于原有工具來開展運維工作狀況,需要依照自身運維管理工作特點,有目有籌劃展開各類管理對象專項分析,例如網(wǎng)絡設備監(jiān)控、鏈路監(jiān)控、服務器監(jiān)控、數(shù)據(jù)庫監(jiān)控等,通過梳理既有監(jiān)控指標特別是全國范疇內(nèi)顧客對上述設備管理指標,建立健全對基本監(jiān)控KPI庫,將各類風險納入到綜合運維管理系統(tǒng)中,實現(xiàn)綜合運維管理系統(tǒng)及時、迅速、有效對各類故障進行事前可知、事中可控、事后可查目的。建設目的依照局現(xiàn)狀和需求進行統(tǒng)籌規(guī)劃,本著“從實際需要出發(fā),保護已有投資”原則,將當前已有、針對網(wǎng)絡分散式監(jiān)控管理系統(tǒng),以及數(shù)據(jù)解決中心動力集中到一種統(tǒng)一監(jiān)控系統(tǒng),并以恰當形式進行集中呈現(xiàn),為運維人員進行系統(tǒng)、設備監(jiān)控、故障定位、故障診斷和解決等運維工作提供信息來源。實現(xiàn)集中統(tǒng)一事件監(jiān)控、集中統(tǒng)一性能監(jiān)控,從而實現(xiàn)綜合運維管理系統(tǒng)各項業(yè)務功能規(guī)定。運用綜合運維管理系統(tǒng)全面積極反映個業(yè)務系統(tǒng)運營健康狀況,通過各種分析手段為合理有效地分派各運維人員和值班人員人員調(diào)度,為制定設備升級、擴容方案提供決策支持。通過綜合運維管理系統(tǒng)對業(yè)務核心數(shù)據(jù)進行分析和實時監(jiān)控,并實現(xiàn)豐富、科學、美觀展示。綜合運維管理系統(tǒng)功能我司系統(tǒng)采用層次化設計,對系統(tǒng)各個層面進行了建模和抽象,使得各構(gòu)造層面之間既互相獨立,又互有關(guān)聯(lián),最大限度上提高了系統(tǒng)運營效率。綜合運維系統(tǒng)架構(gòu)圖我司平臺架構(gòu)圖如下:從上圖,可以直觀看出我司模塊清晰,層次分明。各模塊之間既互相獨立,又互有關(guān)聯(lián),共同實現(xiàn)了對被管對象集中監(jiān)控和管理,此外也通過WEB方式為顧客進行了統(tǒng)一呈現(xiàn)。綜合監(jiān)控綜合監(jiān)控某些重要是對系統(tǒng)各個監(jiān)控對象進行迅速瀏覽時使用,適合顧客查看守理對象尋常運營狀況,操作簡樸,界面直觀明了。通過全網(wǎng)設備負載、線路流量自動TOPN排序,積極告訴顧客哪些設備需要關(guān)注,全網(wǎng)運營隱患在哪里。綜合監(jiān)控功能涉及:管理監(jiān)控、值班監(jiān)控、設備運營、線路流量、峰值流量、環(huán)境監(jiān)控、告警總覽、服務總覽。綜合監(jiān)控優(yōu)勢和亮點綜合監(jiān)控是我司系統(tǒng)對所有被管對象一種綜合展示窗口,呈現(xiàn)直觀以便、關(guān)聯(lián)性強。支持全網(wǎng)設備負載自動TOPN排序,積極告訴顧客哪些設備需要關(guān)注,全網(wǎng)運營隱患在哪里。提供可配備功能,在一種界面上可以配備各種可視化項目。顧客可以配備自己個性化監(jiān)控首頁,這樣就可以讓顧客把自己最關(guān)懷東西,一進系統(tǒng)就能立即看到。通過業(yè)務視圖呈現(xiàn)各類服務邏輯,并對服務系統(tǒng)諸多業(yè)務核心參數(shù)(KPI)進行監(jiān)控,作為服務管理基本。全網(wǎng)線路流量TOPN排序和峰值流量呈現(xiàn),告訴顧客當前網(wǎng)絡重要流量有哪些、在哪里。全網(wǎng)告警預覽。讓顧客一幕了然理解網(wǎng)絡中問題所在。自動生成全網(wǎng)設備運營記錄率報表。以便顧客理解全網(wǎng)設備運營狀況。管理監(jiān)控與值班監(jiān)控功能對于不同管理人員對于數(shù)據(jù)指標查看需求也有區(qū)別,我司系統(tǒng)提供了詳細和簡樸兩種不同管理信息界面,對于值班員偏重于信息關(guān)聯(lián),對于運維人員更偏重于信息指標完整。對于值班員和管理者需要查詢實時信息也是不同類型,系統(tǒng)按照管理規(guī)定提供了快捷值班監(jiān)控和管理監(jiān)控兩個頁面。值班監(jiān)控可通過定制化配備顧客所關(guān)懷核心指標,并實時數(shù)據(jù)呈現(xiàn),而管理監(jiān)控則著重于從網(wǎng)絡、服務、業(yè)務三個方面呈現(xiàn)實時管理效果。設備運營功能呈現(xiàn)整體系統(tǒng)設備運營狀況,并呈現(xiàn)CPU/MEM設備TOPN當前狀態(tài)線路流量功能呈現(xiàn)整體系統(tǒng)設備運營狀況,并呈現(xiàn)流量/幀流量設備TOPN當前狀態(tài)主機系統(tǒng)服務資源管理通過我司綜合管理平臺,重要是在顧客環(huán)境中實現(xiàn)對主機系統(tǒng)及有關(guān)系統(tǒng)綜合管理,涉及:所有被管信息收集、系統(tǒng)管理、數(shù)據(jù)庫和中間件管理、存儲系統(tǒng)管理、資源信息庫管理、統(tǒng)一監(jiān)控平臺(對第三方管理軟件整合)。數(shù)據(jù)采集是針對不同對象所采用不同采集方式,涉及SNMP、SYSLOG、業(yè)務和應用仿真、透明Agent等。對象抽象化層重要負責獲取對象信息,將它們抽象成管理對象,向上屏蔽不同交通管理對象差別。業(yè)務層重要提供詳細應用功能,如服務拓撲管理、報表分析和流程管理等。訪問層顧客展示管理信息、暴露管理功能,顧客通過它發(fā)出管理命令,執(zhí)行尋常管理任務。支持主機類型有:WindowsIBMAIXHP-UNIXSolarisLinux(REDHAT\SUSE…)FreeBSDCentOSNovellTUR64系統(tǒng)和通用應用數(shù)據(jù)采集我司綜合管理平臺支持通過SYSLOG、命令集/透明AGENT、SNMP、端口應用仿真等各種監(jiān)測方式監(jiān)測服務器,可以獲取遠程服務器系統(tǒng)資源,我司支持對Windows、UNIX、Linux、AIX、Solaris、HPUX等各種服務器系統(tǒng)管理和監(jiān)視,對服務器操作系統(tǒng)運營狀態(tài)和性能數(shù)據(jù),涉及服務器CPU負載、內(nèi)存運用率、應用進程、文獻系統(tǒng)、文獻體積等信息分析與監(jiān)視。管理和監(jiān)視服務器上各應用服務運營狀態(tài)和性能數(shù)據(jù),涉及Ema、HTTP、FTP、EMA、Apache/IIS、數(shù)據(jù)庫、DNS、DHCP服務以及各中間件等。如下圖所示:進程狀態(tài)分析服務器進程控制對整個服務器運營至關(guān)重要,會影響到其操作系統(tǒng)正常運營和核心服務正常運營,因此實時掌握服務器所有進程運營狀況是很有必要。正常狀況下運營著大量系統(tǒng)進程和應用進程。它們在運營過程中會消耗服務器資源,甚至某些非法進程可以導致服務器癱瘓,因此服務器進程管理也是很有必要。一方面就是進程數(shù)量,第一,如果服務器里運營著進程過多,勢必會占用大量系統(tǒng)資源,進程數(shù)量越多,導致服務器不穩(wěn)定也許性就越大,因此監(jiān)視所有進程總數(shù)量可以協(xié)助顧客及時理解到服務器資源狀況,浮現(xiàn)異常,也可以第一時間讓顧客理解到她必要當前去看看究竟發(fā)生了什么事?第二,相似名字進程數(shù)量過多,大某些時間意味著病毒爆發(fā),因此監(jiān)視同名進程數(shù)量也是很故意義。咱們提供了進程數(shù)量監(jiān)視,時刻監(jiān)視服務器所有進程數(shù)量或進程名字和設立匹配進程數(shù)量,當浮現(xiàn)異常時會在第一時間內(nèi)提示顧客,保證顧客盡早發(fā)現(xiàn)問題、解決問題,避免更嚴重故障發(fā)生。我司綜合管理平臺可以以表格方式實時顯示服務器所有進程運營狀況,涉及進程名稱、CPU運用時間、CPU占用狀況、當前內(nèi)存占用狀況、運營狀態(tài)等等,為顧客分析服務器當前運營狀況提供詳細實時數(shù)據(jù)來源。我司綜合管理平臺支持對服務器上應用進程狀況進行監(jiān)視,支持使用*和?通配符記錄符合條件應用進程數(shù)量,當該數(shù)量超過/不大于指定閾值時,系統(tǒng)將觸發(fā)告警。我司綜合管理平臺也可以直接監(jiān)視某些特定名稱進程活動狀態(tài)。系統(tǒng)中某一活動著進程也許對顧客非常重要,因此顧客會關(guān)懷這個進程與否始終在進程列表中,咱們稱這樣進程為“核心進程”;當這些進程出當前進程表中或者不出當前進程表中時,系統(tǒng)將自動觸發(fā)告警,提示管理人員及時解決。我司綜合管理平臺提供對指定進程進行CPU運用率、內(nèi)存運用率不間斷監(jiān)視功能。每一種進程都會占用系統(tǒng)資源,如CPU、內(nèi)存,當某一種進程或某幾種進程占用CPU過高時,會影響到整個服務器運營,使得運營速度變慢,使得其她進程由于分享不到CPU而無法正常運營;某些進程如果存在內(nèi)存泄露等問題,會不斷申請內(nèi)存,導致系統(tǒng)內(nèi)存溢出。我司綜合管理平臺自動每分鐘從服務器上獲取最新進程運營數(shù)據(jù),提供各進程運營趨勢分析圖,涉及進程CPU占用趨勢圖、物理內(nèi)存運用率趨勢圖,以便管理人員查看各進程一段時間以來運營狀況。文獻系統(tǒng)分析諸多應用服務都需要使用磁盤空間進行數(shù)據(jù)存儲和解決,因此普通狀況下,服務器磁盤空間應當保持一定空白容量,當磁盤空間低于可控制下限時,顧客應當立即進行相應解決,避免磁盤空間被占滿后核心服務不能正常運營狀況發(fā)生。并且磁盤空間被占滿也有也許是病毒引起,這需要管理人員第一時間就要掌握到,盡量避免病毒擴散和維護核心服務正常運營。文獻系統(tǒng)分析重要提供服務器上各文獻系統(tǒng)空間大小和使用狀況(已用空間、剩余空間、運用率)以及文獻系統(tǒng)名稱、類型等基本信息。管理人員可以指定系統(tǒng)刷新間隔,自動以一定頻率從服務器上讀取文獻系統(tǒng)信息和參數(shù),便于服務器文獻系統(tǒng)狀態(tài)監(jiān)視和解決。CPU運用率1、服務器CPU運用率,可針對系統(tǒng)每個CPU分別分析其相應運用率;2、服務器當邁進程列表所占用CPU運用率,CPU使用時間;3、顯示服務器CPU性能(分進程顯示)實時變化狀況和歷史變化趨勢;4、服務器CPU閾值告警,當服務器CPU負載過大/小,能產(chǎn)生報警;5、服務器進程CPU占用閾值告警,當進程占用CPU過大/小,能產(chǎn)生報警;內(nèi)存運用率1、服務器內(nèi)存運用率;2、服務器當邁進程列表所占用內(nèi)存運用狀況,內(nèi)存運用率;3、顯示服務器內(nèi)存運用率(分進程顯示)實時變化狀況和歷史變化趨勢;4、服務器內(nèi)存運用率閾值告警,當服務器內(nèi)存運用率過大/小,能產(chǎn)生報警;5、服務器進程內(nèi)存運用率閾值告警,當進程占用內(nèi)存過大/小,能產(chǎn)生報警;硬盤性能分析我司綜合管理平臺可以收集磁盤性能I/O狀態(tài)信息。協(xié)助顧客分析磁盤讀取繁忙限度,由于磁盤I/O信息是影響系統(tǒng)性能常用因素,進而得到對優(yōu)化整個系統(tǒng)性能參照指標。服務器日記查詢、分析我司綜合管理平臺采用syslog、WMI、telnet、ssh方式來讀取所監(jiān)控服務器日記,并可按分鐘、小時、日等方式對日記進行查詢與分析。主機管理提供對WINDOWS、AIX、LINUX、Solaris等主機系統(tǒng)進行全方位監(jiān)測和管理,協(xié)助顧客及時理解到各類系統(tǒng)KPI運營狀態(tài)??梢躁P(guān)聯(lián)告警系統(tǒng),對主機核心指標異常狀態(tài)進行告警,讓顧客可以及時懂得并進行解決??梢躁P(guān)聯(lián)告警系統(tǒng),對主機異常進程,或進程異常狀態(tài)進行告警,讓顧客可以及時懂得并進行解決。支持動態(tài)數(shù)據(jù)流轉(zhuǎn)圖,可以圖形化呈現(xiàn)CPU負載、內(nèi)存使用率、硬盤容量、應用進程、文獻占用空間、網(wǎng)絡流量等信息。取數(shù)方式靈活,支持Agent和Agentless兩種方式供顧客選取。數(shù)據(jù)呈現(xiàn)方式多樣、層層遞進→物理拓樸圖、監(jiān)控總覽、數(shù)據(jù)流轉(zhuǎn)圖、業(yè)務拓樸圖。我司綜合管理平臺提供對WINDOWS、AIX、LINUX、Solaris等主機系統(tǒng)多方面監(jiān)測和管理:對Windows操作系統(tǒng)重要可以監(jiān)控如下內(nèi)容:服務器配備信息:自動獲取服務器名稱、IP地址、系統(tǒng)版本、CPU個數(shù)、磁盤大小、內(nèi)存大小等;服務器運營狀態(tài):服務器運營狀態(tài)、服務器磁盤狀態(tài)、網(wǎng)卡狀態(tài)、進程總數(shù)服務器CPU運營狀況:CPU顧客時間比例、CPU系統(tǒng)時間比例、CPU運營隊列進程個數(shù)服務器內(nèi)存使用狀況:內(nèi)存運用率、虛擬內(nèi)存(互換區(qū))使用率、互換SWAP分區(qū)頁數(shù)量(換入/換出);服務器磁盤運營指標:磁盤空間運用率、磁盤讀/寫速率、磁盤TPS指標。服務器文獻管理指標:各文獻系統(tǒng)分區(qū)使用率和空閑空間、指定核心文獻與否存在和當前大??;服務器核心進程運營指標:涉及進程ID、進程名、進程狀態(tài)、占用CPU時間、內(nèi)存占用大小等;服務器日記告警:檢查服務器核心日記文獻,提取有關(guān)錯誤日記信息(Warning/error/fa)并生成告警;實時監(jiān)控操作系統(tǒng),數(shù)據(jù)庫和應用系統(tǒng)中制定日記文獻,并可依照其中特定信息,執(zhí)行顧客預定義操作;HA狀態(tài)監(jiān)控,對HA狀態(tài)、系統(tǒng)間切換和節(jié)點間切換等狀態(tài)進行積極監(jiān)測,并記錄每一次發(fā)生切換發(fā)生時間、有關(guān)服務器名稱等信息。對系統(tǒng)服務進行監(jiān)控,對重要服務運營故障進行實時告警。下圖是我司綜合管理平臺對Windows監(jiān)控界面:對AIX、Solaris、Linux等類Unix系統(tǒng)重要可以監(jiān)控如下內(nèi)容:服務器配備信息:獲取服務器名稱、IP地址、系統(tǒng)版本、CPU個數(shù)、磁盤大小、內(nèi)存大小等;服務器運營狀態(tài):服務器運營狀態(tài)、服務器磁盤狀態(tài)、網(wǎng)卡狀態(tài)、進程總數(shù)服務器CPU運營狀況:CPU顧客時間比例、CPU系統(tǒng)時間比例、CPU運營隊列進程個數(shù)服務器內(nèi)存使用狀況:內(nèi)存運用率、虛擬內(nèi)存(互換區(qū))使用率、互換SWAP分區(qū)頁數(shù)量(換入/換出);服務器磁盤運營指標:磁盤空間運用率、磁盤讀/寫速率、磁盤TPS指標。服務器文獻管理指標:各文獻系統(tǒng)分區(qū)使用率和空閑空間、指定核心文獻與否存在和當前大??;服務器核心進程運營指標:涉及進程ID、進程名、進程狀態(tài)、占用CPU時間、內(nèi)存占用大小等;服務器日記告警:檢查服務器核心日記文獻,提取有關(guān)錯誤日記信息(Warning/error/fa)并生成告警;實時監(jiān)控操作系統(tǒng),數(shù)據(jù)庫和應用系統(tǒng)中制定日記文獻,并可依照其中特定信息,執(zhí)行顧客預定義操作;HACMP狀態(tài)監(jiān)控:對HACMP狀態(tài)、系統(tǒng)間切換和節(jié)點間切換等狀態(tài)進行積極監(jiān)測,并記錄每一次發(fā)生切換發(fā)生時間、有關(guān)服務器名稱等信息。對CICSRegion監(jiān)控:通過監(jiān)控有關(guān)日記(Prepare
日記、Comm交通管理日記、Abort日記等)、并輔以模仿連接(將連接成果發(fā)送到我司綜合管理平臺),咱們可以做到對P系統(tǒng)主機上CICS狀態(tài)和隊列進行監(jiān)控。下圖是我司綜合管理平臺對AIX系統(tǒng)監(jiān)控界面數(shù)據(jù)庫管理可以實現(xiàn)對各種數(shù)據(jù)庫監(jiān)控和管理,以便顧客對各種業(yè)務平臺進行統(tǒng)一管理。實現(xiàn)對數(shù)據(jù)庫容量、命中率、會話信息、日記信息等實現(xiàn)全面監(jiān)控,并為顧客提供直觀數(shù)據(jù)報表,以便掌握數(shù)據(jù)庫運營狀態(tài)??梢躁P(guān)聯(lián)告警系統(tǒng),對數(shù)據(jù)庫核心指標異常狀態(tài)進行告警,讓顧客可以及時懂得并進行解決。支持動態(tài)數(shù)據(jù)流轉(zhuǎn)圖,可圖形化多角度動態(tài)全方位呈現(xiàn)數(shù)據(jù)庫諸如CPU、緩存、表空間、鎖、緩存、讀寫速度各種信息。我司綜合管理平臺可以對服務器上DB2、ORACLE、SQLSERVER、SYBASE、INFORMIX等數(shù)據(jù)庫系統(tǒng)提供狀態(tài)監(jiān)測和管理。數(shù)據(jù)庫服務監(jiān)視重要是對大型數(shù)據(jù)庫系統(tǒng)性能、事務、連接等性能數(shù)據(jù)進行監(jiān)視。我司綜合管理平臺通過JDBC連接到指定大型數(shù)據(jù)庫服務上,執(zhí)行管理人員指定SQL語句,然后對所獲得成果進行分析解決,如果不不大于指定閾值,則自動觸發(fā)數(shù)據(jù)庫服務監(jiān)視告警。通過SQL語言對數(shù)據(jù)庫系統(tǒng)表進行監(jiān)視,可以對數(shù)據(jù)庫表空間(空閑率)進行容量規(guī)劃,并可以對表空間使用狀況進行定期分析和預警;可以實時監(jiān)控當前連接數(shù)據(jù)庫會話,并可以在連接數(shù)據(jù)庫浮現(xiàn)問題觸發(fā)告警;可以獲取會話級數(shù)據(jù)庫運營性能參數(shù),并對性能參數(shù)進行關(guān)聯(lián)性分析,進行告警監(jiān)測;可以解決數(shù)據(jù)庫事務提交數(shù)、事務回滾數(shù)、順序掃描總數(shù)、排序總數(shù)、排序所使用最大磁盤空間等系統(tǒng)運營狀態(tài)參數(shù)監(jiān)測和告警;可以對數(shù)據(jù)庫磁盤IO參數(shù)如讀取數(shù)、緩沖區(qū)讀取數(shù)、寫入數(shù)、緩沖區(qū)寫入數(shù)等數(shù)據(jù)進行監(jiān)測;可以對數(shù)據(jù)庫內(nèi)存使用率、數(shù)據(jù)庫容量、交易量、數(shù)據(jù)庫連接數(shù)、進程狀態(tài)、數(shù)據(jù)庫資源使用率等信息進行監(jiān)測;我司綜合管理平臺可以對數(shù)據(jù)庫表空間(空閑率)進行容量規(guī)劃,并可以對表空間使用狀況進行定期分析和預警??梢越鉀Q數(shù)據(jù)庫中各數(shù)據(jù)表記錄數(shù)、鎖模式、索引、Extents、總頁數(shù)、使用頁數(shù)等性能指標進行監(jiān)測??梢詫?shù)據(jù)庫交易日記進行監(jiān)視。由于生產(chǎn)環(huán)境使用是IBMDB2數(shù)據(jù)庫,現(xiàn)以DB2為例簡介監(jiān)控內(nèi)容DB2高可用性劫難恢復(HADR)狀態(tài)監(jiān)控和告警數(shù)據(jù)庫狀態(tài):監(jiān)聽器與否工作,數(shù)據(jù)庫與否工作;數(shù)據(jù)庫基本配備信息:數(shù)據(jù)庫名、版本、32/64位、并行狀態(tài)、歸檔模式、歸檔目錄,基本配備等。數(shù)據(jù)庫進程監(jiān)測信息:進程占用CPU時間、內(nèi)存大小、數(shù)據(jù)庫進程總數(shù);數(shù)據(jù)庫自身告警信息:獲取數(shù)據(jù)庫告警信息并告警;數(shù)據(jù)庫SGA監(jiān)測信息:高速緩沖區(qū)大小、重做日記緩沖區(qū)大小、共享池大小、數(shù)據(jù)字典緩存大小、共享庫緩存大小、SQL緩存大??;數(shù)據(jù)庫SGA性能監(jiān)測:高速緩沖區(qū)命中率、共享庫緩存命中率、共享數(shù)據(jù)字典緩存命中率、磁盤排序/內(nèi)存排序比率;實時SQL監(jiān)測:規(guī)定可以捕獲瞬時或一段時間內(nèi)(例如五分鐘內(nèi))執(zhí)行SQL語句,使管理員可以有效地獲取關(guān)于正在執(zhí)行事務詳細信息;前十條性能最差SQL語句等。數(shù)據(jù)庫表空間運營監(jiān)測:制定表空間使用空間大小,表空間使用率等、表空間碎片F(xiàn)SFI比率、讀/寫表空間平均時間;數(shù)據(jù)庫表空間配備信息:表空間名稱、初始大小、Next擴展值大小、擴展次數(shù);數(shù)據(jù)庫文獻性能:數(shù)據(jù)文獻名、數(shù)據(jù)文獻大小、狀態(tài)、讀寫次數(shù)、讀寫時間;數(shù)據(jù)庫回滾段監(jiān)測:回滾段名、回退段當前大小、命中率(獲得次數(shù)和等待次數(shù)比率),壓縮次數(shù);數(shù)據(jù)庫會話信息監(jiān)測:會話ID、顧客名、占用CPU時間、內(nèi)存排序次數(shù)、掃描表次數(shù)、讀寫次數(shù)、提交次數(shù)、所占用游標數(shù)、緩沖區(qū)命中率、已連接顧客數(shù)、空閑連接數(shù);數(shù)據(jù)庫會話安全監(jiān)測:判斷與否有未經(jīng)授權(quán)IP地址、顧客、時間段、使用特殊工具訪問數(shù)據(jù)庫行為;數(shù)據(jù)庫資源鎖監(jiān)測:監(jiān)測數(shù)據(jù)庫資源鎖狀況,對超過鎖定期間、鎖過濾條件資源鎖生成相應告警。對參數(shù)和性能管理,我司同步都支持實時運營數(shù)據(jù)流轉(zhuǎn)圖和詳細數(shù)據(jù)表查詢功能,同步支持對查詢數(shù)據(jù)進行歷史記錄分析和告警管理。中間件管理實現(xiàn)對不同種類中間件信息實現(xiàn)全面監(jiān)控,并為顧客提供直觀數(shù)據(jù)報表,以便掌握中間件運營狀態(tài)。支持與業(yè)務管理聯(lián)動??梢躁P(guān)聯(lián)告警系統(tǒng),對中間件核心指標異常狀態(tài)進行告警,讓顧客可以及時懂得并進行解決。我司綜合管理平臺支持對慣用中間件系統(tǒng)進行監(jiān)控和管理,如:WebLogic、MQ、Websphere,分述如下:1、WebLogic監(jiān)控對weblogic支持但不限于如下管理指標:監(jiān)控描述監(jiān)控描述WebLogic數(shù)據(jù)庫連接池WebLogicWEB應用監(jiān)測指標名稱當前激活會話數(shù)服務器名稱最大會話數(shù)當前容量會話總數(shù)活動連接數(shù)WebLogicEJB監(jiān)測指標活動連接比名稱等待連接數(shù)類型最大可用數(shù)激活次數(shù)泄露連接數(shù)鈍化次數(shù)最大等待時間緩存ejb個數(shù)連接池最大容量WeblogicJTA事務ejb池名稱JTA事務總回滾比例ejb池類型資源錯誤回滾比例使用ejb個數(shù)應用錯誤回滾比例空閑ejb個數(shù)系統(tǒng)錯誤回滾比例超時ejb個數(shù)WebLogicJVM監(jiān)控等待ejb個數(shù)當前虛擬機運營時空閑堆棧ejb事務名稱當前虛擬機運營時堆棧大小ejb事務類型堆棧運用率提交事務總數(shù)WebLogicServlet監(jiān)測回滾得事務總數(shù)名稱超時得事務總數(shù)平均執(zhí)行時間Weblogic運營隊列信息最大執(zhí)行時間對象名稱執(zhí)行次數(shù)當前空閑執(zhí)線程計數(shù)WebLogic基本配備信息隊列中最長等待時間服務器名稱服務祈求總數(shù)(吞吐量)服務器運營Weblogic版本隊列中檔待祈求數(shù)(隊列長度)服務器監(jiān)聽端口服務器運營狀態(tài)對參數(shù)和性能管理,我司同步都支持實時運營數(shù)據(jù)流轉(zhuǎn)圖和詳細數(shù)據(jù)表查詢功能,同步支持對查詢數(shù)據(jù)進行歷史記錄分析和告警管理。2、Websphere監(jiān)控對websphere支持但不限于如下管理指標:接口變更JVMWebSphereJVM信息事務WebShpher事務信息JDBCWebSphereJDBC連接池線程池WebSphere線程池信息系統(tǒng)信息WebSphere系統(tǒng)信息WebWebsphereWeb信息ServletWebShpherServlet信息對參數(shù)和性能管理,我司同步都支持實時運營數(shù)據(jù)流轉(zhuǎn)圖和詳細數(shù)據(jù)表查詢功能,同步支持對查詢數(shù)據(jù)進行歷史記錄分析和告警管理。3、MQ監(jiān)控MQ_BaseinfoMQ隊列管理器基本信息MQ_QueuesMQ隊列列表、名稱MQ_QueueStatMQ隊列狀態(tài)、深度、IPPROCS、OPPROCS、UNCOMMQ_ChannelsMQ通道列表、名稱、INDOUBT、SUBSTATE、LASTSEQNO、CURSEQNO、MCASTATMQ_ChstatusMQ通道狀態(tài)、本地隊列及通道(涉及集群通道)、死信隊列滿對MQ支持但不限于如下管理指標:對參數(shù)和性能管理,我司同步都支持實時運營數(shù)據(jù)流轉(zhuǎn)圖和詳細數(shù)據(jù)表查詢功能,同步支持對查詢數(shù)據(jù)進行歷史記錄分析和告警管理。應用管理應用仿真式監(jiān)控方式,“一語中”告訴客戶行還是不行??梢詫崟r管理和監(jiān)視這些應用配備和連接等信息,并可以通過數(shù)據(jù)表、圖例等方式實時進行呈現(xiàn),真實反映這些應用運營狀況。統(tǒng)提供各種基本信息服務如FTP服務、POP3服務、SMTP服務、TCP端口、流媒體服務以及DNS、DHCP、目錄服務等監(jiān)視,可以對這些服務有效性、服務狀態(tài)等實行集中、實時監(jiān)視。關(guān)聯(lián)告警系統(tǒng),及時告訴顧客什么應用浮現(xiàn)了問題,協(xié)助顧客及時解決。存儲管理存儲管理優(yōu)勢和亮點全面管理FC-SAN異構(gòu)管理,支持多廠商全面支持FC各類型產(chǎn)品可視化動態(tài)呈現(xiàn)拓撲圖方式顯示網(wǎng)絡,明確清晰管理到位,支持盤陣組件監(jiān)管積極式故障管理高頻監(jiān)控設備狀態(tài)積極告知,故障及時解決可落地管理實踐組件生命周期管理,到期積極提示運維信息明確,提高故障解決便捷性布置方式存儲環(huán)境監(jiān)控規(guī)定:FC互換機、磁盤陣列接入IP網(wǎng)絡,且組件服務器IP可達;安裝有HBA卡主機,必要安裝Provider,并對外開放有關(guān)SMI-S合同接口;IP網(wǎng)絡中需要假設一臺代理機,用于監(jiān)管和配備磁盤陣列,此機上需要安裝有盤陣provider,同廠商provider普通能監(jiān)控4~6個盤陣,因此當顧客環(huán)境中同一產(chǎn)品provider超過4個,也許需要布置各種代理機;組件服務器用于安裝存儲、Vmware管理系統(tǒng),支持虛擬機方式;可與我司共用一種數(shù)據(jù)庫,在監(jiān)控量適當狀況下,數(shù)據(jù)庫服務器可與我司安裝在一臺物理機上。故障告警管理故障管理是事前管理有效手段之一,故障管理能對來自網(wǎng)絡設備、主機、數(shù)據(jù)庫、存儲系統(tǒng)、網(wǎng)管系統(tǒng)自身以及其他硬、軟件系統(tǒng)等所產(chǎn)生事件進行歸類。顧客可以依照自定義級別條件來劃分事件級別,還可以將事件歸類到詳細事件組中,并且可以依照定義行為執(zhí)行條件來執(zhí)行某事件產(chǎn)生時所相應動作(例如在客戶端發(fā)出報警聲音、自動發(fā)送E-ma告知負責人等)。故障管理功能涉及:網(wǎng)絡告警、服務告警、環(huán)境告警、基線數(shù)據(jù)管理、告警日記查詢、負載設立和ARP干擾功能。故障管理優(yōu)勢和亮點支持聯(lián)動告警,提高顧客對于故障響應速度。支持符合告警,為客戶提供了“智能化”運維監(jiān)控平臺,提高運維效率,可以依照客戶關(guān)注給出不同告警設立方案。提供告警事件壓縮、事件組合和抑制、對外接、送功能。針對網(wǎng)絡、主機、流量、各類系統(tǒng)軟件、業(yè)務系統(tǒng)各類KPI指標均可提供告警功能?!岸ㄆ隗w檢”+“有疾病預兆時全面檢查”啟發(fā)式告警方式。例如說,對于一種核心業(yè)務,事先設定好一種核心監(jiān)控點(告警觸發(fā)點),平時只監(jiān)控這個點,當這個點越過閾值時,系統(tǒng)會全面采集該核心監(jiān)控點有關(guān)所有基本信息(涉及網(wǎng)絡、服務器、數(shù)據(jù)庫、中間件、機房環(huán)境信息等),減輕了數(shù)據(jù)采樣對網(wǎng)絡壓力,減少了輪詢在業(yè)務高峰時段對業(yè)務自身影響,所有設立可由客戶設定,避免了“黑盒子”效應。對告警劃分層次之后有助于效率提高,這樣一來客戶就不必為繁多無關(guān)告警所苦惱了。支持基線告警。支持自定義時間段,以便顧客依照實際狀況發(fā)出告警。短信平臺強大,接口眾多。對非法IP地址進行ARP干擾,回絕黑客、網(wǎng)絡掃描等異常行為,為穩(wěn)定網(wǎng)絡運營保駕護航。我司故障管理詳細簡介事前運維管理我司注重運營維護管理,偏向于事前管理而非事后管理,因而特別強化了基于事件故障管理與故障預警管理。設備失效固然是嚴重故障,但我司產(chǎn)品設計并非讓顧客被動地等待“出事”,絕大多數(shù)告警項設計是為了建立“預警”機制。例如,對一條千兆網(wǎng)絡連接300M流量不算大事件,但是如果考慮到尋常流量普通不會超過100全面告警監(jiān)視我司支持從網(wǎng)絡第2層到第7層實行全面故障告警管理,涉及網(wǎng)絡類告警、服務類告警、環(huán)境類告警和其她類告警。獨立事件告警輸出管理短消息管理中心:支持多通道管理,默認設立通道失效可自動尋找其她備選可用通道、告警隊列管理;短消息接口管理:合成語音告警管理:支持在告警發(fā)生時刻,依照告警內(nèi)容不同,合成語音送到IE前端;E_ma告警管理:支持多服務器管理,A通道失效可自動尋找其她可用通道,不同告警可以選取不同Ma服務器;Ma服務器管理:編號;E-Ma服務器屬性;及時/定期測試(對象、時間、內(nèi)容)。消息框告警管理;設備端口開關(guān)操作;事件告警觸發(fā)管理告警規(guī)則管理系統(tǒng)提供如下告警信息:編號;告警名稱;告警描述;狀態(tài)(執(zhí)行/未執(zhí)行/屏蔽態(tài))緊急度、影響度;本告警與否容許被高檔告警遮蔽。我司告警屏蔽為高檔智能判斷提供了基本,支持如下狀況:例如:某設備SNMP訪問失效自動屏蔽該設備內(nèi)部各SNMP檢測點輪詢。我司告警屏蔽提供高檔層層進一步故障發(fā)現(xiàn)模式。出于減少被檢測對象額外管理流量壓力,避免影響設備與服務正常性能,普通狀況下僅對幾種重要指標參數(shù)進行例行檢測,這幾種指標參數(shù)雖可以反映問題征兆,但因信息太少仍局限性以定位問題根源,借助我司告警屏蔽功能咱們可以預置各種檢測點,平時不工作(屏蔽),一旦重要指標參數(shù)異常則自動撤除屏蔽,開始進行進一步分析,以提高故障告警反映速度與精確性。觸發(fā)告警條件:單點告警:支持批量設立各種監(jiān)控點,任意一種超閥值觸發(fā)告警。類型、閥值相似(一組)視為各種單一告警點,逐個解決告警;復合告警:設立各種監(jiān)控點,所有監(jiān)控點超閥值才觸發(fā)告警。類型、閥值可以不同,平時只看一種最易復用數(shù)據(jù)項,觸發(fā)時再看其她復用項。復合告警在管理實踐中意義很大,帶有簡樸人工智能特性。在管理實踐中咱們懂得故障表象往往復雜多樣,同一故障會在不同角度有不同體現(xiàn),故不能簡樸地依照某一檢測點數(shù)據(jù)異常容易地下判斷,這對于某些重要事件判斷尤為重要,咱們必要考察若干點之后再判斷才較為精確。例如,顧客需要建立某主干線路故障診斷,但不能僅憑該線路所在端口與否Down來簡樸鑒別,這樣誤報率很高,因素在于某些類型線路(如“幀中繼”)即便斷路,設備端口也不會Down,此外設備自身如突然Snmp合同訪問失效又如何解決?合理復合判斷可以是“線路端口Down+經(jīng)該線路可訪問對端設備訪問失效+……”。特定Trap信息特定Syslog信息所有條件輪巡間隔相似,設備類最小間隔為10秒,服務類最小間隔為120秒,每到輪巡時刻,對所有已選觸發(fā)條件逐個檢查,任何一種符合就計為發(fā)現(xiàn)一次故障。相似告警點持續(xù)N次觸發(fā)才有效,輪巡間隔M秒一次,此處次數(shù)和頻率顧客可自行設立。告警撤除管理單點告警:逐個解決告警點恢復;復合告警:所有超閥值恢復或任意一種恢復撤除告警;特定trap(定期積極去Trap庫中查檢);特定Syslog(定期積極去Syslog庫中查檢)。相似告警點持續(xù)P次觸發(fā)撤除才有效,輪巡間隔Q秒一次。觸發(fā)執(zhí)行我司在告警觸發(fā)時刻可以引起一連串動作:關(guān)聯(lián)觸發(fā)開始循環(huán)記錄告警點(10分鐘);以傳播參數(shù)方式啟動數(shù)據(jù)流分析記錄(定期長);啟動有關(guān)PCagent進行進程記錄;第三方程序。關(guān)聯(lián)抑制(兩者可以同步選)手工屏蔽/取消屏蔽指定“緊急度/影響度”告警(各種);手工屏蔽/取消屏蔽指定“編號”告警(各種);容許自動屏蔽(可查看內(nèi)容,可關(guān)閉此功能,但不能更改,缺省為“開”,如果與手工指定矛盾,則以手工指定為準);告警輸出(每一項可選目地)時段選取(在不同步段執(zhí)行不同告警輸出)如下輸出每一種信息輸出解決方式都可填寫,每種方式支持幾種不同參數(shù)填寫,每次完整填寫均有編號,供上述告警輸出選取靈活選用、組合。WAV輸出(缺省所有IE前臺,可以指定登陸顧客名/組)(告警內(nèi)容);短消息(無缺省,可以指定網(wǎng)關(guān)編號、對方手機、登陸顧客名/組(告警內(nèi)容);消息框(缺省所有前臺,可以指定登陸顧客名、組)(告警內(nèi)容);E-ma告警(無缺省,可以指定Ma服務器編號以及對方地址)(告警內(nèi)容)。基線告警對于一種成熟業(yè)務網(wǎng)絡來說,網(wǎng)絡上在不同步間段運營業(yè)務,網(wǎng)絡流量和負載也會不同。例如,網(wǎng)絡主核心互換機在早上9點到10點這段時間經(jīng)常是以60%CPU負載工作,而在下班后空閑時間,該互換機CPU負載不會超過20%。老式固定閥值告警普通是設定CPU負載在80%時候告警,但是這樣設立不利于對閑時設備進行預警。咱們通過長期對顧客網(wǎng)絡環(huán)境和應用分析發(fā)現(xiàn),顧客設備負載不是一成不變,普通是呈一條曲線進行波動。我司基線告警就是依照這一現(xiàn)象,從長時間歷史記錄中自動生成設備運營基線表,這張基線表是該設備運營趨勢和告警偏離基準線。這張基線表充分收集該臺設備工作狀態(tài)信息,可以生成每日、每周、每月運營基線?;€告警則是依照這條動態(tài)基線數(shù)據(jù)點,按照相相應時間形成一種動態(tài)告警閥值。普通基線告警閥值都采用偏離度閥值,即在這個基準線上下N%偏離度內(nèi)都是正常,超過這個偏離度進行告警,此處偏離度顧客可自行設立?;€數(shù)據(jù)管理功能基線數(shù)據(jù)管理可以依照顧客網(wǎng)絡中設備運營狀態(tài)設立相應基線數(shù)據(jù),并對相應基線數(shù)據(jù)設立相應告警信息,通過基線數(shù)據(jù)管理可覺得顧客提供更加完善告警解決功能。告警日記查詢功能告警日記查詢可以依照不同查詢條件,按照時間先后順序?qū)⒎蠗l件告警信息在日記中列出。并可以對相應告警信息進行記錄,為顧客提供更加直接告警信息管理和查詢。如:下圖中數(shù)據(jù)表格中浮現(xiàn)了合計次數(shù)和查詢歷史告警記錄兩列信息。輔助查詢功能輔助設立涉及了對告警有關(guān)設立,如告警郵件告警方式設立。ARP干擾設立功能ARP干擾重要可以對顧客網(wǎng)絡中監(jiān)控IP地址、設備、IP—MAC、MAC—PORT合法性進行管控,并可以有條件使用ARP干擾方式進行控制解決。重要可以實現(xiàn)功能涉及IP地址分布查詢、合法地址管理、共享地址管理和ARP干擾等。其她告警我司運維管理平臺還可以進行必不可少網(wǎng)絡類告警,服務類告警,環(huán)境類告警,告警種類上百種,可以讓顧客隨心設立想要告警類別,讓網(wǎng)管運維更安心更省心,為網(wǎng)管人員排憂解難。下圖為網(wǎng)絡告警頁面下圖為服務告警頁面下圖為溫濕度告警頁面下圖為UPS告警頁面報表管理我司系統(tǒng)提供各種運營分析和性能報告,監(jiān)控管理人員能依照這些報告精確評估整個交通管理環(huán)境運營狀況,及早發(fā)現(xiàn)故障隱患和評估威脅。系統(tǒng)報表管理功能涉及定制報表、生成報表、設立/修改報表格式、打印/輸出報表、取消報表生成等功能。系統(tǒng)依照顧客指定報表內(nèi)容和生成報表時間,生成相應報表。報表管理優(yōu)勢和亮點支持對比報告、趨勢報告、可用性報告、TopN報告、故障分析報告等各種專家級報告分類??梢詫崿F(xiàn)上下級管理之間報表定制和上傳,自動發(fā)布到上級平臺。自動生成運營率記錄報表。支持報表數(shù)據(jù)以execl格式導出,提供顧客二次解決。支持全域報表,不依賴下級平臺系統(tǒng)報表記錄、生成辦法,由上級平臺系統(tǒng)定義核心參數(shù)級別,自動參數(shù)收集,自動報表生成。依照顧客實際需要,可以手工或自動生成客戶定制化報表??捎X得顧客此后擴容提供量化根據(jù)。報表內(nèi)容闡明網(wǎng)絡運營記錄:網(wǎng)絡設備分類記錄、網(wǎng)絡拓撲連接記錄、網(wǎng)絡歷史流量記錄、網(wǎng)絡連通率記錄、網(wǎng)絡設備CPU/內(nèi)存運用率記錄等;服務器運營記錄:服務器CPU/內(nèi)存使用記錄、磁盤使用量記錄、磁盤性能記錄、進程占用資源記錄;數(shù)據(jù)庫運營記錄:數(shù)據(jù)庫CPU/內(nèi)存占用記錄、數(shù)據(jù)庫SGA性能記錄、數(shù)據(jù)庫表空間記錄、數(shù)據(jù)庫回退段記錄等;中間件運營記錄:JVM性能記錄、JDBC連接池記錄、JTA性能記錄,WEB應用性能記錄、EJB性能記錄等;資產(chǎn)記錄:依照各種條件查詢資產(chǎn)列表,各部門/人負責資產(chǎn)記錄;流量分析記錄:提供節(jié)點排名、合同分布報表、節(jié)點流向分析報表。報表呈現(xiàn)類別闡明運營天報表:以天為單位查看所有被管資源運營狀況;運營月報表:以月為單位查看所有被管資源運營狀況;運營年報表:以年為單位,提供日歷導向方式匯總每天被管系統(tǒng)運營狀況;運營狀態(tài)報表:以直觀方式查看到某個被管系統(tǒng)某個時間段運營狀況,并自動計算出故障時間段;趨勢分析報表:能查看某個被管系統(tǒng)一段時間內(nèi)某些性能參數(shù)變化趨勢,提供時間曲線圖和表格呈現(xiàn)方式;比較分析報表:對某些被管系統(tǒng)運營狀況進行記錄和比較,形成類似TopN排名分析報表,提供比較柱狀圖和表格呈現(xiàn)方式;下圖是時序圖和直方圖:綜合分析報表:提供綜合網(wǎng)絡和應用運營狀態(tài)記錄報表,記錄成果以分鐘為單位顯示故障時長;設備負載分析報表;線路端口流量分析報表;告警事件記錄報表;設備運營率記錄報表;服務運營率記錄報表。報表提供方式提供報表中心,分組保存報表查詢模板,以便查詢記錄;報表標題、記錄時間等可以自定義后,保存為慣用報表,以便后來報表查看;對于顧客關(guān)懷報表,可以定期以郵件方式發(fā)送到指定郵箱;系統(tǒng)提供應顧客定制報表功能,即顧客可以定義報表內(nèi)容和格式;系統(tǒng)可以依照顧客規(guī)定設立/修改報表格式,涉及列表高度,列表寬度,顯示項,隱藏項等。記錄報表數(shù)據(jù)可以保存為HTML、Excel格式,可以依照顧客規(guī)定將報表以指定格式打印出來或輸出到其她外圍存儲設備上。下圖為線路(端口)流量報表達例下圖為設備和主機運營率記錄和設備負載TOPN報表機房管理我司系統(tǒng)可以將整個機房機柜、機柜中設備、設備運營狀態(tài)等真實地呈當前機房拓撲上,管理人員可以通過該拓撲,查看設備信息、設備狀態(tài)等。可對市場上具備原則SNMP主流UPS進行管理通過提供溫濕度探頭可對機房、機柜溫濕度進行監(jiān)控機房拓撲背景可更換且背景標注可自定義,字體大小、顏色、位置可更改;機柜中設備圖標也可進行更改。提供增長、刪除、編輯機房拓撲以及機柜功能。機房中機柜顏色可隨機柜中設備告警級別變化。機柜中每臺設備提供批示燈功能,顏色可依照設備負載變化,當有告警觸發(fā)批示燈提供閃爍功能進行提示。可在機柜中通過單擊、雙擊方式直接查看設備負載、主機系統(tǒng)運營狀況、設備真實面板圖。3D背景和圖例,真實展示機房環(huán)境布局。與物理拓撲圖之間進行關(guān)聯(lián)定位操作。統(tǒng)一監(jiān)控平臺我司綜合管理平臺通過統(tǒng)一監(jiān)控平臺豐富、直觀呈現(xiàn)界面,呈現(xiàn)主機系統(tǒng)管理平臺整體狀況;通過不同視角視圖,協(xié)助運維人員精確評估運營性能,及早發(fā)現(xiàn)故障隱患。服務拓撲呈現(xiàn)功能闡明我司綜合管理平臺提供拓撲信息涉及網(wǎng)絡拓撲,詳細闡明如下:我司綜合管理平臺支持手動添加設備及設備之間連線功能,拓撲圖上信息完全可以支持手工編輯方式生成,提供了豐富拓撲編輯工具,可以把網(wǎng)絡拓撲和業(yè)務拓撲分別呈現(xiàn)??梢灾庇^清晰地顯示相應管理層次網(wǎng)絡所有骨干網(wǎng)絡設備、子網(wǎng)和互聯(lián)關(guān)系;可以自定義拓撲背景圖片,每個拓撲節(jié)點都可以用不同圖片進行呈現(xiàn);拓撲圖定期刷新,可以實時反映各節(jié)點當前運營狀況;拓撲圖使用不同粗細、顏色線條表達不同帶寬和鏈路流量狀況;拓撲可以浮動顯示網(wǎng)絡鏈路流量狀況、設備CPU/內(nèi)存性能和工作狀態(tài);運營呈現(xiàn)功能闡明整個平臺系統(tǒng)運營呈現(xiàn)某些提供了所有被監(jiān)測系統(tǒng)當前運營狀況呈現(xiàn),并且提供直觀、以節(jié)點和業(yè)務系統(tǒng)為導向?qū)舆M式呈現(xiàn)方式。運營呈現(xiàn)功能闡明如下:從拓撲視圖進入,點擊相應設備或者系統(tǒng)軟件;顯示各節(jié)點當前總體運營狀況,按節(jié)點類型不同呈現(xiàn)不同組織界面,涉及節(jié)點有關(guān)各項性能指標;可以單獨彈出每個性能指標顯示表格,可設定期間段查詢各種性能趨勢狀態(tài)圖表。我司綜合管理平臺依照不同類型節(jié)點有如下幾大類界面組織:網(wǎng)絡設備:需要顯示設備基本信息、當前CPU使用率、當前內(nèi)存使用率和當前各端口工作狀態(tài)、流量狀況等;主機設備:需要顯示設備基本信息、當前CPU使用率、當前內(nèi)存使用率、各磁盤使用率、磁盤IO、當邁進程狀況等,如下圖:此外,我司綜合管理平臺還支持以樹形圖方式對主機系統(tǒng)進行呈現(xiàn),如下圖所示:數(shù)據(jù)庫(以Oracle為例):需要顯示Oracle基本信息、各表空間列表和使用狀況、數(shù)據(jù)文獻使用狀況、當前Session列表和狀況、SGA配備和性能狀況、各回滾段狀況等,如下圖:中間件:需要顯示中間件基本信息、JVM使用狀況、JDBC池使用狀況、JTA使用狀況、各WEB應用狀況、Servlet和EJB運營狀況、線程池使用狀況等告警呈現(xiàn)功能闡明我司綜合管理平臺提供集中告警呈現(xiàn)功能,擁有集中統(tǒng)一呈現(xiàn)方式,涉及網(wǎng)絡告警、系統(tǒng)告警在內(nèi)所有告警信息,都提供查詢記錄功能。告警呈現(xiàn)功能涉及如下幾種內(nèi)容:告警以導航樹方式集中呈現(xiàn),通過樹狀導航方式,可以迅速查閱,選取各種類型告警,導航方式支持以節(jié)點分類導航和告警類型導航;告警列表和告警詳細信息在同一視圖里呈現(xiàn),從而可以以便查看各告警詳細信息;告警列表包括了告警級別、告警源名稱、所屬單位、告警時間、告警摘要等;告警詳細信息、解決狀態(tài)和參照解決辦法以頁框方式在同一界面里顯示,便于切換查看;提供告警查詢功能,可以依照各種復雜條件進行查詢;告警列表支持Excel導出功能;提供各種告警記錄報告,涉及告警頻率、告警比較、告警分布等報告。系統(tǒng)管理系統(tǒng)管理用于管理和維護系統(tǒng)顧客信息。系統(tǒng)容許您添加新顧客、建立顧客組、對不同顧客賦予不同權(quán)限等。系統(tǒng)管理涉及:顧客管理、顧客操作審計、當前在線顧客、當前顧客編輯、平臺管理模塊。系統(tǒng)管理優(yōu)勢和亮點針對不同網(wǎng)管員角色,指定各自管理設備,每個管理員都可以有不同設備擺放方式。對于每個顧客操作都會有審計日記,以便查詢。對于系統(tǒng)登陸顧客口令強弱提供自動檢查,弱口令將不能使用。支持動態(tài)口令,口令都采用加密方式存儲,保證系統(tǒng)顧客安全性。顧客管理功能顧客管理重要是對角色、顧客組和顧客賬戶管理。對于不同顧客可以授予不同權(quán)限,系統(tǒng)通過角色不同可以一次設立不同顧客具備相似權(quán)限級別。顧客操作審計功能在這里咱們可以對系統(tǒng)所有顧客操作過程進行審計當前在線顧客功能該功能會列出當前所有在線顧客信息,涉及顧客名稱、顧客組、角色、登錄時間、IP地址等信息。當前顧客編輯功能該功能會列出當前顧客名、電話、手機、電子郵件、部門、職位、備注,并可進行修改操作,也可對當前顧客進行口令更改。網(wǎng)管郵件發(fā)送帳號功能這里設立是為告警設立中郵件告警方式做準備。交通運維管理功能服務臺服務臺在交通管理服務管理中起著舉足輕重作用,是信息中心和顧客溝通重要橋梁,事件管理故障重要來源,系統(tǒng)單獨為服務臺角色創(chuàng)立了相應服務臺模塊讓服務臺可以更加以便解決尋常工作事項。事件管理事件管理相應交通管理流程中事件管理流程,重要是用來管理在服務運營過程中,對大量突發(fā)事件和服務祈求響應和解決,目是盡量迅速恢復交通管理基本架構(gòu)正常運營,響應客戶祈求,避免業(yè)務中斷,使事故對業(yè)務運營影響降至最低,以保證交通管理資源可用性水平與保持交通管理運維最佳服務水平。多渠道創(chuàng)立祈求:支持從電話、郵件、網(wǎng)絡、短信、PDA創(chuàng)立祈求;支持與監(jiān)控系統(tǒng)集成,自動產(chǎn)生工單。內(nèi)置故障模板,協(xié)助服務臺迅速創(chuàng)立工單。圖形化調(diào)度,按“優(yōu)先級=緊急度*影響度”模型自動生成調(diào)度隊列。各種派單方略,支持人工派單與系統(tǒng)自動派單,可設立各種派單規(guī)則,迅速有效派單。事件關(guān)閉:可設立特定人員(服務臺)確認后統(tǒng)一進行關(guān)閉,或設立關(guān)閉方略自動進行關(guān)閉。自助服務臺:最后顧客可通過自助服務臺提交祈求、跟蹤祈求,并可對祈求服務質(zhì)量進行評價;可查詢知識庫自行解決問題。問題管理 問題管理相應交通管理流程中問題管理流程,針對交通管理基本架構(gòu)中薄弱環(huán)節(jié),分析導致故障因素,提出暫時解決辦法和主線解決方案,防止同類問題再次發(fā)生,以提高服務水平,減少故障率。問題辨認,采用TopN分析法以及層層鉆取功能,定位問題;支持從事件管理等流程創(chuàng)立問題單。問題分析,通過魚骨圖分析法,從人、機、料、法、環(huán)5個維度,找出問題主線因素。已知錯誤,辨認問題后,可定位為已知錯誤,并提供暫時解決辦法給有關(guān)事件;找到主線解決方案之后,可發(fā)起變更流程。變更管理 變更管理相應交通管理流程中變更管理流程,針對交通管理基本架構(gòu)變更進行評估和影響分析,有效控制變更,減少或者消除變更對業(yè)務導致影響和風險。提交RFC。變更日歷,通過圖形化方式展示所有正在進行中變更,可協(xié)助顧客跟蹤變更進度和執(zhí)行狀況。變更審核,可按原則變更、緊急變更等不同變更類型,走不同變更審核流程(可跨各種部門,進行多級審批等),來對變更也許導致影響、成本、存在風險以及可行性等進行評估和分析。變更實行后評估變更效果(變更實行與否成
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息處理項目實踐題及答案
- 橋下易燃物火災應急預案(3篇)
- 2025年信息處理技術(shù)員備考指南試題及答案
- 機場小型火災應急預案(3篇)
- 班級活動火災應急預案(3篇)
- 2025年游戲開發(fā)程序員考試試題及答案
- 涼庫發(fā)生火災應急預案(3篇)
- 2025年計算機VB考試課程大綱試題及答案
- 2025年軟考設計師學習資源試題及答案
- 2025年軟考網(wǎng)絡管理員新法試題及答案
- 2025年護士考試心理健康試題及答案
- 旅游法規(guī)教程試題及答案
- 工程測量學概述
- 農(nóng)村小學教師信息技術(shù)應用能力提升策略研究:數(shù)字化教學資源與實踐應用
- 2025-2030中國學生校服行業(yè)市場發(fā)展分析及前景趨勢與投資研究報告
- DB11 T 411.8-2007 體育場館等級劃分及評定 第8部分:籃球館
- 滴滴管理制度
- 2025年全國中小學生百科知識競賽題庫及答案(480題)
- 貨車掛靠協(xié)議合同
- 規(guī)?;B(yǎng)豬場非洲豬瘟生物安全防控策略研究
- 2025年度專業(yè)技術(shù)人員繼續(xù)教育公需科目考試題(附答案)
評論
0/150
提交評論