IT綜合監(jiān)控管理解決方案_第1頁
IT綜合監(jiān)控管理解決方案_第2頁
IT綜合監(jiān)控管理解決方案_第3頁
IT綜合監(jiān)控管理解決方案_第4頁
IT綜合監(jiān)控管理解決方案_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、面向業(yè)務(wù)之IT綜合監(jiān)控管理解決方案廣州藍(lán)科科技股份有限企業(yè)2012年10月目 錄1IT運維面臨挑戰(zhàn)12需求分析13解決方案33.1總體架構(gòu)33.2部署架構(gòu)53.3系統(tǒng)功能63.3.1資源監(jiān)控63.3.2服務(wù)監(jiān)控73.3.3日志監(jiān)控73.3.4用戶體驗監(jiān)控73.3.5事件管理73.3.6服務(wù)影響管理73.3.7知識庫73.3.8監(jiān)控視圖83.3.9統(tǒng)計分析143.3.10系統(tǒng)管理173.4系統(tǒng)特點173.4.1面向業(yè)務(wù)與集中監(jiān)控173.4.2高開放性與易集成性173.4.3廣適應(yīng)的數(shù)據(jù)采集技術(shù)183.4.4復(fù)雜靈活的告警條件設(shè)置183.4.5圖形化的業(yè)務(wù)服務(wù)建模工具183.4.6運維知識自動關(guān)聯(lián)

2、183.4.7豐富多樣的告警通知方式183.4.8模板化的監(jiān)控報表管理183.4.9可視化的監(jiān)控結(jié)果呈現(xiàn)193.5關(guān)鍵技術(shù)193.5.1CCE分析技術(shù)193.5.2用戶體驗偵測技術(shù)204方案價值21圖表清單圖表 1系統(tǒng)總體結(jié)構(gòu)5圖表 2系統(tǒng)部署架構(gòu)6圖表 3 Linux主機可視化監(jiān)控圖8圖表 4 ORALCE數(shù)據(jù)庫可視化監(jiān)控圖9圖表 5 物理拓?fù)湟晥D10圖表 6 機柜視圖11圖表 7 綜合監(jiān)控視圖11圖表 8 全局概覽12圖表 9 服務(wù)視圖舉例14圖表 10 CCE分析引擎19圖表 11 用戶體驗監(jiān)控工作原理示意圖20ii1 IT運維面臨挑戰(zhàn)隨著企業(yè)信息化的普及,IT系統(tǒng)的運維管理面臨越來越多

3、的壓力和挑戰(zhàn),具體表現(xiàn)在如下方面:n n企業(yè)業(yè)務(wù)對IT系統(tǒng)依賴程度持續(xù)增強,對IT系統(tǒng)可用性要求也越來越高。目前企業(yè)生產(chǎn)、經(jīng)營和管理等各個環(huán)節(jié)都離不開IT系統(tǒng)的支持,信息化的價值日益得到廣泛認(rèn)同,信息化應(yīng)用越來越深入,任何可用或性能方面的IT故障都可能導(dǎo)致企業(yè)業(yè)務(wù)連續(xù)性受到影響,嚴(yán)重的甚至給企業(yè)帶來不可挽回經(jīng)濟損失和負(fù)面社會影響;n nIT系統(tǒng)架構(gòu)越來越復(fù)雜,故障診斷和恢復(fù)越來越困難。目前企業(yè)應(yīng)用系統(tǒng),其組成除了包括網(wǎng)絡(luò)、主機、存儲、負(fù)載均衡和機房等IT基礎(chǔ)設(shè)施外,還包括數(shù)據(jù)庫、中間件、WEB和外部接口等各種應(yīng)用,任何一項業(yè)務(wù)應(yīng)用都可能穿越多個資源層面,這給故障的診斷和恢復(fù)帶來了許多困難。n

4、nIT系統(tǒng)規(guī)模不斷擴大,IT運維人力資源凸顯不足。隨著企業(yè)IT系統(tǒng)的不斷建成和投入運行,IT資源數(shù)量急劇膨脹,系統(tǒng)使用終端不斷增多,故障和風(fēng)險點也在持續(xù)增加,如果不借助技術(shù)手段輔助運維,僅靠現(xiàn)有運維人力資源很難保障IT運維管理質(zhì)量。因此,如何應(yīng)對上述IT運維管理面臨的各種壓力和挑戰(zhàn),確保企業(yè)IT系統(tǒng)安全穩(wěn)定可靠地運行,保障企業(yè)業(yè)務(wù)連續(xù)性和業(yè)務(wù)服務(wù)水平,已成為企業(yè)信息管理部門當(dāng)前亟待考慮的問題。2 現(xiàn)狀和需求分析全球最具權(quán)威的IT研究與顧問咨詢公司高德納咨詢公司(Garter Group Inc) 將企業(yè)IT管理過程成熟度劃分為混亂、被動、主動、服務(wù)和價值等5個階段,IT管理方法論發(fā)展也經(jīng)歷了網(wǎng)

5、絡(luò)系統(tǒng)管理(NSM)、IT服務(wù)管理(ITSM)和業(yè)務(wù)服務(wù)管理(BSM)三個階段,具體如圖1所示。從圖中可以看出,只有實現(xiàn)IT與業(yè)務(wù)高度融合,根據(jù)企業(yè)業(yè)務(wù)戰(zhàn)略來設(shè)計和管理IT,才能實現(xiàn)IT價值最大化。圖表 1 IT管理過程成熟度模型和IT管理方法論發(fā)展三個階段目前,大部分企業(yè)IT管理還處在從被動階段向主動階段轉(zhuǎn)變之中,少部分企業(yè)已經(jīng)通過實施ITSM正在向服務(wù)階段邁進(jìn)。但相比整個企業(yè)業(yè)務(wù)的信息化水平,企業(yè)在IT運維管理方面的信息化還相對比較滯后, IT運維基本上還是停留在以人工巡檢為主的管理模式,基于各種主客觀的原因,人工巡檢不僅巡檢范圍有限而且實時性差,致使相當(dāng)多的隱患不能提前發(fā)現(xiàn)和消除,相當(dāng)多

6、的故障不能先于用戶知曉,導(dǎo)致IT運維工作長期處于被動應(yīng)對局面。另外,面對日益復(fù)雜的IT技術(shù)架構(gòu),一項簡單的業(yè)務(wù)應(yīng)用往往穿越多個IT資源層面,如果缺乏專業(yè)IT監(jiān)控管理工具,在接到用戶報告業(yè)務(wù)故障之后運維人員往往需要耗費大量時間在故障診斷環(huán)節(jié),導(dǎo)致故障恢復(fù)時間過長,影響了IT系統(tǒng)的可用性。IT運維管理信息化主要包括運維自動化和流程化等內(nèi)容,IT運維自動化是指將IT運維中大量日常的、重復(fù)性工作由過去手工執(zhí)行轉(zhuǎn)為計算機自動進(jìn)行,例如自動檢查磁盤剩余空間、自動檢查操作系統(tǒng)和應(yīng)用程序日志等。實現(xiàn)運維自動化不僅大大減輕了運維人員工作量,而且由于大大提高了巡檢頻率使很多故障隱患得到及時發(fā)現(xiàn)和消除,最大程度保證

7、了業(yè)務(wù)持續(xù)可用性。IT運維流程化主要通過一系列制度、流程、標(biāo)準(zhǔn),使每項運維工作(例如配置變更、故障處理)可以高質(zhì)量完成。結(jié)合企業(yè)IT運維現(xiàn)狀和實際情況,建議目前重點解決IT運維自動化,建設(shè)一個面向業(yè)務(wù)的IT綜合監(jiān)控管理系統(tǒng),實現(xiàn)對IT資源和業(yè)務(wù)的集中全面監(jiān)控,具體有如下目標(biāo):n 實現(xiàn)全面一體化監(jiān)控所謂全面監(jiān)控,是指將企業(yè)辦公、財務(wù)、人事、項目、銷售等業(yè)務(wù)系統(tǒng)所依賴的IT資源包括網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫、中間件、機房等作為監(jiān)控對象全面納入監(jiān)控管理。所謂一體化監(jiān)控,是指監(jiān)控內(nèi)容必須覆蓋IT系統(tǒng)在可用性、性能、安全、資源和其他異常事件方面監(jiān)控管理需求。n 實現(xiàn)面向業(yè)務(wù)的整體監(jiān)控IT是為企業(yè)業(yè)務(wù)服務(wù)的,保

8、持企業(yè)業(yè)務(wù)持續(xù)高可用性是IT運維部門的首要目的。傳統(tǒng)的以資源監(jiān)控為主的監(jiān)控產(chǎn)品,無法建立企業(yè)業(yè)務(wù)與IT資源之間的映射關(guān)系,實行的是一種單點監(jiān)控和分散監(jiān)控管理方式(如網(wǎng)絡(luò)處只管網(wǎng)絡(luò)的監(jiān)控、系統(tǒng)管理處只管數(shù)據(jù)庫和應(yīng)用的監(jiān)控),不能直觀整體地反映企業(yè)業(yè)務(wù)的健康狀況,常導(dǎo)致“四處救火”被動應(yīng)戰(zhàn)的工作局面。因此新的監(jiān)控平臺必須從業(yè)務(wù)需求出發(fā),使IT與業(yè)務(wù)關(guān)聯(lián)起來,實現(xiàn)按業(yè)務(wù)進(jìn)行整體監(jiān)控,建立基于角色的各種業(yè)務(wù)視圖,增強業(yè)務(wù)部門和IT部門溝通,以改變IT部門長期被動運維工作的局面。n 實現(xiàn)用戶體驗監(jiān)控和管理IT部門作為一個服務(wù)部門,IT運維管理的目標(biāo)之一就是要不斷提升用戶滿意度,這里的用戶既包括內(nèi)部用戶(

9、如使用IT系統(tǒng)的業(yè)務(wù)人員)也包括外部用戶(如訪問企業(yè)網(wǎng)站人員)。用戶體驗管理從最終用戶的角度為運維人員提供業(yè)務(wù)服務(wù)的可用性和健康狀況,使IT人員也能從用戶角度感受系統(tǒng),從而確保了用戶滿意度。n 實現(xiàn)服務(wù)主動模擬偵測有時候針對后臺IT資源的監(jiān)控并不能發(fā)現(xiàn)全部問題,例如用戶報告某個頁面不可用,但后臺服務(wù)器和數(shù)據(jù)庫都正常,因此實現(xiàn)服務(wù)主動模擬偵測更能直接發(fā)現(xiàn)業(yè)務(wù)系統(tǒng)存在的問題,確保監(jiān)控不留死角。n 支持故障提前預(yù)警一個好的監(jiān)控產(chǎn)品,其價值不在于故障發(fā)生后如何告警,而是在故障發(fā)生前如何能及時預(yù)警,使IT運維工作真正做到“防患于未然”。新的監(jiān)控平臺應(yīng)具備強大的故障隱患發(fā)現(xiàn)能力和預(yù)警能力,幫助運維人員在故

10、障發(fā)生之前消除隱患,真正做到主動運維。n 避免告警風(fēng)暴和誤報由于IT資源之間是存在關(guān)聯(lián)的,如果不具備事件之間關(guān)聯(lián)分析和告警屏蔽功能,就很容易引起告警風(fēng)暴。例如磁盤剩余空間不足時可能會導(dǎo)致數(shù)據(jù)庫掛起;核心交換機宕機后會導(dǎo)致許多服務(wù)不可用等等。另外對哪些波動性監(jiān)控指標(biāo),如果只是短時間超過告警閾值并不代表有問題,只有在持續(xù)一段時間內(nèi)都超過告警閾值時才需要告警。3 解決方案3.1 總體架構(gòu)根據(jù)企業(yè)需求分析,可選用SAMP AM(應(yīng)用管理)和SAMP UXM(用戶體驗管理)產(chǎn)品搭建一個面向業(yè)務(wù)的IT綜合監(jiān)控管理系統(tǒng),實現(xiàn)從IT資源到業(yè)務(wù)應(yīng)用的全面監(jiān)控,使IT運維人員從單一集中的界面直觀了解企業(yè)業(yè)務(wù)應(yīng)用與

11、其所依賴業(yè)務(wù)的健康狀況。系統(tǒng)總體結(jié)構(gòu)如下圖所示,分為集中監(jiān)控層、事件處理層、服務(wù)管理層和統(tǒng)一展現(xiàn)層。各層功能和目標(biāo)描述如下:n 集中監(jiān)控層集中監(jiān)控層主要解決各種隱患和問題的自動發(fā)現(xiàn),包括資源監(jiān)控、服務(wù)監(jiān)控和用戶體驗監(jiān)控等功能。資源監(jiān)控范圍涵蓋了網(wǎng)絡(luò)、服務(wù)器、存儲、數(shù)據(jù)庫、中間件等各種IT資源,能及時發(fā)現(xiàn)和識別各種問題隱患;服務(wù)監(jiān)控通過主動模擬偵測來獲取服務(wù)可用性和性能狀況,能在用戶之前發(fā)現(xiàn)服務(wù)可用和性能故障;用戶體驗監(jiān)控通過監(jiān)控真實用戶的業(yè)務(wù)操作,幫助運維人員從用戶角度了解業(yè)務(wù)系統(tǒng)可用性和性能,發(fā)現(xiàn)資源監(jiān)控?zé)o法發(fā)現(xiàn)的問題,并且借助事件快照可重現(xiàn)問題場景以幫助進(jìn)行問題診斷。n 事件處理層事件處理

12、層主要解決事件標(biāo)準(zhǔn)化、關(guān)聯(lián)分析和自動通知等功能。事件標(biāo)準(zhǔn)化使不同來源不同格式事件進(jìn)行集中統(tǒng)一的關(guān)聯(lián)分析成為可能,通過對跨專業(yè)領(lǐng)域事件的關(guān)聯(lián)分析,可有效避免告警風(fēng)暴和從事件海洋中識別出有意義事件。n 服務(wù)管理層服務(wù)管理層主要解決了IT與業(yè)務(wù)關(guān)聯(lián)問題。將IT與業(yè)務(wù)關(guān)聯(lián)可幫助運維人員正確判斷IT事件對業(yè)務(wù)影響,以便正確安排工作優(yōu)先級,同時在業(yè)務(wù)出現(xiàn)問題時可快速定位問題組件,從而加快故障恢復(fù)速度。n 結(jié)果展現(xiàn)層結(jié)果展現(xiàn)層主要解決監(jiān)控結(jié)果展現(xiàn)和分析,包含實時監(jiān)控結(jié)果展現(xiàn)和歷史數(shù)據(jù)分析。圖表 2系統(tǒng)總體結(jié)構(gòu)3.2 部署架構(gòu)對具有分支機構(gòu)企業(yè),系統(tǒng)部署架構(gòu)如下圖所示,在總部數(shù)據(jù)中心部署一臺SAMP管理平臺服

13、務(wù)器,在中心核心交換機上接入一臺用戶體驗引擎負(fù)責(zé)偵聽和解析網(wǎng)絡(luò)報文,并將用戶體驗數(shù)據(jù)上報到SAMP平臺管理服務(wù)器。各分支機構(gòu)部署一臺用于服務(wù)模擬訪問的現(xiàn)場探針,定期模擬服務(wù)使用以探測服務(wù)可用性和性能,并將偵測結(jié)果數(shù)據(jù)通過HTTP協(xié)議上報到SAMP管理平臺服務(wù)器。圖表 3系統(tǒng)部署架構(gòu)3.3 系統(tǒng)功能3.3.1 資源監(jiān)控監(jiān)控企業(yè)業(yè)務(wù)所依賴的IT資源如網(wǎng)絡(luò)、主機、存儲、數(shù)據(jù)庫、中間件等,監(jiān)控內(nèi)容包括可用性、性能、安全和其他異常指標(biāo),及時發(fā)現(xiàn)和消除各種問題隱患,真正做到防患于未然。3.3.2 服務(wù)監(jiān)控主動模擬用戶使用服務(wù)功能,以探測服務(wù)可用性和性能,這樣可以先于用戶發(fā)現(xiàn)和解決問題,而不是被動等待用戶投

14、訴,有效提高用戶滿意度。3.3.3 日志監(jiān)控監(jiān)控各種設(shè)備、系統(tǒng)和應(yīng)用程序日志,一旦日志中出現(xiàn)指定錯誤信息就及時報警,幫助運維人員從海量日志分析工作中解脫出來。3.3.4 用戶體驗監(jiān)控監(jiān)控真實用戶業(yè)務(wù)操作的可用性和性能,幫助IT部門從用戶角度感受IT系統(tǒng),解決了后臺資源監(jiān)控不能全面反映業(yè)務(wù)系統(tǒng)健康狀況的現(xiàn)象,使監(jiān)控不留死角。3.3.5 事件管理為企業(yè)提供一個對多來源、跨專業(yè)事件的采集、關(guān)聯(lián)分析、處理、展現(xiàn)和通知平臺,幫助IT運維人員從事件海洋中尋找有意義事件,識別根源事件,確定事件處理的優(yōu)先順序,以加快問題處理速度。3.3.6 服務(wù)影響管理通過創(chuàng)建并維護(hù)服務(wù)模型、關(guān)聯(lián)和處理服務(wù)組件相關(guān)事件,分析

15、IT事件對業(yè)務(wù)服務(wù)的影響,幫助IT運維人員快速定位問題根源和確定解決問題優(yōu)先順序。3.3.7 知識庫企業(yè)提供一個IT運維知識管理平臺,幫助企業(yè)實現(xiàn)對運維知識的有效管理,有效提高IT運維工作質(zhì)量和效率。3.3.8 監(jiān)控視圖 資源監(jiān)控視圖.1 管理視圖管理視圖提供從管理職責(zé)角度來查看和分析監(jiān)控結(jié)果功能,選擇組或子組,系統(tǒng)都提供圖示、列表、概覽和告警顯示風(fēng)格,其中圖示以圖標(biāo)方式顯示其下各個子組或?qū)ο蟮臓顟B(tài);列表以列表方式其下各個子組或?qū)ο蟮臓顟B(tài);概覽顯示該組對象狀態(tài)統(tǒng)計信息和關(guān)鍵指標(biāo)狀態(tài);告警顯示該組活動告警和告警統(tǒng)計信息。選擇具體對象,系統(tǒng)提供監(jiān)控結(jié)果、告警事件、報警日

16、志瀏覽和依賴關(guān)系查看和維護(hù)功能,對對象監(jiān)控結(jié)果系統(tǒng)提供圖示化和詳情兩種展現(xiàn)方式,對單個指標(biāo)還可進(jìn)一步查看監(jiān)測歷史和告警歷史情況。下面是主機和數(shù)據(jù)庫監(jiān)控可視化截圖。圖表 4 Linux主機可視化監(jiān)控圖圖表 5 ORALCE數(shù)據(jù)庫可視化監(jiān)控圖.2 設(shè)備視圖設(shè)備視圖提供按監(jiān)控對象類型來查看和分析監(jiān)控結(jié)果功能,具體功能與管理視圖相同。.3 自定義視圖自定義視圖提供綁定監(jiān)控對象到VISIO圖功能,以實現(xiàn)各種用戶所需的監(jiān)控視圖。下面是一些自定義視圖舉例。圖表 6 物理拓?fù)湟晥D圖表 7 機柜視圖圖表 8 綜合監(jiān)控視圖 用戶體驗視圖.1 全局概覽全局概覽

17、提供企業(yè)業(yè)務(wù)應(yīng)用最近一段時間內(nèi)可用性和性能狀況一覽表,運維人員可實時了解最近一段時間內(nèi)企業(yè)所有應(yīng)用整體狀況,包括會話、動作、錯誤和事件等數(shù)量和變化趨勢。圖表 9 全局概覽.2 應(yīng)用概覽提供某一指定應(yīng)用最近一段時間內(nèi)運行健康狀況概覽,包括會話、動作和事務(wù)的可用性和性能狀況,以及錯誤和事件統(tǒng)計信息。.3 地域概覽地域概覽全面展現(xiàn)應(yīng)用在不同地域的狀態(tài)和信息,方便用戶定位由于地域差異引起的問題。.4 事務(wù)概覽事務(wù)概覽方便用戶統(tǒng)一瀏覽UXM中各個事務(wù)的可用性、性能和違約狀態(tài)。通過此功能可以幫助尋找事務(wù)的問題到底出現(xiàn)在哪里,可發(fā)現(xiàn)不同地點問題的差異,不同應(yīng)用、交易

18、交易流、時間段或地點交易響應(yīng)時間或可用性的差異。.5 錯誤概覽錯誤概覽用來發(fā)現(xiàn)系統(tǒng)目前存在的錯誤情況,便于了解了解系統(tǒng)運行狀態(tài)。系統(tǒng)提供按照應(yīng)用、地域、服務(wù)器、客戶端4個維度對錯誤進(jìn)行展現(xiàn)。.6 服務(wù)器概覽提供某一應(yīng)用最近一段時間內(nèi)所有服務(wù)器平均響應(yīng)時間、流量和錯誤數(shù)量,以及訪問該服務(wù)器會話和動作數(shù)量、可用性和性能狀況。 服務(wù)影響視圖服務(wù)視圖將業(yè)務(wù)與IT資源關(guān)聯(lián)起來,通過服務(wù)視圖可實時監(jiān)控業(yè)務(wù)健康狀態(tài),并在業(yè)務(wù)出現(xiàn)問題時可快速定位問題組件,在IT資源出現(xiàn)問題時準(zhǔn)確判斷對業(yè)務(wù)的影響。圖表 10 服務(wù)視圖舉例3.3.9 統(tǒng)計分析對監(jiān)控歷史數(shù)據(jù)進(jìn)行統(tǒng)計分析為

19、IT運維發(fā)現(xiàn)潛在系統(tǒng)隱患和系統(tǒng)優(yōu)化提供有價值的信息,主要包括資源監(jiān)控結(jié)果數(shù)據(jù)分析和用戶體驗監(jiān)控結(jié)果數(shù)據(jù)分析。 資源監(jiān)控數(shù)據(jù)分析.1 TOPN分析提供資源告警、資源在線率等TOPN排名分析,運維人員可從中獲取一段時間內(nèi)告警最多、在線率較差資源清單,以便重點關(guān)注和采取針對性措施。.2 趨勢分析提供資源指標(biāo)監(jiān)測值變化趨勢、增速變化趨勢等分析,通過對一段時間指標(biāo)值變化趨勢進(jìn)行分析,可獲取一些有價值信息,例如磁盤空間每個月增量是多少?增速是否平穩(wěn)?服務(wù)響應(yīng)時間變化是否隨著系統(tǒng)運行時間增加而變慢?根據(jù)這些分析結(jié)果可為系統(tǒng)優(yōu)化和擴容提供依據(jù)。.3 統(tǒng)計

20、分析提供針對資源對象和告警事件的統(tǒng)計分析,例如按事件組、事件性質(zhì)、事件分類、事件嚴(yán)重級別、處理狀態(tài)對事件進(jìn)行統(tǒng)計分析;按資源類別統(tǒng)計各類資源告警情況;統(tǒng)計某個對象在某段時間內(nèi)運行情況等。 用戶體驗監(jiān)控數(shù)據(jù)分析.1 TOPN分析按業(yè)務(wù)應(yīng)用提供可用性最差、性能最差、訪問量最大、錯誤最多、服務(wù)器耗時最長、連接耗時最長等排名分析,為IT運維提供系統(tǒng)優(yōu)化依據(jù)。.2 問題分析問題分析主要提供過去一段時間內(nèi)出現(xiàn)的問題或性能隱患動作和事務(wù)實例,幫助運維人員進(jìn)行問題診斷,主要包括最近的慢動作、最近的慢事務(wù)、大訪問量動作、不可用的動作、差性能動作、大流量動作、內(nèi)置錯誤和自

21、定義錯誤。并且提供事件快照回放功能,以幫助運維人員重現(xiàn)故障場景。.3 應(yīng)用運行情況分析提供不同地域應(yīng)用可用性和性能趨勢分析,幫助了解一段時間內(nèi)應(yīng)用可用性和性能趨勢變化情況以及地域差異情況,同時也可了解應(yīng)用會話數(shù)量和事務(wù)數(shù)量變化對可用性和性能影響程度。提供不同地域動作可用性趨勢變化分析,幫助了解地域之間動作可用性差異;提供不同服務(wù)器動作可用性趨勢變化分析,幫助了解服務(wù)器之間動作可用性差異。提供事務(wù)響應(yīng)時間分析,幫助了解不同地域之間事務(wù)響應(yīng)時間差異,同時還可進(jìn)一步分析事務(wù)在網(wǎng)絡(luò)、服務(wù)器、客戶端所耗費時間,以便確定性能瓶頸。提供事件統(tǒng)計分析,幫助了解一段時間內(nèi)應(yīng)用告警事件數(shù)量,以及按事

22、件分類、嚴(yán)重性級別的占比情況。提供錯誤統(tǒng)計分析,幫助了解一段時間內(nèi)錯誤數(shù)量和分類統(tǒng)計情況。.4 服務(wù)器情況分析按服務(wù)器統(tǒng)計會話數(shù)量、會話可用性、會話性能、動作數(shù)量、動作可用性、動作性能數(shù)據(jù)、服務(wù)器平均響應(yīng)時間、服務(wù)器流量等數(shù)據(jù),以了解不同服務(wù)器負(fù)載和性能情況。.5 業(yè)務(wù)活躍度分析提供不同應(yīng)用、不同地域、不同用戶群業(yè)務(wù)使用情況分析。.6 業(yè)務(wù)漏斗情況分析用來分析某一業(yè)務(wù)流程完成情況,以及用戶一般從那一環(huán)節(jié)放棄業(yè)務(wù),通過業(yè)務(wù)漏斗分析可幫助企業(yè)優(yōu)化業(yè)務(wù)流程。.7 用戶行為習(xí)慣分析分析客戶一般使用什么樣客戶端和在系統(tǒng)停留時間有多長。3.3.10

23、系統(tǒng)管理提供用戶權(quán)限管理、全局參數(shù)配置、任務(wù)調(diào)度管理和系統(tǒng)日志查詢等功能。3.4 系統(tǒng)特點3.4.1 面向業(yè)務(wù)與集中監(jiān)控通過創(chuàng)建業(yè)務(wù)服務(wù)模型,實現(xiàn)業(yè)務(wù)服務(wù)與服務(wù)所依賴的機房環(huán)境、網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫、應(yīng)用等IT資源的關(guān)聯(lián),同時通過合并來自企業(yè)范圍內(nèi)的各種事件(包括來自監(jiān)控系統(tǒng)、操作系統(tǒng)和應(yīng)用程序日志、SNMP Trap消息等),全面完整地呈現(xiàn)業(yè)務(wù)服務(wù)及其所依賴組件的運行狀況。有別于傳統(tǒng)的以資源監(jiān)控為主的分散監(jiān)控模式,面向業(yè)務(wù)的集中監(jiān)控實現(xiàn)了以業(yè)務(wù)為主線的全面和整體監(jiān)控,不僅使運維人員在問題事件到來時能直觀地了解事件對業(yè)務(wù)服務(wù)的影響,而且在業(yè)務(wù)出現(xiàn)問題時又可快速地定位問題根源組件,極大地提高了運

24、維工作質(zhì)量和效率。3.4.2 高開放性與易集成性產(chǎn)品的開放性決定了產(chǎn)品的生命力,SAMP監(jiān)控平臺具有高度開放性和易集成能力,在數(shù)據(jù)采集、模型創(chuàng)建、事件轉(zhuǎn)換、事件處理、可視化展現(xiàn)和統(tǒng)計分析等環(huán)節(jié)都提供用戶接口或工具來幫助客戶實現(xiàn)自己的個性化監(jiān)控需求。例如用戶無需編程就能定義自己的事件適配器,從而輕松實現(xiàn)與第三方監(jiān)控系統(tǒng)的集成。3.4.3 廣適應(yīng)的數(shù)據(jù)采集技術(shù)目前市面上監(jiān)控軟件數(shù)據(jù)采集技術(shù)可分為代理和非代理兩種技術(shù),有些廠家只支持代理如IBM,有些廠家則只支持非代理如游龍的SiteView。其是兩種采集技術(shù)各有優(yōu)缺點,需根據(jù)用戶實際監(jiān)控環(huán)境確定,SAMP®監(jiān)控平臺同時支持兩種數(shù)據(jù)采集技術(shù)

25、,對各種復(fù)雜監(jiān)控環(huán)境具有廣泛適應(yīng)性。3.4.4 復(fù)雜靈活的告警條件設(shè)置很多監(jiān)控軟件在設(shè)置告警條件時只支持簡單閾值判斷,往往不能適應(yīng)復(fù)雜的監(jiān)控場景。SAMP® AM在這方面則非常靈活,除了簡單閾值之外,還支持復(fù)雜告警條件的設(shè)置,如按時段設(shè)置不同閾值。3.4.5 圖形化的業(yè)務(wù)服務(wù)建模工具SAMP®監(jiān)控平臺提供圖形化的業(yè)務(wù)服務(wù)建模工具,使服務(wù)建模工作變得簡單易行。3.4.6 運維知識自動關(guān)聯(lián)在事件處理時可根據(jù)事件內(nèi)容自動關(guān)聯(lián)運維知識庫,可以極大地提高運維工作響應(yīng)速度和質(zhì)量。3.4.7 豐富多樣的告警通知方式系統(tǒng)提供短信、郵件、聲光、桌面告警等多種告警通知方式,使告警信息及時準(zhǔn)確地

26、送達(dá)接受人。3.4.8 模板化的監(jiān)控報表管理基于模板的統(tǒng)計報表,更容易滿足用戶個性化統(tǒng)計需求。3.4.9 可視化的監(jiān)控結(jié)果呈現(xiàn)監(jiān)控結(jié)果采用簡潔美觀的圖形化界面予以呈現(xiàn),IT資源健康狀況一目了然,幫助運維人員輕松掌控IT運行情況。3.5 關(guān)鍵技術(shù)3.5.1 CCE分析技術(shù)事件分析是追蹤和監(jiān)控網(wǎng)絡(luò)、計算機和應(yīng)用系統(tǒng)行為的關(guān)鍵。目前大部分事件分析方法都僅能夠提供簡單的模式匹配和邏輯判斷,但卻不能夠提供時間和事件相關(guān)的判斷能力。監(jiān)控的核心目的在于分析和判斷,如果沒有強大的分析判斷能力用戶將會被淹沒在信息的海洋之中。因此我們提出了獨具特色的上下文關(guān)聯(lián)事件(CCE - Contextual Correlated Events)分析理念,在系統(tǒng)中提供大量內(nèi)置的分析規(guī)則,用戶只

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論