已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
ca系統(tǒng)運維建議書冠群電腦(中國)有限公司2009年4月nsm and insigh r11 proposal1 網(wǎng)絡管理1.1 概述網(wǎng)絡管理是spectrum產(chǎn)品的基本功能。spectrum在全球的企業(yè)環(huán)境中得到廣泛的應用?,F(xiàn)在spectrum可以提供包括端對端服務狀況,以及系統(tǒng)響應和網(wǎng)絡應用的測量和管理能力。如下部分將介紹網(wǎng)絡管理解決方案和該方案為您帶來一些主要的益處。1.2 架構管理ca spectrum是一個業(yè)界領先的基礎架構和故障管理解決方案,一方面它通過內嵌的適配模塊集成第三方管理產(chǎn)品,同時它具有強大的根源分析引擎和統(tǒng)一用戶界面來管理所有用戶事件,并將經(jīng)過優(yōu)化并同問題相關的少數(shù)告警體現(xiàn)出來。無論主機、客戶服務器、分布式系統(tǒng)及web服務計算均離不開網(wǎng)絡環(huán)境,spectrum已成功地在多廠商、多技術的網(wǎng)絡中進行了大量的實施;它不僅告訴你出現(xiàn)了問題,同時告訴你是什么導致了該問題、有哪些影響因素、怎么發(fā)現(xiàn)和解決問題。這些結論每年為用戶節(jié)省數(shù)百萬美元;在全球范圍內,spectrum提供了完整的2層和3層網(wǎng)絡視圖,詳細到每個端口和電路,其中包括局域網(wǎng)和廣域網(wǎng)、有線和無線、物理網(wǎng)和虛擬網(wǎng)絡。spectrum同樣提供獨特的應用模塊深入監(jiān)控和分析atm、frame relay、ip multicast、mpls、qos和vpn網(wǎng)絡。 除此之外,spectrum 解決方案的核心是對業(yè)務服務it架構之間關系和影響的理解能力,該方法稱為業(yè)務服務智能(bsi);bsi方法提供了關聯(lián)映射、影響分析和根源分析能力,從而使我們的用戶能夠將其it架構從基于策略的被動響應發(fā)展到基于戰(zhàn)略的提前優(yōu)化, 從而從客戶角度和戰(zhàn)略遠景方面提升it服務質量。 spectrum的分析模塊能夠利用基于模式、規(guī)則和策略的關聯(lián)引擎,對數(shù)以千計的不同廠商、不同技術的設備來識別、檢驗和解決復雜的問題。 這樣,業(yè)務服務的管理和日常問題維護通過自動化的操作變得輕松,其中包括了資產(chǎn)、可用性、容量規(guī)劃、變更管理、性能和趨勢分析并最終實現(xiàn)有效的服務等級評估。 附圖1. 豐富的評估分析報表1.3 人工智能spectrum的基礎是專利的感應模型技術(inductive modeling technology -imt),它由多個人工智能領域開發(fā)的概念和技術所形成,例如語言學、知識表示、問題解決等。盡管可以按語義網(wǎng)絡或基于模型的系統(tǒng)進行分類,但imt將其集成為統(tǒng)一的概念和技術。imt的核心是一個任何spectrum模型的知識庫。該知識庫由存儲在數(shù)據(jù)庫中的預定義概念和可由spectroserver處理的過程性知識組成。spectroserver提供訪問這些信息的界面。知識庫由這些概念、關系和它們實例組成,包括表示管理結點的實例。spectrum可以管理任何使用簡單無論管理協(xié)議和互聯(lián)網(wǎng)控制管理協(xié)議 (icmp)的結點。如果結點不使用這些協(xié)議,可以使用 spectrum外部協(xié)議api來開發(fā)一個協(xié)議轉換器進行協(xié)議轉換。模型類型、關系構成了spectrum知識庫的基石。模型和關系是從真實世界對象中抽象的,通過規(guī)則和邏輯限制將這些抽象互相聯(lián)系起來。spectrum 知識庫中的概念和關系通過不同的視圖進行可視表示。例如,某些視圖描述管理結點之間的邏輯連接,并顯示其物理位置。某些視圖使用分級結構,允許用戶通過點擊下拉的方式顯示明細子視圖。其他視圖是通用的,包含監(jiān)控管理結點活動的測量標尺、圖形和圖表。 在spectrum知識庫中的概念實例在不同的視圖中顯示為圖標,每個圖標其實就是模型的活動“圖片”,某些包含狀態(tài)字段的圖標還會根據(jù)知識庫中的數(shù)據(jù)實時的變化顏色。1.4 故障管理網(wǎng)絡中可能出現(xiàn)的故障多種多樣,往往解決一個復雜的網(wǎng)絡故障需要廣泛的網(wǎng)絡知識與豐富的工作經(jīng)驗。這也是為什么一個成熟的網(wǎng)絡管理機構制訂有一整套完備的故障管理日志記錄機制,同時人們也率先把專家系統(tǒng)和人工智能技術引進到網(wǎng)絡故障管理中來的原因。另一方面,由于網(wǎng)絡故障的多樣性和復雜性,網(wǎng)絡故障分類方法也不盡相同。我們可以根據(jù)網(wǎng)絡故障的性質把故障分為物理故障與邏輯故障,也可以根據(jù)網(wǎng)絡故障的對象把故障分為線路故障、路由器故障和主機故障。對于一個優(yōu)秀的網(wǎng)管系統(tǒng)而言,提供足夠的靈活性以向管理人員提供相應的故障視圖和管理手段是非常重要的。幸運的是,spectrum是業(yè)界極少能夠提供這種能力的網(wǎng)管系統(tǒng)之一。首先,千里之行,始于足下。一個好的故障處理模型是進行故障管理的基礎。spectrum采用面向對象的建模 自適應建模技術(imt)可以為所有網(wǎng)絡設備建立軟件模型。即使平臺事實上不能與某一設備通訊,此模型也能了解到網(wǎng)絡中的各個實體間的關系,從而使系統(tǒng)做出準確判斷,加速網(wǎng)絡的診斷過程。通過spectrum,可以方便地查詢設備、自動發(fā)現(xiàn)此設備所支持的mib,并將所發(fā)現(xiàn)的mib與spectrum的“建模目錄”中的公共mib相比較,從而動態(tài)地匯編出spectrum設備模型,并為客戶應用顯示出完整的設備模型視圖,這是目前世界上最先進的故障診斷模型。其次,spectrum是目前所有網(wǎng)絡管理軟件中唯一具備處理網(wǎng)絡對象相關性能力的系統(tǒng)。spectrum采用的歸納模型可以使它檢查不同的網(wǎng)絡對象與事件,從而找到其中的共同點,以歸納出同一本質的事件或故障。比如,許多同時發(fā)生的故障實際上都可最終歸結為一個同一路由器的故障,這種能力減少了故障卡片的數(shù)量,也減少了網(wǎng)絡的開銷。第三,故障隔離和報警抑制 一旦發(fā)現(xiàn)問題,企業(yè)管理系統(tǒng)可以推斷出故障設備的狀態(tài)并幫助診斷問題,通過spectrum的精確定位功能,可迅速找出出錯設備并抑制不必要的報警,并且利用企業(yè)報警管理視圖,用戶可在網(wǎng)絡的任何地點以瀏覽器方式觀察網(wǎng)絡報警,這為用戶提供了快速了解網(wǎng)絡報警及網(wǎng)絡狀況的方法,有利于節(jié)約維護費用。當然,也可以將事件前向到其他網(wǎng)管軟件,進行報警。1.4.1 關鍵特性 事件關聯(lián)spectrum的事件關聯(lián)功能將業(yè)界的人工智能和故障解決方式進行充分結合;首先于1991年提出了基于模型的智能技術;在2000年,又開發(fā)出新的基于規(guī)則的智能引擎。 該引擎能夠很好地支持多種復雜的關聯(lián)方式,如事件頻率、事件持續(xù)時間和事件并發(fā)條件等。將兩種智能技術完美地結合在一起后,spectrum的事件關聯(lián)引擎一方面可以分鐘自動適應it環(huán)境的變化進行匹配,同時可以滿足用戶快速靈活地添加自定義的新的規(guī)則。 問題根源分析spectrum的問題根源分析已經(jīng)被證明可以降低70%的網(wǎng)絡中斷時間、將mttr從小時降低到分鐘,同時將故障問題單數(shù)量降低50%;spectrum提供的問題根源分析專家能夠同異構企業(yè)環(huán)境中已部署的管理工具集成,從而為復雜的網(wǎng)絡環(huán)境提供端對端的完整管理視圖。1.4.2 智能規(guī)則spectrum故障管理提供了大量的預定義智能規(guī)則來消除重復的告警和trap,同時在故障發(fā)生前發(fā)現(xiàn)潛在的問題。為了達到上述的功能,spectrum提供了不同的智能算法和管理方式。在故障發(fā)生之前或者剛剛發(fā)生的時候,可以配置spectrum以不同的形式通知給相關的人員,如郵件,前轉trap,或者短信(sms),傳真(pager),甚至可以運行一些必要的程序來執(zhí)行需要的修補行為。1.5 資產(chǎn)管理通過自動的discovery工具,設備發(fā)現(xiàn)過程可以每天進行,或按設置的時間表進行,或互動式進行。在每一次掃描網(wǎng)絡的過程中,會自動發(fā)現(xiàn)新的或變化的設備信息。并通過讓按類或ip地址分組對網(wǎng)絡單元分類,方便了識別網(wǎng)絡設備的過程。然后,它執(zhí)行發(fā)現(xiàn)過程,在網(wǎng)絡找到這些設備。通過對企業(yè)網(wǎng)絡環(huán)境的發(fā)現(xiàn)和信息收集,spectrum將所有信息集中存儲到中心數(shù)據(jù)庫中,從而通過智能的分析引擎靈活地進行資產(chǎn)分析、變更分析和資產(chǎn)統(tǒng)計報表。附圖2. 網(wǎng)絡資產(chǎn)管理報表相關資產(chǎn)屬性包括: device and sub components vendor device type ip address firmware version last time rebooted last time patched sys uptime contact location mac address1.6 審計安全管理spectrum對于網(wǎng)絡管理和設備訪問具有完善的安全保障,主要包括以下層面:在管理服務器上,spectrum提供分權的用戶管理機制,每個用戶具有不同的管理視圖,同時通過管理日志提供完善的審計功能。對于網(wǎng)絡設備的主要事件,如配置更改,設備訪問和狀態(tài)變更提供審計管理能力。1.7 性能管理1.7.1 功能概述ca ehealth通過snmp輪詢或者外部元素和其他網(wǎng)管系統(tǒng)數(shù)據(jù)的導入接收性能信息。它也通過snmp trap接收網(wǎng)絡設備的信息。 請參見如下關于性能數(shù)據(jù)和網(wǎng)絡設備信息如何收集和報考的圖示如圖,性能和故障信息存儲在ehealth數(shù)據(jù)庫中以備長期的分析和交給報告引擎進行處理。這些引擎為ehealth提供了一個具有競爭性的特點:“標準化”數(shù)據(jù),用一種統(tǒng)一的發(fā)生向用戶提供信息。ehealth支持現(xiàn)有來自上百個廠商的技術,如atm,幀中繼,dsl,光纖,voip,san,路由器,交換機,防火墻,服務器、應用程序和數(shù)據(jù)庫等。ehealth允許操作員將所管理的設備,系統(tǒng)和應用程序劃分為不同的邏輯組以便更精確的反映被管環(huán)境的情況。分組能夠反映被管設備的地域分布,設備和特定用戶關系,同時也能聚合一些特殊類型的設備。ehealth可以按照預定的要求或者用戶的即時需求提交相應的報告,這些報告不僅針對某個特定的設備可以針對一個分組。報告可能包括特殊性能指標的統(tǒng)計信息,如顯示超出給定基準線的性能統(tǒng)計的歷史平均情況。這些信息可以幫助操作員理解近期性能和歷史性能的關聯(lián),以便確定發(fā)展的趨勢。除此之外,報告提供針對不同用戶的可定制的性能信息,并且使用pdf或者ascii等格式發(fā)布在互聯(lián)網(wǎng)上。如下圖示反映了數(shù)據(jù)如何被實時采集和分析:ehealthlive health是ehealth提供的一個故障管理產(chǎn)品。它通過專用的算法來分析存儲在ehealth數(shù)據(jù)庫中的性能數(shù)據(jù),當發(fā)現(xiàn)性能指標違反了用戶定義的閾值時,將發(fā)送snmp trap。依靠設置建立在歷史性能數(shù)據(jù)上的閾值,操作員能夠在性能指標偏離期望行為的時候關注到它,同時能夠在性能降低到臨界點之前采取相應的措施。live health通過綜合性能管理的數(shù)據(jù)來提供了不同于其他軟件包的一個主動故障管理。 用戶可以使用ehealth來進行預警管理,輕松的故障維護,定制容量規(guī)劃和服務等級管理。1.7.2 性能預警管理ehealthlive health故障管理的live exception browser提供了大量的預定義智能規(guī)則來消除重復的告警和trap,同時在故障發(fā)生前發(fā)現(xiàn)潛在的問題。為了達到上述的功能,live health提供了不同的智能算法:主要告警方式: 超過門限時間(time over threshold):識別被管對象在較長的時間內出現(xiàn)了較多的錯誤 偏離正常時間(deviation from normal):使用的動態(tài)的閾值和常規(guī)行為進行比較從而檢測出異常的性能行為trap管理: 事件狀態(tài)(event state):在被管設備出現(xiàn)故障的時候僅僅通知一次事件比率(event rate):用來識別接受到了過多的trap。 事件超過門限時間(event time over threshold):用來識別被管對象在較長的時間內出現(xiàn)較多的錯誤。在故障發(fā)生之前或者剛剛發(fā)生的時候,可以配置live health以不同的形式通知給相關的人員,如郵件,前轉trap,或者短信(sms),傳真(pager),甚至可以運行一些必要的程序來執(zhí)行需要的修補行為。用戶能夠通過各種報告來實現(xiàn)主動管理: exception summary of health report提供被管元素產(chǎn)生問題和導致異常的詳細報告。 situation to watchof health report在關鍵業(yè)務出現(xiàn)問題前,表示出迫切需要解決的問題所在。 my health report允許用戶定制被選關鍵統(tǒng)計信息的多形式的視圖,來反映被管服務的質量1.7.3 輕松的故障維護如下圖示描述了故障維護的工作流程.不同的人員會得到不同的視圖.您將非常方便的通過簡單的點擊就可以展開詳細視圖,同時,生成不同的報告以便以后進行分析。live status diagram提供了一個業(yè)務界面來反映被管元素當前的狀態(tài)。在live status中使用不同的顏色來標示元素狀態(tài),同時高亮顯示業(yè)務拓撲。這樣用戶能夠方便的發(fā)現(xiàn)問題所在之處。當確定問題后,用戶能很快的深入了解詳細信息以便了解問題的本質。live exception browser能夠呈現(xiàn)全局或者特定主題下的trap/告警/異常信息。live exception browser會保持告警信息,一直到問題被解決或者人為的被清除。通過它,用戶能很快的深入了解詳細信息以便了解問題的本質。用戶能夠通過各種報告來實現(xiàn)輕松的故障維護。 health report 的summary section和 element details section提供如健康指數(shù),利用率分布,變化導向等詳細的信息,以用來分析問題。 top n report按照用戶定義的規(guī)則顯示出最適合的元素列表 at-a-glance report 能夠為發(fā)生問題的元素提供一份相關聯(lián)的關鍵參數(shù)的詳細報告 trend report報告一組關聯(lián)參數(shù)的變化趨勢1.7.4 容量規(guī)劃ehealth提供用戶監(jiān)控每周每月的趨勢的能力。通過這些趨勢分析報告,你可以很輕松的建設你的基礎設施以便來支持業(yè)務量這些周期性變化。用戶能夠通過以下的報告來實現(xiàn)容量規(guī)劃: health report 的補充部分提供了未充分利用元素的詳細信息 capacity projection of health report 提供了未來所需的估計容量值的詳細信息。 capacity provisioning of health report, 容量建議提供哪些元素在建議的時間范圍需要進行升級。 what-if report 提供一個假設情況來調整容量參數(shù)并且決定在問題發(fā)生之前怎么改變。1.7.5 等級管理ehealth服務等級報告為管理sla提供了一個重要的工具。通過采用ehealth的歷史數(shù)據(jù),該報告為企業(yè),部門和業(yè)務提供分析和呈現(xiàn)sla信息的手段。服務等級報告的數(shù)據(jù)來源主要來自ehealth console采集的來自駐留在工作站,服務器和網(wǎng)絡設備上的各類代理的關鍵數(shù)據(jù)。service level report 提供重要參數(shù)的可視信息,如下: 可用性-活動和運行情況的百分比 延時傳輸?shù)难訒r,通常使用ping來度量 帶寬利用率-通訊量占用元素速率的百分比 線路利用率-每個接口的鏈路利用率總和除以接口數(shù) cpu利用率-每個cpu利用率總和除以cpu個數(shù) 健康指數(shù)和健康異常一組分配給元素的基于關鍵性能的度量值。當健康指數(shù)超出最小的范圍時,一個相關的異常就生成了。service level report 提供非常易于理解的品質信息, 該報告為各主要的管理者提供所需的精確的格式和等級狀況,如下: 操作者報告executive report該報告為高級管理人員設計,提供精煉的概述性服務等級性能報告。 網(wǎng)絡經(jīng)理報告 network manager report該報告為網(wǎng)絡管理人員設計,提供日常的設備或應用的服務性能與趨勢預測。 服務客戶報告service customer report該報告為為最終用戶設計,提供特定區(qū)域或站點的服務等級報告。 業(yè)務單元報告business unit report此多技術集成的報告為業(yè)務管理員設計,提供全面的到特定業(yè)務應用流程的設備或相關應用的性能等級報告。1.8 軟件配置服務器名稱硬件類型操作系統(tǒng)/應用數(shù)量ca產(chǎn)品、模塊spectrum infrastructure manager 9.1.2pc服務器2個3g至強cpu。4g內存。150g硬盤空間以上u windows server 2003 sp2u 英文版 1spectrum infrastructure manager device based suite * 1000;spectrum infrastructure manager device based suite server * 1;ehealth performance manager 6.2pc服務器2個3g至強cpu。4g內存。250g硬盤空間以上u windows server 2003 sp2u 英文版 1ehealth performance manager device based suite * 1000;ehealth performance manager device based suite server * 1;2 系統(tǒng)監(jiān)控2.1 概述unicenter nsm r11為企業(yè)it提供了不斷創(chuàng)新、安全、平臺獨立的管理方案,允許企業(yè)輕松的在單一或跨異構平臺上部署管理方案。支持企業(yè)業(yè)務優(yōu)化、按需計算的it管理要求,滿足企業(yè)it投資的最優(yōu)化。unicenter nsm是ca公司企業(yè)it管理藍圖(eim)按需計算戰(zhàn)略的重要組成部分。unicenter nsm幫助企業(yè)在復雜的環(huán)境下安全可靠的部署和維護基礎架構以支持企業(yè)整體業(yè)務開展。確保關鍵基礎設施能夠連續(xù)、可靠和高效的運行。通過不斷創(chuàng)新的智能技術幫助企業(yè)在靈活的適應業(yè)務變化需求的同時能夠有效的控制運維成本。同時能夠同ca其他管理解決方案使用通用數(shù)據(jù)存儲庫共享信息,滿足管理以及信息使用的最佳化要求。2.1.1 平臺級管理技術同ca其他管理組件以及第三方管理產(chǎn)品能夠共享標注和技術以期達到減小實施風險、方便靈活管理、技術快速學習的能力。如下特征提供這個關鍵策略:u mdb配置管理數(shù)據(jù)庫利用ca公司產(chǎn)品解決方案允許利用通用的數(shù)據(jù)結構作為單一一致的定義和訪問策略管理所有ca產(chǎn)品解決方案設計的數(shù)據(jù)。以資產(chǎn)為核心的mdb是一個共享的實體,以便知識集合能夠方便的被不同管理職能使用。u common transport mechanism通用傳輸機制單一和安全的通信模式在復雜的網(wǎng)絡環(huán)境下可以大大簡化通信的配置和管理。所有通信都可以利用標準的模式進行,如安全套接字secure socket,加密,端口整合,動態(tài)配置等。u 標準用戶接口針對所有ca管理解決方案產(chǎn)品的管理都采用通用的用戶管理接口,即用戶接口使用標準的顏色和圖形。u 連續(xù)發(fā)現(xiàn)實時連續(xù)發(fā)現(xiàn)機制使用戶擁有一個不斷更新的it資源管理庫,unicenter nsm可以在此連續(xù)發(fā)現(xiàn)的基礎上自動生成拓撲管理視圖。u snmp v3的支持unicenter nsm以及相關選件對snmp的支持得到了升級,目前完全支持snmpv3標準。u web reporting server (wrs)對管理對象的可用性和性能實現(xiàn)了基于web的報告定制、執(zhí)行以及查看功能。參考下圖:wrs提供了如下的優(yōu)勢:u 報告內容以圖表格式顯示report presentations are composed of table and chart views.u 允許用戶動態(tài)定制報告內容,通過點擊滿足用戶從高級別的報告查看到細節(jié)報告的查看需求。u 報告支持html, csv, pdf格式2.1.2 異構環(huán)境的管控unicenter nsm 對目前存在的廠商以及相關平臺具有廣泛的支持性,可以有效的減少業(yè)務風險。其特點表現(xiàn)在:u 自動監(jiān)控和響應服務器架構下所有組件的健康狀態(tài)和性能信息以自管理的模式進行收集。管理員可以精確方便的對可能導致末端用戶服務異常的情況進行標識、通告和響應。為了減少故障解決時間,允許管理員進行組、個體以及包含的關系定義和裁減升級、通告策略。u 事件關聯(lián)unicenter nsm允許管理員對網(wǎng)絡、系統(tǒng)和應用事件以drill-down的方式在一系列的相關事件中分析標識真正的問題。u 基于策略的事件通知policy-based event notification在企業(yè)中,管理員可以將特定響應信息定位給特定的角色。通過控制臺視圖、管理員可以方便的接收客戶化的事件集合。u 全面的平臺支持comprehensive platform supportit管理系統(tǒng)可以從不同的系統(tǒng)平臺上采集數(shù)據(jù),這些平臺涵蓋windows、unix、linux、as/400、z/os和openvms,對網(wǎng)絡的支持包括tcp/ip、sna、和decnet,針對所有企業(yè)it管理對象提供單一的控制和操作點。u remote management遠程管理針對特定的業(yè)務部門或廣域網(wǎng)環(huán)境,可能存在特定的代理難于部署問題,遠程管理可以幫助管理員快速獲取網(wǎng)絡以及系統(tǒng)的主要工作狀態(tài)信息,為監(jiān)控提供了靈活的應對策略。2.1.3 智能可視化通常在類似數(shù)據(jù)中心的日常運維環(huán)境中需要實現(xiàn)基于角色的管理,ca公司為此提供了豐富的用戶接口管理能力,可以針對不同的用戶提供特定的可裁減的用戶管理接口。采用基于角色的管理方法,管理員可以輕松的定義管理范圍和個性化管理視圖以滿足管理人員管理復雜it環(huán)境的要求。支持的具體功能如下所示:u unicenter management command center (unicenter mcc)為了提高管理員的管理效率,unicenter nsm 為系統(tǒng)管理員以及it管理者提供了直觀的基于樹狀結構的圖形化管理視圖。u unicenter management portal (unicenter mp)管理門戶unicenter mp提供了基于web的管理視圖,滿足管理員可以進行安全可靠、基于角色動態(tài)的個性化管理工作。同unicenter mp的集成,允許管理員在單一的管理視圖中對大量分散存在的數(shù)據(jù)源進行集成統(tǒng)一的分析、查詢、報告和展示。u unicenter classic經(jīng)典管理視圖基于windows視窗的管理界面為it管理員及時響應本地化的系統(tǒng)問題提供了靈活的管理手段。u real-time and historical views實時和歷史管理視圖相關性和可視化信息幫助管理員迅速定位、分析和響應問題。這些視圖提供了豐富的展現(xiàn)格式供分析人員靈活的預置各種性能分析報告。u business process views and smart business process view (smartbpv)業(yè)務視圖從業(yè)務應用視角管理和監(jiān)控基礎單元可以幫助it管理更加適應業(yè)務優(yōu)先級管理要求。通過分析網(wǎng)絡活動,smartbpv可以標識支撐特定業(yè)務和應用單元的it基礎架構組件,自動搭建和不斷更新具有針對性的業(yè)務相關性的監(jiān)控管理視圖。2.2 系統(tǒng)結構unicenter nsm作為企業(yè)it監(jiān)控的核心解決方案,其架構分為:u worldview交互層u managing layer管理層u monitoring layer監(jiān)控層附圖3. unicenter體系架構2.2.1 worldview展現(xiàn)層該層將監(jiān)控信息通過二維視圖worldview 2d和管理控制中心management command center兩個管理邏輯組件進行表達,通過該層管理員可以查看被監(jiān)控對象以及對象間的關系。worldview由如下組件構成:u worldview管理接口u management database(mdb)管理數(shù)據(jù)存儲庫u worldview application programming interface(api)2.2.2 managing管理層該層主要通過分布式狀態(tài)機dsm(distributed state machine)實現(xiàn)agent的管控,支持運行的平臺包括windows、unix或linux。dsm實際上是由dsm和一系列支持組件構成。管理層包含的組件如下:u distributed services bus (aws_orb)u distributed state machine (aws_dsm)u dsm monitor (dsmmonitor)u dsm store (aws_nsm)u object store (aws_store)u service control manager (awservices)u snmp / dia gateways (aws_snmp and aws_agtgate)u trapmux (catrapmuxd)u worldview gateway (aws_wvgate)上述組件以后臺服務的方式構造了管理層,允許單獨的進行啟動和停止。2.2.3 monitoring layer監(jiān)控層監(jiān)控層又稱代理層,采集監(jiān)控對象基礎信息。管理員可以通過不同的管理接口,如mib browser、agent view browser、dashboad、mcc等查看監(jiān)控資源的當前狀態(tài)。通過service control manager(awservices)可以對監(jiān)控層的服務進行獨立的啟停操作。監(jiān)控層包含如下組件:u distributed services bus (aws_orb)u agents (agentname)u service control manager (awservices)u snmp / dia administrator (aws_sadmin and aws_agtgate)監(jiān)控層組件間的交互如下圖所示:2.3 軟件配置n unicenter network and system r11.2 x 1n unicenter network and system r11.2 managed resources x 1202.4 硬件配置服務器名稱硬件類型操作系統(tǒng)/應用數(shù)量ca產(chǎn)品系統(tǒng)管理服務器pc服務器2個3g至強cpu。4g內存。150g硬盤空間以上u windows 2003 r2u ms sql 2005u excel 20031u unicenter network and system r11.23 數(shù)據(jù)庫性能監(jiān)控3.1 概述ca 推薦使用insight 管理貴公司的業(yè)務關鍵數(shù)據(jù)庫。ca insight database performance monitor for distributed databases 是一個多數(shù)據(jù)庫的監(jiān)控、診斷及性能管理的方案。insight 為瀏覽器界面,支持實時及歷史數(shù)據(jù)庫監(jiān)控、診斷、處理和全面的性能管理,包括數(shù)據(jù)庫內部配置、狀態(tài)、sql捕獲、cpu利用率、內存利用率和i/o訪問??蓴U展的監(jiān)控范圍無論要監(jiān)控數(shù)據(jù)庫的個數(shù)、體積或者所運行的系統(tǒng),insight先進的技術可確保它們發(fā)揮最大效率,共享內存架構可以處理大型和復雜的多數(shù)據(jù)庫環(huán)境,你可以擴大監(jiān)視范圍而不過分干擾被監(jiān)控的主機。數(shù)據(jù)庫發(fā)現(xiàn)和自動監(jiān)視數(shù)據(jù)庫發(fā)現(xiàn)技術可以選擇性的監(jiān)視目標數(shù)據(jù)庫并自動實例化。這意味著當數(shù)據(jù)庫目標被添加或刪除時,不需要改變配置。當改變發(fā)生時,它會自動確認并響應。數(shù)據(jù)庫、操作系統(tǒng)和i/o 信息數(shù)據(jù)庫的性能監(jiān)控可以實時的進行,伴以圖表和統(tǒng)計數(shù)值。因為性能數(shù)據(jù)依賴于與數(shù)據(jù)庫之外的交互,insight會同時監(jiān)控操作系統(tǒng)和i/o活動。有了ca insight dpm for distributed databases,數(shù)據(jù)會在單一的控制臺被采集和呈現(xiàn);管理員能夠同時在界面上掌握性能信息和關聯(lián)的故障,這樣問題就能盡早診斷和修復。采集過程對系統(tǒng)的影響極小。先進的通知和事件管理通過檢查用戶定義的性能分組、掃描參數(shù),ca insight dpm 為超過門限后的動作測量和報告條件。同時它還可以基于很多條件觸發(fā)告警,如空間不足、長期運行的進程、高cpu利用率、交換空間不足等。用戶可以采取措施來確保數(shù)據(jù)庫可用。 交互式的實時及長期歷史性能分析ca insight dpm 可以在單一界面同時為實時及歷史分析總結性能趨勢和診斷信息,這樣就保證了快速的解決問題能力。insight 還能提供: 數(shù)據(jù)庫質量指數(shù) 幫助客戶排出需要關注的數(shù)據(jù)庫的優(yōu)先級 sql 捕獲和存儲 趨勢及負載分析歷史重現(xiàn)性能信息以壓縮方式按時間序列儲存??蛻裟軌虮O(jiān)視數(shù)據(jù)庫的當前狀態(tài),并基于負載指標與其歷史基線比較,決定采集數(shù)據(jù)的粒度及存儲的時間跨度。速查以及詳細性能信息關鍵的性能指標被分組、匯總以及展示在統(tǒng)一的控制臺中,所以客戶可以快速的發(fā)現(xiàn)性能異常、趨勢以及約束條件。如想進一步了解,insight dpm 也可以提供直接訪問的性能掃描和統(tǒng)計數(shù)據(jù)鉆取。內建的專家顧問在控制臺界面中,advisor 按鈕隨處可見,它為各種數(shù)據(jù)庫系統(tǒng)提供了性能參數(shù)解析:ms sql & oracle database等等。這幫助客戶 優(yōu)化數(shù)據(jù)庫性能并且解決問題。集成的方案ca insight 可ca nsm、wily、service desk和spectrum service assurance等產(chǎn)品完全集成。3.2 系統(tǒng)架構ca insight dpm由ca insight for distributed databases,ca database command center,ca tsreorg,ca fast unload 4個部分組成,如下圖所示:l ca dcc是一個統(tǒng)一的數(shù)據(jù)庫管理監(jiān)控界面系統(tǒng)。n 支持統(tǒng)一的瀏覽器界面,一站式監(jiān)控所有數(shù)據(jù)庫系統(tǒng)。n 可以靈活地定制界面層次和內容n 自動發(fā)現(xiàn)環(huán)境中的數(shù)據(jù)庫系統(tǒng)l ca insight for distributed databases - 該部件安裝在數(shù)據(jù)庫服務器端,用于收集數(shù)據(jù)庫的實時性能,并將性能歸檔保存。l ca tsreorg 優(yōu)化提高數(shù)據(jù)庫的性能n 回收廢棄表空間,數(shù)據(jù)存儲優(yōu)化,索引優(yōu)化n 優(yōu)化期間,保證數(shù)據(jù)庫正常訪問性能和可用性n 檢查可能的失敗并恢復n 支持優(yōu)化作業(yè)的定時調度l ca fast upload提高業(yè)務數(shù)據(jù)的可用性n 快速的數(shù)據(jù)抽取n 支持多種格式輸出n 支持大表分解輸出到多個文件n 支持數(shù)據(jù)的快速重加載n 支持加載作業(yè)的定時調度進一步深入dcc和insight,它們的架構如下圖:l 門戶和web服務器基于ca的cleverpath產(chǎn)品,完全符合j2ee標準。門戶基于java,是用戶操作的主要界面,具備高度個性化的工作區(qū)。瀏覽器訪問的后端是一個apache tomcat的web服務器。在生產(chǎn)環(huán)境中,tomcat服務器應該具有足夠的帶寬并良好的性能以處理并發(fā)用戶請求。 管理數(shù)據(jù)庫 mdbca產(chǎn)品使用的通用數(shù)據(jù)庫,用來存儲運維數(shù)據(jù)。例如,存儲的數(shù)據(jù)可能是主機名、域名和在特定的服務器安裝的組件。目前,ca支持sql server和oracle以及ingres,使用后者客戶不需要購單獨付費了。與mdb的通信是通過odbc驅動的sql調用完成的,這作為安裝的一部分。 客戶端和基礎服務數(shù)據(jù)庫客戶端庫文件 - odbc驅動程序被集成安裝后,即負責與mdb通信,同時也負責遠程管理oracle、db2和ingres的引擎,避免了安裝遠程代理的麻煩。由數(shù)據(jù)庫廠商提供的連接工具也同時需要在 dcc上安裝,以連接到你想管理的數(shù)據(jù)庫(如oracle的sql*net或db2 connect.)。 mdb的客戶端進程o iigcn:為用戶進程提供信息,使用戶進程接受到本地服務器的連接。o iigcc:監(jiān)視本地到遠程服務器發(fā)出的通信以及遠程應用程序到本地服務器的通信。o iigcd:將jdbc驅動和.net data provider轉換為mdb的內部格式,并轉發(fā)請求到適當?shù)姆掌鳌?數(shù)據(jù)庫任務管理服務進程mitjasag進程負責監(jiān)視任務參數(shù)進入到圖形界面的過程,同時在mdb中檢查要執(zhí)行的動作,然后把參數(shù)傳遞到負責執(zhí)行的相應產(chǎn)品。工作可以立即執(zhí)行或推遲到預定的時間執(zhí)行。 rtserverinsight共有2個通信層,其中一個叫做“pec”。 dcc和其組件在與客戶端和代理通信時,pec負責傳送消息。最少也會有一個rtserver運行在服務器端上(通常是dcc portal服務器)。在其他服務器上安裝的insight代理將有一個或多個rtclient進程,借助pec連接到rtserver,與其他rtclient進程通信。例如,使用pec來調度:在遠程主機執(zhí)行一個任務,或者重組或卸載一個表。另外的通信層是dcc用來連接和瀏覽數(shù)據(jù)庫的odbc驅動。3.3 軟件配置n ca database command center r11.3 x 1n ca insight for distributed database x ? 3.4 硬件配置服務器名稱硬件類型操作系統(tǒng)/應用數(shù)量ca產(chǎn)品數(shù)據(jù)庫管理服務器pc服務器2個3g至強cpu。4g內存。150g硬盤空間以上u windows 2003 r2u ms sql 20051u ca database command center r11.34 業(yè)務保障管理4.1 概述ca spectrum service assurance manager通過創(chuàng)新、智能的業(yè)務建模,分析技術和根本原因手段來提高服務的可預測性、質量和效率。它可分析許多數(shù)據(jù)源的資料,計算it服務的質量和風險,通過靈活的服務儀表板為業(yè)務提供實時和歷史數(shù)據(jù)。 您可能已經(jīng)有若干個管理方案,支持包括it基礎設施或最終用戶體驗的各個方面。您可能會發(fā)現(xiàn),這些單項方案都無法可以為您提供真正完整的、端到端的服務的健康和可用性管理。服務往往依賴于您的基礎設施,跨越許多不同的領域,如網(wǎng)絡、系統(tǒng)、數(shù)據(jù)庫和應用程序。如果沒有整合工具,提供業(yè)務透視、集中告警、跨域的根源分析,操作人員必須經(jīng)常猜測是什么故障或性能問題影響了關鍵的it服務,降低了服務質量,或增加停機的風險。同樣,服務利益相關者可能無法完全查看他們的服務構成,結果就是不能完全了解他們是否能夠實現(xiàn)其業(yè)務目標。 ca spectrum service assurance manager可以幫助克服以上的挑戰(zhàn),原因在于它能夠統(tǒng)一來自所有域管理器的健康和可用性數(shù)據(jù),整合it服務和業(yè)務戰(zhàn)略。該產(chǎn)品引入了一種新的服務管理層,并通過一個開放和可擴展的集成框架,提升你現(xiàn)有的管理技術投資的價值。ca spectrum service assurance manager天然的與幾乎所有ca的監(jiān)控產(chǎn)品集成,同時支持第三方的應用程序。此外,您可以添加自定義的集成模塊來進一步擴展解決方案。 0創(chuàng)新、智能的服務建模是服務質量和風險管理的基礎,而且 ca spectrum service assurance manager 可簡化和促進端對端、實時的統(tǒng)一服務模型的構建任務。智能服務建模可從直接管理基礎架構和應用程序的 it 工具、以及包括由其創(chuàng)建的整個服務模型在內的配置管理數(shù)據(jù)庫中導入 it 組件(即基礎架構配置項、應用程序和交易)。0 服務的影響和風險分析根據(jù)服務模型組件狀態(tài)或服務模型結構本身的變化,促進服務交付質量和風險的動態(tài)計算。組件狀態(tài)由基礎域管理程序(即網(wǎng)絡、數(shù)據(jù)庫、系統(tǒng)和應用程序性能管理工具)進行監(jiān)測。狀態(tài)信息隨后由 ca spectrum service assurance manager 使用,其根本原因分析可確定服務質量影響的來源和服務交付的風險。 服務質量指示消費者對it服務的體驗的質量水平,無論是其他it服務,客戶或最終用戶。例如,ca wily cem則可能表明報警服務質量退化,因為它們可以說明在應用交易的問題,可能影響到最終用戶體驗的質量。 服務風險指示提供的服務質量在支持業(yè)務目標過程中發(fā)生的總體風險。增加風險的例子可能是冗余網(wǎng)絡服務器失效,或是一個數(shù)據(jù)庫集群發(fā)生了故障切換。ca spectrum service assurance manager具有在組件服務區(qū)分內收到報警類型的質量和風險的影響的能力。組件的狀態(tài)由域管理器進行監(jiān)測,如網(wǎng)絡,數(shù)據(jù)庫,系統(tǒng)和應用性能管理工具。狀態(tài)和報警信息會被傳遞到ca spectrum service assurance manager,它利用根本原因分析,找準影響服務交付退化的來源,如服務質量和風險。0 基于 soa的集成架構采用 ca 產(chǎn)品實現(xiàn)即裝即用的集成,面向基礎架構、應用程序性能管理、工作負荷、安全、合規(guī)和服務臺管理,以及第三方 it 管理產(chǎn)品。此外,還提供集成 sdk 用于定制集成。 基于角色的服務儀表板和服務控制臺ca spectrum service assurance manager提供了一個統(tǒng)一的中央控制臺,關聯(lián)域告警和資源服務。ca spectrum service assurance manager的告警包括諸如域管理警報的嚴重級別、告警所影響服務的數(shù)量,告警狀態(tài)對服務的影響,以及對這些服務的報警條件的影響。您可以確認、分配、批注和清除告警,并且可以發(fā)送通知消息,觸發(fā)升級的策略,例如生成故障單、發(fā)送電子郵件或調用自定義腳本。4.2 組件概述ca spectrum service assurance manager 包括以下的組件,共同來完成服務和資源的監(jiān)控: 集成框架集成框架(ifw)是整個的通信架構,ca spectrum service assurance manager用來連接到域管理器以及收集配置項(ci)、服務、拓撲和狀態(tài)信息。它使用了apache activemq消息代理,后者充分利用了java消息服務(jms)進行通信。 連接器連接器是一個網(wǎng)關,ca spectrum service assurance manager通過它收集各個的數(shù)據(jù)。連接器收集有關服務、獨聯(lián)體、拓撲和狀態(tài)信息。每一個已集成的產(chǎn)品都有自己的連接器,您可以使用通用連接器集成未預定義的產(chǎn)品。轉換器的策略將收集的數(shù)據(jù)標準化為spectrum service assurance manager的格式。每個連接器需要獲得其連接的域管理器的具體資料。系統(tǒng)會提示您在安裝過程中指定,您也可以在以后使用管理用戶界面更改。以下是部分connector的說明:ca nsm connector: worldview (wv) connector n wv 監(jiān)控對象創(chuàng)建為cin wv bpvs和dbpvs 創(chuàng)建為服務n wv 監(jiān)控對象狀態(tài)轉移作為告警發(fā)送 dsm connector n dsm 對象創(chuàng)建為ci ca spectrum im connector:spectrum 模型創(chuàng)建為cispectrum 服務創(chuàng)建為服務spectrum 告警作為告警發(fā)送 必須安裝在spectroserver上 ca ehealth connector:ehealth 元素創(chuàng)建為ciehealth 組/組列表創(chuàng)建為服務狀態(tài)轉移trap作為告警發(fā)送 支持本地和遠程安裝 ca wily cem connector:業(yè)務過程創(chuàng)建為服務 業(yè)務過程創(chuàng)建為cicem alarms 作為告警發(fā)送支持本地和遠程安裝 ca wily introscope connectorintroscope management models 創(chuàng)建為服務 introscope agent metrics 創(chuàng)建為ciintroscope alerts 作為告警發(fā)送 支持本地和遠程安裝 ca cmdb connector:導入 cmdb ci 和 services. 不轉發(fā)狀態(tài)轉移告警 支持本地和遠程安裝 通用連接器(universal connector )從ca和第三方產(chǎn)品處檢索服務、ci、狀態(tài)事件 提供web services 界面,定期檢索事件 將事件格式標準化然后交給sa manager在tomcat服務器上以web service運行,名字為genericconnectorservice sa managersa manager是spectrum service assurance manager的主要管理組件。它監(jiān)測管理資源的健康和可用性,處理來自域管理器的事件,并執(zhí)行服務的影響和風險分析。sa manager還更新sa store中存儲的分析結果和狀態(tài)變化,并提供數(shù)據(jù)到其他ca spectrum service assurance manager組件。sa manager為報警條件提供了以下功能: 自動通過電子郵件通知,基礎設施或服務的警報已創(chuàng)建 自動基于時間的警報升級,根據(jù)策略,例如通知技術人員或運行命令 建立在ca服務臺的故障單,并關聯(lián)報警和故障單 ui server 界面服務器是承載用戶界面應用程序服務器。用戶界面服務器托管在web服務器中,單一的ca spectrum service assurance manager支持多個用戶界面服務器,以滿足負載平衡。ca spectrum service assurance manager 擁有以下用戶界面: service console 支持所有管理功能,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度個人金融服務居間合作協(xié)議范本4篇
- 二零二五版物業(yè)經(jīng)營管理委托經(jīng)營管理合同樣本3篇
- 二零二五年度行政部合同簽訂、履行、終止全流程管理手冊3篇
- 西山區(qū)廚房防水施工方案
- 二零二五年度高品質消防管道材料采購及銷售合作協(xié)議2篇
- 二零二五年度全面物業(yè)保潔服務外包合同模板5篇
- 2025版銅門市場調研與銷售數(shù)據(jù)分析合同2篇
- 二零二五年度汽車金融債務追討委托合同3篇
- 二零二五年度家庭挖機作業(yè)安全管理合同4篇
- 二零二五年度住房公積金借款合同范本(全面升級)4篇
- 蘇北四市(徐州、宿遷、淮安、連云港)2025屆高三第一次調研考試(一模)英語試卷(含答案)
- 《酸堿罐區(qū)設計規(guī)范》編制說明
- 2023年十天突破公務員面試
- 《瘋狂動物城》中英文對照(全本臺詞)
- 醫(yī)院住院醫(yī)師規(guī)范化培訓證明(樣本)
- 小學六年級語文閱讀理解100篇(及答案)
- 氣功修煉十奧妙
- 安徽省物業(yè)服務標準
- 勾股定理的歷史與證明課件
- 淺談如何有效提高小學數(shù)學教學質量課件
- 新教材青島版三年級下冊科學全冊教學課件
評論
0/150
提交評論