




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
NC5.5監(jiān)控工具使用手冊概述
2系統(tǒng)要求
3監(jiān)控工具架構(gòu)
3部署
5部署環(huán)境(以NC+WAS垂直集群為例)
6部署步驟
6進(jìn)程監(jiān)控
13功能概述
13MW-XX的監(jiān)控
13DB-XX的監(jiān)控
15線程監(jiān)控
18功能概述
18線程信息說明
20監(jiān)控設(shè)置
21匯總顯示
23顯示過慮
24聯(lián)查操作員
25聯(lián)查數(shù)據(jù)庫
26數(shù)據(jù)庫
26功能概述
26監(jiān)控客戶端功能
26CPU監(jiān)控
30功能概述
30監(jiān)控客戶端功能
30內(nèi)存監(jiān)控
30功能概述
30監(jiān)控客戶端功能
31日志抽取
31功能概述
31NC客戶端日志級(jí)別設(shè)置
31日志數(shù)據(jù)庫
32NCLOG日志抽取
34抽取JVM日志
39抽取CPU
41抽取內(nèi)存日志
43監(jiān)控消息和快照信息日志
45操作員信息
46消息中心
47功能概述
47監(jiān)控客戶端功能
49安全設(shè)置
51功能概述
51監(jiān)控客戶端功能
51參數(shù)設(shè)置
52功能概述
52監(jiān)控客戶端功能
52應(yīng)用實(shí)例
52OVERVIEW
53進(jìn)程監(jiān)控
53線程監(jiān)控
55日志抽取
57DB-監(jiān)控
61消息中心
61典型案例
66概述NC一線實(shí)施與技術(shù)人員在客戶項(xiàng)目現(xiàn)場會(huì)經(jīng)常遇到以下類型難以處理的問題:1:一個(gè)操作大半天灰屏不出來,客戶極不滿意,而咱們現(xiàn)場人員也束手無策,不知道時(shí)間都耗在了哪里?如何處理?2:系統(tǒng)用了一段時(shí)間后,便越用越慢了,不知道為什么?慢在哪里?3:一到月末,并發(fā)數(shù)一上來,系統(tǒng)的壓力便加大,客戶端響應(yīng)變慢了。但系統(tǒng)壓力具體是大在數(shù)據(jù)庫、應(yīng)用服務(wù)器、還是網(wǎng)絡(luò)?客戶端響應(yīng)慢又慢在哪里?不知道如何處理。4:一個(gè)用戶登錄進(jìn)系統(tǒng),在某段時(shí)間里做了某些操作,這些操作的后臺(tái)日志,可能分布在集群系統(tǒng)的不同機(jī)器、不同目錄、不同日志文件下,如何將此操作用戶這段時(shí)間做的操作日志信息抽取過濾出來,這又是一個(gè)讓人束手無策的的問題?!5:NC系統(tǒng)經(jīng)常出現(xiàn)死機(jī)情況,導(dǎo)致客戶的業(yè)務(wù)經(jīng)常中斷,不停手工重啟,怎么辦?6:咱們系統(tǒng)集群的負(fù)載均衡情況怎樣、系統(tǒng)的吞吐量情況怎樣,咱們能否獲取這些信息并進(jìn)行評(píng)估?……咱們一線人員與技術(shù)顧問往往對(duì)以上問題感到頭痛,難以處理,最主要的原因便是無法獲取有效的信息以及對(duì)信息進(jìn)行處理的工具;而NCV55Monitor監(jiān)控工具,便是解決上述問題的一個(gè)強(qiáng)有力的收集有效信息并進(jìn)行監(jiān)控預(yù)警的工具。此工具功能強(qiáng)大,能為我們提供以下相關(guān)功能:1:中間件進(jìn)程監(jiān)控與問題恢復(fù):能監(jiān)控集群中對(duì)應(yīng)的每一個(gè)server健康狀況,并支持在server出現(xiàn)問題時(shí)能處理并重新恢復(fù)server的服務(wù)能力。2:線程監(jiān)控:能實(shí)時(shí)監(jiān)控每一個(gè)server中對(duì)應(yīng)客戶端提交任務(wù)對(duì)應(yīng)的線程的詳細(xì)狀態(tài)信息,能詳細(xì)到知道當(dāng)前任務(wù)在服務(wù)器端執(zhí)行到了哪一步,正在調(diào)用什么代碼或執(zhí)行哪些SQL語句等等;同時(shí)還支持對(duì)這個(gè)線程執(zhí)行了多長時(shí)間、多少條SQL語句、傳輸了多少數(shù)據(jù)等信息做統(tǒng)計(jì),以便技術(shù)顧問對(duì)系統(tǒng)做分析。3:數(shù)據(jù)庫監(jiān)控:監(jiān)控服務(wù)根據(jù)配置好的監(jiān)控腳本對(duì)數(shù)據(jù)庫進(jìn)行實(shí)時(shí)監(jiān)控。同時(shí)客戶端預(yù)制了大量的性能監(jiān)控腳本。對(duì)數(shù)據(jù)庫的監(jiān)控變得非常簡單。4:日志抽取分析:這是此工具中一個(gè)亮眼功能,能對(duì)NC的各種日志提供抽取、過濾、統(tǒng)計(jì)、分析功能;是一個(gè)日常應(yīng)用中非常實(shí)用的功能。5:消息中心:提供各個(gè)監(jiān)控服務(wù)產(chǎn)生的報(bào)警消息和系統(tǒng)自動(dòng)生成的快照。根據(jù)這些消息和快照可以事后分析系統(tǒng)問題。系統(tǒng)要求1:應(yīng)用服務(wù)器為NC55。2:數(shù)據(jù)庫監(jiān)控的腳本包括客戶端的一些性能監(jiān)控腳本目前只是支持oracle9i及以上版本。數(shù)據(jù)庫客戶端工具可以執(zhí)行oracle,SQLserver,db2的SQL命令。3:UNIX/LINUX系統(tǒng)如果要監(jiān)控CPU,則必須安裝mpstat,UNIX/LINUX系統(tǒng)如果要監(jiān)控內(nèi)存則必須要安裝vmstat。監(jiān)控工具架構(gòu)監(jiān)控域:指向同一個(gè)服務(wù)中心的一組監(jiān)控進(jìn)程,這些監(jiān)控進(jìn)程可以分布在多個(gè)物理服務(wù)器上。服務(wù)中心(ServiceCenter):用于注冊監(jiān)控域內(nèi)所有的服務(wù)和資源,同時(shí)提供服務(wù)啟動(dòng)控制、訪問日志、服務(wù)請求路由、安全檢查、動(dòng)態(tài)參數(shù)刷新功能。一個(gè)監(jiān)控域內(nèi)有且只有一個(gè)服務(wù)中心,所有的監(jiān)控進(jìn)程必須指定到一個(gè)已經(jīng)啟動(dòng)的服務(wù)中心。后臺(tái)服務(wù)以服務(wù)插件的形式提供,配置文件conf/service.xml定義了服務(wù)中心地址,服務(wù)的屬性。包括服務(wù)名、是否啟動(dòng)、是否需要安全檢查、是否域內(nèi)唯一、消息處理方式、快照項(xiàng)目。新開發(fā)的服務(wù)可以直接在service.xml注冊。服務(wù)啟動(dòng)引擎根據(jù)服務(wù)配置啟動(dòng)服務(wù),每個(gè)服務(wù)啟動(dòng)后會(huì)向服務(wù)中心注冊??蛻舳送ㄟ^訪問服務(wù)中心可以把可以訪問的服務(wù)資源下載到本地??蛻舳送瑯硬捎昧瞬寮降募軜?gòu),通過配置文件conf/resource/resource-client.xml配置每個(gè)服務(wù)對(duì)應(yīng)的客戶端UI。每個(gè)監(jiān)控域的信息都保存在conf/resource/domain.xml文件中,每次啟動(dòng)客戶端會(huì)自動(dòng)連接domai.xml文件中的監(jiān)控域。服務(wù)中心提供了一種簡單的安全機(jī)制。管理員可以配置一個(gè)用戶名和密碼。需要安全保護(hù)的服務(wù)需要通過這個(gè)認(rèn)證才可以被訪問。比如數(shù)據(jù)庫,只有通過了安全檢查服務(wù)的認(rèn)證才能對(duì)數(shù)據(jù)庫操作。部署典型部署圖(推薦):典型模式是監(jiān)控服務(wù)中心部署在NC的服務(wù)器上,監(jiān)控服務(wù)也同時(shí)部署在NC的服務(wù)器上。獨(dú)立部署模式:Monitorserver可以部署到一個(gè)獨(dú)立服務(wù)器上,但這樣不能監(jiān)控NCServer的NCLOGS、CPU和內(nèi)存,同樣也不能抽取NCServer的NCLOGS,CUP和內(nèi)存的日志。部署環(huán)境(以NC+WAS垂直集群為例)ServerHost56服務(wù)節(jié)點(diǎn)master、ncMem01、ncMem02應(yīng)用代碼目錄D:\ufsoft\nc55\APACHE目錄D:\IBM\HTTPServer中間件was6.1.10.DMserver啟動(dòng)在56,端口為8879數(shù)據(jù)庫ORACLE10G
部署步驟1:拷貝代碼:拷貝代碼前,先做好正式環(huán)境的代碼備份,將monitorpackfor55.rar解壓到monitorpackfor55目錄。將monitorpackfor55目錄的下的文件拷貝到應(yīng)用服務(wù)器的D:\ufsoft\nc55\目錄下。代碼覆蓋后,不需要部署,需要重新啟動(dòng)WAS中間件或NC中間件??蛻舳诵枰顺鯥E,然后重新登錄NC。如果是水平集群,則需要將monitorpackfor55目錄的下的文件拷貝到從服D:\ufsoft\nc55目錄下。提示:備份代碼時(shí),一定不要在代碼的同目錄下備份,要將代碼拷貝到NC環(huán)境外的目錄備份。2:配置服務(wù)中心:在server上啟動(dòng)D:\ufsoft\nc55\nmc\server\configure.bat,設(shè)置servicecenter,如果是多網(wǎng)卡,則必須指定一個(gè)除了以外的地址。這里將服務(wù)中心設(shè)置為56,管理員默認(rèn)為admin,密碼為xxxxx,端口9999為系統(tǒng)默認(rèn),盡量不要改,如果改為其他端口,需要同時(shí)改D:\ufsoft\nc55\nmc\server\conf\server.xml文件修改對(duì)應(yīng)的端口。LocalServer中的host可以設(shè)置為或本機(jī)的IP地址56。D:\ufsoft\nc55\nmc\server\configure.bat命令的運(yùn)行界面如下:說明:運(yùn)行configure.bat命令需要設(shè)置JAVA_HOME:
set
JAVA_HOME=JDK存放的目錄,如:setJAVA_HOME=../../ufjdk
或setJAVA_HOME=D:\ufida502\nchome\ufjdk同樣,其它命令,如startmonitor.bat,MonitorConsole.bat等也需要同樣的設(shè)置。如果是水平集群,則在從服務(wù)器上運(yùn)行..\nmc\server\configure.bat命令,需要將ServerCenter中Host項(xiàng)的值,設(shè)置為主服務(wù)器的IP地址如:56.
LocalServer中的host項(xiàng)的值是從服務(wù)器的IP地址如57或注意:Unix如果服務(wù)器操作系統(tǒng)無法啟動(dòng)圖形界面,可以直接修改配置文件nmc\server\conf\services.xml。配置監(jiān)控安全管理員,可以通過命令securityset.sh修改。3:指定WASDM服務(wù)器,在D:\ufsoft\nc55\nmc\server\configure.bat的運(yùn)行界面上的屬性配置(perites)的tab頁中修改屬性nodeagenthost,nodeagentport。如果不是WAS中間件,則將nodeagenthost設(shè)置為空。如果monitorserver監(jiān)控工具安裝在單獨(dú)的一臺(tái)機(jī)器,則同樣需要nodeagenthost設(shè)置成集群中WASDM服務(wù)器的IP地址。4:確保D:\ufsoft\nc55\ierp\bin\prop.xml文件的配置和實(shí)際環(huán)境的配置相同.特別是中間件為websphere的情況下,prop.xml可能會(huì)存在和實(shí)際環(huán)境不同的情況,因?yàn)楸O(jiān)控工具通過讀這個(gè)文件來獲取中間件和數(shù)據(jù)庫的信息,所以,必須要確保這個(gè)文件的配置和真實(shí)環(huán)境的配置相符(包括中間件,數(shù)據(jù)庫,webserver).可以通過ncsysconfig.bat對(duì)環(huán)境配置。另外,如果上圖中的propfile的值不是相對(duì)路徑../../ierp/bin/prop.xml,是指定的絕對(duì)路徑,則需要用\\作為分隔符如d:\\monitornc55ok\\ierp\\bin\\prop.xml,否則啟動(dòng)時(shí)會(huì)提示找不到文件。特別說明:(1)如果在WAS管理控制臺(tái)中更改了單個(gè)Server或者集群中某個(gè)成員Server的端口,一定要在NC的prop.xml文件中修改該對(duì)應(yīng)的端口。否則在NC5.5監(jiān)控工具的客戶端,將會(huì)檢測不到該端口對(duì)應(yīng)的Server信息。WEB服務(wù)器的地址也要配置,不能為空。如下圖(2)如果是數(shù)據(jù)庫是RAC環(huán)境,需要prop.xml文件中將數(shù)據(jù)源拆分成兩個(gè)針對(duì)單個(gè)實(shí)例的數(shù)據(jù)源.這樣可以保證做快照和數(shù)據(jù)庫檢查的性能.但是,部署時(shí)需要用原來的數(shù)據(jù)源。比如:<databaseUrl>jdbc:oracle:thin:@(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=1)(PORT=1521))(ADDRESS=(PROTOCOL=TCP)(HOST=2)(PORT=1521))(LOAD_BALANCE=yes)(CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=ncdata)))</databaseUrl>改成:<dataSource><dataSourceName>dbsource11</dataSourceName>……..<databaseUrl>jdbc:oracle:thin:@1:1521:ncdata</dataDbaseUrl>…</dataSource><dataSource><dataSourceName>dbsource12</dataSourceName>………<databaseUrl>jdbc:oracle:thin:@1:1521:ncdata</dataDbaseUrl>………….</dataSource>5:消息自動(dòng)發(fā)送郵件的功能郵件配置:郵件服務(wù)器(SMTP)可以是任何有效的郵件服務(wù)器,如但是,帳號(hào)和密碼填寫針對(duì)“發(fā)送郵件服務(wù)器”有效的帳號(hào)和密碼。郵件發(fā)送的地址:在下面屬性配置頁簽,配置消息自動(dòng)發(fā)送到的郵件地址。說明:郵件發(fā)送的地址是填寫任何有效的郵件地址。如:xxx@或xxx@6:在server上啟動(dòng)D:\ufsoft\nc55\nmc\server\startmonitor.bat如果是水平集群,則主服務(wù)器啟動(dòng)后,再在從服務(wù)器上對(duì)應(yīng)目錄運(yùn)行startmonitor.bat7:啟動(dòng)客戶端.將D:\ufsoft\nc55\nmc\client拷貝到任意一個(gè)客戶端機(jī)器.執(zhí)行D:\ufsoft\nc55\nmc\client\monitorconsole.bat,第一次執(zhí)行在沒有監(jiān)控域的情況下,需要添加監(jiān)控域,監(jiān)控域名稱任意,服務(wù)中心地址為:56,端口9999,用戶名admin,密碼xxxxx,(都是在步驟2中配置的)。說明:啟動(dòng)monitorconsole.bat需要設(shè)置JAVA_HOME,如setJAVA_HOME=D:\ufida502\nchome\ufjdk啟動(dòng)后提示如下:需要增加監(jiān)控域域名可以隨意寫入NC某項(xiàng)目或56,服務(wù)中心地址必須寫服務(wù)中心(ServiceCenter)的IP地址:如56啟動(dòng)后的客戶端如注:進(jìn)入上圖方式:選擇一個(gè)監(jiān)控域,工具->overview,或者第一次登陸到監(jiān)控系統(tǒng)的第一個(gè)頁面,提供一種整個(gè)監(jiān)控系統(tǒng)的概要信息。主要功能:1.展現(xiàn)整個(gè)系統(tǒng)的部署方式.包括apache,中間件,數(shù)據(jù)庫.2.
動(dòng)態(tài)顯示中間件的和數(shù)據(jù)庫的性能指標(biāo).中間件動(dòng)態(tài)柱狀圖顯示jvmheap信息,和web線程信息,數(shù)據(jù)庫柱狀圖顯示數(shù)據(jù)庫活動(dòng)會(huì)話的個(gè)數(shù).如:鼠標(biāo)點(diǎn)中上圖的ncMem02圖標(biāo),會(huì)自動(dòng)顯示該成員的信息如下:3.
報(bào)警.如果某個(gè)server有報(bào)警信息,則相應(yīng)的服務(wù)器會(huì)變紅,鼠標(biāo)點(diǎn)上去會(huì)顯示報(bào)警信息.4.服務(wù)器端主要的配置文件:(1)安全設(shè)置:Monitor/server/conf/perties,用于設(shè)置對(duì)需要安全驗(yàn)證的服務(wù)訪問的權(quán)限用戶(2)服務(wù)配置:monitor/server/conf/services.xml:(3)各種監(jiān)控參數(shù)配置:monitor/server/conf/perties進(jìn)程監(jiān)控功能概述進(jìn)程監(jiān)控服務(wù)主要實(shí)現(xiàn)如下功能:1:定時(shí)對(duì)中間件狀態(tài)檢查,包括端口響應(yīng)的時(shí)間和內(nèi)存使用的情況,如:當(dāng)發(fā)現(xiàn)中間件不能正常工作,則可以對(duì)其自動(dòng)重啟。2:定時(shí)將jvmheap的使用情況和中間件webthread,serivcethread信息寫入日志,通過日志抽取和分析的功能可以對(duì)系統(tǒng)進(jìn)行性能評(píng)估和性能診斷。3:定時(shí)更新數(shù)據(jù)庫連接池的信息和數(shù)據(jù)庫活動(dòng)會(huì)話的信息。4:如果是WAS中間件,提供對(duì)中間件的管理功能,比如重啟,生成javacore,heapdump,設(shè)置定時(shí)重啟等。通過上面的進(jìn)程監(jiān)控功能,可以獲取NC服務(wù)的運(yùn)行狀態(tài)、Webcontainer線程池的大小、當(dāng)前遠(yuǎn)程調(diào)用線程數(shù)、當(dāng)前后臺(tái)服務(wù)的線程數(shù)、Jvmheap的max值、Jvmheap當(dāng)前的free值、Jvmheapused值、數(shù)據(jù)庫連接池的大小、數(shù)據(jù)庫的活動(dòng)會(huì)話數(shù)等,同時(shí)根據(jù)需要直接在監(jiān)控工具中定時(shí)、關(guān)閉和啟動(dòng)NC服務(wù)等。MW-XX的監(jiān)控客戶端功能:定時(shí)獲得某個(gè)中間件的概要信息,包括部署信息和性能信息等。自動(dòng)刷新設(shè)置:設(shè)置自動(dòng)獲取服務(wù)器信息的頻率.可以及時(shí)獲取最新信息。自動(dòng)刷新設(shè)置后,會(huì)有對(duì)應(yīng)于每個(gè)中間件的折線圖.可以直觀的看到每個(gè)中間件的內(nèi)存使用情況.如果使用自動(dòng)刷新功能,需要先設(shè)置,如:點(diǎn)擊”自動(dòng)刷新設(shè)置”,彈出對(duì)話框,然后設(shè)置自動(dòng)刷新的時(shí)間如5秒等,確定后即可。設(shè)置自動(dòng)刷新的秒數(shù)間隔:在進(jìn)程監(jiān)控中,可以對(duì)NC服務(wù)進(jìn)行啟動(dòng)、停止、重啟、定時(shí)等。啟動(dòng):啟動(dòng)選擇中間件。停止:停止選擇的中間件。重啟:重啟選擇的中間件。定時(shí):為選擇的中間件設(shè)置定時(shí)重起。必須先重起master。打補(bǔ)丁如果需要重啟中間件,可以利用這個(gè)功能輪循啟動(dòng)中間件.Dumpthread:對(duì)選擇中的中間件手工生成Dumpthread。DumpHeap:對(duì)選擇中的中間件手工生成DumpHeap。選中上面的任何一行,如ncMem02所在的行,然后雙擊,則彈出下面的對(duì)話框:上圖中的字段解釋如下:字段說明服務(wù)名中間件名稱狀態(tài)有三種狀態(tài):Running/down/starting主機(jī)中間件服務(wù)器地址端口中間件端口重啟定時(shí)定時(shí)重啟,可以通過右鍵或者管理->定時(shí)設(shè)置Web線程池Webcontainer線程池的大小Web線程當(dāng)前遠(yuǎn)程調(diào)用線程數(shù)服務(wù)線程當(dāng)前后臺(tái)服務(wù)的線程數(shù)Jvmmax(m)Jvmheap的設(shè)置(max)Jvmtotal(m)Jvmheap當(dāng)前的total值Jvmfree(m)Jvmheap當(dāng)前的free值Jvmused(m)Jvmheapused上次端口檢查耗時(shí)最近一次端口探測的響應(yīng)時(shí)間可管理如果啟動(dòng)wasdm,則為true,否則為false.可管理意味著可以遠(yuǎn)程對(duì)中間件進(jìn)行啟動(dòng),關(guān)閉,生成HEAPDUMP、THREADDUMP.當(dāng)監(jiān)控服務(wù)發(fā)現(xiàn)中間件不響應(yīng)時(shí),可以根據(jù)監(jiān)控服務(wù)配置的管理策略對(duì)其自動(dòng)重啟.如果不能管理,則意味著只能做監(jiān)控.
DB-XX的監(jiān)控客戶端功能:DB-XX的監(jiān)控包括數(shù)據(jù)庫連接池的信息和數(shù)據(jù)庫活動(dòng)會(huì)話的信息等信息。選中上面的任何一行,如ncv55所在的行,然后雙擊,則彈出下面的對(duì)話框,上圖字段說明:字段說明數(shù)據(jù)源數(shù)據(jù)源名稱數(shù)據(jù)庫類型數(shù)據(jù)庫類型連接字符串?dāng)?shù)據(jù)庫的jdbc連接串連接池大小顯示為default-max.連接池已用在對(duì)應(yīng)的中間件連接池中有多少連接為使用狀態(tài).dbActiveSessions數(shù)據(jù)庫的活動(dòng)會(huì)話數(shù)最近檢查時(shí)間最近進(jìn)行數(shù)據(jù)庫健康檢查的時(shí)間
同樣選中上面的任何一行,如nc55所在的行,然后在工具欄中點(diǎn)擊“查詢”可以切換到對(duì)數(shù)據(jù)信息進(jìn)行跟蹤的界面.如下圖監(jiān)控下拉列表中可以看到:可以查看的數(shù)據(jù)庫信息??梢栽趎mc\client\conf\SQL\fixSQL.cfg,中看到每個(gè)查詢對(duì)應(yīng)的SQL。如選擇監(jiān)控下拉列表中的“數(shù)據(jù)庫文件的使用情況“,下圖中就是查詢的結(jié)果.另外,也可以在DB-ncv55中直接寫SQL語句,點(diǎn)擊工具欄中的“執(zhí)行”按鈕,即可執(zhí)行自己寫的SQL.如下面是查詢NC產(chǎn)品版本信息的SQL。線程監(jiān)控功能概述線程監(jiān)控包括調(diào)試模式的設(shè)置,實(shí)時(shí)線程信息的跟蹤,穿透到數(shù)據(jù)庫,聯(lián)查操作員信息,每個(gè)線程的性能統(tǒng)計(jì)信息等。通過這些信息,可以知道線程中SQL的執(zhí)行時(shí)間、從數(shù)據(jù)庫中讀取數(shù)據(jù)到應(yīng)用服務(wù)器的時(shí)間、數(shù)據(jù)從應(yīng)用服務(wù)器傳到客戶端的時(shí)間、發(fā)起遠(yuǎn)程調(diào)用的操作員及IP、線程的堆棧、SQL的堆棧等.這樣就可以判斷出是個(gè)哪個(gè)SQL運(yùn)行耗時(shí),時(shí)間是耗在網(wǎng)絡(luò)上還是數(shù)據(jù)庫讀取上,是哪個(gè)操作員正在執(zhí)行的業(yè)務(wù),從而可以從業(yè)務(wù)、網(wǎng)絡(luò)或SQL上進(jìn)行優(yōu)化。線程監(jiān)控ALL是查看所有中間件的線程。線程監(jiān)控某個(gè)具體的服務(wù),如ncMem02是只查看ncMem02上的線程.線程監(jiān)控圖選中上面的任何一行,如ncMem02所在的行,然后雙擊,則彈出下面的對(duì)話框,可以看到詳細(xì)的線程信息。在下面的線程信息說明中對(duì)每個(gè)字段有詳細(xì)描述。線程信息說明線程信息說明:字段說明服務(wù)全局模式下中間件的名稱線程名稱線程名稱線程狀態(tài)當(dāng)前線程狀態(tài)當(dāng)前事件當(dāng)前線程正在做的事件性能統(tǒng)計(jì)當(dāng)前線程到當(dāng)前的性能統(tǒng)計(jì).耗時(shí)當(dāng)前線程運(yùn)行到目前的執(zhí)行時(shí)間遠(yuǎn)程調(diào)用方法遠(yuǎn)程調(diào)用方法客戶端地址發(fā)起遠(yuǎn)程調(diào)用的客戶端地址操作員發(fā)起遠(yuǎn)程調(diào)用的操作員主鍵操作員編碼發(fā)起遠(yuǎn)程調(diào)用的操作員名稱操作員名稱發(fā)起遠(yuǎn)程調(diào)用的操作員名稱.
性能統(tǒng)計(jì)說明:字段說明SQLcosttime當(dāng)前線程所有SQL的執(zhí)行時(shí)間(不包括fetch結(jié)果集)readresulttime當(dāng)前線程fetch結(jié)果集的總時(shí)間readrownum當(dāng)前線程共fetch了多少條記錄.writetoclienttime當(dāng)前線程寫數(shù)據(jù)到客戶端的時(shí)間(網(wǎng)絡(luò)耗時(shí))writetoclientbytes當(dāng)前線程寫到客戶端的總字節(jié)數(shù)notclosedconnectioncount當(dāng)前線程沒有關(guān)閉的數(shù)據(jù)庫連接數(shù)
線程SQL堆棧說明:字段說明SQL第一條為統(tǒng)計(jì)信息,包括sql執(zhí)行數(shù)量總計(jì)sql執(zhí)行時(shí)間總計(jì)(不包括fetch結(jié)果集);占用數(shù)據(jù)庫連接數(shù)總計(jì).執(zhí)行狀態(tài)有兩種狀態(tài),running|finished耗時(shí)Sql執(zhí)行時(shí)間數(shù)據(jù)庫連接執(zhí)行sql的數(shù)據(jù)庫連接ID.數(shù)據(jù)源執(zhí)行SQL的數(shù)據(jù)源名稱.
線程Thead堆棧說明:調(diào)試模式下,線程堆棧為線程的實(shí)時(shí)堆棧.非調(diào)試模式下,線程堆棧為最近一次獲取數(shù)據(jù)庫連接時(shí)的堆棧.目前的線程事件:1.獲取數(shù)據(jù)庫連接2.sql翻譯3.執(zhí)行sql.4.調(diào)用EJB5.序列化6.往客戶端寫數(shù)據(jù)7.調(diào)用master8.線程到數(shù)據(jù)庫的映射9.回滾,提交監(jiān)控設(shè)置1:
全局調(diào)試開:除服務(wù)線程外的所有的線程默認(rèn)都是調(diào)試模式.2:
全局調(diào)試關(guān):所有的線程默認(rèn)都不是調(diào)試模式.3:
選擇調(diào)試用戶:將選擇的用戶的遠(yuǎn)程調(diào)用設(shè)置為調(diào)試模式.此時(shí)全局模式自動(dòng)為關(guān)閉狀態(tài).4:
取消用戶調(diào)試:取消用戶調(diào)試模式.5:
服務(wù)線程調(diào)試開:在全局模式為開的情況下,服務(wù)線程處于調(diào)試狀態(tài).6:
服務(wù)線程調(diào)試關(guān):服務(wù)線程設(shè)置為非調(diào)試狀態(tài).關(guān)于調(diào)試模式的說明:一個(gè)線程如果是調(diào)試狀態(tài),則:1:這個(gè)線程的所有的數(shù)據(jù)庫操作都會(huì)將線程信息映射到數(shù)據(jù)庫.2:客戶端獲取線程堆棧都將是實(shí)時(shí)的堆棧.3:對(duì)中間件做快照時(shí),只有處于DEBUG模式的線程會(huì)參與快照.打開全局調(diào)試開的方法:
監(jiān)控設(shè)置全局調(diào)試開如,設(shè)置全局調(diào)試開后,線程監(jiān)控界面的“調(diào)試模式”顯示為是。下圖紅色部分。將用戶設(shè)置成調(diào)試模式方法如下:監(jiān)控設(shè)置選擇調(diào)試用戶:
彈出如下對(duì)話框“選擇用戶對(duì)話框”。選中y1用戶,確定后,下圖中藍(lán)色行對(duì)應(yīng)的調(diào)試模式為“是”。匯總顯示將客戶端顯示的所有服務(wù)器的所有的線程信息,包括SQL堆棧和線程堆棧顯示在匯總顯示.如下圖中WebContainer:5,拖動(dòng)右邊滾動(dòng)條可以看到WebContainer:6等。SQL堆棧和線程堆棧的說明,在線程信息說明中有詳細(xì)的介紹。顯示過慮設(shè)置當(dāng)前客戶端顯示的線程信息的條件.目前有如下過慮條件:線程耗時(shí),操作員編碼,操作員名稱,客戶端地址,服務(wù).默認(rèn)情況下不顯示服務(wù).聯(lián)查操作員聯(lián)查當(dāng)前操作員更加相信的信息(來自于bd_psnbasdoc).點(diǎn)擊工具欄中的”聯(lián)查操作員”,在下圖中選擇對(duì)應(yīng)的數(shù)據(jù)庫然后就可以看到該操作員的如下信息:聯(lián)查數(shù)據(jù)庫a)
如果當(dāng)前的線程事件是執(zhí)行一個(gè)SQL,則聯(lián)查數(shù)據(jù)庫,直接可以看到當(dāng)線程在數(shù)據(jù)庫端的狀態(tài).包括其執(zhí)行計(jì)劃。b)
在數(shù)據(jù)庫端,可以直接將對(duì)應(yīng)的會(huì)話kill掉,從而將中間件的線程kill掉.連查詢數(shù)據(jù)庫方法同連查操作員方法.連查到數(shù)據(jù)庫后的界面,同DB-XX中的“查詢”按鈕功能.數(shù)據(jù)庫功能概述1.
提供一組數(shù)據(jù)庫健康檢查的服務(wù).當(dāng)發(fā)現(xiàn)數(shù)據(jù)庫有性能問題時(shí),發(fā)送快照或者報(bào)警消息.2.
提供客戶端可以調(diào)用的數(shù)據(jù)庫操作方法.監(jiān)控客戶端功能監(jiān)控服務(wù)根據(jù)配置好的監(jiān)控腳本對(duì)數(shù)據(jù)庫進(jìn)行實(shí)時(shí)監(jiān)控.同時(shí)客戶端預(yù)制了大量的性能監(jiān)控腳本.對(duì)數(shù)據(jù)庫的監(jiān)控變得非常簡單.1.
預(yù)制了一些常用的用于性能監(jiān)控的腳本.如果要增加其他性能監(jiān)控腳本,直接修改client/conf/SQL/fixSQL.cfg即可.2.
執(zhí)行SQL:在SQL文本區(qū)選擇要執(zhí)行SQL的SQL,在工具欄中點(diǎn)執(zhí)行按鈕。3.
根據(jù)sql執(zhí)行的結(jié)果集,可能穿透到其他結(jié)果集.比如,根據(jù)會(huì)話信息,可以聯(lián)查對(duì)應(yīng)的SQL,通過SQL結(jié)果集,可以聯(lián)查到對(duì)應(yīng)得執(zhí)行計(jì)劃.4.
對(duì)于結(jié)果集可以導(dǎo)出到sql/xml/文本.在左邊樹型結(jié)構(gòu)中,選中數(shù)據(jù)庫下對(duì)應(yīng)的數(shù)據(jù)源,如ncv55,雙擊后會(huì)在右側(cè)彈出對(duì)話框,然后在工具欄中:監(jiān)控下拉列表中可以看到可以查看的數(shù)據(jù)庫信息.如選擇監(jiān)控下拉列表中的“數(shù)據(jù)庫文件的使用情況“,下圖中就是查詢的結(jié)果.也可以在DB-ncv55中直接寫SQL語句,點(diǎn)擊工具欄中的“執(zhí)行”按鈕,即可執(zhí)行自己寫的SQL.如下面是查詢NC產(chǎn)品版本信息的SQL。查看SQL執(zhí)行計(jì)劃的方法:工具欄中“監(jiān)控->長時(shí)sql”,如下圖查詢出比較耗時(shí)的SQL,然后選中,右鍵即可顯示出該SQL的執(zhí)行計(jì)劃??茨硤?zhí)行SQL的執(zhí)行計(jì)劃CPU監(jiān)控功能概述1.
實(shí)現(xiàn)了對(duì)各種平臺(tái)的cpu的監(jiān)控.定時(shí)將cpu的運(yùn)行狀態(tài)寫入日志,便于日后性能分析。2.
當(dāng)發(fā)現(xiàn)某CPU持續(xù)高于某閥值,則發(fā)送報(bào)警消息。監(jiān)控客戶端功能對(duì)服務(wù)器端CPU的監(jiān)控。自動(dòng)刷新設(shè)置:設(shè)置CPU性能數(shù)據(jù)的自動(dòng)刷新頻率.內(nèi)存監(jiān)控功能概述日志監(jiān)控服務(wù)對(duì)服務(wù)器內(nèi)存進(jìn)行定時(shí)監(jiān)控.并將內(nèi)存信息寫入日志,便于日后對(duì)性能進(jìn)行分析。監(jiān)控客戶端功能服務(wù)器端內(nèi)存監(jiān)控.日志抽取功能概述將NC的日志和監(jiān)控服務(wù)產(chǎn)生的日志(比如:NCLOG,CPU,JVM,內(nèi)存日志)抽取到本地?cái)?shù)據(jù)庫.同時(shí)提供一個(gè)客戶端的工具,對(duì)本地的日志進(jìn)行分析.NC客戶端日志級(jí)別設(shè)置服務(wù)器端的日志輸出級(jí)別可以根據(jù)特定的用戶來綁定.如用戶A可以把自己的日志輸出級(jí)別設(shè)置為DEBUG,這樣用戶A的所有后臺(tái)操作的日志輸出級(jí)別都是DEBUG.無論后臺(tái)的日志默認(rèn)級(jí)別是什么.客戶端設(shè)置后臺(tái)日志級(jí)別的方法:登陸到NC桌面后,點(diǎn)擊右上角的日志,彈出一個(gè)日志對(duì)話框,設(shè)置remoteloglevel.注意:調(diào)試完畢后將它設(shè)置成為后臺(tái)默認(rèn)的日志級(jí)別模式!日志數(shù)據(jù)庫日志數(shù)據(jù)庫一個(gè)嵌入式數(shù)據(jù)庫,是存儲(chǔ)從NC日志、CPU、內(nèi)存等抽取的日志信息。數(shù)據(jù)可以通過抽取的方式獲得,也可以通過導(dǎo)入的方式獲得。如工具欄中:工具日志數(shù)據(jù)庫
即轉(zhuǎn)換到日志數(shù)據(jù)庫界面。此工具可以對(duì)日志數(shù)據(jù)庫進(jìn)行分析,可以寫各種SQL來分析,默認(rèn)提供了一些常用的腳本。其他腳本可以根據(jù)需要通過修改配置文件monitor/client/conf/SQL/logSQL.cfg來完成。雙擊上面查詢出的結(jié)果的任何一行,可以看到相應(yīng)的信息,如下:日志客戶端的一些配置文件:Monitor/client/conf/SQL/logsql.cfg:默認(rèn)的日志分析的sql.Monitor/client/resource/logdb.xml,日志數(shù)據(jù)庫的配置文件,包括日志數(shù)據(jù)庫的信息,和一些默認(rèn)的表DDL.Monitor/client/logdb/logdb.mdb:默認(rèn)的日志數(shù)據(jù)庫.NCLOG日志抽取
NCLOG日志抽取是從NC的日志目錄nclogs目錄中抽取的,抽取的內(nèi)容包括NC的報(bào)錯(cuò)信息,遠(yuǎn)程調(diào)用信息,statement信息,執(zhí)行方法信息等。抽取的詳細(xì)信息見表日志表logdetail和日志表summary表。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫(client\logdb\logdb.mdb)中,NCLOGS日志抽取后保存的表是logdetail和summary,字段信息保存在nmc\client\conf\resource\logdb.xml文件中.日志表logdetail表的信息字段含義id記錄IDcallid遠(yuǎn)程調(diào)用的IDuserid操作員IDthread線程名稱hostNC服務(wù)器的IPportNC服務(wù)器的端口.ts時(shí)間戳remotecall遠(yuǎn)程調(diào)用的服務(wù)名debuglevelNC的日志級(jí)別:如ERROR/INFO/WARNING等msgNC的日志信息:如錯(cuò)誤信息,警告信息等costtime耗時(shí)flowsize流量serverNC服務(wù)器:如:mastr/ncMem01/ncMem0Nfile抽取的NC服務(wù)器端日志文件的位置,如:..\..\nclogs\ncMem01\anony-log[0].log
日志表summary表的信息字段含義id記錄IDcallid遠(yuǎn)程調(diào)用的IDremoteCallMethod遠(yuǎn)程調(diào)用方法remoteAddr發(fā)起遠(yuǎn)程調(diào)用的客戶端地址userid操作員IDthread線程名稱begintime線程開始時(shí)間costtime線程運(yùn)行時(shí)間SQLcosttime當(dāng)前線程所有SQL的執(zhí)行時(shí)間(不包括fetch結(jié)果)readrownum當(dāng)前線程總共fetch了多少條記錄.readresulttime當(dāng)前線程fetch結(jié)果集的時(shí)間writetoclienttime當(dāng)前線程寫數(shù)據(jù)到客戶端的時(shí)間(網(wǎng)絡(luò)耗時(shí))writetoclientbytes當(dāng)前線程寫到客戶端的字節(jié)數(shù)notclosedconnectioncount當(dāng)前線程沒有關(guān)閉的數(shù)據(jù)庫連接數(shù)
抽取方法:選中日志抽取項(xiàng)后,工具欄中:抽取NCLOG下圖是抽取的過程:查看NCLOG日志信息方法:如下圖,工具日志數(shù)據(jù),就切換到日志數(shù)據(jù)界面,然后常用腳本下拉框中預(yù)制了:執(zhí)行方法統(tǒng)計(jì)、statements、報(bào)錯(cuò)信息統(tǒng)計(jì)、遠(yuǎn)程調(diào)用統(tǒng)計(jì)直接選擇常用腳本報(bào)錯(cuò)信息統(tǒng)計(jì)
就會(huì)查詢出NC的報(bào)錯(cuò)信息。也可以在日志數(shù)據(jù)界面,直接寫SQL,如下圖,然后點(diǎn)工具欄中的”執(zhí)行”查詢。下面是抽取NCLOG的條件說明:抽取條件說明服務(wù)器:指安裝NC的應(yīng)用服務(wù)器,可以使多臺(tái)服務(wù)器。如集群時(shí)為多臺(tái)。時(shí)間范圍:按照圖示的格式輸入。操作員:點(diǎn)擊“選擇操作員”按鈕,彈出如下對(duì)話框,然后選擇對(duì)應(yīng)的操作員即可。日志文件全名包括(like):如輸入
master,則抽取的日志信息是master目錄下的所有日志信息.如果輸入summary,則表示抽取日志文件名包含summary的日志。自定義條件:可以把以下字段作為自定義條件:Id,callid,userid,thread,host,port,ts,remotecall,debuglevel,msg
比如以下條件是可以的:Debuglevel=ERRORANDuserid=#UAP#andremotecall=nc.ui.test.ITest以下抽取條件只抽取報(bào)錯(cuò)信息。抽取JVM日志JVM的抽取信息為:JVM的最大值、JVM的空閑值及JVM的信息等。通通過這些信息,我們就可以知道NC的某個(gè)服務(wù)的內(nèi)存歷史使用情況及JVM出現(xiàn)問題的信息等。JVM的日志抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\mw目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是jvmlog。JVM表jvmlog表的信息字段含義server服務(wù)器名servernameNC服務(wù)名:如:mastr/ncMem01/ncMem0NmaxJVM最大值totaltotalfreeJVM的空閑值ratiofree/totalmsg進(jìn)程監(jiān)控輸出的信息如masterisnotstarted,waituntilitstarted!wcthreadnum當(dāng)前web線程數(shù)servicethreadnum當(dāng)前服務(wù)線程數(shù)wcrange連接池大小file抽取的NC服務(wù)器端日志文件的位置,如:..\..\nclogs\ncMem01\anony-log[0].log
抽取及查看JVM日志方法如下:
抽取JVM設(shè)置好抽取的條件后,點(diǎn)“確定”,下圖顯示抽取日志的過程。然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對(duì)應(yīng)的選項(xiàng)查看對(duì)應(yīng)的日志信息。也可以根據(jù)需要自己寫腳本。表結(jié)構(gòu)信息在nmc\client\conf\resource\logdb.xml。抽取CPUCPU的抽取信息為:服務(wù)器cpu的user、sys、wait、idle等。通過這些信息,我們就可以知道CPU的歷史使用狀況。CPU的日志抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\cpu目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是cpulog。CPU表cpulog表的信息字段含義server服務(wù)器host機(jī)器名cpuidCPUID號(hào)user用戶使用百分比sys系統(tǒng)使用百分比waitCPU空閑期間系統(tǒng)有未完成的磁盤I/O請求時(shí)的時(shí)間百分比idleCPU空閑并且系統(tǒng)沒有未完成的磁盤I/O請求時(shí)的時(shí)間百分比file抽取的CPU日志文件在監(jiān)控服務(wù)器上的文件如:.\logs\cpu\cpu-uf200703074.log.0
抽取CPU日志及查看方法:抽取cpu下圖顯示抽取日志的過程。然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對(duì)應(yīng)的選項(xiàng)查看對(duì)應(yīng)的日志信息。抽取內(nèi)存日志內(nèi)存的抽取信息為:服務(wù)器內(nèi)存的total、free、pi、po等。通過這些信息,我們就可以知道內(nèi)存的歷史使用狀況。內(nèi)存的日志抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\memory目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是memorylog。內(nèi)存表memorylog表的信息字段含義server服務(wù)器host機(jī)器名total內(nèi)存總值free內(nèi)存空閑值pipipopofile抽取的內(nèi)存日志文件在監(jiān)控服務(wù)器上的文件位置:.\logs\memory\memory-uf200703074.log.2
抽取內(nèi)存日志及查看方法:抽取MEMORY設(shè)置好抽取的條件后,點(diǎn)“確定”,下圖顯示抽取日志的過程。然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對(duì)應(yīng)選項(xiàng)查看對(duì)應(yīng)的日志信息。監(jiān)控消息和快照信息日志監(jiān)控消息和快照信息是在消息中心同步消息時(shí)抽取到日志數(shù)據(jù)庫的。監(jiān)控消息和快照信息抽取是從監(jiān)控服務(wù)器目錄nmc\server\logs\snapshot目錄中抽取的。抽取的數(shù)據(jù)保存在監(jiān)控工具客戶端日志數(shù)據(jù)庫中,保存的表是message和snapshot。監(jiān)控消息日志表message的信息字段含義snapshotid快照IDmessage消息的內(nèi)容service監(jiān)控服務(wù)名snapshotfile快照文件在服務(wù)器端的位置:D:\ufsoft\nc55\nmc\server\.\logs\snapshot\snapshot-1242096486515
快照信息日志表snapshot的信息字段含義snapshotid快照IDfilename快照文件在服務(wù)器端的位置:D:\ufsoft\nc55\nmc\server\.\logs\snapshot\snapshot-1242096486515content快照的內(nèi)容
操作員信息操作員信息包括操作員的名稱,操作員編碼及監(jiān)控域名稱。操作員信息的抽取方法:在線程監(jiān)控中,如下圖,點(diǎn)擊線程監(jiān)控下的ALL/ncMem01/ncMem02/master,如果此時(shí)監(jiān)控客戶端日志數(shù)據(jù)庫中沒有操作員信息,則提示是否需要同步操作員信息。同步時(shí)即將操作員的信息保存到監(jiān)控客戶端日志數(shù)據(jù)庫中。操作員日志表operator的信息字段含義cuserid操作員IDuser操作員名稱user_code操作員編碼domain監(jiān)控域名稱
操作員信息查看方法:工具欄:常用腳本操作員SQL語句為:select*frommessageorderbytsdesc消息中心功能概述后臺(tái)的每個(gè)監(jiān)控服務(wù)都可以產(chǎn)生監(jiān)控消息,并將消息發(fā)送到消息隊(duì)列.如:中間件一個(gè)WEB線程運(yùn)行時(shí)間超過180秒仍沒有結(jié)束則發(fā)送快照消息。中間件一個(gè)WEB線程執(zhí)行的SQL最大數(shù)量1000,如果超過這個(gè)值,則發(fā)送快照消息。中間件一個(gè)線程最耗時(shí)的SQL耗時(shí)超過120,則發(fā)送快照消息。連接池使用超過70%,則發(fā)送快照消息。表空間使用率超過90%,則發(fā)送WARNING消息。active的回滾段超過90%,則發(fā)送WARNING消息等。消息服務(wù)定時(shí)從消息隊(duì)列取到消息,根據(jù)消息的內(nèi)容和服務(wù)對(duì)消息處理模式的配置,對(duì)消息生成快照或者只是作為一條報(bào)警消息保存到日志中。根據(jù)這些消息,就可以很方便的進(jìn)行事后分析。這些消息包括:數(shù)據(jù)庫、中間件、進(jìn)程、cpu、內(nèi)存等信息。消息由兩部分組成:消息概要和快照。快照目前提供中間件線程快照和數(shù)據(jù)庫的快照,根據(jù)快照和消息概要很容易進(jìn)行深入分析系統(tǒng)問題。同時(shí)消息中心提供自動(dòng)發(fā)送郵件的功能。消息及快照的生成過程:監(jiān)控服務(wù)根據(jù)監(jiān)控條件生成消息,消息處理服務(wù)定時(shí)從消息隊(duì)列中讀取消息,根據(jù)消息內(nèi)容及快照項(xiàng)目,請求對(duì)應(yīng)的服務(wù)生成快照信息,快照信息生成后返回給消息處理服務(wù),然后消息處理服務(wù)寫到快照文件中。消息及快照的生成過程圖快照文件在…\nmc\server\logs\snapshot\snapshotidx.log中有詳細(xì)記錄。perties文件在…\nmc\server\conf\perties。services.xml文件在…\nmc\server\conf\services.xml。消息產(chǎn)生的觸發(fā)點(diǎn)在perites中配置。服務(wù)觸發(fā)條件值說明進(jìn)程監(jiān)控restartWhenCheckMemoryfailuretrue/false檢測JVM內(nèi)存失敗是否重啟,如果為false,則只是發(fā)送報(bào)警消息.如果為true,則發(fā)送快照信息線程監(jiān)控MW_THREAD_CHECK_MAXCOSTTIME180中間件一個(gè)WEB線程運(yùn)行時(shí)間的閥值,單位為秒.超過這個(gè)時(shí)間仍沒有結(jié)束則發(fā)送快照消息線程監(jiān)控MW_THREAD_CHECK_MAXCOUNTOFSQL1000中間件一個(gè)WEB線程執(zhí)行的SQL最大數(shù)量,如果超過這個(gè)值,則發(fā)送快照消息線程監(jiān)控MW_THREAD_CHECK_MAXCOSTOFONESQL120中間件一個(gè)線程最耗時(shí)的SQL閥值,單位為秒.如果SQL的耗時(shí)超過這個(gè)值,則發(fā)送快照消息線程監(jiān)控MW_THREAD_CHECK_CONNECTIONPOOLUSED70連接池使用閥值,單位位百分比.如果連接池使用超過50%,則發(fā)送快照消息數(shù)據(jù)庫監(jiān)控HEALTH_RUNTIME_CHECK_DB__SQL_1HEALTH_RUNTIME_CHECK_DB__SQL_2HEALTH_RUNTIME_CHECK_DB__SQL_3HEALTH_RUNTIME_CHECK_DB__SQL_4詳見perites進(jìn)行健康檢查時(shí)執(zhí)行的腳本,個(gè)數(shù)最大為4個(gè).檢查失敗后會(huì)發(fā)送快照消息.數(shù)據(jù)庫健康檢查目前只是支持ORACLE.數(shù)據(jù)庫監(jiān)控HEALTH_CONF_CHECK_DB__SQL_1詳見perites表空間使用率超過90%,則發(fā)送WARNING消息數(shù)據(jù)庫監(jiān)控HEALTH_CONF_CHECK_DB__SQL_2詳見peritesactive的回滾段超過90%,則發(fā)送WARNING消息消息服務(wù)手工發(fā)送消息
客戶端主動(dòng)快照
監(jiān)控客戶端功能同步消息:將服務(wù)器端產(chǎn)生的消息和本地的數(shù)據(jù)庫進(jìn)行同步.刪除消息:將服務(wù)器端的消息和本地的消息進(jìn)行刪除.執(zhí)行快照:主動(dòng)發(fā)一條快照消息.系統(tǒng)會(huì)自動(dòng)根據(jù)配置生成快照.如:點(diǎn)擊“執(zhí)行快照”,消息處理監(jiān)控服務(wù)就會(huì)發(fā)送一條消息到消息隊(duì)列,消息處理服務(wù)取到該消息后,根據(jù)消息中的內(nèi)容及快照項(xiàng)目配置信息,請求生成快照,然后生成快找并保存到快照文件。從上圖可以看出,已經(jīng)生成了快照,選中該條快照,則下面的快照欄中就會(huì)顯示出快照出的對(duì)應(yīng)文件,雙擊快照欄中的某一行就可以看到相應(yīng)的信息。下圖是一個(gè)線程的快照信息。安全設(shè)置功能概述1.通過監(jiān)控服務(wù)提供的安全代替監(jiān)控目標(biāo)系統(tǒng)的安全.這樣的好處是:客戶可以不用提供給你真正的數(shù)據(jù)庫密碼.因?yàn)閿?shù)據(jù)庫的密碼一般是不變的,但是監(jiān)控服務(wù)的用戶名和密碼是隨時(shí)都可以改變的.2.對(duì)需要安全檢查的服務(wù)訪問進(jìn)行安全檢查.3.客戶端可以動(dòng)態(tài)修改監(jiān)控管理員用戶名和密碼.說明:該功能主要是為了更安全的使用監(jiān)控服務(wù)器器,如果不知道監(jiān)控服務(wù)器端的用戶和密碼,則有些監(jiān)控功能將不允許使用。監(jiān)控客戶端功能管理員設(shè)置:重新設(shè)置管理員的用戶名和密碼.說明該管理員的用戶名和密碼是指服務(wù)器端的監(jiān)控工具設(shè)置的管理員用戶名和密碼。參數(shù)設(shè)置功能概述1.
提供一種可以動(dòng)態(tài)修改參數(shù)的功能.保存之后馬上生效,不需要重啟監(jiān)控服務(wù).2.
有些參數(shù)修改后必須要重啟監(jiān)控服務(wù),比如:prop文件nodeagenthost等.3.
所有監(jiān)控服務(wù)器的參數(shù)獲取都是從servicecenter那里獲取的。監(jiān)控工具啟動(dòng)服務(wù)時(shí)自動(dòng)從servicecenter下載最新的參數(shù)配置。參數(shù)修改時(shí),servicecenter通知所有的其他監(jiān)控服務(wù)器從新刷新參數(shù)。監(jiān)控客戶端功能參數(shù)值的修改方法:雙擊某個(gè)參數(shù)值進(jìn)行修改。應(yīng)用實(shí)例以一個(gè)真實(shí)客戶的環(huán)境為例。OVERVIEW選擇一個(gè)監(jiān)控域,工具->overview通過下圖,可以看出該集群中有三臺(tái)機(jī)器。每臺(tái)機(jī)器上分別有兩個(gè)成員:master,ncMem01,ncMem02,ncMem03,ncMem04,ncMem05進(jìn)程監(jiān)控從進(jìn)程監(jiān)控中可以查看每個(gè)成員的狀態(tài)、線程、端口、JVM使用情況等。下圖是進(jìn)程監(jiān)控中DB狀況:可以查看連接池大小,當(dāng)前活動(dòng)的sessions等.線程監(jiān)控從線程監(jiān)控中可以查看每個(gè)線程的狀態(tài)及SQL堆棧等。雙擊SQL堆棧中任何一行,如藍(lán)色的行,顯示該條的詳細(xì)信息,如:下圖是顯示的thread堆棧信息:日志抽取日志抽取可以從多個(gè)服務(wù)器上抽取日志信息,如bgync1和bgync3等服務(wù)器上抽取NC的日志信息。下圖是按時(shí)間查詢。下圖按操作員只查匯總的信息:
下圖按自定義條件只查詢ERROR級(jí)別的信息。日志抽取過程如下:然后,工具日志數(shù)據(jù)庫
切換到下面的界面。在常用腳本的下拉框中可以通過選擇對(duì)應(yīng)選項(xiàng)查看對(duì)應(yīng)的日志信息。如查看“遠(yuǎn)程調(diào)用統(tǒng)計(jì)”:選擇一行,可以查看其詳細(xì)信息。DB-監(jiān)控在數(shù)據(jù)庫監(jiān)控中可以查看執(zhí)行比較長的SQL等.消息中心查看消息時(shí),先同步消息,如在消息中心,可以查看系統(tǒng)的消息,如[WebContainer:4]totalnumberofsqlover1500表示該線程執(zhí)行的sql個(gè)數(shù)超過了1500個(gè).雙擊上圖中快照欄中的信息,彈出如下詳細(xì)信息這是個(gè)中間件的快照信息.下圖中選中的消息是數(shù)據(jù)庫中有SQL執(zhí)行時(shí)間超過120秒的消息,如:這是個(gè)數(shù)據(jù)庫的快照信息.下圖是web線程的執(zhí)行總時(shí)間超過了180000ms的快照信息。選中上圖中快照欄的記錄,雙擊后彈出詳細(xì)信息:典型案例某項(xiàng)目5月初監(jiān)控信息及問題解決建議一:某項(xiàng)目監(jiān)控相關(guān)信息1:系統(tǒng)總體狀況如上圖,某項(xiàng)目目前是3臺(tái)物理機(jī)器組成水平集群,總共6個(gè)中間件server進(jìn)程提供NC服務(wù)。2:每個(gè)server進(jìn)程狀況從5月6-8號(hào)這三天的監(jiān)控情況來看,6個(gè)中間件server進(jìn)程狀況非常健康;一是內(nèi)存曲線始終比較平穩(wěn),穩(wěn)定在1G以內(nèi),如上圖顯示,沒有出現(xiàn)總體上升的曲線狀況(即不存在內(nèi)存泄漏情況),二是可以看到每個(gè)server中的web線程數(shù)比較平均且少于10個(gè),即系統(tǒng)不存在堵塞狀況。3:系統(tǒng)所有正在工作任務(wù)狀況如上圖所示,在某(任)一時(shí)刻,系統(tǒng)中的任務(wù)數(shù)穩(wěn)定在10個(gè)左右,很少超過10個(gè);但從監(jiān)控圖形中可以看到有的任務(wù)耗時(shí)比較長,如上有耗時(shí)145秒的任務(wù)。如圖,可以聯(lián)查任務(wù)詳細(xì),看到這個(gè)已經(jīng)耗時(shí)12秒多的任務(wù)(依然還在運(yùn)行中),其正在執(zhí)行的SQL語句已經(jīng)花了12秒了。如圖,查看任務(wù)詳細(xì)統(tǒng)計(jì)信息,如總共執(zhí)行了多少SQL,sql總耗時(shí),每個(gè)sql耗時(shí)等等有用信息。4:消息中心的警告信息將系統(tǒng)中的警告信息同步過來,發(fā)現(xiàn)從7號(hào)下午14:30左右開始,出現(xiàn)數(shù)據(jù)庫異常情況。同時(shí),在7號(hào)上午到下午還有一些執(zhí)行時(shí)間超過警告閥值的任務(wù)的信息。以下是聯(lián)查的警告中的詳細(xì)信息5:日志情況先抽取7號(hào)下午4點(diǎn)這個(gè)時(shí)間段的日志,查看相關(guān)信息二:某項(xiàng)目監(jiān)控到的異常問題從上面的監(jiān)控情況,主要發(fā)現(xiàn)是數(shù)據(jù)庫出現(xiàn)了異常以及相關(guān)數(shù)據(jù)庫執(zhí)行變慢問題1:從7號(hào)下午2點(diǎn)開始,監(jiān)控到數(shù)據(jù)庫異常信息:如下(1):連接報(bào)io異常<record><時(shí)間>2009-05-0811:18:14</時(shí)間><服務(wù)>dbmonitor:bgy12</服務(wù)><消息>[ERROR]Io異常:Gotminusonefromareadcall</消息><是否有快照>否</是否有快照><消息id>1241752694437</消息id></record>(2):數(shù)據(jù)庫同時(shí)報(bào)連接異常<record><時(shí)間>2009-05-0810:55:51</時(shí)間><服務(wù)>dbmonitor:bgy12</服務(wù)><消息>[ERROR]Listenerrefusedtheconnectionwiththefollowingerror:#ORA-12518,TNS:listenercouldnothandoffclientconnection#TheConnectiondescriptorusedbytheclientwas:#2:1521:ncdata2#</消息><是否有快照>否</是否有快照><消息id>1241751351343</消息id><
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年環(huán)保知識(shí)競賽賽題及答案(共70題)
- 貴州省貴陽市七校2024-2025學(xué)年高三下學(xué)期聯(lián)考(三)政治試題(原卷版+解析版)
- 2025屆青海省西寧市高三一模語文試題(原卷版+解析版)
- 2025四月份按揭房屋共同管理權(quán)終止協(xié)議書
- 2025年度一月淘寶虛擬試衣間運(yùn)營身材數(shù)據(jù)保密協(xié)議
- 二零二五版?zhèn)€人抵押合同范例
- 二零二五草場租賃合同范例
- 二零二五版聘用物業(yè)保安人員協(xié)議書范例
- 二零二五版建筑工程安全管理協(xié)議
- 公司防中毒管理制度
- Unit 3 Learning better (教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教PEP版(2024)英語三年級(jí)下冊
- 萊蕪市人民醫(yī)院院區(qū)擴(kuò)建工程項(xiàng)目可行性研究報(bào)告
- 2025年山東省淄博市張店區(qū)中考一模歷史試題(原卷版+解析版)
- 心肺復(fù)蘇知識(shí)培訓(xùn)課件
- 2025初中物理課程標(biāo)準(zhǔn)(2022版)考試模擬試卷及答案
- 物理-華大新高考聯(lián)盟2025屆高三3月教學(xué)質(zhì)量測評(píng)試題+答案
- 3.2 頻率的穩(wěn)定性(第2課時(shí)) 課件 2024-2025學(xué)年北師大版七年級(jí)數(shù)學(xué)下冊
- 滬教版(五四學(xué)制)(2024)六年級(jí)下冊單詞表+默寫單
- 第五課+弘揚(yáng)勞動(dòng)精神、勞模精神、工匠精神【中職專用】中職思想政治《職業(yè)道德與法治》高效課堂(高教版2023·基礎(chǔ)模塊)
- 旅游景區(qū)旅游安全風(fēng)險(xiǎn)評(píng)估報(bào)告
- 2024年中華人民共和國企業(yè)所得稅年度納稅申報(bào)表(帶公式)20240301更新
評(píng)論
0/150
提交評(píng)論