版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、IBM 小型機日常管理與故障處理第1頁,共47頁。內容提要系統(tǒng)健康檢查HMC的使用ASMI 的使用常用操作故障的處理IBM 服務熱線第2頁,共47頁。系統(tǒng)健康檢查第3頁,共47頁。系統(tǒng)健康檢查巡檢用戶:xunjian(普通權限)。至/tmp/xunjian/ 目錄下執(zhí)行common_check.sh腳本。查看輸出的日志:more pxxx20160920.log,進行系統(tǒng)的狀態(tài)查看。第4頁,共47頁。系統(tǒng)健康檢查檢查文件系統(tǒng)查看有沒有“滿”的文件系統(tǒng)。文件系統(tǒng)滿可導致系統(tǒng)不能正常工作,尤其是AIX的基本文件系統(tǒng)。如/ (根文件系統(tǒng))滿則會導致用戶不能登錄。# df -k (查看AIX的基本文件
2、系統(tǒng))Filesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 24576 1452 95% 2599 22% /dev/hd2 614400 28068 96% 22967 15% /usr/dev/hd9var 8192 4540 45% 649 32% /var/dev/hd3 167936 157968 6% 89 1% /tmp/dev/hd1 16384 5332 68% 1402 35% /home第5頁,共47頁。系統(tǒng)健康檢查查看卷組信息lsvg -l vg_name有沒有stale狀態(tài)的邏輯卷。用syn
3、cvg 命令修復。# smitty syncvgLV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 2 2 closed/syncd N/Ahd6 paging 48 96 2 open/syncd N/Apaging00 paging 32 64 2 open/syncd N/Ahd8 jfslog 1 2 2 open/syncd N/Ahd4 jfs 1 2 2 open/stale /hd2 jfs 32 64 2 open/syncd /usrhd9var jfs 5 10 2 open/syncd /varhd3 jfs
4、4 8 2 open/syncd /tmphd1 jfs 1 2 2 open/syncd /home第6頁,共47頁。系統(tǒng)健康檢查網(wǎng)絡檢查netstat -i 查看網(wǎng)卡狀態(tài)Ierrs/Ipkts 和 Oerrs/Opkts是否1%ping host_name /IP Address查看是否通和是否有丟包。路由表#netstat -rn查看路由表是否正確,ping 各路由器是否通。核 對 主 機 名#hostname第7頁,共47頁。系統(tǒng)健康檢查#ifconfig -aen0: flags=4e080863inet 172.40.10.31 netmask 0 xffff0000 broadc
5、ast 172.40.255.255lo0: flags=e08084binet 127.0.0.1 netmask 0 xff000000 broadcast 127.255.255.255inet6 :1/0第8頁,共47頁。系統(tǒng)健康檢查#lsattr El inet0authm 65536 Authentication Methods Truehostname qtsms Host Name Truegateway Gateway Trueroute net,0,172.40.10.1 Route Truebootup_option no Serial Optical Network I
6、nterface Truerout6 FDDI Network Interface Trueroute屬性是否有相應的路由信息。格式為:net,0,172.16.23.81如果沒有缺省路由,執(zhí)行命令:#chdev l inet0 a route=0,172.16.23.81其中172.16.23.81為網(wǎng)關如果缺省路由不正確,則先刪除路由,再增加缺省路由:#chdev l inet0 a delroute= net,0,133.16.23.81#chdev l inet0 a route=0,172.16.23.81第9頁,共47頁。系統(tǒng)健康檢查系統(tǒng)故障記錄(errorlog)errdemon
7、 進程在系統(tǒng)啟動時自動運行記錄包括硬件、軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog,可備份下來或拷貝到別的機器上分析errpt 命令的使用(普通用戶權限也可使用)第10頁,共47頁。系統(tǒng)健康檢查第11頁,共47頁。系統(tǒng)健康檢查第12頁,共47頁。系統(tǒng)健康檢查第13頁,共47頁。HMC的使用第14頁,共47頁。Hardware Management Console進行P系列小型機的硬件管理、維護,以及邏輯分區(qū)的劃分等必須配置HMC對其進行管理如果需要劃分邏輯分區(qū),則必須配置HMCHMC通過TCP/IP與需要管理的主機進行連接HMC 使用第15頁,共47頁。HMC 使用
8、 操作界面第16頁,共47頁。HMC 使用 操作界面第17頁,共47頁。HMC 使用 操作界面第18頁,共47頁。HMC 使用 操作界面第19頁,共47頁。HMC 使用 操作界面第20頁,共47頁。HMC 使用 操作界面第21頁,共47頁。HMC 使用 操作界面點擊關閉事件第22頁,共47頁。HMC 使用 操作界面點擊機器前面板黃燈第23頁,共47頁。ASMI的使用第24頁,共47頁。ASMI的使用Advanced System Management Interface 硬件故障信息硬件設備信息硬件狀態(tài)信息CUoD可以在任何時候訪問(機器在Power Off狀態(tài),或者Operating 狀態(tài))
9、第25頁,共47頁。ASMI的使用 連接方式HMC GUI使用硬件管理終端訪問網(wǎng)頁模式使用PC或筆記本,用網(wǎng)線連接到負責HMC和FSP通信的交換機、或者HUB上通過瀏覽器,輸入FSP的IP地址即可訪問ASMI串口模式使用串口線鏈接到串口,可訪問字符界面ASMI第26頁,共47頁。ASMI的使用 連接方式第27頁,共47頁。ASMI的使用 訪問界面(Web)第28頁,共47頁。ASMI的使用 訪問界面(Web)第29頁,共47頁。常用操作第30頁,共47頁。常用操作-HACMP的操作HACMP的操作啟動:smitty clstart停止:smitty clstop啟動/停止過程可以查看/tmp/
10、hacmp.out文件:#tail f /tmp/hacmp.out 檢查Cluster是否運行正常Cluster進程是否運行:#lssrc g cluster,至少兩個進程,且為active。IP地址是否獲?。?netstat i,看boot IP是否變?yōu)閟ervice ip。VG是否varyon:#lsvg o文件系統(tǒng)是否mount:#mount應用進程是否啟動:#ps ef | grep app_name第31頁,共47頁。常用操作-HACMP的操作HACMP相關日志/usr/adm/cluster.log; 以事件為單位的紀錄/tmp/hacmp.out; 詳細記錄/usr/sbin/
11、cluster/history/cluster.mmdd; 歷史紀錄第32頁,共47頁。常用操作-HACMP的操作使用clstat -o 命令查看hacmp的狀態(tài)第33頁,共47頁。常用操作-HACMP的資源切換smitty hacmp-System Management (C-SPOC)-Resource Group and Applications-Move Resource Groups to Another Node第34頁,共47頁。常用操作-HACMP的資源切換第35頁,共47頁。Administration GuideConcepts and Facilities GuideHA
12、CMP Troubleshooting GuidePlanning and Installation Guide 以上文檔可以在隨機所帶的光盤上找到常用操作-HACMP參考文檔第36頁,共47頁。故障處理第37頁,共47頁。故障處理-故障的定義弄清楚系統(tǒng)發(fā)生了什么問題系統(tǒng)現(xiàn)在能做什么?不能做什么?故障什么時候發(fā)生的?有沒有做平時不同的操作?故障有沒有規(guī)律?定時還是不定時?發(fā)生的頻率有多高?是一臺機器出現(xiàn)故障還是多臺機器故障?故障現(xiàn)象是否相同?最近有沒有做改動?如安裝了新的硬件、軟件,改變了系統(tǒng)的一些設置(如 HACMP配置)等 。第38頁,共47頁。故障處理-故障信息的收集收集故障信息對于判斷
13、、診斷故障原因,修復系統(tǒng)非常重要。系統(tǒng)故障記錄(errorlog)errdemon 進程在系統(tǒng)啟動時自動運行記錄包括硬件、軟件及其他操作信息故障記錄文件為/var/adm/ras/errlog,可備份下來或拷貝到別的機器上分析errpt 命令的使用(普通用戶權限也可使用)第39頁,共47頁。故障處理-故障信息的收集 HMC Service focal point記錄了連接在此臺HMC上的所有P系列主機的硬件報錯信息。選擇“Service focal point“,選擇“Manage Serviceable Events“。可以根據(jù)主機、機柜序列號進行查詢#mail系統(tǒng)會向root用戶發(fā)mail
14、報告出錯信息。通常系統(tǒng)出現(xiàn)故障后沒有進行檢查修復,系統(tǒng)會定時提醒root第40頁,共47頁。故障處理-故障信息的收集其他用于收集系統(tǒng)信息的命令lsdev -C 系統(tǒng)設備信息#lsdev -Cc diskhdisk0 Available 00-06-00-2,0 4.5 GB 16 Bit SCSI Disk Drivehdisk1 Available 00-06-00-1,0 4.5 GB 16 Bit SCSI Disk Drivehdisk2 Defined 00-06-00-4,0 16 Bit SCSI Disk Drive lspv 查看物理卷信息#lspvhdisk0 0007821160af3d76 rootvghdisk1 000782117f571294 rootvghdisk2 0000000045c45bde datavglsvg 查看卷組信息第41頁,共47頁。故障處理-故障信息的收集第42頁,共47頁。故障處理-故障信息的收集第43頁,共47頁。故障處理-故障信息的收集第44頁,共47頁。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年建筑工程施工企業(yè)知識產權保護合同3篇
- 二零二五年度礦業(yè)安全生產標準化合同寶典3篇
- 二零二五年度環(huán)保工程外包實施協(xié)議3篇
- 二零二五版房地產設計違約責任合同范本3篇
- 2025年消防排煙系統(tǒng)設計審查及驗收合同2篇
- 2025年校園空調系統(tǒng)智能化升級改造服務合同樣本2篇
- 二零二五版智能家居系統(tǒng)集成代理售后服務協(xié)議3篇
- 二零二五年跨境電商貸款合同保證人責任及信用風險3篇
- 2025勞動合同法規(guī)定法規(guī)
- 生石灰采購合同
- 《阻燃材料與技術》-顏龍 習題解答
- 人教版八年級英語上冊Unit1-10完形填空閱讀理解專項訓練
- 2024年湖北省武漢市中考英語真題(含解析)
- GB/T 44561-2024石油天然氣工業(yè)常規(guī)陸上接收站液化天然氣裝卸臂的設計與測試
- 《城市綠地設計規(guī)范》2016-20210810154931
- 網(wǎng)球場經(jīng)營方案
- 2024年公司保密工作制度(四篇)
- 重慶市康德卷2025屆高一數(shù)學第一學期期末聯(lián)考試題含解析
- 建筑結構課程設計成果
- 雙梁橋式起重機小車改造方案
- 基于AR的無人機操作訓練系統(tǒng)
評論
0/150
提交評論