存儲維護(hù)管理_第1頁
存儲維護(hù)管理_第2頁
存儲維護(hù)管理_第3頁
存儲維護(hù)管理_第4頁
存儲維護(hù)管理_第5頁
已閱讀5頁,還剩36頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、.,DELL 存儲,常見存儲管理、故障處理和注意事項,.,常見故障原因,經(jīng)驗表明,造成客戶存儲故障的外部原因主要有以下幾種: 存儲內(nèi)部錯誤的開關(guān)機(jī)順序。 機(jī)頭或擴(kuò)展柜的速率開關(guān)處于錯誤的位置。 不規(guī)范的軟硬件升級。 對存儲子系統(tǒng)進(jìn)行破壞性操作。 不規(guī)范的故障修復(fù)操作。 維護(hù)過程中觸發(fā)了相關(guān)的隱患。 存儲系統(tǒng)沒有冗余的配置方案。,.,開關(guān)機(jī)步驟,開機(jī): SAN交換機(jī)EXP磁盤擴(kuò)展柜主控柜主機(jī) 關(guān)機(jī): 主機(jī)主控柜EXP磁盤擴(kuò)展柜SAN交換機(jī) 不正確的開關(guān)機(jī)順序可能會導(dǎo)致部分硬盤離線以及數(shù)據(jù)無法訪問。 注意:在DS5000按下電源按鈕關(guān)機(jī)后,在控制器代碼和所有電源燈熄滅前絕對不能進(jìn)行任何操作!,.,

2、管理軟件,Storage Manager客戶端管理軟件 連接方式如下: 將裝有Storage Manager Client客戶端軟件的工作站,通過以太網(wǎng)Hub或Switch,同時連接到DS4000/DS5000的兩個控制器。 打開Storage Manager Client客戶端軟件 控制器有一個出廠默認(rèn)的IP地址:控制器A/B:192.168.128.101/102 (控制器A/B:192.168.129.101/102 ),.,存儲子系統(tǒng)狀態(tài)標(biāo)識,.,管理界面-企業(yè)主管理界面,.,管理界面子系統(tǒng)管理界面,.,子系統(tǒng)部件標(biāo)識,.,故障檢測按鈕,使用“Recovery Guru” 故障檢測按鈕

3、檢查DS4000/DS5000子系統(tǒng)的整體狀態(tài) “聽診器”,.,故障檢測按鈕,正常 故障,.,控制器和擴(kuò)展柜的硬件狀態(tài),點(diǎn)擊物理硬盤右側(cè)的狀態(tài)檢查按鈕,可以打開查看具體部件的硬件工作狀態(tài),.,查看控制器信息,選擇“Storage Subsystem Menu” “View” “ Profile”,.,故障數(shù)據(jù)收集,收集 All Support Data 菜單:Advanced-Troubleshooting-Collect All Support Data .,.,故障數(shù)據(jù)收集,查看Major Event Log 菜單:Advanced-Troubleshooting-View Event L

4、og,.,故障數(shù)據(jù)收集,查看鏈路信號噪音檢測報告 菜單:Advanced-Troubleshooting-Run Diagnostics-Read Link Status ,.,電池和緩存,電池和緩存的設(shè)計原理 為了保證寫緩存數(shù)據(jù)的安全性,DS4000/DS5000系統(tǒng)中,只要電池發(fā)生故障(處于Failed狀態(tài))或者超過微碼所規(guī)定的設(shè)計壽命,那么寫緩存就會被自動禁用 為了保證寫緩存數(shù)據(jù)的安全性,默認(rèn)兩個控制器的Cache Mirroring寫緩存鏡像功能是打開的。因此當(dāng)一個控制器的寫緩存被禁用之后,另外一個控制器的寫緩存也不能使用了。,.,電池和緩存,寫緩存禁用之后的故障現(xiàn)象 主機(jī)端應(yīng)用程序響

5、應(yīng)變慢,從topas檢查主機(jī)性能指標(biāo),I/O waiting顯著增加,每個邏輯盤的busy接近100%,但是IO吞吐量很小,每秒只有幾十K到1M不等:,.,電池和緩存,電池的更換策略 如果電池當(dāng)前是處于“Failed”或“Removed”狀態(tài) 如果電池當(dāng)前狀態(tài)正常,只是接近或已超過告警壽命,.,在AIX上使用MPIO的一些注意事項,AIX版本5.2以上,除了原有的集成的RDAC功能以外,操作系統(tǒng)還新增了MPIO的功能來實現(xiàn)外部磁盤的多通路訪問。AIX 5.2/5.3默認(rèn)是使用RDAC,而AIX6.1默認(rèn)是使用MPIO。 RDAC和MPIO的兼容性 DS3000: 只支持 MPIO DS4000

6、: 支持方式:RDAC, MPIO DS5000: 支持方式:MPIO (DS5000在AIX上不再支持RDAC),.,在AIX上使用MPIO的一些注意事項,如何在AIX上確認(rèn)當(dāng)前正在使用MPIO還是RDAC 在AIX中執(zhí)行“manage_disk_drivers” 以下是一個當(dāng)前使用MPIO的例子: #manage_disk_drivers 1: DS4300: currently MPIO; supported: RDAC/fcparray, MPIO 2: DS4500: currently MPIO; supported: RDAC/fcparray, MPIO 3: DS4700/D

7、S4200: currently MPIO; supported: RDAC/fcparray, MPIO 4: DS4800: currently MPIO; supported: RDAC/fcparray, MPIO 以下是一個當(dāng)前使用RDAC的例子: 1: DS4300: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 2: DS4500: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 3: DS4700/DS4200: currently RDAC/fcp

8、array; supported: RDAC/fcparray, MPIO 4: DS4800: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO,.,在AIX上使用MPIO的一些注意事項,如何檢查當(dāng)前磁盤的工作路徑 RDAC:fget_config -Av MPIO: mpio_get_config -Av,.,常見故障處理和注意事項,控制器微碼是不是有重大隱患的版本? 06.23.05.00: 隱患一:當(dāng)某個控制器內(nèi)存校驗出錯時,故障控制器無法正確的被隔離offline,從而導(dǎo)致邏輯盤LUN不能切換到好的控制器上,主機(jī)訪問中斷。

9、 隱患二:DS4800寫緩存被禁用,主機(jī)寫性能大幅度下降,從而影響業(yè)務(wù)。 07.10.23.00: 隱患一:更換故障硬盤后,之前已經(jīng)接管的熱備盤無法CopyBack 隱患二:Media Scan被自動禁用,.,常見故障處理和注意事項,EXP擴(kuò)展柜的ESM微碼版本有沒有重大隱患? EXP710的ESM的微碼隱患(9681以下版本) 當(dāng)一塊硬盤故障時,MEL里面顯示Fiber Channel Link up和Link down的Event,發(fā)生大面積的多塊硬盤的同時故障,客戶數(shù)據(jù)訪問中斷。 EXP810和EXP420的ESM的微碼隱患(98D0以下版本) 當(dāng)一塊硬盤故障時,MEL里面顯示Fiber

10、 Channel Link up和Link down的Event,發(fā)生大面積的多塊硬盤的同時故障,客戶數(shù)據(jù)訪問中斷。,.,常見故障處理和注意事項,要特別注意前面板右下方的(2GB/4GB)速率開關(guān),是否處于正確的位置。速率開關(guān)處于4GB位置時,2Gbps的硬盤將不能被識別;相反速率開關(guān)處于2GB位置時,4Gbps的硬盤是可以使用的,但是性能將會下降。這種情況比較容易被忽視。速率開關(guān)的更改需要關(guān)機(jī)下電。注意:所有3Gbps的SATA硬盤,都推薦運(yùn)行在4Gbps。,.,常見故障處理和注意事項,磁盤擴(kuò)展柜的光纖連線符合IBM的規(guī)范。 在控制器有冗余的光模塊條件下,建議將多個擴(kuò)展柜連接在多個冗余環(huán)路上

11、,盡量不要將所有的擴(kuò)展柜串聯(lián)在一個環(huán)路里。,.,常見故障處理和注意事項,只要使用了光纖交換機(jī),做Zone是強(qiáng)制要求。每一個Zone必須只包含兩個成員,一個對應(yīng)主機(jī)的一張光纖卡的一個端口,另一個對應(yīng)DS4000/DS5000的一個控制器的一個端口。,.,常見故障處理和注意事項,邏輯盤不在最優(yōu)路徑“Logical Drive Not On Preferred Path” 。這個問題指的是DS4000/DS5000的邏輯盤(LUN)沒有掛在原本所屬的控制器下。,.,常見故障處理和注意事項,原因分析:(主要有6點(diǎn)) 從主機(jī)的光纖卡到Logical Drive的光纖物理鏈路有問題。 P-Series主機(jī)

12、的dar0的虛擬設(shè)備配置有問題 光纖交換機(jī)fabric1的Zone設(shè)置有問題。 主機(jī)光纖卡HBA和DS4000/DS5000控制器的主機(jī)端口Host Port之間的光纖連線方式不正確,沒有符合IBM的規(guī)范。 控制器發(fā)生過重啟,或者控制器已經(jīng)Offline(離線),.,常見故障處理和注意事項,檢查的確認(rèn)方法:(主要有8點(diǎn)) 確認(rèn)從主機(jī)的光纖卡到邏輯盤Logical Drive的物理鏈路是完全正常的。 查看光纖交換機(jī)相應(yīng)的主機(jī)光纖卡端口和DS4000/DS5000控制器端口的狀態(tài)燈 登陸主機(jī),運(yùn)行“fget_config -Av”確認(rèn)dar的虛擬設(shè)備配置正常 確認(rèn)光纖交換機(jī)的Zone設(shè)置沒有問題。

13、 確認(rèn)主機(jī)光纖卡HBA和DS4000/DS5000控制器的主機(jī)端口Host Port之間的光纖連線方式是正確。 在SM客戶端管理軟件里面確認(rèn)DS4000/DS5000的控制器狀態(tài)正常 檢查DS4000/DS5000內(nèi)部的Mapping是否正確 確認(rèn) Linux主機(jī)的host type是否正確。,.,常見故障處理和注意事項,恢復(fù)方法 在Storage Manager客戶端管理軟件里面運(yùn)行: Advanced Recovery Redistribute Logical Drives 在Storage Manager客戶端管理軟件里面,更改每一個邏輯盤Logical Drive的所屬控制器 菜單:L

14、ogical DriveChangeOwnership/Preferred Path 注意:在恢復(fù)之前,一定要確認(rèn)從主機(jī)的光纖卡到Logical Drive的通道是完全正常的,只有在完全確認(rèn)上述幾種故障都已經(jīng)解決之后,才能實施恢復(fù)。否則后果一定是災(zāi)難性的!,.,常見故障處理和注意事項,Storage Manager客戶端軟件不能連接和訪問DS4000/DS5000的控制器 首先排除網(wǎng)絡(luò)方面的問題 看看控制器的兩位數(shù)字LED的顯示是否正常 如果控制器的兩位數(shù)字LED的顯示在循環(huán)變化,或者Ping的時通時斷,這時候可以通過串口連上控制器,觀察并捕獲屏幕的輸出。 控制器能Ping通但是Storage

15、 Manager連不上 如果能安排停機(jī)時間,重啟機(jī)頭是最有效的解決方法。,.,常見故障處理和注意事項,拔除DS4000/DS5000系統(tǒng)中所有未使用(沒有光纖連接)的光電轉(zhuǎn)換模塊SFP 會導(dǎo)致光纖鏈路的不穩(wěn)定 在MEL Event Log中,會發(fā)現(xiàn)有大量的“Fibre Channel Link Down”和“Fibre Channel Link Up”的提示信息。,.,常見故障處理和注意事項,特別注意:不規(guī)范的實施DS4000/DS5000系統(tǒng)EXP擴(kuò)展柜和物理硬盤的升級和遷移,可能會造成客戶數(shù)據(jù)丟失! DS4000/DS5000系統(tǒng)增加新的EXP擴(kuò)展柜(升級) DS4000/DS5000系統(tǒng)

16、增加新的物理硬盤(升級) 將一個或多個EXP擴(kuò)展柜,從一個現(xiàn)有的DS4000/DS5000系統(tǒng)遷移到另一個DS4000/DS5000系統(tǒng)(遷移) 將一塊或多塊硬盤,從一個現(xiàn)有的DS4000/DS5000系統(tǒng)遷移到另一個DS4000/DS5000系統(tǒng)(遷移) 以上工作必須嚴(yán)格按照最新版的IBM官方文檔里面所規(guī)定的步驟進(jìn)行。,.,常見故障處理和注意事項,注意定期保存DS4000/DS5000系統(tǒng)的All Support Data(ASD) DS4000/DS5000的All Support Data里面記錄了所有Array的配置信息和主機(jī)Mapping的信息,在關(guān)鍵時刻對于客戶的數(shù)據(jù)恢復(fù)有著非常重

17、要的作用。,.,常見故障處理和注意事項,尋找DS4000/DS5000的Recovery Profile SM客戶端軟件的一個功能 記錄了DS4000的Array和LUN的基本信息,.,常見故障處理和注意事項,不能對處于“Degraded”狀態(tài)的Array的故障硬盤使用Revive操作! 當(dāng)Array變成Degraded狀態(tài)時,主機(jī)的訪問將會恢復(fù)。 故障硬盤仍然處于被隔離的靜止?fàn)顟B(tài) 造成數(shù)據(jù)丟失!,.,常見故障處理和注意事項,故障誤報 微碼和舊版的不兼容 通過升級微碼解決 通過重啟機(jī)頭解決,.,常見故障處理和注意事項,絕對不能在生產(chǎn)系統(tǒng)使用SM客戶端管理軟件的“Reset Configuration”功能 刪除DS4000/DS5000系統(tǒng)里面所有的Array/Lun信息 將所有配置恢復(fù)成出廠設(shè)置值,.,常見故障處理和注意事項,DS5000維護(hù)注意事項

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論