DELL POWEREDGE R510 RAID恢復與常見問題解決.doc_第1頁
DELL POWEREDGE R510 RAID恢復與常見問題解決.doc_第2頁
DELL POWEREDGE R510 RAID恢復與常見問題解決.doc_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

DELL POWEREDGE R510 RAID恢復與常見問題解決1 備份您重要的數(shù)據(jù),以免導致數(shù)據(jù)的丟失。2 重新啟動您的服務器,按下ctrm(這是raid 卡的bios),進入raid bios3 選擇object(目標對象),回車進入4 選擇physical driver(物理硬盤),在物理硬盤這個菜單中,你可以看到各種硬盤的狀態(tài):主要有(online(在線)/fail(失敗)/rebuild(重建)/ready(預備)。通常情況下ready表示您的機器硬盤處于預備狀態(tài),硬盤沒有任何數(shù)據(jù)。Fail表示您的機器這個硬盤脫離了您的陣列,這個時候有可能硬盤壞了,也可能僅僅脫離陣列,您需要在每個硬盤上按一下F2鍵,檢查一下是否有media error (媒質錯誤),other error(其他錯誤)如果錯誤超過10個就需要更換硬盤。如果錯誤全部是0,僅僅需要rebuild(重建)就可以。在經(jīng)過5小時后硬盤會從rebuild(重建)狀態(tài)改變?yōu)閛nline(在線),就是raid 回復正常。有關RAID的常見問題1. 為什么硬盤會掉線?SCSI的通訊采用的是并行總線技術,當SCSI鏈路中出現(xiàn)沖突,設備故障或通訊干擾,就會造成總線無法釋放,在此期間SCSI控制器可能無法正確識別到某些磁盤的狀態(tài),因此會將這些磁盤置為離線狀態(tài)。SCSI控制器會嘗試通過總線的復位來釋放總線。SCSI鏈路中的任何一個設備的故障都會造成SCSI總線通信故障,它包括下面這些部件:l SCSI線纜l 硬盤背板l 硬盤l SCSI控制器或RAID卡l 有缺陷的SCSI設備固件l SCSI終結器l EMM卡2. 為什么診斷工具可以發(fā)現(xiàn)硬盤故障,而硬盤本身卻沒有報警?硬盤在工作一段時間后,可能因各種原因會產(chǎn)生一些介質錯誤,但硬盤廠商對這些介質錯誤都有設定一個報警閥值,當硬盤的介質錯誤超過預設的報警閥值,硬盤firmware將觸發(fā)報警,并反映到硬盤報警燈,但有時硬盤雖然產(chǎn)生了介質錯誤,但這些錯誤并沒達到報警預設閥值,所以硬盤報警燈可能會沒有提示。3. 為什么硬盤可以rebuild成功,但卻經(jīng)常掉線?Rebuilding的操作是一個RAID數(shù)據(jù)冗余性重新同步的過程,rebuilding成功僅反應出磁盤介質在同步過程中無讀寫錯誤。硬盤離線通常跟SCSI總線的穩(wěn)定性有關(參見問題1)。4. 什么原因導致Rebuilding失敗?l Double fault:由于多快磁盤故障,導致數(shù)據(jù)的冗余性丟失。l 錯誤的操作:在更換硬盤時,如果該硬盤本身并沒有離線,應該使用prepare remove功能通知RAID卡,以便系統(tǒng)更新磁盤狀態(tài)。否則,系統(tǒng)可能不會接納更換的硬盤,從而導致不能rebuild,另外,建議熱更換故障硬盤。l 新?lián)Q磁盤上存在不正確的RAID配置信息(僅針對Apaptec公司的RAID卡)l 更換的硬盤物理容量比故障硬盤的小或存在介質故障。l RAID卡故障。l SCSI總線不穩(wěn)定。5. RAID卡Firmware有什么作用?RAID卡的功能都是由firmware決定的,不同版本的firmware會有不同實現(xiàn)方式,高版本的firmware總是提供更多的功能以及修復早期版本的缺陷。6. 如何維護RAID數(shù)據(jù)?定期執(zhí)行check consistency和啟用RAID卡的patrol功能是一個良好的維護習慣。通常磁盤的介質會隨著時間的推移出現(xiàn)讀寫故障。當一個寫操作遇到壞塊 (RAID卡會將其標記,并存放在RAID卡及磁盤的NVRAM中,如果該表中的值到達預設閥值時,硬盤firmware將觸發(fā)故障告警),該寫操作不能完成,但RAID卡會嘗試將該數(shù)據(jù)寫到其它健康的塊上。當一個正常的讀操作遇到壞塊,那么數(shù)據(jù)是可以通過校驗信息重新得到,RAID卡將得到的信息放到一個健康的塊上,并將先前的壞塊標記出來。有時我們可能會遭遇double fault(即數(shù)據(jù)存放于多個有壞塊的的硬盤上),為了防止這些錯誤的出現(xiàn),我們必須進行維護。7. 什么是consistency check ?一致性校驗是磁盤陣列控制器的一種高級維護功能。它可以預先檢查陣列上的數(shù)據(jù),以保證它們的一致性,即數(shù)據(jù)是正確的、沒有被破壞。對于有奇偶校驗值的陣列(RAID-5),一致性校驗通過數(shù)據(jù)的奇偶校驗,并且和存校驗值的盤上的校驗值進行比較,確定并糾正數(shù)據(jù)的一致性。對于鏡像盤,一致性校驗比較RAID-1上2塊硬盤的數(shù)據(jù)是否完全一致。不一致的需要進行同步處理。對于剩余空間的磁盤介質consistency check一樣會進行讀校驗。8. 為什么要進行一致性校驗?系統(tǒng)崩潰、意外斷電或者硬盤出現(xiàn)壞道,都可能導致陣列上的數(shù)據(jù)被破壞或不一致。根據(jù)硬盤的原廠家的數(shù)據(jù),平均每進行1,000,000,000,000,000次的比特位(bit)數(shù)據(jù)傳輸,就會產(chǎn)生一個不可恢復的數(shù)據(jù)錯誤。以36GB硬盤為例,平均每進行3000次的全盤讀操作,就會產(chǎn)生1個錯誤字節(jié)(byte)。如果在陣列不一致的狀態(tài)時,發(fā)生硬盤故障,RAID控制器就無法通過奇偶校驗計算出正確的數(shù)據(jù),陣列將無法rebuild成功。9. 什么是RAID卡的Patrol功能Patrol功能是基于磁盤介質的,RAID卡firmware會在后臺按照設定的計劃定期對磁盤介質進行讀校驗,類似于SCSI卡的verify, 當發(fā)現(xiàn)壞塊時會對壞塊進行標記及搬移。Patrol功能不對RAID數(shù)據(jù)進行校驗。10. 什么是Media errorMedia Error一般是指RAID卡發(fā)現(xiàn)的磁盤讀寫錯誤。通過這個指標我們可以簡單的判斷磁盤介質的情況,有media error并不意味者磁盤一定需要更換,因為磁盤的firmware會對壞塊進行屏蔽及遷移。但應

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論