WHUMG應(yīng)急維護指導(dǎo)書_第1頁
WHUMG應(yīng)急維護指導(dǎo)書_第2頁
WHUMG應(yīng)急維護指導(dǎo)書_第3頁
WHUMG應(yīng)急維護指導(dǎo)書_第4頁
WHUMG應(yīng)急維護指導(dǎo)書_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、WH500220UMG8900 應(yīng)急維護指導(dǎo)書 (cover)ISSUE 1.0模板使用說明:(Notes Heading,F10) 1. 本模板為培訓(xùn)手冊寫作專用模板。模板中藍字字體為該段落應(yīng)選取的樣式,紅色字體為模板的使用說明。(Notes Text,F8)2. 套用該模板時,請按正確步驟加載模板。3. 建議直接用該模板建一個新文件來進行寫作。寫作時一定不要刪除文中的分節(jié),直接將封面、課程說明、正文、小結(jié)等幾部分內(nèi)容直接拷貝到相應(yīng)位置,并刪除該位置的示例內(nèi)容,再套用相應(yīng)的樣式。樣式說明:(Notes Heading,F10)1. 本模板中標(biāo)題號、頁碼為自動編號,不需要修改。2. 表格和圖形

2、編號會在章內(nèi)自動重新編號,正文中的表格和圖形編號需要手動插入“交叉引用”。3. Notes Text為自動編號。若不需要編號,需要手動取消編號。(Notes Text,F8)4. 頁眉中左側(cè)的課程名稱需手動修改;右側(cè)的章節(jié)名稱及編號由原來的“交叉引用”改為“域”,會自動更新。設(shè)置好后就不再需要插入和更新。樣式快捷鍵樣式快捷鍵標(biāo)題1 (Heading 1)Alt+1表格題注 (Table Description)F5標(biāo)題2 (Heading 2)Alt+2表頭 (Table Heading)F6標(biāo)題3 (Heading 3)Alt+3表正文 (Table Text)F7標(biāo)題4 (Heading

3、4)Alt+4說明內(nèi)容 (Notes Text)F8正文 (Normal)F2特別說明 (Notes Heading)F10正文項目 (Item List)F3圖題注 (Figure Description)F11自動編號 (Item Step)F4圖文本 (Figure Text)F12模板中樣式與快捷鍵對應(yīng)表:1. 強烈推薦大家使用快捷鍵,真的又快又方便。2. 請將該模板放到MicrosoftTemplate下,只有這樣快捷鍵才能生效。WH500220 UMG8900應(yīng)急維護指導(dǎo)書 ISSUE1.0目 錄(TOC Heading) 目 錄(TOC Heading)課程說明1課程介紹1課程目

4、標(biāo)1相關(guān)資料1第1章 緊急事故與應(yīng)急維護流程21.1 緊急事故的界定21.1.1 設(shè)備類事故21.1.2 業(yè)務(wù)類事故31.2 應(yīng)急處理過程31.2.1 總體處理流程3第2章 設(shè)備類事故處理52.1 排除機柜供電故障52.1.1 判斷機柜供電是否正常52.1.2 檢修供電系統(tǒng)然后加電重啟52.2 排除主控框運行故障62.2.1 判斷主控框供電是否正常62.2.2 檢查OMU單板是否故障62.2.3 檢查其它單板是否故障72.3 排除中心交換框運行故障72.3.1 判斷中心交換框供電是否正常72.3.2 檢查MPU單板是否故障82.3.3 檢查其它單板是否故障82.3.4 檢查級聯(lián)系統(tǒng)是否故障82

5、.4 排除業(yè)務(wù)框運行故障92.4.1 判斷業(yè)務(wù)框供電是否正常92.4.2 檢查MPU單板是否故障92.4.3 檢查其它單板是否故障102.4.4 檢查級聯(lián)系統(tǒng)是否故障102.5 排除擴展控制框運行故障112.5.1 判斷擴展控制框供電是否正常112.5.2 檢查MPU單板是否故障112.5.3 檢查其它單板是否故障122.5.4 檢查級聯(lián)系統(tǒng)是否故障122.6 排除業(yè)務(wù)模塊運行故障13是否為修改配置數(shù)據(jù)引起132.6.1 恢復(fù)正確的配置數(shù)據(jù)132.6.2 復(fù)位該業(yè)務(wù)模塊所對應(yīng)的單板132.6.3 更換該業(yè)務(wù)模塊所對應(yīng)的單板14第3章 業(yè)務(wù)類故障應(yīng)急處理153.1 全局業(yè)務(wù)阻塞的處理153.1.

6、1 全局業(yè)務(wù)阻塞的處理流程153.1.2 檢查硬件設(shè)備是否正常163.1.3 檢查承載網(wǎng)運行是否正常163.1.4 備份配置數(shù)據(jù)173.1.5 排除配置數(shù)據(jù)錯誤173.1.6 排除主機過載引起的緊急情況183.2 局部業(yè)務(wù)阻塞的處理183.2.1 局部業(yè)務(wù)阻塞的處理流程183.2.2 檢查硬件設(shè)備是否正常193.2.3 檢查承載網(wǎng)運行是否正常193.2.4 備份配置數(shù)據(jù)193.2.5 檢查該UMG8900是否正常注冊193.2.6 檢查UMG8900與MGC之間的通信是否正常203.2.7 檢查目的信令點是否可達203.2.8 是否為修改信令數(shù)據(jù)引起203.2.9 恢復(fù)正確的信令數(shù)據(jù)203.2

7、.10 恢復(fù)正確的中繼數(shù)據(jù)203.2.11 轉(zhuǎn)對端交換局處理事故2121華為技術(shù)有限公司 版權(quán)所有, 未經(jīng)許可不得擴散WH500220 UMG8900應(yīng)急維護指導(dǎo)書 ISSUE1.0課程說明(標(biāo)題1,ALT+1) 課程說明(標(biāo)題1,ALT+1)課程介紹(標(biāo)題2,ALT+2)本課程主要介紹UMG8900設(shè)備在發(fā)生緊急事故的情況下,如何迅速判斷事故原因,排除故障,快速恢復(fù)系統(tǒng)或設(shè)備的正常運行,并將事故損失降到最低。本課程的主要內(nèi)容如下:第一章介紹緊急事故的分類;第二章針對事故種類和場景進行判斷,采取應(yīng)急措施;第三章介紹如何搜集故障信息,采集哪些故障信息。(正文,F2)課程目標(biāo)(標(biāo)題2)完成本課程的

8、學(xué)習(xí)后,您應(yīng)該能夠: (正文,F2)l 了解UMG8900設(shè)備的應(yīng)急維護方法(Item List,F3)l 掌握UMG8900設(shè)備的應(yīng)急維護措施相關(guān)資料(標(biāo)題2)UMG8900 應(yīng)急維護手冊WH500220 UMG8900應(yīng)急維護指導(dǎo)書 ISSUE1.00第1章 緊急事故與應(yīng)急維護流程(標(biāo)題1,Alt+1)1.1 緊急事故的界定所謂緊急事故,是指突然發(fā)生的、影響面廣、涉及范圍大、并對網(wǎng)絡(luò)的安全運行與服務(wù)質(zhì)量造成嚴重后果的設(shè)備或網(wǎng)絡(luò)事故。常見的現(xiàn)象包括:l 大量用戶無法使用語音業(yè)務(wù);l 大量用戶通話過程中出現(xiàn)頻繁掉話;l 頻繁出現(xiàn)單通、雙不通、串話、雜音等現(xiàn)象;l 大量用戶不能做主叫或不能做被叫

9、;l 大量用戶無法進行數(shù)據(jù)業(yè)務(wù);l 數(shù)據(jù)業(yè)務(wù)使用不正常、速率慢、時斷時續(xù);l 系統(tǒng)的CPU占用率過高。為便于緊急事故的處理,我們可以從兩個方面對與UMG8900有關(guān)的緊急事故進行界定:l 按事故影響到的設(shè)備功能進行界定,即判斷本次事故是否為設(shè)備類事故;l 按事故影響到的業(yè)務(wù)范圍進行界定,即判斷本次事故是否為業(yè)務(wù)類事故。1.1.1 設(shè)備類事故設(shè)備類事故表現(xiàn)在UMG8900整機或者主要部件運行發(fā)生了故障,導(dǎo)致在網(wǎng)絡(luò)中發(fā)生了功能完全喪失或大部分喪失的惡性事故。在故障定位的過程中,當(dāng)出現(xiàn)以下任何一種情況時,我們稱本局UMG8900發(fā)生了設(shè)備類事故:l 所有機柜全部掉電;l 主控框掉電;l 業(yè)務(wù)框掉電;

10、l 中心交換框掉電;l OMU主備單板故障;l 業(yè)務(wù)模塊癱瘓。業(yè)務(wù)模塊癱瘓是指某個業(yè)務(wù)模塊發(fā)生了功能完全喪失的惡性事故,主要表現(xiàn)為該業(yè)務(wù)模塊所對應(yīng)的主備用單板或者負荷分擔(dān)的單板的運行均出現(xiàn)了故障或“宕機”。1.1.2 業(yè)務(wù)類事故業(yè)務(wù)類事故表現(xiàn)為UMG8900提供的業(yè)務(wù)出現(xiàn)全局或部分阻塞。1. 全局業(yè)務(wù)阻塞全局業(yè)務(wù)阻塞是指本局UMG8900發(fā)生了長時間的、全局范圍內(nèi)的業(yè)務(wù)中斷或呼叫阻塞事故。在故障定位的過程中,當(dāng)出現(xiàn)以下任何一種情況時,我們稱本局UMG8900發(fā)生了全局業(yè)務(wù)阻塞事故:l 全部媒體網(wǎng)關(guān)均不能正常注冊,如無法注冊到媒體網(wǎng)關(guān)控制器MGC、注冊后又立即斷開等;l 在UMG8900接入的用

11、戶終端中,全部用戶終端均發(fā)生呼叫阻塞,如無法呼入、無法呼出等;l UMG8900提供的所有中繼電路不能正常使用,如TDM電路全部故障、無法呼入、無法呼出等。2. 局部業(yè)務(wù)阻塞局部業(yè)務(wù)阻塞是指本局UMG8900發(fā)生了長時間的、局部范圍內(nèi)的業(yè)務(wù)中斷或呼叫阻塞事故,其常見的表現(xiàn)形式有:l 部分媒體網(wǎng)關(guān)不能正常注冊到媒體網(wǎng)關(guān)控制器MGC,如無法注冊、注冊后又立即斷開等;l 在UMG8900接入的用戶終端中,部分用戶終端均發(fā)生呼叫阻塞,如無法呼入、無法呼出等;l UMG8900提供的部分中繼電路不能正常使用,如TDM電路部分故障、無法呼入、無法呼出等。1.2 應(yīng)急處理過程1.2.1 總體處理流程應(yīng)急維護

12、以快速恢復(fù)設(shè)備的正常運行與業(yè)務(wù)的正常提供為核心指導(dǎo)思想,其總體處理流程如1. 所示。應(yīng)急維護的總體處理流程寫作說明:1. 章節(jié)小結(jié)一定要有,而且要新起一頁。2. 章節(jié)小結(jié)可以不用膠片,直接用文字來表述。3. 小結(jié)不一定非要在章節(jié)結(jié)束才有,一個相對獨立的內(nèi)容講解完后就可以有一個小結(jié)。第2章 設(shè)備類事故處理設(shè)備類事故表現(xiàn)在全部機柜掉電、機框掉電、OMU主備單板故障等,通過查看系統(tǒng)告警、單板指示燈等方法可以判斷。對于硬件類故障產(chǎn)生的告警,比如單板溫度致命告警、單板電壓致命告警、風(fēng)扇框通訊故障、配電框通訊故障等,請按照相關(guān)告警聯(lián)機幫助介紹來處理有關(guān)緊急和重要告警。2.1 排除機柜供電故障2.1.1 判

13、斷機柜供電是否正常機柜全部掉電或綜合配置機柜掉電必然導(dǎo)致主機設(shè)備癱瘓。維護人員可通過以下方法判斷機柜的供電是否正常:l 若機柜配電框面板上的“RUN”運行指示燈(綠色)點亮、并每秒鐘閃爍1次,則表示機柜的供電正常,即配電框的進線電源正常、配電框的內(nèi)部電路正常。l 若機柜配電框面板上的“RUN”運行指示燈(綠色)熄滅,則表示機柜的供電不正常,即配電框的兩路進線電源全部失壓。2.1.2 檢修供電系統(tǒng)然后加電重啟機柜供電不正常一般是由于機房的供電系統(tǒng)發(fā)生故障而引起,在這種情況下,維護人員應(yīng)按照以下操作步驟進行恢復(fù):在機房的供電系統(tǒng)恢復(fù)正常之前,為防止意外,請斷開機柜配電框面板上的所有電源開關(guān)(SW1

14、SW6)。立即檢修機房的供電系統(tǒng),比如機房的空氣開關(guān)是否跳閘等。在機房的供電系統(tǒng)恢復(fù)正常之后,請對機柜執(zhí)行加電重啟操作。-結(jié)束2.2 排除主控框運行故障2.2.1 判斷主控框供電是否正常由于主控框內(nèi)配置有OMU、TNU等重要單板,因此,主控框掉電將直接導(dǎo)致框內(nèi)的重要單板不能使用,從而導(dǎo)致主機設(shè)備癱瘓。維護人員可通過以下方法判斷主控框的供電是否正常:l 若主控框內(nèi)各單板的面板指示燈均被點亮,則表示主控框的供電正常。l 若主控框內(nèi)單板的面板指示燈均沒被點亮,則表示主控框的供電不正常。如果發(fā)現(xiàn)為電源模塊故障,可按照如下方式盡快處理電源問題,恢復(fù)系統(tǒng)。確認提供整框的-48V電源是否有問題,檢查機柜上部

15、的配電盒以及配電柜,是否工作正常。檢查電源線路是否正常。通過萬用表測試電源輸出是否正常。如為單板電源模塊問題,請更換單板。-結(jié)束2.2.2 檢查OMU單板是否故障OMU單板作為整個設(shè)備的管理控制中心,采用主備方式工作。如果主OMU單板發(fā)生故障,設(shè)備會自動倒換到備OMU單板,不影響設(shè)備運行,如果主備板都發(fā)生了故障,則會導(dǎo)致設(shè)備無法正常運行。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷主控框內(nèi)OMU單板的運行已經(jīng)處于癱瘓狀態(tài):l 主備用OMU單板面板上的“RUN”運行指示燈熄滅或常亮。l 主備用OMU單板面板上的“ALM”故障指示燈點亮。l 在本地維護終端上運行MML命令DSP CPUR,查詢主備用

16、OMU單板的CPU占用率在長時間范圍內(nèi)接近100%。當(dāng)確定OMU單板發(fā)生故障后,請更換故障的OMU單板,有關(guān)OMU單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.2.3 檢查其它單板是否故障主控框內(nèi)除OMU單板外的其它單板如果發(fā)生故障,根據(jù)單板的具備功能不同,可能會局部影響設(shè)備的運行,造成局部業(yè)務(wù)中斷。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷主控框內(nèi)該單板的運行已經(jīng)處于癱瘓狀態(tài):l 該單板面板上的“RUN”運行指示燈熄滅或常亮。l 該單板面板上的“ALM”故障指示燈點亮。l 該單板的CPU占用率在長時間范圍內(nèi)接近100%。當(dāng)確定該單板發(fā)生故障后

17、,請更換有故障的該單板,有關(guān)該單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.3 排除中心交換框運行故障2.3.1 判斷中心交換框供電是否正常由于中心交換框內(nèi)配置有MPU、TNU、BLU等重要單板,因此,中心交換框掉電將直接導(dǎo)致框內(nèi)的重要單板不能使用,從而導(dǎo)致與之相級聯(lián)的業(yè)務(wù)框、擴展控制框癱瘓。維護人員可通過以下方法判斷中心交換框的供電是否正常:l 若中心交換框內(nèi)各單板的面板指示燈均被點亮,則表示中心交換框的供電正常。l 若中心交換框內(nèi)單板的面板指示燈均沒被點亮,則表示中心交換框的供電不正常。如果發(fā)現(xiàn)為電源模塊故障,可按照如下方式盡快處理電源問題

18、,恢復(fù)系統(tǒng)。確認提供整框的-48V電源是否有問題,檢查機柜上部的配電盒以及配電柜,是否工作正常;檢查電源線路是否正常;通過萬用表測試電源輸出是否正常;如為單板電源模塊問題,請更換單板。-結(jié)束2.3.2 檢查MPU單板是否故障MPU單板作為整個設(shè)備的主處理單元,在中心交換框內(nèi)位于前插7、8槽位,采用主備方式工作。如果主MPU單板發(fā)生故障,設(shè)備會自動倒換到備MPU單板,不影響設(shè)備運行,如果主備板都發(fā)生了故障,則會導(dǎo)致設(shè)備無法正常運行。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷中心交換框內(nèi)MPU單板的運行已經(jīng)處于癱瘓狀態(tài):l 主備用MPU單板面板上的“RUN”運行指示燈熄滅或常亮。l 主備用MPU單

19、板面板上的“ALM”故障指示燈點亮。l 主備用MPU單板的CPU占用率在長時間范圍內(nèi)接近100%。當(dāng)確定MPU單板發(fā)生故障后,請更換故障的MPU單板,有關(guān)MPU單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.3.3 檢查其它單板是否故障中心交換框內(nèi)除MPU單板外的其它單板如果發(fā)生故障,根據(jù)單板的具備功能不同,可能會局部影響設(shè)備的運行,造成局部業(yè)務(wù)中斷。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷中心交換框內(nèi)該單板的運行已經(jīng)處于癱瘓狀態(tài):l 該單板面板上的“RUN”運行指示燈熄滅或常亮。l 該單板面板上的“ALM”故障指示燈點亮。l 該單板的CPU占

20、用率在長時間范圍內(nèi)接近100%。當(dāng)確定該單板發(fā)生故障后,請更換有故障的該單板,有關(guān)該單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.3.4 檢查級聯(lián)系統(tǒng)是否故障中心交換框提供交換與級聯(lián)功能,通過TNU、NET、BLU單板與主控框、業(yè)務(wù)框、擴展控制框?qū)崿F(xiàn)級聯(lián)功能。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷級聯(lián)系統(tǒng)已經(jīng)處于緊急事故狀態(tài):l FE級聯(lián)網(wǎng)口LINK指示燈頻繁出現(xiàn)閃斷。l LMT上有級聯(lián)網(wǎng)口故障告警頻繁上報。l 中心交換框主備的BLU單板不停復(fù)位,啟動失敗。當(dāng)確定級聯(lián)系統(tǒng)發(fā)生故障后,可以嘗試從以下幾種方法處理故障:l 級聯(lián)網(wǎng)線的質(zhì)量有問題、

21、與網(wǎng)口接觸不良,需要更換網(wǎng)線、保證與網(wǎng)口接觸良好。l 與設(shè)備相連的LAN Switch芯片出現(xiàn)問題,需要更換LAN Switch。l 先拔掉BLU上的TDM光纖,如果BLU單板能正常啟動,說明是TNU的級聯(lián)部分頻繁倒換引起的BLU復(fù)位,這是由于時鐘信號不穩(wěn)定導(dǎo)致,需要更換NET單板或CLK時鐘板,保證系統(tǒng)提供穩(wěn)定的時鐘。也可能是TNU單板故障,需要更換TNU單板。2.4 排除業(yè)務(wù)框運行故障2.4.1 判斷業(yè)務(wù)框供電是否正常由于業(yè)務(wù)框內(nèi)配置有MPU、TNU等重要單板,因此,業(yè)務(wù)框掉電將直接導(dǎo)致框內(nèi)的重要單板不能使用,從而導(dǎo)致業(yè)務(wù)中斷。維護人員可通過以下方法判斷業(yè)務(wù)框的供電是否正常:l 若業(yè)務(wù)框內(nèi)

22、各單板的面板指示燈均被點亮,則表示業(yè)務(wù)框的供電正常。l 若業(yè)務(wù)框內(nèi)單板的面板指示燈均沒被點亮,則表示業(yè)務(wù)框的供電不正常。如果發(fā)現(xiàn)為電源模塊故障,可按照如下方式盡快處理電源問題,恢復(fù)系統(tǒng)。確認提供整框的-48V電源是否有問題,檢查機柜上部的配電盒以及配電柜,是否工作正常;檢查電源線路是否正常;通過萬用表測試電源輸出是否正常;如為單板電源模塊問題,請更換單板。-結(jié)束2.4.2 檢查MPU單板是否故障MPU單板作為整個設(shè)備的主處理單元,在業(yè)務(wù)框內(nèi)位于前插7、8槽位,采用主備方式工作。如果主MPU單板發(fā)生故障,設(shè)備會自動倒換到備MPU單板,不影響設(shè)備運行,如果主備板都發(fā)生了故障,則會導(dǎo)致設(shè)備無法正常運

23、行。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷業(yè)務(wù)框內(nèi)MPU單板的運行已經(jīng)處于癱瘓狀態(tài):l 主備用MPU單板面板上的“RUN”運行指示燈熄滅或常亮。l 主備用MPU單板面板上的“ALM”故障指示燈點亮。l 主備用MPU單板的CPU占用率在長時間范圍內(nèi)接近100%。當(dāng)確定MPU單板發(fā)生故障后,請更換故障的MPU單板,有關(guān)MPU單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.4.3 檢查其它單板是否故障業(yè)務(wù)框內(nèi)除MPU單板外的其它單板如果發(fā)生故障,根據(jù)單板的具備功能不同,可能會局部影響設(shè)備的運行,造成局部業(yè)務(wù)中斷。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即

24、可判斷業(yè)務(wù)框內(nèi)該單板的運行已經(jīng)處于癱瘓狀態(tài):l 該單板面板上的“RUN”運行指示燈熄滅或常亮。l 該單板面板上的“ALM”故障指示燈點亮。l 該單板的CPU占用率在長時間范圍內(nèi)接近100%。當(dāng)確定該單板發(fā)生故障后,請更換有故障的該單板,有關(guān)該單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.4.4 檢查級聯(lián)系統(tǒng)是否故障業(yè)務(wù)框提供業(yè)務(wù)處理功能,通過TNU或者NET單板與中心交換框?qū)崿F(xiàn)級聯(lián)功能,當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷級聯(lián)系統(tǒng)已經(jīng)處于緊急事故狀態(tài):l FE級聯(lián)網(wǎng)口指示燈頻繁出現(xiàn)閃斷。l LMT上有級聯(lián)網(wǎng)口故障告警頻繁上報。l 中心交換

25、框主備的BLU單板不停復(fù)位,啟動失敗。當(dāng)確定級聯(lián)系統(tǒng)發(fā)生故障后,可以嘗試從以下幾種方法處理故障:l 級聯(lián)網(wǎng)線的質(zhì)量有問題、與網(wǎng)口接觸不良,需要更換網(wǎng)線、保證與網(wǎng)口接觸良好。l 與設(shè)備相連的LAN Switch芯片出現(xiàn)問題,需要更換LAN Switch。l 先拔掉BLU上的TDM光纖,如果BLU單板能正常啟動,說明是TNU的級聯(lián)部分頻繁倒換引起的BLU復(fù)位,這是由于時鐘信號不穩(wěn)定導(dǎo)致,需要更換NET單板或CLK時鐘板,保證系統(tǒng)提供穩(wěn)定的時鐘。也可能是TNU單板故障,需要更換TNU單板。2.5 排除擴展控制框運行故障2.5.1 判斷擴展控制框供電是否正常由于擴展控制框內(nèi)配置有MPU、NET等重要單

26、板,因此,擴展控制框掉電將直接導(dǎo)致框內(nèi)的重要單板不能使用,從而導(dǎo)致業(yè)務(wù)中斷。維護人員可通過以下方法判斷擴展控制框的供電是否正常:l 若擴展控制框內(nèi)各單板的面板指示燈均被點亮,則表示擴展控制框的供電正常。l 若擴展控制框內(nèi)單板的面板指示燈均沒被點亮,則表示擴展控制框的供電不正常。如果發(fā)現(xiàn)為電源模塊故障,可按照如下方式盡快處理電源問題,恢復(fù)系統(tǒng)。確認提供整框的-48V電源是否有問題,檢查機柜上部的配電盒以及配電柜,是否工作正常;檢查電源線路是否正常;通過萬用表測試電源輸出是否正常;如為單板電源模塊問題,請更換單板。-結(jié)束2.5.2 檢查MPU單板是否故障MPU單板作為整個設(shè)備的主處理單元,在擴展控

27、制框內(nèi)位于前插7、8槽位,采用主備方式工作。如果主MPU單板發(fā)生故障,設(shè)備會自動倒換到備MPU單板,不影響設(shè)備運行,如果主備板都發(fā)生了故障,則會導(dǎo)致設(shè)備無法正常運行。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷擴展控制框內(nèi)MPU單板的運行已經(jīng)處于癱瘓狀態(tài):l 主備用MPU單板面板上的“RUN”運行指示燈熄滅或常亮。l 主備用MPU單板面板上的“ALM”故障指示燈點亮。l 主備用MPU單板的CPU占用率在長時間范圍內(nèi)接近100%。當(dāng)確定MPU單板發(fā)生故障后,請更換故障的MPU單板,有關(guān)MPU單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.5.3 檢查

28、其它單板是否故障擴展控制框內(nèi)除MPU單板外的其它單板如果發(fā)生故障,根據(jù)單板的具備功能不同,可能會局部影響設(shè)備的運行,造成局部業(yè)務(wù)中斷。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷擴展控制框內(nèi)該單板的運行已經(jīng)處于癱瘓狀態(tài):l 該單板面板上的“RUN”運行指示燈熄滅或常亮。l 該單板面板上的“ALM”故障指示燈點亮。l 該單板的CPU占用率在長時間范圍內(nèi)接近100%。當(dāng)確定該單板發(fā)生故障后,請更換有故障的該單板,有關(guān)該單板更換的詳細操作,請參考HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 部件更換相關(guān)部分內(nèi)容。2.5.4 檢查級聯(lián)系統(tǒng)是否故障擴展控制框提供呼叫控制消息處理,通過NET單板與中心交換框?qū)?/p>

29、現(xiàn)級聯(lián)功能。當(dāng)出現(xiàn)以下任何一種情況時,維護人員即可判斷級聯(lián)系統(tǒng)已經(jīng)處于緊急事故狀態(tài):l FE級聯(lián)網(wǎng)口指示燈頻繁出現(xiàn)閃斷。l LMT上有級聯(lián)網(wǎng)口故障告警頻繁上報。l NET單板不停復(fù)位,啟動失敗。當(dāng)確定級聯(lián)系統(tǒng)發(fā)生故障后,可以嘗試從以下幾種方法處理故障:l 級聯(lián)網(wǎng)線的質(zhì)量有問題、與網(wǎng)口接觸不良,需要更換網(wǎng)線、保證與網(wǎng)口接觸良好。l 與設(shè)備相連的LAN Switch芯片出現(xiàn)問題,需要更換LAN Switch。l 可能是NET單板故障,需要更換NET單板。2.6 排除業(yè)務(wù)模塊運行故障當(dāng)維護人員確認系統(tǒng)發(fā)生了業(yè)務(wù)模塊癱瘓的緊急事故后,應(yīng)立即按照如下的基本思路來進行處理。是否為修改配置數(shù)據(jù)引起恢復(fù)正確的

30、配置數(shù)據(jù)復(fù)位該業(yè)務(wù)模塊所對應(yīng)的單板更換該業(yè)務(wù)模塊所對應(yīng)的單板Error! Reference source not found.-結(jié)束是否為修改配置數(shù)據(jù)引起一般情況下,維護人員不能修改UMG8900的公共參數(shù)、模塊參數(shù)、與對端的協(xié)商參數(shù)等重要配置數(shù)據(jù)。如果維護人員不合理地修改了這些配置數(shù)據(jù),某些單板可能會出現(xiàn)無法加載或反復(fù)加載的現(xiàn)象,從而導(dǎo)致該單板無法正常運行。在這種情況下,維護人員可使用LST LOG命令來查詢系統(tǒng)的日志信息,查詢有關(guān)SET、MOD等命令的操作記錄。2.6.1 恢復(fù)正確的配置數(shù)據(jù)若維護人員不合理地修改了上個步驟所描述的配置數(shù)據(jù),請立即恢復(fù)正確的配置數(shù)據(jù),或在華為公司技術(shù)服務(wù)人

31、員的指導(dǎo)下恢復(fù)正確的配置數(shù)據(jù)。2.6.2 復(fù)位該業(yè)務(wù)模塊所對應(yīng)的單板在維護人員沒有錯誤修改配置數(shù)據(jù)的情況下,若系統(tǒng)發(fā)生了業(yè)務(wù)模塊癱瘓的緊急事故,為快速恢復(fù)設(shè)備的正常運行與業(yè)務(wù)的正常提供,維護人員繼續(xù)如下操作:對該業(yè)務(wù)模塊所對應(yīng)的單板執(zhí)行硬件復(fù)位操作,然后觀察該業(yè)務(wù)模塊的運行是否恢復(fù)正常。2.6.3 更換該業(yè)務(wù)模塊所對應(yīng)的單板在對該業(yè)務(wù)模塊所對應(yīng)的單板執(zhí)行硬件復(fù)位操作后,若該業(yè)務(wù)模塊的運行仍然未能恢復(fù)正常,請嘗試通過更換該業(yè)務(wù)模塊所對應(yīng)的單板來排除故障。第3章 業(yè)務(wù)類故障應(yīng)急處理業(yè)務(wù)類事故表現(xiàn)在UMG8900全局或者大范圍業(yè)務(wù)使用發(fā)生阻塞,可以通過大量用戶投訴、告警等發(fā)現(xiàn)。按照緊急情況發(fā)生時故障

32、的現(xiàn)象,初步判斷是全局業(yè)務(wù)阻塞還是局部業(yè)務(wù)阻塞。全局業(yè)務(wù)阻塞包括的情況如下:l 由病毒引起的大面積的全局業(yè)務(wù)受到影響l 硬件線路、電源等導(dǎo)致的全局業(yè)務(wù)中斷l(xiāng) 話務(wù)量大時的全局業(yè)務(wù)阻塞局部業(yè)務(wù)阻塞包括的情況如下:l 某種業(yè)務(wù)的故障、某個局向的用戶故障l 某塊單板上用戶的故障(可以根據(jù)分配的用戶地址來判斷)3.1 全局業(yè)務(wù)阻塞的處理3.1.1 全局業(yè)務(wù)阻塞的處理流程當(dāng)維護人員確認系統(tǒng)發(fā)生了全局業(yè)務(wù)阻塞的緊急事故后,應(yīng)立即按照如下基本思路來進行處理。檢查硬件設(shè)備是否正常檢查承載網(wǎng)運行是否正常備份配置數(shù)據(jù)排除配置數(shù)據(jù)錯誤排除主機過載引起的緊急情況Error! Reference source not

33、found.-結(jié)束3.1.2 檢查硬件設(shè)備是否正常由于硬件設(shè)備癱瘓必然同時引發(fā)全局業(yè)務(wù)阻塞事故,因此,維護人員在處理全局業(yè)務(wù)阻塞事故時,應(yīng)首先檢查UMG8900是否發(fā)生了硬件設(shè)備癱瘓的事故。3.1.3 檢查承載網(wǎng)運行是否正常在UMG8900硬件設(shè)備運行正常的情況下,當(dāng)系統(tǒng)發(fā)生業(yè)務(wù)阻塞事故時,維護人員應(yīng)首先檢查承載網(wǎng)的運行是否正常。常用的檢查方法有:l 登錄告警臺查看是否存在承載網(wǎng)故障的告警。l 查看單板、LAN Switch、Firewall端口上的指示燈,檢查是否存在物理連線故障。l 在UMG8900上使用ping命令,檢查到相關(guān)設(shè)備的連接是否正常。在本地維護終端的接口跟蹤任務(wù)中使用“PIN

34、G” 跟蹤任務(wù),向目的地發(fā)送ping報文,如果到目的地網(wǎng)絡(luò)連接工作正常,則目的地主機接收到ping報文后,向源主機發(fā)送ping應(yīng)答報文。ping命令的輸出信息包括目的地對每個ping報文的響應(yīng)情況:l 如果在超時時間內(nèi)收到響應(yīng)報文,則輸出報文的字節(jié)數(shù)、報文序號、TTL和響應(yīng)時間等。l 如果在超時時間內(nèi)沒有收到響應(yīng)報文,則輸出“Requested time out”,最后的統(tǒng)計信息,包括發(fā)送報文個數(shù)、接收到響應(yīng)報文個數(shù)、未響應(yīng)報文數(shù)百分比和響應(yīng)時間的最小、最大和平均值。 注意:1. 請先確認哪些地址是可以ping通的,比如公網(wǎng)地址往往由于防火墻的隔離功能,是無法ping通的。使用ping命令時需

35、要注意以下幾點:l 如果網(wǎng)絡(luò)傳輸速度較慢,可以適當(dāng)加大等待響應(yīng)的超時時間。l 如果是在Telnet方式下,可以通過“CTRL+C”中斷ping命令。l 每個單板最多同時可以進行5個ping操作。l ping操作是從具有IP接口的單板的網(wǎng)口向目的地發(fā)送ping報文,以分析到目的地的網(wǎng)絡(luò)連接是否正常。當(dāng)用ping命令測試發(fā)現(xiàn)網(wǎng)絡(luò)出現(xiàn)故障后,可以用tracert測試網(wǎng)絡(luò)何處有故障。在本地維護終端的接口跟蹤任務(wù)中使用“TRACERT”跟蹤任務(wù),定位承載網(wǎng)中發(fā)生故障的路由器的IP地址。與數(shù)據(jù)通信部門聯(lián)系,使用專用的儀器或軟件測試承載網(wǎng)的傳輸時延、誤碼率、丟包率、抖動等參數(shù),以確認承載網(wǎng)是否存在網(wǎng)絡(luò)擁塞、

36、網(wǎng)絡(luò)風(fēng)暴、病毒攻擊等故障。當(dāng)承載網(wǎng)的運行出現(xiàn)故障時,請立即聯(lián)系數(shù)據(jù)部門執(zhí)行承載網(wǎng)事故處理。3.1.4 備份配置數(shù)據(jù)由于在事故處理的過程中,維護人員可能要執(zhí)行修改配置數(shù)據(jù)、復(fù)位單板、復(fù)位模塊甚至復(fù)位機框等重大操作,為確保數(shù)據(jù)安全,在執(zhí)行修改配置數(shù)據(jù)等涉及修改BAM數(shù)據(jù)庫的操作之前,維護人員應(yīng)預(yù)先備份配置數(shù)據(jù)。有關(guān)備份配置數(shù)據(jù)的詳細操作請參見“HUAWEI UMG8900 通用媒體網(wǎng)關(guān) 系統(tǒng)備份與恢復(fù)”。3.1.5 排除配置數(shù)據(jù)錯誤在UMG8900正常投入運行以后,維護人員不能隨意修改配置數(shù)據(jù)。如果維護人員不正確地修改了配置數(shù)據(jù),例如刪除了VPU單板的TC資源管理功能、更改了FE端口的IP地址等,

37、則當(dāng)系統(tǒng)重新啟動后,UMG8900將可能出現(xiàn)全局業(yè)務(wù)阻塞的事故。通過命令LST LOG查看操作日志可以判斷是否有影響全局的數(shù)據(jù)改動操作,此時應(yīng)該根據(jù)具體的操作進行相應(yīng)的恢復(fù)手段。 注意:1. 數(shù)據(jù)修改必須在話務(wù)量低的時候進行,在數(shù)據(jù)修改完成后必須進行詳細的撥測,確認修改正確,避免引發(fā)事故。對于數(shù)據(jù)改動錯誤的緊急情況可以按照以下步驟處理:按照操作日志中的操作記錄,逐一檢查數(shù)據(jù),找出導(dǎo)致緊急情況發(fā)生的錯誤數(shù)據(jù)。修改錯誤數(shù)據(jù)。觀察是否解決問題。如果找不出數(shù)據(jù)錯誤的地方,可以使用緊急情況出現(xiàn)前最近備份的數(shù)據(jù)來對系統(tǒng)進行重新加載,恢復(fù)業(yè)務(wù)。-結(jié)束3.1.6 排除主機過載引起的緊急情況主機過載表現(xiàn)為CPU

38、占用率持續(xù)偏高,一般是因為極大話務(wù)量、性能測量任務(wù)(或者跟蹤任務(wù))太多或者流量控制設(shè)置不當(dāng)造成。若CPU占用率持續(xù)過高,超過正常的門限,會產(chǎn)生相應(yīng)的告警。UMG8900支持應(yīng)用H.248.10/11協(xié)議進行過載控制,由MGC對UMG8900的過載情況進行相應(yīng)的處理,保證UMG8900的系統(tǒng)安全,需要MGC和UMG8900配合完成。當(dāng)MGC過載控制不成功時,MG需要啟動過載保護,防止過載控制不成功時對網(wǎng)關(guān)造成損害。過載保護時網(wǎng)關(guān)自我實現(xiàn)保護功能,不需要與MGC進行交互,可以進行單獨配置與實現(xiàn)。主機過載應(yīng)該查看是否因為性能測量任務(wù)過多,跟蹤任務(wù)過多,或者性能測量任務(wù)周期過短造成。如果是這種情況,則

39、應(yīng)該刪除已登記的不必要性能測量任務(wù)和跟蹤任務(wù),以減輕CPU的處理負擔(dān)和前后臺通信的消息量。但是對于一些必要的性能測量任務(wù),建議不要刪除,對于跟蹤任務(wù)可以全部關(guān)閉。也有可能是因為單板業(yè)務(wù)忙造成的,或者負荷分擔(dān)的單板中有一塊或多塊發(fā)生故障或被下電、拔出。此時對于負荷分擔(dān)的單板,可以考慮增加單板數(shù)目。也可以考慮擴容業(yè)務(wù)框。3.2 局部業(yè)務(wù)阻塞的處理3.2.1 局部業(yè)務(wù)阻塞的處理流程當(dāng)維護人員確認系統(tǒng)發(fā)生了UMG8900業(yè)務(wù)阻塞的緊急事故后,應(yīng)立即按照如下的基本思路來進行處理。檢查硬件設(shè)備是否正常檢查承載網(wǎng)運行是否正常備份配置數(shù)據(jù)檢查該UMG8900是否正常注冊檢查UMG8900與MGC之間的通信是否正常檢查目的信令點是否可達是否為修改信令數(shù)據(jù)引起恢復(fù)正確的信令數(shù)據(jù)恢復(fù)正確的中繼數(shù)據(jù)轉(zhuǎn)對端交換局處理事故Error! Reference source not found.-結(jié)束3.2.2 檢查硬件設(shè)備是否正常由于硬件設(shè)備癱瘓必然同時引發(fā)局部業(yè)務(wù)阻塞事故,因此,維護人員在處理局部業(yè)務(wù)阻塞事故時,應(yīng)首先檢查UMG8900是否發(fā)生了硬件設(shè)備癱瘓的事故。3.2.3 檢查承載網(wǎng)運行是否正常承載網(wǎng)發(fā)生故障也會造成局部業(yè)務(wù)故障,具體處理方法請參見“3.1.3 檢查承載網(wǎng)運行是否正?!?。3.2.4 備份配置數(shù)據(jù)由于在事故處理的過程中,維護人員可能要執(zhí)行修改配置數(shù)據(jù)、復(fù)位單板、復(fù)位模塊甚至復(fù)位機框等重大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論