




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、HUAWEI TECHNOLOGIES CO., LTDHUAWEI Confidential Security Level: 內(nèi)部公開UMG8900產(chǎn)品問題定位-操作維護與硬件類ISSUE1.0HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 2第第2章章 硬件類常見問題處理硬件類常見問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 31.1 加載類常見問題處理加載類常見問題處理1.2 LMT無法登陸問題處理無法登陸問題處理HUAWEI TECHNOLOGIES CO.
2、, LTD.HUAWEI Confidential Page 4加載類常見問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 5加載類常見問題處理l版本配置文件(vercfg_xxx.ini)是加載的核心 ,其中記錄著主版本號、各主機軟件的標準版本號、各種配置文件的標準CRC校驗值l版本配置文件使用LOD TOBAM上傳之后就可以直接生效,無需復位系統(tǒng),但CHK VERSION的主版本號需要復位任意一塊單板后才會修改HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 6加載類
3、常見問題處理l啟動方式設(shè)置為LOAD方式,備OMU從主OMU硬盤加載主機軟件到本板FLASH中,然后從FLASH解壓軟件啟動,啟動過程中不會從主用OMU單板同步配置文件和主機軟件l啟動后,備用OMU一般會上報“bam文件系統(tǒng)損壞告警”,因為主機軟件跟硬盤上的配置文件不配套。只要有此告警備用OMU在LMT面板上就會一直顯示“備份態(tài)”,所以不要試圖等待其變?yōu)檎B(tài)l手動執(zhí)行SYC BAMFILE命令,將主用OMU單板的配置文件和主機軟件同步到備用OMU上。然后將備用OMU單板啟動方式設(shè)置為FLASH,手動將其復位,使配置文件生效l備用OMU啟動后,會從主用OMU同步告警和日志,此過程中其在LMT面
4、板上顯示“備份態(tài)”,同步完畢后,顯示為“正常態(tài)”HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 7加載類常見問題處理l問題現(xiàn)象:連接FTP服務(wù)器出錯FTP服務(wù)器沒有打開用戶名或密碼輸入有誤導致 l問題現(xiàn)象:FTP文件操作錯誤硬盤空間不足導致,首先用DSP DISK命令查詢硬盤空間,看空間占用是否正常主用OMU硬盤出現(xiàn)問題,處理措施參考UMG8900統(tǒng)一維護手冊硬盤故障處理指導書HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 8加載類常見問題處理l問題現(xiàn)象:文件加載超時主用OM
5、U單板內(nèi)存碎片過多,申請不到大塊內(nèi)存,需要倒換OMU單板加載軟件文件不標準,用CHK VERSION和CHK FILE命令查看硬盤上軟件是否標準低版本下個別單板無法加載新版本軟件,將加載失敗的單板設(shè)置為LOAD方式啟動HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 91.1 加載類常見問題處理加載類常見問題處理1.2 LMT無法登陸問題處理無法登陸問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 10LMT無法登錄問題處理檢查物理連接檢查軟件版本檢查用戶連接數(shù)檢查系統(tǒng)任
6、務(wù)數(shù)檢查系統(tǒng)內(nèi)存檢查連接數(shù)組收集調(diào)試信息檢查用戶鎖定倒換單板檢查用戶時限HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 11第第1章章 操作維護類常見問題處理操作維護類常見問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 122.1 概述概述 2.2 單板不啟動問題處理單板不啟動問題處理2.3 單板運行中異常復位單板運行中異常復位2.4 常見硬件類告警問題處理常見硬件類告警問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confident
7、ial Page 13概述常見硬件問題:常見硬件問題:l單板不啟動單板不啟動 單板故障、配置問題l異常復位異常復位 軟件BUG、硬件BUG、硬件故障l硬件類告警硬件類告警 硬件故障、軟件誤告HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 14概述定位思路:定位思路:l常見問題按照固有方法排查常見問題按照固有方法排查l非常見問題收集定位信息聯(lián)系研發(fā)非常見問題收集定位信息聯(lián)系研發(fā) 告警日志(告警日志(LST ALMLOG) 運行日志(運行日志(LST LOG) 系統(tǒng)日志(系統(tǒng)日志(LST SYSLOG) 配置信息(配置信息(DSP CFG
8、) 復位日志(復位日志(do resetlog dump) 異常信息(異常信息(do except dump) 單板信息(單板信息(lst brdver、lst brdarc) 串口信息串口信息HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 152.1 概述概述 2.2 單板不啟動問題處理單板不啟動問題處理2.3 單板運行中異常復位單板運行中異常復位2.4 常見硬件類告警問題處理常見硬件類告警問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 16單板不啟動問題處理l單板
9、不上電單板不上電板類型錯誤軟硬件不匹配MBUS扣板故障板類型存儲器故障保險管燒毀/電源模塊故障l單板上電后無法正常啟動單板上電后無法正常啟動板類型錯誤啟動方式設(shè)置錯誤硬盤出錯關(guān)聯(lián)性問題電壓問題其它HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 17單板不啟動問題處理l上電原理上電原理48V 保險管5V 保險管MBUS扣板電源模塊.3.3V2.5V1.8V1.0V48V輸入5V輸入導通控制點OFFLINE藍燈板類型存儲器I2C總線溫感1溫感2微動開關(guān)電壓檢測HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Conf
10、idential Page 18單板不啟動問題處理l單板不上電單板不上電 現(xiàn)象:現(xiàn)象:單板拉手條OFFLINE藍燈亮,RUN、ALM、ACT燈都不亮;l常見原因常見原因板類型錯誤軟硬件不匹配板類型存儲器故障HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 19單板不啟動問題處理l單板不上電單板不上電板類型錯誤板類型錯誤處理方法:處理方法:1、硬件板類型對應(yīng)的領(lǐng)域不一致,比如移動領(lǐng)域使用了FNET單板。可以通過修改板 類型解決。(R6B048及其以后版本無此限制)2、非法板類型,修改成實際板類型。HUAWEI TECHNOLOGIES C
11、O., LTD.HUAWEI Confidential Page 20單板不啟動問題處理l案例一案例一某局點某局點UG01SCMUUG01SCMU不上電不上電現(xiàn)象:拉手條上offline藍色指示燈常亮,其它指示燈不亮; LMT面板上SCMU為暗紅色不匹配狀態(tài);排查步驟:1、查詢板類型:mnt mbusinfo slotno: 6; plugin:install; boardtype:virtual; running:no run; power: off; Ugver: 02、修改板類型:mnt wbt scmu 0 6 slotno: 6; plugin:install; boardtype:
12、SCMU; running:running; power: on; Ugver: 03、再次確認指示燈狀態(tài):offine燈滅,run燈亮,LMT面板顯示為鮮紅色,3分鐘后成 功啟動;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 21單板不啟動問題處理l單板不上電單板不上電軟硬件不匹配軟硬件不匹配處理方法:處理方法:對照硬件配套關(guān)系確認是否符合要求HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 22單板不啟動問題處理l案例二案例二某局點某局點UG02MS2LUG02MS2L不
13、上電不上電現(xiàn)象:拉手條上offline藍色指示燈常亮,其它指示燈不亮; LMT面板上對應(yīng)槽位為暗紅色不匹配狀態(tài);排查步驟:1、查詢MBUS板類型,結(jié)果 slotno: 16; plugin:install; boardtype:MS2L; running:no run; power: off; Ugver: 1 ;2、查詢軟硬件配套關(guān)系表,確定UG02MS2L用于SSM256無限制,用于SSM32必須 是R7主機版本支持;3、確認軟件版本是R5C10B039,所用機框是SSM32框;4、更換單板到SSM256框后,單板成功啟動;HUAWEI TECHNOLOGIES CO., LTD.HUAW
14、EI Confidential Page 23單板不啟動問題處理l單板不上電單板不上電板類型存儲器故障板類型存儲器故障處理方法:處理方法:1、查詢板類型,查詢板類型為非法值(virtual);2、修改板類型,如果修改后還是virtual值,則是存儲器故障,更換單板;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 24單板不啟動問題處理l單板不上電單板不上電 現(xiàn)象:現(xiàn)象:單板拉手條上所有燈都不亮;l常見原因常見原因主控板故障MBUS扣板/電源/保險管故障保險管燒毀/電源模塊故障HUAWEI TECHNOLOGIES CO., LTD.H
15、UAWEI Confidential Page 25單板不啟動問題處理l單板不上電單板不上電主控板故障(主控板故障(TNC/TND/OMU/MPUTNC/TND/OMU/MPU)處理方法:處理方法:解決主控板故障,保證主用主控板正常啟動。HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 26單板不啟動問題處理l單板不上電單板不上電MBUSMBUS扣板扣板/ /電源電源/5V/5V保險管故障保險管故障處理方法:處理方法:1、確認TNC/TND/OMU/MPU主控板是否正常啟動;2、查詢單板板類型,結(jié)果中沒有列出此板信息;3、MBUS扣板上
16、指示燈全部熄滅;4、更換單板HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 27單板不啟動問題處理l案例三案例三某局點某局點4 4槽槽UG01MNLUUG01MNLU不上電,不上電,5 5槽槽UG01MNLUUG01MNLU正常正?,F(xiàn)象:拉手條上offline藍色指示燈不亮,其它指示燈不亮; LMT面板上對應(yīng)槽位看不到此單板;排查步驟:1、查詢MBUS板類型,結(jié)果中看不到對應(yīng)槽位信息;2、4、5槽NLU對調(diào)位置,故障轉(zhuǎn)移到5槽;3、觀察MBUS扣板,發(fā)現(xiàn)指示燈不亮,更換故障NLU上的MBUS扣板后正常啟動;HUAWEI TECHNOL
17、OGIES CO., LTD.HUAWEI Confidential Page 28單板不啟動問題處理l單板不上電單板不上電48V48V保險管燒毀保險管燒毀/48V/48V電源模塊故電源模塊故障障處理方法:處理方法:1、查詢板類型可以返回正常值,而且顯示為power on狀態(tài);2、上報“致命電壓告警”;3、更換單板;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 29單板不啟動問題處理l案例四案例四某局點某局點1010槽槽UG01MHRDUG01MHRD不上電,不上電,1111槽槽UG01MHRDUG01MHRD正常正?,F(xiàn)象:拉手條上
18、offline藍色指示燈不亮,其它指示燈不亮; LMT面板上10槽HRD顯示紅色故障狀態(tài);排查步驟:1、查詢MBUS板類型,結(jié)果正常;slotno: 10; plugin:install; boardtype:MHRD; running:running; power: on; Ugver: 0slotno: 11; plugin:install; boardtype:MHRD; running:running; power: on; Ugver: 02、查看告警信息,發(fā)現(xiàn)10槽HRD上報“單板電壓致命告警”;3、更換單板HUAWEI TECHNOLOGIES CO., LTD.HUAWEI C
19、onfidential Page 30單板不啟動問題處理l單板上電后無法正常啟動單板上電后無法正常啟動現(xiàn)象現(xiàn)象 LMT上顯示單板故障 拉手條上RUN燈常亮 拉手條上RUN燈時而常亮時而快閃原因原因 UG版本錯誤 啟動方式設(shè)置錯誤 硬盤出錯 關(guān)聯(lián)性問題 電壓問題 其它 HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 31單板不啟動問題處理l單板上電后無法正常啟動單板上電后無法正常啟動UGUG版本錯誤版本錯誤 UG版本錯誤處理方法:處理方法:1、確認軟件識別的的UG版本和真實的UG版本是否一致2、對照軟硬件配套表確認軟件版本是否支持此UG
20、版本3、如果不支持需要升級或換板HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 32單板不啟動問題處理l單板上電后無法正常啟動單板上電后無法正常啟動啟動方式設(shè)置錯誤啟動方式設(shè)置錯誤 FLASH方式無法獲取正確的軟件版本文件處理方法:處理方法:修改啟動方式設(shè)置 SET BRDSTART: MOD=FLASH; - 設(shè)置為FLASH方式啟動 SET BRDSTART: MOD=LOAD; - 設(shè)置為LOAD方式啟動HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 33單板不啟動問題
21、處理l單板上電后無法正常啟動單板上電后無法正常啟動硬盤出錯硬盤出錯情況情況1:文件損壞:文件損壞 LMT中執(zhí)行CHK FILE:;可以確認文件是否損壞處理方法:處理方法:從服務(wù)器重新load文件;情況情況2:硬盤本身故障(:硬盤本身故障(OMU復位)復位) 無法讀取硬盤內(nèi)的加載文件,上報“單板硬件故障”告警,故障原因為“11”可 以確認是硬盤故障。處理方法:處理方法:更換單板硬盤,重新同步文件,同步完成后復位OMU單板。(詳細步驟見硬盤&CF卡故障相關(guān)信息查詢和操作指導書.doc)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 34單
22、板不啟動問題處理l案例五案例五某局點升級后,所有某局點升級后,所有HRUHRU單板不能正常啟動單板不能正常啟動現(xiàn)象:局點升級后,所有HRU不能正常啟動,其它單板啟動正常排查步驟:1、查詢單板啟動方式,確認為load方式;2、執(zhí)行 CHK FILE,發(fā)現(xiàn)“hru.vfs”文件校驗錯誤;3、重新加載所有軟件;4、加載完畢后,單板啟動正常;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 35單板不啟動問題處理l案例六案例六某局點升級后,某局點升級后,OMUOMU單板不能正常啟動單板不能正常啟動現(xiàn)象:局點升級后復位系統(tǒng),OMU單板不能正常啟動
23、排查步驟:1、主用OMU不啟動,整個設(shè)備癱瘓,只能通過串口信息定位;2、查看串口信息,反復打印“Ide read error , then try my best to repair it”,確定硬盤故障;3、通過串口重新上電加載后正常;(重新加載時有格式化硬盤的操作);HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 36單板不啟動問題處理l單板上電后無法正常啟動單板上電后無法正常啟動關(guān)聯(lián)性問題關(guān)聯(lián)性問題 有些單板的啟動有制約關(guān)系情況情況1:TDM接口板不啟動(包括接口板不啟動(包括S1L/S2L/E32/T32/E63/T63/S4
24、L) 主備CLK單板不在位或異常; 主備NET板時鐘都不鎖定; TNU/TNB與同框接口板類型不匹配; 檢查中心交換框的TNU單板沒有啟動;情況情況2:HRU/ASU單板不啟動單板不啟動 后插板(E8T/G1O/A4L)故障;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 37單板不啟動問題處理l案例七案例七某局點某局點UG01ME32UG01ME32無法啟動無法啟動現(xiàn)象:某局點3框所有UG01ME32無法啟動,其它框的UG01ME32啟動正常;排查步驟:1、查詢單板啟動方式,確認為load方式;2、查看告警信息,發(fā)現(xiàn)3框主備NET板
25、都上報時鐘失鎖;3、檢查時鐘分發(fā)線,發(fā)現(xiàn)主備NET板時鐘分發(fā)線都脫落;4、接好時鐘分發(fā)線,主備NET板時鐘失鎖告警恢復,E32正常啟動;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 38單板不啟動問題處理l案例八案例八某局點某局點UG01MHRUUG01MHRU無法啟動無法啟動現(xiàn)象:某局點10槽HRU無法啟動;排查步驟:1、查詢單板啟動方式,確認為load方式;2、查看告警信息,發(fā)現(xiàn)后插10槽G1O上報電壓致命告警,G1O單板狀態(tài)顯示正常;3、更換后插10槽G1O單板,前插10槽HRU正常啟動;HUAWEI TECHNOLOGIES
26、 CO., LTD.HUAWEI Confidential Page 39單板不啟動問題處理l單板上電后無法正常啟動單板上電后無法正常啟動電壓問題電壓問題 電壓異常會導致單板芯片不能正常工作處理方法:處理方法:確認有沒有電壓類告警(詳情見后面電壓告警處理)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 40單板不啟動問題處理l單板上電后無法正常啟動單板上電后無法正常啟動其它其它 扣板故障、器件故障、軟件配置問題等等處理方法:處理方法:扣板故障:VPU類單板居多,需要查看串口信息確認;器件故障:Flash、Cpu、網(wǎng)口芯片 故障居多,需
27、要查看串口信息確認;配置問題:HRD問題最多,添加HRD單板后,必須手動添加IPIF選擇對應(yīng)的接口類型 才能正常啟動;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 41單板不啟動問題處理l案例九案例九某新建局點某新建局點1 1框主備框主備HRDHRD無法啟動無法啟動現(xiàn)象:10、11槽主備HRD一直處于故障狀態(tài),無法啟動;排查步驟:1、查詢單板啟動方式,確認為load方式;2、查詢IPIF是否添加,確認沒有添加;3、根據(jù)接口類型添加IPIF,3分鐘后單板成功啟動;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI
28、Confidential Page 42單板不啟動問題處理l案例十案例十某新建局點某新建局點VPDVPD無法啟動無法啟動現(xiàn)象:某局點新擴5塊UG01MVPD有一塊無法啟動;排查步驟:1、查詢單板啟動方式,確認為load方式;2、查詢板類型,確認為UG01MVPD;3、收集串口信息,發(fā)現(xiàn)打印“Dsp 1 load fail because of DSP bug!”,確定為0號扣板有問題;4、將扣板重新插拔安裝后啟動成功;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 43單板不啟動問題處理l案例十案例十某新建局點某新建局點VPDVPD無
29、法啟動無法啟動DSP0-DSP7為0號扣板上的DSP芯片,DSP8-DSP15為1號扣板上的DSP芯片,DSP16DSP23為2號扣板上的DSP芯片;扣板位置圖:HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 44單板不啟動問題處理l案例十一案例十一某局點某局點UG01MNETUG01MNET板無法啟動板無法啟動現(xiàn)象:某局點新擴5塊UG01MVPD有一塊無法啟動;排查步驟:1、查詢單板啟動方式,確認為load方式;2、查看告警信息中只有單板故障告警;2、查詢板類型,確認為UG01MNET;3、對照版本配套表確認配置正確;4、收集串口信
30、息,打印 “FLASH_FileWriteByType():Call FLASH_MemWrite Return Error! (f-flash/FlashDrv.c,l-814)”5、Flash芯片故障;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 45思考題l單板不上電有哪些常見原因?l單板上電后不啟動有哪些常見原因?l如何確認單板實際板類型?如果錯誤如何修改?l開局時經(jīng)常遇到主備HRD都不能啟動,為什么?HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 462.1 概述
31、概述 2.2 單板不啟動問題處理單板不啟動問題處理2.3 單板運行中異常復位單板運行中異常復位2.4 常見硬件類告警問題處理常見硬件類告警問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 47單板運行中異常復位l OMU/OMB/OME因硬盤因硬盤/CF卡故障而復位卡故障而復位l 750 CPU故障復位故障復位l VPD單板內(nèi)存參數(shù)問題復位單板內(nèi)存參數(shù)問題復位HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 48單板運行中異常復位l OMU/OMB/OME因硬盤因硬盤/C
32、F卡故障而復位卡故障而復位現(xiàn)象:現(xiàn)象:OMU/OMB/OME單板運行時突然復位,復位后可以正常啟動; 一般會有硬盤故障告警,有些情況沒有此告警;處理方法:處理方法:查詢此單板的復位日志:(do resetlog dump)+ RESET LOG Output Time: 2006-01-02 12:48:33+ Reset time : 2006-01-02 04:00:50 Reset type : 1(PROGRAM) Reset info : Reset Board for dsik error at ./././src/fam/src/mnt/mnt_main.c(4821) Star
33、t time : 2006-01-02 04:04:58 Start info : Last software watchdog is 0 ticks Last task switch: 0 x30536a8(RPCQ) = 0 x3084338(VIDL)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 49單板運行中異常復位l OMU/OMB/OME因硬盤因硬盤/CF卡故障而復位卡故障而復位處理方法:處理方法:按照指導書步驟修復,如果修復不成功更換硬盤;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Conf
34、idential Page 50單板運行中異常復位l 750CPU單板單板L2Cash問題復位問題復位現(xiàn)象:現(xiàn)象:單板運行中突然復位,復位后可以正常啟動 750單板涉及OMU/MPU/PPB/CMF/SPF/TNU/TCLU/HRU處理方法:處理方法:查詢單板復位日志(do resetlog dump)和異常堆棧信息(do except dump),有以下記錄:HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 51單板運行中異常復位l 750CPU單板單板L2Cash問題復位問題復位+RESET LOG Output Time: 200
35、8-03-26 12:52:58+Reset time : 2008-03-26 12:07:15Reset type : 2(EXCEPT)Reset info : Fatal except. Start time : 2008-03-26 12:09:02+do except dump(查詢結(jié)果節(jié)選):= Exception Info Begin =Exception Time : 2008-03-26 12:07:15Exception VosTick : 537402Exception CpuTick : 0 x0000001f 6d58ed33Exception Type : MAC
36、HINE CHECK EXCEPTIONException Vector Num : 0 x200Exception Task : _MFAM (ID = 14, OsalID = 0 x341bd70)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 52單板運行中異常復位l 750CPU單板單板L2Cash問題復位問題復位處理方法:處理方法:此故障屬于CPU固有問題,與工藝和芯片內(nèi)部校驗方式相關(guān),不可避免;如果故障頻率很低可以不用處理;如果一周內(nèi)連續(xù)兩次出現(xiàn)問題則將單板作為壞件返回;HUAWEI TECHNOLOGIES CO.,
37、LTD.HUAWEI Confidential Page 53單板運行中異常復位l 750 CPU問題復位問題復位現(xiàn)象:現(xiàn)象:單板運行中突然復位,復位后可以正常啟動; 750單板涉及OMU/MPU/PPB/CMF/SPF/TNU/TCLU/HRU處理方法:處理方法:通過調(diào)試臺查詢單板復位日志和異常堆棧信息,有以下記錄:do resetlog dump查詢結(jié)果:+ No reset reason recorded! Last reset : Power-On, pressing or MBUS Start time : 2008-03-03 06:00:41+ Reset time : 2008
38、-03-03 01:31:48 Reset type : 2(EXCEPT) Reset info : Fatal except. Start time : 2008-03-03 01:33:31HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 54單板運行中異常復位l 750 CPU問題復位問題復位 do except dump查詢結(jié)果節(jié)選:= Exception Info Begin =Exception Time : 2008-03-03 01:31:48Exception VosTick : 11645922Exception
39、CpuTick : 0 x0000029f 92f1f5d8Exception Type : DATA ACCESS EXCEPTIONException Vector Num : 0 x300Exception Task : VBDR (ID = 11, OsalID = 0 x3434620)Exception PID : -1Exception CPUID : 43Dopra Version : DOPRA_C V100R005B080CPC013Application Version : UMG8900V200R005C02B052SP06HUAWEI TECHNOLOGIES CO.
40、, LTD.HUAWEI Confidential Page 55單板運行中異常復位l 750 CPU問題復位問題復位處理方法:處理方法: 復位原因是fatal except,堆棧中可以看到0 x300和0 x700異常是750問題導致,此問題為芯片BUG,解決方案有兩種:(1)通過UMG8900硬件健康檢查工具-750單板測試工具進行檢測和修復(2)升級版本,在R5C02B072/R5C10B039/R6/R7版本中已合入750問題的解決方案 【注1】并不是所有的750問題都可以通過軟件方案解決,因此現(xiàn)網(wǎng)如果通過750單板測試工具無法修復或已合入解決方案版本仍出現(xiàn)0 x300或0 x700異
41、常的單板,需要申請備件更換。【注2】2007年7月后生產(chǎn)的單板沒有750問題HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 56單板運行中異常復位l VPD內(nèi)存參數(shù)問題復位內(nèi)存參數(shù)問題復位現(xiàn)象:現(xiàn)象:單板反復復位,少則幾天一次,多則幾分鐘一次 查詢復位日志如下:+ No reset reason recorded! Last reset : Power-On, pressing or MBUS Start time : 2008-03-03 06:00:41+HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Co
42、nfidential Page 57單板運行中異常復位l VPD內(nèi)存參數(shù)問題復位內(nèi)存參數(shù)問題復位處理方法:處理方法:升級軟件版本或者打熱補丁,如下版本已經(jīng)合入V100R007C01B041V100R006C02B039 Hotpatch13V100R006C02B048 Hotpatch03V200R007C03B041V200R005C10B039 Hotpatch09V200R005C02B072 Hotpatch03V200R007C05B045HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 582.1 概述概述 2.2 單板不
43、啟動問題處理單板不啟動問題處理2.3 單板運行中異常復位單板運行中異常復位2.4 常見硬件類告警問題處理常見硬件類告警問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 59常見硬件類問題處理l 電壓告警電壓告警l 硬件模塊類故障硬件模塊類故障l 機框監(jiān)控類故障機框監(jiān)控類故障HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 60常見硬件類問題處理l 電壓告警電壓告警 ALM-0006 ALM-0006 單板電壓致命告警單板電壓致命告警 ALM-0011 ALM-0011 嚴
44、重低壓告警嚴重低壓告警 ALM-0012 ALM-0012 嚴重高壓告警嚴重高壓告警故障影響:故障影響:單板電壓致命告警:單板無法啟動。嚴重低壓/高壓告警:單板反復復位或者單板無法啟動。附注:VPD單板在扣某些扣板時可能上報誤告警,下文有專題說明。HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 61l 電壓監(jiān)控原理電壓監(jiān)控原理常見硬件類問題處理MBUS扣板MBUS扣板016.MBUS扣板016.MBUS扣板016.MBUS扣板016.016.MBUS扣板016.MBUS扣板016.MBUS扣板016.MPU/OMU/TNCMPU/OM
45、U/TNCHUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 62l 電壓類問題處理辦法電壓類問題處理辦法1、確認單板是否有相關(guān)告警、確認單板是否有相關(guān)告警 2 2、確認單板是否故障、確認單板是否故障 4 4、確認單板板類型是否正確、確認單板板類型是否正確5 5、查詢單板電壓是否異常、查詢單板電壓是否異常常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 63l 電壓類問題處理辦法電壓類問題處理辦法UMG電壓問題處理指導書(通用版)常見硬件類問題處理HUAWEI T
46、ECHNOLOGIES CO., LTD.HUAWEI Confidential Page 64l 電壓類問題處理辦法電壓類問題處理辦法VPDVPD誤告警處理誤告警處理常見硬件類問題處理1 1、確認是否上報、確認是否上報“ALM-0012 ALM-0012 嚴重高壓告警嚴重高壓告警”并且單板還處于正常狀態(tài)并且單板還處于正常狀態(tài) 是:步驟2 否:其它問題2 2、確認告警單板是否為、確認告警單板是否為UG01VPD + VDB(VB) UG01VPD + VDB(VB) 或者或者 UG01VPD + ECUG01VPD + EC扣板扣板( (無無TCTC扣板扣板) ) 是:步驟3 否:其它問題3
47、3、確認系統(tǒng)日志中是否記錄、確認系統(tǒng)日志中是否記錄 Syslog: FamMntGetVltStatusByVolt: High severity volt alarm! The volt of channel 4 in frame 1 slot 1 is 147!” 是:軟件誤告警,升級至最新熱補丁 否:其它問題HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 65l 電壓類問題處理辦法電壓類問題處理辦法VPDVPD誤告警處理誤告警處理常見硬件類問題處理VPD電壓誤告警確認指導書:HUAWEI TECHNOLOGIES CO., LT
48、D.HUAWEI Confidential Page 66常見硬件類問題處理l案例十二案例十二某局點某局點UG01MNLUUG01MNLU上報電壓告警上報電壓告警現(xiàn)象:NLU單板上報電壓致命告警;排查步驟:1、確認單板是否故障;- 故障2、查詢各通道電壓值;測量點 正常電壓范圍(V) 測量電壓值(V) 0 3.133.45 3.33 1 1.711.88 0.55 2 0.000.00 0.00 3 0.000.00 0.00 4 0.000.00 0.00 5 0.000.00 0.00 6 4.485.49 4.92(結(jié)果個數(shù) = 1)- END3、復位MBUS和插拔單板后故障依舊4、單板
49、故障,更換單板;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 67l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法ALM-0007 ALM-0007 單板硬件故障單板硬件故障ALM-0021 ALM-0021 單板硬件模塊故障單板硬件模塊故障ALM-1059 FMEAALM-1059 FMEA檢測告警檢測告警常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 68l 硬件模塊類硬件模塊類告警告警處理辦法處理辦法ALM-0007 ALM-0007 單板硬件故障單
50、板硬件故障 11 11 硬盤故障硬盤故障 故障原因:故障原因:OMU硬盤硬件損壞。 影響:影響:主用OMU發(fā)生此故障后倒換。 解決辦法:解決辦法:更換硬盤或者單板。 12 MBUS12 MBUS串口通信失敗串口通信失敗 故障原因:故障原因:主控板(OMU/MPU/TNC/TND)的MBUS扣板故障。 影響:影響:主控板無法刷新本框內(nèi)MBUS總線信息,故障單板自己復位。 解決辦法:解決辦法:更換單板。常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 69l 硬件模塊類硬件模塊類告警告警處理辦法處理辦法ALM-0007 A
51、LM-0007 單板硬件故障單板硬件故障 13 NET13 NET板板CXECXE芯片故障芯片故障 故障原因:故障原因:主用NET板上的GE交換芯片故障。 影響:影響:此NET板GE平面故障,主備倒換。 解決辦法:解決辦法:更換單板。常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 70l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法ALM-0021 ALM-0021 單板硬件模塊故障單板硬件模塊故障 21- OMU 21- OMU 時間模塊故障時間模塊故障 故障原因:故障原因:OMU/OMB/OME時鐘芯片故障 影響
52、:影響:系統(tǒng)時間異常 解決辦法:解決辦法:更換RTC時鐘模塊。常見硬件類問題處理OMUOME圖中黃色部分為RTC時鐘模塊位置RTC模塊編碼:39130075 RTC-RTC&256Kb NVRAM-SOH28OMBHUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 71l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法ALM-0021 ALM-0021 單板硬件模塊故障單板硬件模塊故障 22- OMU/MPU22- OMU/MPU單板通信信道故障單板通信信道故障 故障原因:故障原因:OMU/MPU上FE Lanswitch被復位,或者FE
53、Lanswitch故障。 影響:影響:本框內(nèi)FE平面故障。 解決辦法:解決辦法: 1、確認告警前是否有l(wèi)od lan操作,此操作會導致Lanswitch復位,告警可以恢復; 2、確認是否人為復位過Lanswitch,復位后可以告警恢復 3、如果告警不恢復,更換單板。常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 72l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法ALM-0021 ALM-0021 單板硬件模塊故障單板硬件模塊故障 23- TNC23- TNC單板單板BCM5338BCM5338芯片故障芯片故障 故障
54、原因:故障原因:TNC上的BCM5338芯片檢測失敗。 影響:影響:非誤告警情況下會導致本框內(nèi)FE平面故障。 解決辦法:解決辦法: 情況1:單板無故障,告警能夠恢復,或者反復恢復后上報。 1)確認TNC PCB版本是否為VC,如果為VC則是誤告警。 2)確認兩點,如果都滿足則是誤告警 a、告警的TNC是否連接IWF并且為主控框 b、軟件版本是不是V1/V2R6C02/R5C10B046以下 情況2:其它情況需要更換單板常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 73l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法
55、ALM-0021 ALM-0021 單板硬件模塊故障單板硬件模塊故障 24- TNC24- TNC單板單板CKMBCKMB時鐘扣板故障時鐘扣板故障 故障原因:故障原因:TNC單板時鐘扣板硬件故障或者不在位或者沒有插穩(wěn)。 影響:影響:系統(tǒng)無法從時鐘扣板上上獲取時鐘 解決辦法:解決辦法: 1、重新插穩(wěn)扣板,告警恢復則不用處理。 2、如果告警不恢復,更換時鐘扣板。常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 74l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法ALM-0021 ALM-0021 單板硬件模塊故障單板硬件模
56、塊故障 25- NET/BLU25- NET/BLU單板單板BCM5338BCM5338芯片故障芯片故障 27- OMB27- OMB單板單板BCM5338BCM5338芯片故障芯片故障 故障原因:故障原因: NET/BLU/OMB上的BCM5338芯片檢測失敗。 影響:影響:FE級聯(lián)接口故障。 解決辦法:解決辦法: 情況1:告警10秒后能夠恢復,或者反復恢復后上報,可以確認是誤告警。 情況2:告警不恢復,更換單板。常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 75l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法A
57、LM-0021 ALM-0021 單板硬件模塊故障單板硬件模塊故障 26- LSW26- LSW自檢故障自檢故障 故障原因:故障原因:OMU/MPU單板FE Lsw芯片故障 影響:影響:經(jīng)過本OMU/MPU的FE平面,F(xiàn)E通道倒換到另一個OMU/MPU的LSW上 解決辦法:解決辦法:更換單板常見硬件類問題處理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 76常見硬件類問題處理l案例十三案例十三某局點某局點UG01MTNCUG01MTNC上報硬件模塊故障告警上報硬件模塊故障告警現(xiàn)象:TNC上報硬件模塊故障告警,10S后恢復,但是反復上
58、報;排查步驟:1、確認TNC版本,執(zhí)行 lst brdver,節(jié)選部分內(nèi)容如下1框8槽后插MTNC單板-PCB版本 = REV C2、確認單板正常運行,軟件誤告警;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 77l 硬件模塊類告警處理辦法硬件模塊類告警處理辦法ALM-1059 FMEAALM-1059 FMEA檢測告警檢測告警 內(nèi)部內(nèi)部PHY PHY 芯片故障芯片故障 網(wǎng)口芯片網(wǎng)口芯片a a故障故障 網(wǎng)口芯片網(wǎng)口芯片b b故障故障 66M 66M 時鐘故障時鐘故障 25M 25M 時鐘故障時鐘故障 125M 125M 時鐘故障時鐘故障 33M 33M 時
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 杭州師范大學《影音制作》2023-2024學年第一學期期末試卷
- 2025年挖掘機行業(yè)前瞻:2月銷量同比增52.8%基建回暖推動市場增長
- 主要分部分項施工方案
- 預制蓋板涵施工方案
- 灌縫膠施工方案
- 光學測試試題及答案高一
- 6年級寫作第3單元冬日暖陽怎么寫
- 6n.m的螺絲鎖付扭矩
- cof內(nèi)加少量聚合物成質(zhì)子交換膜
- 低代碼熱區(qū)功能
- 設(shè)計變更單表格
- 良性前列腺增生診療指南
- 中學生食品安全教育 主題班會課件(18張PPT) 上學期
- 《長方形和正方形》 完整版課件
- 《乘法交換律和結(jié)合律》教學課件數(shù)學四年級下冊
- 趣味數(shù)學-高斯求和 完整版課件
- 花卉生產(chǎn)設(shè)施課件
- 高中體育與健康人教版高中必修全一冊(新課標)第十章體操類運動-技巧模塊計劃
- 云南省主要礦產(chǎn)資源
- 臨床試驗疑難問題解答
- 光伏發(fā)電工程施工組織設(shè)計施工工程光伏發(fā)電工程光伏發(fā)電施工組織設(shè)計
評論
0/150
提交評論