




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2015版S系列園區(qū)交換機(jī)維護(hù)手冊(cè)第3冊(cè),共3冊(cè)SS維護(hù)寶典5典型故障案例集04(2015-10-25)PAGE04(2015-10-25)PAGE300IP地址異常故障案例涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況無現(xiàn)象描述現(xiàn)象描述:設(shè)備異常復(fù)位后客戶端獲取IP地址后報(bào)IP地址沖突。判斷方法:查看下設(shè)備運(yùn)行時(shí)間和復(fù)位記錄,以及IP地址池的狀態(tài):displayversiondisplayreset-reasondisplayippoolnamepool-nameall原因分析設(shè)備異常復(fù)位后地址池相關(guān)信息同時(shí)被清空,新用戶會(huì)申請(qǐng)到之前已經(jīng)分配的IP地址出現(xiàn)地址沖突。處理步驟步驟1配置DHCP數(shù)據(jù)保存功能:dhcpserverdatabaseenabledhcpserverdatabasewrite-delayinterval//建議不要配置太小,該操作會(huì)頻繁寫dhcpserverdatabaserecover結(jié)束總結(jié)與建議DHCPServer默認(rèn)沒有開啟數(shù)據(jù)的保存功能,設(shè)備異常復(fù)位后數(shù)據(jù)丟失,需要開啟數(shù)據(jù)的保存功能。IP地址故障現(xiàn)象描述及組網(wǎng)為了防止DHCP服務(wù)器上某個(gè)地址池溢出,從而導(dǎo)致客戶端無法獲取地址,在DHCP中繼上配置主從網(wǎng)關(guān),使能網(wǎng)關(guān)切換,可以在主服務(wù)器沒有響應(yīng)的時(shí)候,從另外的網(wǎng)關(guān)獲取地址。圖5-18客戶端無法從其他網(wǎng)關(guān)獲取地址組網(wǎng)圖
使能DHCP中繼網(wǎng)關(guān)自動(dòng)切換功能。缺省情況下,DHCP中繼網(wǎng)關(guān)自動(dòng)切換功能關(guān)閉??梢栽诮涌谝晥D下執(zhí)行命令dhcprelaygateway-switchenable使能DHCP中繼網(wǎng)關(guān)自動(dòng)切換功能。使能之后,如果主服務(wù)器器上的地址池沒有異常,不能從另外的網(wǎng)關(guān)對(duì)應(yīng)的地址池獲取地址。查看服務(wù)器上的主地址池是否溢出。在交換機(jī)上執(zhí)行以下命令,查看主地址池的使用情況。如果地址池中“Used設(shè)備是不會(huì)切換為網(wǎng)關(guān)的。<HUAWEI>displayippoolnamePool-name :p1Pool-No :0Lease :1Days0Hours0MinutesDomain-name :-DNS-Server0:NBNS-Server0:Netbios-type:Position :Local Status :Gateway-0 :Mask :VPNinstance :--Start End TotalUsedIdle(Expired)ConflictDisable
54
253 0 253(0) 0 0解決方案
為了防止DHCP服務(wù)器上某個(gè)地址池溢出,從而導(dǎo)致客戶端無法獲取地址,在DHCP中繼上配置主從網(wǎng)關(guān),使能網(wǎng)關(guān)切換,可以在主服務(wù)器沒有響應(yīng)的時(shí)候,從另外的網(wǎng)關(guān)獲取地址。在需要網(wǎng)關(guān)切換功能時(shí),需要使能DHCP網(wǎng)關(guān)切換功能:[Switch]ipRelayaddresscycle經(jīng)驗(yàn)及總結(jié)
一般情況下,DHCP網(wǎng)關(guān)切換功能是能正常發(fā)揮功能的,如果遇到功能異常,先檢查下配置和從屬網(wǎng)關(guān)與DHCP服務(wù)器之間的鏈路情況。DHCPOPTION82DHCP中繼聯(lián)用失效故障現(xiàn)象描述及組網(wǎng)在DHCP中繼上配置OPTION82,但是在SERVER側(cè)抓包發(fā)現(xiàn),報(bào)文中并沒有OPTION82的內(nèi)容,配置的OPTION82功能未生效。圖5-19OPTION82與DHCP中繼聯(lián)用功能失效問題根因說明OPTION82的使用需要依賴于DHCPRELAY與DHCPSnooping功能,即如果設(shè)備上沒有使能DHCPRELAY與DHCPSnooping功能,OPTION82將無法使用。而且OPTION82功能必須要在客戶端側(cè)使能,否則也無法生效。OPTION82與DHCPRELAY聯(lián)用的原理如圖5-20。用戶發(fā)送的Discover和Request報(bào)文至DHCP。DHCP在使能OPTION82功能后將OPTION82插入到用戶發(fā)送的Discover和Request報(bào)文中,并將報(bào)文發(fā)送給DHCPServer。DHCPServer通過識(shí)別OPTION82來執(zhí)行IP地址分配策略或其他策略。DHCPServer的響應(yīng)報(bào)文也帶有OPTION82。DHCPRelay收到帶有OPTION82的響應(yīng)報(bào)文后,將OPTION82剝離,然后發(fā)給用戶。圖5-20OPTION82與DHCPRELAY聯(lián)用原理
查看接口下配置的DHCP服務(wù)器組及其包含的DHCP服務(wù)器信息。<HUAWEI>displaydhcprelayinterfacevlanif100DHCPrelayagentrunninginformationofinterfaceVlanif100:ServerIPaddress[01]:Gatewayaddressinuse:查看DHCPOption82的配置信息。<HUAWEI>displaydhcpoption82configuration#vlan100dhcpoption82insertenable#比較OPTION82功能是否配置在使能DHCP功能對(duì)應(yīng)的VLAN接口下。如果不是,需要修改為一致。解決方案
需要將OPTION82配置在使能DHCPRELAY功能的VLANIF接口對(duì)應(yīng)的Vlan下。經(jīng)驗(yàn)總結(jié)
DHCPOPTION82與DHCP一塊使用,功能比較穩(wěn)定,現(xiàn)網(wǎng)在使用中如果出現(xiàn)問題,可以先按照上面的步驟檢查配置,如果配置正確,可以抓取報(bào)文查看OPTION82的信息。DHCPSnooping生成綁定表涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況現(xiàn)象描述
如圖5-21所示,客戶端通過DHCPRelay從DHCP服務(wù)器上獲取地址,DHCP中繼上開啟DHCPSnooping功能。圖5-21DHCPSnooping場(chǎng)景下客戶端能獲取地址,但是設(shè)備上沒有生成綁定表故障案例現(xiàn)象描述:在DHCPSnooping設(shè)備上查看動(dòng)態(tài)綁定表,發(fā)現(xiàn)并沒有生成該用戶的動(dòng)態(tài)綁定表。判斷方法:確認(rèn)中繼客戶端接口配置了dhcpsnoopingenable,服務(wù)器側(cè)配置了dhcpsnoopingtrusted:[Switch]displaydhcpsnoopingvlan100DHCPsnoopingrunninginformationforVLAN100:DHCPsnooping :Trustedinterface :GigabitEthernet1/0/2Dhcpusermaxnumber :1Currentdhcpusernumber :1Checkdhcp-giaddr :Disable(default)Checkdhcp-chaddr :Disable(default)Checkdhcp-request :Disable(default)Checkdhcp-rate :Disable(default)[Switch]displaydhcpsnoopinginterfacegigabitethernet1/0/1DHCPsnoopingrunninginformationforinterfaceGigabitEthernet1/0/1DHCPsnooping :EnableTrustedinterface :noDhcpusermaxnumber :32768 (default)Currentdhcpusernumber :0Checkdhcp-giaddr :Disable(default)Checkdhcp-chaddr :Disable(default)Alarmdhcp-chaddr :Disable(default)Checkdhcp-request :Disable(default)Alarmdhcp-request :Disable(default)Checkdhcp-rate :Disable(default)Alarmdhcp-rate :Disable(default)Alarmdhcp-ratethreshold :Discardeddhcppacketsforratelimit :0Alarmdhcp-reply :Disable(default)動(dòng)態(tài)綁定表生成的幾點(diǎn)總結(jié):用戶側(cè)端口沒有使能DHCPSnoopingenable,網(wǎng)絡(luò)側(cè)端口沒有配置信任端口,用戶可以上線,但不會(huì)生成動(dòng)態(tài)綁定表;用戶側(cè)端口沒有使能DHCPSnoopingenable,網(wǎng)絡(luò)側(cè)端口配置信任端口,用戶可以上線,但不會(huì)生成動(dòng)態(tài)綁定表;用戶側(cè)端口使能DHCPSnoopingenable,網(wǎng)絡(luò)側(cè)端口沒有配置信任端口,用戶無法上線;用戶側(cè)端口DHCPSnoopingdisable,配置/未配置信任端口,用戶都可以上線,但不會(huì)生成動(dòng)態(tài)綁定表。用戶側(cè)端口使能DHCPSnoopingenable并配置信任端口,網(wǎng)絡(luò)側(cè)端口配置信任端口,用戶可以上線,但不會(huì)生成動(dòng)態(tài)綁定表。原因分析(CauseAnalysis)客戶端在通過配置DHCPSnooping的交換機(jī)從DHCP服務(wù)器上獲取地址,理論上是會(huì)生成動(dòng)態(tài)綁定表,在配置不當(dāng)時(shí),是生成不了動(dòng)態(tài)綁定表。處理步驟步驟1客戶端側(cè)接口配置dhcpSnoopingenable,服務(wù)器側(cè)配置dhcpsnoopingtrusted:[Switch-Ethernet5/0/6]dhcpsnoopingenable[Switch-Ethernet5/0/5]dhcpsnoopingtrusted結(jié)束總結(jié)與建議
在使能了DHCPSnooping功能后,如果設(shè)備上沒有生成綁定表,可以依據(jù)動(dòng)態(tài)綁定表生成的幾點(diǎn)總結(jié)來檢查自己的配置是否正確。DHCPOPTION82DHCPSnooping場(chǎng)景下失效涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況
如圖5-22所示,在DHCPRelay上配置DHCPSnooping功能,同時(shí)配置OPTION82。圖5-22DHCPOPTION82在DHCPSnooping場(chǎng)景下失效故障案例現(xiàn)象描述
現(xiàn)象描述:在SERVER側(cè)抓包發(fā)現(xiàn),報(bào)文中并沒有OPTION82的內(nèi)容,從而導(dǎo)致配置的OPTION82功能失效。判斷方法:查看中繼上客戶端側(cè)接口與服務(wù)器側(cè)接口DHCPSnooping的配置。[Switch]displaydhcpsnoopingvlan100DHCPsnoopingrunninginformationforVLAN100:DHCPsnooping :Trustedinterface :GigabitEthernet1/0/1Dhcpusermaxnumber :1Currentdhcpusernumber :1Checkdhcp-giaddr :Disable(default)Checkdhcp-chaddr :Disable(default)Checkdhcp-request :Disable(default)Checkdhcp-rate :Disable(default)[Switch]displaydhcpsnoopinginterfaceGigabitEthernetDHCPsnoopingrunninginformationforinterfaceGigabitEthernet1/0/1DHCPsnooping :EnableTrustedinterface :noDhcpusermaxnumber :32768 (default)Currentdhcpusernumber :0Checkdhcp-giaddr :Disable(default)Checkdhcp-chaddr :Disable(default)Alarmdhcp-chaddr :Disable(default)Checkdhcp-request :Disable(default)Alarmdhcp-request :Disable(default)Checkdhcp-rate :Disable(default)Alarmdhcp-rate :Disable(default)Alarmdhcp-ratethreshold :Discardeddhcppacketsforratelimit :0Alarmdhcp-reply :Disable(default)查看OPTION82配置的位置。[Switch-GigabitEthernet5/0/1]displaydhcpoption82#interfaceGigabitEthernet1/0/1dhcpoption82insertenable#能在報(bào)文中正確插入DHCPOPTION82信息的條件是,DHCPSnooping配置正確,而且OPTION82配置在客戶端側(cè)。原因分析
DHCPOPTION82必須配置在客戶端側(cè)接口,如果沒有配置在客戶端側(cè),從DHCPSnooping設(shè)備上發(fā)出的報(bào)文是不會(huì)帶OPTION82的內(nèi)容,而且接口上DHCPSnooping的配置必須正確。處理步驟步驟1正確配置DHCPSnooping,并在客戶端側(cè)配置OPTION82。結(jié)束總結(jié)與建議
DHCPOPTION82與DHCPSnooping一起使用,如果配置正確,可以抓取報(bào)文查看OPTION82的信息。如果配置不正確,需要參照上面的分析去配置。MAC地址認(rèn)證失敗涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況現(xiàn)象描述
如圖5-23所示,交換機(jī)配置mac地址認(rèn)證,認(rèn)證地點(diǎn)為Radius服務(wù)器。圖5-23MAC地址認(rèn)證故障案例1現(xiàn)象描述:用戶接入后認(rèn)證失敗,無法成功獲取到IP地址。判斷方法:查看radius失??;查看設(shè)備系統(tǒng)視圖下相關(guān)配置配置如下:#mac-authen#aaaauthentication-schemedefaultauthentication-schememac-authenauthentication-moderadiusauthorization-schemedefaultaccounting-schemedefaultdomaindefaultdomaindomainmac-authenauthentication-schememac-authenradius-servermac-authenlocal-useradminpasswordcipher%$%$I6.ASV)hJET,p"Dn.YM%3aXO%$%$local-useradminservice-typehttp#查看設(shè)備接口下相關(guān)配置配置如下:#interfaceGigabitEthernet0/0/11mac-authen#從步驟2中可以看出雖然配置了mac-authen域,但是并沒有指定mac地址認(rèn)證的認(rèn)證域,如果沒有指定認(rèn)證域的話,mac認(rèn)證默認(rèn)會(huì)在default里認(rèn)證,而default域默認(rèn)是進(jìn)行的本地認(rèn)證,所以用戶接入后進(jìn)行mac認(rèn)證失敗。原因分析設(shè)備沒有指定mac地址認(rèn)證的認(rèn)證域,如果沒有指定認(rèn)證域的話,mac認(rèn)證默認(rèn)會(huì)在default里認(rèn)證,而default域默認(rèn)是進(jìn)行的本地認(rèn)證,所以用戶接入后進(jìn)行mac認(rèn)證失敗。處理步驟步驟1在系統(tǒng)視圖下追加mac地址認(rèn)證域的配置:#mac-authenmac-authendomainmac-authen#結(jié)束總結(jié)與建議用戶做認(rèn)證時(shí)一定要關(guān)注用戶認(rèn)證的域是哪個(gè),且要通過配置將用戶關(guān)聯(lián)到預(yù)期的域中去。如果不配置的話,mac地址認(rèn)證用戶默認(rèn)是要去default域認(rèn)證的。Portal服務(wù)器認(rèn)證頁面無法下發(fā)涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況現(xiàn)象描述
如圖5-24所示,交換機(jī)上配置Portal認(rèn)證。圖5-24web認(rèn)證故障案例1現(xiàn)象描述:Portal服務(wù)器認(rèn)證頁面無法下發(fā)。判斷方法:1、客戶端pingPortal服務(wù)器是否可達(dá)。2、在Portal服務(wù)器使用netstat-anb|findstr8443(端口因服務(wù)器而異)。檢查服務(wù)器端口或服務(wù)是否已啟動(dòng)。3、檢查客戶端瀏覽器是否配置使用代理。4、檢查交換機(jī)Portal認(rèn)證配置是否有誤。原因分析
1、客戶端無法ping通Portal服務(wù)器。2、服務(wù)器端口未啟動(dòng)或啟動(dòng)異常。3、客戶端瀏覽器配置使用代理。4、交換機(jī)Portal認(rèn)證配置有誤。處理步驟步驟1步驟2重新啟動(dòng)Portal服務(wù)器服務(wù)。步驟3步驟4修改交換機(jī)Portal認(rèn)證配置。結(jié)束總結(jié)與建議無Portal服務(wù)器認(rèn)證頁面涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況現(xiàn)象描述
如圖5-25所示,交換機(jī)上配置Portal認(rèn)證。圖5-25web認(rèn)證故障案例2現(xiàn)象描述:客戶端直接打開頁面,但無法重定向到Portal服務(wù)器認(rèn)證頁面。判斷方法:1、檢查http報(bào)文是否能發(fā)往交換機(jī)認(rèn)證端口。2、客戶端pingDNS服務(wù)器是否可達(dá)。3、使用displayaccess-user命令檢查交換機(jī)上是否有此終端的web用戶在線。原因分析1、客戶端多網(wǎng)卡,訪問重定向前網(wǎng)址的http報(bào)文不從認(rèn)證的網(wǎng)卡發(fā)送。2、客戶端到DNS服務(wù)器不可達(dá),只能使用IP地址重定向。3、交換機(jī)上已有用戶在線,不會(huì)再重定向。處理步驟步驟1客戶端配置路由,使得http報(bào)文能發(fā)往交換機(jī)認(rèn)證端口。步驟2設(shè)備上配置Portalfree-rule,使到DNS服務(wù)器可達(dá)。步驟3交換機(jī)上有此終端的web用戶在線不能重定向是正常的,只有在該終端沒有web用戶上線的情況下才會(huì)重定向。結(jié)束總結(jié)與建議無Portal10分鐘左右后下線涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況現(xiàn)象描述
如圖5-26所示,無線客戶端通過wifi連接AP,交換機(jī)上配置Portal認(rèn)證。圖5-26web認(rèn)證故障案例4現(xiàn)象描述:無線客戶端Portal認(rèn)證成功10分鐘左右后下線,且從交換機(jī)看用戶已上線。判斷方法:1、客戶端如果設(shè)置省電鎖屏或?qū)g覽器運(yùn)行到后臺(tái)后,客戶端會(huì)在10分鐘左右后下線。2、檢查AP版本是否為V200R001C00SPC100及之前版本。原因分析
若AP版本為V200R001C00SPC100,射頻模板配置成GN模式,該版本在11N模式下,會(huì)有終端進(jìn)入省電模式后下行報(bào)文不通的問題,導(dǎo)致客戶端到服務(wù)的TCP心跳報(bào)文交互失敗,服務(wù)器將用戶下線。(另外:客戶端如果設(shè)置省電鎖屏或?qū)g覽器運(yùn)行到后臺(tái),會(huì)發(fā)送RST報(bào)文,并停止發(fā)送TCP報(bào)文。如果超過10分鐘,服務(wù)器會(huì)將用戶下線,此為正常情況。)處理步驟步驟1升級(jí)AP版本,WA6X3XN_V200R001C00SPC900版本已解決此問題。結(jié)束總結(jié)與建議無ADPortal認(rèn)證涉及產(chǎn)品和版本所有產(chǎn)品和版本。組網(wǎng)情況現(xiàn)象描述
如圖5-27所示,交換機(jī)上配置Portal認(rèn)證,且與TSM服務(wù)器對(duì)接。圖5-27web認(rèn)證故障案例6現(xiàn)象描述:客戶端使用AD域賬號(hào)認(rèn)證,會(huì)彈出invalidADacount,錯(cuò)誤碼為1029的對(duì)話框。判斷方法:檢查客戶端輸入賬號(hào)是否帶AD域。原因分析
TSM服務(wù)器會(huì)對(duì)客戶端輸入的AD域賬號(hào)做檢查,如果不帶AD域名,會(huì)認(rèn)為是非法的AD域賬號(hào)。處理步驟步驟1客戶端輸入帶AD域名的賬號(hào)。結(jié)束總結(jié)與建議
客戶端使用AD域賬號(hào)認(rèn)證時(shí),需要輸入帶AD域名的賬號(hào)。CSS集群集群連線錯(cuò)誤導(dǎo)致集群不能正常建立的故障案例適合產(chǎn)品形態(tài)及版本框式設(shè)備問題現(xiàn)象描述及組網(wǎng)如上圖所示,兩臺(tái)框式交換機(jī)已經(jīng)使能集群功能、集群機(jī)框ID配置正確、集群線纜已經(jīng)連接的情況下,集群系統(tǒng)無法建立。問題根因說明框式交換機(jī)的集群連線規(guī)則是固定的,錯(cuò)誤的連線規(guī)則將會(huì)影響各個(gè)主控板之間報(bào)文交互,并導(dǎo)致集群系統(tǒng)無法建立。
在其中一臺(tái)設(shè)備上使用displaycssstatus命令查看設(shè)備的集群狀態(tài),發(fā)現(xiàn)設(shè)備處于單框集群狀態(tài):<HUAWEI>displaycssstatusPropertyItem PropertyValueFrameID 2Priority 1Enableswitch OnCSSmasterforce OffCSSstatus single使用命令terminalmonitor和terminaltrapping能,發(fā)現(xiàn)有大量集群線纜連接錯(cuò)誤告警:<HUAWEI>terminalmonitor<HUAWEI>terminaltrappingInfo:Currentterminalmonitorison.Mar31201010:53:43SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport3linkto1/14port2,thisportshouldlinkto1/13port2Mar31201010:53:43SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport1linkto1/13port4,thisportshouldlinkto1/14port4Mar31201010:53:44SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport3linkto1/14port2,thisportshouldlinkto1/13port2Mar31201010:53:44SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport1linkto1/13port4,thisportshouldlinkto1/14port4Mar31201010:53:45SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport3linkto1/14port2,thisportshouldlinkto1/13port2Mar31201010:53:45SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport1linkto1/13port4,thisportshouldlinkto1/14port4Mar31201010:53:46SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport3linkto1/14port2,thisportshouldlinkto1/13port2Mar31201010:53:46SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport1linkto1/13port4,thisportshouldlinkto1/14port4Mar31201010:53:47SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport3linkto1/14port2,thisportshouldlinkto1/13port2Mar31201010:53:47SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport1linkto1/13port4,thisportshouldlinkto1/14port4Mar31201010:53:48SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport3linkto1/14port2,thisportshouldlinkto1/13port2Mar31201010:53:48SYS-136CSSM/4/STACKCONNECTERROR:OID.4.1.20.4Connecterror,2/13CSSport1linkto1/13port4,thisportshouldlinkto1/14port4從告警信息中可以知道存在連接錯(cuò)誤,改動(dòng)集群線纜的連接。解決方案根據(jù)告警提示信息,更改集群線纜的連接。集群線纜重新連接后,其中有一個(gè)機(jī)框重啟(進(jìn)入集群合并),重啟之后集群建立成功,故障排除。例如本案例中,參考連線提示信息,拔出1/13的端口4,連接到1/14的端口4;把1/14的端口2連接到1/13到端口2。完成上述操作后,在可以看到集群合并,故障排除。經(jīng)驗(yàn)總結(jié)在組建集群系統(tǒng)時(shí),必須嚴(yán)格參照集群連線規(guī)則,注意集群的配置和集群的連線正確性。例如S7700的集群連線規(guī)則圖如下,各形態(tài)集群具體的連線規(guī)則,可以參考對(duì)應(yīng)的產(chǎn)品文檔。集群通道故障案例適合產(chǎn)品形態(tài)及版本框式設(shè)備問題現(xiàn)象描述及組網(wǎng)如上圖所示,兩臺(tái)框式交換機(jī)已經(jīng)使能集群功能、集群機(jī)框ID配置正確、集群線纜已經(jīng)連接的情況下,集群建立后一條集群通道兩端狀態(tài)為Down。問題根因說明集群線纜故障或線纜上的光模塊未插緊導(dǎo)致的集群通道不通。
登錄設(shè)備,執(zhí)行命令terminalmonitor和terminaltrapping息功能,發(fā)現(xiàn)集群端口Down的告警信息。<HUAWEI>terminalmonitor<HUAWEI>terminaltrappingMay7201221:08:00QuidwayCSSM/4/STACKLINKDOWN:OID.4.1.20.11/14CSSport2down.觀察集群子卡上的ACT/LINK指示燈,Down掉的集群口對(duì)應(yīng)的指示燈應(yīng)當(dāng)為熄滅狀態(tài)。如果是V200R001版本,還可以執(zhí)行命令displaycsschannel,查看集群鏈路狀態(tài)。<HUAWEI>displaycsschannelChassis1 || Chassis2================================================================Num[SRUAHG] [VSTSPort(Status)]|| [VSTSPort(Status)][SRUAHG]11/130/0--1/13/0/1(UP16G)||2/7/0/4(UP16G)--2/80/1421/130/1--1/13/0/3(UP16G)||2/8/0/2(UP16G)--2/70/1531/130/14--1/14/0/4(UP16G)||2/7/0/1(UP16G)--2/70/041/130/15--1/14/0/2(DOWNNA)||2/8/0/3(DOWNNA)--2/80/151/140/0--1/14/0/1(UP16G)||2/8/0/4(UP16G)--2/70/1461/140/1--1/14/0/3(UP16G)||2/7/0/2(UP16G)--2/80/1571/140/14--1/13/0/4(UP16G)||2/8/0/1(UP16G)--2/80/081/140/15--1/13/0/2(UP16G)||2/7/0/3(UP16G)--2/70/1通過告警信息和集群鏈路狀態(tài),可知因?yàn)?號(hào)鏈路故障,檢查集群線纜及集群相關(guān)模塊是否正常,可排除故障。解決方案拔,插拔間隔建議大于5秒。如果重新連接后,集群鏈路兩端狀態(tài)為UP,組故障排除,否則,轉(zhuǎn)入第二步。更換狀態(tài)為Down的集群線纜。經(jīng)驗(yàn)總結(jié)單個(gè)集群鏈路發(fā)生故障時(shí),不會(huì)影響業(yè)務(wù),但是發(fā)生故障的集群鏈路數(shù)量增多,集群分裂的風(fēng)險(xiǎn)增加,所以及時(shí)檢查集群鏈路狀態(tài),排除集群鏈路故障。Up適合產(chǎn)品形態(tài)及版本框式設(shè)備問題現(xiàn)象描述及組網(wǎng)如上圖所示,兩臺(tái)框式交換機(jī)已經(jīng)使能集群功能、集群機(jī)框ID配置正確、線纜已經(jīng)連接的情況下,發(fā)現(xiàn)集群拓?fù)渖儆诩号渲玫逆溌窋?shù)目。問題根因說明使用業(yè)務(wù)口集群方式組建集群,但沒有按照連線方式連線。
在設(shè)備上查看集群配置及拓?fù)?,發(fā)現(xiàn)有集群口的狀態(tài)為Down數(shù)。<HUAWEI>displaycsscss-portallB:broadcast *down:administrativelydownLogicPort Num PhyPort (B)css-port1/1 3 XGigabitEthernet1/12/0/2 upXGigabitEthernet1/12/0/3 XGigabitEthernet1/12/0/6 LogicPort Num PhyPort (B)css-port2/1 3 XGigabitEthernet2/4/0/2 upXGigabitEthernet2/4/0/3 XGigabitEthernet2/4/0/6 <HUAWEI>displaycsschannelChassis1 || Chassis2=========================================================================Num[Css-port] [LpuPort] || [LpuPort] [Css-port]1 1/1 XGigabitEthernet1/12/0/2 XGigabitEthernet2/4/0/2 2/12.執(zhí)行命令terminalmonitor和terminaltrapping打開信息中心發(fā)送的告警信息功能,發(fā)現(xiàn)有集群連線錯(cuò)誤告警。<HUAWEI>terminalmonitor<HUAWEI>terminaltrappingAug14201210:57:58HuaweiCSSM/4/CSUCONNECTERR:OID.4.1.20.8TheconnectionbetweenCSSport2/4/0/3and2/4/0/6iserror.Reason:LoopAug14201210:57:58HuaweiCSSM/4/CSUCONNECTERR:OID.4.1.20.8TheconnectionbetweenCSSport2/4/0/6and2/4/0/3iserror.Reason:Loop連線告警中的Reason字段有三種輸出信息。–Loop:集群線纜相連的兩個(gè)集群口位于同一個(gè)框上。–1To2:一個(gè)邏輯集群口中出的兩根集群線分別連到了兩塊不同的集群板上。–Unknown:其他原因,除以上兩種原因以外的所有原因。從上面的告警信息中可以判斷,此故障是由集群線纜連到了同一個(gè)框上導(dǎo)致。解決方案檢查導(dǎo)致環(huán)路的集群線纜,正確連接到對(duì)框物理集群口上。正確連接集群線纜后,告警消除,配置的集群端口全部Up。經(jīng)驗(yàn)總結(jié)業(yè)務(wù)口集群連線有兩種形式。1+0板上的集群鏈路實(shí)現(xiàn)集群連接。1+1的集群鏈路形成備份。為保證集群系統(tǒng)穩(wěn)定,集群連線時(shí)需注意以下幾點(diǎn):口只能與另一個(gè)邏輯集群口下物理集群口相連,不允許混連。在1+1對(duì)于S9312/S9312E,這兩塊單板不與6、7槽位進(jìn)行混插。對(duì)于1+0建議使用1+1組網(wǎng)形式。業(yè)務(wù)口集群方式集群無法建立適合產(chǎn)品形態(tài)及版本框式設(shè)備問題現(xiàn)象描述及組網(wǎng)如上圖所示,兩臺(tái)框式交換機(jī)已經(jīng)使能集群功能、集群機(jī)框ID配置正確、線纜已經(jīng)連接的情況下,發(fā)現(xiàn)集群無法建立。問題根因說明依次排除配置錯(cuò)誤、光纜、光模塊故障等因素所導(dǎo)致的系統(tǒng)無法建立。問題判斷方法檢查兩框的集群配置是否有問題。<HUAWEI>displaycssstatusPropertyItem PropertyValueChassisID 2Priority 2Enableswitch OnCSSmasterforce OffCSSstatus masterCSSmode lpu檢查兩框Enableswitch字段,查看兩框是否集群已經(jīng)使能。檢查兩框ChassisID字段,查看兩框是否配置了相同的集群ID為不同的集群ID。檢查兩框CSSmode字段,查看兩框是否都配置了業(yè)務(wù)口集群LPU經(jīng)檢查集群配置正確,集群狀態(tài)正常。執(zhí)行檢查兩框的集群口配置及狀態(tài)是否有問題。<HUAWEI>displaycsscss-portB:broadcastLogicPort*down:administrativelydownNumPhyPortStatus(B)css-port2/11 XGigabitEthernet2/4/0/2downcss-port2/20–檢查兩框的集群口物理連線和集群口配置是否相對(duì)應(yīng)。檢查連線是否有錯(cuò)誤,可根據(jù)告警提示判斷。檢查狀態(tài)為Down的鏈路,其光模塊是否插牢,是否發(fā)生光纖故障。經(jīng)檢查,集群口配置正常,由于連接集群口XGigabitEthernet2/4/0/2的光纖已壞,無法傳輸信號(hào)。解決方案
更換光纖線纜,并正確連接到對(duì)框物理集群口上。經(jīng)驗(yàn)總結(jié)
業(yè)務(wù)口集群連線有兩種形式。1+0板上的集群鏈路實(shí)現(xiàn)集群連接。1+1的集群鏈路形成備份。為保證集群系統(tǒng)穩(wěn)定,集群連線時(shí)需注意以下幾點(diǎn):口只能與另一個(gè)邏輯集群口下物理集群口相連,不允許混連。在1+1對(duì)于S9312/S9312E,這兩塊單板不與6、7槽位進(jìn)行混插。對(duì)于1+0建議使用1+1組網(wǎng)形式SS維護(hù)寶典6維護(hù)類專題資料04(2015-10-25)PAGE04(2015-10-25)PAGE319 6維護(hù)類專題資料CPU占用率高(盒式交換機(jī))CPU占用率高(框式交換機(jī))Ping和TracertCPU占用率高(盒式交換機(jī))CPU占用率是指一段時(shí)間內(nèi)系統(tǒng)中非空閑任務(wù)占用CPU處理的時(shí)間比率。CPU占用率常常是衡量設(shè)備性能的重要指標(biāo)之一。說明本章節(jié)僅適用于盒式交換機(jī)。CPUCPU占用率簡(jiǎn)介介紹CPU運(yùn)行的任務(wù)、特性功能以及設(shè)備啟動(dòng)后的CPU占用率情況。設(shè)備啟動(dòng)后,系統(tǒng)CPU持續(xù)運(yùn)行以下任務(wù):維護(hù)和管理設(shè)備狀態(tài)的系統(tǒng)任務(wù)。當(dāng)前網(wǎng)絡(luò)環(huán)境需要運(yùn)行的各種協(xié)議任務(wù)。從設(shè)備轉(zhuǎn)發(fā)面接收和發(fā)送報(bào)文的處理任務(wù)。華為交換機(jī)設(shè)備運(yùn)行時(shí),需要占用CPU資源的特性功能包括:管理設(shè)備組件:管理設(shè)備內(nèi)各組件并檢查其運(yùn)行狀態(tài),如板卡、電源、風(fēng)扇等。管理堆疊系統(tǒng):管理和維護(hù)堆疊系統(tǒng)內(nèi)成員交換機(jī)狀態(tài)。管理外部訪問:處理上送CPU的網(wǎng)絡(luò)管理流量,如、SSH、HTTP和SNMP等。管理配置的網(wǎng)絡(luò)控制協(xié)議:發(fā)送和接收協(xié)議報(bào)文、進(jìn)行協(xié)議運(yùn)算、更新轉(zhuǎn)發(fā)表(如MSTP、MAC、FIB表等)。網(wǎng)絡(luò)控制協(xié)議包括STP、LLDP、LNP、LACP、VCMP、DLDP、EFM、GVRP、VRRP、各路由協(xié)議等。輔助學(xué)習(xí)MAC:堆疊系統(tǒng)成員交換機(jī)間同步MAC。軟轉(zhuǎn)發(fā)報(bào)文:如L2PT軟轉(zhuǎn)發(fā)L2協(xié)議報(bào)文。學(xué)習(xí)和老化ARP表項(xiàng)。處理上送CPU的所有其他報(bào)文。在任何時(shí)刻,設(shè)備的CPU上都可能有很多活躍的任務(wù),如S5700LI就有超過200個(gè)任由于系統(tǒng)一直處于運(yùn)行狀態(tài),即使設(shè)備無任何業(yè)務(wù)配置和網(wǎng)絡(luò)流量,其CPU占用率也不可能為0%。在堆疊系統(tǒng)中,由于需要定時(shí)維護(hù)堆疊成員狀態(tài),并且系統(tǒng)大部分業(yè)務(wù)主要運(yùn)行在堆疊主交換機(jī)上,因此堆疊主交換機(jī)的CPU占用率比單臺(tái)設(shè)備運(yùn)行時(shí)的CPU占用率高;堆疊成員交換機(jī)數(shù)量增多時(shí),堆疊主交換機(jī)的CPU占用率也會(huì)相應(yīng)升高。當(dāng)設(shè)備轉(zhuǎn)發(fā)面上送CPU的報(bào)文速率過快(如因網(wǎng)絡(luò)環(huán)路導(dǎo)致CPU短時(shí)間內(nèi)收到大量報(bào)文)或者某任務(wù)長(zhǎng)時(shí)間占用CPU時(shí),CPU將高負(fù)荷運(yùn)行,可能無法及時(shí)調(diào)度其他任務(wù),進(jìn)而引發(fā)業(yè)務(wù)異常。設(shè)備提供了displaycpu-usage命令查看當(dāng)前CPU占用率情況,顯示包括最近5秒鐘、最近1分鐘、最近5分鐘的CPU平均占用率及歷史最高CPU占用率和發(fā)生時(shí)刻,同時(shí)還由高到低列出了系統(tǒng)當(dāng)前各任務(wù)在最近5秒鐘內(nèi)的CPU占用率情況。說明通常情況下,普通數(shù)據(jù)報(bào)文轉(zhuǎn)發(fā)由交換機(jī)硬件完成,無需CPU參與,因此CPU占用率高通常并不影響數(shù)據(jù)轉(zhuǎn)發(fā)。CPU報(bào)文處理原理介紹需要CPU處理的報(bào)文以及CPU處理報(bào)文的機(jī)制和原理。華為交換機(jī)由硬件轉(zhuǎn)發(fā)普通數(shù)據(jù)報(bào)文,無需CPU參與。以下場(chǎng)景會(huì)將報(bào)文發(fā)送給CPU處理:需要交換機(jī)終結(jié)的協(xié)議報(bào)文所有目的地址為本機(jī)的報(bào)文均需要上送CPU處理:各種協(xié)議控制報(bào)文,如STP、LLDP、LNP、LACP、VCMP、DLDP、EFM、GVRP、VRRP等路由更新報(bào)文,如RIP、OSPF、BGP、IS-IS等SNMP、、SSH報(bào)文ARP、ND回應(yīng)報(bào)文需要特殊處理的數(shù)據(jù)報(bào)文帶option選項(xiàng)的ICMP報(bào)文帶hop-by-hop選項(xiàng)的IPv6報(bào)文TTL小于或等于1的IPv4/IPv6報(bào)文目的IP地址為本機(jī)的報(bào)文ARP/ND/FIBMiss報(bào)文基于ACL的特性開啟logging功能后,通過ACLdeny動(dòng)作丟棄的報(bào)文流策略重定向到CPU的報(bào)文組播特性PIM、IGMP、MLD、MSDP協(xié)議報(bào)文未知IP組播流其他特性DHCP協(xié)議報(bào)文ARP、ND廣播請(qǐng)求報(bào)文,二層交換機(jī)配置動(dòng)態(tài)ARP檢測(cè)DAI(DynamicARPInspection)時(shí)也發(fā)送ARP報(bào)文L2PT軟轉(zhuǎn)發(fā)的L2協(xié)議報(bào)文(僅Tunnel件轉(zhuǎn)發(fā))N:1VLANmapping第一個(gè)報(bào)文上送CPU,后續(xù)報(bào)文使用硬件轉(zhuǎn)發(fā)交換機(jī)采用QoS機(jī)制處理上送CPU的報(bào)文,確保重要報(bào)文優(yōu)先處理。交換機(jī)將上送CPU的不同類型的報(bào)文劃分到優(yōu)先級(jí)不同的8個(gè)隊(duì)列,不同交換機(jī)款型支持上送CPU的報(bào)文種類可能不同。以S5700LI形態(tài)為例,部分典型報(bào)文上送CPU的隊(duì)列劃分如表6-1和圖6-1所示,隊(duì)列ID值越大,優(yōu)先級(jí)越高。表6-1CPU處理不同報(bào)文的隊(duì)列劃分隊(duì)列ID報(bào)文類型說明7IPC、RPC、LACP內(nèi)部管理報(bào)文6VP內(nèi)部軟轉(zhuǎn)發(fā)的協(xié)議報(bào)文隊(duì)列ID報(bào)文類型說明5Telnet、SSH、LNP、DHCP管理面協(xié)議報(bào)文4ARPRequest重要控制面協(xié)議報(bào)文3STP、SMLK、EOAM、VCMP重要控制面協(xié)議報(bào)文2LBDT、LLDP、DLDPIGMP、ICMP、NTP、、GVRP、L2PT、ARPMiss、FTP、SNMP控制面協(xié)議報(bào)文1Other-0Other-圖6-1將不同類型報(bào)文分發(fā)到CPU隊(duì)列交換機(jī)根據(jù)報(bào)文的層次(管理/控制/轉(zhuǎn)發(fā))及其重要性來指定將報(bào)文發(fā)送到哪個(gè)CPU隊(duì)列。CPU隊(duì)列具有相對(duì)優(yōu)先級(jí)。例如,Telnet管理報(bào)文和L2PT軟件透?jìng)鱈2協(xié)議報(bào)文同時(shí)排隊(duì),CPU將優(yōu)先處理5號(hào)隊(duì)列的Telnet管理報(bào)文,通過該機(jī)制確保CPU高負(fù)荷下設(shè)備穩(wěn)定可管理。同時(shí),CPU還通過加權(quán)調(diào)度機(jī)制防止低優(yōu)先級(jí)隊(duì)列的報(bào)文得不到處理。在穩(wěn)定的網(wǎng)絡(luò)環(huán)境下,上送CPU的報(bào)文數(shù)量控制在適當(dāng)?shù)姆秶鷥?nèi),CPU占用率也穩(wěn)定在一個(gè)合理的區(qū)間。如果一段時(shí)間內(nèi)上送CPU的報(bào)文數(shù)量過大,則CPU會(huì)因?yàn)槊τ谔幚磉@些報(bào)文而表現(xiàn)為CPU占用率過高。CPU占用率高是否是故障場(chǎng)景某些情況下CPU占用率高并不會(huì)導(dǎo)致網(wǎng)絡(luò)問題,尤其因一些已知網(wǎng)絡(luò)事件或管理員操作導(dǎo)致CPU占用率高的現(xiàn)象是正常的、可接受的。所以不能簡(jiǎn)單的將CPU占用率高當(dāng)作故障處理,只有當(dāng)導(dǎo)致設(shè)備不能正常處理業(yè)務(wù)時(shí),CPU占用率高才需要作為故障進(jìn)行解決。CPU占用率高屬于正常現(xiàn)象的場(chǎng)景在一些網(wǎng)絡(luò)應(yīng)用中,CPU占用率較高是正常的。通常情況下,網(wǎng)絡(luò)規(guī)模越大,處理網(wǎng)絡(luò)流量需要的CPU資源將越多。對(duì)于運(yùn)行堆疊的交換機(jī)系統(tǒng),當(dāng)管理的成員交換機(jī)數(shù)量增多時(shí),CPU用于維護(hù)和管理堆疊系統(tǒng)狀態(tài)所需要的資源也會(huì)相應(yīng)增加。設(shè)備長(zhǎng)時(shí)間運(yùn)行時(shí)CPU占用率不超過80%,短時(shí)間內(nèi)CPU占用率不超過95%,可認(rèn)為設(shè)備狀態(tài)是正常的。如下一些場(chǎng)景可能導(dǎo)致CPU占用率高,但是屬于正?,F(xiàn)象,而不是故障場(chǎng)景:生成樹對(duì)于MSTP,CPU占用率同實(shí)例數(shù)和活躍端口數(shù)成正比。對(duì)于VBST,由于每個(gè)VLAN獨(dú)立運(yùn)行一個(gè)實(shí)例,因此在相同VLAN和端口數(shù)目下,VBST比MSTP占用更多的CPU資源。更新路由表當(dāng)一臺(tái)三層交換機(jī)接收到路由更新消息時(shí),設(shè)備需占用CPU資源將路由信息更新到轉(zhuǎn)發(fā)面。對(duì)于堆疊系統(tǒng),路由信息還需要同步到其他成員交換機(jī)。在路由表更新過程中影響CPU占用率大小的因素有:路由表項(xiàng)的規(guī)模更新的頻率接收更新的路由協(xié)議進(jìn)程數(shù)堆疊系統(tǒng)成員交換機(jī)數(shù)量執(zhí)行命令部分命令因執(zhí)行時(shí)間長(zhǎng)會(huì)導(dǎo)致CPU占用率暫時(shí)升高,主要包括:用戶視圖下執(zhí)行copyflash:/命令一些輸出信息量大的debug命令,尤其是通過串口輸出debug信息導(dǎo)致CPU占用率高的其他事件端口使能了StickyMAC功能后,快速學(xué)習(xí)MAC將大量端口同時(shí)加入大量VLAN(如通過端口組操作,將大批端口加入大量VLAN、修改大批端口的鏈路類型等)頻繁或大量的IGMP請(qǐng)求頻繁的網(wǎng)管操作大量并發(fā)的DHCP請(qǐng)求(如交換機(jī)作為DHCP服務(wù)器時(shí),同時(shí)恢復(fù)與大量用戶的連接)ARP廣播風(fēng)暴以太網(wǎng)廣播風(fēng)暴軟轉(zhuǎn)發(fā)大量并發(fā)協(xié)議報(bào)文(如短時(shí)間內(nèi)L2PT透?jìng)鞔罅緽PDURelay/Snooping軟轉(zhuǎn)發(fā)DHCP報(bào)文等)大量不能硬件轉(zhuǎn)發(fā)的數(shù)據(jù)報(bào)文上送CPU(如ARP-Miss)端口頻繁up/downCPU占用率高對(duì)系統(tǒng)的影響CPU占用率過高會(huì)影響系統(tǒng)處理能力,導(dǎo)致網(wǎng)絡(luò)業(yè)務(wù)表現(xiàn)不如預(yù)期,可能導(dǎo)致出現(xiàn)的網(wǎng)絡(luò)故障現(xiàn)象有:STP拓?fù)涓淖兩踔脸霈F(xiàn)網(wǎng)絡(luò)環(huán)路交換機(jī)通過CPU周期性的接收BPDU報(bào)文維持其Root/Alternate端口角色,如果因上游設(shè)備CPU繁忙導(dǎo)致BPDU報(bào)文不能及時(shí)發(fā)出或本機(jī)CPU繁忙不能及時(shí)處理收到的BPDU報(bào)文,交換機(jī)會(huì)認(rèn)為到根橋的原路徑故障而重新選擇Root端口,引起網(wǎng)絡(luò)重新收斂;如果交換機(jī)原來同時(shí)存在Alternate端口,則將Alternate端口作為新的Root端口,這時(shí)就可能導(dǎo)致網(wǎng)絡(luò)出現(xiàn)環(huán)路。路由拓?fù)涓淖儎?dòng)態(tài)路由協(xié)議的?;钣蒀PU完成,如果因CPU繁忙不能及時(shí)接收和發(fā)送hello報(bào)文,就會(huì)導(dǎo)致路由震蕩,如OSPF震蕩、BGP震蕩、VRRP震蕩??煽啃詸z測(cè)協(xié)議震蕩802.3ah、802.1ag、DLDP、BFD、MPLSOAM等檢測(cè)協(xié)議均由CPU完成定時(shí)?;睿⊿5700HI通過硬件OAM引擎實(shí)現(xiàn)802.1ag、BFD、MPLSOAM的超時(shí)探測(cè),其OAM?;畈皇蹸PU負(fù)荷狀態(tài)影響),如果因?yàn)镃PU報(bào)文,將會(huì)導(dǎo)致協(xié)議震蕩,進(jìn)而影響相關(guān)業(yè)務(wù)流量轉(zhuǎn)發(fā)。鏈路震蕩LACP的?;钣蒀PU完成,如果因CPU繁忙不能及時(shí)接收和發(fā)送LACP報(bào)文,Eth-Trunk會(huì)將鏈路關(guān)閉,產(chǎn)生鏈路震蕩。交換機(jī)不能響應(yīng)正常的管理請(qǐng)求或SSH延遲等SNMP超時(shí)MAC/IPPing耗時(shí)很長(zhǎng)甚至超時(shí)交換機(jī)不能及時(shí)轉(zhuǎn)發(fā)或回應(yīng)客戶端請(qǐng)求,導(dǎo)致DHCP失敗或IEEE802.1x失敗通過CPU軟轉(zhuǎn)發(fā)的報(bào)文被丟棄或轉(zhuǎn)發(fā)時(shí)延增大設(shè)備內(nèi)存消耗增加CPU占用率高的步驟介紹排查CPU占用率過高的整體思路以及常見的引起CPU占用率過高的原因和解決措施。當(dāng)發(fā)現(xiàn)CPU占用率過高時(shí),建議按照“確定現(xiàn)象”、“明確問題”、“確認(rèn)根因”、“修復(fù)故障”的整體思路進(jìn)行分析,主要涉及以下幾個(gè)關(guān)鍵點(diǎn)的信息:CPU占用率升高發(fā)生在什么時(shí)間?CPU占用率升高時(shí)系統(tǒng)在做什么?什么因素導(dǎo)致CPU占用率升高?CPU占用率高是否是正常情況?是否需要修復(fù)?如何修復(fù)?CPU使用情況設(shè)備的CPU占用率指一段時(shí)間內(nèi)系統(tǒng)中非空閑任務(wù)占用CPU處理的時(shí)間比率,是對(duì)設(shè)備CPU使用情況的一個(gè)宏觀統(tǒng)計(jì),具有以下的幾個(gè)重要特點(diǎn):持續(xù)變化性:系統(tǒng)的CPU境的變化而持續(xù)變化的。非實(shí)時(shí)性:系統(tǒng)的CPU占用率反映的是一個(gè)CPU統(tǒng)計(jì)周期內(nèi)的CPU不是特指某一個(gè)時(shí)間點(diǎn)的實(shí)時(shí)占用情況。實(shí)體強(qiáng)相關(guān)性:CPU占用率是以物理CPU為粒度進(jìn)行統(tǒng)計(jì)的,通常而言,系統(tǒng)中的每一個(gè)物理實(shí)體單元均有一個(gè)單獨(dú)的物理CPU機(jī)的CPU占用率都是相互獨(dú)立的。獲取設(shè)備信息通過displaydevice命令獲取設(shè)備信息,如設(shè)備型號(hào)是什么、是否是堆疊系統(tǒng)、堆疊系統(tǒng)的成員交換機(jī)設(shè)備有哪些等。<HUAWEI>displaydeviceS5700-28P-LI-AC'sDevicestatus:SlotSubType Online Power Register Status Role----------------------------------------0- S5700-28P-LIPresentPowerOnRegisteredNormalMaster1- S5700-28P-LIPresentPowerOnRegisteredNormalStandby2- S5700-28P-LIPresentPowerOnRegisteredNormalSlave獲取CPU占用率統(tǒng)計(jì)信息通過displaycpu-usage[slave|slotslot-id]命令查看發(fā)生CPU占用率高的設(shè)備的CPU占用率統(tǒng)計(jì)信息,slot-id在堆疊系統(tǒng)中表示堆疊ID。<HUAWEI>displaycpu-usageslot0CPUUsageStat.Cycle:60(Second)CPUUsage :99%Max:100%CPUUsageStat.Time:2014-06-0515:19:46CPUutilizationforfiveseconds:99%:oneminute:75%:fiveminutes:42%MaxCPUUsageStat.Time:2014-06-0514:33:36.TaskNameCPURuntime(CPUTickHigh/TickLow)TaskExplanationARP30%0/bda2b23b ARPOS30%0/b2d02f1f OperationSystemL2IF21%0/8448bf54 L2IFIFPD4%0/1e575090 IFPDIfnetProductAdapterL2_P3%0/1a777526 L2_PRFTS2%0/13ed6c3e FTSIPCQ2%0/1256ab6f IPCQIPCtaskforsinglequeueSTP2%0/175350b9 STPVPR2%0/16254e6f VPRVPReceivemv_rx72%0/123d908c mv_rx7VIDL1%0/5f5df6f DOPRAIDLEmv_rx61%0/db73d34 mv_rx6AAA0%0/ 1d5c6 AAAAuthenAccountAuthorizeACL0%0/5fa8c7 ACLAccessControlListADPT0%0/ 0 ADPTAdapterAGNT0%0/ 0 AGNTSNMPagenttaskAGT60%0/ 0 AGT6SNMPAGT6taskALM0%0/ 0 ALMAlarmManagementALS0%0/3c2c178 ALSLossofSignalAM0%0/155db9 AM AddressManagementAPP0%0/ 0 APPASFI0%0/ 0 ASFIASFM0%0/ 0 ASFMBATT0%0/ 0 BATTMainTaskBFD0%0/3d8a91 BFDBidirectionForwardingDetectBOX0%0/ 0 BOXOutputBPDU0%0/ 1f13d BPDUAdapterBTRC0%0/ 6295 BTRCCAPM0%0/ 0 CAPMCapturePacket獲取CPU占用率高的告警和日志信息當(dāng)CPU占用率超過告警閾值時(shí),系統(tǒng)會(huì)向網(wǎng)管發(fā)送告警并將CPU占用率和占用CPU資源最多的3個(gè)任務(wù)等關(guān)鍵信息記錄到系統(tǒng)日志中??赏ㄟ^這些信息獲取CPU占用率過高的相關(guān)記錄。查看CPU占用率過高的告警信息可以通過網(wǎng)管監(jiān)控或displaytrapbuffer命令查看設(shè)備的告警信息,查看設(shè)備是否產(chǎn)生了CPU占用率過高的告警。相關(guān)告警信息為:ENTITYTRAP_.4.1.20hwCPUUtilizationRisingENTITYTRAP/4/ENTITYCPUALARM:OID[oid]CPUutilizationexceededthepre-alarmthreshold.(Index=[INTEGER],EntityPhysicalIndex=[INTEGER],PhysicalName=[OCTET],EntityThresholdType=[INTEGER],EntityThresholdValue=[INTEGER],EntityThresholdCurrent=[INTEGER],EntityTrapFaultID=[INTEGER].)CPU占用率過高的日志信息可以通過查看系統(tǒng)日志文件或displaylogbuffer命令查看設(shè)備的日志信息,查看設(shè)備是否產(chǎn)生了CPU占用率過高的日志。相關(guān)日志信息為:VOSCPU/4/CPU_USAGE_HIGHVOSCPU/4/CPU_USAGE_HIGH:TheCPUisoverloaded(CpuUsage=[ULONG]%,Threshold=[ULONG]%),thetaskswithtopthreeCPUoccupancyare:[CPU-resources-usage]識(shí)別設(shè)備行為在收集設(shè)備CPU的使用情況后,如果確認(rèn)設(shè)備出現(xiàn)CPU占用率過高的情況,則需要對(duì)CPU占用率過高時(shí)設(shè)備的行為進(jìn)行分析。通常情況下,系統(tǒng)CPU占用率過高與特定的業(yè)務(wù)處理或網(wǎng)絡(luò)環(huán)境異常有關(guān),因此可以通過收集系統(tǒng)CPU占用率過高期間CPU占用率較高的任務(wù)來分析設(shè)備當(dāng)時(shí)的行為。收集CPU占用率高的任務(wù)根據(jù)上節(jié)中命令的提示或者收集到的日志、告警的信息,獲取CPU占用率較高的任務(wù),建議重點(diǎn)關(guān)注占用率最高的前3個(gè)任務(wù)。根據(jù)任務(wù)分析設(shè)備行為系統(tǒng)通過任務(wù)承載業(yè)務(wù)功能,任務(wù)的CPU占用率可以在一定程度上反映各業(yè)務(wù)功能的活動(dòng)情況,是分析設(shè)備行為的重要手段。通常情況下,可以根據(jù)實(shí)際業(yè)務(wù)部署情況重點(diǎn)關(guān)注以下幾類重要任務(wù):系統(tǒng)空閑任務(wù)該任務(wù)是系統(tǒng)中的一個(gè)特殊任務(wù),任務(wù)名為VIDL,任務(wù)優(yōu)先級(jí)最低,僅在沒有其他任何非空閑任務(wù)運(yùn)行時(shí),該任務(wù)才會(huì)占用CPU;在其他非空閑任務(wù)需要使用CPU時(shí),該任務(wù)會(huì)被立即搶占。CPU占用率是指各非空閑任務(wù)占用CPU運(yùn)行時(shí)間的比率,因此,系統(tǒng)會(huì)利用VIDL任務(wù)占用CPU的時(shí)間來統(tǒng)計(jì)設(shè)備的CPU占用率。VIDL任務(wù)的CPU占用率越高,系統(tǒng)的CPU占用率越低,系統(tǒng)越空閑。系統(tǒng)管理任務(wù)這一類任務(wù)的主要功能是對(duì)系統(tǒng)資源進(jìn)行管理,并提供操作系統(tǒng)基礎(chǔ)機(jī)制,如定時(shí)器、信息中心等功能。常見的可能導(dǎo)致CPU占用率過高的系統(tǒng)管理任務(wù)有:信息中心:主要包括BOX任務(wù)(用于輸出黑盒子中存儲(chǔ)的信息)、INFO任務(wù)(用于接收、輸出業(yè)務(wù)模塊產(chǎn)生的日志、告警)等,這些任務(wù)的主要功能是提供操作系統(tǒng)的基礎(chǔ)信息中心功能(如日志、告警、異常、死循環(huán)的記錄,調(diào)試信息的輸出等),當(dāng)設(shè)備輸出大量調(diào)試信息或者日志信息時(shí),可能會(huì)引起該任務(wù)CPU占用率過高。設(shè)備管理:主要包括DEV任務(wù)(用于管理設(shè)備上的硬件模塊)、HOTT任務(wù)(用于管理板卡的熱插拔)、SRMI任務(wù)(用于處理設(shè)備器件相關(guān)的外部中斷)等,這些任務(wù)主要用于處理各類設(shè)備變化事件,在配置恢復(fù)、主備倒換、堆疊新成員加入、子卡插入等特殊階段可能出現(xiàn)短時(shí)間的CPU升高的情況,一般不會(huì)對(duì)業(yè)務(wù)造成影響;但是在部分設(shè)備器件故障時(shí)會(huì)上報(bào)大量中斷,可能會(huì)導(dǎo)致SRMI任務(wù)CPU占用率升高。設(shè)備之間通信:主要包括IPCR任務(wù)(分發(fā))、IPCQ任務(wù)(用于設(shè)備之間通信消息的失敗重傳)、RPCQ任務(wù)(用于提供遠(yuǎn)程過程調(diào)用功能)等,這些任務(wù)的主要功能是實(shí)現(xiàn)設(shè)備之間管理消息通信功能。在產(chǎn)生大量設(shè)備之間管理消息的情況下,如大規(guī)格路由震蕩、大量用戶并發(fā)上線、環(huán)網(wǎng)震蕩等,可能會(huì)導(dǎo)致這一類任務(wù)的CPU占用率升高。接口管理:主要包括IFNT任務(wù)(負(fù)責(zé)接口狀態(tài)變化事件的處理)、IFPD任務(wù)(維護(hù)設(shè)備的接口數(shù)據(jù)庫,處理各種接口狀態(tài)變化事件)、linkscan任務(wù)(端口link狀態(tài)檢測(cè)任務(wù))等,用于對(duì)設(shè)備當(dāng)前的接口及其外圍器件(如光模塊)信息和接口狀態(tài)進(jìn)行維護(hù),并將接口事件通告給業(yè)務(wù)模塊進(jìn)行處理。在接口數(shù)量較多、接口link狀態(tài)震蕩、光模塊異常等情況下可能會(huì)導(dǎo)致這一類任務(wù)的CPU占用率升高。網(wǎng)絡(luò)管理任務(wù)這一類任務(wù)的功能包括兩個(gè)方面,一是提供網(wǎng)絡(luò)管理界面;二是提供對(duì)網(wǎng)絡(luò)狀況的監(jiān)控管理能力。常見的可能出現(xiàn)CPU占用率過高的任務(wù)有:網(wǎng)絡(luò)管理:主要包括AGNT任務(wù)(提供IPv4SNMP功能)、AGT6任務(wù)(提供IPv6SNMP功能)、VTx任務(wù)(VTY用戶任務(wù),用于提供VTY用戶的登錄、鑒權(quán)、人機(jī)交互功能,x表示用戶的登錄序列,如第一個(gè)用戶任務(wù)名為VT0)、FTPS任務(wù)(提供FTP服務(wù)功能)等,這些任務(wù)的作用是提供用戶通過網(wǎng)絡(luò)管理設(shè)備的能力。在用戶終端打印大量數(shù)據(jù)、多個(gè)FTP件、網(wǎng)管軟件頻繁訪問設(shè)備遍歷MIB節(jié)點(diǎn)信息等情況下,可能會(huì)出現(xiàn)這類任務(wù)的CPU占用率短時(shí)間過高的情況。網(wǎng)絡(luò)監(jiān)控:主要包括NSA任務(wù)(提供Netstream功能,用于監(jiān)控網(wǎng)絡(luò)中的業(yè)務(wù)流量)、NQAS和NQAC任務(wù)(提供NQA功能,用于對(duì)現(xiàn)網(wǎng)業(yè)務(wù)報(bào)文進(jìn)行仿真測(cè)試)等,這些任務(wù)的主要作用是提供用戶對(duì)網(wǎng)絡(luò)的監(jiān)控能力。這些任務(wù)一般不會(huì)導(dǎo)致CPU占用率過高。報(bào)文接收和發(fā)送類任務(wù)在網(wǎng)絡(luò)中,可將報(bào)文按照功能分為控制報(bào)文和數(shù)據(jù)報(bào)文。在華為交換機(jī)控制面和轉(zhuǎn)發(fā)面雙平面分離的架構(gòu)設(shè)計(jì)下,控制報(bào)文和部分?jǐn)?shù)據(jù)報(bào)文(如ARP-Miss報(bào)文、組播RPF-Fail報(bào)文等)需要在控制面進(jìn)行處理,而控制面的處理核心即為設(shè)備的CPU。由轉(zhuǎn)發(fā)面上送CPU的報(bào)文經(jīng)過一系列報(bào)文接收和發(fā)送任務(wù)的逐層解析和分發(fā)處理,最終完成整個(gè)報(bào)文的處理和轉(zhuǎn)發(fā)過程,在這個(gè)過程中,涉及到BCMR、BCMT、MV0~7、FTS、VP、VPR、VPS、SOCK等任務(wù),當(dāng)大量報(bào)文發(fā)送到控制面處理時(shí),這些任務(wù)的CPU占用率就會(huì)出現(xiàn)顯著的升高。這一類原因是導(dǎo)致系統(tǒng)CPU占用率高的重要原因。業(yè)務(wù)協(xié)議類任務(wù)業(yè)務(wù)協(xié)議任務(wù)承載了交換機(jī)的大部分協(xié)議功能。在網(wǎng)絡(luò)穩(wěn)定的情況下,業(yè)務(wù)協(xié)議的交互與處理一般不會(huì)造成較大的CPU占用率的波動(dòng),但是在網(wǎng)絡(luò)變動(dòng)頻繁甚至是震蕩的情況下,業(yè)務(wù)協(xié)議需要適應(yīng)網(wǎng)絡(luò)環(huán)境的變化進(jìn)行頻繁的交互和計(jì)算,此時(shí)可能會(huì)引起CPU占用率的升高。常見的容易引起設(shè)備CPU占用率過高的任務(wù)包括ROUT(提供BGP、IS-IS、OSPF、RIP等路由協(xié)議功能)、FIB等路由管理任務(wù),frag_add、frag_del、MSYN等MAC管理任務(wù),DHCP、EAP、SAM等用戶管理任務(wù)以及ARP等交互較為頻繁的協(xié)議任務(wù)。分析根本原因了解重要網(wǎng)絡(luò)事件系統(tǒng)CPU占用率高通常是由系統(tǒng)外部輸入或者系統(tǒng)內(nèi)部事件觸發(fā)的,如業(yè)務(wù)配置、網(wǎng)管同步、網(wǎng)絡(luò)環(huán)境、器件故障等。因此,要確認(rèn)設(shè)備CPU占用率高的根本原因,可以首先根據(jù)網(wǎng)絡(luò)運(yùn)維信息了解設(shè)備CPU占用率過高時(shí)有無重要的網(wǎng)絡(luò)事件,如網(wǎng)絡(luò)割查的范圍。根據(jù)設(shè)備行為分析原因通過分析CPU占用率過高時(shí)的設(shè)備行為,我們可以初步判斷導(dǎo)致CPU占用率高的直接原因,再結(jié)合網(wǎng)絡(luò)部署及網(wǎng)絡(luò)環(huán)境信息進(jìn)行分析,可以最終找出導(dǎo)致CPU占用率高的根本原因。由于系統(tǒng)中不同類型任務(wù)的處理過程不同,導(dǎo)致CPU占用率升高的根因也不同。系統(tǒng)管理類任務(wù)系統(tǒng)管理類任務(wù)的作用是對(duì)系統(tǒng)中的各器件進(jìn)行管理,并提供操作系統(tǒng)基本功能給其他業(yè)務(wù)模塊使用,因此系統(tǒng)管理類任務(wù)CPU占用率高的主要原因包括系統(tǒng)內(nèi)部原因和其他模塊觸發(fā)兩類。系統(tǒng)內(nèi)部原因,通常是由硬件故障引起的,其他業(yè)務(wù)模塊觸發(fā)的情況下,可以根據(jù)導(dǎo)致系統(tǒng)CPU占用率過高的業(yè)務(wù)模塊信息對(duì)問題進(jìn)行分析。網(wǎng)絡(luò)管理類任務(wù)網(wǎng)絡(luò)管理類任務(wù)CPU占用率高是由網(wǎng)管同步等網(wǎng)絡(luò)管理事件觸發(fā)的,其影響時(shí)間較短,通常對(duì)業(yè)務(wù)不會(huì)造成影響。此類情況可以結(jié)合網(wǎng)絡(luò)管理事件進(jìn)行分析。報(bào)文接收/發(fā)送類和業(yè)務(wù)協(xié)議類任務(wù)這兩類任務(wù)CPU占用率高往往是同時(shí)發(fā)生的,通常是由協(xié)議報(bào)文大量上送CPU產(chǎn)生的,可按照以下思路進(jìn)行分析:確定報(bào)文的種類不同款型的交換機(jī)有多種方式對(duì)上送CPU的報(bào)文進(jìn)行統(tǒng)計(jì),主要有如下幾種方式:根據(jù)CPU-Defend統(tǒng)計(jì)信息分析上送報(bào)文的種類(僅S5710EI、S5700EI、S5700HI和S6700支持支持)可以通過displaycpu-defendstatisticsall命令收集系統(tǒng)中所有上送CPU的報(bào)文的統(tǒng)計(jì)值。該統(tǒng)計(jì)值是持續(xù)累加的。如果連續(xù)采集幾次信息發(fā)現(xiàn)某類報(bào)文上送CPU的速率明顯較大(采集速率可以通過displaycpu-defendrateall命令查看)甚至出現(xiàn)超出系統(tǒng)對(duì)該類報(bào)文上送CPU的速率的限制而產(chǎn)生報(bào)文丟棄的情況,則可將CPU占用率高的直接原因確認(rèn)為是該類報(bào)文引起的??梢允褂胷esetcpu-defendstatistics命令清空統(tǒng)計(jì)信息。同時(shí)CPU-Defend功能以10分鐘為周期對(duì)報(bào)文上送CPU的情況進(jìn)行監(jiān)控,如果在檢測(cè)周期內(nèi)發(fā)現(xiàn)有報(bào)文上送CPU的數(shù)量超過閾值的情況,系統(tǒng)會(huì)將該類報(bào)文的報(bào)文類型、丟棄數(shù)量、發(fā)生時(shí)間等重要信息記入日志,可以通過查看該日志獲取CPU占用率高時(shí)系統(tǒng)狀態(tài)的歷史記錄。日志格式為DEFD/4/CPCAR_DROP_MPU:RateofpacketstocpuexceededtheCPCARlimitontheMPU.(Protocol=[STRING],CIR/CBS=[ULONG]/[ULONG],ExceededPacketCount=[STRING])–根據(jù)業(yè)務(wù)模塊使用情況判斷上送CPU的報(bào)文種類大量協(xié)議報(bào)文上送CPU通常會(huì)伴隨著相關(guān)協(xié)議業(yè)務(wù)模塊任務(wù)CPU占用率升高,可以利用協(xié)議任務(wù)CPU占用率信息判斷是哪一類的報(bào)文大量上送常見的重要協(xié)議任務(wù)如下:任務(wù)名功能描述ARP實(shí)現(xiàn)ARP協(xié)議棧,管理協(xié)議狀態(tài)機(jī),維護(hù)協(xié)議相關(guān)的數(shù)據(jù)庫。DHCP實(shí)現(xiàn)DHCP協(xié)議棧處理,完成DHCPSnooping及DHCPRelay等功能。SNPGIGMPSnooping/MLDSnooping協(xié)議棧,偵聽并處理IGMP和MLD協(xié)議報(bào)文。ROUT負(fù)責(zé)各路由協(xié)議路由選路以及路由學(xué)習(xí),進(jìn)行最優(yōu)路由的選擇并下發(fā)FIB。STP實(shí)現(xiàn)STP協(xié)議棧,管理協(xié)議狀態(tài)機(jī),維護(hù)協(xié)議相關(guān)的數(shù)據(jù)庫。(可選)確定報(bào)文的詳細(xì)特征如果根據(jù)報(bào)文種類和網(wǎng)絡(luò)管理事件仍無法分析出具體原因,則可以通過端口鏡像獲取報(bào)文信息、打印調(diào)試信息等方式分析上送CPU的報(bào)文的詳細(xì)特征。端口鏡像獲取報(bào)文信息(推薦)端口鏡像獲取報(bào)文信息是最直接的獲取報(bào)文詳細(xì)特征的方式,且對(duì)設(shè)備的CPU不會(huì)造成任何影響,建議在上送CPU的報(bào)文的入方向端口進(jìn)行鏡像。交換機(jī)端口鏡像配置方式請(qǐng)參考《鏡像配置》。打印調(diào)試信息如果不滿足鏡像獲取報(bào)文信息條件,可以通過打印調(diào)試信息的方式對(duì)報(bào)文詳細(xì)特征進(jìn)行獲取,打印調(diào)試信息本身會(huì)占用CPU資源,在定位問題過程中打印大量調(diào)試信息會(huì)加劇CPU占用率高的情況,請(qǐng)慎重使用。(可選)通過ACL定義報(bào)文輸出過濾器如果需要對(duì)IP層調(diào)試信息進(jìn)行過濾,可以通過配置ACL并應(yīng)用在debug命令中的方式對(duì)輸出調(diào)試信息進(jìn)行過濾。打開相應(yīng)層次的調(diào)試信息開關(guān)常用的調(diào)試信息包括IP層調(diào)試信息和鏈路層調(diào)試信息兩種:IP層調(diào)試信息:可以使用debuggingippacket命令打開IP層調(diào)試信息,該命令支持按照ACL對(duì)輸出信息進(jìn)行過濾。鏈路層調(diào)試信息:可以使用debuggingethernetpacket命令打開Ethernet層調(diào)試信息,該命令支持按照?qǐng)?bào)文類型和接口對(duì)輸出信息進(jìn)行過濾。打開終端信息輸出開關(guān)通過執(zhí)行terminalmonitor命令和terminaldebugging命令將調(diào)試信息輸出到用戶終端。分析根因根據(jù)報(bào)文的種類和特征可以得到導(dǎo)致設(shè)備CPU占用率高的直接原因,根據(jù)該原因議震蕩、網(wǎng)絡(luò)環(huán)路、網(wǎng)絡(luò)攻擊以及業(yè)務(wù)并發(fā)等,詳細(xì)的故障處理措施請(qǐng)參考下節(jié)。CPU占用率高的原因和解決措施硬件故障
當(dāng)交換機(jī)出現(xiàn)硬件故障時(shí),器件可能會(huì)大量上報(bào)中斷,引起系統(tǒng)CPU占用率過高。定位方法由于硬件故障導(dǎo)致CPU占用率過高時(shí),通常表現(xiàn)為SRMI、SRMR、BCMDPC等中斷處理相關(guān)的任務(wù)占用率較高,因此如果出現(xiàn)系統(tǒng)CPU占用率較高且以上相關(guān)任務(wù)占用率排名靠前的情況,則可能是系統(tǒng)硬件出現(xiàn)故障。處理建議判斷故障根源可能為硬件故障時(shí),請(qǐng)先嘗試手工復(fù)位CPU占用率較高的設(shè)備(建議采用下電的方式進(jìn)行重啟),如果重啟后問題依然存在,請(qǐng)聯(lián)系技術(shù)支持工程師進(jìn)行處理。網(wǎng)絡(luò)環(huán)境
網(wǎng)絡(luò)環(huán)境因素是導(dǎo)致交換機(jī)CPU占用率高的一類主要外部原因,常見的原因有網(wǎng)絡(luò)震蕩、網(wǎng)絡(luò)環(huán)路、網(wǎng)絡(luò)攻擊等,不同原因?qū)е碌膯栴}表現(xiàn)不同,需要根據(jù)具體情況分別進(jìn)行處理。網(wǎng)絡(luò)震蕩網(wǎng)絡(luò)震蕩是導(dǎo)致設(shè)備CPU占用率過高的一類重要原因,出現(xiàn)網(wǎng)絡(luò)震蕩的情況下,網(wǎng)絡(luò)頻繁變動(dòng),設(shè)備忙于處理網(wǎng)絡(luò)切換事件,導(dǎo)致CPU占用率高。常見的網(wǎng)絡(luò)震蕩情況如下:STP震蕩STP震蕩是二層網(wǎng)絡(luò)中的場(chǎng)景問題,在STP頻繁震蕩的情況下,設(shè)備需要不斷進(jìn)行STP拓?fù)溆?jì)算,更新MAC表和ARP表等轉(zhuǎn)發(fā)表,引起CPU占用率高。定位方法當(dāng)懷疑網(wǎng)絡(luò)中存在頻繁的STP震蕩時(shí),可以通過displaystptopology-change命令查看STP的拓?fù)渥兓畔?。如果確認(rèn)存在頻繁的網(wǎng)絡(luò)拓?fù)渥兓?,可以通過displaystptc-bpdustatistics命令查看端口上接收到的TC-BPDU統(tǒng)計(jì),以確定TC報(bào)文的來源。根據(jù)TC事件和系統(tǒng)日志分析STP拓?fù)渥兓母?。處理建議如果是接入側(cè)端口up/down引起的STP拓?fù)渥兓?,則在接口視圖下通過edged-portenable命令將接入側(cè)端口配置為邊緣端口,并通過stpbpdu-protection命令開啟BPDU保護(hù)功能??谕ㄟ^stproot-protection命令開啟根保護(hù)功能,保證拓?fù)涞恼_性。如果網(wǎng)絡(luò)中發(fā)生了TC攻擊,則在被攻擊的端口通過stptc-protection署TC保護(hù)功能,減少TC攻擊對(duì)設(shè)備的影響。技術(shù)支持工程師。路由協(xié)議震蕩路由協(xié)議震蕩會(huì)導(dǎo)致路由信息的重新擴(kuò)散和路由表的重新計(jì)算,對(duì)設(shè)備CPU產(chǎn)生影響。交換機(jī)的實(shí)際應(yīng)用中,通常使用OSPF協(xié)議對(duì)動(dòng)態(tài)路由信息進(jìn)行管理。定位方法可以通過日志查看OSPF鄰居狀態(tài)Down的原因。執(zhí)行displaylogbuffer命令,查看如下日志信息:OSPF/3/NBR_DOWN_REASON:NeighborstateleavesfullorchangedtoDown.(ProcessId=[USHORT],NeighborRouterId=[IPADDR],NeighborAreaId=[ULONG],NeighborInterface=[STRING],NeighborDownImmediatereason=[STRING],NeighborDownPrimeReason=[STRING],NeighborChangeTime=[STRING])NeighborDownImmediatereason此關(guān)鍵字記錄的是OSPF鄰居Down的原因。OSPF鄰居Down的原因一般會(huì)有以下幾種:NeighborDownDuetoInactivity:表示在deadtime時(shí)間內(nèi)沒有收到Hello報(bào)文導(dǎo)致OSPF鄰居Down。NeighborDownDuetoKillNeighbor:表示因?yàn)榻涌贒own、BFDDown或執(zhí)行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 糧油加工機(jī)械相關(guān)項(xiàng)目投資計(jì)劃書范本
- 人工智能技術(shù)支持下的智能交通系統(tǒng)開發(fā)協(xié)議
- 2024年全國英語競(jìng)賽《C類本科生》初賽試題真題及答案
- 一根火柴測(cè)出肺好壞課件
- 英文習(xí)語與短語辨析教案
- 旅游酒店客房服務(wù)與管理技術(shù)手冊(cè)
- 甘肅省酒泉市2024-2025學(xué)年高二上學(xué)期期末語文試題(原卷版+解析版)
- 高速公路建設(shè)項(xiàng)目投資合同
- 公司股東內(nèi)部承包合同
- 網(wǎng)絡(luò)服務(wù)合作協(xié)議條款及責(zé)任事項(xiàng)
- 2024年胰島素泵行業(yè)前景分析:胰島素泵行業(yè)發(fā)展趨勢(shì)提升服務(wù)水平
- 機(jī)床夾具設(shè)計(jì)實(shí)例
- 福建省泉州市第五中學(xué)2023-2024學(xué)年八年級(jí)下學(xué)期期中語文試題
- 2024CSCO惡性腫瘤患者營養(yǎng)治療指南解讀
- 產(chǎn)后出血預(yù)防與處理
- 智能化倉儲(chǔ)冷庫項(xiàng)目可行性研究報(bào)告
- 通達(dá)信公式函數(shù)說明大全
- 2024年輔警招聘考試試題庫含完整答案(各地真題)
- 柏子養(yǎng)心丸神經(jīng)保護(hù)機(jī)制
- 《工程建設(shè)標(biāo)準(zhǔn)強(qiáng)制性條文電力工程部分2023年版》
- 第17課《昆明的雨》課件(共35張)
評(píng)論
0/150
提交評(píng)論