资源描述
,单击填写章节标题,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,故障分析,2,课程介绍,本课程主要介绍一些常见的故障,以及故障排除的一般思路及方法。,3,内容介绍,第,1,章 了解故障信息的途径,第,2,章 排除故障的一般思路,第,3,章 故障分类,第,4,章 案例分析,4,了解故障信息的途径,网管告警箱告警,网管告警台上可以查询故障的详细信息,从硬件单板工作状态的显示灯观察,用户申告,5,内容介绍,第,1,章 了解故障信息的途径,第,2,章 排除故障的一般思路,第,3,章 故障分类,第,4,章 案例分析,6,排除故障的一般思路,收集故障相关信息,了解故障面积并且判断故障的紧急程度,对故障情况进行分析,罗列出可能原因和相应的试排方案,尝试排除故障,优先选择最容易的操作且安全的方案,其次选择最可能的方案,最后选择对正常业务可能产生影响的方案,7,内容介绍,第,1,章 了解故障信息的途径,第,2,章 排除故障的一般思路,第,3,章 故障分类,第,4,章 案例分析,8,故障的分类,硬件故障,电源模块(,PEM,)的故障,CSM,硬件故障,业务板的硬件故障,SFP,硬件故障,与,ONU,连接故障,升级、重启故障,系统故障,9,电源模块(,PEM,)的故障,故障指示,配置,1,:只安装了单个电源模块,查看电源模块上的,ON LED,状态。若不亮,表示电源模块有故障。,配置,2,:冗余安装电源模块,查看电源模块上的,RUN LED,的状态。若输入电压和链接都正常,但,RUN,是灭的,表示电源模块有故障。,10,电源模块(,PEM,)的故障,故障处理,确认该电源模块为故障模块,拔掉故障模块的电源线,拔出故障电源模块,插入一块新电源模块。,连接电源线。,处理结果,若是单个电源模块,此时系统将自动重启。,若是两个电源模块,此时系统的电源模块又工作在冗余备份状态。,11,CSM,硬件故障,故障指示,故障指示,1,:,当,CSM,板上的所有指示灯都不亮,表明,CSM,发生硬件故障。,故障指示,2,:,当通过,Console,口或,MGNT,口直连访问,BBS 4000,,系统上电启动。系统自检未通过,停留在某个自检过程中。,按下,BBS 4000,前面上的,RESET,按钮,系统重新启动,但,BBS 4000,系统仍未能正常启动。,表明,CSM,发生硬件故障。,12,CSM,硬件故障,故障处理:,确认该,CSM,为故障插板,拔掉,CSM,上的所有连线,拔出故障,CSM,,插上新,CSM,。具体参考,CSM,热插拔。,连接,CSM,上的端口。,处理结果:,系统将会自动重启,系统正常启动。,13,业务板的硬件故障,故障指示,当业务板上的,POWER LED,为常灭,表示该业务板为故障插板。,故障处理(,以,GEM04B,插板为例进行故障处理的描述,),确认该业务板为故障插板,记录业务板的端口连线及其,SFP,模块信息,拔掉业务板上的所有连线及其,SFP,模块,拔出故障业务板,插上新业务板。,按照记录,在正确的,OLT,口安装相应的,SFP,模块。,按照记录,连接业务板上的端口。,处理结果:,该业务板上的,PWR LED,显示为绿色常亮,连接到业务板的,ONU,将重新注册登录到,BBS 4000,。,14,业务板热插拔过程,将防静电手腕环的接地端插入,BBS 4000,的,ESD,端口,松开故障业务板的上下侧螺母。,按下故障业务板前面板上的,SWAP,按钮,,LED,将闪烁,5s,左右,变为黄色常亮。,沿着导轨的拔出故障插板,将新业务板从防静电袋中取出,插板插入插槽。,通过按下,CSM,上下两侧的扳键锁,固定,CSM,板。,将插板前面上下侧的螺母旋紧。,15,SFP,硬件故障,故障指示,在,BBS 4000,上电的情况下,若,EPM04A PON,口,OPR LED,为红色,表示该,PON,口链路有故障;若,GEM04B,的,GE,口的,LINK LED,为红色,表示该,GE,口链路有故障。,确认,BBS 4000,的端口工作正常,,BBS 4000,和对端设备之间的连接正常。,此时判断:该端口链路故障是由插板的,SFP,引起的。,16,BBS 4000,和,ONU,连接故障处理,通过,CLI,命令行(,Privileged EXEC,命令模式),显示,BBS 4000,的,OLT,端口属性和端口上所连的,ONU,数量:,telnetUU-BBS400#show interface epon-olt brief,OLT state admin phy mac ONU transceiver self-diag Hardware,Firmware id state state addr num type state version version,-,2/1 Running Enabled present 00:e0:8e:88:02:00 1 EPM04B-SFP passed 0 x20 0 x20003,2/2 Disabled Disabled present 00:e0:8e:88:02:00 0 EPM04B-SFP passed 0 x20 N/A,2/3 Disabled Disabled present 00:e0:8e:88:02:00 0 EPM04B-SFP passed 0 x20 N/A,2/4 Disabled Disabled present 00:e0:8e:88:02:00 0 EPM04B-SFP passed 0 x20 N/A,槽位,2,上的,EPM04B,的,OLT,端口,1,已启用并可用。端口均采用,SFP,收发器。槽位,2,的端口,1,上注册了,1,个,ONU,。,17,启动,OLT,端口的管理状态,在,OLT,端口配置命令模式下,通过以下命令启动,OLT,端口:,telnetBBS4000(config-t-if-olt-module/port)#no shutdown,检查,EPM04A,模块的,LED,如果,OLT,端口的,FAULT LED,为红色,检查该端口的光纤连接。在继续之前,需确保,OLT,端口的,OPR LED,为绿色。,BBS 4000,和,ONU,连接故障处理,18,检查系统中的,ONU,认证设置检查,有两种,ONU,认证方法:,Radius,服务器认证或本地认证。,通过以下命令显示,ONU,认证设置:,TelnetBBS4000(config-t)#show pon-sys,PON system global parameters:,local sla authentication=enabled,local sla sync with radius server=disabled,local logical port strict binding=disabled,MAC Address Aging Timer=300 seconds,remote-mgmt onu-authentication time out=10,若选择本地认证,根据,lport,绑定设置,分以下两种情况:,lport-strict-binding,设置为,disable,时,与,ONU,的,MAC,地址设置无关。,lport-strict-binding,设置为,enable,时,需确保在本地,SLA,表中正确输入,ONU,的,MAC,地址。,BBS 4000,和,ONU,连接故障处理,19,BBS 4000,和,ONU,连接故障处理流程,查看,OLT,口和,ONU,的状态,是否启动,OLT,口,Admin,状态,LTM FAULT LED,是否亮?,光纤是否连接正确端口?,LTM OPR LED,是否亮?,收发器类型是否正确?,是否需要本地认证,本地认证,-,本地,SLA,表是否有,ONU MAC,?,Radius,服务器设置是否正确?,Radius,服务器数据库是否有,ONU-ID/PWD,?,OLT,Radius,服务,或网络错误,是否启动,OLT,口,20,内容介绍,第,1,章 了解故障信息的途径,第,2,章 排除故障的一般思路,第,3,章 故障分类,第,4,章 案例分析,21,案例分析,ONU,注册失败故障,上连口故障,二层转发故障,三层转发故障,组播业务故障,密码丢失故障处理,22,ONU,注册失败故障,造成,ONU,注册失败的原因有:,从,ONU,至,OLT,间的光纤线路损坏或者衰耗过大,ONU,掉电,本地认证设置不正确,radius,认证的属性参数设置不正确,Radius,认证时,ONU,的用户名与密码设置不正确,23,ONU,注册失败故障,ONU,注册失败后显示的状态:,使用,show interface epon-olt module/port mac,如果,ONU,注册失败,相应的,ONU id,为,N/A,telnetUU-BBS400#sho interface epon-olt 2/1 mac-address-table,Record OLT LPort ONU id LLID VID Mac_Address Type,-,1 2/1 1 0 0 1 00:07:ba:35:41:f9 Dynamic,2 2/1 1 0 0 4088 00:07:ba:35:41:fa Dynamic,3 2/1 2 N/A N/A N/A 00:07:ba:35:3e:87 Dynamic,24,ONU,注册失败故障处理,LED,状态检查,使用,show interface epon-olt brief,命令查看,ONU,注册的数目,telnetUU-BBS400#show interface epon-olt brief,OLT state admin phy mac ONU transceiver self-diag Hardware Firmware,-,2/1 Running Enabled present 00:e0:8e:88:02:00 1 EPM04B-SFP passed 0 x20 0 x20003,2/2 Disabled Disabled present 00:e0:8e:88:02:00 0 EPM04B-SFP passed 0 x20 N/A,2/3 Disabled Disabled present 00:e0:8e:88:02:00 0 EPM04B-SFP passed 0 x20 N/A,2/4 Disabled Disabled present 00:e0:8e:88:02:00 0 EPM04B-SFP passed 0 x20 N/A,25,ONU,注册失败故障处理,3,、,启用管理状态,通过以下命令启动,OLT,端口:,telnetBBS1000(config-t-if-olt-module/port)#no shutdown,4,、检查,LTM,模块的,LED,确保,OPR LED,为绿色。,5,、重新激活,OLT,端口和光纤参数,telnetBBS1000(config-t-if-olt-module/port)#shutdown,telnetBBS1000(config-t-if-olt-module/port)#no shutdown,26,ONU,注册失败故障处理,6,、检查系统鉴权设置,种认证方法:本地认证和,radius,通过,show pon-sys,命令查询系统认证设置,,ONU,逻辑端口设置,local-authentication-Local sla authentication,lport-strict-binding -Local logical port strict binding,sla-synchronization-Local sla sync with radius server authentication,vlan-id-base -Configure vlan id base for SLA,若采用,Radius,服务器认证,则需正确设置,ONU,用户名与密码,并且,ONU,的逻辑端口号与相应的,ONU,用户名密码一一对应;,若采用本地认证,则设置本地认证启用;,27,上连口故障,故障现象:,业务不通,上连口物理和协议状态为,down,故障处理:,硬件方面检查,包括,LED,、光纤、光模块、与对端设备之间的距离,软件方面检查,包括自协商、,no shutdown,、,ping,命令、查看二层三层接口状态等操作,28,二层转发故障,故障现象:,BBS1000,配置成二层,数据不能正常转发,不通。,注:数据转发是根据目的,MAC,地址、,VLAN ID,、还有端口号,进行转发,如果找不到相应的转发端口,系统自动丢弃数据包,29,二层转发故障处理,通过命令进行查询,BCM,的,MAC,地址表,telnetBBS1000(config-t)#sho mac-ad,Interface Vlan Static LAG-Group GroupID MAC address,-,ge1/1 104 dynamic No -00:00:00:00:00:01,ge3/1 104 dynamic No -00:00:00:00:00:20,ge1/1 104 dynamic No -00:00:00:00:00:08,30,二层转发故障处理,通过命令查询,PAS,芯片的,MAC,地址表,telnetBBS1000(config-t)#show interface epon-olt mac-address-table,Record OLT LPort ONU id LLID VID Mac_Address Type,-,1 1/1 1 1 1 101 00:00:00:00:00:01 Dynamic,2 1/1 1 1 1 101 00:00:00:00:00:08 Dynamic,3 1/1 1 1 1 101 00:07:ba:34:bd:e8 Dynamic,4 1/1 2 2 2 102 00:07:ba:34:bd:e1 Dynamic,5 1/1 3 3 3 103 00:07:ba:34:bd:eb Dynamic,6 1/1 4 4 4 104 00:07:ba:34:bd:b1 Dynamic,注:,如果源和目的,MAC,地址位于同一个,EPON,接口下,系统不会转发;,31,三层转发故障处理,故障现象:,BBS1000,工作在三层状态,数据不通,故障处理:,检查路由表是否存在正确的路由:,show ip route,如果目的,IP,地址位于某直连接口下,检查,MAC,表,,host-route,表以及,arp,表是否正确,:,show mac-address-table,show host-route,show arp,如果目的,IP,地址不属于任何直连接口下,查看对端设备是否设置正确,查看三层接口的物理状态和协议是否为,UP,32,组播业务故障处理,33,组播业务故障处理,故障现象,1,:,IGMP,组成员列表没有生效,故障处理:,检查,IGMP,的配置,确认组播功能已经添加到相应的端口上,并且,IGMP,协议已经使能,通过使用命令,show ip igmp interface,显示客户,super-svi,接口与源接口是否都参与,IGMP,功能,通过使用命令,show ip igmp snooping vlan super vlan id,确认,IGMP Snooping,是否在,super vlan,口下使能,确认,IMGP,组成员报告中是否包含正确的组成员列表,使用,ping,工具,确认用户是否能,ping,通用户网关,因为,super-svi,不支持自动,ARP,学习,因此我们需要配置静态的,ARP,列表,或者是,host-route,核对,IGMP,组列表是否加入到组条目中,34,组播业务故障处理,故障现象,2,:,组播流量不能转发到客户端,故障处理:,确认,IGMP,组条目是否存在,如果,IGMP,组条目不存在,请参考故障处理,1,检查,IGMP,的配置,确认在源端口上已经打开,igmp-proxy,功能,确认源端口发过来的组播流量包含客户端所需要的组,使用,ping,工具,验证客户端是否能,ping,通源接口,检查,ARP,列表里是否存在源接口和客户端口的,ARP,列表,检查源接口静态信息,确认组播流量已经正确地加入到设备中,35,组播业务故障处理,故障现象,3,:,ONU,接收到的组播信息不是它所需要的组播组流量,故障处理:,检查,ONU,接收的组播流量信息,确认此组播流量的地址是否是,ONU,所需要的,在当前,ONU,下,使用命令,multicast-enable,打开组播过滤器,确认,ONU,不再接收与其无关的组播组流量,36,组播业务故障处理,查询命令参考:,show ip igmp groups,显示,IGMP,组成员列表,show ip igmp debug-tracesIGMP,访问学习,show ip igmp snooping vlan super_vlan_id,显示,super vlan,是否起用了,IGMP snooping,功能,show ip igmp interface,显示加入组播进程的接口以及相关参数设置,show ip igmp statistics vlan|total,显示,IGMP,包的统计信息,备注:,我们暂不支持二层的,IGMP Snooping,功能,ONU,不能当作组播源的端口,37,上网不正常故障,故障现象,网吧用户反馈一会可以上网,一会有不能上网。,处理:检查,BBS1000,的运行,,ONU,注册,,MAC,地址学习是否正常。重新绑定,onu.,设置绑定有效。,38,密码丢失故障处理,断电重启,在系统启动倒计时处敲回车中断,进入,VxWorks Boot,提示状态;,VxWorks Boot:c,/,对参数进行修改,boot device:flash,unit number:0,processor number:0,host name:host,file name:bbs1000plus.stz,inet on ethernet(e):192.168.103.205:ffffff00,host inet(h):192.168.103.145,gateway inet(g):0.0.0.0,user(u):epon,ftp password(pw):epon,flags(f):0 x0=0 x8000,/,修改程序启动指针,target name(tn):bbs1000plus.st,other(o):motfcc,VxWorks Boot:,/,继续程序加载过程,39,密码丢失故障处理,系统启动后将直接进入,shell,命令行提示状态:,-flashFsFormat 1,/,格式化文件系统,Retrieved old volume params with%100 confidence:,Volume Parameters:FAT type:FAT16,sectors per cluster 2,2 FAT copies,0 clusters,20 sectors per FAT,Sectors reserved 1,hidden 0,FAT sectors 40,Root dir entries 512,sysId(null),serial number 76d4b9,Label:.,Disk with 10240 sectors of 512 bytes will be formatted with:,Volume Parameters:FAT type:FAT16,sectors per cluster 2,2 FAT copies,5067 clusters,20 sectors per FAT,Sectors reserved 1,hidden 0,FAT sectors 40,Root dir entries 512,sysId VXEXT1.1,serial number 76d4b9,Label:.,value=0=0 x0,-flashFsSync 1,/,文件系统同步,恢复初始设置,value=0=0 x0,-,40,密码丢失故障处理,断电重启,BBS1000,,在系统启动倒计时处敲回车中断,进入,VxWorks Boot:,提示状态;,VxWorks Boot:c,/,对参数进行修改,boot device:flash =motfcc,/,改用,FTP,启动,unit number:0,processor number:0,host name:host,file name:bbs1000plus.stz =bbs1000plus.st,/,跟改启动文件名,inet on ethernet(e):192.168.103.205:ffffff00,host inet(h):192.168.103.145,gateway inet(g):0.0.0.0,user(u):epon,ftp password(pw):epon,flags(f):0 x8000=0 x0,/,修改程序启动指针,target name(tn):bbs1000plus.st,other(o):flash,VxWorks Boot:,/,继续程序加载过程,41,密码丢失故障处理,系统启动后,用默认用户名和密码登陆即可:,Username:admin,Password:,BBS1000,enable,BBS1000,#,注意:,该方法会导致配置文件,程序文件,以及所有,flash,和,nvm,上存储的文件丢失;故密码恢复后,还需要重新下载程序文件和配置文件到相应目录下,再更改启动设备为,flash,即可。,42,故障处理小结,1.,明确,BBS1000,的配置,,2.,了解,BBS1000,的网络中的位置,3.,了解故障的范围,时间、频率,4.,抓包,在终端处和上连设备处,5.,结合的版本特点,配置情况,故障现象和抓包等条件分析故障,找出故障原因,解决故障。,43,Q&A,Q&A,44,The end,Thank you,!,
展开阅读全文