资源描述
,山东联通,中兴通讯光网络,ZTE中兴SDH传输产品日常维护与故障分析,一、维护操作,了解例行维护意义,熟悉例行维护项目及维护周期,熟练掌握例行维护,设备维护,维护操作,例行维护,例行维护是对,ZTE,中兴传输设备的工作状态进行定期检查,突发性维护,突发性维护是指因为传输设备故障、网络调整等带来的维护任务,。,突发性维护也称为故障处理,。,维护操作,例行维护,日常例行维护,日常例行维护是指每天必须进行的维护项目。通过日常例行维护项目,可以随时了解设备的运行情况,以便及时发现问题、解决问题。,周期性例行维护,周期性例行维护是指定期进行的维护,通过周期性维护,我们可以了解设备的长期工作情况。如定期查询历史性能、对风扇防尘网定期进行清洗。,维护项目,维护周期,设,备,检,查,项,目,设备声音告警检查,1天,机柜指示灯观察,1天,单板指示灯观察,半天,风扇检查和定期清理,2周,公务电话检查,2周,业务检查,2周,网,管,检,查,项目,登录口令定期更改并记录备忘录,1月,浏览树监视,1天,拓扑图监视,1天,告警监视,1天,性能监视,1天,查询系统配置,不定期,查询用户操作日志,不定期,报表打印,不定期,备份数据,不定期,维护操作,ZTE,中兴传输设备例行维护项目列表,设备的例行维护操作,维护操作,设备声音告警检查,机柜指示灯观察,单板指示灯观察,风扇检查和定期清理,公务电话检查,业务检查,误码测试,登录口令更改,浏览树监视,拓扑图监视,告警设置,查询当前告警,查询历史告警,查询非返回式保护倒换事件告警,性能监视,查询系统配置,查询用户操作日志,报表打印,网管的例行维护操作,维护操作,维护注意事项,维护操作,开局调试步骤,单点调试,设置,NCP,的,IP,地址,网管上创建网元等,检查网元监控,光板等单板自环性能检测,系统调试,连通光路,测试光板的光功率,检查网管对整个网络的监控,全网的业务配置,时钟配置,检查全网的各单板的告警、性能,业务、单板的保护倒换测试,重复说明一下!,设备维护注意事项(一),维护操作,在设备维护中做好防静电措施,插拔单板时要戴防静电手环,避免损坏单板。,插拔单板时要小心操作,不要野蛮插拔。,注意备用单板的防潮处理。,维护时准备好必要的工具,如电缆、尾纤;仪表,如光功率计、,2M,误码仪;安装好网管的便携机。,设备维护注意事项(二),维护操作,光板维护的注意事项,光接口板上未用的光口一定要用防尘帽盖住。,日常维护工作中使用的尾纤不用时,尾纤接头也要戴上防尘帽。,不要直视光板上的光口,以防激光灼伤眼睛。,清洗光纤头时,应使用无尘纸蘸无水酒精小心清洗,不能使用普通的工业酒精、医用酒精或水。,更换光板时,注意应先拔掉光板上的光纤,再拔光板,不要带纤插拔板。,设备维护注意事项(三),维护操作,严禁电源电缆带电安装、拆除。电源线在接触导体的瞬间,会产生电火花或电弧,会对设备造成伤害。在进行电源电缆的安装、拆除操作之前,必须关掉电源开关。,设备加电的顺序,硬件检查,线缆标志检查,闭合头柜的空开,测试空开的输入电压,关闭设备空开,机柜通电,打开风扇开关,检查风扇运行,观察单板运行状态,设备断电的顺序,机柜断电,风扇断电,头柜电源断电,网管维护注意事项,维护操作,网管系统在正常工作时不应退出,退出网管不会中断业务,但会使网管在关闭后失去对设备的监控能力,破坏对设备监控的连续性。,定期更改网管口令以保证其安全性。,定期备份配置数据,以防人为操作失误时,可立即恢复配置数据,实现业务的快速恢复。,不得在网管计算机上安装下载各种游戏软件,以及向网管计算机拷入无关的文件或软件。定期用杀毒软件对网管计算机进行杀毒,防止计算机病毒感染网管系统。,常见告警分析与处理,常见性能分析与处理,熟悉故障处理思路及方法,熟悉各种故障处理原则,了解故障处理的各种流程,熟练掌握例行维护操作,二、故障处理,故障处理,常见告警分析与处理,常见告警分析与处理(一),故障处理,光口接收信号丢失(LOS),原因,光连接不良使接收光功率过低,光接收模块或者对端光发送模块损坏,机房内,从,ODF,架到光板的尾纤损坏,解决方法,用光功率计测试收光功率,是否在光板的接收灵敏度范围内,分别用尾纤自环本端和对端的光板,对长距光板自环时,需加,10dBm,的衰耗器,以确定是本端还是对端的故障,更换光板,更换相应的尾纤,常见告警分析与处理(二),故障处理,帧丢失(LOF),原因,光接收信号不是同等级别信号,如,STM-1,的端口收到,STM-4,的信号,光板故障,本站点的时钟板故障,解决方法,用光功率计测试收光功率,是否在光板的接收灵敏度范围内,分别用尾纤自环本端和对端的光板,对长距光板自环时,需加,10dBm,的衰耗器,以确定是本端还是对端的故障,更换光板,更换时钟板,常见告警分析与处理(三),故障处理,复用段告警指示(MS-AIS),原因,网管在对端光板的发送端强制插入了,MS-,AIS,对端设备是,REG,,,对端的光接收有,LOS,,,LOF,或,OOF,告警,解决方法,在网管上清除强制插入的,AIS,告警,检查对端光收有告警的原因,解决对端光收告警后本端告警自行消失,常见告警分析与处理(四),故障处理,复用段远端缺陷告警指示(MS-RDI),原因,对端设备是,ADM,,对端的光板有,LOS,、,OOF,、,LOF,或,MS,AIS,告警,解决方法,找到对端出现告警的原因并进行相应的处理。对端的告警消失后本端告警自行消失。通常是对端收无光。,常见告警分析与处理(五),故障处理,AU4通道告警指示(AU-AIS),原因,交叉板故障或者光板故障或者光板的光口报,LOS,、,LOF,等,网管在对端强制插入了,AU-AIS,告警,在网管上的时隙配置不正确,两端的光板都自环,并没有上业务,解决方法,检测是网管时隙配置是否正确,通过网管上作环回,以确定故障点。,通过更换光板或者交叉板,在网管上清除对端强插的,AU-AIS,告警,常见告警分析与处理(六),故障处理,再生段(复用段、高阶通道)信号劣化,原因,单板性能不好引起告警,接口连接不良使接收功率或电平过低,解决方法,用仪表测试接收光功率或者接收电平,或者更换单板,或者处理线路故障。,常见告警分析与处理(七),故障处理,2M接收信号丢失(LOS),原因,2M,电接口没有收到信号,2M,电缆没有接好、虚焊、电缆中间断,该支路,2M,接收电路有故障,如被雷击等,与本板对接的设备的,2M,信号发电路有故障,解决方法,通过,2M,电缆自环,判断故障点。若依旧有,LOS,告警,则检查电缆,或者更换该,ET1,板。若自环,LOS,告警消失,则是对端的,2M,发信号有问题,或者对端的发信号的电缆有问题。,常见告警分析与处理(八),故障处理,TU12-AIS通道告警指示信号,原因,时隙配置不正确,从网管上在对端插入了告警,本端或对端光板、支路板、交叉板有故障,解决方法,从网管上根据该告警的来源板,查看来源板是否有告警,以及该来源板的时隙配置是否正确。若该来源板有告警,则先解决该板的告警;或者修改时隙配置。,通过光板的环回或者时隙环回,以确定故障点。,将网管上插入的告警清除,常见告警分析与处理(九),故障处理,TU12指针丢失,原因,对应光板有告警,或对端时隙未配置,从网管上插入了告警,本端或对端,EP1,单板有问,解决方法,从网管上的时隙配置表查找该支路的业务来自于哪个光板,若该光板有告警,则先解决该光板的告警;或者补齐配到对端,EP1,板的时隙,将网管上插入的告警清除,在确认对应光板无告警的情况下,可以将该支路的,2M,业务从另一块好的,2M,单板,B,进行上下,如果单板,B,无告警,则认为源端单板正常,而是本单板有故障,应进行维修;如果单板,B,也有告警,则认为源端,2M,单板有故障,应进行维修办法为对光连接进行检测后插好光纤,保证光连接正确可靠,常见告警分析与处理(十),故障处理,指针调整,原因,本点时钟与相连网元时钟不同步或时钟设置不正确,出现了互抽,可能是时钟板晶体振荡器老化所致,通过临时更改抽时钟的方向,判断是那一块时钟板的故障,然后更换,路径中有网元跟网络时钟不同步,外接设备和或该端口与其它设备对接,解决方法,先处理网络上的,AU,指针再处理,TU,指针,检查有,AU,指针调整的网元,看是否跟相连网元有互抽现象或不同步,更改时钟配置,更换,PWCK,统一让对方抽我们时钟或统一使用外时钟,故障处理,常见性能分析与处理,常见性能分析与处理(一),故障处理,物理接口性能事件及处理,性能事件概述,2M,,,34M,,,45M,和,140M,物理接口的性能通过,CV,来实现,,CV,是编码违例的简称,是针对电信号编码进行的检测。,ZXSM-600(V2)设备的2M,34M和45M信号采用HDB3码,140M信号采用CMI码,当设备检测到信号编码有误时,会上报CV。,常见性能分析与处理(一),故障处理,物理接口性能事件及处理,产生原因,不同速率电信号产生CV的原因相似,以最常用的2M信号为例,其原因包括,支路板本身的接口部分性,在拔插接口电缆的瞬间,支路端口会产生轻微的,CV,计数,电缆的焊接或压接质量不良,如果几乎所有的支路都上报,CV,,,原因可能是交换设备、传输设备没有共地,电缆质量不好,常见性能分析与处理(一),故障处理,物理接口性能事件及处理,设备影响,CV,值比较小,,15,分钟内有几个或没有,,24,小时内零星上报,对业务不会有影响,CV,值,15,分钟内较大,而且是持续的增加,业务可能受影响,出现话音噪声或数据乱码,严重可导致业务中断。,突发式出现的很大的,CV,值,瞬间中断业务,常见性能分析与处理(一),故障处理,物理接口性能事件及处理,处理方法,隔离交换设备和传输设备,分别用误码仪测试相应的净传输通道,确定,CV,上报源是交换设备还是传输设备。,如果,CV,上报源是传输设备,断开该通道的业务连接,通过网管查找上报,CV,的网元,定位故障点,根据不同的产生原因有以下处理方法:,如果由于,2M,支路板的接口部分性能造成,通过硬件环回可以判断,一般通过更换支路板可以解决。,如果由于电缆连接质量不良导致,应重新焊接或压接电缆,避免接触不良。,如果由于电缆质量造成,应更换电缆,对于接地不良造成的,CV,,,通常是由于不同厂家的设备业务接口地线设计不同导致。解决办法是重新做地线,也可以考虑在发端芯线串联一个电容,电容可以使用容量为,0.1u1u,的钽电容。,常见性能分析与处理(一),故障处理,物理接口性能事件及处理,注意事项,在设备机房,要求配线架外壳接保护地,保护地的接地电阻小于1,直流工作地的接地电阻小于1,接地线要求抗干扰性能强。,如果,CV,上报源是交换设备,可以根据交换设备的用户手册处理,也可借鉴传输设备的处理方法。,在设备正常运行时,用户可以在空闲的传输通道接入误码仪进行,24,小时测试,挑选出几条性能良好的传输通道备用。在突发大量,CV,时,可以将业务倒换到备用通道传输。,常见性能分析与处理(二),故障处理,再生段性能事件及处理,性能事件概述,再生段性能事件通过再生段开销字节B1实现,B1字节采用8个比特作为奇偶校验,B1字节在接收端网元进行检测和终结,不向下一网元传递。,常见性能分析与处理(二),故障处理,再生段性能事件及处理,产生原因,外部原因:光纤接头不清洁或连接不正确,光纤性能劣化、损耗过高。,设备原因:光板收发光模块、时钟板及时钟质量不好。,人为原因:使用网管软件在再生段进行了插入误码操作,并且未删除。,常见性能分析与处理(二),故障处理,再生段性能事件及处理,设备影响,零星小误码,规律性较强,每,24,小时有几次或几天一次或连续,平均每个误码秒,1,个,BBE,。,该误码一般不产生低级别误码,对业务影响很小。,大误码,规律性较强,每,24,小时有几次或几天一次,平均每个误码秒最少,5,个,BBE,,,偶尔伴有瞬间帧失步告警(持续,56,秒)和,OFS,计数,导致,B2,,,B3,误码,所有业务都有影响,尤其对电视业务会有短暂玛赛克或停帧,但对电话或数据业务,用户一般察觉不到。,突发连续大误码,上报性能超值告警,伴随帧失步告警,系统不可用时间开始,业务频繁瞬断。,常见性能分析与处理(二),故障处理,再生段性能事件及处理,处理方法,首先将本端设备的线路光接口自环,适当调节光纤插入深度,若告警消失,则是由于光功率过强或过弱引起。,如果光功率过强,应在线路中加入衰减器调节。,如果光功率过弱,应清洗尾纤后重新连接,或更换光发功率强的光模块。,如果是光板或时钟板所致,应更换相应单板。,如果在网管软件中插入误码所致,应在网管中删除此误码,并将命令下发。,常见性能分析与处理(三),故障处理,复用段性能事件及处理,性能事件概述,复用段性能事件由复用段开销,B2,,,K1,,,K2,字节实现。,K1/K2,字节用于,MS-PSD,和,MS-PSC,性能事件,,B2,用于复用段误码的监视。,复用段误码采用,3,个,B2,字节共,24,比特作为奇偶校验,,B2,字节在接收端网元进行检测和终结,同时向发送端网元发出对告信息,不向下一网元传递。,只有处理复用段开销的网元设备才处理B2字节,因此中继设备(REG)对B2字节不作任何处理,直接发至下一网元。分插复用器(ADM)和终端复用器(TM)均将B2终结、重新发起校验记数,并将B2的对告消息回送至发送端网元。,常见性能分析与处理(三),故障处理,复用段性能事件及处理,说明,“对告信息”是由收端回送给发端的信息,以便发端了解收端的收信情况。以B2字节为例,其对告信息字节为复用段开销中的M1字节,即复用段远端误码块指示字节。收端网元检测到B2后,将性能值存入M1字节回送至发端网元,发端网元检测M1后,上报相应数值的B2远端性能数值(FEES/FEBBE/FESES/FEUAS)。,常见性能分析与处理(三),故障处理,复用段性能事件及处理,产生原因,B1,误码导致,B2,误码,此时产生的原因同,B1,误码。,光板损坏。,使用网管软件在复用段进行了插入误码操作,并且未删除。,网络中有复用段倒换事件发生。,常见性能分析与处理(三),故障处理,复用段性能事件及处理,相关影响,B2,误码较少时,对系统的影响不大,当性能持续劣化以至于误码超过性能门限时,上报性能超值告警。,如果网管同时上报帧失步告警和,B2,性能超值告警,对于配置有复用段保护的网络将进行复用段倒换,,MS-PSD,和,MS-PSC,开始计数。倒换正常时,,MS-PSC,计数为偶数,倒换恢复时,,MS-PSD,统计时间清零,等待下次倒换重新计数。,常见性能分析与处理(三),故障处理,复用段性能事件及处理,相关影响,如果,B2,误码随,B1,误码出现,应首先解决,B1,误码。,如果在网管软件中插入误码所致,应在网管中删除此误码,并将命令下发。,当网络中发生复用段倒换事件时,如果,MS-PSC,倒换计数为奇数,首先检查网络中是否出现,NCP,板拔板或故障、光口自环、保护关系配置错误、,APS,被暂停、,APS-ID,不一致、倒换控制命令上下不一致、保护光板对之间无法正常传递,K,字节等情况。如果存在,应首先解决以上问题,如果没有,通过给复用段环中各点下发复位,APS,命令解决。,常见性能分析与处理(四),故障处理,高阶通道性能事件,性能事件概述,高阶通道性能事件通过高阶通道开销,B3,实现,,B3,字节负责监测,VC4,在,STM-N,帧中传输的误码性能,使用,8,个比特对高阶通道作为奇偶校验。,B3,字节由通道的始端网元发起,在通道中经过的,ZXSM-600(V2),设备中透传,不进行处理,在整个通道的终端网元进行终结。,B3误码的对告字节为高阶通道开销G1。G1将通道终端状态和性能情况回送给VC4通道源设备,从而允许在通道的任一端或通道中任一点对整个双向通道的状态和性能进行监视。网元的B3 BBE/ES/SES/UAS与对端网元的B3 FEBBE/FEES/FESES/FEUAS伴随产生。,常见性能分析与处理(四),故障处理,高阶通道性能事件,产生原因,外部原因:光功率过强或过弱。,设备原因:光板、时钟板或交叉板损坏。,人为原因:使用网管软件在高阶通道进行了插入误码操作,并且未删除,说明,B3,误码通常伴随,B1,,,B2,误码的产生而产生。,常见性能分析与处理(四),故障处理,高阶通道性能事件,相关影响,B3,误码较少时,对设备影响不大。,当性能持续劣化,,B3,误码超过其门限值时,上报,B3,误码性能超值告警,通道传输质量下降。,常见性能分析与处理(四),故障处理,高阶通道性能事件,处理方法,首先检查是否存在,B1,和,B2,误码,如果有,处理,B1,、,B2,误码。,如果不存在,B1,和,B2,误码,在上报,B3,误码的通道中寻找,B3,误码的起点,解决起点的,B3,误码后,沿通道寻找下一个新的,B3,误码起点,如此类推,直至全部解决。,如果在网管软件中插入误码所致,应在网管中删除此误码,并将命令下发。,常见性能分析与处理(五),故障处理,指针调整性能事件,性能事件概述,在,SDH,帧结构中,利用特定位置的若干个字节来记载,SDH,帧中数据信息的起始位置,即利用这些字节表征数据信息的相位,这些字节就是指针。,当网络处于同步工作状态时,指针用于进行同步信号之间的相位校准,当网络失去同步时,通过指针调整,校准频率和相位,由于各种信号所携带的网元时钟快慢不一,指针调整分为正指针调整和负指针调整。指针调整字节在接收端网元进行检测和终结,不向下一网元传递。,常见性能分析与处理(五),故障处理,指针调整性能事件,在SDH的复用映射过程中,包括AU-4,TU-12,TU-3三种指针:,AU-4,指针位于,SDH,帧结构中第,4,行的头,9,个字节,用于确定,VC,在,AU,帧中的起始位置。,TU-3,指针位于,TUG-3,帧中,共有,9,个字节,用于确定,VC3,在,TU-3,中的起始位置。,TU-12,指针共,3,个字节,用于确定,VC12,在,TU-12,中的起始位置。,常见性能分析与处理(五),故障处理,指针调整性能事件,产生原因,外部原因:时钟失锁,时钟锁定质量不高,或长期运行后时钟板、光板损耗过大。,设备原因:时钟板、光板故障,对于,TU-3/TU-12,而言,支路板故障也是产生指针调整的原因。,网管原因:人工执行强制倒换命令未解除、时钟源配置有误等。,说明:,AU4,指针调整能够导致,TU3,或,TU12,指针调整事件的发生。,常见性能分析与处理(五),故障处理,指针调整性能事件,处理方法(1)处理AU4指针调整事件,如果时钟处于失锁状态,应检查时钟是否发生倒换,如果没有发生倒换,可能是由于光板、时钟板故障或长期运行的损耗造成,应更换相应板件。,如果时钟发生了倒换,应检查时钟源配置是否有误,尤其注意数据配置、时钟源等级配置、抽时钟源配置以及时钟倒换规则设置是否正确。,如果时钟源配置无误,应检查倒换后的时钟源是否存在硬件故障,如果存在应更换相应硬件单板。,如果外时钟处于失锁状态,也可按照步骤,1,3,寻找故障点并解决。,如果是时钟锁定质量不高造成的指针调整事件,可能是光板、时钟板故障或长期运行的损耗造成,应更换相应板件。,常见性能分析与处理(五),故障处理,指针调整性能事件,处理方法(2)处理TU3指针调整事件,如果,TU3,指针调整事件与,AU4,指针调整事件同时存在,应首先解决,AU4,指针调整的问题。,如果由于,34M,电支路板(,ET3,),或,45M,电支路板(,TT3,),故障导致,应更换相应板件。,常见性能分析与处理(五),故障处理,指针调整性能事件,处理方法(3)处理TU12指针调整事件,如果,TU12,指针调整事件与,AU4,指针调整事件同时存在,应首先解决,AU4,指针调整的问题。,如果由于,2M,电支路板(,ET1,),故障导致,应更换相应板件。,故障处理思路及方法,故障处理流程,故障处理,故障定位的原则,故障处理,在定位故障时,应先排除外部的可能因素,如光纤断、交换故障或电源问题等,再考虑传输设备的问题。,在定位故障时,要尽可能准确的定位出是哪个站的问题,再将故障定位到单板。,线路板的故障常常会引起支路板的异常告警,因此在故障定位时,先考虑线路,再考虑支路。,在分析告警时,应先分析高级别告警,再分析低级别告警。,故障定位的基本思路,故障处理,工程问题,外部原因,操作不当,设备对接问题,设备原因,故障定位的常见方法,故障处理,观察分析法,测试法,拔插法,替换法,配置数据分析法,更改配置法,仪表测试法,经验处理法,排除故障的一般思路,故障处理,查看,询问,思考,动手,通信类故障处理方法(一),故障处理,通信故障泛指通道中断或存在误码的故障,还未判断是交换侧或传输侧的问题;在交换侧和传输侧均存在业务中断、误码超值、时钟同步等故障。,故障原因,传输设备侧或交换机侧的故障导致通信业务的中断或者大量误码产生。,故障处理,发生故障后,启动备用通道保证现有通信业务的正常进行。,在交换设备和传输设备连接的,DDF,架上通过硬件环回的方式准确定界和定性故障:确定究竟是传输侧故障还是交换侧故障。,如果定位在传输侧,进行传输故障的分类。,判断种类后,按照相应的故障处理流程排除故障。,通信类故障处理方法(一),通信故障处理流程,故障处理,通信类故障处理方法(二),故障分类流程,故障处理,通信类故障处理方法(三),故障处理,业务中断故障处理方法(一),故障原因,外部原因:供电电源故障;光纤、电缆故障。,操作不当:由于误操作,设置了光路或支路通道的环回;由于误操作,更改、删除了配置数据。,设备原因:单板失效或性能劣化。,故障处理,业务中断故障处理方法(二),业务中断类故障流程图,故障处理,业务中断故障处理方法(三),故障原因,外部原因:供电电源故障;光纤、电缆故障。,操作不当:由于误操作,设置了光路或支路通道的环回;由于误操作,更改、删除了配置数据。,设备原因:单板失效或性能劣化。,故障处理,业务中断故障处理方法(四),业务中断类故障流程图,故障处理,业务中断故障处理方法(五),处理流程,通过测试法,逐级挂表环回来定位故障网元。,通过测试法定位出故障网元后,可通过观察设备指示灯的运行情况,分析设备故障。,同时分析网管的告警和性能,根据故障反映出来得到告警和性能定位故障单板并加以更换。这一过程可结合使用拔插法和和替换法。,注意:环回操作要遵循由低到高的原则(低阶通道,高阶通道,复用段),对业务的影响小。,故障处理,业务中断故障处理方法(六),逐级环回,故障处理,业务中断故障处理方法(七),常见故障及分析 业务不通,同时网管上报光信号丢失告警,检查光纤情况,检查光纤的槽位是否接错。,检查光线路板的收光功率,测试是否收发光不正常,调整光接口,观察告警是否消失。,检查上一点的的光线路板收发光情况,测试是否收发光不正常,调整光接口,观察告警是否消失。,如经过以上检查后,告警仍未消失,按照业务中断故障处理流程将光线路板自环检测定位故障点并解决故障。,注意:当两站点过近时,必须添加衰减器。,故障处理,业务中断故障处理方法(八),常见故障及分析 业务不通,同时无任何告警,检查业务不通的站点之间是否被做环回,如果光线路板之间存在环回,取消环回并正确连接即可。,如果没有环回存在,按照业务中断故障处理流程将光线路板自环检测定位故障点。,确定故障光线路板,判断该板收发故障。因为当某块光线路板收不到光信号,同时自己也检测不到故障时,该光线路板可能不会告警,对端光线路板也无远端接收故障告警。,故障处理,业务中断故障处理方法(九),常见故障及分析 光板发光功率正常,但业务中断。,检查与此两点间的光缆。,检查对端光板的光缆是否插好,灵敏度是否正常。,检查时隙配置,并确认下发到,NCP,的配置与网管配置一致。,故障处理,业务中断故障处理方法(十),常见故障及分析 2M业务不通。,查看业务不通的,2M,业务的数量,如果数量很多,应首先考虑为光路问题。,如果单个或几个,2M,业务不通时,检查时隙配置是否正确,并在网管中执行下载命令将正确的时隙配置数据重新下到支路板上。如果支路仍然没有信号,复位支路板,若没有其他硬件问题的话,告警会消失。,如果业务仍然不通,按照故障处理流程对,2M,支路进行终端侧自环并挂误码仪检测。如果误码仪,2M,电信号丢失告警不消失,则判定原因可能是,2M,接口板的接口不好、,2M,线断或配线架同轴头未焊好,可更换接口解决;如果误码仪告警消失,则问题出在,2M,接口板或交叉板或背板上,可更换,2M,接口板或交叉板解决问题。,如果故障点为与其他厂家对接的,2M,接口板,可能是由于接地存在压差。解决办法是消除压差。,故障处理,误码类故障处理方法(一),误码的处理要根据严重程度选择处理时间,如较为严重,则需立即处理,如不严重,则可保持现状,等到业务量少时(如傍晚)再处理。,故障定位所采用的诊断手段,要遵循安全第一的原则。尽量缩小影响范围,尽量缩短影响时间。这里所描述的一些方法,有的只适合于工程调试其间使用,需斟酌。,故障处理,误码类故障处理方法(二),故障原因,外部原因:光纤接头不清洁或连接不正确;光纤性能劣化、损耗过高;设备接地不好;设备附近有强烈干扰源;设备散热不好,工作温度过高。,设备原因:交叉板与线路板、支路板配合不好;时钟同步性能不好;单板失效或性能不好等。,故障处理,误码类故障处理方法(三),定位故障点,查询故障网元的性能,如果网管上有,B1/B2,的性能,说明光路不好。,检查故障网元的性能,如果网管上没有,B1/B2,,,只有,B3,的性能,说明高阶通道不好,问题可能在交叉板或支路板上,可以通过网管的交叉板控制操作来倒换交叉板定位故障单板。另外,B1,、,B2,、,B3,也与时钟板有关。,检查故障网元的性能,如果网管上只有,V5,的性能,表示低阶通道不好,说明支路板故障。可以通过改配时隙到临近网元下支路的办法或,AU,环回的办法来定位是本端还是对端支路板故障。,故障处理,误码类故障处理方法(四),处理流程,采用测试法,环回挂表,对误码的发源地进行定位。,如果是线路板误码,分析线路板误码性能事件,排除线路误码。,首先排除外部的故障原因,如接地不好、工作温度过高、线路板接收光功率过低或过高等问题;然后观察线路板误码情况,若某站所有线路板都有误码,推断为该站时钟板问题,更换时钟板;若只有某块线路板报误码,则可能是线路板问题,或对端光板或两端光纤的问题。,如果是支路板误码,分析支路板误码性能事件,排除支路误码。若只有支路误码,则可能是支路板或交叉板的问题,应更换支路板或交叉板。,注意:传输维护人员必须仔细分析性能,通过分析,B1/B2/B3/V5,等,SDH,基本开销的含义和发生机制,查找故障单板,杜绝未加分析便对故障网元进行关电重启或换板操作。,故障处理,时钟同步类故障处理方法(一),故障原因,外部原因:光纤接反;外时钟质量问题。,操作不当:时钟源配置错误,出现同一组网中两个时钟源的情况;时钟源级别设置错误;时钟对抽。,设备问题:线路板故障,提供时钟质量不好;时钟板故障,提供的时钟源质量不好;交叉板故障,给各单板分配的工作时钟质量不好。,故障处理,时钟同步类故障处理方法(二),处理流程,故障处理,时钟同步类故障处理方法(三),处理流程,检查网管的时钟配置,避免时钟对抽的人为故障现象,并将正确的时钟配置下发至,NCP,板,保持网管数据与,NCP,数据的一致。,通过网管检查光路和支路是否有,AU PJE/TU PJE,的性能值。如果只有,TU PJE,,,说明该支路板故障,更换即可。,如果,AU PJE/TU PJE,同时存在,先处理,AU PJE,,,处理后如果还有,TU PJE,,,继续处理,TU PJE,。,故障处理,时钟同步类故障处理方法(四),常见故障及分析 网管上报指针调整超值告警,由于在时钟失锁及时钟锁定的状态下,都会产生指针调整。因此,如果发现指针调整,应首先检查时钟锁定状态是否正常,如果不正常,首先应解决时钟失锁问题。,时钟失锁,外时钟配置站点的时钟失锁,时钟锁定质量低,故障处理,时钟同步类故障处理方法(五),常见故障及分析 网管提示时钟源故障,外接设备造成,连接该站点的对方时钟板没插。,光线路板故障造成。首先检查时钟源配置,下载时钟配置,复位时钟板。,本端时钟源丢失造成,检查时钟源,故障处理,网管连接故障处理方法(一),故障原因,外部原因:供电电源故障,如设备掉电、供电电压过低等;光纤故障,如光纤性能劣化、损耗过高等。,操作不当:私有协议网管,ECC/DCC,配置有误。,设备故障:网卡故障、光板故障、时钟板故障、网元有大量的性能数据上报到网管,造成,ECC,通道阻塞。,故障处理,网管连接故障处理方法(二),处理流程,排除外部原因,如掉电、光纤性能劣化等。,检查网管,ECC/DCC,配置是否有误。,采用测试法,逐段自环定位故障网元。,采用告警分析法对光板、时钟板进行检查。,故障处理,网管连接故障处理方法(三),常见故障及分析 网管无法通过Q口与NCP连接,ping不通NCP但可ping通自己。,通过,NCP,面板上的,F,口与,NCP,连通,上载网元说明库,检查其网元和服务器,IP,地址与网管数据配置是否一致。,检查网线和,AUI,适配器是否正常。,检查网卡是否正常工作。,ping,通自己说明网卡口地址设置正确,,ping,不通,NCP,一般是网卡中断号不正确。检查网卡上的跳线,使其工作在,JUMPER,方式而不是,PNP,方式。,故障处理,网管连接故障处理方法(四),常见故障及分析 网元取NCP时间十分缓慢。,首先,复位,NCP,,,重新下载本点和相临网元的“网元描述数据”,观察是否正常。,此外,当网元连接与实际光纤连接有误时也会导致该现象,需要仔细检查光纤连接是否有问题。,故障处理,公务故障处理方法(一),故障原因,外部原因:掉电、光纤折断等。,操作不当:,OW,配置数据错误。,设备原因:光板、,OW,板故障。,故障处理,公务故障处理方法(二),处理流程,检查光路是否有告警。因为光路不通,公务也不能通。,检查公务电话是否出现故障,可更换电话测试。,检查,OW,板,观察指示灯及网管告警,可采用拔插法、替换法确定开销板是否产生故障。,检查,OW,板的配置。,故障处理,公务故障处理方法(三),常见故障及分析 公务电话打不通、不能听拨号音,查看光线路板有否告警,如果有光信号告警,首先解决光线路告警。,复位呼叫发起点和被叫站点的,OW,板,及二者之间经过站点的,OW,板。,检查各站点的光纤是否按数据配置连接。,检查话机。,更换,OW,板。,故障处理,公务故障处理方法(四),常见故障及分析 公务板全呼不通,检查网管软件是否设置全呼。,复位单板,定位故障板,换板解决。,故障处理,公务故障处理方法(五),常见故障及分析 公务电话有杂音噪声,检查是否公务成环,如果成环,将环回站点设为控制点。,检查光板,如有问题可更换光板。,检查,OW,板,如有问题可更换。,检查话机,如有问题应更换。,常见故障及分析 公务电话无故振铃,此情况多半在实际组网与数据配置的组网方式不同时发生,特别是在缺少光缆时。当缺少的光缆连上后此现象自动消失。,割接准备工作,割接的原则,三、数据割接,数据割接,数据割接,割接准备工作,考察原来使用设备的业务分配,并做业务分配表。,对我司组网所使用的尾纤,标示清楚,并做出每个站点的光纤分配图。如果需要改网,在现场更改光纤出局入局方向或需跳纤,一定要将以前的连接关系和标注逐点核实并录入表格,以前未作标签的一定要补作,要求醒目且易懂;新的连接关系一定要到设备机房核实可达。这些资料要做到现场人员人手一份。,做我司设备时隙分配表,并对每个通道按照所分配的业务进行标识。,测试所有,2M,跳线,并将,2M,跳线布放到基站配线架位置。,布放跳线后,对需要割接的每个,2M,通道进行测试;在基站处环回后没有误码,断开后误码仪有,AIS,。,准备足够的备件,以应付可能出现的问题。,做详细的割接方案以及割接中的注意事项。,数据割接,割接的原则,一切以用户利用为重,切忌经验主义,在制定改网或数据割接方案时,要注意权衡方案的可行性和对用户业务的影响程度,最好是和局方人员一起来完成并确认。,改网和数据割接前一定要确认原有网络的某些关键功能的完善,决不能在假定的基础上制定计划。,重大的改网和数据割接不允许一个技术人员擅自决定,割接方案一定要经过多个维护人员的交叉检查;或者反馈至研究所,由产品研发测试人员进行确认。,中兴通讯版权所有,
展开阅读全文