1、Page,#,HUAWEI TECHNOLOGIES CO.,LTD.,单击此处编辑母版标题样式,英文标题,:32-35pt,颜色,:R153 G0 B0,内部使用字体,:,FrutigerNext LT Medium,外部使用字体,:Arial,中文标题,:30-32pt,颜色,:R153 G0 B0,字体,:,黑体,英文正文,:20-22pt,子目录,(2-5,级,):18pt,颜色,:,黑色,内部使用字体,:,FrutigerNext LT Regular,外部使用字体,:Arial,中文正文,:18-20pt,子目录,(2-5,级,):18pt,颜色,:,黑色,字体,:,细黑体,配色
2、参考方案:,建议同一页面内不超过四种颜色,以下是组配色方案,同一页面内只选择一组使用。,(仅供参考),客户或者合作伙伴的标志放在右上角,.,LTE,日常维护案例介绍,目录,业务类故障处理,设备类故障处理,-,传输类,设备类故障处理,-,射频类,设备类故障处理,-,硬件更换类,传输类故障,传输类故障处理,类别,常见问题现象,传输类典型问题,信令终端,/,吞吐量异常,上层应用链路不通(,SCTP,、,IPPATH,、,OMCH,),IP,冲突、路由错误等导致业务异常,VLAN,错误、,ARP,异常导致链路不通,光纤,/,光模块故障,物理端口连接不良,光电模式协商不正确等导致物理链路不通,传输类故障
3、传输故障处理思路,总体思路:分层,/,逐段排查定位,分层法:根据协议层,逐层定位,定位出实际故障点;,逐段法:完成故障隔离,对数据流进行分段,逐段环回,逐段定位;,具体排查项:,物理层故障排查,ARP/IP,层故障排查,IPPATH,异常处理,SCTP,异常处理,问题定界指导:,传输类故障,传输故障逐层排查方法简介,协议层,常见问题现象,L5,信令终端,/,吞吐量异常,L4,上层应用链路不通(,SCTP,、,IPPATH,、,OMCH,),L3,IP,冲突、路由错误等导致业务异常,L2,VLAN,错误、,ARP,异常导致链路不通,L1,光纤,/,光模块故障,物理端口连接不良,光电模式协商不正
4、确等导致物理链路不通,排查方法,应用场景,PING,通断检测,+MTU,检测,TRACERT,传输路径排查、,MTU,探测,UDP,环回,检测,S1/X2,链路质量,IP ROUTE,路由排查,排查方法,应用场景,DSP ARP,ARP,表项查询,DSCP/VLAN,DSCP,与,VLAN,优先级映射,抓包,维护通道类故障,维护通道类故障处理,eNodeB,DHCP,站点,2,、自动发现,U2000,Config,Config,Config,S/W,CME,中心机房,Support,网站,1.1,、提取版本包,1.2,、组织配置数据,1.4,、打开开站工具、,上传数据、启动开站,上报,ESN,
5、4,、调测,License,下发,1,、安装上电,3,、自动配置,Config,S/W,限制和约束:,在开站之前,必须:硬件安装完毕,,U2000,调测完毕,,eNodeB,与,U2000,之间的传输正常;,eNodeB,的软件版本必须从,Support,网站上取得,并且已经上传到,U2000 Server,。,1.3,、导出开站列表,DHCP,自发现失败,典型故障,DHCP,自发现失败故障处理,【,实现原理,】,1,、为了避免,DHCP,广播包冲击,U2000,,引入路由器进行,DHCP Relay,,转化为单播报文。,2,、,DHCP,过程目的是实现,eNodeB,的,OMCH,的建立。即
6、获取,IP,、路由等。,2,、,eNodeB,上电后,,4,步完成,DHCP,过程。常见问题需分析具体消息中的取值,DHCP DISCOVER,DHCP OFFER,DHCP REQUEST,DHCP ACK,DHCP,流程:,该流程分四步:,1,)基站在检测到可用的链路后,广播,DHCP DISCOVER,报文,以查找可用的,U2000;,2,),U2000,进行,ESN,匹配,如果匹配成功,,U2000,会发送,DHCP OFFER,报文给,L3,交换机,并携带分配的,IP,地址等信息,以响应,DHCP DISCOVER;,3,),eNB,收到,DHCP OFFER,后,判断,ESN,是否
7、正确,如果正确,则停止,DHCP,探测过程。并发送,DHCP REQUEST,广播报文,向,U2000,服务器发起确认信息,;,4,),U2000,同样需要进行,ESN,匹配判断。确认信息正确后发送,DHCP ACK,报文给,eNB,基站收到,DHCP ACK,报文,进行,ESN,匹配,匹配成功后,分配的,IP,地址等信息生效,并生成,OM IP,和相关路由信息。,维护通道类故障,DHCP,自发现失败故障处理,问题描述,某局点,在站点安装完成并加电后,使用,U2000,进行自开站,发现某站点在发送,OFFER,报文后,在,DHCP,配置管理中一直未出现上报的,REQUEST,报文。,问题,原因
8、在,U2000,抓包,看,,已,收到,eNodeB,上报,REQUEST,报文,但在上报的,REQUEST,中未携带,OPTION54,字段,因此导致该站的,REQUEST,报文被,U2000,抛弃。,同时,,在基站侧镜像抓包后证明基站发送的,REQUEST,报文已携带,OPTION54,字段。,结论:,IPRAN,修改了,DHCP,报文,丢弃了,OPTION54,字段,。,维护通道类故障,VLAN,自学习失败故障处理,问题描述,W,市,T,运营商,LTE,工程在开站过程中,DHCP,四个报文都是正常的,从,U2000,上可以看到已经下发,ACK,消息到基站,且基站也收到,U2000,发送的
9、ACK,消息,但是,ACK,消息之后又重复,DHCP,四个报文,导致基站操作维护链路一直不能建立,1,、首先进行现象确认,,DHCP,过程正常,而,OM,通道建立失败,可能是由于,DHCP,过程中下发的配置有误或者是传输侧配置有误。,2,、其次进行配置核查,结合现象核查,DHCP,下发的配置,,DHCP,下发的主要配置如图所示:核查后发现配置参考与规划相同。,3,、再次进行传输侧相关参数核查,主要是与,OM,通道相关的配置,如,VLAN,,网关,IP,,核查后发现,VLAN,配置与规划不一致,,修改,summary,表中基站的,VLAN,,重新导入,CME,中,重新导出开站数据和开站列表。,
10、开站正常。,处理过程,维护通道类故障,VLAN,自学习失败故障处理,VLAN,自学习:,在,U2000,上创建,PnP,调测任务后,,U2000,周期性向基站发送,OM,通道建立请求。该报文的源,IP,地址为,U2000 IP,地址,目的,IP,地址为基站的,OM IP,地址。此数据包会被发送至基站侧,Relay,的,L3,路由器上,如果,L3,路由器上无对应此报文目的,IP,地址及,eNB OMIP,的,ARP,表项,,L3,设备就会广播,ARP,报文,此时基站则会接收到此,ARP,报文,并从,ARP,报文中取出正确的,VLAN,信息同时进行保存。,重点:基站学习到的,VLAN,是,IPRA
11、N L2,上配置的,VLAN,1,、,DHCP,四个报文中从基站上报的,discover,和,request,报文中的,VLAN,都是从,IPRAN L2,上学习到的,所以基站所发的这两个报文能正常到达,U2000,,而,U2000,也可以把,offer,和,ack,报文发送到基站;,2,、,U2000,给基站下发,ACK,消息后,基站会把从,U2000,上配置的操作维护,IP,、,VLAN,和路由在基站侧生效;,在建立操作维护之前基站会使,用,U2000 ACK,消息中的,VLAN,和,IPRAN L2,上配置的,VLAN,进行对比,如果一致会建立操作维护链路,;如果不一致则把从,ACK,消
12、息中获取到的,IP,,路由及,VLAN,全部失效,重新启动,DHCP,流程,案例根因:,传输类案例,传输引起的开站失败案例,问题现象,某局点,在进行开站时,发现从,U2000,上看,每次开站时都是进行到,99%,时,失败,。,排查,步骤,1,、首先进行现象确认,从,U2000,开站界面上可以看到基站已完成了版本下载、配置下载,在进行激活配置后等待站点重新启动完成时超时。,2,、其次进行配置核查,版本能够下载成功,说明,ESN,无误,,VLAN,、,IP,和路由没有问题,复位后,OMCH,建立失败,可能原因是版本和配置文件激活失败,或激活成功后,OMCH,通道建立失败。核查结果版本与配置文件匹配
13、没有问题,端口模式,/VLAN/IP/,路由配置均无误。,3,、再次进行传输侧相关参数核查,发现,ATN,的端口协商模块为强制(实际要求为自适应),改为自适应后,开站成功。,eNB,路由器),M,2000,下载软件,下载配置,激活配置,激活软件,基站复位重启,复位后,,U2000,以新配置登陆站点,此处失败,目录,业务类故障处理,设备类故障处理,-,传输类,设备类故障处理,-,射频类,设备类故障处理,-,硬件更换类,射频类故障,射频类故障处理,1,2,3,RSSI,外部干扰,互调,驻波,CPRI,接口,电调天线故障,射频类故障,RSSI,故障处理,RSSI,过低,RSSI,不平衡,RSSI,
14、过高,RSSI,RSSI,理论值,带宽,FDD,dBm,TDD,dBm,20M,-98,-97,15M,-99,-98,10M,-101,-100,5M,-104,-103,3M,-106,-105,1.4M,-110,-109,1,通道衰减值检查,互调干扰检测,2,方法,1,方法,2,1,、记录空载时的,RSSI,值;,2,、通过,ADD CELLSIMULOAD,加载模拟负载;,3,、在,U2000,跟踪,RSSI,差值是否大于,4dB,。,1,、通过,STR RFTEST,进行反向,互调,干扰检测;,过低告警门限为,-114dBm,空载下,RSSI,的计算方法如下:,-174+10*lo
15、gBW+NF,其中,BW,为带宽,单位为,Hz,,,NF,为射频模块的噪声系数,通常为,2-2.5,左右,举例:,LRRU 2.6G 2T2R,,,5MHz,小区带宽,那么空载下的,RSSI,参考值大小,=-174+10*log(5*106)+2.5=-104.5dBm,。,RSSI,过高:,标准要求不超正常值,6dB,;因此,20M,:,RSSI=-92dBm,,,15M,:,RSSI=-93dBm,3,频谱扫描,OK,NOK,射频类故障,RSSI,故障处理,先按要求进行后台单站测试,加载和不加载的时候,RSSI,差值大于等于,4dBm,的定义为,内部干扰,(,工程质量问题和互调问题),,需
16、安排站处理恢复;,如果,RSSI,值高于,-,92dBm,,排除测试方法、驻波、射频通道告警等问题后,就可以认为“,疑似存在外部干扰,”,需要网优人员上站扫频;,如果客户扫频扫不出干扰,作为重点问题,由客户及网优,产品人员一起上站去排查处理;,如扫频扫出干扰,处理干扰问题;,RSSI,异常情况,现象,产生的主要可能原因,RSSI,过低,主(分)集长时间,RSSI,低于,-114dBm,左右,或出差,RSSI,过低告警,天馈各个接头接触不好,天馈、,TRX,、,CDU,、功放故障,RSSI,过高,主(分)集长时间,RSSI,高于,-92dBm,或在一定时间内高于,-92dBm,开关和跳线错误,天
17、馈驻波、硬件故障、接头进水、系统工作不正常和互调、外部干扰,RSSI,主分集差异过大,主(分)集两者间,RSSI,长时间或在一定时间内相差,6dB,以上或出现,RTWP,接收不平衡告警,天馈驻波、天线安装问题、硬件故障、外部干扰,备注:主分集,RSSI,均偏高且基本一致,优先考虑外部干扰问题;主分集,RSSI,只有一个偏高,且相差较大,优先考虑互调问题。,射频类故障,互调问题,处理,目前商用的互调测试仪都只能测试天馈系统的互调大小,无法定位出互调故障点的位置,在这种情况下,业界最成熟也是广泛采用的互调故障点定位方法是“分段排查法”。,或者使用“替换法”,逐段馈线检查替换。,“分段排查法”如下图
18、所示:,“分段排查法”的意思就是:依次把左图的,4,个地方断开,接入低互调负载,添加下行模拟负载,观察,RTWP/RSSI,是否抬升,以判断互调干扰的引入点。,例如:断开,1,,接入低互调负载,添加下行模拟负载,,RTWP/RSSI,无变化,说明载频模块,OK,;断开,2,,接入低互调负载,添加下行模拟负载,,RTWP/RSSI,显著抬升,说明下跳线是引入互调干扰的故障点,依次类推。,或者使用“替换法”,逐段馈线检查替换。,射频类故障,电调天线故障处理,-,电调基本原理,远程电调天线,RET,(,Remote Electrical Tilt,)由天线、远端控制单元,RCU,(,Remote C
19、ontrol Unit,),和,AISG(Antenna Interface Standard Group),控制线缆组成。见图,1,两种连接方式:,RRU/RFU+SBT+RCU,和,RRU+RCU,射频类故障,电调天线故障处理,-,配置步骤,电调天线调测过程,通过网管远程控制:,第一步:设置,ALD,供电开关,MOD RETPORT,(,RRU,直接给,RCU,供电方式)、,MOD ANTENNAPORT,(使用,SBT,或塔放给,RCU,供电方式),第二步:扫描,ALD,设备,SCN ALD,第三步:添加,ALD,设备,ADD RET,第四步:,配置电调天线与,RRU,的对应关系,MOD
20、 RETSUBUNIT,第五步:加载,RET,天线配置数据文件,DLD RETCFGDATA,第六步:校准,RET,天线,CLB RET,第七步:设置,RET,天线下倾角,MOD RETTILT,第八步:查询,RET,天线下倾角,DSP RETSUBUNIT,射频类故障,电调天线故障处理,-,常见电调故障,告警名称,告警原理,告警促发来源,一般原因,备注,电调天线马达故障告警,基站下发,RCU,角度校准或角度调整命令,,RCU,检查到马达故障(,RCU,内部检查)后上报告警给基站,基站收到告警信息后上报,RCU,马达检测失败、马达不在位,马达永久堵转、马达转动时力矩不足或,RCU,内部老化、马
21、达转不动。,RCU,的电压供电不足会导致马达驱动力不足。,RCU,线接触不良(线未拧紧等)或,RCU,线过长,馈线馈线松动、过长都可能导致供电不足。,电调天线数据丢失告警,在电调校准或调整下倾角时,,RCU,读取不到配置文件,上报告警给基站,RCU,未上传配置文件或者,RCU,内部数据文件读取不到,一般解决方案:重新上传配置文件,如果重新上传文件还是有该告警,说明,RCU,内部存储损坏,需要更换,RCU,电调天线未校准告警,在调整,RCU,角度时,如果,RCU,未检测到已校准标识(,RCU,写到自己的存储里面),上报该告警给基站,RCU,新安装的配置文件没有进行校准或已校准的标识丢失,加载的配
22、置文件与,RCU,不匹配,,RCU,软件异常,或,RCU,安装不工艺导致,射频单元,ALD,电流异常告警,RRU,检测,RRU,外接天馈设备的工作电流值异常,基站上报该告警。,RRU,1,)过流告警的可能问题:使用的合路器对直流短路、,ALD,过流告警门限设置不当、多芯线制作不合格、怀疑,ALD,设备故障导致。,2,)欠流告警的可能问题:无,ALD,设备却打开了,ALD,供电开关、天馈上有,BT,,非华为供电线缆连接松动,首先排查后台门限是否设置合理,天线设备维护链路异常告警,RRU,检测与已配置的,RCU,的握手关系,如果无法检测到心跳帧就上报告警。,RRU,RRU,检测与已配置的,RCU,
23、的握手关系中断,RRU,与,RCU,之间链路异常,无法通讯,电调天线运行数据异常告警,基站周期查询,RCU,的实际下倾角值和基站配置文件中保持的下倾角值不一致,基站上报告警。基站可以设置两者之间的误差范围,BBU,配置文件更新,下倾角变化或电调因为动力因素产生下倾角变化,解决方案:重新校准天线后,重新设置下倾角角度,射频类故障,驻波故障处理,1,、驻波告警门限查询,根据工程质量设置告警门限,供日后在线检测驻波。,工程质量驻波,=1.5,,告警门限设置为,2.0.,2,、离线驻波测试,在线驻波测试有一定误差,通常验收时采用离线检测。,执行,STR VSWRTEST,测试,该测试会中断业务。,3,
24、上站排查,首先检查,RRU,和天馈各个组件之间的连接是否有松动或断开现象。,检查,RRU,和天馈的频段是否一致,使用,SiteMaster,的,DFT,测试驻波故障点,射频类故障,CPRI,接口故障处理,CPRI,协议接口定义,CPRI,接口,CPRI,接口,光模块光纤的单双模不一致;,两端设备较近时使用了距离过大的光模块;,光模块故障(对端发送光功率过大),光纤接头或光模块安装松动,或光模块老化。,光纤接头不洁净,存在灰尘等异物。,光模块的型号(单模,/,多模、速率、距离)不匹配。,光纤线路存在弯折、挤压或老化,或光纤线路过长导致光信号出现较大衰减;,光口接收无信号还可能是没有光纤有断点、
25、对端未连接或单板硬件故障;,CPRI,光口故障的可能原因,射频类故障,射频类故障处理案例,-,华为,LTE,基站,RRU,光路异常分析,目前,LTE,基站基本采用,DBS3900,方式组网,因此,BBU,RRU,的光路故障是我们日常维护中最经常遇到的问题之一,这类故障常见的告警包括:,小区不可用告警,BBU,光模块收发异常告警(物理层),BBU CPRI,接口异常告警(链路层),BBU CPRI,光模块,/,电接口不在位告警,BBU CPRI,光接口性能恶化告警,射频单元光模块收发异常告警(物理层),射频单元,CPRI,接口异常告警(链路层),射频单元光模块,/,电接口不在位告警,射频单元光接
26、口性能恶化告警,射频单元光模块故障告警,射频单元维护链路异常告警,射频单元硬件故障告警,告警类别那么多,吓死人了!,射频类故障,射频类故障处理案例,-,华为,LTE,基站,RRU,光路异常分析,其实,没有那么复杂,,BBU,RRU,光路涉及的设备就那么几个,你说能复杂到哪去呢,是吧!下面我们来分析看看。,BBU,和,RRU,尾纤直连,BBU,和,RRU,中间转接光路(,BBU,和,RRU,尾纤接,ODF,架),处理方式:,后台查询,1,、,通知后台查询,BBU,光模块的收发光功率是否正常;,2,、,如果,RRU,没有中断,查询,RRU,光模块的收发光功率是否正常;,通过后台的光功率查询,可以,
27、初步判断故障原因是光衰过大还是链路中断,。,射频类故障,射频类故障处理案例,-,华为,LTE,基站,RRU,光路异常分析,现场排查,(建议携带:光功率计、光模块、短尾纤,),做以下操作前可以先,查看光模块规格是否正确、,拔插光模块、尾纤,查看尾纤头是否有尘灰等,,以下,4,个步骤,基本可以完成故障的排查和处理,其实挺简单的吧?所以不要在检查前随意就换了光模块或者,RRU,哦:,1,、,用尾纤在,BBU,光口环回,和后台确认,BBU,的光模块收发光是否正常,如果正常可以排除,BBU,端口和光模块问题,否则请按顺序更换,BBU,光模块、端口、单板直到环回,BBU,光模块收发光正常;,2,、在,BB
28、U,侧用光功率计测量,RRU,过来的光功率是否正常,如果不正常,检查下一步;,3,、在,RRU,测量,RRU,发出的光功率,如果正常,请检查光路,如果不正常,请按顺序更换光模块、,RRU,端口、,RRU,直至发出的光功率正常;,4,、在,RRU,处测量,BBU,过来的光功率,如果不正常,请检查光路;如果正常,请按顺序更换光模块、,RRU,端口、,RRU,直至正常;,射频类故障,射频类故障处理案例,-1,问题现象,:,上报,ALM-26529,射频单元驻波告警(重要)与,ALM-29243,小区服务能力下降告警,问题分析,:,如果驻波告警后处理开关打开,上报重要级别射频单元驻波告警,将关闭驻波告
29、警对应的发射通道,触发小区服务能力下降告警,此时先处理驻波告警,如果未打开驻波告警后处理开关,则两个告警分别排查。,问题处理步骤,1.,查询驻波告警门限,确认门限配置正确(,LST RRU,,默认驻波门限,2.0,,驻波后处理门限,3.0,),。,2.,离线驻波测试,确认驻波检测的结果确实高,输入小区的下行中心频率,避免天馈组件中存在频段不匹配的组件(如合路器等),导致测试的结果错误。,3.,上站排查,发现驻波异常的通道天馈线缆断开,重新连接好后测试驻波恢复,。,射频类故障,射频类故障处理案例,-,2,问题描述:上报,ALM-26521,射频单元接收通道,RTWP/RSSI,过低告警,问题处理
30、步骤:,确认是否存在,ALM-26532,射频单元硬件故障告警,如果存在按告警帮助处理。,不存在。,2.,排查接收通道衰减配置,如果有塔放,塔放是否正常工作,。,没有使用塔放,且通道衰减为,0,,没有问题。,3.,复位射频单元,复位后不恢复,带备件上站排查。,4.,交换射频单元正常与异常通道的天馈连接。,交换后射频单元未随天馈转移。,5.,更换射频单元后恢复,待返板分析,。,射频类故障,射频类故障处理案例,-,3,问题描述:上报,ALM-29243,小区服务能力下降告警,问题分析:,1.,配置与单板实际支持规格不符:,小区配置的“小区发送和接收模式”大于,RRU,实际支持的规格:,例如配置,2
31、T4R,小区,,RRU,实际只能支持,2T2R,。,RRU,实际支持的规格可以通过查询,RRU,电子标签确认。,2.,小区配置的“小区发送和接收模式”大于,LBBP,实际支持的规格:,例如配置,2T4R,小区,,LBBP,实际只能支持,2T2R,。,LBBP,实际支持的规格可以通过产品文档,硬件描述,确认;,3.,如果是,SFN,小区,由于配置错误或,RRU,不可用导致配置的“,SFN,小区扇区设备数量”与实际可用的扇区设备数量不一致,修改“,SFN,小区扇区设备数量”与实际一致,或解决,RRU,不可用问题。,MOD CELL:LocalCellId=0,MultiRruCellFlag=BO
32、OLEAN_TRUE,MultiRruCellMode=SFN,SectorEqmNum=n;,。,4.CPRI,带宽不足,DSP CPRILBR,查询当前协商到的线速率,将该速率与实际配置所需的,CPRI,速率进行对比,如果小于实际配置所需,CPRI,速率(,CPRI,不压缩场景下,,20M/15M,2T2R CPRI,接口带宽需求为,2.5Gbps,,,20M/15M 2T4R CPRI,接口带宽需求为,4.9Gbps,,具体计算可参考,2013,年,FAQ,:,CPRI,接口速率如何计算),则根据“最大,速率能力”部分的描述判断是,RRU,侧的光模块还是,LBBP,侧的光模块速率过低导致
33、同时可以通过,DSP SFP,确认光模块的详细信息,如果光模块速率正确,但是,协商到的速率小于两侧光模块的速率,则有可能是,CPRI,链路其它故障导致。,射频类故障,射频类故障处理案例,-,3,5.,射频单元发射通道或接收通道关闭,查看是否存在,26259-,射频单元驻波告警、,26545-,射频单元发射通道手动关闭告警、,26532-,射频单元硬件故障告警、,26538-,射频单元时钟异常告警,、,26524-,射频单元功放过流告警,如果存在先排除告警。,注意:在射频单元驻波告警后处理开关关闭(通过,LST RRU,查询)时,不会因为驻波大于驻波比告警后处理门限(默认值,3,)关闭发射通道
34、故此时,不会导致小区服务能力下降告警。,6.CPRI,链路异常,查看是否存在,26230-BBU CPRI,光模块异常告警、,26232-BBU,光模块收发异常告警、,26233-BBU,光接口性能恶化告警、,26234 BBU CPRI,接口异常,告警、,26503-,射频单元光模块收发异常告警、,26504-,射频单元,CPRI,接口异常、,26506-,射频单元光接口性能恶化告警,如果存在先排除告警。,问题处理步骤:,确认小区配置实际单板规格是否支持,小区配置,2T4R,,,RRU3632,,,LBBPd3,单板。,CPRI,未压缩时,,2T4R 20M,小区需要,4.9G CPRI,
35、速率,查看,CPRI,协商结果。,从线速率上确认,,CPRI,速率不足导致小区服务能力下降。,DSP SFP,或,DSP ELABLE,查询光模,块支持的速率,确认为,LBBP,侧使用了,2.5G,光模块,更换光模块告警恢复。,射频类故障,射频类故障处理案例,-,4,问题描述:出现“,电调天线马达故障告警,”和“,电调天线未校准告警,”,华为双频六端口天线替换原,C,网天线并安装华为,RRU3638,,,C,网天线的,RCU,先级联到,LTE,天线的,RCU,上,然后将,RCU,通过,AISG,电缆连接到,RRU3638,。通过网管对站点,3,个小区进行电调数据加载,总显示校准失败,多次校准后
36、出现,3,个小区,LTE,侧电调马达永久堵转现象。,问题分析:,1,、,RCU,马达,硬件故障;,2,、,RCU,的电压供电不足会导致马达驱动力不足。,RCU,线接触不良(线未拧紧等)或,RCU,线过长,馈线馈线松动、过长都可能导致供电不足,3,、,加载的配置文件与,RCU,不匹配,;,射频类故障,射频类故障处理案例,-,4,问题处理步骤:,1,、加载电调数据,显示校准失败,通过,DSP RETPORT,查看端口电流值,均显示正常范围。,2,、,SCN ALD,扫描电调天线,并不存在序列号错误的现象。,3,、删除电调数据,,RST ALD,复位天线设备,复位,RRU,,重新加载数据,仍显示电调
37、未校准。,4,、需上站处理了?但是,3,个小区都出现马达堵转硬件故障的几率很小,则怀疑加载电调数据时绑定,RCU,序列号可能出现,LTE,侧和,C,网侧混淆;则删除数据,将每个小区电调序列号,LTE,侧和,C,网侧互换,重新加载电调数据,加载成功,目录,业务类故障处理,设备类故障处理,-,传输类,设备类故障处理,-,射频类,设备类故障处理,-,硬件更换类,U2000,FDD_LTE,的,UMPT,板故障恢复指导书,在现实,LTE,网络运维中,,基站单板故障不可避免,,LTE,网络没有了基站控制器,其运行配置全部储存在基站上,因此更换主控板时,需要完全更新数据。华为网管集成了,CME,对数据进行
38、管理。,通过,CME Current,区实时同步网元配置的功能,可以实现不需要重新开站而只需要利用已保存的数据完成快速建站,达到更换主控板前的站点状态。,需要在现场,更换单板前,完成,Step1,Step3,步骤工作,否则网管数据可能会被新更换单板数据覆盖,;,1,、,删除即插即用中原来的基站数据,(注意记录基站,ESN,号);,2,、,进入,CME,Current,区,打开,Current,区,,,导出,目标站点的“,即插即用数据,”;,3,、校验完成后,,进入“即插即用”界面,;点击进行重新开站;,4,、,更换主控板,;待开站正常结束;,5,、检查,数据配置,是否与之前相同,及基站各项状态
39、是否正常;,目录,业务类故障处理,设备类故障处理,-,传输类,设备类故障处理,-,射频类,设备类故障处理,-,硬件更换类,业务类故障处理案例,1,问题描述,某,LTE FDD,站点下只能接入一个终端,第二个终端无法连接上。后来更换多个终端,发现有的可以接入,有的则不行,告警信息:无版本:,V100R008C01SPC240,问题分析,:,1.,用户接入类问题,首先排查终端问题,是否只涉及某一类终端。其次确认失败时现象,是否网络无响应,还是已接入无法做业务。,2.,接入失败,要通过信令确认在哪一个阶段被拒绝,是,RRC,阶段还是,E-RAB,阶段。,LTE,系统中的承载如下图所示,业务类故障处理
40、案例,1,问题处理步骤:,1.,通过跟踪可以看到,UE,会给,MME,回复,S1AP_INITIAL_CONTEXT_SETUP_RSP,消息后,等待了,52,秒给,MME,又发送了释放请求,原因为传输资源不可用,。,2.,S1AP_INITIAL_CONTEXT_SETUP_REQ,携带的地址如下,解析后为,10.100.34.68,1,3.,查看告警情况,测试时间段,28,号告警上报情况是正常的。到,10.100.34.68,无异常告警,业务类故障处理案例,1,4,从,CHR,统计可以看到,90%,的掉话都是由于,UEM_UECNT_REL_RECV_GTPU_RESET _BEAR_RE
41、Q,导致,RAB,阶段掉话。这个错误值的含义是,RRC,重建,重配置,GTPU,资源失败。,5.,查看,CHR,日志,选取了多次失败记录看,都指向不同的对端,IP,,有,10.100.34.12/10.100.34.65/10.100.34.34,等等,如下图只是一个举例,说明并不是某一条链路存在问题,所有链路都有问题。再看对应释放时间点的,debug,日志,看到有,GTPU,的,Echo Response,超时记录,以及明显的,IPPATH down,的记录,说明是,IPPATH,链路故障导致对端没有回,Echo Response.,6.,检查传输链路,对所有对端,IP,进行,PING,测试
42、500,字节,20,次包大部分都能,PING,通,,1500,字节基本不能通,调整到,1472,能,PING,通,,1473,字节,PING,不通,说明传输,MTU,存在瓶颈,设置的,MTU,值不满足我们的要求。要求传输更改,MTU,值或者更换传输链路。,7.,由于当前使用异厂家传输,修改,MTU,未协调成功。修改到华为传输下,,ping 1500,字节能通。业务测试正常。,业务类故障处理案例,1,案例中,IPPATH,故障却未上报告警,,IPPATH,故障是否有检测机制,是否会上报告警,?,如果打开了,GTPU,静态检测(,MOD GTPU,),,IPPATH,会通过,GTPU ECHO
43、报文检测业务通道:,检测机制根据配置,MOD GTPU,来定的,默认是,20s,一次,连续,3,次才上报告警。,LST GTPU:,查询,GTPU,配置信息,-,ECHO,帧超时时长,(,毫秒,)=20000,ECHO,帧超时次数,=3,差分服务码,=0,静态检测开关,=,使能,静态检测:,1,分钟检测一轮,,1,分钟定时器超时后,在所有,IPPATH,上发送,GTPU ECHO,检测报文。收到,SGW,应答,检测正常结束。检测不通,等待“,ECHO,帧超时时长”(,MOD GTPU,设置,默认,5,秒)后,发送下一个报文,一共发送“,ECHO,帧超时次数”(,MOD GTPU,设置,默认,
44、3,次),超时后上报“,IP Path,故障告警”(,Link,方式)或“用户面承载链路故障告警”(,End-Point,方式)。,动态检测:只检测有用户承载的,IPPATH,,检测机制与静态相同,检测到故障后不上报告警,会释放对应,IPPATH,上的承载用户。,接入类故障,接入类常见故障处理,当出现终端无信号情况时,首先检查小区是否正常开工,排查基站侧告警;,2.,小区正常后,仍无法搜到网络,则确认终端是否支持,LTE,对应频段、,FDD/TDD,模式;,3.,终端发起,attach,流程后,未发起鉴权就被,MME,拒绝,一般原因为终端在,EPC,侧的开户数据存在异常,需要协调,EPC,配合
45、定位;,4.,终端与,EPC,双向鉴权失败,导致终端被拒绝接入,一般原因为写卡的,KI,、,OP/OPC,与开户的,KI,、,OP/OPC,不一致,该问题需要,EPC,配合解决;,5.,当安全模式流程通过后,终端接入失败分为两种情况:,a.,基站侧发送,release,消息,此时终端不会收到,MME,下发的,Attach Reject,消息;这种情况只能通过基站侧,S1,跟踪,观察失败原因;常见问题为,IPPath,不可用导致;,b.MME,下发,Attach Reject,消息,此时常见原因为终端接入的,TAC,(由,eNodeB,配置),与,MME,侧配置的,TAC,不符。,业务类故障处理
46、案例,2-iphone,终端设置问题导致被叫异常,问题描述,iphone,终端注册,4G,网络,放置到信号好的区域,做被叫经常感知不到,有时候可以接到,主叫侧收到被叫用户忙的录音通知。被叫查看手机时看到有未接来电提醒。,问题处理步骤:,1,、,相同的,iphone,终端现场测试没有复现问题,因此怀疑终端个体问题。从目前来看,这部分投诉都是来自从海外归来的用户。,2,、,海外用户由于时差的问题,经常使用手机设置勿扰模式:,设置勿扰模式,手动启用或者设定时间,功能启用,屏幕锁定时的来电和提醒将被设为静音,并且状态栏中将出现月亮图标。,经过测试勿扰模式导致的现象是:,1,、,设置勿扰模式的手机屏幕未
47、锁定时,来电均能够接收到;,2,、,手机屏幕锁定时,做被叫第一个来电是无法接通的,“主叫侧反馈被叫正在通话中”,打开被叫后看到未接来电提醒;,3,、,手机屏幕锁定时,同一个号码三分钟内第二次来电可以接通(终端侧设置);,所有的投诉现象都是这个设置导致,将勿扰模式关闭后,测试正常。,【,问题现象,】,某局点切换测试,终端,从红星家具城站移动到模范马路站时,,RSRP,信号不断降低,但是始终没有触发切换;,【,问题分析,】,1.,配置检查,从基站配置文件看,已经打开“同频切换开关”,,A3,事,件门限设置合理,满足切换区域的要求;,2.,信令分析,观察,Uu,日志:基站收到终端上报的,Measur
48、ementReport,消息,并发起了,S1 Handover Request,流程,但是收到了,Mme,返回,的,S1 Handover Preparation Failure,消息;,观察失败原因值为,“,Unkown-target-ID,”,业务类故障处理案例,3-,邻区,TAC,配置错误导致切换失败,Page,40,P,【,问题分析,】,检查,Handover Required,消息中信元,发现其携带的,Target-eNB Info,中的,TAC,为,4117,检查目标站配置发现,,该站点实际,TAC,为,6236,【,问题结论,】,修改,TAC,后,切换正常,邻区,TAC,配置错误
49、导致切换失败,切换类故障,切换原理概述与常见故障,切换的过程就是终端在移动过程中与网络连接交互发生变化的过程,简单的图示如下图:,LTE,系统的整个切换过程,完全由网络侧,(,eNB,)控制,所以,eNB,需要监测,UE,所处的无线质量环境,这个过程是通过,eNB,下发测量控制让,UE,在满足一定条件时上报测量报告来实现的:,触发:当前我司,eNB,是采用,A3,事件触发同频切换,主要通过,A2、A4,事件来触发异频切换,切换:,eNB,下发切换命令给,UE,,,UE,收到切换命令后,中断与源小区的交互,按切换到目标小区,判断是否存在切换,,通常以信令为判断依据,,在终端侧,以发出触发切换的测量报告为开始,以切换完成消息为,结束。,切换成功时,从,UE,侧观察表现为,UE,从一个源小区到,一个新的小区(可从,PCI,变化来观察)进行,正常,业务交互,。,如果切换失败,则,大多表现为,掉话、,RRC,重建,等,现象,。常见切换问题:,邻区漏配、切换不及时、弱覆盖,等,导致切换失败,。,切换失败有很多种原因,通常表现在,S1,,,UU,等接口的信令交互出现信令丢失,所以切换问题的,首要定位方法是比对标准流程看是哪里信令缺失了,。,源侧信令,目标侧信令,协作共赢,电信华为,






