资源描述
5G网管性能问题分析手册
概述
现在全省县城及以上区域已全方面开展5G网络布署工作,除了从日常测试与投诉中发觉网络存在“点、线”问题,还需要从想娶性能上发觉面上问题,从而使得NSA网络正常运行,保障5G网络用户体验感知。
与传统LTE网络一样,需要从“接入性”、“移动性”、“保持性”以及“小区数传能力”几个维度进行性能问题分析定位。
接入性:SCG添加成功率;
移动性:SCG修改成功率、SCG变更成功率、锚点切换成功率;
保持性:SCG异常释放率;
小区数传能力:小区下上下行感知速率。
一、 小区接入性能问题
NSA组网小区,终端接入5G网络情况主要从“SCG添加成功率”来表现,主要包括流程以下(LTE打点以及NR侧打点):
包括指标:SCG添加成功率
计算公式:
LTE侧:上图1
L.NsaDc.SgNB.Add.Succ / L.NsaDc.SgNB.Add.Att*100%
NR侧:上图2
N.NsaDc.SgNB.Add.Succ/N.NsaDc.SgNB.Add.Att*100%
1.1 NR小区接入包括相关信令流程
1.2 接入问题要求动作
1.2.1 版本配套排查
排查NR、LTE、TUE(CPE)、U、关键网使用版本与推荐版本策略版本一致。
1.2.2 操作日志&告警故障
基站操作,告警和故障日志能够在U和一键式日志内获取,使用FMA能够直接打开,对于操作日志主要排查是否存在影响接入操作,主要判断问题时间点与操作时间点是否存在相关性;对于告警及故障主要查看问题时间点,是否存在相关未恢复告警,如小区不可用、X2接口故障等。
1.2.3 参数核查
1、 NSA DC相关配置,包含NR外部小区、频点,邻区关系是否正确,DC开关是否打开。
2、 X2链路配置是否正确、X2链路数量是否满规格。
3、 同一LTE小区是否存在NR邻区PCI冲突、同一NR站点下是否存在PCI冲突。
4、 NSA终端识别开关、PDCP参数组核查等。
1.2.4 射频通道(发功&上行干扰)排查
上行干扰会影响SRS和PUSCH解调性能,严重影响吞吐率性能。正常情况下底噪在-116dbm左右,干扰跟踪位于M Tracing Monitor->NR->Cell Performance Monitoring.
1.3 接入问题定位思绪
NR接入问题包括4G、5G以及45G接口问题,可见以下思维导图
1.3.1 用户无法接入LTE(锚点)
问题现象:
用户在LTE接入失败有以下两种场景:
1. 用户在LTE不发起接入,从L3 Message窗口看到没有任何UE接入消息
2. 用户在LTE发起Attach被关键网拒绝,从L3 Message能够看到接入LTE后收到NAS消息Attach Reject。
定位方法:
用户接入LTE后,要满足以下条件LTE才能够正常下发5G B1测量控制:
UE能力上报中包含R15UE能力
关键网未禁止该用户NSA能力
UE默认承载QCI未占用LTE专用QCI(QCI 1-5,QCI 65/66)
LTE侧NSA开关、NR邻频点配置正确
LTE小区本身具备NSA能力,部分LTE单板硬件不支持NSA
1.3.2 UE不上报B1测量汇报
NSA用户正常上报B1测量时,会经过RRC_MEAS_RPRT消息中携带5GmeasResultCell-r15来通知LTE。用户不上报5GB1测量结果可能有以下可能原因:
1、B1测量控制中下发频点错误。
2、5G小区状态异常或者AAU发功异常造成用户无法测量到5G。
3、5G SSB受干扰严重造成用户测量不到5G。
1.3.3 LTE收到B1事件后没有发起SgNB_ADD
这类问题需要跟踪基站侧UU口和X2信令联合排查,Uu接口找到5G B1测量上报对应CallId,再到X2接口看是否有该CallId对应SgNB_Add_Req消息,LTE不发起SgNB Add可能有以下可能原因:
1、 LTE邻区配置异常(漏配或PCI冲突)
2、 到目标站点X2链路异常
1.3.4 SgNB_ADD被5G拒绝
一样该问题如1.3.3节所述问题现象也需要基站侧跟踪信令方可发觉,X2接口看到5G收到SgNB_Add_Req后回复SgNB_Add_Reject。
SgNB_Add_Reject消息中会携带原因值,依照原因值能够初步判断可能问题原因:
1、 Transport resource not available: 5G侧传输故障造成接入拒绝,可能链路为当前UE所在LTE基站到5G基站X2-U链路或者5G到关键网S1-U链路
2、 No radio resource available:5G小区用户数License不足,或者5G其余资源异常(比如无可用SRS资源等)
1.3.5 UE未发起空口随机接入
Uu接口看到用户收到携带5G SCG配置RRC重配置消息后,立刻回复SCG_RAIL_INFO消息给LTE,携带原因值为scg-reconfigFailure:
造成重配置失败可能原因有:
1、5G小区搜索失败,这种多半是因为接入小区并非最强小区或者该区域小区间干扰严重造成。
SCG重配置消息中参数在UE侧校验失败,这种情况提议终端工程师共同定位。
1.3.6 空口接入RAR超时(较为常见)
Uu接口看到用户收到携带5G SCG配置RRC重配置消息后,隔一段时间(时间间隔与T304配置关于)回复SCG_RAIL_INFO消息给LTE,携带原因值为ScgAccessFailure或者scg-ChangeFailure;主要排查以下:
1、 接入5G小区并非最强小区或者该区域小区间干扰严重造成
2、 Prach参数等配置异常或者物理层原因造成接入失败
1.3.7 空口接入Msg3失败(较常见)
X2接口看到5G发送SGNB_ADD_REQ_ACK之后一段时间(与Msg3基站侧等候定时器关于,默认是2.1s)发送SGNB_REL_REQUIRED消息,携带原因值为radio-connection-with-UE-lost:
造成Msg3失败可能原因有:
1、 上行TA值异常或者上行有干扰造成Msg3解调失败。
2、 UE或者基站侧参数配置异常造成Msg3失败。
二、 移动性问题
当前省内5G系统采取NSA。NSA架构切换过程包括gNB和eNB交互,且切换过程包括LTE小区切换,和5G小区变更,所以在做移动性问题排查时需要关注下面几个概念:
1、 Pcell:MeNB主小区,是NSA DC终端驻留小区。
2、 PSCell:SgNB主小区,是MeNB经过RRC连接信令配置给NSA DC终端在SgNB上一个主小区,PSCell一旦配置成功即保持激活态。
3、 MeNB:主基站(锚点),是NSA DC终端驻留小区所属LTE基站。
4、 SgNB:辅基站(NR),是MeNB经过RRC连接信令配置给NSA DC终端NR基站。
因为gNB/eNB并不知道UE所处位置和无线质量情况,需要控制UE上报相关无线质量信息来判断,UE上报无线质量信息方式有周期上报和事件上报两种方式,当eNB收到测量或切换事件上报时,会下发切换命令给UE,UE收到切换命令后,中止与源小区交互,按切换命令要求切换到新目标小区,并经过信令交互通知目标小区,以完成整个切换过程。
包括指标:SCG修改成功率(4G侧发起+5G侧发起)、SCG变更成功率(changge)、锚点切换成功率(NR终端带SN切换成功率)
对应counter计算及打点:
1、NSA PCell用户SCG变更成功率:L.NsaDc.SCG.Change.Succ / L.NsaDc.SCG.Change.Att*100%
A点所表示,当eNodeB收到gNodeB发送SgNB Change Required 消息时,L.NsaDc.SCG.Change.Att累加。B点所表示,当eNodeB向gNodeB发送SgNB Change Confirm 消息时,L.NsaDc.SCG.Change.Succ累加
2、NSA PCell用户SCG修改成功率(4G发起):L.NsaDc.SCG.Mod.Req.Succ / L.NsaDc.SCG.Mod.Req.Att*100%
如图1中A点和图2中B点所表示,当eNodeB向gNodeB发送SgNB Modification Request消息时,则L.NsaDc.SCG.Mod.Req.Att累加;如图1中B点所表示,当eNodeB向gNodeB发送SgNB Reconfiguration Complete消息时, L.NsaDc.SCG.Mod.Req.Succ累加;如图2中C点所表示,当eNodeB向gNodeB发送SgNB Modification Confirm消息时,L.NsaDc.SCG.Mod.Req.Succ累加。
图一:
图二:
3、NSA PCell用户SCG修改成功率(5G发起):L.NsaDc.SCG.Mod.Required.Succ / L.NsaDc.SCG.Mod.Required.Att
A点所表示,当eNodeB收到gNodeB发送SgNB Modification Required消息时,则L.NsaDc.SCG.Mod.Required.Att累加。如图中B点所表示,当eNodeB向gNodeB发送SgNB Modification Confirm消息时,L.NsaDc.SCG.Mod.Required.Succ累加。
4、SgNB Pscell更换成功率(站内+站间):当前未采取该指标,SCG更换成功率使用4G侧统计SCG变更成功率
站内:
N.NsaDc.IntraSgNB.PSCell.Change.Succ/N.NsaDc.IntraSgNB.PSCell.Change.Att*100
站间:
N.NsaDc.InterSgNB.PSCell.Change.Succ/N.NsaDc.InterSgNB.PSCell.Change.Att*100%
5、锚点切换成功率:L.NsaDc.HHO.ExecSuccOut/L.NsaDc.HHO.PrepAttOut*100%
包括站内、X2和S1三个部分对应指标counter求和做分子分母
站内:
站间:X2
站间:S1
2.1 NSA组网下切换流程
2.1.1 NR站内切换
5G空口覆盖或干扰较差造成MSG2没有响应,造成接入失败。如以下案例:
1、 UE把测量汇报发给源eNB:在UU接口表现为RRC MEASUREMENT REPORT信令,源eNB收到测量汇报后,进行相关条件判断,假如决定切换,网络侧将准备相关切换资源(这个过程对UE侧不可见)
2、 eNB 将测量汇报发给gNB:在X2接口表现为RRC Transfer信令
源gNB收到测量汇报后,进行相关条件判断,假如决定切换,网络侧将准备相关切换资源(这个过程对UE侧不可见)
3、 gNB准备切换相关资源发给eNB,X2口表现为SgNB Modification Required信令
4、 源eNB下发切换命令:在UU接口表现为RRC CONNECT RECONFIG信令,包含NR RRC配置消息(NR切换命令)。
5、 UE接收到RRC重配置消息后完成重配置,并向MeNB反馈RRCConnectionReconfigurationComplete 消息,包含NR RRC响应消息。若UE未能完成包含在RRCConnectionReconfiguration 消息中配置,则开启重配置失败流程。
UE成功完成重配后,MeNB向SgNB发送SgNB Modification Confirm 消息
6、 UE收到切换命令后,中止与源gNB(小区)交互,并尝试接入目标gNB(小区),这个过程称为随机接入过程。
2.1.2 NR站间切换
1、 UE把测量汇报发给源eNB:在UU接口表现为RRC MEASUREMENT REPORT信令
2、 eNB 将测量汇报发给gNB:在X2接口表现为RRC Transfer信令
源eNB收到测量汇报后,进行相关条件判断,假如决定切换,网络侧将准备相关切换资源(这个过程对UE侧不可见)
3、 源gNB判断是站间切换,SgNB收到MR后进行切换目标小区选择、准入和资源准备后假如允许切换,会给LTE发送SgNB Change Required消息,包含目标SgNB ID信息,SCG配置信息(支持增量配置)和目标SN测量结果。
4、 MN经过SgNB添加流程请求目标SN为UE分配资源,包含与从源SN接收到目标SN相关测量结果。假如需要转发,则目标SN向MN提供转发地址。
5、 MN触发UE应用新配置:MN向UE发送重配置消息RRCConnectionReconfiguration,包含目标SN生成RRC配置信息。UE跟新配置后向MN回复消息RRCConnectionReconfigurationComplete,包含对目标SNRRC响应消息。若UE未能完成包含在RRCConnectionReconfiguration 消息中配置,则开启重配置失败流程。
假如目标SN资源分配成功,则MN释放源SN资源。假如需要数据转发,则MN向源SN提供数据转发地址。源SN接收到SgNB Change Confirm消息后停顿向UE发送数据,并向目标SN开始转发数据。
6、 假如UE回复重配置完成,则MN经过SgNB Reconfiguration Complete消息通知目标SN UE重配完成,包含NR RRC响应消息。
7、 UE在目标SN随机接入。
8、 数据转发开始。数据转发最早能够在SN收到SgNB Change Confirm消息时候。
9、 MN发起承载修改流程。源SN在收到UE Context Release消息后能够释放空口资源及控制面相关资源,数据转发不受影响。
2.1.3 LTE(锚点)切换(站内&站间)
NSA场景下4G小区切换完全遵照4G only处理。NSA下4G小区站内切换前,下发切换命令前需要先进行SgNB Mod流程。
NSA下4G小区站间切换,4G目标站会先请求添加gNB,然后回复Ho Req ACK给4G源站。
2.2 切换问题排查要求动作
2.2.1操作、故障和告警排查
基站操作,告警和故障日志能够在U和一键式日志内获取查看。
告警重点关注列表以下:
告警ID
告警名称
告警级别
告警影响
ALM-29841
NR小区不可用告警
主要
告警小区不能提供业务。
ALM-29840
gNodeB退服告警
主要
产生告警双工模式下全部小区无法提供业务。
ALM-29842
NR小区闭塞告警
主要
告警小区不能提供业务。
ALM-29844
NR分布单元小区不可用告警
主要
产生告警NR分布单元小区不能提供业务。
ALM-29870
NR分布单元小区TRP不可用告警
主要
产生告警NR DU小区TRP不能提供业务。
ALM-29871
NR分布单元小区TRP服务能力下降告警
主要
产品告警NR DU小区TRP所属小区提供给客户可用无线空口能力会下降。
基带检测到NR DU小区TRP上行业务数据不一样时时,概率出现用户接入异常。
ALM-29800
gNodeB X2接口故障告警
主要
基站将无法继续支持与对应基站间EN-DC业务。
ALM-29204
X2接口故障告警
主要
邻基站类型为gNodeB,基站将无法继续支持与对应基站间EN-DC业务。
ALM-25888
SCTP链路故障告警
主要
造成SCTP链路上无法承载信令。
ALM-25889
SCTP链路拥塞告警
次要
因为发送缓冲区被耗尽,无法继续发送数据,造成业务中止。
ALM-25955
SCTP链路目标地址不可达告警
提醒
假如SCTP链路配置两个目标IP地址均无法与本端通信时,将会造成基站业务中止。
ALM-29810
gNodeB Xn接口故障告警
主要
基站释放正在经过产生告警Xn接口进行切换用户,在该告警恢复前,基站将无法继续支持与对应基站间Xn接口切换流程。
ALM-29815
gNodeB NG接口故障告警
主要
基站将释放已经接入该异常NG接口上全部用户。假如小区没有状态正常NG接口,基站能够激活小区,但新用户将无法接入到这些小区。
ALM-29816
gNodeB NG控制面传输中止告警
紧急
同一运行商下全部承载gNodeB NG接口SCTP链路(链路个数不少于2条)状态都异常,造成基站同一运行商下全部gNodeB NG接口无法建立成功,用户无法入网。
EVT-29811
gNodeB Xn接口复位事件
提醒
基站主动释放正在经过Xn接口切换全部在网用户,对应切换流程将失败。
EVT-29817
gNodeB NG接口复位事件
提醒
依照复位消息中复位类型释放NG接口下全部在网用户,或指定部分在网用户。
ALM-29201
S1接口故障告警
主要
对于“S1接口闭塞”原因引发故障,该S1接口不允许接入新用户(包含正常接入、系统内站间切换入和系统间切换入用户);但对已经接入用户消息、非用户相关消息无影响。对于其余原因,基站将释放已经接入该异常S1接口上全部用户。假如小区没有状态正常S1接口,非调测态下,基站将去激活小区;调测态下,基站能够激活小区,但新用户将无法接入到这些小区。
ALM-29213
基站S1控制面传输中止告警
紧急
基站同一运行商下全部承载S1InterfaceSCTP链路(链路个数不少于2条,且不包含IOPS特征使用S1InterfaceSCTP链路)状态都异常,造成基站同一运行商下全部S1接口无法建立成功,小区无法建立,用户无法入网。
2.2.2 参数核查
按照统一下发NR性能小区基线参数进行基础参数配置核查站点基线参数是否正常。
2.2.3 干扰排查
上行干扰会影响PRACH和PUSCH解调性能,从而影响切换。提议排查一下上行干扰情况,干扰跟踪位于U Tracing Monitor->NR->Cell Performance Monitoring:
2.2.4 关键网异常排查
与关键网侧确认,排查问题时间点附近关键网侧是否有操作。
当切换小区处于关键网辖区边界场景,站间切换准备失败问题场景,站间切换执行成功率比站内切换执行成功率差时要重点关注。(站内切换不包括关键网,只有站间切换包括到关键网)
分析方法:
1、站间切换准备存在FailOut.AMF原因失败。
2、Ng切换场景,假如切换入准备请求话统小于切换出准备请求话统,或者切换出准备失败大于切换入准备失败,很可能是关键网没有转发切换准备相关消息或者回复失败。
3、X2和Xn切换存在PATH SWITCH流程失败。
以上三种场景都怀疑关键网存在问题,然后经过跟踪TOP站点标口信令深入明确问题详细场景(比如关键网没有回复目标站PATH_SWICHT_ACK或者回复PATH_SWICHT_FAIL)。
2.3 切换问题定位思绪
NSA切换信令流程,包含NR站内,NR站间,LTE切换,整理切换过程中出现在UU口,X2口,S1口异常流程定位思绪。
2.3.1 UU口信令异常原因分析与优化
2.3.1.1测量控制丢失
通常在UE接入并添加NR辅小区后,或者NR辅小区切换后会下发测量控制。NR测量控制信源结构与LTE类似,分为测量对象、上报配置以及测量ID配置。NR测量控制经过LTE空口重配置消息带给UE,基本机制与LTE相同。
1)邻区问题:未配置任何5G邻区
//查询NR外部邻区(NR站内切换时不需要查询),确认有没有配置。
LST NREXTERNALNCELL:
//查询NR邻区关系,确认有没有配置。
LST NRCELLRELATION:
2)外部小区配置SSB频点错误:
可经过:MO NREXTERNALNCELL进行查询修正,查看是否与规划数据一致。
3)信道受限:
下行DCI资源分配失败,基站无法调度给UE下发测量控制消息。
PDSCH信道拥塞,基站无法及时发送测量控制消息。
4)信道质量:
依照SSB RSRP/SINR判断下行信号质量差(比如SSB SINR在0dB以下),可能造成UE无法接收到测量控制消息。
2.3.1.2测量汇报丢失
每个NRMR有两条,一条显示Direction为Ms->gNodeB,一条显示Direction为Ms->eNodeB。NSA场景下UE不会直接与gNodeB进行RRC连接,第一条MR(Direction为Ms->gNodeB)实际是工具自己解析结果,实际表示是UE内部消息传递(5G UE将MR发送给4G UE),第二条MR(Direction为Ms->eNodeB)才是LTE空口实际发送MR,能够跟网络侧进行比对。出现测量汇报丢失问题通常以下:
1) 信道受限:
下行DCI资源分配失败,基站无法调度给UE下发测量控制消息。
PDSCH信道拥塞,基站无法及时发送测量控制消息。
2) 覆盖较差:
服务小区和邻区信号RSRP差值
排查NRCELLRELATION,小区偏移量,Ocn
排查GNBMEASCOMMPARAMGRP,RSRP偏置和幅度迟滞,RsrpOffset和Hys
依照A3事件计算是否满足门限
3) 终端异常:
假如终端侧log查看到有测量到服务小区和邻区信号已经满足切换门限,不过未上报MR,则怀疑终端侧可能存在内部异常。需要联络终端侧排查。
2.3.1.3切换命令RRC Conn Recfg消息丢失
当基站侧判决满足切换条件后会下发切换命令,经过LTE空口发给UE,空口就是一条RRC重配消息。
1) 信道受限,包含PDCCH/PDSCH
2) 覆盖较差
3) eNB或gNB切换判决失败,或内部异常
这类问题通常为外部配置错误造成,当外部小区NREXTERNALNCELL中PhysicalCellId配置错误,造成测量汇报上报后源侧找不到外部邻区,不会发起切换。
2.3.1.4切换完成RRC Conn Recfg Cmp消息丢失
这类问题除了PDCCH/PUSCH信道受限及覆盖质差以外原因,还可能为终端未响应发送重配完成消息。
2.3.1.5 gNB随机接入失败
该部分问题排查思绪可参考章节(一)小区接入性能问题。
2.3.2 X2口或Xn口信令异常原因分析
2.3.2.1 锚点基站内部异常
经过MML命令或告警查询,查看锚点本身站点是否存在告警异常。
2.3.2.2 X2口传输异常
能够经过告警和故障日志判断,也能够查看话统L.X2.Unavail.Dur.Sys(系统原因造成X2链路不可用时长,指标ID=)是否存在异常。经过网管查询锚点与目标GNB站点之间X2配置是否正常。
2.3.3 S1口或Ng口信令异常原因分析
2.3.3.1 SgNB切换判决失败(漏配邻区或PCI冲突)
//查询NR外部邻区,确认有没有到目标小区gNBId,CellId和PCI。
LST NREXTERNALNCELL:;
//查询NR邻区关系,确认有没有到目标小区gNBId和CellId。
LST NRCELLRELATION:;
假如查询到SgNB配置NR外部邻区中存在相同PCI,则需要找网规人员确认是否规划或开站脚本配置错误。
2.3.3.2 Ng口传输异常&SgNB内部异常
能够经过告警和故障日志判断是否存在异常。
三、 保持性问题
当前5G组网方式下5G掉线触发机制有两种,终端触发与基站触发。终端侧掉话有两类,第一类是直接收到网络侧释放5G命令(RRCConnectionReconfiguration里nr-Config-r15下面携带release)。第二类是终端先上报SCGFailureInformationNR,然后再收到基站下发释放指示。这种场景是UE检侧到某种异常后主动申请释放。 SCGFailureInformationNR消息里会携带原因值,例以下面示例表示上行RLC达成最大重传次数:
网络侧触发可能是5G侧发起释放(5G在X2口给4G发SGNB_REL_REQUIRED),也可能是4G发起释放(4G在X2口给5G发SGNB_REL_REQ)。
3.1要求排查动作
3.1.1告警与操作排查
告警排查:
排查掉线时间前后是否存在以下告警。需要注意,因为告警有平滑机制,告警出现时间可能在掉话时间点之后。
告警编号
告警名称
对掉话影响
ALM-29800
gNodeB X2接口故障告警
NSA组网时造成传输掉话
ALM-29815
gNodeB NG接口故障告警
SA场景造成基站释放在线用户;
ALM-29816
gNodeB NG控制面传输中止告警
SA场景造成基站释放在线用户;
ALM-29840
gNodeB退服告警
基站释放全部在线用户;
ALM-29841
NR小区不可用告警
释放小区下全部在线用户;
ALM-29842
NR小区闭塞告警
人为闭塞造成释放小区下全部在线用户;
ALM-29843
NR分布单元小区模拟负载开启告警
造成空口干扰大,误码高,产生空口掉话;
ALM-29844
NR分布单元小区不可用告警
释放小区下全部在线用户;
ALM-29870
NR分布单元小区TRP不可用告警
释放小区下全部在线用户;
ALM-29871
NR分布单元小区TRP服务能力下降告警
空口能力下降,在小区边缘等弱覆盖区域轻易掉话;
ALM-26521
射频单元接收通道RTWP/RSSI过低告警
小区解调性能变差,在小区边缘等弱覆盖区域轻易掉话;
ALM-26520
射频单元发射通道增益异常告警
当发射功率过大时,造成越区干扰;当发射功率过小时,造成覆盖空洞。
ALM-26529
射频单元驻波告警
驻波造成小区覆盖收缩;严重时可能造成基站自动关闭发射通道;
ALM-26527
射频单元输入功率异常告警
造成射频单元承载业务质量变差,覆盖边缘用户可能掉话
ALM-26260
系统时钟不可用告警
基站业务处理会出现各种异常,包含和周围站点相互干扰,造成误码,切换失败等
操作日志排查:用于掉线指标之前正常,日后恶化情况:
数据源
分析方法
闭环动作
操作日志
1、查找之前正常到现在有问题这一段时间内是否有修改,添加,删除,闭塞,激活以及去激活操作。
2、MOCN场景关注是否有多运行商相关操作,如修改传输、License等。
3、FMA工具能够将告警日志,故障日志和操作日志关联。
1、确认操作是否可回退,观察操作回退后指标是否有改进。
2、分析告警和设备故障对掉话率带来影响,依照故障&告警处理帮助进行告警清零。
3、确认是否外部事件造成,需要观察容量和负载情况并及时通知二线。
4、完成排查后确认问题是否处理。
外部事件分析
1、了解出现问题时,周围网元是否有操作,局方是否有新终端公布/放号、套餐变更和网络结构变动等。
2、了解出现问题时,掉话趋势转折点附近是否有重大活动,比如,节假日,球赛,游行等。
3、MOCN场景关注问题运行商新终端发放、套餐变更、传输变动、邻区覆盖优化等。
3.1.2参数排查
常见影响掉话以下,实际操作时参考进行全方面检验。
参数名称
推荐值
对掉话影响
UE不活动定时器
20
该参数越小,话统掉话率越低;对于单点演示测试场景,提议改成0,防止因为短时内无业务时触发基站正常释放,误认为是掉话。
PSCell A2事件RSRP触发门限值
-121
假如该参数设置过高,当RSRP低于该参数时会造成gNodeB发起正常释放,让测试人员误认为是掉话。
上行时间对齐定时器
INFINITY(无穷大)
该参数表示UE上行时间对齐定时器长度,该定时器超时,则认为UE上行失步;NSA组网下会上报NRSCGFailure造成掉话;设置为无穷大能够防止出现TA超时掉话,不影响TA同时性能。
TA发送周期
3
假如UE移动速度越高,该参数需要取值越小才能确保定时性能,不然可能造成掉话,不过消耗空口资源会增加。
RRU发射功率
不一样RRU模块最大发送功率不一致,依照详细模块和网络规划,优化提议进行配置;对于极近场景,依照实际接收RSRP调整,RSRP不超出-60dbm。
功率过大,在极近场景可能造成功率饱和,解调性能下降造成掉话;功率过小,对于室外拉远场景,造成弱覆盖掉话。
用户周期SRS带宽切换门限
45
该参数假如配置过小,比如低于30,会造成UE在小区边缘不缩减SRS带宽,基站测量到SRS信号较差,无法准确测量TA并进行定时调整,移动场景下轻易掉话。
双DCI调度开关
和TUE配合使用
假如基站和TUE配置不一致,那么会造成TUE下行DCI解不到,RLC AM模式下,下行达成最大重传,从而造成掉话。
PDCCH RateMatch开关
OFF
19A不支持,打开会造成基站处理异常,从而掉话
SSB RateMatch开关
OFF
19A不支持,打开会造成基站处理异常,从而掉话
UE AM模式最大重传次数
MAXRETRANS_THRESHOLD_T32(32)
配置UE上行RLC最大重传次数,假如配置过小,NSA组网下达成最大重传次数,UE会上报NRScgFailure造成掉话。
gNB RLC最大重传次数
MAXRETRANS_THRESHOLD_T32(32)
配置gNodeB下行RLC最大重传次数,假如配置过小,达成最大重传次数会造成5G基站发起RLC Reset掉话。
UE状态汇报禁止定时器
不分流场景:保持默认 分流场景:MS20
UE在AM模式下两次状态汇报发送间隔最少要大于该定时器。假如设置过大,轻易造成基站发送窗口满,造成下行RLC Reset掉话
下行RLC序列号长度
BITS18
假如DlPdcpSnSize配置18bit,而DlRlcSnSize配置12bit,在状态汇报反馈不及时情况下,轻易造成发送窗口满,造成下行RLC Reset掉话。
gNodeB AM模式触发Polling字节数门限
保持默认
假如配置无穷大,且DlRlcSnSize为12bit时,在下行近点full buffer业务时,轻易出现基站发送窗口满造成下行RLC Reset掉话
gNodeB触发PollingPDU个数门限
保持默认
假如配置无穷大,且DlRlcSnSize为12bit时,在下行近点full buffer业务时,轻易出现基站发送窗口满造成下行RLC Reset掉话
3.1.3高误码排查
假如掉话是5G基站发起释放,且携带原因是UE LOST;或是因为UE上报SCGFailure,携带原因值是rlc-MaxNumRetx或randomAccessProblem。
排查方法:
需要排查空口信号质量和干扰;假如误码不高,则需要经过CHR或cellDT深入分析是否RLC层窗口滑动有问题,或者是上层信令解码失败,或者完整性校验失败。
3.1.4覆盖和干扰排查
1、假如是RSRP较差,确认测试点和天线距离,是否有遮挡等。尝试更换到愈加好点位确认是否依然有掉话。
2、假如发觉干扰较大,排查是否存在邻区信号强于服务小区而没有切换情况。假如邻区信号不满足切换条件,不过强度和服务小区相当,则排查邻区是否做了模拟加载。假如条件允许,尝试关闭周围小区观察干扰是否改进。
3、假如排查干扰来自外部,则开启FFT扫频,观察干扰特征,进行排查处理。
4、假如排除了弱覆盖和干扰,而且掉话是在特定位置点,很可能是该位置点无线环境存在超CP造成符号间干扰等情况,从而造成信令和数据解调失败。能够尝试修改波束模式或数字下倾观察是否能够改进。
3.1.5内部释放原因排查
5G侧发起释放,或终端上报SCGFailure造成释放:
经过呼叫日志分析,明确是空口问题,资源分配问题,还是其它产品内部异常(该内容需要求援厂家使用特定工具解析)。
3.2 掉线问题排查思绪
3.2.1NR覆盖问题造成掉话
覆盖问题主要有弱覆盖,无主导频造成邻区干扰大两类主要场景。对于弱覆盖,假如有终端侧log,能够经过查看终端侧RSRP,假如RSRP低于-120dBm则说明覆盖较差了,轻易造成掉话。此时需要排查掉话点和服务小区距离,是否有遮挡,服务小区是否网络规划预期主覆盖小区。以下所表示,当RSRP低于5GA2门限时(NRCELLNSADCCONFIG.PscellA2RsrpThld,默认-121),UE会上报测量汇报造成gNodeB发起释放。这个释放属于正常释放,不会统计为掉话。
以下这次掉话,UE没有上报测量汇报,RSRP绝对强度不算尤其差,不过突然收到网络侧释放命令。从终端侧能够看到有两个邻区比服务小区好,其中一个瞬时RSRP高5dB了。在邻区干扰下,SSB SINR只有-3,频偏-123也比较大。该位置多个邻区信号强度波动大,强度和服务小区相当,无主服务小区,需要先处理RF问题。
3.2.2 5G干扰问题造成掉话
干扰是常见一个造成掉话原因,造成掉话现象有多个,以下行RLC达成最大重传次数,上行RLC达成最大重传次数,SR达成最大次数,TA超时等等。干扰类别有很多,比如切换不及时造成邻区干扰,TDD系统环回干扰,时钟偏差造成小区间干扰,还有外部干扰等。掉话分析主要是先确认是否因为干扰造成,然后才是确认干扰源和排除干扰。
查看标口跟踪,是5G侧发起释放。携带原因值是Radio-connection-with-UE-lost。
经过基站FFT频谱扫描,能够观察小区干扰情况,确定是否干扰造成:
3.2.3 5G配置问题造成掉话
常见配置问题主要有:漏配邻区造成无法切换掉话;RLC参数配置不合理,造成状态汇报不能及时上报,造成RLC重传达成最大次数掉话;SRS自适应门限设置不合理,造成远点SRS带宽不能切换到窄带,基站测量SRS信号较弱,无法准确测量TA造成掉话;A2门限配置过高,造成UE没有到小区边缘就被正常释放。在要求动作“参数核查”这一步就能够发觉参数造成问题。
3.2.4 5G切换失败造成掉话
切换失败主要场景是UE向目标小区随机接入失败。移动拉网测试过程中,一个是5G小区间切换;还有一个是NSA组网下,LTE发生切换,5G服务小区即使不改变,不过UE需要做一次随机接入,这个过程也可能出现失败。(详细排查思绪可参考移动性问题排查思绪章节)
3.2.5 传输故障造成掉话
当标口信令跟踪里看到释放命令携带原因值是transport-resource-unavailable时,说明是传输故障造成掉话。首先要排查是否有传输相关告警。需要注意假如GTPU静态检测开关(GTPU.STATICCHK)没有打开,则不会上报传输告警。这时候能够打开开关继续测试观察。或者经过故障日志,CHR,debug等来确认之前掉话原因。传输故障造成掉话通常有两种场景,一个是传输拥塞丢包,造成信令传递失败或时延大。一个是收到关键网GTPU Error,造成基站发起释放。以下:
4G侧信令跟踪发觉,LTE给5G发了SGNB_ADD_REQ消息后,等了6秒才收到SGNB_ADD_REQ_ACK,正常情况下应该只有几十ms。
5G侧信令跟踪看到是收到SGNB_AD
展开阅读全文