资源描述
端到端优化思路
一.PS域业务优化总体思路
业务数据流的正常与否是决定业务质量和用户感知的直接因素,当业务质量出现异常时,必然伴随出现业务流程的异常。数据业务端到端优化,是以监测用户业务流程为核心,通过分析和解决引起业务流程异常的各类因素(如:链路拥塞、参数设置不合理、SP服务器无响应、终端性能问题等),全面提高业务质量和用户感知度。总体优化思路如下图所示:
二.数据来源
1. 业务信令采集
业务信令采集是指结合PS域业务流程与GPRS组网结构,在网络重要逻辑接口通过数据复制的方式对全网用户的业务流程进行监控和保存。如下图所示:
目前,四川移动已在PS域核心网Gn、Gi、Gw接口部署了西塔信令监测系统,用于监测和保存全网用户的业务信令。Gb接口的信令采集由于受组网方式、设备资源等方面限制目前无法实现,需要使用信令仪表进行数据采集和分析。
2. 典型用户投诉
典型用户投诉是指网络中普遍存在的投诉、大客户投诉、疑难投诉,对于此类问题,需要进行重点关注,并组织专家组进行联合分析。
3. 热点地区业务测试
业务热点地区应为具有业务使用量大、无线资源相对紧张、人群较为集中等特点,通过在热点地区进行业务测试,可以即使发现和解决业务使用中出现的各类问题,提高用户感知度,并在一定程度上减少投诉的发生。
三.分析方法
进行数据业务分析时,首先应基于全网业务统计数据和典型业务流程对全网数据业务现状进行统计和分析,确定影响业务成功率的主要状态、影响业务时延的主要网元和设备,然后结合终端分析、无线网络分析、GPRS核心网分析、SP质量分析等手段对影响业务成功率和时延的根本原因进行定位,最终通过网络和设备调整解决问题,提高业务质量和用户感知度。
1. 业务状态分析
目前GPRS业务主要基于WAP和http协议实现终端和网络侧的交互,而WAP和http协议,以及WAP GW都支持通过定义状态码来描述业务状态是否正常,业务成功率分析是指基于全网业务信令对业务状态码进行分析和统计,找出影响业务成功率的主要原因。
Ø http状态码
Status-Code =
"100" ; Section 10.1.1: Continue
| "101" ; Section 10.1.2: Switching Protocols
| "200" ; Section 10.2.1: OK
| "201" ; Section 10.2.2: Created
| "202" ; Section 10.2.3: Accepted
| "203" ; Section 10.2.4: Non-Authoritative Information
| "204" ; Section 10.2.5: No Content
| "205" ; Section 10.2.6: Reset Content
| "206" ; Section 10.2.7: Partial Content
| "300" ; Section 10.3.1: Multiple Choices
| "301" ; Section 10.3.2: Moved Permanently
| "302" ; Section 10.3.3: Found
| "303" ; Section 10.3.4: See Other
| "304" ; Section 10.3.5: Not Modified
| "305" ; Section 10.3.6: Use Proxy
| "307" ; Section 10.3.8: Temporary Redirect
| "400" ; Section 10.4.1: Bad Request
| "401" ; Section 10.4.2: Unauthorized
| "402" ; Section 10.4.3: Payment Required
| "403" ; Section 10.4.4: Forbidden
| "404" ; Section 10.4.5: Not Found
| "405" ; Section 10.4.6: Method Not Allowed
| "406" ; Section 10.4.7: Not Acceptable
| "407" ; Section 10.4.8: Proxy Authentication Required
| "408" ; Section 10.4.9: Request Time-out
| "409" ; Section 10.4.10: Conflict
| "410" ; Section 10.4.11: Gone
| "411" ; Section 10.4.12: Length Required
| "412" ; Section 10.4.13: Precondition Failed
| "413" ; Section 10.4.14: Request Entity Too Large
| "414" ; Section 10.4.15: Request-URI Too Large
| "415" ; Section 10.4.16: Unsupported Media Type
| "416" ; Section 10.4.17: Requested range not satisfiable
| "417" ; Section 10.4.18: Expectation Failed
| "500" ; Section 10.5.1: Internal Server Error
| "501" ; Section 10.5.2: Not Implemented
| "502" ; Section 10.5.3: Bad Gateway
| "503" ; Section 10.5.4: Service Unavailable
| "504" ; Section 10.5.5: Gateway Time-out
| "505" ; Section 10.5.6: HTTP Version not supported
Ø WAP状态码(WTP和WSP)
Tab:WTP Abort Code
Tab:WSP Abort Code
Ø WAP GW自定义状态码
Tab:华为WAP GW- V300R001 Code
2. 业务流程分析
业务流程分析是指针对不同业务状态码以及时延异常的的业务,结合典型业务流程进行分析,找出影响业务状态的网元或设备。
2.1业务成功率分析
针对每类影响成功率的业务状态码,结合业务信令过程进行分析,定位业务流程异常发生的位置。如下所示:
Ø 002 User Canceled Request
通过对002错误的异常业务流程分析发现,导致该类错误的现象是网络侧收到用户主动发起业务中断请求(disconnect)。而导致用户发起业务中断请求的原因可能包括用户行为、终端异常、无线连接异常等,需要结合终端分析、无线网络分析等手段进行问题定位。
2.2业务端到端时延分析
业务端到端时延分析是指根据业务信令的时间戳计算出数据流在各网元或节点所消耗的时延,并以此统计出端到端时延分布的情况,找出时延消耗过大和不合理的网元和设备。分析方法如下图所示:
3. 网络和设备分析
网络和设备分析基本属于传统网络优化范畴,具体内容包括无线网络分析优化、GPRS核心网分析优化、业务网分析优化、终端性能测试分析等,通过网络和设备分析,确定并解决引起业务流程异常的根本原因。
四.解决措施及案例
业务状态和业务流程分析可确定引起业务流程异常的根本原因,针对这些原因,实际优化过程中可以通过网络资源均衡、参数调整、设备算法调整、终端软件升级等具体措施加以解决。
案例介绍:
五.预期输出成果
通过现网业务状态分析,了解全网数据业务的的主要问题和瓶颈;通过业务流程分析和网络设备分析,可以确定并解决确定并解决引起业务流程异常的根本原因。结合以上方法对数据业务进行分析,最终可以活得数据业务状态和网络原因的映射关系,为数据业务优化形成指导和参考。如下表所示:
HTTP/WAP Status Code
Description
Reason
408
请求超时
无线网络(信道)资源不足
002
用户取消请求
覆盖问题导致无线连接中断
500
服务器内部错误
防火墙配置问题导致上传数据超时
504
网关超时
SP服务器未下发数据
六.彩信业务优化补充说明
彩信业务与其他PS域业务相比,存在一定特殊性,集中表现为用户原因对业务成功率的影响比重极大,如4441、4442、2000等错误占彩信端到端错误总数的80%以上,前面所描述的PS域业务优化思路只能够有针对性地解决网络和终端问题,而针对彩信业务,需要单独进行分析。
根据彩信端到端业务现状,目前主要需要对以下问题进行分析:
1. 为什么有那么多彩信终端用户没有提取彩信?—4442错误
2. 为什么部分用户和终端会拒绝接收彩信?—2000错误
3. 为什么会有大量PUSH消息下发失败?—4470错误
4. ……
下面以4442错误为例,说明分析思路和解决措施:
Ø 4442错误分析总体思路
Ø 4442错误常见原因及分析解决建议
序号
原因
分析方法
处理建议
备注
1
用户终端为非MMS终端
(1)在MMSC数据库过滤4442用户对应的手机号码 (2)利用BOSS系统或EADC系统查找号码对应的终端型号
按照集团规范进行停发,并尽可能告知用户停发原因,避免用户投诉
EADC系统为爱立信终端配置智能纠错系统,已在部分省上线使用
2
用户设置手动提取,但未提取彩信
(1)过滤该用户返回的m-motifyresp-ind,查看状态标记是否为“延迟提取” (2)对该类用户进行统计
(1)对该类用户定时下发宣传短信向用户宣传接收彩信免费等信息,并引导用户将彩信提取方式设置为自动提取; (2)PUSH消息二次下发
3
用户欠费停机或未开通GPRS
需要结合BOSS统计,筛选该类问题对应的用户
可以对彩信中心进行改造,增加信令前置机,在其下发PUSH消息前先通过信令前置机到HLR查询用户的状态,这样可以有效提高PUSH下发成功率并规避用户未开通GPRS带来的4442错误。
4
用户无法接入网络,请求未到MMSC
(1)结合用户使用其他WAP业务的信令,定位用户所在区域 (2)用过用户回访了解用户无法提取彩信的地点 (3)结合Gb、Gn等接口信令分析无法接入网络的原因
确认业务异常区域,并加强热点区域的网络优化调整
5
终端异常导致无法提取彩信
(1)通过核心网数据采集,过滤MMS业务失败比例较大的终端型号 (2)统计4442错误占比最大的终端型号
对典型终端进行测试分析,定位终端原因
展开阅读全文