收藏 分销(赏)

软件开发文档:XX公司大数据平台需求规格说明书-TAS.docx

上传人:唯嘉 文档编号:9958751 上传时间:2025-04-14 格式:DOCX 页数:70 大小:6.15MB
下载 相关 举报
软件开发文档:XX公司大数据平台需求规格说明书-TAS.docx_第1页
第1页 / 共70页
软件开发文档:XX公司大数据平台需求规格说明书-TAS.docx_第2页
第2页 / 共70页
点击查看更多>>
资源描述
中国移动云南公司 大数据平台 需求规格说明书 编写 编写时间 审批 审批时间 文档版本 V1.1 中国移动云南公司信息技术中心版权所有 文档中的全部内容属中国移动云南公司信息技术中心所有, 未经允许,不可全部或部分发表、复制、使用于任何目的。 文档修订摘要 日期 修订号 描述 修订人 审阅人 审阅日期 V1.0 云南移动大数据平台需求规格书 目 录 1. 需求概述 1 1.1. 建设背景 1 1.2. 系统目标定位 1 1.3. 系统建设原则 2 1.4. 业务框架 2 2. 系统概述 3 2.1. 系统功能框架 3 2.2. 系统技术架构 4 2.3. 两阶段的建设考虑 5 3. 业务需求 6 3.1. 标签体系 6 3.1.1. 标签构建 6 3.1.2. 标签使用 6 3.2. IMCD智慧营销 6 3.2.1. 界面使用 6 3.2.2. 复杂事件营销 6 3.2.3. 实时营销 6 3.3. 流量价值提升 7 3.3.1. 流量价值提升影响因素分析 7 3.3.2. 恶意刷机用户分析 7 3.3.3. 终端信息自动运维 7 3.4. 客服专区 7 3.4.1. 客服KPI监控 7 3.4.2. 客服流程分析 7 3.4.3. 投诉分类、热点分析 7 3.4.4. 投诉舆情分析 7 3.4.5. 区域投诉分析 7 3.5. 网络智能分析 7 3.5.1. 行业APN业务保障智能分析与监控 7 3.5.2. 小区网络监控、分析 7 3.5.3. PCC管控策略分析与监控 7 3.6. 星级专区 7 3.7. 融合专区 7 3.8. 4G专区优化 7 3.9. 集团专区 8 4. 一线支撑需求 8 4.1. 自助分析优化 8 4.2. 一线支撑APP 8 4.3. 增值业务支撑APP 8 5. 基础功能需求 8 5.1. 数据源采集与解析 8 5.1.1. 数据源扩展 8 5.1.2. 信息增强 8 5.2. 数据处理与交换 8 5.2.1. 数据融合 8 5.2.2. 跨平台数据处理 8 5.2.3. 跨平台统一调度 9 5.2.4. 数据处理监控 9 5.3. 数据融合 9 5.4. IMCD智慧营销 9 5.4.1. 策略管理 9 5.4.2. 事件管理 9 5.4.3. 个性化推荐 9 5.4.4. 触点渠道管理 9 5.5. 投诉智能处理 9 5.5.1. 投诉文本分词、关键词处理 9 5.5.2. 投诉文本挖掘 9 5.5.3. 投诉文本营销商机挖掘 9 5.6. 服务开放 9 5.6.1. 服务开放平台 9 5.6.2. 自媒体广告平台 9 5.7. 综合管控 9 5.7.1. 数据资产管理优化 9 5.7.2. 平台多租户管理 10 6. 附录 10 6.1. 二级目录 10 6.1.1. 三级目录 10 6.1.1.1. 四级目录 10 6.1.1.1.1. 五级目录 10 1. 需求概述 1.1. 建设背景 利用大数据能力实现的精细化、智能化、个性化的市场营销与服务,以及与之配套的数据分析驱动的方案策划、营销执行、渠道协同、接触管理、过程优化、效果评估等功能。提高大数据在市场营销与客户服务中的应用水平,提升企业层面的整体营销与服务能力。 目前,我省通过长期实践,在营销支撑方面积累了丰富的经验,如客户标签库,帮助实现深度的客户洞察;开发了营销管理平台,部分实现了营销活动的策划、审核、执行、评估的闭环管理,整合并打通了不同类型的多种营销渠道与触点,如短信、外呼、前台、网厅、掌厅、业务平台等;并在流量经营、存量保有、业务营销方面了作了积极有意的尝试,通过系统支撑的手段协同营销在各个渠道的执行。 但是,现有的数字化营销实践也存在着一些局限性与片面性,包括:1)大数据应用尚处于初级阶段,受限于大数据能力未能充分发挥,客户需求洞察能力不足,很多营销仍然依赖于人工经验,大数据价值体现不足;2)渠道协同能力不足,渠道之间缺乏协同,造成跨渠道、多波次的营销活动开展能力不足,营销资源未能到充分利用,并造成重复接触、重复打扰等问题;3)实时事件驱动的营销能力不足,缺乏对关键事件的实时捕捉,以及后续的自动化营销过程;4)营销经验的沉淀不足,营销活动往往按需策划,好的营销活动往往未能通过适当抽象转化为营销,便于后续的复用与共享。 1.2. 系统目标定位 以基于大数据的客户上网行为挖掘为基础,通过智能营销管理平台,实现目标客户准识别、营销产品精匹配、营销渠道全方位,实时和准实时互搭配,重点服务于4G客户迁移、存量维系、流量经营、终端营销、内容营销等领域。 1. 从产品、客户、渠道、关键时刻、商机等多个维度沉淀和落地几类营销场景。 2. 通过综合网关的上网触点感知和流处理技术的位置触点感知实现几类实时营销的落地。 3. 上网日志留存系统的经分适应性改造,提升大数据平台的数据来源,在数据质量、响应及时性、信息承载等方面的能力,为用户上网行为和基于位置的深度分析挖掘,用户需求深度洞察等提供基础能力。 4. 营销管理平台的智能化改造,实现营销触点的自动感知、营销渠道的统一管控、营销执行的科学反馈;并提升目标客户识别、产品策略匹配,渠道选型的综合营销策划能力。 1.3. 系统建设原则 本期工程建设满足以下原则: 开放性与先进性:基于开放式标准,采用先进成熟的设备和技术,确保系统的技术先进性,保证投资的有效性和延续性。 灵活性与可扩展性:方便扩展设备容量和提升设备性能;支持业务处理的灵活的、参数化配置,业务功能的重组与更新的灵活性,新的应用业务可灵活加载,并不影响原有业务流程。 安全性与可靠性:提供良好的安全可靠性策略,支持多种安全可靠性技术手段,制定严格的安全可靠性管理措施。 准确性与实时性:保证系统数据处理的准确性,提供多种核查手段。对实时性要求高的处理提供特殊有效的处理方法。 易用性与可管理性:对于用户可以方便、快捷的使用业务,对于用户可以快速的提供内容服务。平台本身应具有良好的操作界面、详细的帮助信息,系统参数的维护与管理通过操作界面完成。平台应具有良好的管理手段,可管理网络、服务器、操作系统、数据库及应用等。 1.4. 业务框架 以大数据资源为依托,通过客户标签与产品标签实现客户群超细分,捕捉客户群事件性即时需求和群体性商机,适时开展针对细分客户群的静态、准实时甚至实时营销。 整个营销过程执行之前,需要针对客户数据、产品资源进行准备,部署事件和商机规则,由事件/商机触发营销活动,当制定事件或商机发生时,匹配出客户-产品-渠道的营销活动方案,开展多波次营销,实现基于关键时刻的针对性准实时或实时营销,并就营销效果进行及时跟踪和数据评估,为后续营销活动规则、客户标签的不断优化迭代提供依据,推进营销方案的不断完善。 因此,将营销过程从营销准备、事件/商机捕捉、客户-产品-渠道匹配、活动开展及效果评估五个环节,抽象出相关营销要素配置工作,形成5个核心营销要素:目标、产品、营销事件、营销渠道、与之相关商机。 同时,随着营销的深度开展,将逐步形成海量的营销方案。为准实时或实时的营销事件自动智能匹配相应的营销,需要对各类营销活动进行统一管理。 2. 系统概述 2.1. 系统功能框架 2.2. 系统技术架构 技术选型及亮点 1. 采用Flume计算框架,实现文件和消息采集与解析; 2. 采用流式爬虫、中文分词技术,实现互联网网页信息实时采集。 3. 引入Hadoop 2.0,在1个集群上承载批处理和流处理,基于Yarn资源管理可最大效率利用资源,实现消峰填谷。 4. 在Yarn基础上,引入Storm计算框架,通过Hive、Mahout、RHadoop 实现海量数据计算和全量数据挖掘;引入VoltDB内存数据库,结合Esper,实现基于CEP的实时动态营销。 5. 支持分析中心架构差异化,可有效保护现有投资;同时,积极的引入MySQL,利用Sharding实现数据快速访问,为未来技术替换缩减投资奠定基础。 2.3. 两阶段的建设考虑 依据云南移动各业务部门对大数据平台支撑营销场景需求,结合云南现有大数据平台建设情况,参考其它兄弟省份大数据平台建设经验,建议云南移动大数据平台建设分阶段有序推进,达到“阶段目标、过程可控、效果可见”的目标。 Ø 第一阶段:继续利用融合感知分析(C3)能力,通过扩容hadoop平台,提升大数据处理能力;升级智能营销(IMCD)软件并扩容智能营销(IMCD),实现与综合网关对接,实现实时营销;扩充并完善客户标签、数据挖掘,为精准营销奠定基础;升级互联网内容规则及实例库,细化互联网分类及准确性;探索客户服务投诉文本分析。从而满足业务部门所提营销及平台建设技术要求。 Ø 第二阶段:上网日志留存系统改造,取代融合感知分析(C3)的采集和初级预处理能力,构建信息识别增强模块实现对URL信息的识别与增强;升级互联网内容解析软件,并扩容互联网爬虫、实例库匹配功能,提升互联网内容分类、解析能力;改造智能营销(IMCD)产品,使用flume+storm技术实现与信息增强模块对接,以支撑融合感知分析(C3)下线后的实时营销场景;依据新的数据源和业务发展需要,扩充并完善客户标签,优化并验证数据挖掘模型。 3. 业务需求 3.1. 标签体系 3.1.1. 标签构建 /*从标签覆盖范围、标签粒度等角度提出标签构建的需求和特征要求,目录可自拟,具体内容待调研后明确,后面部分内容雷同*/ 3.1.2. 标签使用 /*从标签使用响应速度、标签选择的便利性、标签推荐、标签使用界面、标签与其它系统的交互等角度提出标签使用的需求和特征要求,目录可自拟,体内容待调研后明确*/ 3.2. IMCD智慧营销 3.2.1. 界面使用 /*从营销平台使用响应速度、营销活动选择、目标客户选择、与其它系统的交互等角度提出营销使用的需求和特征要求,目录可自拟,体内容待调研后明确*/ 3.2.2. 复杂事件营销 /*说明营销平台所能满足的复杂事件营销类型、复杂事件营销匹配特征及要求等内容,目录可自拟,体内容待调研后明确*/ 3.2.3. 实时营销 /*说明营销平台所能满足的实时营销类型、实时营销匹配特征及要求等内容,目录可自拟,体内容待调研后明确*/ 3.3. 流量价值提升 3.3.1. 流量提升驱动力因素分析 3.3.1.1. 业务目标 为帮助运营商完成提升流量目标,从传统的单靠业务营销知识入手转变为通过自动化手段分析挖掘流量驱动因素,从而做到拉伸流量规模。产品从流量使用的对象,即从用户方面入手,分析用户流量使用习惯。通过对用户群进行筛选分类,分析用户上网行为及流量使用情况,挖掘对流量变动影响最重要的因素,全面分析因素驱动流量变动的影响度,分析结果可为提升流量的策略提供强有力、精准的数据支撑。 3.3.1.2. 功能概述 流量驱动力因素分析通过对一些固化沉淀出的流量影响因素,经过一系列的指标选取、相似度计算和短发分析,输入影响流量驱动的因素列表以及对应的影响度大小。主要是为用户提供一个制定营销策略提升流量的数据支撑平台。 流量驱动力因素分析的过程是将影响因素、数据经过规则筛选、算法分析,输出对流量驱动影响因素及其对应的影响程度。此过程中根据既定规则和数据类型从不同的口径获取数据,通过对因素指标模板的管理、初选,并结合数据筛选出相关性较大的指标,后通过算法分析出因素已经因素的影响度。 3.3.1.3. 业务流程 3.3.1.4. 功能详细描述 3.3.1.4.1. 流量提升的关键影响因素挖掘 对系统模型算法中所需数据进行了整理与管理,为后续因素分析执行管理做基础准备。 1 2 3 3.1 3.2 3.3 3.3.1 3.3.1.1 3.3.1.2 3.3.1.3 3.3.1.4 3.3.1.4.1 3.3.1.4.1.1 初选指标设定 用户根据本省建设情况与省份业务需要,在系统提供的一百个指标模板中进行选择。系统对用户选择的指标个数不设最多限制,可以选择全部,但不提供全选按键,以免客户直接选择全部指标,失去选择意义,增加系统运算压力;系统对用户选择的指标不设最低限制,但不能不进行选择。用户选择后,已选的因素指标,成为初选指标,为后续指标相关性筛选的指标输入。 该模块将初选指标信息传送给样本数据规则管理模块,初选指标即为后续选取样本数据的指标字段。 指标选择完成后,展示初选指标列表。 3.3.1.4.1.2 样板数据设计 根据样本数据类型管理的样本数据类型分类确定样本数据选择口径,根据样本数据规则管理确定样本数据最小数据量和样本数据数据规则,选取样本数据。 该模块的界面中包括:样本数据类型录入、样本数据各类型口径录入,数据录入存储于样本数据类型管理模块中。在样本数据类型管理模块中,不再设计录入路径界面。 3.3.1.4.1.3 指标相关性筛选 对初选指标进行相关性的筛选,过滤重复数据,缩减因素指标个数,为后续模型计算减少系统运算压力。 在用户完成初选指标设定和样本数据设计后,点击指标相关性筛选按键,系统自动对指标相关性进行计算,并根据计算结果,展现指标与其相关性系数,以相关性系数为维度展开,用户可根据相关性系统的大小,选择筛选结果。 相关性系统值的范围: l 0.8-1.0 极强相关; l 0.6-0.8 强相关; l 0.4-0.6 中等程度相关; l 0.2-0.4 弱相关; l 0.0-0.2 极弱相关或无相关。 系统根据以上五种分类展现指标个数,用户选择五类中的几类,可多选,形成筛选条件,并最终展现筛选结果。 3.3.1.4.2. 驱动流量波动因素的影响度分析 根据因素分析数据管理模块提供的基础数据,和基础信息模块提供的信息,对因素进行深入挖掘分析,产出因素影响度,并对算法进行验证。 3.3.1.4.2 3.3.1.4.3 3.3.1.4.3.1 因素影响度分析 因素以及因素影响度的分析是本产品需要产出的结论性成果。这部分是从大量的用户行为样本数据中,通过建模分析结合筛选出的指标因素集合,从数据中发掘对提升流量规模关键因素以及因素的影响度信息。 这部分主要集中于后台数据挖掘模型的计算中,接入数据是样本数据和筛选后的因素指标集合。通过根据嵌入到挖掘模型中的算法规则,计算出样本数据中影响用户使用流量变动的各因素影响度数据,将影响程度比较大的因素列表以及影响度输出。 建模分析: 依据问题类型,采用合理的挖掘算法,通过数据挖掘工具实现对流量突增客户关键指标的分析和筛选。 因素重要性输出: 因素重要性输出是上述建模分析中的挖掘模型吐出的结果集,其中包括对流量提升影响重要的因素集合和对应各因素对流量的影响度权重。结果通过权重由大到小对影响因素进行排序后输出。 算法选择: 算法选择的依据需要根据其分析出的结果来判断。在数据建模过程中,可选择多个算法挖掘用户上网行为数据中流量波动的因素情况。选择的各个算法会通过其既定的运算规则和判断标准,分析生成也影响因素列表和其影响度权重;分析人员根据输出的分析结果和自己的业务知识,选择贴近于实际情况的分析算法,此算法的分析结果作为最终的因素分析结果。 3.3.1.4.3.2 规则集验证 规则集是挖掘算法内置的分析计算方式,其中包含该算法中分析的流量影响因素集合。规则集是一个二叉树类型的数据集合,每个节点都包含一个影响因素。规则集验证是将测试样本数据和算法的规则集输入挖掘模型工具中,再次分析出对流量变动的影响因素,查看分析结果与之前分析结果之间侧差异,验证该算法分析的完善性。 3.3.1.4.3. 流量波动群用户跟踪分析 分析下一统计周期内,因素及其影响度的变化情况,判定模型算法的正确率和因素影响度的正确率。 3.3.1.4.4 3.3.1.4.4.1 算法效果分析 效果分析是基于对用户流量情况做完因素分析之后,使用分析结果对用户群进行接收营销推广后,再次对这些用户流量使用情况进行分析,一般是在做完因素分析推广营销后的下一个月做跟踪分析。分析用户群在当月流量使用情况,并对部分流量回落用户做流量波动的因素分析,挖掘出那些因素对流量回落产生影响,并计算产生影响的影响度。 这部分输入的数据需要流量波动用户群分组下用户上网详单数据和影响流量驱动的因素集合。 3.3.1.4.4.2 因素效果对比 算法效果分析体现在对分类划分出用户群跟踪期内流量变动因素分析过程中,主要为判断算法分析出的结构是否完善准确,结果是否可精准为营销活动提供数据支撑。 算法的效果分析输入的数据为用户群跟踪期内上网行为数据以及影响因素集合,通过挖掘模型分析出隐藏在数据中影响因素列表和因素影响度权重,并与之前分析的结果进行对比,查看分析算法分析的精准度和完整性。 3.3.1.4.4. 流量提升驱动力因素排行 根据跟踪分析的结果,对流量提升因素分析的结果进行矫正,最终确定出适用于本省的流量提升驱动力因素TOP排行。 序号 指标类别 建模指标 重要程度 1 消费信息 可用流量较上月增幅 0.45 2 互联网信息 新增使用应用的个数 0.23 3 促销信息 是否参与赠送流量的营销活动 0.2 4 消费信息 近3个月超套的次数 0.05 5 消费信息 3G流量占比增幅 0.02 6 业务信息 是否变更为智能手机用户 0.01 7 业务信息 是否变更为3G手机用户 0.01 8 消费信息 2G流量占比增幅 0.01 9 业务信息 是否流量套餐包升级 0.01 10 客户信息 是否漫游 0.01 11 业务信息 是否变更包含流量的主套餐 0.01 12 互联网信息 应用消耗流量较上月增幅 0 13 消费信息 节假日日均流量较非节假日日均流量是否提升 0 14 业务信息 是否变更为4G手机用户 0 15 消费信息 4G流量占比增幅 0 16 促销信息 是否参与限时特惠包活动 0 17 消费信息 手机WLAN流量较上月增幅 0 18 客户信息 集团客户标识 0 19 客户信息 校园客户标识 0 20 互联网信息 热点事件搜索次数 0 3.3.2. 智能推荐引擎 3.3.2.1. 概述 智能推荐引擎是基于大数据平台的数据和计算能力,通过对各类数据的分析、计算、关联、预测等方式,将对的产品推荐给对的人,为精准营销提供能力支撑。 智能推荐引擎提供的能力包括:产品推荐能力(找到适合推荐的产品,例如,活性最高的应用、热门的终端等等),用户推荐能力(找到每一类产品适合推荐的用户群)以及基于大数据挖掘的效果评估。 3.3.2.2. 与现有营销流程的整合 智能推荐引擎可以与省内已有的营销平台进行整合,在不影响现有流程的前提下,为营销活动的策划提供智能推荐的能力。整合方案如下: 3.3.2.3. 个性化应用推荐 3.3.2.3.1. 业务目标 在流量时代,业务部门需求与大数据紧密关联,利用大数据推动运营流程转变、推动商业模式变革。个性化应用正是形成以大数据分析驱动的智能营销闭环管理流程,实现营销策划的精细化和智能化,助力电信运营商提升4G用户流量规模。 3.3.2.3.2. 功能概述 从用户方面入手,活性分析得出用户热门应用,实现自动推荐;其次对全量用户通过协同过滤筛选后再从中挑选出4G用户(4G用户口径:使用4G终端、开通4G套餐、4G流量包),给予个性化的应用推荐;对推荐结果进行多维度的效果评估,通过安装应用、监控应用的使用来推动用户的流量提升。具体实现功能包括:用户业务偏好分析、应用活性分析、应用使用特性分析、协同过滤算法、营销效果多维分析。 3.3.2.3.3. 业务流程 3.3.2.3.4. 功能详细描述 3.3.2 3.3.2.1 3.3.2.2 3.3.2.3 3.3.2.3.1 3.3.2.3.2 3.3.2.3.3 3.3.2.3.4 3.3.2.3.4.1 用户应用偏好分析 用户应用偏好分析基于DPI流量话单(HTTP话单或通用话单)中计算的应用访问量、访问时长、访问流量等指标,通过一系列规则计算得出用户对其所已使用过应用的偏好得分。 偏好得分表是协同过滤算法的输入数据。 3.3.2.3.4.2 用户应用活性分析 应用活性静态分析 应用活性静态分析:分别从三个档次(0-1万,1-10万,10万及以上)考察应用新装后第三个月的用户保有率、流量保有率、月均用户使用频次及月均流量。生成对应的气泡图、曲线图直观查看,默认按照流量保有率的TOP30排名各应用。最终用户可将分析结果保存下来。 应用活性动态分析 考察应用新装后连续三个月的用户保有率及流量保有率变化情况,取并集得出TOP30应用。点击指标切换按钮分别可以选取三个月单独的保有率变化以及整体的一个保有率变化。 应用活性特性分析 分别从户均流量增存量对比折线图;户均流量增存量对比折线图;方便用户观察该应用是属于上升型、下降型、交织型、喇叭型中的哪一种。在具体应用推荐的时候优先选择上升型应用。 3.3.2.3.4.3 用户应用推荐列表 系统通过最佳推荐应用分析提供默认的最佳推荐应用列表。最佳推荐应用列表产生的原则是: 根据静态活性分析结果,分别选取用户保有率和流量保有率TOP30的应用,取并集同时去重;根据动态活性分析结果,分别选取用户保有率增幅和流量保有率增幅TOP30的应用,取并集同时去重; 针对最终选取出的应用中,判断应用使用类型,过滤出户均流量‘上升型’的应用。如果过滤出的应用数量不足30个,则选取用户保有率最高的应用进行补全;如果过滤出的应用数量大于30个,则选取用户保有率最低的应用进行过滤。 该界面的应用推荐列表主要包括推荐应用的名称、用户数、保有率、户均流量等指标还列出了经过筛选出的目标用户数。(具体筛选算法见下页);同时该页面提供后台推荐列表产生的流程图以及用户筛选的原理图,感兴趣的可点击链接查看。 3.3.2.3.4.4 目标用户挖掘 采用基于协同过滤算法,筛选具体推荐用户,并在筛选出的用户中选择终端是4G的用户。 总体思想: 1)基于用户X对所有物品的偏好,找到邻居用户Y; 2)将邻居用户Y喜欢但用户X尚未购买的物品推荐给当前用户X。 3.3.2.3.4.5 应用推荐效果评估 计划推荐用户数和实际传播用户数,IMCD通过外部接口向智能推荐引擎进行同步后。一般从传播开始前一周到传播结束后一周作为评估周期,为了增加指标效果,可延长统计周期至传播前后1个月,传播效果分析中,指标统计均以‘实际传播用户’为数据样本总体。 前台界面用户可以查询到历史推荐的列表,能查看到当时具体推荐应用的内容以及用户数规模;通过分析用户的流量数据,可对具体的推荐活动进行效果评估,提供从应用及区域两个维度对历史活动进行分析评估推荐效果。 历史活动查询 历史推荐概览: 区域维度效果分析 区域维度评估-转化率分析 区域维度评估-趋势分析 应用维度效果分析 应用维度评估-转化率分析 应用维度评估-趋势分析 3.3.2.4. 个性化套餐推荐 3.3.2.4.1. 业务目标 随着运营商提供的套餐方案越来越多,套餐内提供的产品种类繁多,每种产品的适用条件又不尽相同,用户往往不能清楚的知道自己应该使用哪一种套餐;新的套餐也因为宣传手段有限,无法及时通知到最适合的用户。通过个性化主套餐推荐,及时的推荐用户新的套餐或者建议升级主套餐,最大限度地保有存量用户,在稳步提高收入的同时,更能有效的提升用户感知,降低用户维系的成本。 3.3.2.4.2. 功能概述 首先,基于大数据中心的数据挖掘分析能力,分析并预测出用户下月对各类产品的实际需求;其次,根据用户现在使用的套餐,分析匹配程度;第三,分析现有的所有套餐产品,分析出最合适的主套餐;第四,分析用户的“月保底消费叠加规则”,滤除 资费中大部分是保底消费的用户;第五,输出需要升级主套餐的用户以及推荐的目标主套餐产品。 3.3.2.4.3. 业务流程 3.3.2.4.4. 功能详细描述 3.3.2.4 3.3.2.4.1 3.3.2.4.2 3.3.2.4.3 3.3.2.4.4 3.3.2.4.4.1 用户下月的需求预测 根据用户使用本地通话、长途通话、流量、WLAN、短信、彩信等产品的实际数据,分析出用户使用每一种产品的历史变化趋势,通过产品使用量预测模型,推算出用户下个月对每种产品可能的需求量。最终可得出每一个用户下一个月使用各种产品的预测情况,例如: 用户号码 13811321218 本地通话时长 200分钟 长途通话时长 100分钟 漫游通话时长 50分钟 流量 500MB WLAN上网时长 60分钟 短信 50条 彩信 10条 是否使用139邮箱 是 3.3.2.4.4.2 主套餐升档潜在用户分析 根据预测出的用户需求,分析用户现有套餐的每项产品,按照不同产品符合程度的加权算法,得出用户现有套餐组合产品的符合程度得分,并且根据符合情况给出建议的调整方式。如下表: 用户 当前套餐 符合度 调整建议 用户A 158 75 升档 用户B 58 98 保持 用户C 158 67 降档 从符合度列表中筛选出需要升档的用户群。 3.3.2.4.4.3 低消费保底叠加用户剔除 针对需要主套餐升档的用户群,找出其中参加了优惠活动有保底消费并且近三个月除了保底消费外很少有额外消费的用户,根据这部分用户的消费习惯,为了避免不必要的误解引起投诉,将不予推荐套餐升档,具体的筛选方法如下: 结合用户近三个月出账费用的稳定性及规模(X),假定参加某活动A需要添加保底Y1且活动A将产生消费额Y2,用户参加活动A前已有保底消费规则Y,系统判断Y+Y1+Y2<X*90%,如果满足则向用户推荐活动A,否则不推荐。 3.3.2.4.4.4 升档用户主套餐推荐清单 根据最终筛选完成的目标用户群以及省公司当前最新的套餐产品,匹配出最合适的套餐建议,每月输出每一个目标用户建议推荐的主套餐清单。 3.3.2.5. 4G终端推荐 3.3.2.5.1. 业务目标 终端引领一直是运营商很重要的用户发展手段,如今通信市场已正式进入4G高速移动互联网时代,而现网中还有大量的2G、3G存量用户。通过增加对4G终端潜在换机用户的精确识别帮助运营商正确引导用户,完成终端换机推荐,实现提升流量目标,同时让各合作终端厂商的终端都能够被推荐给对其感兴趣的用户,是现在需要分析解决的问题。 3.3.2.5.2. 功能概述 4G终端推荐通过终端信息获取、用户画像、终端参数与流量分析、终端算法推荐等流程手段可提供对4G终端潜在换机用户的精确识别及4G终端推荐结果查询两大功能。 4G终端推荐精准分析可通过几种识别方式对用户进行筛选: “用户兴趣人群化”识别:基于用户业务使用习惯,兴趣分类及流量数据业务监控进行用户群筛选画像,圈定终端推荐适配人群。 “购买事前动作”识别:基于用户通信行为和上网行为进行分析,通过用户流量使用行为变化,APP使用行为变化、特定网站上网行为变化等筛选潜在换机用户。 “终端偏好”识别:基于用户通信消费能力、交往圈、用户位置、上网行为、终端搜索行为、终端参数配置爬取等匹配用户适配终端。 3.3.2.5.3. 业务流程 3.3.2.5.4. 功能详细描述 3.3.2.5 3.3.2.5.1 3.3.2.5.2 3.3.2.5.3 3.3.2.5.4 3.3.2.5.4.1 候选终端信息数据提取 用户根据本省建设情况与业务需要,从系统提供的候选4G终端列表中进行选择,生成待推荐终端列表。系统对用户选择的终端个数没有限制,可以全部选择也可以批量勾选;终端品牌、型号等信息可根据需要进行排列筛选。 3.3.2.5.4.2 潜在换机用户识别分析 本功能对用户在用终端使用情况数据进行匹配分析,分两步进行识别判定:第一步是对近期是否有过换机行为进行判断,分析现有终端的生命周期;第二步是对用户上网行为进行判断,通过对用户使用应用及流量情况分析判断用户对终端需求的变化。 下图是潜在换机用户识别分析业务处理流程: 功能要求:计算用户在用终端使用情况,踢掉已有4G终端用户、近期有过换机记录用户、流量阈值低于1M的用户。基于用户通信行为和上网行为进行分析,通过流量使用行为变化、APP应用使用变化、特定网站上网行为变化等筛选出潜在换机用户。 3.3.2.5.4.3 终端推荐列表 系统通过潜在4G换机用户识别分析结果及候选终端信息数据提取结果通过用户终端偏偏好模型,生成最终终端推荐列表。 3.3.3. 恶意刷机用户分析 3.3.3.1. 业务目标 通过“三码对应”规则可切实有效的甄别恶意刷机行为,分析识别疑似恶意刷机终端群体,查找这些终端对应的渠道商信息,为运营商有效进行渠道管控、商业止损提供数据支撑,旨在解决当前运营商普遍面临的不良渠道商通过恶意刷机非法套取佣金酬金但无法有效识别与监督的现状难题。 3.3.3.2. 功能概述 恶意刷机用户分析通过“三码对应”手段 可提供恶意刷机识别,及恶意刷机结果查询两大功能。 恶意刷机用户分析识别可通过对用户上网记录数据中关键字段信息进行解析提取,包括IMEI匹配、Useragent/URL中的终端信息,采用“三码对应”规则,对数据解析的结果数据进行比对分析,初步判定出可能刷机的用户群。 恶意刷机用户分析对初步判定的可能刷机的用户群IMEI号进行监测分析(如一个月),通过“二次甄别”手段将UA/URL数据中剔除手机作wifi热点导致IMEI变化的部分用户 ,剩下的则判定为疑似刷机终端。同时将刷机用户与渠道信息进行关联,甄别判定恶意刷机渠道。 恶意刷机用户分析查询可逐月提供合约机识别输出分析报表,包括:疑似恶意刷机用户列表,恶意刷机渠道列表等。 3.3.3.3. 业务流程 对用户上网详单数据中终端相关的要素信息采用“三码对应”的规则进行匹配分析,初步筛选出疑似恶意刷机的用户。将初步选出的疑似恶意刷机用户匹配用户渠道信息,根据一定阀值判定某渠道是否为疑似恶意刷机渠道,并统计各渠道的疑似恶意刷机情况。 疑似恶意刷机识别分析业务流程的主要关键步骤如下: 3.3.3.4. 功能详细描述 3.3.3.4.1. 疑似恶意刷机用户识别 本功能需通过对用户上网详单数据中终端相关的要素信息采用“三码对应”的规则进行匹配分析,分为两步进行识别判定:第一大步为初步识别过程,第二大步为二次甄别过程。 3.3.3 3.3.3.1 3.3.3.2 3.3.3.3 3.3.3.4 3.3.3.4.1 3.3.3.4.1.1 初步识别 初步识别的第一步,用户上网日志分析主要是对终端渠道销售表中的那部分用户的一段周期的上网日志进行分析,如果用户在该周期内无上网记录则不对该用户进行分析。分析的内容是:从Useragent或URL中按照规则模板解析出终端品牌型号信息,同时用IMEI字段关联终端信息库匹配出终端品牌型号信息。其处理流程如下图所示: 1、用户通过接口或手工导入的方式加载渠道终端销售信息表,该表包含了渠道与合约机用户的对应关系; 2、对渠道终端信息表中的那部分用户的上网日志记录进行分析,主要是对其Useragent或URL字段按照 规则模板进行解析,解析出终端的品牌与型号信息,添加到用户上网记录信息中。解析模板的优先级顺序从高到底是: ① Useragent的浏览器规则模板 ② Useragent的操作系统规则模板 ③ Useragent的正则表达式模板 ④ URL规则模板 只有在高优先级规则模板无法解析出终端信息的情况下才使用低优先级下一规则模板,一旦当前规则模板能够解析出终端品牌型号信息,则不进行低优先级的规则模板匹配。 如果Useragent和URL字段通过现有模板都无法解析出用户终端信息,则对该条上网记录进行剔除,不做后续分析。 此外,将用户上网日志记录中的IMEI字段关联终端信息库,如果可以关联出终端品牌信号信息则添加该终端品牌型号信息至用户上网记录信息中,否则,则对该条上网记录进行剔除,不做后续分析。 初步识别的第二步,是对第一步的输出结果进行分析,将从UA/URL解析的终端品牌型号信息与通过IMEI与终端信息库关联的终端品牌型号信息进行对比,即“三码对应”识别,输出初步判定的疑似恶意刷机用户,流程如下图所示。 初步判定的第三步,是对第二步中识别的疑似恶意刷机的那部分用户的上网记录分析结果进行进一步的分析,通过散列统计的方式,来确定其真实的终端品牌型号信息。 散列分析,是针对用户的多条上网记录信息,其UA/URL解析的终端品牌型号信息可能不一致的情况,通过按终端品牌型号进行统计分析,来确定疑似恶意刷机用户的实际终端品牌与型号。 确定的原则是: 1、出现频次最多的即为该疑似恶意刷机用户的实际终端品牌型号; 例如:A用户可解析的上网记录有10条,4条解析结果是华为C8810,3条解析的是华为C8812,2条是ZTE Z5,1条是三星G3,则以C8810作为用户的实际终端品牌型号。 2、如果频次一致,则选择最近的一条上网记录中UA/URL解析出的那个终端品牌型号作为用户的实际终端品牌型号。 例如:B用户可解析的上网记录有10条,5条解析结果是华为C8810,5条解析的是华为C8812,则看这10条记录上,离当前时间最近的一条上网记录中的UA/URL解析出来的终端品牌和型号作为用户的实际终端品牌型号。 3.3.3.4.1.2 二次甄别 终端信息监控功能,实现对上一步骤“三码对应”规则匹配输出的疑似恶意刷机用户进行长达一个月的跟踪监控。目的是剔除可能用手机做热点上网导致的IMEI匹配的终端信息与UA/URL抽取的终端信息不匹配的情况。 在监控期内,如果从某用户的UA/URL抽取的终端信息与IMEI匹配的终端信息又出现匹配一致的情况。则判定该用户为用手机做Wifi热点的用户。否则的话,即认为是疑似恶意刷机用户。 3.3.3.4.2. 疑似恶意刷机渠道识别 本功能需要将初步选出的疑似恶意刷机用户匹配用户渠道信息,根据一定阀值判定某渠道是否为疑似恶意刷机渠道,并统计各渠道的疑似恶意刷机情况。 下图是疑似恶意刷机用户识别的业务处理流程: 数据生成周期:可以按照月统计 功能要求:计算疑似刷机数量、销售量、疑似刷机率,设定阀值判断,渠道刷机率在10%以上(实际阀值可通过前台界面进行设定)的即为疑似恶意刷机渠道,阀值在10%以下不判定为疑似恶意刷机渠道。 3.3.3.4.3. 任务管理 3.3.3.4.1 3.3.3.4.2 3.3.3.4.3 3.3.3.4.3.1 创建识别任务 可手工创建恶意刷机识别任务,确定任务的开始时间、待识别的合约机
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 行业资料 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服