ImageVerifierCode 换一换
格式:PDF , 页数:3 ,大小:1.74MB ,
资源ID:325669      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/325669.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(基于大数据技术的高校用户识别方法研究.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

基于大数据技术的高校用户识别方法研究.pdf

1、信息通信基于大数据技术的高校用户识别方法研究郭向红,魏国华,包志刚(中国移动通信集团内蒙古有限公司,内蒙古呼和浩特0 10 0 10)摘要:文章提出了一种新的高校用户的识别方法,在指定的高校基站范围内,通过分析客户的交往圈、通话行为、流量使用情况、活跃时间、常驻活动位置等信息,依据交往圈交往程度及位置驻留时长等维度,构建校园用户识别模型,进一步提升对校园用户的识别能力,为公司对校园市场的精确营销及运营分析提供有力支撑。关键词:大数据;交往圈;校园市场中图分类号:TP3092023年第0 5期(总第2 45期)文献标识码:B文章编号:2 0 9 6-9 7 59(2 0 2 3)0 5-0 15

2、7-0 31 引言校园市场作为年轻人市场的核心组成部分,一直是电信运营商特别关注的焦点市场。互联网时代下,学生的消费行为已发生了巨大变化,现有校园用户识别模型的识别能力已不能有效提供运营支撑。为了更好地支撑公司运营,强筑大数据支撑能力,充分发挥大数据平台数据资源优势,不断提升精准运营能力,对“校园用户识别模型”进行了重点优化,通过提升模型基站覆盖率,提高数据识别准确率,为分公司精准运营提供有力保障。本文提出了一种新的高校用户的识别方法,在指定的高校基站范围内,通过分析客户的交往圈、通话行为、流量使用情况、活跃时间、常驻活动位置等信息,依据交往圈交往程度及位置驻留时长等维度,构建校园用户识别模型

3、。在校园用户识别能力建设的基础上,进一步统计出省内校园数量、各校园中电信运营商的校园用户的分布情况及省内省外用户的占比,从而为后期的运营分析提供有力支撑。2模型历史方案及缺陷分析校园用户的运营由来已久,早期的校园用户识别模型主要基于本省校园区域及校园区域内用户的通信及交往圈特征,建立了分类模型,提炼训练结果,最终形成规则进行模型落地,历史模型的构建规则如下。2.1校园基站信息采集主要依靠各地市进行手工维护,即由各地市将区域内所属校园基站数据通过手工收集,并不定期的手工录入到大数据平台中,大数据平台对录入数据按月进行汇总整理,剔除重复数据及失效数据,保留有效数据,为下一步模型建设做准备。2.2校

4、园区域下全量用户圈定(1)移动校园区域用户:当月校园基站下通话的所有非漫游用户;(2)友商校园区域用户:当月与我网校园基站下通信用户产生通信的友商用户。2.3月模型下校园用户识别规则(1)我网校园用户识别语音通信天数大于5天以上、校园通信占比大于30%以上;流量通信天数大于5天以上、校园流量占比大于30%以上;在校园基站下的语音及流量通信天数在14天以上;校园套餐用户且在校园基站下有三天或以上通信(通话+收稿日期:2 0 2 3-0 2-2 8作者简介:郭向红(197 4-),女,高级工程师,工程硕士,主要研究方向:行业数据分析、大数据应用、数据挖掘;魏国华(198 3-),男,高级工程师,高

5、级信息系统项目管理师,硕士研究生,主要研究方向:行业数据分析、大数据应用;包志刚(198 1-),男,高级工程师,硕士研究生,主要研究方向:行业数据分析、大数据应用、数据挖掘。157流量);本年新生迎新名单。(2)友商校园用户识别最近半个月有通话,并且在同一学校的交往圈大于2 人;校园通话占总通话比例2 5%以上。旧方案的建设具备一定的合理性,但也存在一些明显的缺陷,会影响到模型识别的准确性,主要体现在:(1)校园基站手工维护,会导致基站数据更新不及时、人为操作产生数据错误等问题,也会给维护人员带来较大的工作量;(2)旧方案没有使用大数据平台挖掘模型建设能力,相关参数指标不够科学,影响模型识别

6、准确性;(3)旧方案未能有效发挥大数据价值,更为精准的信令数据没有在用户位置判定中得到使用,影响了对用户的位置分析能力;(4)没有实现对外省漫入用户的识别,对高校用户的构成分析不够全面。3基于大数据技术的高校用户识别模型3.1校园基站采集考虑到旧方案中存在的种种弊端,新的高校用户识别模型使用的高校基站数据源于网络侧实时更新的基站数据,相比于人工维护的基站数据,其优势体现在以下几个方面。(1)网络侧能够实时更新基站信息,不需要在进行人为干预和手工操作,能够有效减少人工维护耗费的大量时间,更具有时效性。(2)网络侧能够根据需要圈定范围,实现基站信息的增、删、改等调整,灵活性和可操作的空间更大。(3

7、)网络侧的基站信息更为全面与精准,有效降低手工操作导致的数据偏差,对于校园基站下用户的圈定和监测更为合理,提升了校园识别模型基础数据的数据质量。3.2高校用户识别模型建设思路校园用户的识别主要分为我网高校用户的识别及异网高校用户的识别。模型整体建设思路如下:首先需要完成样本数据的收集,并在大数据平台,利用挖掘模型算法,探索高校用户的行为特征,通过相应的特征确定校园用户识别规则的阈值,最终在圈定的校园基站下的用户中识别出校园用户,形成校园用户识别模型。在我网校园用户识别的基础上,通过移动号码号段,还会进一步区分是省内移动用户,还是外省漫入的移动用户。在确定了我网校园用户的基础上,通过交往圈发酵规

8、则进行发酵,最终圈定异网校园用户。Changjiang Information&Communications异网校园用户模型异网用户生成图1高校用户识别模型模型建设主要完成三步,校园用户特征探索、本网校园用CPAS,RES5001Starpl22440l*/11220.11220TiC00120,$13571046710461.9COMM_CHANELIDS-1.0519181204e-1278.#VDIC_RESS-O.O2NNET,LONGS-L6720P3861231441220.21GPRS_RESS0.121e048OPY-0722rtopy-0.918sirmples3RM57NE

9、T,LONG-1.A67enbopyo.o3mtopy=0.9711.173.3高校用户识别模型构建过程(1)训练样本选取在当前状态正常的在网用户中,选取有校园基站通信行为的个人语音卡用户,作为模型训练的样本集。(2)模型算法模型预处理:对缺失值进行处理,将输入数值类型字段中的空值全部置零。种子用户特征分析工程,根据业务理解和相关性分析,筛选保留相关度高的指标维度变量:校园主资费套餐、校园基站通话次数占比、校园基站驻留时长占比等。构建决策树模型,得到分类二叉树,输出可视化结果,转换得到分类阈值,如图1所示。根据决策树算法输出结果,结合省内各高校实际情况进行参数及特征值优化,最终确定校园本网用户

10、的识别规则。(3)模型判定规则模型最终将校园用户划分为三类客户,分别是本省我网校园用户、外省漫入我网校园用户及友商校园用户。其中本省我网校园用户由四部分客群组成,四部分用户合并后剔重,形成最终客群;外省漫入我网校园用户由三部分客群组成,三部分用户合并后剔重,形成最终客群;友商校园用户的识别只有一条规则,直接生成目标客群。各类客群及判定规则详见表1。郭向红等:基于大数据技术的高校用户识别方法研究户识别模型和异网校园用户发酵。我网校园规则生成我网校园用户交往图发酵根据发酵规则生成异网校园用户1223220AVG_GPRS.RES-0.5191142.0CID,APP_DOUO.294FRIENO.

11、CNTS-0.57T42图1决策树模型生成的分类二叉树本省我网校园用2、年龄*岁;户识规则3、*_*点校园驻留时长占比*%及以上;4、总校园驻留时长占比*%及以上1、年龄*岁;2、*点校园驻留时长占比*%及以上1、年龄*_*岁;2、*_*点校园驻留时长占比*%及以上友商校园用户识与我网校园用户*个及以上通信别规则1、外省漫入客户;2、*点校园驻留时长占比*%及以上;3、总校园驻留时长占比*%及以上外省漫入我网校1、外省漫入客户;园用户识别规则2、*_*点校园驻留时长占比*%及以上1、外省漫入客户;2、*_*点校园驻留时长占比*%及以上注:表内数据由于涉及商机机密,故作了数据隐藏处理。158(1

12、)校园用户特征探索用户明细选取充分发挥运营商大数据优势,利用大数据信令数据、用户位置信息、校园基站驻留时长、上网日志信息、学生常用APP交往圈发酵的使用情况等信息,利用随机森林算法进行特征选择,找出判发酵规则:2 个及以上本网校园用户主被叫一个异网用户的方式进行发酵les1162MAGE.OLD-14790-27.68AVG_VOIC_BHD-2.096CO,APP_DOUS1S786P0276Pe21samples3定校园用户的重要特征。(2)本网校园用户识别模型构建基于校园用户的重要特征构建决策树模型,计算分类阈值。基于分类算法得到的阈值,结合校园用户的实际情况做优化,最后形成我网校园用户

13、的识别规则。(3)异网用户发酵异网用户发酵规则,按照2 个及以上本网校园用户主被叫一个异网用户进行发酵。F83NNETLONGS-1203-1197347R,11214SUB_CHANNELDE-0.181-11582-P7111211AGEOLDSO73$11404504Oy-0.10211351151,11208C_2123_51.05111264024,11401PECE.DIST.JOS-0.60-1.1907SUB,CHANELO-0.68317750-4.174010009y-0.264P5534a10,1208SUB_CHANNELID-1028P391ety-0.918AVG.

14、VOIC_RESE-0.10s17791-0.022FREE_DOUSO.BO40343AVG.VOIC_RES5.4.435N50P-0.374表1校园客户客群判定规则1、用户名称流量大于*G及以上;2、年龄*岁;3、*点校园驻留时长占比*%及以上;4、总校园驻留时长占比*%及以上1、指定资费代码;eopy-0.918tamples3enboPy-0.97622ep,13385SUB_CHANELID-0.4B70e-PA.9233NNET,LONGS-1872039792ROPYO.O3.okeP25.7805INNETLONGS-18351373esE13410133o525Changj

15、iang Information&Communications3.4模型的输入和输出在模型设计和训练完成后,形成了最终的模型判定规则,以判定规则为依据,确定模型输入信息,主要包括用户网龄、总流量、校园基站驻留时长、总通话时长等2 8 项用户信息。表2 模型输入信息表序号字段1GPRS_RES2INNET_LONG3GPRS_RES64AGE_OLD5NIGHT_DOU6CLASS_7_20_ZB7QUAN_ZB8AVG_GPRS_RES9AVG_DOU310FREE_TIME_GPRS11CLASS_0_6_ZB12BUSY_TIME_GPRS13VOIC_USED_PROP14GRID_CO

16、DE15COMM_CHANNEL_ID16AVG_VOIC_RES17CID_APP_DOU18SUB_CHANNEL_ID19AVG_VOIC_BHD20AVG_GPRS_BHD21RED_APP_DOU22AREA_CODE23PIECE_DIST_ID24AVG_OPPER_CNT25CLASS_21_23_ZB26FRIEND_CNT27FREE_DOU28VOIC_RES模型执行周期以月为单位,执行结果在大数据平台GBASE数据库进行存储。模型输出信息主要包括用户号码、归属高校、基站ID、运营商类型等。4模型优化效果对比基于大数据平台构建的决策树分类识别模型进行测试,159郭向红等:

17、基于大数据技术的高校用户识别方法研究在测试样本上(共收集到正样本112 2 0 条,负样本8 97 6 0 条)的查准率为96.39%,查全率为7 0.14%。由于新模型在校园基站采集方面,摒弃了手工维护的方式,采取了通过网络接口进行实时数据采集,因此,降低了数据维护的工作量,有效规避了数据维护不及时导致的数据差异问题,显著提高了模型识别的准确性。新模型建成后,有效字段名称的校园基站个数从5312 个增加到8 998 个,覆盖高校数量从套餐+流量包总流量(MB)57个增加到了6 9个,达到了区内高等院校全覆盖。网龄(月)根据决策树分类识别模型,再结合高校用户实际情况进行优化,确定了新的校园用户

18、识别规则。以2 0 2 2 年2 月的模半年内平均流量型输出结果看,模型识别到的省内校园用户为33.6 万人,其中年龄本省移动用户为17.8 2 万,占比52%,外省移动用户占比24.65%,联通用户占比16%,电信用户占比6.0 9%。经过与各夜间流量(MB)盟市高校官方公布的师生数据核对,模型输出结果与各盟市7-20点校园驻留时长占比高校学生数量及电信运营商所统计的学生用户分布比例基本总校园驻留时长占比吻合。新旧模型识别到的校园用户规模见下表:表3新旧模型识别校园用户规模对比计费总流量(MB)用户归属近3 月平均DOU移动闲时 GPRS 流量联通0-6点校园驻留时长占比电信忙时GPRS流量

19、外省本月语音利用率合计归属网格5结语通信归属区县代码校园市场用户对于企业有重要意义。校园市场不仅拥有总通话时长(分钟)巨大的消费潜力、庞大的用户规模、强大的传播能力,而且拓展校园市场有利于撬动年轻消费群体、塑造品牌形象、占领年视频类APP使用流量轻市场。本文为了有效识别高校用户,基于某运营商数据,利入网归属营业厅代码用大数据建模能力,构建了“校园用户识别模型”。模型利用随机森林算法完成特征值筛选,通过决策树确定了阈值,采用语音饱和度实时接口的方式实现了校园基站的实时更新,从效果来看,该流量饱和度模型取得了很高的识别准确率及覆盖率,校园用户的规模及阅读类APP使用流量分布情况也符合实际。下一步将

20、根据模型识别结果针对校园市场制定精细化营销策略与运营方案,开展校园市场专项运地市ID营工作。网格编码参考文献:语音主叫用户数1李晓辉.关于一种移动通信高价值用户的识别模型探讨 .21-23点校园驻留时长占比科学与信息化,2 0 2 0(1):2-4.2徐波,孙李哲.手机用户识别模型与应用 .大众科技,交往圈用户数2014,16(11):18-20.定向流量(MB)3王可.建立基于基站与交往圈的校园用户识别分析系统套餐+语音包总语音(分钟)初探 J.中国新通信,2 0 17,19(3):1-3.4陈小凤大数据挖掘校园用户 .电子技术与软件工程,2 0 18,15(3):1-3.5 朱珊珊.数据挖掘在电信行业客户细分的应用研究 D.辽宁大学,2 0 12.6陈媛媛.移动通信系统中校园用户精准识别与细分研究 D.重庆大学,2 0 10.旧模型识别用户数8799511087997新模型识别用户数178290548782050482992336664

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服