1、,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,大 数 据发展战略,中国联通集团,客户事业,部,集团客户通信信息产品,联通大数据可整合的内容,客户基本资料,姓名,、出生日期,、,证件,号码、住址,、,客户,类型、电话号码,、,地域,、性别、年龄、籍贯等,用户状态信息,号码状态、欠费状态、,业务开通状态、,订购产品、流量包、,合约计划、开通渠道,等,用户位置信息,手机号码、,IMSI,、,时间、,CellID,、,LAC,、经纬度等,储值消费信息,缴费渠道、缴费时间、
2、,缴费金额、消费金额、,月租费、通信费、,流量费等,信用欠费信息,初始信用度、,动态信用度、,欠费账龄、欠费额度、,欠费频次等,用户行为信息,语音、短信、流量详单,如通话类型、通话时间、通话地点、通话时长、对方号码等,互联网行为信息,如上网类型、,上网时间、上网地点、,网站,/APP,等,用户终端信息,手机号码、,IMEI,、,IMSI,、终端型号、,终端厂商等,通过,深度数据,挖掘与特征分析,形成客户标签、数据魔方等大数据服务产品。,*,每日,新增,客户、产品数据,网络数据,外部数据,大数据技术平台,(采集、存储、加工、服务,),Hadoop,分布式存储和计算,集群,1300,个,节点,全国
3、新增日采集量超过,10TB,1900,品牌、,4,.5,万,终端,2.05,亿,URL,2490,类,185,万个关键词,5000,APP,U-,标签,U-,征信,U-,位置(,Smart,Steps,),U-,营销,4,亿客户资料,1400,亿条*,用户上网记录,50,亿计费详单*,22,亿结算话单*,75,亿原始话单*,数据资源,基础平台,数据资产,创新应用,客户数据,产品,知识库,中国联通的数据资产,联通大数据平台优势,数据一点集中,31,省,BSS,与集中系统数据一点采集、一点处理、一点服务,IT,开展集中化建设,有利于后续系统一体化部署和活动集中开展,均采集生产系统原始数据,数据更真
4、实、更及时、更准确、更完整,信息价值高,信息含量丰富,:集中,了用户从生活到工作、从通信到互联网,覆盖了,24,小时的位置、行为信息,信息价值含量高、信息涵盖范围广。,信息可信度高,:用户数据样本量大,更能真实反映一个用户的多方面状态,数据产品丰富,联通大数据平台已经形成了客户标签体系、互联网信息库、终端库、风控模型、,APP,排行榜等数据产品,有助于快速形成服务能力、推进对外合作,平台能力强,联通大数据平台具备海量数据处理能力,同时能力开放平台的建设实现资源共享、数据共享,有助于快速构建模型、快速形成生产能力,用户标签库,互联网内容,信用信息,维系营销,位置轨迹,七,级客户,标签体系,已,建
5、成包含,9,个一级标签分类,,33,个二级标签分类,共计,1753,个客户标签,六级互联网标签,一级,7,类,,共,2,542,个,标签,以满足营销的需求为准则进行分类,以层次结构和内部特征进行细化,信用评级,综合,信用评分、身份认证、社交关系认证、开户情况、通信消费情况和漫游情况;,征信,2.0,模型将提供业务评估系数,使数据更安全,维系模型,已,建立客户存量维系的,9,类模型,,现有营销维系,以大规模普惠制营销为主,缺乏精准营销能力,对维系活动缺乏全流程跟踪评估,位置服务,智能,交通、城市规划、旅游智能化管理、户外媒体效果监测、大数据抢险赈灾、平安中国、商业选址、智能商圈,中国联通的大数据
6、产品,身份认证,开户情况,通信消费情况,漫游,情况,社交关系认证,功能描述:该产品用于,查询,用户姓名、证件、手机号的对应关系,数据元素:手机,号码、姓名是否匹配、证件类型、证件是否匹配、手机号归属省、手机号归属市,功能描述:该产品用于,反映,本用户所有联通账户的基本情况,数据元素:手机,号、开户时间、当前状态、归属省市、信用额度(元)、当前欠费金额(元)、当前欠费月份(个)、当前是否是黑名单、黑名单开始,时间、使用终端,功能描述:该产品,用于反映本用户所有联通账户最近,6,个月的消费,情况,数据元素:手机号、月份、账单金额、计费时长(分钟)、发送短信数(条)、上网流量(,M,),功能描述:该
7、产品用于,反映,本用户最近,6,个月,的,位置,情况,数据元素:手机,号、漫游地点,(省市,)、漫游地最后一次通话、漫游通话次数、漫游通话时,长,功能描述:该产品用于,反映,本用户最近,3,个月常用联系人的通信情况,数据元素:对,端手机号、归属国家、归属省市、通话次数(排序优先,1,)、通话时长(排序优先,2,)、最后一次通话日期、最长通话时长,综合信用评分,功能描述,:综合,用户的常规属性及用户的收入使用状态,对用户的信用进行综合评分,数据元素:,手机号码、,综合信用评分,客户注册,业务申请,信用评估,预授信,业务监控,业务追踪,异常行为预警,功能描述,:通过违约模型、通信行为模型,圈子模型
8、、位置模型推算用户是否存在可疑交易,数据元素:,手机号码,、号码状态等,联通数据产品,风控模型,行业应用,产品,数据魔方,“,数据魔方,”,是面向行业用户的大数据分析产品,基于创新产品服务平台,能力,具备,用户画像,数据字典,等分析,技术,为企业、行业、媒体提供品牌分析、产品分析、消费者分析、营销效果分析的行业报告。,生产,广告,营销,用户更喜欢和关注的,产品属性、参数,,及关注,趋势,,优化生产策略。,了解企业自身用户群体,年龄,性别,喜好,网络访问,习惯及社交特性,。,分析特定区域内用户喜好、消费能力、关注等,行为,,精准投放广告。,分析,线上渠道,,通过网站关注度分析,指导广告投放,分析
9、线,下渠道,关联,分析地理位置和潜在用户,,指导企业销售店铺布局,线下营销,活动,客户,细分,针对性服务推荐,在不同位置给予不同的信息推送,目前已向汽车行业、移动终端行业、服装行业及烟草,行业等多个领域提供,数据,服务。,应用场景,:身份认证与信用度评价,用户数,小额金融账户信息,姓名:李*,号码:,1860105,*,身份证号:,4127241976,*,申请贷款:,20W,小额金融机构,-,信息提供,姓名:张*,号码:,1565211,*,身份证号:,4127241996,*,申请贷款:,5W,1,2,联通征信系统,-,信息比对,&,查询,合作探索,在,网时长:,54,个月,月均消费:,4
10、47.3,元,信用额度:,6860,元,信用评分:,99,分,交际圈信息,通话范围:,呼叫,用户圈,上网信息:关注理财产品,号码:,1860105,*,姓名:李*,是否实名制:是,办理套餐:,3G-386A,套餐,集团标识:集团用户,联通用户信息,号码:,15652113190,姓名:张*,是否实名制:是,办理套餐:,3G-46B,套餐,集团标识:非集团用户,在,网时长,:,5,个月,月均消费:,48.3,元,信用额度,:,1,60,元,信用评分,:,2,0,分,通过联通征信系统,,将小额金融贷款系统提供的客户信息,含姓名、电话号码、身份证号等,与系统内数据资源信息比对,查询该客户的联通信用等
11、信息。,从联通征信系统的各指标系数来看,用户,1,信用评分较高,月均消费较高,信用评分较高,且常关注理财产品信息;用户,2,信用评分较低,且最近三个月有欠费。此类信息可供小额金融机构参考,来确定是否贷款于客户。,欠费信息,:,最近,3,个,月存在,欠,费,比对,应用场景:信贷模型验证,通过联通大数据进一步验证,“,风控模型,”,,同时有针对性进行模型训练。,严格的验证环境管控,通过数据,特区将标签化的,数据验证信息进行反馈。,应用场景:营业厅或,VTM,选址,活动中心识别,功能区识别,功能区评估,空间结构和通勤圈,应用场景:精准营销,依据需求方为中国联通提供的自有客户群号码清单,基于运营平台提
12、供的能力,首先提供仅包含加密后用户编码及相关标签产品的数据(例如不涉密部分的身份验证信息),并批量推送给需求方,由需求方按标签进行二次筛选,锁定营销群后缩小营销,范围。,在需求方获得用户授权后,由,联通平台,提供解密后用户编码及其他用户授权的认证标签,内容,应用场景:客户引流,大数据平台,-,目标,客户群筛选,(,基于数据产品,),自有,/,第三方运营平台(多触点数据运营),积分商城,沃商店,短,信,网关,.,客户营销触点,客服,APP,在线系统,.,在沃商店向目标客户精准推广需求方,APP,在积分商城部署积分兑换需求方产品,在定制化短信提醒中提供需求方相关链接或产品信息,联通侧主动发起,客户
13、主动发起,主动下载行业客户,APP,点击链接登陆在线系统,电话咨询客服,客户引流成功,1,2,3,4,5,营销,需求,根据行业客户营销需求,客户引流数据产品进行目标客户特征筛选,并通过联通营销触点数据运营引导公众主动接入行业客户营销触点,达到引流目的。,联通大数据自用情况,联通基站部署与调优,:针对某区域热力图分析规划基础,建设,紧俏终端定向营销,:根据呼叫圈终端情况及关注信息定向推送选购建议,在网用户,维系,:分析,高风险离网人群的通信行为,特征,,定位重点维系用户及维系策略,联通,517,网购节,:针对用户群分析推出一系列,营销,互动,临时加载流量包,:针对用户某月流量,即将,超出范围,及
14、时,推,送临时流量加载提醒,世界杯手机视频,:针对足球爱好者潜在用户推出流量经营,营销,命中率高于常规营销的,7,倍,提升客户体验,加强透明管控和科学运营,构建新的商业模式,风控征信服务定位于打造标准化、安全化和模型化的数据产品,服务于中小合作伙伴。,风控征信服务可分为传统金融风控(如招联,108,项目)和互联网金融风控(如银联智慧、蚂蚁金服等)。,互联网金融风控,联通支付公司牵头,与,招商银行合作,向对方提供部分号码的客户、,产品等,脱敏后,信息,;,招联,108,辅助,用户支付账户操作的安全,风险(,如大额转账、交易瞬间多笔,转账),提供,一致性,校验、,嫌疑,评分,;,蚂蚁金服,识别当前
15、交易是否为持卡人本人,发觉可疑交易行为,保障持卡人安全。提供身份核实一致性判断、信用评价,易联支付,基础数据,客户资料,用户状态,用户订购,用户储值消费,用户信用欠费,用户通信行为,用户互联网行为,用户终端,用户位置,数据脱敏,建立,征信,模型,征,信信息,数据,特区,传统金融风控,数据服务,用户认证,联通大数据平台能力开放,宽带公司,数据服务平台,合作方,平台,产品组装,合作管理,用户授权,脱敏数据,模型收集,试验田,模型训练,标签数据,生产环境,模型部署,脱敏程序,转换接口,采集同步,数据接口,数据接口,产品输出(一至性和评分),参数输入,产品输出,参数输入,产品服务,金融行业风控合作案例
16、,与某汽车,生产企业合作案例,开发数据魔方汽车版服务门户,从不同维度,提供大量标准化分析案例,实现数据自动化处理、存储、分析、展现。,与某服装制造企业合作案例,该企业,提供高端,用户样本,通过样本分析,提供广告投放指导、用户分布分析、竞品品牌用户分析、用户属性分析、用户关注与喜好分析等多关注维度。,与终端、,APP,厂商合作案例,对终端品牌、型号、分布、用户行为、喜好,提供综合服务报告,指导终端厂商和,APP,厂商的市场策略、产品开发。,行业应用合作案例,与某城市规划司合作,案例,对区域内人口分布分时点统计,划定城区人口热力图,流动人口趋势,活动中心识别,交通路网设计等。,联通大数据下一步能力
17、发展规划,主动信令数据采集,:,计划,2015,年底完成北、上、广,,2016,年底完成全国,短信内容数据分析,:,计划,2015,年,10,月份完成,数据开放服务平台,:,计划,2015,年底建成投产,中国联通与西班牙电信成立合资,公司,扩编专业化运营团队,推出大数据专属服务,合资,公司总资本为,1,亿元,,其中联通出资,6000,万元人民币,西班牙电信出资,4000,万元,。,合资公司将在中国市场开展基于位置的大数据业务,比如精准营销等。,智慧足迹,(,SmartSteps,)。智慧足迹基于完全匿名和聚合的移动网络数据,帮助零售商分析顾客来源和各商铺、展位的人流情况以及消费者特征和消费能力
18、,并将洞察结果面向政企客户提供客流分析和零售店选址服务。,数据安全对外合作的管理原则,中国联通数据安全管理条例,中,涉及对外合作运营时的主要,条例:,(一)数据不出门,:为保证数据安全,不论模型训练数据还是最终的生产数据均不可离开联通的环境,即最终的模型要尽可能部署在中国联通的环境,中,(二)敏感数据不可见,:按照工信部等机关规定的,敏感数据要,进行加密,不可明文提供及可见,(三)数据标签化,:为合作伙伴提供的数据要尽可能不提供具体数值,而是数据标签,(四)数据交互需要用户授权,:在进行相关数据的提取,需要用户的授权为前提,(五)保密协议签署,:外部用户在开展数据合作之前,需要依照国家法律法规
19、和中国联通数据安全管理办法签订合作协议和保密协议,规定双方权利和义务、明确数据使用范围、用途、期限、违约责任,等,工信部,第,24,号,令:,电信和互联网用户个人信息保护规定,2013,年,9,月,1,日,平台侧,自建运营平台,可信通信,数据计费网关,SIMKey,MDM,无纸化会议系统,第三方运营平台,征信,终端,侧,Trusted,Communication,Infrastructure,APP,Notification,SMS,客户,侧,聚合客户,群,开放客户,群,精,准营销,客户引流,大数据平台,数据开放,接口,数据脱,敏,模型及标签库,数据加工,生产,大数据平台负责数据采集、存储、加
20、工及数据产品封装提供,平台侧的数据计费网关负责产品的计费认证及鉴权;自建运营平台和第三方运营平台分别负责各自产品的包装、购买及管理等流程,终端侧的可信通信架构负责将数据应用于,App,、通知,短信等,客户侧分为聚合客户群和开放客户群,前者主要封闭应用面向的用户群体(,ICT,行业大客户),后者主要开放应用面向的用户群体,联通大数据平台架构,达到的能力,基础设施规模,日采集处理能力,数据资产能力,X86,服务器共,1,300,多台,分别用于搭建,GP,集群和,Hadoop,集群;,小型机共,6,台,搭建了,3*2,节点,Oracle-RAC,集群。,B/M,域日采集量,170,亿,条记录;,Gn
21、,口等,O,域日采集量,2,700,亿条记录。,存储容量达,13PB,,数据量达,7PB,;,Oracle,容量,700TB,已使用,97%;,GP,集群容量,900TB,,已使用,59%,;,Hadoop,集群容量,11PB,,已使用,53%,。,2014,年,数据中心在大数据平台建设方面实现了零的突破;从年初的,28,个节点的,Hadoop,分布式存储和计算集群到如今的,1300,节点,形成了国内除三家互联网企业以外的最大的,Hadoop,平台,将,Hadoop,平台与,Oracle,数据仓库和,MPP,分布式关系型数据库打通,通过,ETL,工具形成一体化运营体系,提前将电信、移动设计的目
22、标架构付诸实践,联通大数据平台处理能力,从自然人的角度描述客户属性,以及相应的社会关系。,基础特征,用户订购联通产品信息,包括参与合约计划情况,以及客户对营销活动选择的倾向性信息。,产品需求,从语音、流量、短信等方面分析用户的使用情况以及呼叫圈特征。,业务特征,描述用户出账收入的构成、结算收支、缴费、信用相关的信息。,消费特征,描述客户服务接触中的渠道及渠道偏好信息。,渠道特征,描述用户终端使用信息及终端偏好信息。,终端偏好,从营销、维挽等角度,描述客户价值及客户对服务的满意度。,客户,服务评价,记录用户行动和基站使用轨迹。,位置轨迹,对互联网内容进行分类,描述客户上网行为偏好。,互联网,内容
23、,偏好,客户,标签,大数据平台通过深度数据挖掘,形成了九大类共计,2700,个客户标签。,联通大数据客户标签体系,介绍,基于已沉淀了,2.05,亿,host,规则,支撑了,URL,库,5.6,万多个产品,其中包含,5.2,万余个网站和,4,694,个应用。目前整体识别率可达到,95%,。,识别网站,工具使用,2,180,(个),基础上网,27,272,商务应用,9,156,生活服务,4,886,通信交流,2,734,娱乐休闲,5,308,识别,应用,(个),导航,148,教育,139,通信,213,生活,529,摄影,59,办公,128,社交,331,阅读,266,网络,53,系统,135,娱
24、乐,836,儿童,47,理财,324,资讯,165,美化,193,影音,348,安全,82,旅游,124,购物,151,工具,388,健康,29,其他,6,联通大数据,互联网信息库,联通大数据,终端库,基本参数,型号,iPhone 6,手机类型,智能手机,3G,手机,4G,手机,上市时间,2014,年,10,月,17,日,网络支持,2G/3G,网络,GSM,WCDMA,CDMA2000/1x,CDMA EV-DO,TD-SCDMA,4G,网络,FDD-LTE,TD-LTE,手机频段,GSM850/900/1800/1900MHz,TD-SCDMA 1880-1920/2010-2025MHz,
25、屏幕,主屏尺寸,4.7,英寸,屏幕分辨率,1334,750,像素,像素密度,326ppi,屏幕技术,/,材质,IPS,主屏色彩,1600,万色,触摸屏,电容屏,多点触摸,硬件参数,系统,iOS 8,CPU,苹果,A8+M8,运动协处理器,1.4GHz(64,位双核,),GPU,PVR GX6650,运行内存,1GB RAM,内置容量,16GB,SIM,卡类型,nano SIM,卡,汇总,类型,品牌数,机型数,TAC,数,合计,1,908,45,417,111,465,4G,终端,114,1,421,2,874,3G,终端,729,14,289,35,619,2G,终端,1,724,29,707
26、,72,972,业务类型,出账用户,数,识别率,2G,1.43,亿,83%,23G,融合,0.27,亿,79%,3G,手机,0.62,亿,89%,4G,0.1,亿,85%,终端库分布:,用户终端识别率(,2014,年,11,月帐期):,静态参数(共,169,个):,示例,截止目前终端库数据量统计:,终端品牌:,1,908,个,终端机型:,45,417,个,终端,TAC,号段:,111,465,个(,IMEI,号码前八位,可标识手机型号),用户三元组累计采集:,5.28,亿户,(手机号码、,IMEI,IMSI,),用户五元组累计采集:,4.75,亿户,(,手机号码、,IMEI,IMSI,手机型号、厂商,),谢 谢,中国联通集团,客户事业,部,集团客户通信信息产品,