1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,讯飞大数据方案和应用,汇报提纲,1,讯飞大数据,能力简介,2,大数据,+,金融征信,3,大数据,+,精准营销,4,大数据,+,智慧交通,5,大数据,+,商业智能,汇报提纲,1,讯飞大数据,能力简介,2,大数据,+,金融征信,3,大数据,+,精准营销,4,大数据,+,智慧交通,5,大数据,+,商业智能,科大讯飞的大数据,基础层,应用层,技术层,云计算平台,大数据处理平台,深度学习平台,讯飞语音云,智慧教育,智慧政府,智慧公安,语音识别,人脸识别,手写识别,声纹识别,语义理解,分类,聚类,关联规则,预测,异常
2、检测,讯飞语音云,手写识别,语音搜索,语音合成,语音识别,语音评测,讯飞语音云,声纹识别,语义理解,讯飞语音云通过,3000,多台服务器,构成的,云计算平台,向,亿万用户提供多样的、实时的语音能,力输出,日服务次数,13,亿次,自主研发的,Maple,大数据平台,Hadoop,(,存储,&,计算,),Storm&Spark,Hive&Pig,Hbase,Redis,缓存,搜索引擎,数据库,语音云,应用层,Apps,Maple-SDK,Maple-BDWS,500+,高性能服务器,从全国各地,秒级延迟,收集,500,亿,条信息(,100TB,),支持多业务场景复合运算,支持全数据量,10,遍,的
3、计算处理,每天,整个大数据框架建立在分布式技术之上,具有,水平扩展,特性和能力,即简单加,服务器即可,Maple,大数据平台,全面的,大数据挖掘建模,技术,高水平的数据挖掘研究团队,大数据首席科学家,:陈恩红教授(中科大计算机学院副院长、杰青、,CCF,大数据专委会副主任),讯飞大数据研究院:,由近,10,个博士领衔,针对计算广告、个性化推荐、智慧交通、个性化学习、政府征信等领域开展数据挖掘分析工作,全面的大数据挖掘建模技术能力,意图理解,关键词抽取,文本分类,文本聚类,主题抽取,文本建模,行为建模,Look-alike,建模,关联分析,协同过滤,回归模型,Multi-armed Bandit
4、模型,低秩分解,L1,正则化,决策树,卡方检验,信息增益,特征选择,讯飞已拥有的大数据宝藏,toC,大数据,toB,大数据,教育大数据,社管云,运营商,呼叫中心,公共安全,讯飞输入法,灵犀、酷音铃声,讯飞语音云,移动广告平台,智能音箱、车机、电视、,微博、贴吧、微信公共账号,区域教育解决方案,智慧课堂,智慧校园,智学网,性别,金融理财否,音乐偏好,游戏偏好否,APP,偏好,是否有车,网购兴趣否,工作类型,常住地,常出差地,消费能力,当下潜在需求,有无小孩,年龄段,小孩年级,小孩偏科否,基于,AI,技术提取了,200,多个,关键的用户画像标签,总用户数,7,亿,,月活跃用户,1.8,亿,是否学
5、生,小孩强,/,弱学科,小孩学习能力,彩票,股票,基金,保险,借贷,品类,品牌,价格,奢侈品偏好否,P2P,车品牌,车型,购车意向否,购车偏好,偏好分类,是否付费,偏好风格,自然属性 子女教育 金融 购物 汽车 游戏 其他,智慧教育,智慧政府,智慧公安,计算广告,智慧医疗,智慧交通,相关标签信息支撑服务到各个行业应用之中,讯飞已有的大数据实践工作,计,算,广,告,智,慧,教,育,智,慧,城,市,智,慧,交,通,科大讯飞大数据已经成功应用于多个行业和领域,计算广告,+,大数据,通过用户全渠道,ID,打通,整合多来源数据,采用数据分析、模型预测等技术,实现多层次的用户画像标签,,让,广告更加精准的
6、定向目标用户,广告行为,人口属性,原始输入,搜索行为,事实,有房人群,有车人群,高奢人群,人口属性,点击的广告类型,应用行为,GEO,移动设备数据,第三方业务数据,使用了哪些,APP,玩了什么游戏,搜索过的购物词,人群属性,商业兴趣,消费能力,品牌偏好,当下需求,潜在需求,模型预测,业务类,商务人群,结构化、统计建模,机器学习建模,业务定制规则,采用,“,大数据,+,大规模计算能力,+,精准预测模型,+,高效算法,+,在线训练,”,等核心技术,,科学预测点击率,从而,合理出价,,最终达到广告投放的综合收益最大化,精细、精准的人群标签,智能的竞价模型,大数据助力广告业务提升,游戏用户定投,转换率
7、提升,50%,0.5%,%,1.26%,152%,京东广告对接,点击率提升,152%,平均计算广告的点击率提升,20%,0.5%,%,0.6%,20%,0.6%,%,0.9%,50%,智慧,城市,+,大,数据,进一步增强政府的数据利用能力,带动数据开放与共享,实现基于政务大数据的社管、征信和服务体系建设,提升政府在智慧城市、社会治理和民生服务领域的应用水平。,政府公开数据,A,自带数据,B,模型构建,和数据分析,可视化及危险评估,数据采集,以城市管理为契机,建设政府数据共享体系,通过多源数据分析提升城市治理水平。,促进政府各部门向社会开放共享数据资源,丰富面向公众的信用信息服务。,充分整合政府
8、积累的公共信用数据,提高金融征信模型评价水平。,自动监控,:,对,特定重点区域进行自动监控,例如市政府、主要商区、景点等,一旦人群密度达到预设的警戒线,或者明显超出历史峰值,系统自动以语音、电话、短信等方式告警,案例:,重点,区域自动监控,智慧教育,+,大数据,辅助校级分析与建设,校长,主管部门,学生,家长,跨区域的多维度等值评价,高利害考试的组卷与质量分析,学科与学生素质的关联分析,辅助战略规划与决策,辅助教学质量改进,学业监督与人生规划,提升个性化学习效率,学科发展均衡度分析,教师评价与教学改进,学情分析及,趋势预测,学情智能诊断,基于知识图谱的个性化辅导,选科规划和报考决策,教师,通过对
9、教育大数据(考试、作业、课堂教学等数据)的分析挖掘,实现教学规律建模及趋势预测,为教育相关的管理决策和参与执行提供智能的、个性化的解决方案。,案例:大,数据助力学生成绩提升,15,合肥一中个性化,学习显著提升,成绩,合肥一中参与实验的两个班级(,18,班、,22,班)相比其他平行的对比班级成绩有明显提升,数学成绩排名由中等水平升至第一、第二,第,1,名,第,2,名,人工智能,+,大数据的组合拳,智能医疗,智能助理,智能课堂,智慧城市,智慧学习,智能汽车,运营商大数据商业模式,科大讯飞,有数据、有能力、有平台、有客户、有意愿,和运营商开展大数据合作,汇报提纲,1,讯飞大数据能力简介,2,大数据,
10、金融征信,3,大数据,+,精准营销,4,大数据,+,智慧交通,5,大数据,+,商业智能,运营商数据在金融征信中的重要作用,覆盖广,三大运营商,总,用户,12.77,亿,,普及率,93%,央行征信系统收录,8.7,亿自然人,真实性,2015,年三部委要求全部手机实名制登记,持续性,手机用户不会轻易更换号码,运营商数据保存周期长、时间可回溯,消费能力,手机话费、套餐开支与用户消费能力呈正相关,社交关系,手机联系人和线下社交圈的高度重合性,翼支付(天,翼征,信)积极申请个人,征信,牌照,中国,移动与,招商,银行筹备成立征,信合资,公司,中国联通,与招商银行,成立,“,招联消费金融公司,”,央行征
11、信系统,收集信息包括通讯,缴费记录,案例:芜湖信用示范城市建设,2015,年,8,月,国家发改委和中国人民银行联合发文,将杭州、沈阳、青岛、南京、无锡、宿迁、温州、义乌、,合肥、芜湖,、成都等,11,个城市列入首批全国创建社会信用体系建设示范城市,进行为期,2,年的社会信用体系建设。,讯,飞承建芜湖“,一网三库一平台”,更多应用,互,联,网,政,务,网,社会征信管理平台,社会征信网,服务,查询,三库:,基于自然人、企业及社会组织的信用专题库,一平台:,在政务外网内实现信用数据整合、加工,通过信用模型建立信用主体的信用档案,并提供标准的对外信用服务接口,一网:,主要是开通信用主体的信用信息互联网
12、查询服务,以及异议和投诉申请处理,芜湖个人信用评估体系,业务,(,一,),:反欺诈系统,业务目标,进行用户信息验真,甄别有欺诈倾向申请人,降低不良率,应用场景,向金融机构、支付机构提供欺诈预防服务,应用,于支付,商户所有者接入审核,申请客户,姓名,身份证号,手机号,家庭住址,单位地址,输,入,反欺诈系统,真实性查验,黑,/,灰名单信息,网络行为挖掘,手机号、姓名匹配,运营商数据,讯飞数据,身份证号、住址、姓名匹配,入网时长,(社管云)公检法黑名单、日常民生逾期缴费,手机逾期缴费、网络逾期还款,(社管云)医保社保数据,(语音云)上网行为习惯,上网习惯、通话联系人与时长、短信内容,姓名真实,身份匹
13、配,手机号码,单位地址,固定收入,医保社保,学历状况,房产车辆,银行卡号,联系人员,重疾倾向,活动区域,逾期情况,消费兴趣,其他信息,关联规则挖掘,专家,知识,规则一,/,支持度,/,置信度,规则二,/,支持度,/,置信度,规则三,/,支持度,/,置信度,规则四,/,支持度,/,置信度,规则,N/,支持度,/,置信度,输,出,应用,申请通过,/,拒绝,业务,(,二,),:征信平台,业务目标,在授信前进行信用评定,在授信后进行逾期风险评估,进行预警,应用场景,用户,话费透支额度厘定、讯飞信用芜湖项目征信建设、向第三方提供用户逾期风险预警服务,待评估用户,身份属性,信贷历史,行为偏好,履约能力,社
14、交联系,黑,/,灰名单,年龄,性别,学历,婚姻,单位,户籍,收入,住房,企业主,健康,邮箱,运营商数据,讯飞数据,信用卡,还款记录,笔均额度,逾期还款,社保,低保,在线支付,电商购物,甜橙理财,商旅短信,APP,使用习惯,语音文本,支付,还款,民生逾期,交通违章,通话联系人,短信联系人,通讯录,社交网络,语音联系人,手机欠费,移动黑名单,公检法黑名单,加权,信用,评分,花费透支,额度厘定,政府公共,事业授信,授信前:征信平台,业务,(,三,),:风控平台,业务目标,在授信前进行信用评定,在授信后进行逾期风险评估,进行预警,应用场景,用户,话费透支额度厘定、讯飞信用芜湖项目征信建设、向第三方提供
15、用户逾期风险预警服务,被检测用户,输入数据,运营商维度,讯飞维度,入网后付费,支付,还款,手机使用地,手机联系人,在线消费,理财产品购买,APP,使用,手机类型,浏览器类型,微博内容,语音内容,机器学习模型,决策树,逻辑回归,朴素贝叶斯,支持向量机,集成算法,强化学习,违约,/,不违约人群,逾期,/,不逾期人群,标记数据,输出结果,逾期概率,高风险用户标识,评估,坏账率,授信后:风控平台,汇报提纲,1,讯飞大数据能力简介,2,大数据,+,金融征信,3,大数据,+,精准营销,4,大数据,+,智慧交通,5,大数据,+,商业智能,运营商大数据与精准营销,运营商大数据可以提供,全量用户,的,通信,行为
16、移动互联网,行为和,地理位置,限于,分析能力和隐私政策,,运营商大数据的,价值挖掘有待探索,结合,运营商数据,、社交数据,金融数据建设自有,DMP,,实现,金融产品新客精准营销,结合,移动,自有运营商大数据,,实现,咪咕自有广告精准投放业务,多维度人群分析,筛选目标用户,目标用户量化分析,精准定向投放,拟可开展精准,营销业务,概览,个性化推荐平台建设,运营商大数据,&,讯飞大数据融合,平台业务,精准全面的,DMP,数据业务,讯飞个性化推荐平台建设经验,讯飞个性化推荐业务运营经验,数据及技术支撑,讯飞全面的大数据挖掘建模技术,移动,DMP,建设,讯,飞自有,DMP,优化,套餐,推荐,移动设备
17、推荐,增值业务推荐,因地因人实时营销,特色营销业务,LBS,地理位置定向,实时带来目标人群,业务(一):全方位“描述”用户的,DMP,29,全方位“刻画”用户的大数据宝藏,讯飞,to C,大数据,讯飞,to B,大数据,讯飞教育大数据,移动用户社交大数据,移动用户上网轨迹大数据,移动用户位置大数据,移动,大数据拥有,更精准更全面,的用户人口属性标签,基于移动社交大数据进行相似人群拓展,可使得人群定向,覆盖更广泛,基于移动时序位置大数据,使得,用户,位置相关,标签分析更到位,讯飞拥有,独特的用户,教育相关,标签大数据,讯飞全面的,to C,和,to B,大数据可勾勒出用户多方面的,商业兴趣,标签
18、汽车、购物、旅游等),业务(二):个性化推荐平台,用户行为数据,商品内容数据,效果反馈数据,用户行为分析,文本挖掘,&,商品分析,用户属性库,(,DMP,),商品知识库,核心推荐算法,业务规则排序,推荐控制和补足,应用场景,推荐渠道,推荐交互,和,反馈优化,数据层,算法层,应用层,推荐时机,推荐内容,用户标签数据,讯飞酷音铃声,:推荐场景覆盖首页、单曲、来电等多个交互场景,业务开通量提升,300%,实时查询用户多维度标签,业务(三):因地因人实时营销,31,采,用,LBS,地理位置,定向锁定移动用户,,并基于用户的商业兴趣标签,,能,夠,实时带来,周边目标人潮,!,设定商圈位置和覆盖半径,基
19、于基站,定位,数据,锁定覆盖范围内的,终端用户,DMP,筛选,目标广告人群,定位与基站请求数据,,从而让,LBS,位置定向实时投放成为特色,实时带来周边目标人群,,让受众更精准、牵引更高效,终端广告定向,投放,汇报提纲,1,讯飞大数据能力简介,2,大数据,+,金融征信,3,大数据,+,精准营销,4,大数据,+,智慧交通,5,大数据,+,商业智能,智能交通,+,大数据,基于运营商基站信令数据、移动设备,GPS,定位数据等,实现覆盖全面、划分精细、数据实时的城市密集人群监控和热点区域发现。,综合运用交通大数据,分析拥堵规律,发现堵点时空位置,合理引导车流,实现快速及时疏解。,进一步整合交通领域之外
20、的移动运营、,社交网络等多源异构数据,弥补数据缺失,减少数据误差,提供全面综合的数据视角,提升城市交通管控、交通服务和交通规划水平,。,案例:芜湖智慧城市项目,基于手机用户信令,数据,结合城市基础数据,助力芜湖交通、旅游和公共安全管理服务水平提升。,出行轨迹统计分析,关键路段车速预测,工作居住地潮汐流动规律,区域职住比分析,实时预测拥堵发生路段,景区人流量分析,景区游客来源分析,预测景区客流高峰发生,分析景区发展水平,景区宣传策略优化,城市人群密度变化,重点区域人群密度,指导城建、交通规划,商圈、路段人群疏导,实时预警人群异常聚集,网格人群流动分析,网格人群流入、流出,通过全市各网格区域之间
21、人群分布流动与轨迹,分析各主要区域的人群在不同时段的来源,和,去向,以及其中的流动规律和特点,可为道路、公交规划与优化提供决策支持,职住分析:早高峰人流轨迹,通过对比周末与平时在早高峰时段(,8:00-9:00,)的区域间人流量降幅,降幅最大的是,湾里,龙山,其次是大砻,坊,滨江,可知,湾,里和,大砻,坊区域为居住属性为主,在工作日早晚高峰时需要更充足的公交运力。,通过全市各网格区域的职住特点分析,可为城市管理、交通规划与优化提供决策支持,在晚高峰,时段,(,17:00-18:00,),周末比工作日区域人流量降幅最为显著的是龙山,湾里,,因此,龙山职住比高,该区域工作属性为主,工作日需重点加强
22、交通运力。,职住分析,:晚高峰,人流轨迹,通过全市各网格区域的职住特点分析,可为城市管理、交通规划与优化提供决策支持,海量历史交通数据,实时上报位置数据,实时路况,每天,200,万,条,移动,轨迹,每,5,分钟,更新全市,数据,实时流式,计算平台,100GB/,小时,计算,能力,实时交通路况,目前,:,覆盖,市区,50,个主要路段或路口监控,点,近期,:,覆盖全市高速、,国道、市内各主干道,中期:,实现全市,7*24,小时全路段监控、预警,提供覆盖全市各主要路段的实时交通路况,并通过易户网,/,城市令对外发布,提升交通信息服务水平,并有利于提高易户网的用户活跃度,早高峰拥堵路段,道路名称,当前
23、车速(,Km/h,),畅通车速(,Km/h),拥堵指数,北京中路与中山北路,22,30,1.35,赤铸山中路与中江大道,35,43,1.24,九华中路与赭山西路,23,28,1.21,弋江北路,与赤铸山中路,35,42,1.21,长江中路与赭山西路,24,27,1.11,道路名称,当前车速(,Km/h,),畅通车速(,Km/h),拥堵指数,中江大道与北京中路,35,44,1.26,长江北路与天门山路,27,33,1.23,九华中路和赭山西路,23,28,1.21,银湖南路与中山北路,31,35,1.15,长江中路与赭山西路,24,27,1.11,工作日,周末,公众,出行时,可通过城市令等,AP
24、P,了解主要道路路况,,避开拥堵,,减少,在途时间,,缓解高峰期出行,压力。,道路名称,当前车速(,Km/h,),畅通车速(,Km/h),拥堵指数,长江中路与赭山西路,20,26.68,1.33,中山北路与长江中路,25,33.18,1.33,九江北路,与神山路,30,38.57,1.29,赤铸山中路中江大道,37,43.36,1.17,九江中路与赭山西路,24,27.84,1.16,道路名称,当前车速(,Km/h,),畅通车速(,Km/h),拥堵指数,赤铸山中路与中江大道,23,43.36,1.89,仁和路与中江大道,34,40.56,1.19,银,湖南路与中山,北路,32,35.64,1.
25、11,中江,大道与北京,中路,41,44.12,1.08,鸠江北,路与神,山路,36,38.57,1.07,晚高峰拥堵路段,公众,出行时,可通过城市令等,APP,了解主要道路路况,,避开拥堵,,减少,在途时间,,缓解高峰期出行,压力。,工作日,周末,重点路段路况分析,初六,17:30,开始,长江大桥行驶车速下降,,持续至,22,点,,高峰时,比,平时,车速,下降,20Km/h,芜湖新闻网报道,,长江大桥在初六迎来返程高峰,行驶速度受到严重影响,,与,长江大桥路况分析结果,吻合,重点路段路况分析,工作日、周末,、节日(元旦)道路整体通行速度波动较大,工作日早高峰主要集中,7:30-9:00,,晚
26、高峰主要集在,17:00-18:00,周末早高峰主要集中在,9:00-9:30,,从,13:00,开始,各时段通行车速存在较大波动,元旦早高峰主要集中在,10:00-10:30,,从,18:00,开始,通行车速有较大提升,通过对重点路段的路况监控与分析,发现交通运行规律,提供交通路况预测,为交通管理、规划,与优化提供决策,支持,重点路段路况分析,工作日、周末、节日(元旦)道路整体通行速度相近。,工作日早高峰主要集中,10:30-11:00,和,11:30-12:00,两个时段,晚高峰主要集在,17:30-19:00,周末早高峰主要集中在,8:00-8:30,和,9:30-10:00,两个时段,
27、晚高峰集中在,22:30-23:00,。,元旦早高峰主要集中在,7:00-7:30,,晚高峰主要集中在,22:30-23:00,,车速不足,25km/h,通过对重点路段的路况监控与分析,发现交通运行规律,提供交通路况预测,为交通管理、规划,与优化提供决策,支持,重点路段路况分析,工作日整体通行速度比较稳定,晚高峰,16:30-17:30,存在陡降,周末整体通行速度较高,晚高峰,18:00-18:30,速度下降明显,元旦整体速度较工作日和周末低,,13:00-14:30,和,22:30-23:00,时段通行速度较低,通过对重点路段的路况监控与分析,发现交通运行规律,提供交通路况预测,为交通管理
28、规划,与优化提供决策,支持,17:10,17:50,18:30,图例:九华,中路,-,赭山西路路口,历史,统计最,拥堵时刻,17:50,,,堵,点汇集方向:周边,2,公里范围,无明显,方向,堵,点主要发散方向:银湖北路由南向北,重点拥堵路段分析,通过对重点拥堵路段的路况监控,发现拥堵的来源和去向,分析拥堵成因,提供拥堵预测,为交通管理、规划与优化提供决策支持,汇报提纲,1,讯飞大数据能力简介,2,大数据,+,金融征信,3,大数据,+,精准营销,4,大数据,+,智慧交通,5,大数据,+,商业智能,汇报提纲,1,讯飞大数据能力简介,2,大数据,+,金融征信,3,大数据,+,精准营销,4,大数据,
29、智慧交通,5,大数据,+,商业智能,需求普遍存在,但只有极少数企业有能力构建基于大数据的商业智能应用,企业迫切需要统一大数据与商业智能平台,资料分析,机器学习,统计学,专业知识,工程开发,存储,挖掘,数据采集,一体化,平台,可视化,需要统计学、资料分析、机器学习、工程开发等方面的专业知识,需要贯穿数据采集,存储,挖掘,可视化等全流程的系统,因此,企业挖掘数据金矿,需要强力工具,易用,用户不需要开发,通过鼠标拖拽连接组件,数据处理组件,标准化算法组件、可视化组件,设置参数,即可完成开发,甚至不用写一行代码,全面,具备算法与模型库,涵盖统计、挖掘、特征工程、深度学习、大规模机器学习、文本,图像
30、语音等领域的数据技术,高效,支撑海量数据的处理,以及更优的性能,企业大数据与商业智能平台的核心要求,一站式大数据与商业智能解决方案,简化大数据分析的过程,让人人都能够快速从数据获得决策智慧。,简洁的数据集成、数据清洗、数据预处理便可实现数据分析、数据挖掘、数据可视化、数据报告等的工具。,集成性,的平台,能够将您所有的数据,加载到,Hadoop,Spark,平台,并能够可视化您的数据,挖掘您的数据的高效平台,企业级大数据平台特色,特点,竞争性比较,特点,非结构化数据处理,基于业界领先的智能语音技术、语义理解技术,非结构化数据处理能力突出,能够处理语音(例如呼叫中心通话录音)、文本(网站、微信等
31、电子渠道用户交互内容)等典型非结构数据,挖掘其中丰富信息价值,丰富的数据连接,支持数据类型更多,数据源更丰富,支持传感器数据连接,支持政府开放数据连接,支持互联网开放数据连接,支持文本、视频、语音数据连接,高效的数据存储,同时支持实时数据,大数据存储,,OLAP,查询,业界流行开源方案的增强版,线性扩展,全面的数据挖掘,基于大数据拖拽式的数据挖掘与人工智能开发平台,内置业界最全面、最丰富的数据挖掘算法与模型,,灵活的数据可视化,可视化能力突出,国内最丰富的数据可视化呈现与交互,随心所欲呈现数据价值,海量非结构化数据的挖掘分析,基于语音和语义技术,可自动将,企业呼叫中心,海量,通话和各种,用户,
32、单据内容,结构化,,打上各类标签,挖掘分析有价值信息,,为服务,与,营销,等,提供,数据与决策,支持,。,海量非结构化,语音,或文本数据,挖掘分析,为服务与营销提供信息与决策支撑,服务质量,用户评价,营销机会,通话热点,竞争情报,反馈建议,语音转写,文本挖掘,语义解析,自动聚类,建立索引,系统无缝支持主流,ETL,工具,并能实现,ETL,统一调度、,ETL,调度监控,Informatica,工作流,Kettle,工作流,统一数据访问,支持,RDBMS,、,OLTP,、,OLAP,、,ERP,、,CRM,、大型机、云和各种非结构化数据,高速数据导入和提取,可以在源系统与目标系统之间或直接在,Ha
33、doop,及数据仓库中,访问、加载、复制、转换和提取大数据,无限可扩展性,IT,部门可以处理从,TB,(千吉字节)到,PB,(兆吉字节)任何范围的所有数据类型,优化性能实现最低成本,Hadoop,上的提取、转换和加载,(ETL),基于,Hadoop,的一系列预置转换功能,包括数据类型转换和字符串操作、高性能缓冲查找、连接器、排序器、路由器和聚合,统一数据访问与高效数据处理,丰富建模方法,特点,可拖拽式建模,适应非数据分析人员使用,简便的操作,较低的实施和使用成本,可扩展性强,自定义模型,扩充组件,主流数据对象的支持,传统的关系型数据,(mysql,、,Oracle,等,),列式数据库,(Hba
34、se,等,),非结构化数据,(Hdfs,、文件系统,),大数据(,Hbase,、,Hive,等),R,语言、其他算法模型,等,i-THINK,数据挖掘产品颠覆了传统数据挖掘,内存运算,可视化,数据挖掘,全面的数据挖掘与建模分析方法,仪表盘,决策分析,管理驾驶舱,KPI,绩效,信息图,地图分析,多达,102,种数据展现形式,示例,示例,示例,示例,示例,示例,丰富的大数据可视化展现形式,即席查询,自定义查询条件、无需写,SQL,语句,适合业务人员操作,过滤设置、大数据量查询,样式设置、可视化展现,无需,MDX,语法,交互式统计分析,允许用户任意选择指标、维度和过滤条件等,快速生成查询结果、统计图
35、形等。,可方便进行猜想式、求证式分析,极大提升报表分析的交互能力能满足突发数据分析的需求。,内置同比、环比、,TOPN/TOP%,分析、,80/20,分析以及常用的标准差离散度等数理统计分析指标,灵活的交互式自助分析功能,成本,实施周期,功能,性能,易用,行业,一体化平台,采购成本更低。采用内存计算技,术,硬件采购成本更,低。产品容易使用,,比国内外产品实,施节约,50%,快速实施,将BI实施周期由,月,提升到,周,业界唯一全栈大数据分析产品,覆盖数据挖,掘、商业智能、报,表等应用,产品已经在多,个行业获得使用,,针对数据挖掘、,数据分析有方法论,与业务分析模型的支撑,数据从,GB,到,PB,
36、级别,速度从,秒,到,毫秒,最终用户能够在,一天,之内做到产,品的灵活使用,合作伙伴的使用和开,发培训,时间,小于,一周,平台优势,特点,总结,技术能力,业务洞察,行业解决方案,BI,服务中心,(BI Service Center),数据管理,(,Data Management),(,数据迁移、数据质量、数据清理,),企业内容管理,(,ECM),(,结构化与非结构化信息,),数据仓库,/,大数据平台,(,BI,技术体系架构与数据仓库,/,大数据平台建设,),商业智能与数据挖掘,(,报表、预测分析及数据挖掘,),信息管理战略,生产,企业绩效,管理,风险管控,未来预测,供应链,客户与渠道,运营后台
37、人,/,财,/,后勤,),金融,服务,烟草,快消,零售,制造,汽车,政府,移动,58,为,合作伙伴和最终客户提供基于行业的商业智能整体解决方案,端到端的商业智能解决方案,基于大数据的商业智能应用实践,累计,40,个,行业项目,,每天处理超,400,万,通录音,金融、保险,阳光,保险、平安保险、建设银行、中国平安、招商银行、,交通银行等,移动,覆盖中国移动集团,19,省市,中国移动,6,省市,中国,联通,2,个省市(全国集中平台建设中),其他行业,航空、速递、电力等行业,语音分析,项目需求,整合金融非结构化数据、结构化数据和敏捷数据,建立大数据分析平台,核心应用:,客户群体划分、精准营销、
38、风险管控、运营优化、欺诈行为分析等功能,数据存储,某省数据中心,近五年的操作、交易记录,,,共,1,0,00亿,条以上。,80台,X86,架构的,PC,服务器,服务器配置,,8,核,CPU,32G,内存,数据可视化,全行数据集中可视化,可视化推送以及移动应用,全行数据分析资源集中优化管理,提升数据分析效率,助力业务转型、创新和发展,全行数据分析挖掘的灵活扩展,风险预警评价体系,实现系统化的运营监控,行业应用案例,-,金融,行业应用案例,-,金融,持卡客户分析,应用场景分析,交易行为模式分析,人口统计特征分析,特约商户分析,商户业务收益分析,商户价值贡献度评估,持卡客户和特约商户双向分析,商户收单风险分析,商户广告推送分析,从持卡客户维度分析客户消费习惯、挖掘交叉销售和增值销售机会、识别和挽留高价值客户优化客户生命周期价值,提高客户忠诚度和盈利能力。,从特约商户的维度分析客户消费情况,评估商户贡献度,为商户的管理和配合的营销活动提供决策支持。,商业智能应用框架,61,行业应用案例,-,金融,信用风险评估模型库,以,i-THINK,大数据分析平台为基础,以信用风险评估模型库为引擎,实现系统化的运营监控;,日均手工监督工作量由,895.8,万笔,降至,5.4,万笔,,全行释放了,5900,余名,的业务监督人员。,行业应用案例,-,金融,大数据时代,不可不为,大有可为!,






