1、第四章 数据挖掘、数据仓库与CRMq数据挖掘与数据仓库qCRM中的数据挖掘与数据仓库q数据挖掘、数据仓库的行业应用q实例演示1.4.1 数据挖掘与数据仓库2.数据挖掘、数据仓库的产生背景数据爆炸但知识匮乏3.数据:一般的数据:一般的业务业务操作,通常都操作,通常都会会产产生大量的数据,如生大量的数据,如订单订单、库库存、交易存、交易帐帐目、通目、通话记录话记录、及客、及客户资户资料等。料等。信息:如何利用企信息:如何利用企业业的的历历史数史数据增据增进对业务进对业务情况的了解,帮情况的了解,帮助我助我们们在在业务业务管理及管理及发发展上作展上作出及出及时时、正确的判断,需要从、正确的判断,需要
2、从数据成数据成为为信息信息 4.n数据库技术应用发展迅速q积累了大量的数据q提高效率的同时,也带来了一些问题:n数据过量、难以消化;n真假难辨;n数据形式不一、难以统一处理;n5.n如何抛弃不必要的数据,从大量数据中及时提取有用的知识?数据挖掘数据挖掘从大量的数据中挖掘从大量的数据中挖掘出有用的知出有用的知识识6.Advanced Scout 7.数据仓库的定义n数据仓库Data Warehouseq数据仓库是支持管理决策过程的,面向主题的,集成的,随时间而变的,持久的数据集合。(W.H.Inmon)q数据仓库是一个环境,而不是一件产品,提供用户用于决策支持的当前和历史数据,这些数据在传统的操
3、作型数据库中很难或不能得到。q数据仓库技术是为了有效的把操作型数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称8.传统数据库分析方法n数据库系统:由数据库、数据库管理系统、应用开发工具、应用系统、数据库用户组成nOLTP(On-Line Transaction Processing)联机事务处理系统q基本任务及时、安全的将当前事务所产生的记录保存下来。n外部接口:实现标准的SQL语言n内部:实现事务管理,支持事务的并发和恢复9.数据仓库的基本特征n数据仓库的数据是面向主题的;n数据仓库的数据是集成的;n数据仓库的数据是不可更新(稳定)的;n数据仓库的数据是随时间不断变化的。10
4、.数据仓库的体系结构DatabaseDatabaseDatabaseDatabaseDatabaseDatabase外部数据数据数据数据数据仓库仓库仓库仓库服服服服务务务务器器器器抽取,清洗抽取,清洗转换转换,载载入入服服务务查询查询,报报表表管理管理数据挖掘数据挖掘数据源数据源数据数据仓库仓库数据集市数据集市元数据元数据OLAP服服务务前端工具前端工具数据集市数据集市数据准数据准备备OLAP服服务务器器11.数据仓库体系结构n数据抽取工具:数据抽取工具:把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。n数据数据仓库仓库数据数据库库:是整个数据仓库环境的核心,是数
5、据存放的地方和提供对数据检索的支持。相对于操作型数据库来说其突出的特点是对海量数据的支持和快速的检索技术。12.n元数据(元数据(Metadata):):描述了数据的结构、内容、编码、索引等。传统数据库中的数据字典是一种元数据,但在数据仓库中,元数据的内容比数据库中的数据字典更加丰富和复杂。可将其按用途的不同分为两类,技术元数据和商业元数据。q技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库使用的数据。包括:数据源信息;数据转换的描述;数据仓库内对象和数据结构的定义;数据粒度;数据清理和数据更新时用的规则;源数据到目的数据的映射;用户访问权限,数据备份历史记录,数据导入历史记录,
6、信息发布历史记录等。q商业元数据从商业业务的角度描述了数据仓库中的数据。包括:业务主题的描述,包含的数据、查询、报表;13.n数据集市(数据集市(Data Marts):为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(subject area)。在数据仓库的实施过程中往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。n数据数据仓库仓库服服务务器器:相当于数据库系统中的DBMS,负责管理数据仓库中数据的存储管理和数据存取,并给OLAP服务器和前台工具提供存取接口(如SQL查询接口)nOLAP服服务务器器:透明地为前台工具和
7、用户提供多维数据视图。OLAP服务器则必须考虑物理上这些分析数据的存储问题14.OLAP(联机分析处理技术)nOLAP(On-Line Analytical Processing)即联机分析处理,是以海量数据为基础的复杂分析技术 n一、多维数据模型q数据分析时用户的数据视图,是面向分析的数据模型,用于给分析人员提供多种观察的视角和面向分析的操作 q可用这样来一个多维数组来表示:(维1,维2,维n,度量值)15.联机分析处理技术(续)v一、多维数据模型(续)例如:(地区,时间,电器商品种类,销售额)n三维数组可以用一个立方体来直观地表示n一般地多维数组用多维立方体CUBE(超立方体)来表示16.
8、联机分析处理技术(续)n二、多维分析操作 常用的OLAP多维分析操作q切片(slice):在两维空间上的分布q切块(dice):在多维空间上的分布q旋转(pivot):变换维的方向,即在表格中重新安排维的放置(例如行列互换)q钻取:钻取是改变维的层次,变换分析的粒度。n向上钻取(roll-up):在某一维上将低层次的细节数据概括到高层次的汇总数据n向下钻取(drill-down):从汇总数据深入到细节数据进行观察17.联机分析处理技术(续)n三、OLAP的实现方式q按照多维数据模型的不同实现方式nMOLAP(Multidimensional OLAP)多维nROLAP(Relational O
9、LAP)关系nHOLAP(Hybrid OLAP)混合18.MOLAPnMOLAP结构q以多维立方体CUBE来组织数据,以多维数组来存储数据,支持直接对多维数据的各种操作。q多维数据库(Multi-Dimension DataBase,简记为MDDB)。19.ROLAPnROLAP结构q用RDBMS或扩展的RDBMS来管理多维数据,用关系的表来组织和存储多维数据q两类表:一类是事实(fact)表,另一类是维表n事实表用来描述和存储多维立方体的度量值及各个维的码值;n维表用来描述维信息。qROLAP用“星形模式”和“雪片模式”来表示多维数据模型20.ROLAP(续)n星形模式(Star Sche
10、ma)通常由一个中心表(事实表)和一组维表组成 星形模式的中心是销售事实表维表有时间维表、顾客维表、销售员维表、制造商维表和产品维表 21.ROLAP(续)n雪片模式就是对维表按层次进一步细化后形成的22.HOLAP(续)nHOLAPq基于混合数据组织的OLAP实现(Hybrid OLAP),具有更好的灵活性。n低层是关系型的n高层是多维矩阵型的23.n前台工具前台工具:包括查询报表工具、多维分析工具、数据挖掘工具和分析结果可视化工具等 n数据数据仓库仓库管理:管理:安全和特权管理;跟踪数据的更新;数据质量检查;管理和更新元数据;审计和报告数据仓库的使用和状态;删除数据;复制、分割和分发数据;
11、备份和恢复;存储管理。24.数据仓库的实施步骤nDWq项目计划q业务需求分析q数据线实施n数据仓库设计n数据预处理:ETLn数据维护q技术线n技术选择n产品选择q应用线q系统运行维护25.演示:Analysis ManagernMicrosoft SQL Server的多维数据模型:以FoodMart Corporation为例,建立三个多维数据集,即 Marketing(市场营销)、HR(人力资源)和 Expense Budget(开支预算)1.设置系统数据源名称(DSN)2.建立数据库和数据源3.建立事实数据表和维度表4.设计多维数据的存储模式:多维 OLAP(MOLAP)、关系 OLAP
12、(ROLAP)或混合 OLAP(HOLAP)26.数据挖掘的定义n数据挖掘 Data Miningn技术角度的定义q数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。n商业角度的定义q数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的海量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。27.为什么要数据挖掘?潜在的应用n数据分析和决策支持q市场分析和管理n目标市场定位,客户关系管理(CRM),购物篮分析,交叉销售q风险分析和管理n预测,客户保持,质量控制,竞争
13、分析q欺诈检测和不寻常模式的检测(离群点)n其他的应用q文本挖掘(新闻组,email,文档)和Web挖掘q流数据挖掘q生物信息学和生物数据分析28.Ex.1:市场分析和管理n数据从哪来?信用卡交易事务,会员卡,优惠券,客户投诉电话,公众生活方式研究n目标市场q寻找“榜样”客户的聚类,他们共享相同的特征:兴趣,收入水平,消费习惯等 q确定客户在一段时间的购买模式n交叉市场分析寻找产品销售之间的关联/相关性,以及基于这些关联进行预测n客户轮廓(profile)什么类型的客户买什么产品(聚类或分类)n客户需求分析q为不同的用户识别最好的产品q预测什么因素将吸引新的客户n摘要信息提供q多维摘要信息报告
14、q统计学总结信息(数据中心的趋势和变化)29.Ex.2:公司分析和风险管理n财经计划和资产评估q现金流分析和预测n资源计划q总结比较资源和开销n竞争q监控竞争对手和市场方向 q细分客户类别,制定基于类别的定价过程q在激烈竞争市场中建立价格策略30.Ex.3:欺诈检测和挖掘异常模式n方法:为欺诈和离群点分析进行聚类和模型构建n应用:医疗保健,零售业,信用卡服务,电信业.q汽车保险:检测出那些故意制造车祸而索取保险的人q洗钱:可疑的资金流向 q医疗保险n检测出职业病人n不必要、不相关的医学检验q电信业:电话欺诈n电话模式:呼叫目的地,持续时间,每天或每周的次数。分析与预期标准相背离的模式q零售业n
15、分析师评估认为38%的零售业萎缩是因为不诚实的雇员q反恐怖主义31.知识发现(KDD)过程q数据挖掘知识发现过程的核心数据清理数据清理数据集成数据集成数据数据库库数据数据仓库仓库任任务务相关的数据相关的数据选择选择数据挖掘数据挖掘模式模式评评估估32.数据挖掘:多种技术的融合 数据挖掘数据挖掘数据数据库库技技术术统计统计学学机器学机器学习习模式模式识别识别算法算法其他技其他技术术可可视视化化33.为什么不是传统的数据分析?n庞大的数据q算法必须能够高度可伸缩以便处理TB数量级的数据n高维度的数据 q如Microarray(微阵列)可能有成千上万个维度n数据的高复杂性q数据流和传感器数据q时间序
16、列数据,时间数据,序列数据q结构数据,图,社会网络和多链接数据q异构数据库和遗产数据库q空间,时空,多媒体,文本和 Web 数据q软件程序,科学仿真n新的和复杂的应用34.数据挖掘 VS 传统分析方法有何区别?数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。35.数据挖掘系统结构数据数据仓库仓库数据清理数据清理 数据集成数据集成过滤过滤数据数据库库数据库或数据仓库服务器数据挖掘引擎模式评估图形用户界面 知识库36.数据挖掘数据挖掘过过程程n数据挖掘过程包括:q数据准备(选择、预处理、转换)q确定主题q读入数据、建立模型、理解模型q解释与评价q知识应用分析分析分析分析问题问题问题问题整合数
17、据整合数据整合数据整合数据建立模型建立模型建立模型建立模型理解理解理解理解规则规则规则规则预测预测预测预测未来未来未来未来37.数据挖掘技数据挖掘技术术分分类类数据挖掘数据挖掘数据挖掘数据挖掘描述描述描述描述预测预测预测预测可可可可视视视视化化化化聚聚聚聚类类类类关关关关联规则联规则联规则联规则汇总汇总汇总汇总描述描述描述描述分分分分类类类类统计统计统计统计回回回回归归归归时间时间时间时间序列序列序列序列决策决策决策决策树树树树神神神神经经经经网网网网络络络络38.数据挖掘的模型(1)n分分类类(Classification)与决策)与决策树树(Decision trees)q分类分析是为了找
18、出描述和区分数据类或概念的模型,常常通过决策树、神经网络等模型进行表示。q决策树:n根节点、节点、分支、叶子。39.在贷款申请中,要对申请人的风险大小做出判断40.数据挖掘的模型(2)n聚聚类类(Cluster)q聚类是把一组个体按照相似性归成若干类别的过程。q原则:最大化类内部的相似性、最小化类之间的相似性q聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。41.42.n关关联联(Association)q关联规则是形式如下的一种规则,“在购买面包的顾客中,有90%的人同时也买了牛奶”:(面包)(牛奶),计为XY。q评估关联规则的四个重要指标是:n(1)支持度支持度(sup
19、port):交易集中包含X和Y的交易数与所有交易数之比,记为support(XY)n(2)可信度可信度(confidence):包含X和Y的交易数与包含X的交易数之比,记为confidence(XY)n(3)期望可信度期望可信度(expected confidence):描述了在没有物品集X的作用下,物品集Y本身的支持度,记为E-confidence(Y)n(4)作用度作用度(lift):作用度是可信度对期望可信度的比值。描述了物品集X对物品集Y的影响力的大小。记为Lift(XY)。一股情况,有用的关联规则的作用度都应该大于l,才说明X的出现对Y的出现有促进作用,也说明了它们之间某种程度的相关
20、性,如果作用度不大干l,此关联规则也就没有意义了。数据挖掘的模型(3)43.设 supmin=50%,confmin=50%关联规则:A D (60%,100%)D A (60%,75%)Customerbuys diaperCustomerbuys bothCustomerbuys beerTransaction-idItems bought10A,B,D20A,C,D30A,D,E40B,E,F50B,C,D,E,F44.数据挖掘的模型(4)n序列模式(Sequential Pattern)q分析数据之间的前后(因果)关系,类似于关联分析q用于发现客户潜在的购物模式n先购买PC,再购买数码
21、相机,接着还要买存储卡n5天之内,X股票最多上涨10,Y股票涨幅在1020之间,Z股票在下星期上涨的概率为68。q指标n最小支持度n最小可信度45.4.2 CRM中的数据挖掘与数据仓库46.CRM与数据挖掘、数据仓库的关系n数据的整合、集中nCRM的业务整合n数据分析与知识发现47.在CRM中的应用范围 客客户户盈利能力;盈利能力;客客户户保留;保留;客客户细户细分;分;客客户倾户倾向;向;渠道渠道优优化;化;风险风险管理;管理;欺欺诈监测诈监测;购购物物倾倾向分析;向分析;需求需求预测预测;价格价格优优化。化。48.案例:基于DW、DM的客户营销管理流失流失预预警模型警模型交叉交叉销销售模型
22、售模型客客户户行行为为细细分模型分模型更多模型更多模型营销营销信息信息预预警警营销营销方案策划方案策划绩绩效管理效管理主主动营销动营销客客户户行行为为数据数据业务业务系系统统数据数据仓库仓库数据挖掘数据挖掘模型行行为为数据数据行行为为数据数据客客户户挽留挽留营销营销信息信息层层分析企划分析企划层层管理管理实实施施层层49.客户行为细分0200500低低端端中中端端高高端端ARPU值值相似相似的客的客户户需求特需求特点却差点却差别别很大很大客客户细户细分之分之谜谜根据根据ARPU值进值进行客行客户细户细分的方法分的方法基于数据挖掘技基于数据挖掘技术术的以需求的以需求为为基准的基准的细细分分客客户
23、户行行为为价价值细值细分模型分模型海量客户行为数据/特征数据组组内行内行为为特点相特点相似似组间组间行行为为差异差异较较大的客大的客户户分分组组50.客户行为细分(续)客客户户行行为细为细分模型分模型客客户户流失流失倾倾向向预预警模型警模型价格敏感度模型价格敏感度模型客客户户信用信用评评分模型分模型交叉交叉销销售模型售模型营销营销效果效果预测预测模型模型客客户户价价值值评评估模型估模型51.客户行为细分模型通过上百个变量描述客户性性别别年年龄龄建档建档时间时间证证件号件号码码缴缴款方式款方式信息信息费费应应收金收金额额优优惠金惠金额额滞滞纳纳金金应应收收SMSSMS次数次数国国际际呼叫呼叫呼入
24、呼入/呼出比例呼出比例短消息短消息话单类话单类型型信息信息长长度度赠送送费用用呼呼转类型型漫游漫游话费话费通通话时长赠赠送分送分钟钟数数费用用类型型动态动态漫游号漫游号IMSIIMSI号号码月均基本通月均基本通话话月均国内月均国内长长途途工作日呼叫次数工作日呼叫次数工作日呼叫工作日呼叫时间时间WAPWAP呼叫呼叫时间时间繁忙繁忙时时段呼叫次数段呼叫次数非繁忙非繁忙时时段呼叫次数段呼叫次数SMSSMS次数次数WAPWAP次数次数IPIP呼叫次数呼叫次数语语音呼叫次数音呼叫次数非非语语音呼叫次数音呼叫次数月均国月均国际长际长途途非非IPIP呼叫呼叫时间时间52.数据挖掘自动生成影响客户分组的主要因
25、子性性别别年年龄龄缴缴款方式款方式SMSSMS次数次数国国际际呼叫呼叫其它其它优优惠金惠金额额短消息短消息话单类话单类型型赠送送费用用费用用类型型漫游次数漫游次数应应收金收金额额IDDIDD次数次数月均国内月均国内长长途途月均基本通月均基本通话话非非语语音呼叫次数音呼叫次数SMSSMS次数次数WAPWAP次数次数月均国月均国际长际长途途语语音呼叫次数音呼叫次数费用用类型型因子分析因子分析53.聚类分析根据自身所具有的特征自动聚为一些行为特点相似的群体低高高高1 1 1 12 2 2 28 8 8 84 4 4 45 5 5 53 3 3 37 7 7 76 6 6 6因素二(国内呼叫次数)因素
26、二(国内呼叫次数)因素三(因素三(IPIP呼叫次数)呼叫次数)因素一(繁忙因素一(繁忙时时段呼叫次数)段呼叫次数)示例示例54.16个组中呈现出差别明显的优势、弱势特征组组号号优势优势特征特征弱弱势势特征特征描述性名称描述性名称#1语语音每次呼叫音每次呼叫时间时间、香港(澳、香港(澳门门)呼叫、非繁忙呼叫、非繁忙时时段呼叫段呼叫繁忙繁忙时时呼叫、呼叫、IP呼叫、短信、呼叫、短信、转转移移业业余活余活跃组跃组#2繁忙繁忙时时段月均呼叫次数、漫游地区段月均呼叫次数、漫游地区呼叫、香港呼叫次数呼叫、香港呼叫次数转转移呼叫、短信、移呼叫、短信、转转移移业务业务繁忙繁忙组组#4IP呼叫、呼叫、转转移呼叫
27、移呼叫贵贵中求惠中求惠组组#6IP呼叫呼叫短信、短信、转转移移IP手机手机组组#9IP呼叫、短信呼叫、短信非繁忙非繁忙时时段呼叫段呼叫新生潜力新生潜力组组#12非繁忙非繁忙时时段呼叫段呼叫漫游地区呼叫、漫游地区呼叫、转转移、短信移、短信夜夜间积间积极极组组#14繁忙繁忙时时段月均呼叫次数段月均呼叫次数漫游呼叫、非繁忙呼叫、漫游呼叫、非繁忙呼叫、转转移移本地繁忙本地繁忙组组#16繁忙繁忙时时段月均呼叫次数、段月均呼叫次数、转转移呼叫、移呼叫、香港(澳香港(澳门门)呼叫)呼叫IP呼叫呼叫繁忙大客繁忙大客户组户组#8短信短信转转移呼叫、移呼叫、IP短信短信专专家家组组#11转转移呼叫移呼叫繁忙繁忙时
28、时段月均呼叫次数、短信段月均呼叫次数、短信热热衷衷转转移移组组#15漫游地区呼叫漫游地区呼叫短信、繁忙呼叫次数短信、繁忙呼叫次数频频繁出差繁出差组组#3语语音每次呼叫音每次呼叫时间时间繁忙繁忙时时段次数、短信段次数、短信情深情深语长组语长组#5繁忙繁忙时时段次数、每次呼叫段次数、每次呼叫时间时间、短信、短信消极等待消极等待组组#7呼入呼入/呼出比呼出比短信短信等待接听等待接听组组#10繁忙繁忙时时段次数、呼入段次数、呼入/呼出比、每次呼叫呼出比、每次呼叫时间时间休眠休眠组组#13繁忙繁忙时时段月均呼叫次数段月均呼叫次数寂寞无声寂寞无声组组55.各类客户人数及收入贡献一览人数人数百分比百分比收入
29、收入贡贡献献百分比百分比59.61%56.41%15.08%28.51%14.89%25.91%客客户户群群优质优质普通普通弱弱势势组别#1、#2、#4、#6、#9、#12、#14、#16#8、#11、#15#3、#5、#7、#10、#13人数103,66454,816205,071收入贡献RMB29,659,162.05RMB7,204,282.92RMB12,897,830.1优质优质普通普通弱弱势势56.示例:全球通(后付费)客户的17个客户分组客客户户群群组组号号人数(万人)人数(万人)人数百分比人数百分比组组内月人均内月人均话费话费组组名名优质组#91.51.5%970国际呼叫组#4
30、1.71.8%865业务繁忙组#21.51.6%758呼叫香港组#141.01.0%729国内长途组#151.41.4%640呼叫台湾组#1611.611.8%420本地繁忙组#111.21.2%407转移移动组普通组#102.82.9%351热衷IP组#124.64.7%347商务潜力组#132.12.1%331全面发展组#51.91.9%321呼转电信组#72.02.0%286短信热衷组#171.61.6%241转移联通组弱势组#86.76.9%221IP长聊组#64.34.3%205短信潜力组#114.114.4%171情深语长组#338.439%100节约通话组57.对细分客户组进行特
31、征描述本本组组特征描述特征描述1.本组客户共15441人,占客户总数的1.6%,组内每月人均话费759元。2.与其他客户相比,本组客户的显著特征体现在呼叫香港的通话行为较多(因素7)。香港月均每次呼叫时间达1.8分钟,月均呼叫次数8.7次,而全体客户平均香港月均每次呼叫时间1.6分钟,月均呼叫次数只有0.2次。由此,本组客户的香港月均呼叫费用(53.7元)比全体客户平均呼叫费用(1.3元)高出40多倍,香港呼叫需求相当大。第二第二组组:呼叫香港:呼叫香港组组 优质组优质组人数:15,441月人均话费:759元与全体客户话费均值之比:3.0人数百分比:1.6%女性比例:38.2%平均在网时间:4
32、3.258.业务推广与客户服务建议本本组组市市场场建建议议1.业务业务推广建推广建议议a)彩信业务统计分析发现本组客户彩信使用人数比例明显大于其他16个客户分组b)GPRS业务估计本组客户中有相当部分人群是商务人士2.客客户户服服务务建建议议a)免费赠送香港天气预报b)与航空公司里程积点互换c)空港VIP休息室59.2、产品交叉销售交叉交叉销销售售升升级销级销售售市市场场拓展拓展市市场场渗透渗透新新产产品品老老产产品品老客老客户户新客新客户户向老客户销售其尚未使用的产品向老客户促销其正在使用的产品以促使更多消费将老产品销售给新的客户将新产品销售给新客户交叉交叉销销售研究要点售研究要点交叉销售通
33、过研究客户的产品使用情况、消费行为特点,发现老客户的潜在需求交叉销售通过产品之间的关联,寻找实现产品捆绑销售的机会交叉销售为新产品寻找已有用户中的目标群体60.相关性弱相关性弱根据产品业务关联性评分表,形成某一产品与其他产品关联关系图,以形象说明本产品与其他产品之间的关联关系(正相关或是负相关)及其关联性强弱。正正向向关关联联负负向向关关联联客客户户取消取消产产品品时时作作为为替替补补品品考考虑产虑产品品捆捆绑销绑销售售替代性弱替代性弱相关性相关性强强替代性替代性强强产品业务关联关系图说明61.产品A与语音信箱、移动梦网、随E行、数据通信、呼转小叮铛、彩信、百宝箱、20元/0元GPRS套餐都有
34、正向关联关系。某一产品与其他产品/业务的关联关系62.IP长聊组IP长途组节约通话组短信潜力组长话短说组本地小康组短信专家组长途电话组夜间积极组长话长说组等待接听组本地繁忙组情深语长组热衷转移组差旅人士组(次)产品A分组普及率分析7短信专家组、4短信潜力组用户对产品A的兴趣相当较浓,可作为大规模推广该产品的突破口。9夜间积极组、15差旅人士组、8组长途电话组根据用户行为分析,也应用有较大的交叉销售机会。产品A客户分组交叉销售机会63.4.3 数据挖掘数据仓库的行业应用64.问题问题描述:描述:预测预测信用水平是好信用水平是好还还是差,是差,银银行据此决定是否向客行据此决定是否向客户发户发放放贷
35、贷款,款,发发放多少放多少 结结果描述果描述:(决策决策树树)收入大于5万元/年是否有无储蓄帐户是否房主是是否否批准不批准批准金融65.问题问题描述:根据客描述:根据客户户信息,信息,预测预测客客户户流失可能性流失可能性 结结果描述果描述:(神神经经网网络络)输 入流失概率(0.87)输 出男293000元/月神州行130元/月电信66.问题问题描述:如何决定超市中商品的描述:如何决定超市中商品的摆摆放来增加放来增加销销售售额额 结结果描述果描述:(Web图图)零售67.问题问题描述:如何描述:如何对对市市场进场进行行细细分,使分,使产产品品满满足最有价足最有价值值客客户户 结结果描述果描述:
36、(聚聚类类分析)分析)营销营销活活动动回回应应率率制造业68.问题问题描述:如何从众多申描述:如何从众多申请经费请经费或者或者纳纳税中税中发现发现欺欺诈诈 结结果描述果描述:(回回归归、神、神经经网网络络)政府69.4.4 数据挖掘软件实例演示70.常见的数据挖掘软件nSASEnterprise MinernSPSSClementinenMegaputer-PolyAnalystnDBminernOraclenDatamindnKnowledge seekernCart71.SAS Enterprise Miner72.SPSS Clementine73.DBMiner74.Poly Analyst75.谢谢观看!
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100