1、基于关联分析的数据挖掘在中的应用摘要 随着数据挖掘在企业客户关系管理中应用的深入,关联分析越来越成为企业在CRM中应用最广泛的数据挖掘方法和模式。本文以一家企业CRM关联分析为例,围绕关联分析实践了数据挖掘的过程,指明了该过程的意义,并结合挖掘结果分析了该企业CRM的工作重点。关键词 数据挖掘 关联分析 CRM一、引言CRM是指企业为了获取最大经济效益,运用现代科学技术对公司与客户之间的关系进行有效管理的新模式,它包括市场调查、产品销售、客户服务和管理决策等一系列商业流程。随着客户数量的大量积累,客户信息的日益复杂,仅限于营销流程的管理已很难满足企业进一步发展的需要。另外,激烈竞争的市场环境,
2、迫使企业必须立足于客户的个性需求,提供相应的产品和服务,而客户的个性特征如何获取,是企业面临的难题之一。数据挖掘作为一种强有力的数据分析工具,在分析型CRM中的关键作用已经显现,为企业进行全面深入和多维的客户分析提供了强有力的工具。数据挖掘技术在企业的客户关系管理中,可以应用到客户群体分类分析、交叉销售、客户的维护、客户盈利能力分析和预测、客户满意度分析等;而关联分析是商业分析中应用最广泛的一种数据挖掘方法和模式。二、基于关联分析的数据挖掘关联分析是数据挖掘的一种主要形式,而且是无监督学习型系统中最普遍的知识发现形式。典型的关联分析体现在基于交易数据的购物篮分析中。关联分析能够发现交易数据库中
3、不同商品之间的联系,如购买了某一商品对购买其他商品的影响。这种影响有时是正面的,有时是负面的,例如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”,表明商品A与B是正相关的。这种规则可以表示为“A=B”,表明顾客在购买商品A的条件下,购买B的概率。根据类似规则可以对顾客的购买模式进行深入分析,发现对商业决策有价值的规则和知识。用于关联规则发现的主要对象是事务型数据库,其中针对的应用则是售货数据,也称货篮数据。一项事务一般由事务处理时间、一组客户购买的物品、客户标识号等组成。由于条形码技术的发展,零售部门可以方便地收集存储大量的售货数据。对这些历史事务数据进行关联分析,则可对客户的购买
4、行为提供极有价值的信息。例如,可以帮助规划市场。从事务数据中发现关联规则,对于改进销售业绩等商业活动的决策是非常重要的。三、关联分析在企业CRM中的应用实例1.数据挖掘的主题某企业以销售打印机相关产品为主要业务,客户中有购买商品自用的最终客户,也有批发商,多年的业务使企业积累了一定量的销售数据。本次数据挖掘的主题就是对这些数据展开关联分析,找到最有价值客户中的购买规律,从大量的交易数据中,获得这些大客户购买商品的种类和频率;通过关联规则,找出最受大客户欢迎的商品;并根据大客户的喜好,采取相应措施维护客户关系,实现客户价值。 数据的收集本次数据挖掘我们从该销售公司的原始销售表格中提取了以下数据作
5、为我们数据挖掘的原数据(1)客户名称:描述客户关系管理的对象;(2)单号、货品编码、数量、销售货款:描述每个客户所购买的货品、数量、每一笔交易中每一种货品的总价格;(3)销售收入、销售毛利:描述哪些商品盈利大,哪些商品最畅销;(4)开单日期:描述客户购买的频率;(5)品名规格、计量单位、单价:描述客户所购商品的基本信息 数据预处理采用关联规则的挖掘方法,需要先对数据进行预处理,就是对数据进行筛选,选出数据挖掘中需要的数据,并且对数据进行整理。首先以每个客户的半年交易总额为参考,把交易总额低于10万的客户剔除,因这部分客户大都是零散购买商品的客户,公司购买商品量比较小,毛利率低,客户关系维护的价
6、值不大。其次,把交易总额高于10万的客户再进行一次筛选,剔除属于一次性购买大量的办公自动化用品的用户,这样留下的客户则是那些与公司有多次交易往来并且交易总额比较大的客户,当然这些客户是公司主要的客户关系维护目标。数据经过筛选以后,在实现数据挖掘之前,还需要对数据进行二元处理。首先,把商品分为6大类,分别为“复印机”、“墨粉”、“硒鼓”、“复印纸”、“打印机”“送纸器”。其次,判断大客户是否购买这些商品,并以二元数据加以表示。处理后的数据如表2所示。 数据挖掘的实现本次数据挖掘选用Weka GUI Chooser工具。Weka GUI Chooser是基于Java的用于数据挖掘和知识分析的平台,
7、集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理、分类、回归、聚类、关联规则以及在新的交互式界面上的可视化。本文对企业销售数据的挖掘,只选用关联规则算法,调用Weka GUI Chooser挖掘工具中的Associate Rules的模块,选定关联规则中的Apriori算法,将预处理好的数据转换为文本格式,导入Weka GUI Chooser进行挖掘。挖掘后的结果显示为:Best rules found:toner=yes printer=no 400 = manifdder=no paper=no 235 conf:()manifdder=no automatic-docum
8、ent-feeder=no 566 = paper=no printer=no 332conf:()manifdder=no 620 = toner=yes printer=no 363conf:()toner=yes 410 = manifdder=no paper=no automatic-document-feeder=no 240conf:()toner=no automatic-document-feeder=no 504 = manifdder=yes tambour-opc=no printer=no 294 conf:()manifdder=no printer=no 530
9、= tambour-opc=no 309conf:()paper=no 672 = toner=no 390conf:()manifdder=no 620 = toner=yes printer=no automatic-document-feeder=no 359conf:()toner=yes printer=no 400 = manifdder=no paper=no automatic-document-feeder=no 231conf:()paper=no 672 = manifdder=no automatic-document-feeder=no 388conf:()在所得结果
10、中,有意义的关联规则主要有:1、if automatic-document-feeder=yes 177 then manifdder=yes 123conf:()意义:如果客户购买复印机,那么同时买送纸器,置信度为2、 if manifdder=yes 218 thenpaper=yes 397conf:()意义:如果客户购买复印机,那么同时复印纸,置信度为3、if tambour-opc=yes 255 then toner=yes 133 conf:()意义:如果客户购买硒鼓,那么同时购买墨粉,置信度为四、数据挖掘结果对企业CRM的作用1.深入了解重要客户的需求特征对重要客户的数据挖掘结
11、果显示“if automatic-document-feeder=yes 177 then manifdder=yes 123conf:()”,即如果客户购买复印机,那么同时购买送纸器,其置信度为。可以看出,凡是购买复印机类商品的客户,很大一部分都会购买型号为MB-501的旁路送纸器。在企业销售的数据中也验证了这样的购买特征。由此可见,购买复印机类商品的代理商,都对型号为MB-501的旁路送纸器有相当的需求量。2.根据客户需求周期,做好重要客户的关系维护所有的客户都会存在客户生命周期。对于公司经营者而言,客户处在生命周期的第三阶段的时间越长,就意味着公司所赚取的利润会越高。重要客户则是处于客户
12、生命周期的第三阶段,良好的客户关系维护是延长客户生命周期的重要手段。挖掘结果表明,在公司的各类客户中,代理型客户都属于公司的重要客户。其购买特征是定期大批量进货,有的是每一个月进一次货,有的是每两个月一次。在这些客户的往来订单上会发现有很多的赠送品,其中办公耗材用品居多。客户之所以会选择这些商品,是由于现在大部分公司都需要使用打印机、复印机等办公自动化设备,办公耗材用品的使用量自然就非常大了。 关注潜在客户的需求数据挖掘结果关注的是公司重要客户购买规律,公司针对这些客户进行客户关系的维护固然十分重要,然而挖掘潜在的客户的需求同样很重要。公司所有的客户中,除了代理型客户以外还有自用型客户,而自用
13、型客户又可以分为新客户和老客户,老客户是属于重要客户的一部分,他们会以一定的周期购进一系列的商品,大部分以耗材用品为主,因为这些客户本身已经有一定量的复印机或打印机之类的办公自动化设备,在使用这些设备的过程中会有很多的消耗,如打印纸、墨盒、钴粉等。这些用品的消耗速度是一定的,因此到了一定的时间,他们就会发生购买行为。这样的客户一般情况下交易量会很大,而且是长久的定期客户。至于新客户,则是那些新公司或新部门成立,需要为办公室准备一些必须的自动化设备,往往会先以购进大型的复印机或打印机为主,在使用一段时间之后,再根据实际情况购进耗材,完善办公室设备的需求。这种购买的行为一般会持续2-3个月左右,他
14、们会在这段时期内不断地发现自己的新需求,购买行为直到需求基本上被满足为止。由于这些客户使用大量的办公设备,需要的耗材数量也很巨大,这些新客户就是公司潜在的大客户。公司可以利用一系列的方式维护与这些潜在客户之间的关系,这也为公司降低了寻找新客户的成本,而这些客户成为重要客户的机率也会比其他客户高。五、结束语数据挖掘技术在以客户为中心的电子商务时代扮演越来越重要的角色,可以通过对企业销售数据的关联分析把企业的大量客户分成不同的类型,并发现不同类客户的需求特征,从而提供不同的产品和服务,维护好老客户,挖掘新客户,不断提高客户满意度。参考文献:1冀玉苓胡华赵远华:E商业时代基于数据挖掘的客户关系管理.
15、文章编号:1009-811904-0045-03陈京民等编着:数据仓库与数据挖掘技术.北京:电子工业出版社,2006年1月第三次印刷版,P259,P79迈克尔.贝里,戈登.S.利诺夫:数据挖掘-客户关系管理的科学与技术.袁卫等译,北京:中国财政经济出版社,2004年1月第1版,P7,P51李冠乾许亮:CRM数据挖掘中关联规则的应用.昆明理工大学学报2、 if manifdder=yes 218 thenpaper=yes 397conf:()意义:如果客户购买复印机,那么同时复印纸,置信度为3、if tambour-opc=yes 255 then toner=yes 133 conf:()意
16、义:如果客户购买硒鼓,那么同时购买墨粉,置信度为四、数据挖掘结果对企业CRM的作用1.深入了解重要客户的需求特征对重要客户的数据挖掘结果显示“if automatic-document-feeder=yes 177 then manifdder=yes 123conf:()”,即如果客户购买复印机,那么同时购买送纸器,其置信度为。可以看出,凡是购买复印机类商品的客户,很大一部分都会购买型号为MB-501的旁路送纸器。在企业销售的数据中也验证了这样的购买特征。由此可见,购买复印机类商品的代理商,都对型号为MB-501的旁路送纸器有相当的需求量。 根据客户需求周期,做好重要客户的关系维护所有的客户
17、都会存在客户生命周期。对于公司经营者而言,客户处在生命周期的第三阶段的时间越长,就意味着公司所赚取的利润会越高。重要客户则是处于客户生命周期的第三阶段,良好的客户关系维护是延长客户生命周期的重要手段。挖掘结果表明,在公司的各类客户中,代理型客户都属于公司的重要客户。其购买特征是定期大批量进货,有的是每一个月进一次货,有的是每两个月一次。在这些客户的往来订单上会发现有很多的赠送品,其中办公耗材用品居多。客户之所以会选择这些商品,是由于现在大部分公司都需要使用打印机、复印机等办公自动化设备,办公耗材用品的使用量自然就非常大了。 关注潜在客户的需求数据挖掘结果关注的是公司重要客户购买规律,公司针对这
18、些客户进行客户关系的维护固然十分重要,然而挖掘潜在的客户的需求同样很重要。公司所有的客户中,除了代理型客户以外还有自用型客户,而自用型客户又可以分为新客户和老客户,老客户是属于重要客户的一部分,他们会以一定的周期购进一系列的商品,大部分以耗材用品为主,因为这些客户本身已经有一定量的复印机或打印机之类的办公自动化设备,在使用这些设备的过程中会有很多的消耗,如打印纸、墨盒、钴粉等。这些用品的消耗速度是一定的,因此到了一定的时间,他们就会发生购买行为。这样的客户一般情况下交易量会很大,而且是长久的定期客户。至于新客户,则是那些新公司或新部门成立,需要为办公室准备一些必须的自动化设备,往往会先以购进大
19、型的复印机或打印机为主,在使用一段时间之后,再根据实际情况购进耗材,完善办公室设备的需求。这种购买的行为一般会持续2-3个月左右,他们会在这段时期内不断地发现自己的新需求,购买行为直到需求基本上被满足为止。由于这些客户使用大量的办公设备,需要的耗材数量也很巨大,这些新客户就是公司潜在的大客户。公司可以利用一系列的方式维护与这些潜在客户之间的关系,这也为公司降低了寻找新客户的成本,而这些客户成为重要客户的机率也会比其他客户高。五、结束语数据挖掘技术在以客户为中心的电子商务时代扮演越来越重要的角色,可以通过对企业销售数据的关联分析把企业的大量客户分成不同的类型,并发现不同类客户的需求特征,从而提供不同的产品和服务,维护好老客户,挖掘新客户,不断提高客户满意度。参考文献:1冀玉苓胡华赵远华:E商业时代基于数据挖掘的客户关系管理.文章编号:1009-811904-0045-03陈京民等编着:数据仓库与数据挖掘技术.北京:电子工业出版社,2006年1月第三次印刷版,P259,P79迈克尔.贝里,戈登.S.利诺夫:数据挖掘-客户关系管理的科学与技术.袁卫等译,北京:中国财政经济出版社,2004年1月第1版,P7,P51李冠乾许亮:CRM数据挖掘中关联规则的应用.昆明理工大学学报