ImageVerifierCode 换一换
格式:DOCX , 页数:63 ,大小:1.26MB ,
资源ID:5703159      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/5703159.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(本地银行数据挖掘主题项目建设.docx)为本站上传会员【xrp****65】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

本地银行数据挖掘主题项目建设.docx

1、银行卡数据挖掘案例应用 面对银行业竞争的加剧和外资银行的威胁,国内银行在业务发展上面临巨大的挑战。私人金融业务在银行业务中所占地位越来越重要,为银行带来丰厚的中间业务收入。银行卡业务作为私人金融业务的主要载体,深刻和长远的影响着银行整体的经营水平。 探讨以客户为中心的、面向数据挖掘的银行卡业务信息系统的数据特征,第四章在模拟此系统的基础上,利用银行卡交易的真实数据建立四个数据挖掘模型,以探讨数据挖掘技术在银行卡业务中的应用。案例所用的数据来自一家股份制银行地市级分行的银行卡交易数据,时间跨度为 2003年8月4日—2003年12月30日。记录总数为2646256条,经过筛选得到有效记录1

2、982022条。 在我们所说的银行卡中,包括借记卡、准贷记卡和贷记卡。在现阶段,银行卡主要指的是借记卡。在国内,由于信用体制的不健全和管理水平不高,银行为了规避风险,对贷记卡业务进行了一定的限制。比如在一些地方,信用卡的透支功能根本就没有放开,在使用上和借记卡没有区别。在所获得的数据中,由于贷记卡无论是在户数还是在交易额上都没有达到可供挖掘的数据规模,所以在本文中没有涉及贷记卡的挖掘内容。 4.1客户细分模型 很多公司多年来只是把产品和服务推销给自己的客户,根本不知道什么样的客户是好客户。对于任何行业的任何公司,了解客户都是有利润营销的第一步。 对客户进行细分有两种基本方法,一是市场驱

3、动方法。这种方法需要决定使用哪些对业务有重要影响的特征;二是数据驱动方法。数据驱动方法是利用聚集技术或要素分析技术寻找同质的群休。本文的银行卡客户细分所采用的是数据驱动方法 4.1.1客户细分方法 由于人口统计特征和心理特征的多样性,以及交易行为和利润水平的不同,客户交易数据库中存在着不同的群体。发掘出不同群体的这些特征,刁一可能据此进行产品开发、个性化服务和目标定位。 RFM分析是目前用于客户细分最常用的方法之一。它利用客户的购买行为来划分客户。 R(Recency)表示最近值,客户最后一次购买行为到现在的月份数,在预测下一次客户的相应行为时此值通常是三个变量中最有效的特征数据。

4、F(Frequency)表示频度值,在一个特定时间段内客户购买次数的总和。 M(Monetary)表示币值,在一特定时间段内客户用于购买一家企业产品或服务的货币总和。 在CRM的实践中,这三个特征既可以单独使用,也可以组合使用。由于银行卡业务对于其它行业来说有其自身的特点,根据银行对于客户行为特征的关注点,将RFM分析的三个指标进行相应调整如下: 最近值R(Recency)=>账户日均余额B(Balance) 频度值F(Frequency)=>交易频度F(Frequency) 币值M(Monetary)==}-交易金额M(Monetary) 在银行所关心的这三个特征值中,账户日均余

5、额是最重要的,因为它直接决定着银行可供利用资金的多少,进而影响银行的利润;交易频度标识着账户的活跃程度;交易金额则衡量着账户的资金流量,一定程度上反映着该账户拥有人的资金流动性。 4.1.2建立挖掘数据集 用于客户细分的数据来源于客户交易明细表。在交易明细表中,同一张卡按时间的先后存在着若干笔交易记录,根据这些记录,以卡号为客户的唯一标识,生成该卡在交易信息表中的唯一一条汇总记录,原理如图所示: 4.2余额流失模型 客户流失对于任何企业的利润都会带来重大影响。在客户关系管理中,很多的企业都把提高客户的忠诚度作为一个十分重要的方面。据测算,吸引一个新客户的成本是保留一个老客户成本

6、的5倍以上,而且忠诚的客户对于价格的敏感性也会降低。 对于银行来说,关注的不单纯是客户数量的流失,更重要的是客户账户余额的流失。因为在很多情况下,客户把账户内的余额全部转走而不注销1?Yk号,这样就等于客户“无声的流失”了。 4.2.1余额流失的评价标准 对于客户余额的流失,很难用一个定量的标准来衡量,不能用余额变化的绝对量或百分比中的任何一个来确定余额流失者,只有两个指标结合起来才有意义。例如:同样在本期日均余额都减少了10000元的两个账户,第一个账户的日均余额为100000元,减少了百分之十,第二个账户的日均余额只有10000元,减少了百分之百,显然两者的含义是不一样的;另一方面,

7、对于同样在本期日均余额都减少了80%的两个账户,第一个账户的日均余额为100000元,减少的绝对量为80000元,第二个账户日均余额为100元,减少的绝对量为80元,银行的关注程度肯定也是不一样的。 对于“真正的余额流失者”的确定是一件十分困难的事情,没有哪一种分析工具能做到百分之百的准确。这是一件既讲科学性又讲艺术性的事情。在本文的余额流失模型中,采用日均余额变化值和百分比作为度量值,利用聚集技术来划分存在余额流失的客户。在此基础上分析确定“真正的余额流失者”采用日均余额变化值和百分比两个度量值来确定流失者是基于以下的假设: 1.账户余额的减少达到一定的绝对数量;2.流失余额的百分比达到

8、某一较高的比例。这两个条件需要同时满足才能确定余额流失者。 4.2.2建立挖掘数据集 构造账户余额流失模型与4.1的客户细分模型有些类似。利用两段时间的账户日均余额的变化来判断账户的余额是否流失,并在此基础上建立客户余额流失的特征。用于进行余额流失模型的事实数据表的字段说明如表4.3余额流失数据表字段说明 字段名 数据类型 卡号 文本 卡种 文本 卡类 文本 日均余额1 货币 日均余额2 货币 日均余额变化值 货币 日均余额变化百分比 数值 在表4.3中,‘旧均余额1”为在客户细分中己经用到的2003年8月4日一2003年12月3日的账户日均余额。‘旧均余额2”是

9、2003年12月4日一2003年12月30日的账户日均余额。由于案例所获得数据的局限,两段数据期取的比较短。在条件允许的情况下,为提高对余额流失评价的准确性,两段数据期尽量长一些。‘旧均余额1"应该取一年的日均余额,而‘旧均余额2”则至少应该为三个月。两个数据期同步向前滚动,以不断的更新余额流失模型的数据。 日均余额变化值=日均余额2一日均余额1 日均余额变化百分比=(日均余额变化值/日均余额1)X100 4.2.3数据挖掘 数据的准备工作完成后,就可以开始数据挖掘任务了。在余额流失模型中,挖掘工具仍采用的是MicrosoftSQLServer2000AnalysisServices中

10、的聚集技术, 2.计算客户的生命周期价值。客户的生命周期是指从开始购买到停止购买一个供应商的产品或服务时结束。客户生命周期价值(LTV,LifetimeValue)是客户在其生命周期内为企业所创造的直接和非直接的贡献与总成本的差值。这种估算使企业能够按照客户的价值来申请资源。在客户的生命周期内,其价值由历史价值和未来价值两部分组成。但在实际中,由于客户的非直接贡献(如推荐新客户、参加新产品的测试等)很难确定,加之此方法涉及的变量很多,而且数据不能获取或者获取的成本太高,使得这种方法只能作为一种理想的方法。 3.计算客户的潜在价值。此方法的基本观点是:客户过去为企业创造的利润已过去,真正

11、对企业的经营有帮助的是将来客户能为企业创造多少利润。 高▲!一|||令 客户潜在价值 客户当前价值 图4.9客户价值矩阵 图4.9中,对于四个不同的客户群体,应该采取不同的营销策略。 客户群体I:这类客户的当前价值和潜在价值都比较低,企业将营销资源投入到此类客户中也不能带来相应利润的增加。现实的选择是提高向此类客户提供的产品或服务的价格,以增加销售收入,或者促使他们转向竞争对手。 客户群体II:这类客户虽然当前的价值比较低,但他们具有较高的潜在价值,应该增加营销资源的投入,使他们向高价值客户转化。 客户群体III:这类客户的当前价值高,潜在价值低,是企业当前利润来源的重要组成部

12、分。由于其潜在价值低,继续增加营销资源投入并不能带来预期的收益,维持。 金融行业应用 1.前言 随着中国加入WTO,国内金融市场正在逐步对外开放,外资金融企业的进入在带来先进经营理念的同时,无疑也加剧了中国金融市场的竞争。金融业正在快速发生变化。合并、收购和相关法规的变化带来了空前的机会,也为金融用户提供了更多的选择。节约资金、更完善的服务诱使客户转投到竞争对手那里。即便是网上银行也面临着吸引客户的问题,最有价值的客户可能正离您而去,而您甚至还没有觉察。在这样一种复杂、激烈的竞争环境下,如何才能吸引、增加并保持最好的客户呢? 数据挖掘(Data Mining,DM)是指从大量不完全的

13、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有用的信息和知识的过程。其表现形式为概念(Concepts)、规则(Rules)、模式(Patterns)等形式。 用统计分析和数据挖掘解决商务问题。 金融业分析方案可以帮助银行和保险业客户进行交叉销售来增加销售收入、对客户进行细分和细致的行为描述来有效挽留有价值客户、提高市场活动的响应效果、降低市场推广成本、达到有效增加客户数量的目的等。 客户细分―使客户收益最大化的同时最大程度降低风险 市场全球化和购并浪潮使市场竞争日趋激烈,新的管理需求迫切要求金融机构实现业务革新。为在激烈的竞争中脱颖而出,业界领先的金融服务机构正纷纷采用成熟的

14、统计分析和数据挖掘技术,来获取有价值的客户,提高利润率。他们在分析客户特征和产品特征的同时,实现客户细分和市场细分。 数据挖掘实现客户价值的最大化和风险最小化。SPSS预测分析技术能够适应用于各种金融服务,采用实时的预测分析技术,分析来自各种不同数据源-来自ATM、交易网站、呼叫中心以及相关分支机构的客户数据。采用各种分析技术,发现数据中的潜在价值,使营销活动更具有针对性,提高营销活动的市场回应率,使营销费用优化配置。 客户流失―挽留有价值的客户 在银行业和保险业,客户流失也是一个很大的问题。例如,抵押放款公司希望知道,自己的哪些客户会因为竞争对手采用低息和较宽松条款的手段而流失;保险

15、公司则希望知道如何才能减少取消保单的情况,降低承包成本。 为了留住最有价值的客户,您需要开展有效的保留活动。然而,首先您需要找出最有价值的客户,理解他们的行为。可以在整个客户群的很小一部分中尽可能多地找出潜在的流失者,从而进行有效的保留活动并降低成本。接着按照客户的价值和流失倾向给客户排序,找出最有价值的客户。 交叉销售 在客户关系管理中,交叉销售是一种有助于形成客户对企业忠诚关系的重要工具,有助于企业避开“挤奶式”的饱和竞争市场。由于客户从企业那里获得更多的产品和服务,客户与企业的接触点也就越多,企业就越有机会更深入地了解客户的偏好和购买行为,因此,企业提高满足客户需求的能力就比竞争

16、对手更有效。 研究表明,银行客户关系的年限与其使用的服务数目、银行每个账户的利润率之间,存在着较强的正相关性。企业通过对现有客户进行交叉销售,客户使用企业的服务数目就会增多,客户使用银行服务的年限就会增大,每个客户的利润率也随着增大。 从客户的交易数据和客户的自然属性中寻找、选择最有可能捆绑在一起销售的产品和服务,发现有价值的产品和服务组合,从而有效地向客户提供额外的服务,提高活期收入并提升客户的收益率。 欺诈监测 通过侦测欺诈、减少欺诈来降低成本。为了与欺诈活动作斗争,首先您需要预测欺诈在何时、何地发生。数据挖掘技术侦测在欺诈中常见的模式,预测欺诈活动将在哪里发生。 对于银行业的

17、公司来说,欺诈活动频繁发生的一个领域是自动取款机(ATM)。数据挖掘帮助公司预测欺诈性的ATM交易。银行可以来预测欺诈最有可能在哪个地理位置上发生。接着该信息就被传送给ATM网络的成员机构,由这些机构通知客户,让客户确定交易是否正当,从而避免发生更多的欺诈行为。有了这些信息,他们可以更快地冻结帐户或采取其它必要的手段。 开发新客户 金融机构可以使用数据挖掘技术提高市场活动的有效性。银行部门对给出反馈的活动对象进行分析,使之变成新的客户。这些信息也可应用到其它客户,以提高新的市场活动的反馈率。 降低索赔 保险公司都希望减少索赔的数量。可以使用聚类分析,根据现有客户的特征档案来找出哪些客

18、户更有可能提出索赔请求。这些档案是通过对客户提取200至300个不同的变量而产生出来的。接着,您就可以针对那些可能提出较少索赔请求的客户开展获取活动。 信用风险分析 传统的风险管理已无法有效控制跨区域、跨部门、跨行业的多种风险,利用科学的数据分析系统提高欺诈的防范,降低信用风险尤为重要。客户科学评估造成风险的因素,有效规避风险,建立完善的风险防范机制。 2.客户流失 随着金融体制改革的不断深化和金融领域的对外开放,我国金融行业的竞争日趋激烈。《2006年金融服务指数研究报告》显示,在我国金融业逐步对外资行业开放的今天,中国金融业的服务质量虽然有稳步提升,但总体仍需提高,中资银行面临着极

19、大的优质客户流失的危险。这将对银行经营和效益产生极大的影响。除了提高服务质量,银行要加强营销活动,保留优质客户,首先面临的第一个问题就是,谁可能流失?应该针对哪些客户进行客户保留活动?针对所有的客户开展保留活动,成本太大。合理的做法是应用数据挖掘技术,研究流失客户的特征,从而对流失进行预测、并对流失的后果进行评估,采取客户保留措施,防止因客户流失而引发的经营危机,提升公司的竞争力。 具体来说,客户流失是指客户终止与企业的服务合同或转向其它公司提供的服务。客户流失分析是以客户的历史通话行为数据、客户的基础信息、客户拥有的产品信息为基础,通过适当的数据挖掘手段,综合考虑流失的特点和与之相关的多种

20、因素,从中发现与流失密切相关的特征,在此基础上建立可以在一定时间范围内预测用户流失倾向的预测模型,为相关业务部门提供有流失倾向的用户名单和这些用户的行为特征,以便相关部门制定恰当的营销策略,采取针对性措施,开展客户挽留工作。 客户流失需要解决的问题 1)哪些现有客户可能流失? 客户流失的可能性预测。主要对每一个客户流失倾向性的大小进行预测。 2) 现有客户可能在何时流失? 如果某一客户可能流失,他会在多长时间内流失。 3) 客户为什么流失? 哪些因素造成了客户的流失,客户流失的重要原因是什么。主要对引起客户流失的诸因素进行预测和分析。 4) 客户流失的影响? 客户流失对客户

21、自身会造成什么影响? 客户流失对公司的影响如何? 对可能流失客户进行价值评估,该客户的价值影响了运营商将要付出多大的成本去保留该客户。 5) 客户保留措施? 针对公司需要保留的客户,制定客户和执行保留措施。 客户流失的类型 为了避免由客户流失造成的损失,必须找出那些有流失危险和最有价值的客户,并开展客户保留活动。客户流失现象可以分为以下三种情况: 1)公司内客户转移:客户转移至本公司的不同业务。主要是增加新业务,或者费率调整引发的业务转移,例如从活期存款转移至零存整取,从外汇投资转移至沪深股市投资。这种情况下,虽然就某个业务单独统计来看存在客户流失,并且会影响到公司的收入,但对公

22、司整体而言客户没有流失。 2)客户被动流失:表现为金融服务商由于客户欺诈等行为而主动终止客户与客户的关系。这是由于金融服务商在客户开发的过程中忽视了客户质量造成的。 3)客户主动流失:客户主动流失可分为两种情况。一种是客户不再使用任何一家金融服务商的业务;另一种是客户选择了另一家服务商,如客户将存款从一家银行转移到另一家银行。客户主动流失的原因主要是客户认为公司不能提供他所期待的价值,即公司为客户提供的服务价值低于另一家服务商。这可能是客户对公司的业务和服务不满意,也可能是客户仅仅想尝试一下别家公司提供而本公司未提供的新业务。这种客户流失形式是研究的主要内容。 如何进行客户流失分析?

23、 对于客户流失行为预测来说,需要针对客户流失的不同种类分别定义预测目标,即明确定义何为流失,进而区别处理。预测目标的准确定义对于预测模型的建立是非常重要的,它是建立在对运营商的商业规则和业务流程的准确把握的基础之上。在客户流失分析中有两个核心变量:财务原因/非财务原因,主动流失/被动流失。对不同的流失客户按该原则加以区分,进而制定不同的流失标准。例如,非财务原因主动流失的客户往往是高价值的客户,他们会正常支付服务费用并容易对市场活动有所响应,这种客户是企业真正需要保留的客户。而对于非财务原因被动流失的客户,预测其行为的意义不大。 研究哪些客户即将流失,是一个分类问题。将现有客户分为流失和不流

24、失两类,选择适量的流失客户和未流失客户的属性数据组成训练数据集,包括:客户的历史通话行为数据、客户的基础信息、客户拥有的产品信息等。Clementine提供人工神经网络、决策树、Logistic回归等模型用于建立客户流失的分类模型。 关于流失用户特征的分析,是一个属性约减和规则发现问题。Clementine提供关联分析方法,可以发现怎样的规则导致客户流失。也可以利用Clementine的决策树方法,发现与目标变量(是否流失),关系最为紧密的用户属性。由于不同类型的客户可能具有不同的流失特征。因此,在进行深入的客户流失分析时,需要先进行客户细分,再对细分之后的客户群分别进行挖掘。 在预测客户

25、流失时一个很重要的问题是流失的时间问题,即一个客户即将要流失,那么它可能什么时候会流失。生存分析可以解决这类问题。生存分析不仅可以告诉分析人员在某种情况下,客户可能流失,而且还可以告诉分析人员,在这种情况下,客户在何时会流失。生存分析以客户流失的时间为响应变量进行建模,以客户的人口统计学特征和行为特征为自变量,对每个客户计算出初始生存率,随着时间和客户行为的变化,客户的生存率也发生变化,当生存率达到一定的阈值后,客户就可能流失。 分析客户流失对客户自身的影响时,主要可以考虑客户的流失成本和客户流失的受益分析。客户流失成本可以考虑流失带来的人际关系损失等因素,通过归纳客户的通话特征来表征。减少

26、客户流失的一个手段就是增加客户的流失成本。客户流失的受益分析就是判断客户流失的动机,是价格因素还是为了追求更好的服务等。这方面内容丰富,需作具体分析。 分析客户流失对公司的影响时,不仅要着眼于对收入的影响,而且要考虑其它方面的影响。单个的客户流失对公司的影响可能是微不足道的,此时需要研究流失客户群对公司收入或业务的影响。这时候可能需要对流失客户进行聚类分析和关联分析,归纳客户流失的原因,有针对性的制定防止客户流失的措施。 在预测出有较大流失可能性的客户后,分析该客户流失对公司的影响。评估保留客户后的收益和保留客户的成本。如果收益大于成本,客户是高价值客户,则采取措施对其进行保留。至于低价值

27、客户,不妨任其流失甚至劝其流失。 总之在利用数据挖掘研究客户流失问题时,需要明确并深入理解业务目标,在明确的业务目标的基础上准备数据、建模、模型评估,最后将模型部署到企业中。 客户流失应用案例 为了举例说明,我们设想一个虚构的银行ZBANK使用保留客户的应用或客户流失建模。ZBANK正受到来自其它金融机构日益激烈的竞争。住房贷款是ZBANK最宝贵的客户来源之一,在该业务中遇到一些客户会转投其它竞争对手。在营销策略方面,ZBANK给它的房贷新客户许多的优惠措施(如免费的电器和家具优惠券),因此它获得客户的初始成本相对要高于竞争对手。但是,由于此类贷款由市场主导,因此房屋抵押贷款给ZBAN

28、K带来较小的风险,同时也使其处于一个有利的战略地位可以交叉销售其它的服务如期房贷款和住房保险。 除了保持其战略性市场主导地位,对于ZBANK来说预测客户流失的可能性也很重要,以便减少那些获得不久就拖欠贷款的新客户。ZBANK有一个客户数据库,包含了有关房贷客户的交易和人口统计信息。 (1)商业理解 预测现有用户中哪些客户在未来六个月中可能流失以及对哪些流失客户采取保留措施。 (2)数据理解 a) 数据说明 选取一定数量的客户(包括流失的和未流失的),选择客户属性,包括客户资料、客户账户信息等。利用直方图、分布图来初步确定哪些因素可能影响客户流失。所选取的数据属性包括: (1)客户

29、号; (2)储蓄账户余额; (3)活期账户余额; (4)投资账户余额; (5)日均交易次数; (6)信用卡支付方式; (7)是否有抵押贷款; (8)是否有赊账额度; (9)客户年龄; (10)客户性别; (11)客户婚姻状况; (12)客户孩子数目; (13)客户年收入; (14)客户是否有一辆以上汽车; (15)客户流失状态。 其中客户流失状态有三种属性: (1)被动流失; (2)主动流失,这是分析中特别关注的一类客户; (3)未流失。 在分析中,我们主要关注的是主动流失的客户。被动流失对银行来说是意义最小的,因为该指标代表的大多数客户是在贷款期内卖掉了

30、房子,因此不再需要房贷了。主动流失指的是转投向ZBANK竞争对手的客户,是该行关注的焦点。 在开发这个应用之前,ZBANK将所有现有的客户归到上述的三个类别中。同时按照常规,所有的人口统计信息(也就是从客户年龄到客户是否有一辆以上汽车)每六个月更新一次,而交易信息(从储蓄账户余额到是否有赊账额度)则是实时更新的。为了让预测模型能预先进行指示以便采取补救措施,在目标变量(因变量)和输入变量(自变量)之间设定了6个月的延迟。也就是说,输入变量的采集六个月后再将客户流失状态分类;因此该模型提早6个月预测客户流失。 b) 数据描述及图表分析 在数据理解中,可以利用描述及可视化来帮助探索模式、趋势

31、和关系。图2.1显示了Clementine中数据理解的数据流图,包括:使用数据审核,统计分析,网络图,直方图,两步聚类,关联分析,查看数据属性之间的关系。     图2.1:数据理解的数据流图 图2.2显示了数据审核结果。可以很清楚地了解14个数据字段的基本情况。如数据类型、最大最小值、平均值、标准差、偏度、是否唯一、有效记录个数等。从图2.2可见,房贷客户的平均年龄是57.4岁,最小的18岁,最大的97岁。     图2.2:数据审核图 这些描述能帮助理解数据。使用绘图和直方图节点将数据可视化就产生了客户收入和年龄图及日均交易数的直方图(见图3)。将可视化的结果与

32、目标变量联系起来,可以看出客户流失状态包含在不同的图表中。例如,客户的离中趋势,男性和女性客户的被动流失和主动流失以及每个级别的日均交易次数都包含在了图表中。这种对关系的初步评估对于建模是很有用的。更重要的是,结果表明主动流失在女性客户和不太活跃的客户(由日均交易次数确定)中较为多见。     图2.3:各种数据分布图 最后,一幅网状图表明了客户性别,客户婚姻状况,信用卡支付方式,客户流失状态之间的联系(见图3下左面板)。较强的关系由较粗的线表示。那些在一定标准(由用户定义)之下的联系则不包括在图中(例如在被动流失和选中的一些输入变量之间)。网状图表明现有客户(即非流动者)更多

33、的是那些已婚男性,那些用其它账户进行信用卡支付的人。要注意的是,前面已经提到过,客户流失状态滞后输入变量六个月。 c) 关联分析及聚类的结果为了进一步了解房贷客户可以使用聚类。 图2.4总结了使用双步聚类节点获得的结果。如图所示,客户似乎分为七种自然的聚类。所产生的聚类特征可用来定义和理解每个聚类以及聚类间的区别。例如,我们比较聚类1和聚类4,聚类1中包含的是较年轻并绝大多数已婚(92.2%),并且年收入较高的女性。而聚类4中包含的是较年长(平均要比1中大5岁),59.8%已婚,年收入较低(平均要比1中低4000美元)的男性。聚类的结果对于市场定位和分割研究是非常有用的,但是对于预测建模的

34、作用则没这么明显。     图2.4:两步聚类的部分结果 本例使用关联分析来制订规则,寻找输入变量和目标变量间的关系。这些规则不仅对发现模式、关系和趋势很重要,对于预测建模(例如决定采用/不采用哪些输入变量)也很重要。我们使用Clementine的GRI(广义规则归纳)节点来进行联合分析,结果如图2.5所示。其中,第一条联合分析规则表明,有156名(或11.0%的)房贷客户的投资账户余额低于4988美元,其中81.0%是被动流失的。同样,第三条规则表明有198名(或13.9%的)房贷客户的活期账户余额超过1017美元,其中81.0%是主动流失的。其它的规则可以类似地进行理解。这

35、些规则表明交易和人口统计信息是如何与客户流失状态联系起来的。要注意的是,客户流失状态滞后输入变量六个月。     图2.5:关联分析的部分结果 3)数据准备 根据数据理解的结果准备建模用的数据,包括数据选择、新属性的派生,数据合并等。在本例中,利用Clementine进行数据准备的数据流图如图2.6所示。通过分裂节点,给数据集添加一个新的标志属性。该标志属性是0-16之间的随机数。然后再根据标志属性值(<4和)=4),利用过滤节点,将原来的数据样本分成训练集(约占75%)和测试集(约占25%)。     图2.6:数据准备的数据流图 (4)建立模型及评估 预

36、测建模是本例中最重要的分析,神经网络和决策树尤其适用于对房贷客户的流失建模。图2.7和图2.8展示的是使用Clementine训练神经网络模型和建决策树功能得到的神经网络和决策树的结果。     图2.7:C5.0决策树结果     图2.8:神经网络模型结果 决策树模型中有4个终端节点和仅仅3个重要的输入变量(按照重要性降序排列):投资账户余额、客户性别和客户年龄。神经网络模型在输入层、隐藏层和输出层分别有15个、5个和3个神经元。此外,最终要的5个输入变量是(按照重要性降序排列):活期账户余额、客户孩子数目、储蓄账户余额、投资账户余额和客户婚姻状况。Logist

37、ic回归模型统计有效,卡方检验的p值为1.000,表明数据吻合得很好。此外,下列输入变量在统计时,在0.05的有效水平上预测客户流失状态也统计有效:储蓄账户余额c(p值=0.000)、活期账户余额(p值=0.000)、客户年龄(p值=0.002)、客户年收入(p值=0.033)及客户性别(p值=0.000)。 从用评估图节点产生的提升表中可以看出每个预测模型都是有效的,如图2.9所示(从左至右分别为Logistic回归、决策树和神经网络)。提升表中绘制的是累积提升值与样本百分比的关系(在这里是构造/培训样本)。基准值(即评估每个模型的底限)是1,它表示当从样本中随机抽取记录的百分点时能成功地

38、击中”现有客户。提示值衡量的是当来自数据中的某一记录是一个现有客户的降序预测概率能被百分点反映时,预测模型“击中”现有客户的成功可能性(准确度)有多高。如图2.9(左)所示,每个模型的提升值均大于1,在100%时收敛于1。由于每个预测模型都能以有效精度预测目标变量(起码对于现有客户和非现有客户之间的关系),因此我们可以说它们都是有效的。     图2.9:提升图(左)和三个模型的分析结果(右) 值得注意的是神经网络和决策树得出的预测模型并不完全一致,这从图2.9(右)两个模型结果的比较可以看出来。所以,不仅要在训练样本中比较两个模型的表现,也要在训练/测试样本中进行比较,而后

39、者更加重要。对于这些预测模型来说,评估它们相对表现的最佳办法应该是看它们预测目标变量(客户流失状态)的精确率。在本例中为了简单起见,假设总体精确度包括了比较不同预测模型表现的评估标准。在图2.10的右面板中,决策树模型的预测相对精确,总体精确度为81.6%,因此根据评估标准,决策树模型是最好的预测模型,应该在ZABNK预测房贷客户的流失中使用。     图2.10:测试集的提升表(左)和三个模型的分析结果(右) (5)模型部署 在本例中,决策树模型不仅精度最高,而且从图2.7中的简明的规则可以看出,决策树的模型也容易理解。结果表明,ZBANK的房贷客户中,那些39岁以上,在投

40、资帐户中余额超过4976美元的女性更可能主动流失。要注意的是,客户流失状态滞后输入变量六个月。从到目前位置的结果来看,决策树客户流失预测模型能够更精确地根据交易和人口统计的信息判断出流失客户和非流失客户,从而产生增值效益。因此,ZBANK可以用决策树模型判断哪些客户倾向于主动流失,然后向他们提供优惠措施或采取其它预防措施。同样,客户流失模型可以判断哪些是流失风险较低的房贷申请者。使用数据挖掘的决策树模型可以用来对现有客户和新的房贷申请者进行评级。在Clementine中部署模型的数据流图如图所示。运行数据流后,Clementine自动将结果存储在逗号分隔的文件中。银行中其他人员即使没有安装Cl

41、ementine,也可以使用记事本等软件打开查看。并且可以很好的集成到银行现有的其他业务系统中。图2.12给出了一个结果的例子。其中按照客户流失概率的大小,对客户进行排序。     图2.11:模型部署的数据流图     图2.12:流失概率和客户价值的散点图 最后需要指出的是在本例中,模型的总体分类精确率是简化计算的。在实际使用中,一般还需要考虑误分类及其相关成本,还有流失客户和非流失客户在样本和总体中的相对比重。 3.客户细分 信用风险分析 随着金融市场逐步开放,商业银行和保险公司面临着巨大的压力和挑战。面对竞争和挑战、重点是做好客户市场细分,有效发掘客户

42、需求,提供客户差异化服务。一个银行的客户是多种多样的,各个客户的需求也是千变万化的,银行不可能满足所有客户所有的需求,这不仅是由银行自身条件所限制,而且从经济效益方面来看也是不足取的,因而银行应该分辨出它能有效为之服务的最具吸引力的市场,扬长避短,而不是四面出击。对一个银行来说,在经营管理中应用市场细分理论是很有必要的。 客户细分的概念 客户细分的概念是美国市场学家温德尔?史密斯(Wendeii R.Smith)于20世纪50年代中期提出来的。 客户细分(Customer Segmentation)是指按照一定的标准将企业的现有客户划分为不同的客户群。客户细分是客户关系管理的核心概念之一

43、是实施客户关系管理重要的工具和环节。Suzanne Donner认为:正确的客户细分能够有效地降低成本,同时获得更强、更有利可图的市场渗透。通过客户细分,企业可以更好地识别不同客户群体对企业的价值及其需求,以此指导企业的客户关系管理,达到吸引合适客户,保持客户,建立客户忠诚的目的。 所谓客户细分主要指企业在明确的战略、业务模式下和专注的市场条件下,根据客户的价值、需求和偏好等综合因素对客户进行分类,分属于同一客户群的消费者具备一定程度的相似性,而不同的细分客户群间存在明显的差异性。客户细分的理论依据主要有: (1) 客户需求的异质性。影响消费者购买决策因素的差异决定了消费者的需求、消费者

44、的消费行为必然存在区别。因此可以根据这种差异来区分不同的客户,客户需求的异质性是进行客户细分的内在依据。 (2) 消费档次假说。随着经济的发展和消费者收入水平的提高,消费量会随之增加。但消费量的增加并非线性增长,而是呈现出区间性台阶式的变化形式,一旦消费者达到某种消费层次之后,消费变化的趋势将变得非常平缓。根据消费档次假说,消费者的消费档次或消费习惯在一段时期内是相对稳定的,这就为通过消费行为来划分消费群体提供了理论前提和基础。 (3) 企业资源的有限性和有效市场竞争的目的性。资源总是希缺的,由于缺乏足够的资源去应对整个客户群体,因此必须有选择地分配资源。为了充分发挥资源的最大效用,企业必

45、须区分不同的客户群,对不同的客户制定不同的服务策略,集中资源服务好重点客户。 (4) 稳定性。有效的客户细分还必须具有相对的稳定性,足以实现在此基础上进行的实际应用,如果变化太快,应用方案还未来得及实施,群体就已面目全非,这样的细分方法就显得毫无意义。 客户细分模型 客户群细分的目的是为了选择适合企业发展目标和资源条件的目标市场。客户细分模型是指选择一定的细分变量,按照一定的划分标准对客户进行分类的方法。一个好的细分模型,首先是要满足细分深度的要求,不同的使用者对客户细分的深度也有不同的要求,这就要求模型划分的结果能满足不同使用者的需要。其次是对数据的处理能力和容错能力,现代数据库的存

46、储容量越来越大,数据结构也趋于多样性,误差数据也会随之增多,这就要求模型能适应数据在量和样上的膨胀,对误差数据能做出判别和处理。最后是模型要有很强的适用能力,变化是绝对的,而稳定只是相对的,无论是个人消费者还是消费群体,他们的消费行为都是在变化的,这就要求模型对客户的细分标准要随新的情况而不断更新。在对客户进行细分的方法中,除了传统的按照客户基本属性进行分类的方法以外,还有其他多种客户细分模型,如基于客户价值贡献度的细分模型、基于不同需求偏好的细分模型和基于消费行为的细分模型。基于消费者消费行为的客户细分模型研究,主要是以消费者的购买频率、消费金额等为细分变量,如RFM 模型和客户价值矩阵模型

47、 (1)RFM模型。RFM细分模型是根据消费者消费的间隔、频率和金额三个变量来识别重点客户的细分模型。 R-Recency指客户上次消费行为发生至今的间隔,间隔越短则R越大;F—Frequency指在一段时期内消费行为的频率;M—Monetary指在某一时期内消费的金额。研究发现,R值越大、F值越大的客户越有可能与企业达成新的交易,M越大的客户越有可能再次响应企业的产品和服务。 (2)客户价值矩阵模型。 客户价值矩阵模型是在对传统的RFM 模型修正的基础上提出的改进模型。用购买次数F和平均购买额A构成客户价值矩阵,用平均购买额替代了RFM 模型中存在多重共线性的两个变量,消除了RFM

48、模型中购买次数和总购买额的多重共线性的影响。在客户价值矩阵中,确定购买次数F和平均购买额A的基准是各自的平均值,一旦确定了坐标轴的划分,客户就被定位在客户价值矩阵的某一象限区间内。依据客户购买次数的高低和平均购买额的多少,客户价值矩阵将客户划分成四种类型,即乐于消费型客户、优质型客户、经常客户和不确定客户,如图3.l所示。     图3.1:客户价值矩阵 客户细分并没有统一的模式,企业往往根据自身的需要进行客户细分,研究目的不同,用于客户细分的方法也不同。总的来讲,客户细分的方法主要有四类,一、基于客户统计学特征的客户细分;二、基于客户行为的客户细分;三、基于客户生命周期的客户细

49、分;四、基于客户价值相关指标的客户细分。 客户细分模型的基本流程 客户细分包括六个基本流程: 第一步:理解业务需求。 在未来的业务中,知道谁是客户是个非常好的起始点,以了解瞬息万变的市场环境。清楚地了解客户也是对每个客户组采取有针对性措施的基础。客户细分就是根据其特征将相似的客户归组到一起,这是了解客户和针对特定客户组进行市场定向所不可缺少的。客户细分可根据许多不同条件而进行。这些条件可由简单的年龄、性别、地理位置或这些变量的组合来构成。当这些条件变得越来越复杂时,数据挖掘技术就应运而生了。决定使用哪些条件取决于客户细分的目的和应用方法。在使用数据挖掘开发客户细分时,最重要的部分是其结

50、果应当在业务远景中意义深远,并且能够在实际业务环境中进一步得到应用。需要记住的一点是:由于市场环境是动态变化的,细分建模过程应当是重复性的,且模型应随着市场的变化而不断革新。 第二步:选择市场细分变量。 由于变量选择的优劣对细分结果质量的影响非常显著,所以变量选择应该建立在理解业务需求的基础之上,以需求为前提,在消费者行为和心理的基础上,根据需求选择变量。此外,变量的选择还应该有一定的数量,多了不好,少了也不好。 第三步:所需数据及其预处理。 为创建数据模型,必须使用收集到的原始数据,并将其转换成数据模型所支持的格式。我们称这个过程中的这个阶段为初始化和预处理。在金融业中进行客户行为细

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服