ImageVerifierCode 换一换
格式:DOC , 页数:11 ,大小:80.50KB ,
资源ID:22019    下载:注册后免费下载
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/22019.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(消费者购买可能性判断的模型设计.DOC)为本站上传会员【pin****uju】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

消费者购买可能性判断的模型设计.DOC

1、 消费者购买可能性判断的模型设计 分类模型就是根据以往的经验,根据每个属性内的水平与类之间的对应关系,构造出分 类模型。本文旨在探讨分类模型的评价标准,并提出了两种分类方法。第一种分类方法比较简单,经济含义也比较明显, 但第一种方法要求属性(指标)之间不能有强的相关性。在第二种方法中,提出并证明了两条比较实用的结论,并利用这 两条结论与一些合理的假设,求解出了新的分类模型。     在一对一销售、信用评价等商业活动中,经常需要判断哪些人的购买倾向更高一些,哪些人的信用更好一些的

2、问 题。这实际上是如何进行分类的问题。分类与聚类不同。聚类没有根据经验进行学习的过程。而分类模型根据以往的经验 ,根据每个属性内的水平与类之间的对应关系,构造出分类模型。   分类模型的方法有:决策树、遗传算法、贝叶斯等。   在本文中,只分成两类,这两类用购买者与非购买者来代表。购买者表示购买某产品,非购买者表示不购买某产 品。 一、模型好坏评价的标准   预测结果的好坏也就是预测准确程度。本文以销售时的情况为例,假设结果分为两类:购买者与非购买者。假设 在以往数据中购买者与非购买者的个数分别是a、b。我们利用某种模型在a个购买者中预测准确a1个人,不准确a2个人(或 者说

3、a2个人被预测成非购买者);在b个非购买者中预测准确b1个人,不准确b2个人(或者说b2个人被预测成了购买者)。   很自然的想法是利用整体准确率来衡量:   L1=(a1+b1)/(a+b)100% 指标一   指标一的缺点是,有时购买者的个数要远低于非购买者的个数,比如,假设在某个人群中非购买者的比例占98%, 如果采用这样的预测方法:对于任何一个人,都认为他是非购买者,按照指标一,预测准确率可以达到98%,属于很高的预 测精度。但这与商家的目标不一致:商家希望根据以往的经验,根据每个人的属性特征,利用某种评价模型,从某个人群 中挑出一部分人来,与没有应用该种模型相比,挑出来的

4、这部分人比原始人群具有很高的购买倾向。而利用指标一评价, 就属于一个人都没有挑出来。指标一的根本缺点是没有注意到预测准一个购买者与预测准一个非购买者的重要程度是不一 样的(在购买者与非购买者数量基本相等时两者的重要程度是一致的)。   而以下指标就可以有效的克服上述缺点:   L2=(a1/a+b1/b)50% 指标二   可以利用指标二来判别模型的预测能力,将L2称为分类模型拟合优度系数。容易证明,在一般情况下,模型拟合 优度系数在0.5与1之间。当L2=0.5时,说明利用分类预测模型并没有提高预测精度;而当L2=1时,说明分类模型将购买者 与非购买者完全区分开了。   将指

5、标二进行变换,可以得到:   L2=(a1/a+b1/b)50%   =50%+(a1/a–b2/b)50%   一般来说,a1/a–b2/b 显然大于0。因为根据我们的目标利用模型挑选出来的人中,购买者的比例与原始人群相 比有所提高,也就是:   a1/(a1+b2)>a/(a+b) (1)   其中,模型的左边是利用模型挑选出的人群中购买者所占的比重,模型的右边是原始人群中购买者所占的比例。   将式(1)两边同乘以(a1+b2)(a+b),经过整理可以得到:   a1/a>b2/b   同理,可以得到:   b1/b–a2/a>0,并且容易得到:

6、  a1/a–b2/b = b1/b–a2/a (2)   本文将a1/a–b2/b或b1/b–a2/a称为模型的识别能力因子,识别能力因子越大,则模型的挑选能力越高,越能够 符合商家的需要。容易得到,能力识别因子在0与1之间。当能力识别因子等于0时,利用模型挑选出的人群中购买者占的比 例与原始人群相等,模型没有起到应有的挑选能力的作用。而当模型识别能力因子等于1时,挑选出的人群全部是购买者或 非购买者,也就是说将购买者与非购买者完全分开,当然这是一种理想情形,实际上是不可能达到的。 二、评价模型   设有m个属性(比如性别、年龄、以往购买情况等),每个属性由一定的水平构成,通过

7、某种规则将每个属性的各 个水平赋予一定的值,设Xki表示第j个人的第k个属性对应的水平,将该水平赋予一定的数值Ukj (比如如果第k个属性是性别,如果第j个人是男,那么属性对应的水平就是男性,根据购买倾向等可以将男性赋予一定的 数值)。   对于第j个人,若U1j+U2j+……+Umj>P,则判断第j个人属于购买 者,否则判断为非购买者,U1j+U2j+……+Umj称为第j个人的得分,P称为临界值。   假设共有m个属性,假设第i个属性共有ki个水平,分别赋予一定的数值:U(i,1),U(i,2),… …,U(i,ki)。如果当每个属性的水平以及临界值取以下值时:U*(i,1),U*(i

8、2),……,U*(i, ki);P* 使模型评价标准取最大值,即   L2=max(a1/a+b1/b)50%   =50%+max(a1/a–b2/b)50%   或者使模型识别能力取最大值,即max(a1/a–b2/b),则称U*(i,1),U*(i,2), ……,U*(i,ki);P*为模型的一个最优解。 三、赋植方法 利用统计的方法   假设属性A中的j水平有t比例的人属于购买者,则称A属性j水平对购买的隶属程度为t。将t值赋予j水平,依据同 样的方法,则可以得到每个属性各个水平的赋植。   利用max L2=max(a1/a+b1/b)50%或max(

9、a1/a–b2/b)求出P值。对于第i个人,若 U1i+U2i+……+Umi>P,则判断此人为购买者,否则判断为非购买者。   可以求出属性A的重要程度=da/∑d。   其中,da=属性A中各水平赋值的标准差,∑d表示所有属性水平标准差之和。   此种方法比较简单,经济意义也比较明显。但这种方法也有比较明显的缺陷:各个属性(指标)之间不能有强的 相关性,没有考虑到属性之间的交互影响,得到的解有可能不是最优解等。 利用不等式及定义对各水平进行比较精确的赋值   此种方法要求将每个属性的水平赋予合适的值,赋值的范围从-∞到+∞。规则是若第i个人 U1i+U2i+……+Um

10、i>P   则判断此人为购买者,否则判断此人为非购买者。利用以下目标求出每个属性各个水平以及P的值:   max L2=max(a1/a+b1/b)50%或max(a1/a–b2/b)   其中max(a1/a+b1/b)与max(a1/a–b2/b)是等价的。   为了提高算法的可行性,本文提出并证明以下两点结论:   (1)结论一   在一个属性中,给各个水平赋值,有意义的不是各个水平赋值的大小,而是要看各个水平之间差距的大小。也就 是说,在一个属性中,给每个水平同时加上一个常数,不改变分类结果。   可以证明以下结论:   假设U*(i,1),U*(i,2

11、……,U*(i,ki); P*是分类模型的最优解,其中i=1,2,……,m。则对每个属性各水平的以下赋值:U*(i,1) +ai,U*(i,2)+ai,……,U*(i,ki)+ai ;P*+a1+a2+……+am,i=1,2,……,m也是分类的一个最优解,其中 a1,a2,……,am是常数。   可以这样来证明:   对于任意第j个人根据第一种赋值方法即U*(i,1),U*(i,2),……, U*(i,ki);P*,其中i=1,2,……,m 来判断是购买者(如果是非购买者结论也 是一样的),则   U*1j+U*2j+……+U*mj> P*   那么采用赋值方法:U*(i,

12、1)+ai,U*(i,2)+ai,……, U*(i,ki)+ai;P*+a1+a2+…… +am,i=1,2,……,m,因为不等式两边同时加上一个常数不改变不等号方向,所以同样可以得到:   (U*1j+a1)+(U*2j+a2)+……+( U*mj+am)>P*+a1+a2+……+am   也就是说第二种赋值方法没有改变任何人的分类,所以若第一种赋值方法:U*(i,1), U*(i,2),……,U*(i,ki);P*,其中i=1,2,……,m能够使L2 达到最大,L2=max(a1/a+b1/b)50%,或使模型的识别能力达到最大:max(a1/a–b2/b),则第二种赋值方法: U

13、i,1)+ai,U*(i,2)+ai,……,U*(i, ki)+ai;P*+a1+a2+……+am,i=1,2,……, m也能够使L2或模型的识别能力达到最大。   所以说,若U*(i,1),U*(i,2),……,U*(i,ki); P*,其中i=1,2,……,m是分类模型的一个最优解;则第二种分类方法:U*(i,1) +ai,U*(i,2)+ai,……,U*(i,ki)+ai ;P*+a1+a2+……+am,i=1,2,……,m,并且a1,a2,……,am是常数 ,也是分类模型的一个最优解,第一个最优解与第二个最优解是等价的。   利用第一个结论,可以令每个属性中的其中一个水平为

14、零,这样做并不改变模型的识别能力。在实际应用中,一 般可以令每个属性中购买倾向最小的水平赋予的值为0,因为在模型中,是大于临界值为购买者,因此,认为其它所有的水 平值都大于0是比较合理的。   (2)、结论二   若U*(i,1),U*(i,2),……,U*(i,ki); P*是分类模型的最优解,其中i=1,2,……,m;则aU*(i,1),aU*(i,2),… …,aU*(i,ki);aP*也是分类模型的一个最优解,其中a是不等于0的常数。   可分两种情况来证明:   第一种情况,a>0   对于任意第j个人,假设根据第一种赋值方法:U*(i,1),U*(i,2),……

15、 U*(i,ki);P*,其中i=1,2,……,m判断为购买者,即,根据第一种赋值方法可 以得到   U*1j+U*2j+……+U*mj> P*   因为不等式两边同时乘以一个正数,不等号方向不变。因此,有   aU*1j+aU*2j+……+aU*mj> aP*   也就是说利用第二种赋值方法对任何一个人的判断与第一种方法都相同。因此,若第一种方法使模型的识别能力 达到最大,则第二种方法也同样使模型的识别能力达到最大。所以说,若U*(i,1),U*(i,2 ),……,U*(i,ki);P*,其中i=1,2,……,m是分类模型的一个最优解,则 U*(i,2),……,aU*(i,

16、ki);aP*,其中i=1,2,……,m也是分 类模型的一个最优解。   第二种情况:a<0   对于a<0的情况,只需改变一下判断规则(大于或等于临界值时为非购买者,小于临界值时为购买值),则利用 类似的方法,同样可以证明,若U*(i,1),U*(i,2),……,U*(i, ki);P*,其中i=1,2,……,m是分类模型的一个最优解,则U*(i,2),……, aU*(i,ki);aP*,其中i=1,2,……,m也是分类模型的一个最优解。   一般情况下,可以限制a>0,这样判别规则就不用改了。   因为在结论一中,已经将各个水平限制在大于等于0的范围内,并且每个属性中购买倾

17、向最小水平的赋值为零。因 此,一般来说,临界值必然大于0。否则就会出现只要出现某种水平,就预测为购买者的情况。因此,总可以在不等式的两 边同时乘以一个常数,使临界值P为常数,这样并不改变模型的识别能力。   每个属性水平的取值可以限制在不超过P的范围内,否则会出现只要出现某个水平的值,就必须判断为购买者的情 况。   可以取P=10,令每个属性中购买倾向最小水平的赋值为0,其它水平的值在0与P之间(这里P取10),然后确定一 定的步长,利用叠代的方法求出最优解以及分类结果。 四、案例分析   A公司准备推出一款面向儿童的产品,采用的方式为一对一销售。A公司购买了数量很大的一批

18、名址,这些名址包 含的属性有:孩子的性别、孩子的年龄、孩子的爱好、孩子是否经常参加某种集体活动、父母的学历、父母的职业。营销 人员按照数据库中的名址与顾客(儿童的父母)进行沟通,经过一段时间的实践,发现沟通成本极大,与很多不可能购买 的人的接触浪费了太多的精力。A公司希望能够更准确的找到潜在消费者。   在这里,就可以利用分类模型。   A公司共接触了2500人,其中372人购买了产品,2128人没有购买产品。我们采用计算机随机抽样的方法,将2500 人分成两组,每组1250人,每组购买者的比例基本一样。我们用第一组数据来估计模型的参数,第二组数据用来检验模型 。以下分别用上面提到的两

19、种方法来求解分类模型。 1、利用统计的方法赋值   利用每个水平中购买者占的比重作为该水平的赋值。可以得到以下赋值结果: 属性 水平 孩子性别 男 女 赋值 0.233 0.115 孩子年龄 1-3 4- 6 7-9 10-12 13-14 15岁及以 上 赋值 0.0129 0.0736 0.1073 0.4795 0.4375 0.5192 父母职业 第一类职业 第二类职业 赋值 0.2493 0.0596 父母学历 硕士及以上 本科或大专 高中 初中 赋值 0.5 0.234 0.08411 0.0

20、8242 孩子爱好 无 第一类爱好 第二类兴爱好 赋值 0.0936 0.0814 0.2574 孩子是否经常参加集体活动 否 是 赋值 0.1156 0.2199      按照以上赋值方法,可以得到每个人的得分在0.46与1.88之间。   为了找到最合适的临界值,从而使L2=(a1/a+b1/b)50%或a1/a–b2/b 的值最大。可以在0.46与1.88之间计算 出在不同的P值下,模型拟合优度L2=(a1/a+b1/b)50%与模型识别能力a1/a–b2/b 的值。可以得到下图:    从图中可以看出,在P*=1.14时,模型拟合优度与

21、模型识别能力同时达到最大。模 型拟合优度L2=0.794,模型识别能力=0.587,因此,取临界值P*=1.14。按照以上赋值方法,当某个人得分大 于1.14时,就判断该人为潜在购买者;而当得分小于或等于1.14时,就判断该人为非潜在购买者。   可以求出,a1/(a1+b2)=37%,也就是说在利用上述分类模型选出的人中,将来可能会有37%的人购买产品,与不 利用模型时相比(14.88%),精确度有了很大的提高。   但是,也有一部分购买者被误判为非购买者,从而损失了一部分市场,这部分人占全部可能购买者的比例为: a2/a=33%,这属于利用模型获得高精确度的代价。   可以求出

22、各个属性对于判别是否是购买者的归一化重要程度:   孩子 性别 孩子 年龄 父母 职业 父母 学历 孩子 爱好 孩子是否经常参加集体活动 归一化 的重要程度 7.9% 21.8% 12.7% 18.6% 9.3% 29.7%   利用得到的 模型在第二组数据中进行预测,可以得到:    L2=(a1/a+b1/b)50%=0.786,    a1/a–b2/b=0.572   因此,第一种方法得到的模型预测能力还是比较好的,可以用来预测。 2、利用不等式及定义对各水平进行比较精确的赋值   利用第二种方法,可以得到各水平比较精

23、确的赋值。   令临界值P*=10,每个属性购买倾向最小的水平赋值为0。利用叠代的方法,可以得到最优解时的赋值 。 属性 水 平 孩子性别 男 女 赋值 1.1 0 孩子年龄 1-3 4-6 7-9 10-12 13-14 15岁及以上 赋值 0 0.498 0.774 3.826 3.482 4.152 父母职业 第一类职业 第二类职业 赋值 1.69 0 父母学历 硕士及以上 本科或大专 高中 初中 赋值 3.79 1.34 0.015 0 孩子 爱好 无 第一类爱好 第二类兴爱好 赋值 0.

24、174 0 2.31 孩子是否经常 参加集体活动 否 是 赋值 0 0.85   按照以上赋值,当某个人的得分大于10时,就判断为购买者,当得分小于 或等于10时,就判断为非购买者。   模型拟合优度L2=0.81,模型识别能力=0.62,与第一种方法略好一些。但预测能力略差一些。利用得到的模型, 在第二组数据中进行预测,结果为:   L2=(a1/a+b1/b)50%=0.759   a1/a–b2/b=0.518   不如第一种方法的预测。因此,利用第一种比较简单的方法基本可以满足一般的分类要求(但第一种方法在选属 性时要注意属性之间不能有强的相关性)。

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服