1、数据挖掘技术在电子商务中的应用以亚马逊为例的数据挖掘应用分析作者:吴玩秋 陈欣 刘晓驰 张颖 袁燕芳班级:093电子商务指 导 老 师:蒋盛益报告提交时间:2011-06-12目录摘要 2第一章 绪论1.1调研背景21.2数据挖掘应用对电子商务领域的意义21.3数据挖掘技术的应用现状31.4数据挖掘主要方法41.5数据挖掘过程41.51数据挖掘过程图51.52数据挖掘过程简介5第二章 以亚马逊为例的数据挖掘应用分析2.1数据挖掘在电子商务中的应用分析客户获得62.11客户获得的定义62.12数据挖掘技术在客户获得中的应用意义62.13客户获得的步骤72.2数据挖掘在电子商务中的应用分析客户细分
2、82.21客户细分的定义82.22客户细分的意义82.23数据挖掘算法进行客户细分的流程92.24亚马逊网站的客户分析92.3数据挖掘在电子商务中的应用分析客户保留112.31客户保留的意义112.32客户流失原因的分析122.33数据挖掘在亚马逊电子商务平台的挖掘目标132.34亚马逊在建立客户流失模型的过程132.4数据挖掘在电子商务中的应用分析个性化服务142.41个性化服务的定义142.42个性化服务的特点142.43电子商务个性化服务的意义152.44 电子商务个性化服务的类型152.45数据挖掘技术亚马逊个性化服务中的应用162.5数据挖掘在电子商务中的应用分析资源优化182.51
3、资源优化的意义182.52数据挖掘在亚马逊资源优化方面的应用18第三章 局限性分析3.1数据挖掘在电子商务中应用的局限性21总结和体会21摘要随着网络的迅速发展,电子商务的应用不断深入。在电子商务应用系统中,相关的用户数据日益增多,而数据挖掘技术具有从大量复杂数据中发现特定规律的能力。商业的电子化趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。在前人研究的基础上,我们小组以亚马逊网站为研究对象,对数据挖掘技术在亚马逊网站这个电子商务平台的应用进行分析。本文通过对亚马逊网站的客户获得,客户细分,客户保留,个性化服务以及资源优化这五
4、个方面进行分析,得出数据挖掘在电子商务中的重要性。第一章 绪论1.1调研背景随着网络技术和数据库技术的成熟,全球传统商务正经历一次重大变革,向电子商务全速挺近。这种商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需要信息和购物行为特征的可能性。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。电子商务的发展促使公司内部收集了大量的数据,并且迫切需要将这些数据转换成有用的信息和知识,为公司创造更多潜在的利润,数据挖掘概念就是从这样的商业角度开发出来的。数据挖掘涉及的科学领域和方
5、法很多,其核心技术经历了数十年的发展其中包括统计,近邻,聚类,决策树,神经网络和规则等。今天,这些成熟的技术在电子商务中已进入了使用阶段,并取得了良好的效果。1.2数据挖掘应用对电子商务领域的意义数据挖掘有助于发现电子商务业务发展的趋势,帮助电子商务企业做出正确的决策,使企业处于更有利的竞争位置。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需求信息和购物行为特征的可能性。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。数据挖掘有助于客户关系管理,特别是对电子商务客户关系
6、管理起着决定性的作用。数据挖掘主要是找寻隐藏在数据中的信息,例如发现趋势、特征及相关性的过程,也就是从数据中发掘出信息或知识。以此对客户需求进行深入分析以满足企业对个体细分市场的客户关系管理需求。从发现客户到客户分类再到客户管理,数据挖掘通过各种针对性技术为企业客户关系管理提供了强有力的保证。将数据挖掘技术应用于客户关系管理,能够帮助企业深入理解客户,得到更加准确的客户模型,从而改进营销决策和客户服务。 数据挖掘可以促进电子商务平台的发展,加强企业电子商务平台应用的普及度。采用数据挖掘技术将电子商务中丰富的数据源信息进行有效组织利用对电子商务的具有巨大的应用价值。同时数据挖掘对于电子商务平台信
7、息的挖掘分析可以帮助检验电子商务平台的性能,促进电子商务平台的智能化,帮助企业打造更具可操作性及吸引力的消费平台,为消费者提供更便利的消费环境。数据挖掘有利于企业资源优化,合理分配资源以实现资源价值最大化。数据挖掘进行有效的统计分析挖掘,可以指导营销的组织和分配,让企业在市场竞争中处于有利位置抢占先机。通过数据挖掘可以发现消费者的消费特性,从而帮助制定个性化服务,极大地吸引顾客,既避免资源浪费,又为企业带来巨大的价值。1.3数据挖掘技术在电子商务的应用现状由于数据挖掘能带来显著的经济效益,它在电子商务中(特别是金融业、零售业和电信业)应用也越来越广泛。数据挖掘技术在电子商务中重要应用于客户获得
8、,客户细分,客户保留,个性化服务以及资源优化这几个方面。像亚马逊等零售业是数据挖掘的主要应用领域,这是因为零售业积累了大量的销售数据,如顾客购买史记录、货物进出、消费与服务记录以及流行的电子商务等等都为数据挖掘提供了丰富的数据资源。零售数据挖掘有助于划分顾客群体,使用分类技术和聚类技术,可以更精确地挑选出潜在的顾客;识别顾客购买行为,发现顾客购买模式和趋势,进行关联分析,以便更好地进行货架摆设等等。1.4数据挖掘主要方法目前, 在很多领域, 数据挖掘都是一个很时髦的词, 数据挖掘所能解决的典型商业问题有很多, 下面就分别介绍数据挖掘的六种常用数据挖掘得方法。数据统计方法使用这些方法一般首先建立
9、一个数据模型或统计模型,然后根据这种模型提取有关的知识。例如,可由训练数据建立一个 Bayesian 网,然后,根据该网的一些参数及联系权重提取出相关的知识。关联规则方法 关联规则是描述数据之间存在关系的规则, 形式为“A1 A2 An B1 B2 Bn”。一般分为两个步骤: 第一步, 求出大数据项集。第二步, 用大数据项集产生关联规则数据库一组。运用关联规则的数据项往往存在某种潜在关联关系的规则。一找出所有类似的关联规则,对于企业确定生产销售、产品分类设计、市场分析等多方面是有价值的。人工神经网络方法人工神经网络是由大量的简单神经元,通过极其丰富和完善的连接而构成的自适应非线性动态系统,并具
10、有分布存储、联想记忆、大规模并行处理、自组织、自学习、自适应等功能。人工神经网络是一种有效地预测模型,在聚类分析、奇异点分析、特征提取中可以得到。通过模拟人的神经元功能, 经过输入层、隐藏层、输出层等, 对数据进行调整、计算, 最后得到结果, 用于分类和回归。决策树方法决策树算法是目前应用最广泛的归纳推理算法之一,是一种逼近离散值函数的方法。它是以实例为基础的归纳学习算法, 通常用来形成分类器和预测模型,着眼于从一组无次序、无规则的事例中推理出决策树表示形成的分类规则。它采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,最后在决策树的叶结点得到
11、结论。因此从根到叶结点的一条路径就对应着一条合取规则,而整棵决策树就对应着一组析取表达式规则。决策树可能是现在最流行的有指导数据挖掘结构。聚类方法聚类分析是对群体及成员进行分类的递归过程。一个簇是一组数据对象的集合,在同一簇的对象彼此类似,而不同簇中的对象彼此相异。将一组物理或抽象对象分组成为由类似对象组成的多个簇的过程被称为聚类。聚类是将数据对象分组成为多个类或簇,在同一个簇中的对象具有较高的相似度,而不同簇中的对象差别较大。可视化技术数据与结果被转化和表达成可视化形式,如图形、图像等,使用户对数据的剖析更清楚。1.5数据挖掘过程1.51数据挖掘过程图图1:数据挖掘的基本过程和主要步骤1.5
12、2数据挖掘过程简介过程中各步骤的大体内容如下:确定业务对象 清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步.挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的.数据准备a数据的选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据.b数据的预处理:研究数据的质量,为进一步的分析做准备.并确定将要进行的挖掘操作的类型.c数据的转换:将数据转换成一个分析模型.这个分析模型是针对挖掘算法建立的.建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键.d数据挖掘:对所得到的经过转换的数据进行挖掘.除了完
13、善从选择合适的挖掘算法外,其余一切工作都能自动地完成.e结果分析:解释并评估结果.其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术.f知识的同化:将分析所得到的知识集成到业务信息系统的组织结构中去第二章 以亚马逊为例的数据挖掘应用分析概述:数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。在电子商务日益普及的今天,数据挖掘在电子商务领域的应用成为技术领域关注的热点。本章以世界著名的电子商务平台-亚马逊为例,从客户获得、客户细分、客户保持、个性化服务、资源优化五个主要方面分析数据挖掘技术在电子商务上的具体应用。
14、2.1数据挖掘在电子商务中的应用分析客户获得2.11客户获得的定义客户获得是指企业在吸引潜在客户转变为实际购买者这一过程中所运用的策略和方法。客户获得的最佳值取决于企业保留客户的能力、客户重复购买的频次以及与保留客户相比获得客户的相对机遇。 2.12数据挖掘技术在客户获得中的应用意义在没有利用数据挖掘技术时,客户获取的传统方法就是选出一些感兴趣的人口调查其属性,获取这些人口的特征即可。但随着数据量的增大,传统的方法具有不可实现性。利用数据挖掘在扩展客户市场活动时,利用数据挖掘技术挖掘出潜在的客户名单,在客户名单上列出可能对某些产品感兴趣的客户信息,便可更方便的获取更多的客户。分类通过分析已知分
15、类信息的历史数据,总结出一个预测模型,预测哪些人可能会对邮寄广告、产品目录等有反应,可以针对这一类客户的特点展开商务活动,提供个性化的信息服务。具体的操作过程,一般是先从数据仓库中收集客户的相关信息,用数据挖掘的一些算法对其进行处理和转换,并对客户的未来行为进行预测分析,这样,针对不同类型的客户确定一个或多个分析发现流程,从而自动锁定重点客户。 1 李红,梁大鹏. 数据挖掘技术在商场CRM中的应用.商场现代化.2011 2 吴跃.数据挖掘在电信客户流失中的应用研究.中国优秀硕士学位论文全文数据库.2006. 97-993 埃弗雷姆特伯恩.电子商务管理新视角第2版.北京.电子工业出版社.2010
16、用于分类分析的技术有很多,典型方法有统计方法的贝叶斯分类、机器学习的判定树归纳分类、神经网络的后向传播分类等。2.13客户获得的步骤1.建立关系阶段。是卖方确立客户,买卖双方建立互信的阶段,买方对你的产品和服务并没有真正的使用经验。这个阶段是客户营销中最为关键的,也是需要消耗最多资源的。 2.稳定关系阶段。与客户关系进入稳定期以后,工作重点和关键就发生了转移,这个时候工作重点应该放在防止意外情况发生和积极进行危机管理。进入稳定阶段以后,沟通在客户管理中起着非常重要的作用。3.加强关系阶段。随着买卖双方信任和了解的加固,卖方应该对自己满足客户的能力进一步地加强和要求,应该更加深入分析客户的需求潜
17、力。这也是增加销售内容和加固关系的最佳时期。在加强阶段要和客户建立一个互利互惠的关系。在客户获得上,亚马逊公司过各种具体措施收集客户信息并采用数据挖掘技术预测客户,并逐步建立与客户间的关系,最终获得稳定客户。首先,在网站首页设立客户注册栏,获得客户本人基本信息,为客户设立专门档案管理,以便于记录客户行为,比如设置search栏等方法,获得客户点击浏览过哪些商品,购买过哪些商品,满意度如何等信息。这样利用数据挖掘整理出的客户资料可以为未知客户的行为提供对照,以便于进行下一步对未知客户的发掘。其次,亚马逊的顾客在亚马逊网站WEB 上的行为都会产生大量数据信息,不仅包括本次交易信息而且还有利用搜索引
18、擎以及在站点内进行浏览的相关数据,这些数据中包含了对市场分析及预测非常有益的潜在信息。亚马逊根据客户消费行为及商品销售情况或通过web、cookie等技术获得的数据进行数据挖掘,对已知客户的消费行为制定一个数据库和一组具有不同特征的类别(标记),这样就将该已知客户数据库中的每一个记录都赋予一个类别的标记,即设定训练集。这是与客户之间建立关系的阶段。然后,通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,通过分析已知分类信息的历史数据,总结出一个预测模型,然后用这个分类规则对其它数据库中的记录进行分类。 最后,通过数据挖掘分类方法可以将未知客户分类为不同类别,这
19、样就可以预测哪些客户是潜在客户,有针对性的进行商品广告、促销等个性化服务,这样便可最大程度挖掘潜在客户,获得更多客户 。通过分析锁定客户,稳定与客户的关系。亚马逊在自己的网站上使用的都是“一点通”的程序设计。任何人只要在亚马逊网上书店购物过一次,系统就会自动地记下购物者得的相关资料,当下再购买时,只要在你选中的物品上轻轻一点,一键就可以完成余下的所有操作。系统将自动为你刷卡付费,为你填写好邮寄方式和地址等收件资料。更有趣的是,如果在礼品中心购物,如果你去年已经在亚马逊购买了情人节礼物,那么今年你再去时,甚至连收礼人的地址都不需你填,亚马逊的强大的的服务部队会自动、准确无误地将你的礼品送到去年的
20、那个人手上。亚马逊通过数据挖掘为稳定的客户提供更便利的服务,加强与客户间的关系,这是客户获得的有力保障。2.2数据挖掘在电子商务中的应用分析客户细分2.21客户细分的定义客户细分是20世纪50年代中期由美国学者温德尔史密斯提出的,其理论依据在于顾客需求的异质性和企业需要在有限资源的基础上进行有效地市场竞争是指企业在明确的战略业务模式和特定的市场中,根据客户的属性,行为,需求,偏好以及价值等因素对客户进行分类,并提供有针对性的产品,服务和销售模式2.22客户细分的意义顾客天生就存在差异,大量营销策略在忠诚的世界里根本就不适用,因为并不是每一个顾客都适于成为某品牌的品牌忠诚者。如果企业要最大化地实
21、现可持续发展和长期利润,就要明智地只关注正确的顾客群体,因为企业要获得每一位顾客,先前都要付出一定的投入,这种投入只有在你能赢得顾客的忠诚后才能得到补偿。因此,要通过价值营销以获得品牌忠诚重要的一步就是对客户进行细分,找寻到哪些顾客是能为企业带来赢利的,哪些顾客不能,并锁定那些高价值顾客。只有这样企业才能保证他在培育顾客忠诚的过程中所投入的资源得到回报,企业的长期利润和持续发展才能得到保证。传统的分析方法对存在可伸缩性,高维性,异种数据和复杂数据的问题,而数据挖掘技术就是为了解决上述问题而诞生的。2.23数据挖掘算法进行客户细分的流程客户数据 选择关注的客户群 细分参考标准 确定每群客户特征
22、图2:数据挖掘算法进行客户细分流程图2.24亚马逊网站的客户分析亚马逊网站通过长期的观察,获得了顾客的大量信息:顾客作为某品牌的顾客的时间周期,每个时间周期内顾客购买某种品牌的频数,顾客购买该品牌产品的平均贡献,顾客购买该品牌的概率。利用贝叶斯方法,聚类等数据挖掘技术,通过顾客的年龄,职业,性别,收入(通过顾客勉强维持生活,正常生活,小康水平,我们划分为1000-2000,,2000-5000,以及5000以上),我们推测亚马逊网站利用贝叶斯方法,聚类等数据挖掘技术,将目标客户细分成如下表:表1:亚马逊的客户细分表年龄职业性别收入水平购买行为偏好的喜好22岁以下学生男低(1000-2000)便
23、宜,实惠,服装、虚拟产品、电子产品中(2000-5000)追求品牌高(5000以上)个性化, 款式女低(1000-2000)敏感,选择少,时尚服装、化妆品、食品中(2000-5000)品牌、款式、新潮、时尚高(5000以上)世界品牌、炫耀、高贵、华丽2539岁商业人士男低(1000-2000)便宜数码、电子产品中(2000-5000)款式,品牌高(5000以上)独特性,品牌,质量女低(1000-2000)便宜,潮流服装、化妆品、家居、生活用品中(2000-5000)时尚,款式高(5000以上)品牌,质量,时尚企业人士男低(1000-2000)实惠,便宜数码、电子产品中(2000-5000)款式
24、,品牌高(5000以上)个性化,品牌,质量女低(1000-2000)便宜,实惠服装、化妆品、保养品、家居、生活用品中(2000-5000)时尚,款式高(5000以上)品牌,质量职业人士男低(1000-2000)实惠,便宜数码、电子产品中(2000-5000)款式,品牌高(5000以上)独特性,品牌,质量女低(1000-2000)便宜,实惠服装、化妆品、保养品、家居、生活用品中(2000-5000)时尚,款式高(5000以上)品牌,质量40-55商业人士男低(1000-2000)实惠,便宜家居、生活用品中(2000-5000)款式,品牌高(5000以上)独特性,品牌,质量女低(1000-2000
25、)便宜,实惠家居、生活用品中(2000-5000)时尚,款式高(5000以上)品牌,质量企业人士男低(1000-2000)实惠,便宜家居、生活用品、健身器材中(2000-5000)款式,品牌高(5000以上)独特性,品牌,质量女低(1000-2000)便宜,实惠家居、生活用品、化妆品、保养品中(2000-5000)时尚,款式高(5000以上)品牌,质量职业人士男低(1000-2000)实惠,便宜收藏品、健身器材中(2000-5000)款式,质量高(5000以上)质量女低(1000-2000)便宜,实惠家居、生活用品、化妆品、保养品中(2000-5000)款式,耐用高(5000以上)品牌,质量5
26、6岁以上退休人士男低(1000-2000)实惠 家居、生活用品中(2000-5000)款式高(5000以上)质量女低(1000-2000)实惠家居、生活用品、保养品中(2000-5000)质量高(5000以上)品牌,质量通过客户细分,亚马逊网站可以有针对性地向不同类型的顾客提供不同类型的符合客户需求的产品和服务。另外,亚马逊网站也通过客户细分,了解到哪些客户是最有价值的客户,哪些是企业的忠诚客户,哪些是企业的潜在客户,哪些客户的成长性最好,哪些客户最容易流失,从而有针对性的提出销售策略。这也是亚马逊网站成为龙头老大的原因之一。 2.3数据挖掘在电子商务中的应用分析客户保留2.31客户保留的意义
27、随着互联网的发展,电子商务市场的竞争日趋激烈,客户选择的产品、网站的服务及网站的余地越来越大,因此电子商务平台之间对客户的争夺也越来越激烈。以往传统的网络、技术等优势难以在电子商务平台之间拉开差距,无法形成明显的差异话的竞争优势。因此,为了在新的电子商务市场形势下能够培育和创造出新的差异化竞争,电子商务平台以客户为中心,深入地了解客户,引导客户,留住客户。根据某调查数据显示,“用户保持率”增加5,就有望为运营商带来85的利润增长。由此可见用户流失对业绩的影响之大,防止用户流失是企业是否盈利的必要条件。因此,为了避免由客户流失造成的损失,我们必须找出那些有流失危险和最有价值的客户,并相应开展保留
28、和获取客户的活动。数据挖掘技术凭借其在大量看似杂乱无章的数据中发现潜在规律的强大优势,正在为更多的企业用来进行分析用户消费行为特征、信用度等,从而降低企业的经营风险,为企业开展针对性营销提供强有力的技术支撑。2.32客户流失原因的分析在亚马逊的客户分析系统中,明确了客户流失的定义,并将客户流失分为:被动流失和主动流失;被动流失是因为客户恶意拍下商品,长期不付款;主动流失有不同的原因:1、主观原因限制所引起的异动,如住处物流交通不便2、另一类是客户主动放弃,如因为竞争对手的优惠政策,对目前的服务不满意,消费者偏好改变实体店购物等。在这些群体中,主动流失的客户是亚马逊在做客户流失分析中重点分析的对
29、象,亚马逊根据客户的信用度等级和此客户所带来的利润分成不同的小群体,如图所示:高用户信用度低高低 图3: 客户重要性等级在这些小群体中,用户价值和信用度高的可能流失的用户(如图3.1中的类客户)是亚马逊最关心的对象,如果能过成功地预测这类客户,并能够成功地挽留这类客户,将给亚马逊带来可观的利润,对于那些信用度低而价值高的客户(如图3.1中的类客户)是需要次关心的客户,他们可能会盗打,对这类客户加以挽留的同时要采取一定的策略防止他们进行欺诈的可能。其次需要关心的群体是信用度高而价值低的客户(如图3.1中的类客户),可以提供他们感兴趣的业务或实行一定的优惠政策来加以挽留。第四类客户在通常情况下是可
30、以不予考虑。2.33数据挖掘在亚马逊电子商务平台的挖掘目标对历史数据使用决策树、logistic回归和神经网络技术,分别建立模型,以价值和预测概率为过滤条件对一部分客户进行分群分析。利用客户流失模型,对高价值高流失概率的客户进行客户特征分群,并根据不同群的特征图给出不同的特征描述,为市场人员对这些客户进行精细化营销提供支持。2.34亚马逊在建立客户流失模型的过程数据获得亚马逊拥有强大的数据库系统(云环境中的关系数据库数据的选择与理解:客户的历史行为中隐含大量与流失相关的行为模式,数据必须围绕市场分析得到的与相关的信息来组建。从数据库中抽取基本客户群、客户基本资料、客户的缴费资料、客户投诉资料、
31、客户帐单、客户消费习惯等信息形成信息表,然后根据用户号和帐务年月进行连接,形成了亚马逊进行分析的原始数据。同时在原始数据的基础上,根据业务专家的意见,进一步衍生有可能与流失相关的属性数据的预处理与准备:亚马逊对收集到的原始数据进行缺失值的处理,进行抽样分析,进行异常数据处理,得出候选变量,最后对候选变量进行选择,最终形成用于建模使用的候选变量集。客户流失模型的建立: 基于上面的数据准备,得到的数据集合,亚马逊对所得的数据集合进一步分析,通过不断的调试,根据三种方法使用不同变量集合建立起来多个流失模型用于流失模型建立的三种方法: logistic回归模型 神经网络模型 5.0 决策树模型模型的评
32、估:根据所建立的多个模型使用两种方法进行模型评估,并找出相对优的模型2.4数据挖掘在电子商务中的应用分析个性化服务2.41个性化服务的定义 个性化服务是基于信息用户的信息使用行为、习惯、偏好和特点,来向用户提供满足其各种个性化需求的一种服务。其核心内容是在尊重用户个体的基础上,研究用户的行为和习惯,为用户选择更重要、更合适的信息资源,提供有特色的服务。2.42个性化服务的特点 个性化服务具有几个非常明确的特点: a针对性:个性化服务的根本就是以用户为中心,所有的服务必须以方便用户、满足用户需求为前提。通过对用户的行为、兴趣、爱好和习惯的研究,自动组织信息内容和调整服务模式,以便能更好地为用户提
33、供更具针对性的服务。 b可定制性:在个性化服务中,用户能够充分表达个性化需求,动态地定制自己想要的用户界面、信息资源、信息服务种类和服务方式,创造适应自己的信息活动环境,从而获得“量身定制”的服务。 c主动性:个性化服务能够主动感知不同用户的个性化需求并将用户所需要的信息及时推送给用户。这种“信息找人”的主动服务模式与传统“人找信息”的被动服务模式截然不同。 d智能性:个性化服务中采用了推理反馈、机器学习和智能代理等人工智能技术,这些技术通过跟踪和学习用户的习惯、爱好,建立用户模型和信息模型,不断挖掘用户潜在的兴趣特征,实现信息的智能推荐和智能过滤,从而显著提高服务质量。2.43电子商务个性化
34、服务的意义在电子商务中引入个性化技术,其商务模式由以供应商为中心转向以客户为中心,利用个性化的服务工具来了解和学习客户的需求与喜好,根据客户提出的明确要求提供服务,或通过对客户个性、使用习惯的分析而主动地组织信息资源,创建个性化的服务环境,向客户提供其可能需要的服务。这样不但使客户在面对电子商务网站提供的上万甚至上百万种产品时能大大节省在商品搜索上花费的时间和精力,而且提高了客户对电子商务网站的忠诚度,增加了用户的访问次数,实现了将更多的电子商务网站的浏览者转变为商品的购买者,提高了电子商务网站的交叉销售能力,为电子商务企业提供更多的盈利机会。2.44 电子商务个性化服务的类型个性化服务是通过
35、获取用户的个性化信息,从而理解用户的需求,为用户提供更为准确的服务,提高用户的满意度。同时通过与用户直接的或间接的沟通,改善与用户的关系,提高用户的忠诚度。电子商务个性化服务主要包括个性化内容定制服务、个性化信息检索服务和个性化信息推荐服务3类。 (1)个性化内容定制服务 在个性化内容定制服务中,用户可以根据自己的兴趣和需求定制信息。定制的内容包括信息资源、界面、服务等等。电子商务网站在提供个性化内容定制时,如亚马逊Amazon,用户每次登录网站时,只要键入自己的账户名与密码,服务器就可以将查询结果主动传递给信息用户,并利用动态网页自动生成用户定制的动态页面。(2)个性化信息检索服务电子商务网
36、站中最常用的是按照关键词进行检索,输出的检索结果较多,用户一般要花费大量的时间才能找到自己所需要的信息。个性化信息检索根据用户提出的明确要求进行信息检索,或通过对用户个性、使用习惯的分析而主动地分析出用户的检索目的,使检索结果更符合用户的需要。(3)个性化信息推荐服务通过网络信息的挖掘,了解用户的需求和兴趣,为用户提供个性化的实时信息推荐服务,也是电子商务个性化服务的一个发展方向。个性化推荐服务不仅能根据用户的特征提供具有针对性的信息,还能根据用户特征、兴趣主动地向用户推荐其需要的信息。2.45亚马逊的个性化服务 亚马逊这家超级书店的服务有以下特色:方便的浏览和搜索、有用的产品信息评论、建议和
37、个性化内容、广泛的选择余地、较低的价格、单击下单技术、电子钱包、安全支付系统,以及高效的订单执行。亚马逊还提供其他服务以使得在线购物更加有趣。它的“礼品创意”部分提供随季节而变的礼品创意和服务。在“社区”部分,它提供了一个场所共顾客交流产品信息和经验。在“电子贺卡”部分,顾客可以向朋友和家人寄发免费的电子动画贺卡。还有注册用户的在线管理订单服务可以允许用户:查询他们的订单处理状态,撤销为装运订单的送货选项和地址,修改为装运订单的支付方式,订阅商品更新个人提示服务。亚马逊的这些个性化服务带来了令人满意的购物体验,并促使顾客再次访问该网站。2.46数据挖掘技术亚马逊个性化服务中的应用1.Web挖掘
38、技术在电子商务个性化服务中的应用过程如下:(1)数据收集 Web日志文件中的数据主要通过Web服务器端自动收集并保存用户的注册信息、访问内容、访问行为等信息,以及客户端、代理服务器端的信息。启动Web服务器的日志记录功能后,每当浏览者通过浏览器请求一个网页时,这个请求被记录在访问日志中。代理服务器就把所记录的信息保存在文本文件中,通常以“.txt”或“.log”作为文件的扩展名。Web日志文件是由一条条记录组成,一条记录就记录了购书者对Web页面的一次访问。每个客户的访问行为、访问频率等信息,都会在Web服务器中被自动收集并保存,这些原始数据是Web日志挖掘的基础数据来源。Web服务器还可以存
39、储其他的Web使用信息,比如Cookie。Cookie是由服务器产生的,用于记录购书者的状态或者访问路径。由于涉及到购书者的隐私问题,使用Cookie需要客户的配合。亚马逊网站会利用Cookie文件来识别用户身份,当用户再次访问亚马逊网站时,就会显示类似“欢迎再次光临,*(用户名)”。用户可以在线注册一个用户档案,并利用亚马逊获得专利的“单击设置”功能在线管理自己的用户信息。 (2)数据预处理 Web日志文件包含了各种没有经过处理的原始数据,其中有不完整的、冗余的、错误的数据,只有通过数据的清理和过滤,才是有分析价值的可靠信息。数据预处理可以获得客户会话文件或客户事务文件,该文件中包含了访问用
40、户信息、请求页面的次序、访问时间等,为后续工作准备了数据基础。通常Web日志挖掘的预处理包括数据清理、客户识别、会话识别、路径补充、事件识别和格式化等处理过程。 (3)模式发现 对客户会话文件或事务文件运用关联规则分析、聚类分析等算法可以获得客户特征模式库。在今后客户浏览网页时,可以充分利用和分析客户的特征模式,掌握用户的特征和习惯,节省时间,提高效率,动态调整网页结构,主动满足客户需要的服务。亚马逊公司通过运用关联规则分析和聚类分析等算法,分析客户过去浏览历史信息,推测客户的爱好,然后筛选出对客户有用的信息。如根据客户以前购买的书籍种类推荐新书,当客户浏览某本书或某个音乐专辑是,基于Web的
41、数据库将提供其他顾客的评论,并告诉顾客“购买该作者作品的顾客还购买了这些作者写的书”。(4)模式应用 Web日志挖掘得到的结果,可以应用于重构Web页面之间的链接关系以及页面的拓扑结构,实现个性化服务。2.RSS技术在电子商务个性化服务中的应用过程如下: RSS是一种信息聚合的技术,是某一站点用来和其他站点共享内容的一种简易信息发布和传递的方式,使用户用更少的时间分享更多的网上信息资源。RSS通过XML标准定义内容的包装和发布格式,提供了一个实时、高效、安全和低成本的信息发布和快速获取信息的通道,其主要特点有以下几条:a.抗干扰。没有广告或者图片来影响标题或者文章概要的阅读。b.信息汇聚。用户
42、可以加入多个定制的RSS提要,将多个来源的信息整合到单个数据流中,而不用在这些网站或信息系统之间跳来跳去。c.最新资料管理。自动更新你定制的频道网站内容,保持信息的即时性。d.订阅方便快捷。订阅对应的频道只需在阅读器中输入频道地址,马上就能实现信息同步,退订时只要将频道从阅读器中删除即可,而不像邮件订阅需要许多烦琐的操作。 基于RSS的信息服务方式过程:当信息服务提供者向用户提供RSS时,通过RSS生成器,按照RSS规范的要求形成具有统一格式的RSS文档,称为RSS种子,并为RSS种子分配一个URL;浏览者有选择地订阅自己需要的RSS种子,通过RSS阅读器接收RSS种子信息,然后根据其中商品概
43、要信息确定自己具体需要的内容,并通过其提供的链接获取目标页面。RSS技术中提供个性化服务方式具体如下: (1)最新商品信息发布 使用RSS服务器,可以实现商品信息的自动更新。在网站的新商品发布页面上按商品分类放置RSS种子,甚至可以为每个商品生成RSS种子,生成的RSS种子包含商品常规信息,如当前的价格、商品描述、商品图片等。当商品信息变化时,只需修改种子源,相应放有种子的页面信息就同步变化亚马逊就采用RSS技术实现了个性化内容定制服务。打开亚马逊的网站,就可以发现几乎所有种类的商品都已打包成相应的“RSS频道”,向客户终端的阅读器定期发送。通过RSS这个新渠道,亚马逊每当有新商品上市、新促销信息和重大新闻时,都能快速及时地将这些信息“推”向其客户,不仅给客户提供了方便,而且大大提高了这些信息的普及率、针对性和实效性。个性化推送服务RSS服务器可以根据客户个人浏览和购买商品的情况,充分了解客户的需求,提取客户兴趣特征信息,自动构建个性化服务的RSS种子,实现RSS个性化服务。RSS个性化服务可以过滤客户不需要的信息,自动通知客户所需要的预约商品