收藏 分销(赏)

基于淘宝网的消费者网络购物口碑的研究.docx

上传人:pc****0 文档编号:8911908 上传时间:2025-03-07 格式:DOCX 页数:13 大小:249.99KB
下载 相关 举报
基于淘宝网的消费者网络购物口碑的研究.docx_第1页
第1页 / 共13页
基于淘宝网的消费者网络购物口碑的研究.docx_第2页
第2页 / 共13页
点击查看更多>>
资源描述
基于淘宝网的消费者网络购物口碑的研究 北京师范大学 施昀 包钰 摘 要 随着网络消费的兴起,网络口碑对人们的影响也日益显著。本文先比较了网络口碑与传统口碑的异同。然后针对淘宝网买家对商铺的评分系统进行评价和分析,指出其合理性,分析消费者的网络口碑与时间变化的相关性,对消费者基于口碑选择商品和商铺的改进给出合理意见与建议,为后续的更深入更广泛的量化研究做准备。 关键字词:网络口碑;淘宝网商铺;相关性分析;回归分析 一、 研究背景和目的 进入21世纪,互联网已然成为人们生活的必需品,根据中国互联网络信息中心(CNNIC)的统计,截至2008 年6 月底中国网民人数已经达到2.53亿人,首次大幅度超过美国,跃居世界第一位,其中有25% 的网民青睐网络购物,电子商务以其价格低廉、产品丰富、方便灵活逐步得到网民的接受,跻身十大网络应用之列 [7] 。网络口碑传播呈现出波及范围大、 传播速度快、 匿名性 非面对面接触等新的特点,消费者的口碑将比以往更具有影响力 (Chatterjee, 2001; Hennig2 Thurau, et al, 2004; Hoffman, et al, 1996)[8]。 1. 网络口碑的概念和要素 口碑是消费者与消费者之间关于产品或服务的特性、使用经验及提供商等的信息的交换和沟通。传统口碑是通过口耳相传的方式进行沟通的。因特网的出现,使顾客可以通过浏览网页收集其他消费者提供的产品信息以及与此产品有关的讨论,并且顾客可以通过互联网针对特定产品进行自身经验、意见与相关知识的分享,这就形成了网络口碑。 2. 网络口碑与传统口碑的区别 表 1  网络口碑与传统口碑传播特征的比较 比较项目 传统口碑 网络口碑 传播媒介 主要是人际间的面对面接触 电子邮件、 新闻组、 在线论坛、 产业入口网站讨论区、 电子布告栏、 聊天室等 传播形式 语言、 声音和表情 数字化的多媒体信息 ,包括文字、图片、 声音、 音乐等 传播速度 人际之间一对一的沟通 ,传播速度慢 一对多甚至多对多的传播、 病毒式的速度传播 传播环境 人际沟通的社会环境中 ,受到时空限制 ,传播范围有限 开放的虚拟社会环境中没有时空限制 ,传播范围广 传播信息量和结构 信息数量有限 ,网络结构简单 信息数量庞大 ,网络结构复杂 传播双方的关系 传播双方身份公开 ,强联结关系为主 传播双方匿名 ,身份隐藏 ,弱联结关系为主 淘宝网作为目前国内最大的网上购物网站,其商品种类、数目和客服保障系统最能体现国内网络购物的水平与状况。本文基于淘宝网的大量数据,旨在分析淘宝网买家对于商铺的评分系统,指出其合理性,分析消费者的网络口碑与时间变化的相关性,对消费者基于口碑选择商品和商铺的改进给出合理意见与建议,为后续的更深入更广泛的量化研究做准备。 二、 相关研究文献回顾 传统口碑对顾客态度、购买行为的说服效果已被证实,口碑传播双方多属强联结关系,对于口碑接收者而言,口碑传者的信息可信度高,说服力强。大部分研究认为网络口碑较传统口碑具有较高的说服效果。Gelb等(2002)认为网络虚拟空间里,提供意见的人基本上是匿名的,信息传播者非常愿意提供真实的意见或分享第一手经验,无论是正面或负面的评论。网络口碑与传统的口碑传播相比,具有波及范围大、传播速度快等特点,因此对消费者信息搜寻购买决策、态度的形成和变化都具有更强的影响力 (Hoffman, et al, 1996; Hel m, 2000)。Tanimoto等(2003)认为,网络不受时空地理位置的限制,加上信息的易复制性,网络口碑的能见度与传播效果远远超过传统口碑。 学者对传统口碑传播机制的研究较多,关注的焦点主要是口碑产生动机和口碑影响力而对网络口碑传播机制的研究非常有限,多集中于再传播意愿,其中着眼于网络购物评分系统的口碑传播研究在国内尚未发现。 对于网络购物的口碑传播机制和影响,国外已经有人研究。Chevalier 和 Mayzlin(2004)就不同网上购书网站的口碑对其图书排名和销量的影响做出了讨论。Mayzlin(2004)和Yong Liu(2006)就电视和电影观众在网络上的评价进行了动态模型分析。除此以外,也有对美国著名网上购物网站eBay的详细分析和讨论。 三、 研究思路 淘宝网商铺评分系统 商品数量 收藏人气 宝贝与描述相符, 卖家的服务态度, 卖家发货的速度 最近1周,1个月,6个月,6个月前,全部时期的评分 回归 相关性 回归模型 四、 网络消费者口碑的影响因素 1. 考察变量 我们利用程序,可以从淘宝网上得到20个左右的变量。最终根据文献和实际情况,我们选取了如下与商铺评分相关的变量: 商品数量 收藏人气 最近6个月宝贝与描述相符评分 最近6个月卖家的服务态度评分 最近6个月卖家发货的速度评分 卖家最近1周,1个月,6个月,6个月前的好评数 卖家总计好评数 卖家最近1周,1个月,6个月,6个月前的中评数 卖家总计中评数 卖家最近1周,1个月,6个月,6个月前的差评数 卖家总计差评数 卖家最近1周,1个月,6个月,6个月前的总得分 卖家总计总得分 2. 变量分析 经过网上查找,我们得知淘宝网把店铺分为了服饰、手机/数码/办公/家电、家居/母婴/食品美容护肤/个人护理、文体/汽车、珠宝/首饰、收藏/爱好、游戏/花费、生活服务,这其中共有约50类商品,各类商品的店铺数如下图所示: 图1 淘宝网各类商品店铺数 由上图知,店铺数大于3%的商品种类有12类,其中女装所占比例最大,为约为10%,符合大众消费者的需求。在众多类别中,我们先选择了两类进行研究,它们分别是珠宝类和数码相机类。原因有三:一是这两类商品的店铺数都超过了2%;二是这两类商品的店铺数量比较合适,挖掘数据的消耗的时间相对较少而且较准确。三是这两类商品在性质上完全不同,有比较的价值。 从挖掘得到的数据得知,淘宝网站的上给出的对商家评分项有:宝贝与描述相符评分,卖家的服务态度评分,卖家发货的速度评分(简称三项评分),不同时间好评数。在分析评分的关系前,我们从这两类商品中筛选出有代表性和有意义的数据,并剔除错误数据,即商品数大于50个,总评数大于200次。 (1) 三项评分之间的关系 首先得到两类商品三项评分的分布: 图2 珠宝类店铺三项评分的分布 图3 数码相机类店铺三项评分的分布 由上图知,各项评分的分布近似于正态分布。 表2 三项得分的关系 Kruskal-Wallis test P Value 珠宝 2.2e-16 数码相机 2.2e-16 利用Kruskal-Wallis test进行相关性检验。P Value<<0.05. 结论:两类商品中宝贝与描述相符评分,卖家的服务态度评分,卖家发货的速度评分这三项都没有关系。说明这三项评分的设置合理,有参考价值。 其次,两类品的三项评分的分别进行比较。由于各项评分接近正太分布,我们采取t检验来比较两类商铺的评分。 表3 两类商铺三项评分分别比较 珠宝 t test 数码相机 宝贝与描述相符评分 卖家的服务态度评分 卖家发货的速度评分 宝贝与描述相符评分 0.0001408 0 0 卖家的服务态度评分 0 3.306e-06 0 卖家发货的速度评分 0 0 0.3734 结论:两类商铺宝贝与描述相符评分不同,珠宝小于相机;卖家的服务态度评分不同,珠宝大于相机;卖家发货的速度评分相同。用类似的方法可以比较其他不同类别的商铺。 (2) 三项评分与总评分的关系 表4 两类商铺三项评分与总评分的关系 Kruskal-Wallis test P Value 珠宝 2.2e-16 数码相机 2.2e-16 利用Kruskal-Wallis test进行相关性检验。P Value<<0.05. 结论:这两类商铺的三项评分与总评分关系不大。 (3) 除了考虑这三项评分,我们发现收藏人气和商品数量会影响消费者初期选择店铺的判断,即收藏人气越高,进店浏览的可能性越大。在此我们讨论了收藏人气与总评分的关系,如下表: 表5 两类商铺收藏人气,商品数目与总评分的关系 Kruskal-Wallis test P Value 珠宝 2.2e-16 数码相机 2.2e-16 利用Kruskal-Wallis test进行相关性检验。P Value<<0.05. 结论:这两类商铺的收藏人气,商品数目与总评分关系不大。 3. 变量选取 由前面的分析可知,商铺的宝贝与描述相符评分,卖家的服务态度评分,卖家发货的速度评分,收藏人气,商品数目与总评分关系不大,在考虑评分的时间关系时,可以先不作考虑,而作为参考变量。下面我们就总评分代表的消费者的综合评价进行模型建立。 五、 模型建立与分析 (一) 商铺的评分 1. 淘宝的评分规则 根据以上分析结果和实际经验可知,淘宝商铺的总评分值(y)与商铺的商品总数、收藏次数关联性不大,而与各种评价等级(好评(x1)、中评(x_2)、差评(x3))的数量息息相关。通过回归分析研究目前商铺的总评分与各种评价等级的数量的定量关系,可以得到淘宝网对商铺的评价体系,进而方便下面考虑其他变量对消费者心理的影响,找到对店铺的合适的描述。以数码相机的商铺为例,建立的回归模型为: y=β1x1+β2x2+β3x3+b 用SAS对模型进行估计,结果为: y=0.99965x1+0.12184x2-1.14463x3 (5400.66) (1.67) (-8.63) R2=1 F=2.64×107 估计模型参数下括号中为该参数的t统计量检验值,文中以下相同 。 (1) 对模型以及参数的显著性检验 结果如下: 表6 模型及参数的显著性检验 F值 显著性 模型 2.64×107 <.0001 显著 参数 T值 显著性 x1 0.99965 <.0001 显著 x2 0.12184 0.0942 显著 x3 -1.14463 <.0001 显著 可知,淘宝评分模型是显著的,并且各个自变量参数的系数也是显著的。 (2) 对模型进行异方差检验 图4 残差图 由多元线性回归理论可知,预测值的残差图中散点应随机地分布在-2到+2的带子里,这样的残差图成为正常的残差图。从上图可看出,本模型中的残差图只有少数点落在了(-2,2)之外,拥有很好的方差齐性,说明不存在异方差的情况。 (3) 对模型的参数进行自相关检验 求出各个参数的方差膨胀因子如下表所示: 表7 方差膨胀因子 参数 VIF β1 2.72098 β2 9.14975 β3 6.08654 每个参数的VIF值都小于10,说明模型的参数间并不存在自相关性,各个自变量都对总评分(y)值有很好的贡献。 综上所述,我们通过好评、中评、差评数拟合出了淘宝网对商铺的评分体系。经过咨询,得知每个好评数为商铺的总评分加1,中评数加0,差评数减1,这与我们拟合出的系数十分相符。 2. 建立商铺分数模型 商铺的创建时间对淘宝网上的商铺评分有很大影响(创建时间越早可能得到的总评分越高),但是并不意味着创建时间越早商铺就越好。为了消除时间的影响,我们将商铺在不同时期的好评、中评、差评百分比例(px1、px2、px3)作为自变量,带入上步的线性回归模型,可以得到满分为1的评分标准下,不同时期商铺的得分,这样就把商铺的评分标准统一化了。模型的定义如下: std_y=pβ1∙px1+pβ2∙px2+pβ3∙px3+b2 由于有些商铺的评分很接近,为了区分,我们将评分值统一扩大5倍,变为5分制,记为wy=5×std_y. 3. 判别不同商品种类的商铺之间有无评分差异 判别不同商品种类之间评分分值差异是否显著,一方面可以得知是否有必要针对不同的商品的商铺建立不同的评分体系,以方便消费者准确、便捷的购物;另一方面,可以找到淘宝网上商城的薄弱环节,为淘宝网上商城的建设提供很好的建议。下面,我们以数码相机和珠宝两类商品为例,分析的步骤为: (1) 列举两种商品的所有商铺的信息; (2) 筛选出商品数大于50件,对商品的评论人数大于200人的商铺:商品数小于50的商铺很有可能因为商品数过少而经营不下去(在淘宝网上只是徒有其表,实际已经“倒闭”),评论人数过少容易产生很大的误差,为了保证数据的良好性,我们采取如上措施; (3) 利用上述模型分别计算两种商品中各店铺的分值wy; (4) 利用判别分析方法判别两类商品的的商铺之间有无评分差异。 (5) 结果如下: 表8 数码相机与珠宝评分后的t检验 t test P Value 数码相机&珠宝 2.2e-16 图5 数码相机与珠宝重新评分后的得分分布 (6) 建立不同类商品的评分模型 判别分析的结果告诉我们,不同类商品的商铺评分存在明显差异,因而,针对不同类商品,需要建立不同的评分体系。评分体系的模型如下: wy=5*stdy=5*i=1nDi∙pβi∙pxi+b Di=1取pxi因子0不取pxi因子 其中,n=7,分别代表商铺标准化的一周以内的评分(x1)、一个月内的评分(x2)、六个月内的评分(x3)、六个月前的评分(x4)、商品与实际相符的打分(x5)、商家服务态度打分(x6)、商家送货速度(x7)。(以上均为5分制)以数码相机和珠宝为例,讨论不同类商品的评分模型。 4. 数码相机商铺的评分模型 (1) 选择参数 为了探究总评分与不同时间段内的评分是否有关,我们先将原数据中不同时间段的评分值取对数,建立线性模型: logy0=α1log⁡(y01)+α2logy02+α3logy03+α4logy04+b. 表9 用SAS软件处理结果1 Parameter Estimates Variable DF Parameter Estimate Standard Error t Value Pr > |t| Intercept 1 0.83478 0.02314 36.08 <.0001 Logy01 1 0.06276 0.01472 4.26 <.0001 Logy02 1 -0.01445 0.01999 -0.72 0.4701 Logy03 1 0.40280 0.01507 26.73 <.0001 Logy04 1 0.42958 0.00563 76.26 <.0001 上述结果说明,总评分与时间关联很大,特别是最近六个月的评分(logy03)和六个月前的评分(logy04)(这两个变量参数的t值很大),最近一周的评分(log⁡(y01))系数虽然也显著,但是最近六个月的评分与最近一周的评分有重复的部分,因此,下面建模在找寻时间变量的时候只考虑logy03和logy04。 (2) 拟合模型 通过1) 中简单的分析,模型拟合采用标准化的最近六个月的评分x3、六个月前的评分x4、商品与实际相符打分x5、商家服务态度打分x6作自变量,总评分值wy为函数值,结果如下: wy=2.72622+0.31012x3+0.07605x4+0.04554x5+0.02342x6 R2=0.4847,F=425.87 检验模型和参数的显著性: 表10 用SAS软件处理结果2 Parameter Estimates Variable DF Parameter Estimate Standard Error t Value Pr > |t| Variance Inflation Intercept 1 2.72622 0.05533 49.27 <.0001 0 X3 1 0.31012 0.01108 27.99 <.0001 1.24263 X4 1 0.07605 0.00575 13.24 <.0001 1.02273 X5 1 0.04554 0.00875 5.21 <.0001 2.38644 X6 1 0.02342 0.01063 2.20 0.0277 2.45169 从上表可以看出,所有的参数的P-value都是小于0.05的,因而所有的参数都是显著的。即:最近六个月的评分、六个月前的评分对店铺的总评分有影响,说明消费者注意观察商家是否一直更新货品;商品是否符合实际打分、商家服务态度打对最后的总评分有影响说明消费者不仅在乎商品的质量好坏,同样也注重购物的心情,商家要提高自己的竞争力,就要从有形的商品和无形的服务两方面努力。因此,上述的模型不需要调节,即为正确的模型。并且,VIF值均小于3,说明这几个参数没有共线性,各自独立的描述总评分值。采用与上述相同的方法检验异方差,发现其很好的符合方差齐性。 表11 举例列出前十位商铺的评价分数如下所示 ID 数码相机 商品与实际相符打分 商家服务态度打分 33414690 4.99825 4.7 4.7 33611449 4.98279 4.7 4.7 33363272 4.98024 4.7 4.8 33165371 4.92929 4.8 4.8 34355293 4.91024 4.7 4.8 34091340 4.90221 4.7 4.8 34802790 4.82103 4.9 4.9 35287933 4.80200 4.6 4.7 33613003 4.72942 4.6 4.7 34531264 4.70792 4.8 4.8 33414690 4.69841 4.7 4.7 5. 珠宝商铺的评分模型 (1) 选择参数 采用与上述相同的方法挑选时间参数。结果如下: logy0=0.74985+0.34568logy03+0.52137logy04 (29.03) (22.64) (71.47) R2=0.9061,F=2873.72 其中,可以验证模型是显著的,但是log(y02) 和 log(y03) 的系数的p-value均大于0.05,我们把它们看成是不显著的,因而舍去这两个参数,取最近六个月的评分(x3)和六个月前的评分(x4)作为与时间相关的自变量。 (2) 拟合模型 同样地,采用最近六个月的评分(x3)、六个月前的评分(x4) 、商品与实际相符打分(x5)、商家服务态度打分(x6)作自变量,总评分值wy为函数值,结果如下: wy=5.13830-0.02656x4+0.3542x5+0.6649x6 模型是显著的,但是x3的系数的p-value大于0.05,因此,它们是不显著的。总评分只与六个月前的评分有关。检验模型的自变量的共线性和方差齐性,发现其变量的VIF值都小于2,且方差齐性良好,所以模型还是较为合理的。 6. 对两种商品评分模型的解释 从以上分析可以看出,两种商品的评分模型有很大差别:数码相机的商铺评分是由最近六个月的评分、六个月前的评分、商品与实际相符打分、商家服务态度打分决定,说明消费者看重数码相机的商铺的不仅仅是以往的口碑,而且最近的口碑也十分关注,这与数码产品更新换代非常快有很大关系;珠宝的商铺评分中最近六个月的评分的系数是不显著的,说明消费者更看重的是以往商家的口碑如何,珠宝相对于数码产品更新换代较慢,消费者对现在的关注就淡了些。这两个模型提醒淘宝网数码产品的店铺要时刻注意更新换代,否则就有被淘汰下去的可能,而珠宝商家要更加注重商品的质量,这样消费者才能更加光顾店铺。 为了验证模型的合理性,我们还对手机,运动鞋等大众消费比较多的产品进行了分析。发现手机的回归模型与数码相机及其紧密,因为它们都是数码产品,有近似的特性和消费者满意程度。 六、 模型的进一步讨论 1. 本模型的创新之处在于对评分系统考虑了时间的作用。将分段时间的评分作为自变量,并与商品与实际描述相符打分、商家送货速度打分和商家服务态度打分等普通变量充分结合在一起做回归分析,形成一个同时具有时间因素和空间因素的线性模型。 2. 记录评分的时间有些粗糙。若能每天获得一组数据,则可以利用时间序列分析方法分析单个商铺的总评分、服务态度、商品数、收藏人气等变量随时间的变化,并作出预测,从而判断这个商铺未来的经营状况,从商铺的发展层面帮助消费者选择购物的商铺。 3. 回归所用的变量若能更多一些,就能得到更全面、更系统的结果。下一步可以采用网上发行问卷的方式,并将问题分类,获得消费者的更多反馈,可以根据商铺性质将其分类,例如:注重质量的商铺、注重服务的商铺等,供消费者选择,为消费者服务。 七、 结论及建议 从前面的分析可知,淘宝网列出的有关于反映网络口碑的变量存在不同的关系。商铺的宝贝与描述相符评分,卖家的服务态度评分,卖家发货的速度评分,是对商铺的不同方面进行打分。对卖家的总评分表示了买家的综合评价,更具有说服力。三项评分与总评分关系不大,说明了三项评分的合理性和代表性,能从具体的侧面反映商铺的品质。而收藏人气与总评分的无关性则说明了网络口碑的盲目性,人们总是浏览而不去购买,得到的收藏人气也不具有参考价值。 在分析总评分时,为了避免新建立的商铺受时间和评分人数的影响。我们对数据进行标准化处理,得到了不同时期以5分为满分的总评分。在得到不同商品的总评分后,我们可以进行正态检验,比较商品的差异性。由回归结果知,总评分与前六个月和六个月的总评分最相关,说明口碑长期以来好的商铺会获得更多消费者的认可,而那些短期内成立的小店,虽然评分高,但不能完全说明其口碑好。消费者在查看评分状况时,需要注意该店长久以来的评价。 除了根据时间相关性得到的线性方程,我们还加入了收藏人数,商品数目等变量来讨论影响总评分的因素。对于不同种类的商品回归的方程不尽相同,主要是由于商品本身的性质和消费者行为的差异。消费者应该注意对不同类商品关注不同时期的评分。而商铺则应提高其不足的方面,如宝贝相符程度,以满足消费者的需要,获得更好的口碑。 参考文献 [1] Judith A. Chevalier, Dina Mayzlin. “The Effect of Word on Sales: Online Book Reviews.”Journal of Marketing Research, Vol. 43 (August 2006), 345-354. [2] Yong Liu. “Word of Mouth for Movies: Its Dynamics and Impact on Box Office Revenue.” Journal of Marketing, Vol. 70 (July 2006), 74-89. [3] David Godes, Dina Mayzlin. “Using Online Conversations to Study Word-of-Mouth Communication.” Journal of Marketing Science, Vol.23, No.4, Fall 2004,545-560. [4] Qing Chang, Craig Van Slyke, Seung-hun Han. “Break the Trust Threshold: Customer Ratings and Trust Building on eBay Auctions.” Proceeding of the Twelfth Americas Conference on Information Systems, Acapulco, Mexico August 04th-06th 2006 [5] Chrysanthos Dellarocas, Charles A. Wood. “The Sound of Silence in Online Feedback: Estimating Trading Risks in the Presence of Reporting Bias.” Journal of Marketing Science, Vol.54, No.3, March 2008, 460-476. [6] 陈明亮,章晶晶.《网络口碑再传播意愿影响因素的实证研究》.《浙江大学学报》,2008年9月,第38 卷第5 期. [7] 付琛,《网络口碑研究综述》.《现代商业》. [8] 张莹,孙明贵《西方网络口碑传播效应研究进展》.财贸研究,2008.5. [9] 郗河,徐金发,罗时鑫,黄国群.《网络口碑与传统口碑对消费者购买决策影响比较研究》.《财贸经济》,2008年第2期. [10] 德尔 L 霍金斯,戴维 L. 马瑟斯博,罗杰 J.贝斯特.《消费者行为学》.2007年7月,第1版. [10] 薛毅,陈立萍.《统计建模与R软件》.清华大学出版社,2007年4月,第1版. [11] 高惠璇.《实用统计方法与SAS系统》.北京大学出版社,2001年10月,第1版.
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 学术论文 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服