1、 年第 卷第 期总第 期物流工程与管理 经济与管理:./.基于在线评论数据的京东物流服务质量影响因素研究 张雪澳(上海理工大学 管理学院上海)【收稿日期】【作者简介】张雪澳()女硕士研究生上海理工大学研究方向:大数据挖掘与分析网络舆情分析 【摘 要】在电商平台上商品在线评论的重要性越来越突出对顾客的购买行为产生了极大影响 在网络环境下对与物流服务有关的评价信息进行有效的分析对于提升顾客的满意程度和企业的物流服务水平具有十分积极的作用 鉴于此文中以京东商城家居类、家电类商品和生鲜类的在线评论数据为研究对象运用情感分析技术进行情感极性分类确定然后对不同情感极性的评论文本进行词频分析和 主题模型 研
2、究发现消费者对这三种类型商品物流服务需求的关注点存在差异 其中家居类商品和家电类商品的安装服务最为关键消费者对生鲜类商品配送速度有更高需求【关键词】在线评论情感分析 主题模型物流服务质量【中图分类号】【文献标识码】【文章编号】()()【】.【】互联网及电子商务的快速发展极大地改变了消费者的购物方式 中国互联网络信息中心()发布的第 次中国互联网络发展状况统计报告表明截止到 年 月我国网购人数已达到.亿人占网民整体的.数据显示 年上半年我国网上零售总额为.万亿元同比增加了.其中实物商品网上零售额达到了.万亿元同比增加了.占社会消费品零售总额的.同比增长.个百分点在网络购物规模和频率日益增长的趋势
3、下在线评论的数量呈指数级增长这些海量的在线评论隐含着消费者对产品各方面的需求和偏好如使用体验、价格和商品物流等通过技术手段有效挖掘消费者的需求信息能够为商家改进产品和改善服务提供非常宝贵的数据资源 林伟振等采集了亚马逊网站的在线评论数据结合 模型及多个机器学习算法构建顾客满意度模型得到了顾客对产品的关注维度、满意度影响方面与改进次序为商家提供深刻管理启示 刘旭旺等通过构建平台企业的产品两阶段销售收益模型研究在线评论对平台利润的影响探究出在线评论对产品上市模式策略选择的影响 张文等以 主题模型为基础考虑到在线评论有用性构建了 主题分析模型以从商品的在线评论中抽取消费者关注的有用性评论主题 江亿平
4、等针对基于在线评论情感分析的鲜果动态定价问题提出融合边缘采样和协同训练的在线评论情感分析方法探究出零售商最优定价决策 张振刚罗泰晔设计了一种结合在线评论和 模型来识别消费者对产品属性的需求类型的方法 岳子静等利用美团网上的餐馆在线评论数据研究当第 期张雪澳:基于在线评论数据的京东物流服务质量影响因素研究地各菜系及其相关属性的关注度与满意度进而探究用户的菜系偏好及各菜系的传播与发展情况当前在线评论已被广泛应用于酒店、餐饮等行业的研究但是针对网络购物的物流服务质量的研究还不多 同时已有的关于在线评论的网络购物物流服务质量的研究大都未将在线评论进行情感分类也未根据不同类型网购商品的特性深入剖析其对物
5、流服务质量的影响 鉴于此本研究拟利用通过爬虫得到的京东商城家居类、家电类商品和生鲜类的在线文本评论数据结合情感分析技术进行文本情感赋值与分类然后采用 算法对数据进行文本词频分析最后运用 主题模型识别消费者重点关注的京东物流服务维度 研究设计.数据采集本文通过网络爬虫技术采集得到京东网站上的在线评论数据考虑到影响不同类型商品物流服务质量的因素存在差异因此本文分别收集不同类型商品的在线评论作为研究样本.数据预处理爬取获得的评论数据包含噪音为保证其有效性需要进行一定的预处理:数据清洗 爬取的评论数据中往往存在着大量标点符号所以需要通过正则表达式删掉其中的无效符号 分词 由于中文文本之间没有明确的界限
6、因此必须先对文本分词这样有助于计算机更好地理解词语的词性 去除停用词 由于评论数据中包含连词、语气词等这样没有实际意义的词所以数据分词后还要去除这些无用的停用词.分析方法对于爬取得到的京东商城的在线评论数据主要对其进行文本分析和情感分类 具体包括:情感分类 将文本数据进行情感极性划分方便之后针对不同情感极性的评论文本进行词频分析和 主题模型分析文本词频分析 利用 方法得出在线评论中的高频词 主题模型分析 利用主题模型聚类出对京东物流服务质量产生影响的主题数 实验分析.评论采集与预处理选择京东平台上三种不同类型的商品分别为家居类、家电类和生鲜类利用网络爬虫技术采集这三类商品的在线评论数据包括用户
7、名称、评论内容、评论时间、评分、点赞数、回复人数各类商品在线评论的采集数量以及预处理后的数量见表 表 京东商城商品在线评论的数据构成商品种类采集数量(条)预处理后数量(条)家居类家电类生鲜类合计数量.文本情感分析.情感分析模型构建文本情感分析是一种通过自然语言处理从大量文本内容中提取情感极性并通过累加判断情感倾向的有效途径 本文采用基于深度学习的情感分析方法搭建了 模型该模型包括输入层、词嵌入层、层、层、输出层共五个部分整体结构如图 所示 利用在线评论数据构建语料库通过 将评论数据向量化然后结合 网络和注意力机制搭建模型注意力机制对不同特征分配不同权重会更加关注评论数据中倾向于用户情感的特征信
8、息能够有效提高分类效率降低数据中的噪声干扰图 结构图 将四分之一的数据进行人工标记来作为训练的样本对表现正向情感的数据标为“”对表现负向情感的数据标为“”总共标记 个其中 个正向的情感样本个负向的情感样本 训练后的模型准确率为.模型表现良好.情感分类结果利用构建好的情感分析模型对预处理后的在线评论数据进行情感分类分别得到家居类、家电类和生鲜类三种类型商品的正、负面评论文本数据集(见表)从好评率的角度来看家居类商品中正面数据占 家电类商品占 生鲜类商品占 其中生鲜类商品的好评率甚至低于差评率可以看出消费者对于这三种类型的商品评价普遍都不高并且正面情感与负面情感分布两极分化表 在线评论情感极性分类
9、表商品类型正面评论数(条)负面评论数(条)好评率家居类家电类生鲜类物流工程与管理第 卷.文本词频分析.文本特征权重计算本研究通过 方法计算文本特征权重值 ()是一种用于信息检索与文本挖掘的常用加权技术用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度 此方法结合了词频()和逆向文档频率()计算特征权重其公式如下:()()()()其中 代表某一类中词条 出现的次数表示文档中的所有词语个数 代表语料库中的文档总数代表词语 所在的文档数.文本词频分析利用 方法得到三种类型商品正、负面评论的高频词及其权重值表 至表 分别为三类商品正面评论和负面评论的高频词 及其权重排名表表 家居类商品
10、正面评论 高频词及其权重排序特征词权重排序特征词权重安装.乳胶.不错.京东.质量.快递.做工.外观.舒服.材质.物流.很快.客服.款式.包装.好看.结实.收到.满意.性价比.表 家居类商品负面评论 高频词及其权重排序特征词权重排序特征词权重客服.东西.售后.差评.质量.补发.态度.螺丝.垃圾.发货.安装.图片.味道.产品质量.商家.京东.退货.不好.快递.真的.从表 与表 中可以看出安装一词在家居类商品正面评论中出现次数最多说明消费者对家居类商品最在意的是商品的安装问题质量、做工、舒服等词也排名很靠前说明商品的做工质量也是消费者购买家居类商品的重要考虑因素同时表中也出现了物流、客服、快递、很快
11、这类词语说明物流速度和客服服务同样是消费者很在意的方面 负面评论中客服、售后、态度、商家、退货等词出现次数靠前表明家居类商品的客服态度和退换货服务并不理想存在较多问题质量、垃圾、味道等也在家居类商品负面在线评论中频繁出现说明消费者对家居类商品的质量给予否定态度表 家电类商品正面评论 高频词及其权重表排序特征词权重排序特征词权重效果.师傅.外观.满意.安装.速度.外形.大小.静音.声音.制冷.很快.不错.大气.送货.冷暖.京东.音效.容量.物流.表 家电类商品负面评论 高频词及其权重排序特征词权重排序特征词权重安装.送货.客服.烤箱.差评.上门.京东.东西.售后.不好.师傅.质量.退货.电话.垃
12、圾.效果.服务.预约.收费.海尔.根据表 和表 数据家电类商品正面评论的高频词中包括安装、师傅等词说明对于家电类商品消费者很看重商品的安装服务并且予以肯定 送货、京东、速度、物流等词表明消费者也同样十分关注京东的物流速度 在负面评论中可以发现客服、售后、退货、服务等词多次出现说明负面问题主要出现在消费者与售后客服的联系沟通和退换货服务要求上 结合安装、收费等词和正面评论的内容说明家电类商品在各地的安装服务收费标准尚未统一表 生鲜类商品正面评论 高频词及其权重排序特征词权重排序特征词权重京东.快递.不错.收到.好吃.发货.新鲜.购买.包装.口感.味道.快.速度.回购.云吞.质量.物流.满意.喜欢
13、.馄饨.第 期张雪澳:基于在线评论数据的京东物流服务质量影响因素研究表 生鲜类商品负面评论 高频词及其权重排序特征词权重排序特征词权重京东.发货.客服.好吃.坏.售后.差评.垃圾.难吃.态度.苹果.味道.快递.不好.收到.包装.新鲜.螃蟹.商家.口感.表 和表 的数据显示在生鲜类商品正面评论中好吃、新鲜、味道等词频繁出现说明消费者在购买生鲜类商品时特别在意商品的质量 新鲜度是描述此类商品的最重要依据而速度、物流、快递、发货、快等描述物流速度的词也可以等同为对新鲜度的描述因此在消费者选购生鲜产品时物流速度是一个很重要的参考指标 另外包装一词在正面评论中出现的频率也极高可以看出包装同样是消费者关注
14、的重要因素同时也说明了包装对生鲜类商品质量的重要程度 在负面评论中坏、难吃、快递、味道、口感等词都与生鲜类商品的质量即新鲜度有关也就是与配送速度有关表明生鲜类商品在一些区域的配送速度仍然有问题 除此之外由客服、商家、售后、态度等词可以看出在消费者收到有问题的产品之后和商家交流并向商家提出退换货要求过程中客服服务和态度也是让消费者给出差评的一个原因.主题分析.主题模型()是被广泛使用的主题模型之一是一种可以对文本等非结构化数据进行概率统计的模型由文档、主题和词三部分构成其模型结构见图 图 主题模型结构图 图中 代表文档总数 代表主题总数 表示文档中的单词总数 表示文档中单词的主题 代表文档中的词
15、语 表示文档下的主题分布 代表主题下特征词的分布 是文档下主题的多项分布的 先验参数 是主题下特征词的多项分布的 先验参数 主题模型可用于对商品在线评论进行挖掘和信息的检索通过分析文本数据的相似性并利用更深层的语义挖掘挖掘出文本数据中的隐藏主题和特征进而获得其所蕴含的有效信息 在进行 主题分类时需要选择最优的主题数一致性()常被用来确定 模型的最佳主题数量主题一致性通过测量主题中得分高的单词之间的语义相似度来衡量单个主题的得分 数值一般随着潜在主题数量的增加呈现递增的规律 数值越大则该主题模型的生成能力越强.主题数的确定图 至图 所示为三类商品正、负面评论文本数据进行 主题分类时的主题数与一致
16、性曲线从图中可以看出主题数为 时家居类商品正面评论一致性最高因此家居类商品正面评论的 主题模型的主题数为 同理家居类商品负面评论的 主题模型的主题数为 家电类商品正面评论的 主题模型的主题数为 家电类商品负面评论的 主题模型的主题数为 生鲜类商品正面评论的 主题模型的主题数为 生鲜类商品负面评论的 主题模型的主题数为 图 家居类商品正面评论主题一致性结果图 家居类商品负面评论主题一致性结果物流工程与管理第 卷图 家电类商品正面评论主题一致性结果图 家电类商品负面评论主题一致性结果图 生鲜类商品正面评论主题一致性结果图 生鲜类商品负面评论主题一致性结果.主题提取表 至表 所示为三类商品正面评论和
17、负面评论的 主题模型分类结果每个模型的主题特征词都是 个但是在主题特征词中通常存在一些无意义的虚词和重复词所以在选取时可以从中选取最具有代表性的几个通过主题特征词可以分析到与此相对应的主题聚类内容表 家居类商品正面评论 主题及对应的特征词主题特征词商品安装安装、组装、不错、大小、尺寸、简单商品质量做工、质量、款式、结实、不错床质量舒服、乳胶、软硬、不错、躺、感觉物流速度不错、师傅、服务、很快、满意、物流表 家居类商品负面评论 主题及对应的特征词主题特征词商品质量质量、差、垃圾、味道、不好、产品客服态度客服、京东、商家、差、耐心 归纳家居类商品正面评论特征词总结出四大主题可将其简化为三大主题分别
18、是商品安装、商品质量、物流速度归纳家居类商品负面评论特征词总结出二大主题分别是商品质量、客服态度 综合正负面评论的主题词可以看出消费者对于京东家居类商品质量的态度两极分化说明京东对于家居类商品的质量把控不过关且对于商家客服的素质仍需加强管理不过消费者对于京东的物流速度和安装服务给予了高度肯定表 家电类商品正面评论 主题及对应的特征词主题特征词物流速度很快、物流、京东、送货、速度烤箱功能烤箱、东西、烤、差评、京东、美的商品安装安装、师傅、满意、不错空调功能效果、静音、制冷、电、省、节能、冷暖商家品牌买、值得、品牌、不错、信赖电视功能屏幕、运行、速度、清晰、功能、不错第 期张雪澳:基于在线评论数据
19、的京东物流服务质量影响因素研究表 家电类商品负面评论 主题及对应的特征词主题特征词商品价格赠品、便宜、东西、价格、差评、差客服售后客服、差评、京东、售后、电话、解决安装服务安装、师傅、差、服务、上门、收费、送货商品质量质量、坏、垃圾、退货洗衣机功能效果、洗、不好、衣服、干净、脱水 归纳家电类商品正面评论特征词总结出六大主题可将其简化为三大主题分别是物流速度、商品安装、商品质量从中可以看出消费者对于家电类商品的京东物流速度、安装服务和商品质量是给予肯定态度的 归纳家电类商品负面评论特征词总结出五大主题分别是商品价格、客服售后、安装服务、商品质量、洗衣机功能 可以看出家电类商品存在多方面的问题比如
20、安装人员额外收费、安装人员维修技能低、商品保价措施失误、客服售后服务差等 结合正面和负面评论发现家电类商品质量良莠不齐表 生鲜类商品正面评论 主题及对应的特征词主题特征词商品味道好吃、味道、不错、新鲜、喜欢、口感商品价格京东、购买、不错、值得、价格物流速度满意、物流、速度、发货、很快、不错表 生鲜类商品负面评论 主题及对应的特征词主题特征词水果质量烂、不好、坏、垃圾、水果商品味道不好吃、差、吃、难吃、坏、差评客服态度客服、商家、差、态度、回复肉质量肉、虾、味道、虾仁、难吃、差评售后问题退货、退款、差评、慢商品包装包装、坏、味道、收到、箱子 归纳生鲜类商品正面评论特征词总结出三大主题分别是商品味
21、道、商品价格、物流速度 可以看出消费对味道、新鲜度(体现在物流速度上)、价格三个维度较为关注 归纳生鲜类商品负面评论特征词总结出六大主题可以将其简化为五大主题分别是商品质量、商品味道、客服态度、售后问题、商品包装 可以发现负面评论的 主题分类结果较单一顾客对生鲜类商品不满的原因在于商品新鲜度及它所造成的某些问题比如商品损坏变质、客服态度差、退换货售后处理不当等同时也可以看出商品损坏变质不新鲜的部分原因是商品包装不当.总结分析结合三类商品的词频分析和 主题分析可以发现对于所有类型的商品消费者都高度关注商家客服态度与退换货售后服务对于家电类、家居类商品更加关注安装服务对于生鲜类商品更加关注商品包装
22、和物流速度以确保商品新鲜度 这三类商品企业可以通过改善这些方面的服务来有效地提高顾客满意度从而获得更高的收益 另外从三类商品的正面评论 主题分析可以看出消费者对于京东的物流速度保持一致的满意态度 结语在网络购物过程中物流服务是不可或缺的一个环节其服务质量直接关系到消费者的满意程度及购买过程中的感受 本文从消费者角度出发通过京东平台上的在线评论探究了影响其物流服务质量的影响因素 首先使用爬虫技术获取京东平台上家居类、家电类商品和生鲜类三种商品的在线评论数据信息并对数据信息进行了预处理其次使用搭建的情感分析()模型将预处理后的数据信息进行情感极性划分得到正面和负面在线评论数据接着对正、负面评论分别
23、进行词频分析通过 方法展现在线评论中的高频词语最后进行 主题模型分析得出三类商品正、负面评论中关于京东物流服务质量水平的相关主题信息 本文研究有助于京东物流针对各类产品特性制定相应的物流服务管理策略从而改善企业的物流服务质量水平进而达到让客户满意的目的 随着情感分析技术的不断创新与发展本文搭建的情感分析模型尚存在一定的局限性后续研究将更加关注情感分析模型的准确性参考文献 中国互联网络信息中心.第 次中国互联网络发展现状统计报告.中国互联网络信息中心.林伟振刘洪伟陈燕君等.基于在线评论的顾客满意度研究 以健康监测穿戴产品为例/.数据分析与知识发现:.刘旭旺王骏嘉齐微等.基于在线评论的产品上市模式选择策略研究/.系统工程:.张文王强杜宇航等.在线商品评论有用性主题分析及预测研究.系统工程理论与实践():.江亿平张婷夏争鸣等.基于在线评论情感分析模型的鲜果动态定价研究.管理学报():.张振刚罗泰晔.基于在线评论数据挖掘和 模型的产品需求分析.管理评论():.岳子静章成志周清清.利用在线评论挖掘用户饮食偏好 以北京地区为例.图书馆论坛():.车思琪李学沛.评价系统视阈下中美企业致股东信情感话语对比分析基于情感词典和机器学习的文本挖掘技术.外国语(上海外国语大学学报)():.:.():.