1、第 38 卷第 4 期2022 年 11 月 广东农工商职业技术学院学报JournalofGuangdongAgricultureIndustryBusinessPolytechnicVol.38 No.4Nov.2022基于 Group Lasso 对数线性回归的智能手环评论数影响因素分析王黎明1,2,沈梦琦1(1.南京财经大学红山学院,江苏南京210003;2.南京信息工程大学数学与统计学院,江苏南京210044)摘要:本文基于 GroupLasso对数线性回归构建智能手环评论数的影响因素模型,通过八爪鱼采集器抓取智能手环的详细信息进行实证量化研究。首先,对智能手环详细信息进行描述性分析,
2、初步分析智能手环自身属性、功能属性、所属店铺属性三方面对评论量的影响。在建立虚拟变量的基础上,利用 GroupLasso 建立对数线性回归模型来探究影响智能手环评论量因素的具体数值关系,并推广应用。研究结果有助于改善智能手环的有关属性,利于商品的推广和销售。关键词:智能手环;GroupLasso;对数线性回归;变量选择中图分类号:F274文献标识码:A文章编号:1009-931X(2022)04-0015-06投稿日期:2022-07-28基金项目:江苏省高校哲学社会科学研究项目(2019SJA2093);江苏省“青蓝工程”资助项目(2022)作者简介:王黎明(1993),女,江苏淮安人,博士
3、,讲师。研究方向:经济统计和分布式统计推断。随着智能化商品越来越受社会各界关注,出于对自身健康、生活以及娱乐的关注,智能穿戴市场发展迅速。据 IDC 数据显示,近几年,智能穿戴设备仍将保持高速度发展。截止到 2021 年,智能穿戴设备的出货量达 2.82 亿只,2022 年到 2026 年智能手环的 CAGR(复合增长率)将达 21%,市场容量达到462 亿美元。智能手环具有健康管理、运动记录等强大的系统支持功能,凭借其大众化的定位和高性价比,占据智能穿戴设备的主要市场份额。然而,据百度搜索指数显示,智能手环的新闻头条量在近几年一直保持下降趋势,表明人们对智能手环的关注度降低。智能手环也面临着
4、严峻的挑战:首先,同质化严重,缺少创意亮点;其次,进入市场壁垒低,导致竞争对手过多;最后,情感化缺失、定位模糊和功能堆砌,易导致放弃使用智能手环的流失率提高。面对智能穿戴产品竞争激烈的市场环境,提高商品的评论量和审视智能手环的真正用户偏好显得尤为重要。随着我国电商行业发展迅速,消费模式逐步由线下转为线上,线上消费者的购物决策主要依据产品的功能介绍和评论内容。为此,本文以京东商城为平台,进行智能手环评论量的因素分析,以期为企业研发人员提供可靠的参考指标,提升用户体验,提高企业的市场竞争力。一、文献综述关于智能手环,金英伟(2017)、刘丰(2020)、张琰(2017)对智能手环的创新技术方面进行
5、研究,认为商品内在属性和创新感知价值两个方面的设计更能吸引消费者的目光1-3。王林(2017)、何晓龙(2016)、蒿莹莹(2019)、苏水军(2018)从运动功能角度分析,采用实验法、数理统计等方法检测数据的有效性,发现智能手环监测结果具有不同范围的误差4-7。杨梅(2020)、姚湘(2018)等以老年人的角度去研究智能手环的设计,大致从商品设计、用户体验、人机交互和实际生产四个方面,有针对性的提出在智能手环设计方面要有操作简便易懂、具有轻巧实用性、字体要清晰等特点8,9。随着研究深入,学者们对智能手环购买意愿进行分析,并对评论进行在线挖掘。吴江等(2017)通过 LDA 在线评论主题挖掘,
6、分析得出用户更关注智能手环的功能与外观设计10。李奕等(2018)采用联合分析法构建用户偏好量化模型,对智能手环的造型要素、功能要素和交互方式方面提出改进意见11。赵杨(2017)研究网站界面设计对消费者购买可穿戴设备意愿的影响,发现网站界面的信息丰富度对消费者购买意愿有正向影响12。MeiyuanJENG 等(2020)通过手段目的链(MEC)和阶梯式访谈法,构建“等级价值地图”,分析老年人的感知价值,认为在功能和社会价值方面有提升空间13。LianghongWU(2016)等发放问卷的形式进行用户满意度调查,发现品牌和功能最受用户关注,同时价格和评价是影响用户使用意愿的重要因素14,15。
7、应用研究16第 38 卷广东农工商职业技术学院学报综合以上研究,本文以智能手环评论数为研究对象,建立基于 GroupLasso 的对数线性回归模型,预估该类产品的未来市场情形。本文创新之处主要表现在:(1)以评论量为因变量,作为衡量智能手环发展的一个重要指标,分析市场上的主要智能手环产品评论量的影响因素并建模预测,可更好把握智能手环市场的发展方向。(2)使用变量选择方法GroupLasso 来选取评论量的重要影响因素可将智能手环的类别变量所有属性作为整体进行选择。二、模型构建(一)研究数据变量类别变量名变量描述因变量评论数量取值 0-60000 条价格取值 50-5000 元品牌小米、华为、荣
8、耀、普利邦、ZPPSN、dido、其他商品自身属性附加服务无、其他、APP 会员卡、健康咨询防水等级不防水、生活防水、30 米防水、50 米防水、50 米以上防水充电方式磁吸充电线、座式充电器、USB 直插、其他触控方式单点、多点、其他屏幕类型AMOLED、LED、TFT、LCD、OLED、其他续航时间7 天以下、7-14 天、15-20 天、21 天以上亮度调节手动、自动、不可调节表 1变量说明商品功能属性血压监测不支持、实时、手动监测、都可血氧监测不支持、实时、手动监测心率监测不支持、实时、手动监测、都可健康功能睡眠监测、久坐提醒、心电图、心脏健康管理通讯功能来电提醒、消息提醒、可拆卸为蓝
9、牙耳机、来电接听AI 语音功能不支持、支持 AI 语音功能NFC 功能不支持、支持运动模式10 种以下、11-12 种、21-50 种支付功能不支付、支持扫码支付所属店铺属性店铺星级有星级评价、无星级评价商品评价有评价、无评价物流履约有评价、无评价售后服务有评价、无评价本文通过八爪鱼采集器工具,爬取京东商城智能手环商品的数据信息来研究电商客户需求。去除无效数据信息后,共 509 条有效数据。评论数量是智能手环商品的重要属性,直观上可以看出用户对该类智能手环商品的关注程度,因此,本文将评论数量作为因变量。自变量由三方构成,分别为:商品自身属性、商品功能属性以及所属店铺属性,具体变量说明见表 1。
10、(二)研究方法本研究建立基于 GroupLasso 的对数线性回归模型对智能手环信息进行挖掘,分析智能手环评论量的影响因素,具体研究框架见图 1。描述性分析数据整理模型分析评论量分类变量连续变量散点图数据清洗数据预处理变量选择回归模型虚拟变量处理对数线性回归Group LassoYX变量属性识别京东商城智能手环数据八爪鱼采集器箱线图栅栏图图 1 研究框架示意图先用八爪鱼采集器收集智能手环数据信息,删除缺失数据。将评论量作为因变量,商品自身属性、功能属性和店铺属性作为自变量,识别自变量的标签属性。描述性分析对评论量的因素影响,绘制箱线图和栅栏图等直观地表现自变量和评论量的关系。最后,进行模型分析
11、。将自变量中的分类变量转变为虚拟变量,形成新的自变量集合。利用 GroupLosso 筛选出影响评论量的重要组变量,将 GroupLasso选择出的重要组变量带入对数线性回归模型探究影响智能手环评论量因素的具体数值关系。模型分析具体方法如下:1.数据预处理在本文自变量中,除为连续变量外,均为分类变量,对分类变量进行虚拟变量处理。假设有 个类别信息,先分别将变量的类别属性转为数字标签,分别为。接着对做虚拟变量处理:2.基于 GroupLasso 的对数线性回归模型虚拟变量处理后,如将所有自变量代入对数线性回归模型,可解释性差。我们考虑采用 GroupLasso 进行变量选择。GroupLasso
12、 估计方法针对系17第 4 期王黎明,等:基于 Group Lasso 对数线性回归的智能手环评论数影响因素分析图 2 智能手环评论量频数分布图图3 智能手环价格对评论量的影响(左:箱线图;右:散点图)1.商品自身属性(1)价格、品牌与评论量关系由图 3 箱线图可知,智能手环的价格主要集中在本文选择了六个具有代表性的品牌,其他的品牌都归在“其他”类中。从图 4 看出,小米、华为、荣耀和 dido 的评论量相对较大。其他几个品牌的评论量差异较小,间接反映智能手环商品存在较严重的同质化现象。从评论量的分布状态来看,dido 和荣耀等品牌评论量分布两极化,可见同一品牌的智能手环商品之间也有着明显的差
13、异。其中 Y 为评论数,log(X1)表示价格的对数,表示第个自变量的组变量向量,表示第个变量的类别个数,使用最小二乘估计回归系数。三、结果与分析(一)描述性分析从图 2 中可以看出智能手环的评论量主要分布在 60000 条之内。另外,图中存在少量“高评论,低频数”的智能手环,可能是一些性价比很高的商品。根据智能手环评论量呈右偏特点,对评论量取对数,为后续的图表分析和建模起到重要作用。为分析影响智能手环评论数的因素,先描述性分析智能手环自身属性、功能属性和所属店铺属性对评论量的对数影响。其中为惩罚参数。通过惩罚,实现特征选择的目的。如,说明未被选入模型,反之时,则该组变量均选入模型。将已选择的
14、组变量代入对数线性回归模型数组创新性地提出了二范数惩罚,可将虚拟变量组作为整体选取出来16。在线性回归模型中,Y是因变量,X是解释变量,则 GroupLasso 估计为图 4 品牌对评论量的影响(2)防水等级、充电方式、触控方式、屏幕类型与评论量的关系从图 5 中发现:防水等级越高,商品评论量就随之增高(50 米以上防水的商品数量少,参考意义不大);使用传统座式充电器的智能手环的评论量比较高,主要是目前商品多数采用座式充电器,符合消费者的充电行为习惯;具有多点触控的智能手环评论量大,因为多点触控操作更便利;具有AMOLED 屏幕类型的智能手环评论量最高且商品数量最多;相比之下,具有 TFT 和
15、 LED 屏幕类型的商品的数量少且评论量很低,可能因为该类型屏幕厚,需要背光,较为费电。500 元以下;从评论量来看,300 元以下的智能手环的评论量最多。散点图显示,智能手环价格越高,评论量就越低(价格和评论量对数的相关系数为-0.49,p 都可 手动检测 不支持”的特征,反映消费者更喜欢具有实时监测功能的智能手环。图 8 显示在同价格区间的智能手环当中,健康功能有 3 种的智能手环的评论量更高,更容易获得消费者的喜爱。以心率监测和健康功能为条件,总体上价格和评论量对数呈负相关,说明消费者在选购商品时,价格是重要因素。当健康功能为“4 种”时,价格和评论量不相关,表明当消费者注重高端体验时,
16、价格因素的影响会弱化。图 7 以心率监测为条件的价格和评论量对数的栅栏图图 8 以健康功能为条件的价格和评论量对数的栅栏图不支持实时监测手动监测都可1 种2 种3 种4 种3.所属店铺属性由于商品评价、物流履约和售后服务三者分布相似,以商品评价为例分析,有评价的商品数量较多且评论量分布较分散,而无评价的商品虽少但评论量稍高(见图 9)。产生该现象的主要原因可能是有评论的店铺没有将评论进行高评价、中评价和低评价的区分,使消费者不易区分商品好坏,从而产生不同的购物欲望。图 9 店铺商品评价属性对评论量的影响(二)模型分析1.数据预处理在建立模型之前,因变量 Y 是评论量的对数,首先对自变量数据进行
17、处理。所属店铺属性中物流履约、售后服务与商品评价的数据是一致的,因此只需分析商品评价即可。除价格是连续型变量外,其19第 4 期王黎明,等:基于 Group Lasso 对数线性回归的智能手环评论数影响因素分析变量名估计值P|t|基准组Intercept12.5998.13e-16*价格的对数-0.7642e-16*触控方式单点-0.1760.486其他多点-0.6750.000*血压监测不支持0.8070.020*都可实时监测0.8610.008*手动监测-0.9300.014*心率监测不支持0.6210.112都可实时监测1.4802.74e-05*手动监测0.7640.063。运动模式1
18、0 种以下1.9540.092。21-50种1120 种0.8050.493支付功能不支持-0.8450.000*支持店铺星级有星级评价-0.5860.002*无星级评价商品评价有评价-2.3118.85e-15*无评价修正 R20.5表 2模型估计结果注:*a=0.001,*a=0.01,*在 a=0.05,。在 a=0.1 显著。是“其他方式”。单点方式在=0.1 的显著性水平下不显著,多点方式在=0.001 的条件下显著。这说明与基准组相比,具有“多点”触控方式的智能手环评论量对数下降 0.675 个单位。商品功能属性。(1)血压监测:与“既可实时监测又可手动监测”相比,实时监测的回归系
19、数为0.861,手动监测的回归系数为-0.930,均在=0.01的条件下显著。这表明:消费者更愿意购买具有实时监测功能的手环。(2)心率监测:与“既可实时监测和手动监测”相比,手环只具有实时监测或者手动监测的回归系数分别为 1.48 和 0.764,各自通过=0.001 和=0.1 的显著性检验。实时监测心率的手环更容易受到消费者的喜爱。(3)运动模式:运动功能为“10 种以下”和“1120 种”手环的回归系数均为正值,“10 种以下”在=0.1 下显著,而“1120 种”在=0.1 的显著性水平下不显著。这可能因为,对于普通的消费者来说具有 10 种之内运动模式的智能手环已满足需求。(4)支
20、付功能:与支持支付功能的相比,不支持支付功能使得评论量对数平均减少 0.845 个单位。这可能因为,扫码支付功能已经成为当代支付方式的主流,厂家可以提高对支付功能的设置来实现商品销量的提高。所属店铺属性。(1)店铺星级:与店铺星级“无”相比,店铺星级为“有”的回归系数为-0.586,在=0.01 的条件下显著。回归系数呈现负值的原因可能是有星级评价的店铺的星级个数没有进行具体的区分。(2)商品评价:与商品评价“无”相比,商品评价为“有”的回归系数为-2.311,在=0.001的条件下显著。有评价的店铺回归系数呈现负值的原因可能是没有将商品好评和差评分开进行分析。四、结论和对策GroupLass
21、o 回归结果表明:第一,商品自身属性方面。价格与评论量呈负相关,价格越高,评论量越少。第二,商品功能属性。智能手环有手动和实时心率监测功能,对关注身体健康的消费者来说更有吸引力。智能手环运动模式有 10 种以内,针对日常运动的普通消费者来说就能够满足需求。手环具备支付功能有助于提高评论量,吸引消费者。第三,所属店铺属性。店铺星级和商品评价回归呈现负相关,主要是星级和有评价没有进行具体的细分,使消费者难以区分是好还是坏,从而导致评论量减少。基于研究结论,给出以下对策:厂商对产品分别进行低端和高端的开发研究,满足不同的市场需求,占据市场销售的份额。针对低端智能手环,厂商需提升产品的性价比,注重产品
22、功能的实用性和精准性开发。针对高端化智能手环,厂商可以将产品的外观形状、腕带材质、制作工艺等方面进行高端化开发,进军高端市场使智能手环余变量均是分类变量。对连续型变量价格取对数,其余分类自变量进行虚拟变量处理。共 20 组 72 个虚拟变量。在回归分析中为消除多重共线性,剔除虚拟变量的最后一组。最后,自变量 20 组共 52 个虚拟变量。2.GroupLasso 变量选择数据预处理后存在较多的虚拟变量,应用GroupLasso 将相关虚拟变量作为组进行整体保留或剔除在模型中。当=0.09 时,EBIC 值最小,得到的解稀疏。处理后得到系数压缩为零的解释变量 12 组共 38 个,非零解释变量
23、8 组共 14 个,包括价格、触控方式、血压监测、心率监测、运动模式、支付功能、店铺星级、商品评价 8 个变量。3.对数线性回归模型通过 GroupLasso 得到 8 组重要变量(14 个虚拟变量)后,建立对数线性回归模型研究对智能手环评论量的影响因素。回归结果如表 2 所示,回归模型的修正 R2为 0.5,说明模型拟合效果较好。商品自身属性。(1)价格:对数价格的系数为-0.764,在=0.001 的条件下显著,说明价格对数值与评论量之间存在着显著的负向关系。这种现象主要由两方面导致。第一,消费者青睐购买性价比高的商品。第二,价格低的产品往往是商家进行促销活动的商品,商家会加大广告宣传的力
24、度引起消费者的兴趣,从而增加商品的销售数量和讨论量。(2)触控方式:触控方式的单点方式和多点方式的回归系数为负值,分别是-0.176 和-0.675,基准组王黎明20第 38 卷广东农工商职业技术学院学报能够成为具有社会身份标签趋于珠宝奢侈品的“智能珠宝”。厂商可以将智能手环的消费者进行细分。为青少年消费者设计炫酷高颜值的外观、能够记录日常运动功能的智能手环;为中老年消费者设计健康功能强大且灵敏度高的智能手环。店铺需要对产品智能手环进行分类管理。店铺网页设计可按按照产品的主要推广功能进行分类,以此帮助用户精准了解产品特性,增加店铺的关注度。店铺管理者对消费者购买的产品和服务要及时的进行询问,改
25、善售前、售中和售后服务,从而提高店铺星级。店铺激励用户评价商品,挖掘用户对商品的反馈信息,及时处理与改进,从而提高用户忠诚度。参考文献:1 金英伟,尚晓航.技术创新商品购买意愿分析及预测以智能手环为例 J.消费经济,2017,33(1):70-77.2 刘丰,韩京龙,齐骥,等.智能可穿戴设备的研究和应用进展 J.分析化学,2021,49(2):159-171.3 张琰,王晶,蔡静,等.多功能智能手环的远程红外激光自适应控制 J.激光杂志,2017,38(3):93-96.4 王林,胡梦迪,朱文静.运动社交平台对用户使用智能手环行为的影响研究 J.信息资源管理学报,2017,7(3):5-14+
26、44.5 何晓龙,史文越,盛张群.智能手环/手机应用程序在不同步行速度或路面中的计步有效性研究 J.中国体育科技,2016,52(6):122-127.6 蒿莹莹,张琳,马晓凯,等.运动智能手环监测身体活动量的效度研究进展 J.上海体育学院学报,2019,43(4):73-83.7 苏水军,杨管,庄维友,等.5款智能运动手环健康管理的实效性比较 J.体育学刊,2018,25(3):67-73.8 杨梅,丛扬帆,李雪瑞.融合FAHP和TOPSIS的适老化商品综合评价与优选方法以老年智能手环为例 J.图学学报,2020,41(3):469-479.9 姚湘,胡蓉,杨熹,等.基于用户需求的老年人可穿
27、戴设备功能层次研究 J.包装工程,2018,39(20):159-165.10 吴江,周露莎,刘冠君,等.基于LDA的可穿戴设备在线评论主题挖掘研究 J.信息资源管理学报,2017,7(3):24-33.11 李奕,宋章通,范怡宁,等.基于联合分析法的智能手环用户偏好量化模型构建 J.图学学报,2018,39(4):642-647.12 赵杨,赵雨,吴江.网站界面设计对消费者购买可穿戴设备意愿的影响研究 J.信息资源管理学报,2017,7(3):15-23.13 JengMY,YehTM,PaiFY.AnalyzingOlderAdultsPerceivedValuesofUsingSmart
28、BraceletsbyMeansEndChainJ.Healthcare,2020,8(4):494.14 WuLH,WuLC,ChangSC.ExploringConsumersIntentiontoAcceptSmartwatchJ.ComputersinHumanBehavior,2016,64:383-392.15 ChuahS,RauschnabelP,KreyN,etal.WearableTechnologies:TheRoleofUsefulnessandVisibilityinSmartwatchAdoptionJ.ComputersinHumanBehavior,2016,6
29、5(1):276-284.16 MingY,YiL.ModelSelectionandEstimationinRegressionwithGroupedVariablesJ.JournaloftheRoyalStatisticalSociety:SeriesB(StatisticalMethodology),2006,68(1):49-67.Factors Influencing Comment Number of Smart Bracelet Based on Group Lasso Log-linear RegressionWANGLiming1,2,SHENMengqi1(1.Nanji
30、ngUniversityofFinance&EconomicsHongshanCollege,Nanjing210003,China;2.SchoolofMathematicsandStatistics,NanjingUniversityofInformationScienceandTechnology,Nanjing210044,China)Abstract:Inthispaper,theinfluencingfactormodelofthenumberofcommentsonsmartwristbandswasconstructedbasedongrouplassolog-linearre
31、gression,andthedetailedinformationofsmartbraceletwascapturedbyoctopuscollectorsforempiricalquantitativeresearch.Firstofall,adescriptiveanalysiswasconductedonthedetailedinformationofsmartbracelets,thentheimpactoftheirownattributes,functionalattributesandstoreattributesonthenumberofcommentswasanalyzed
32、preliminary.Next,byintroducingdummyvariables,log-linearmodelwithgrouplasso,asamethodofquantativeanalysis,wasusedtodetecttherelevantfactorsaffectingthecommentsquantityofsmartbraceletandfurthergeneralizedtootherapplications.Theresultsshowthat:1.When=0.09,GroupLassoselectsimportantfactors,includingpric
33、e,touchmode,bloodpressuremonitoring,heartratemonitoringexercisemode,paymentfunction,storestarlevelandcommodityevaluation.2.AdjustedR2oflogarithmiclinearregressionis0.5,indicatingagoodmodefitting.Therefore,improvingtherelevantpropertiesofsmartbraceletsishelpfulforthepromotionandsalesofcommodities.Keywords:smartbracelet;grouplasso;Log-linearregression;variableselection
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100