收藏 分销(赏)

基于弹幕文本挖掘的猪肉价格上涨舆论研究.pdf

上传人:自信****多点 文档编号:634263 上传时间:2024-01-19 格式:PDF 页数:4 大小:1.91MB
下载 相关 举报
基于弹幕文本挖掘的猪肉价格上涨舆论研究.pdf_第1页
第1页 / 共4页
基于弹幕文本挖掘的猪肉价格上涨舆论研究.pdf_第2页
第2页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、计算机时代 2023年 第9期0 引言据国家统计局11月9日发布数据显示,10月份全国CPI环比上涨0.1%,其中,猪肉价格环比上涨9.4%,涨幅比上月扩大4.0个百分点。全国各地猪肉价格上涨幅度明显,国家发展改革委甚至拉响全国猪肉价格过度上涨的“一级预警”。网络媒体时代下,社交媒体关注更是放大了猪肉价格上涨事件的影响1。而弹幕作为一种用户在信息时最为直观的反馈,能有效地反映出是否用户的情感表达以及关注倾向2。因此,本文通过对该节目的弹幕文本进行分析,讨论“猪肉价格上涨”事件发生时网络舆情的态势走向,寻找弹幕背后所蕴含的情感倾向和舆情热点,为稳物价、保民生做出贡献。本文试图回答以下问题:问题1

2、:“猪肉价格上涨”事件对网民来说意味着什么?问题2:“猪肉价格上涨”事件所引发的舆论最终走向何处?1 文献综述目前,随着物价波动频繁出现,越来越多的研究者开始关注物价对公众舆论的影响。研究者从分析微博、新闻报道等多个角度进行研究。邵小彧等人通过对微博中关于物价的讨论进行文本挖掘,揭示了物价与公众舆情的影响机制3。刘苗等人则发现消费情感指数与传统消费者信心指数走势具有较强相似性4。除此之外,戴又有等人发现经济较热时,公众更在意网络上有关物价讨论的热度,而当经济较冷时,DOI:10.16644/33-1094/tp.2023.09.027基于弹幕文本挖掘的猪肉价格上涨舆论研究陈朝昱,刘贺,彭子欣(

3、桂林电子科技大学商学院,广西 桂林 541000)摘要:弹幕作为一种新的交互方式,能直观反映猪肉价格上涨时间对公众舆论产生的影响。本文以弹幕文本信息为研究对象,利用词频、语义网络分析、LDA主题挖掘和SnowNLP情感分析模型等方法,进行了内容分析与情感解读,实现对网络舆情弹幕的情感分类和主题分析。在此基础上建立了物价预测模型。该项研究可为相关政策的调整提供一定的参考。关键词:价格上涨;文本发掘;BP神经网络模型;弹幕中图分类号:TP391.1文献标识码:A文章编号:1006-8228(2023)09-129-03Public opinion research on pork price ri

4、se based on bullet chat text miningChen Zhaoyu,Liu He,Peng Zixin(School of Business,Guilin University of Electronic Technology,Guilin,Guangxi 541000,China)Abstract:As a new interactive way,bullet chat can directly reflect the impact of pork price rise on public opinion.In this paper,taking the bulle

5、t chat text information as the research object,using the methods of word frequency,semantic network analysis,LDA topic mining and SnowNLP sentiment analysis model,we carried out the content analysis and sentiment interpretation,so asto realize the sentiment classification and theme analysis of the o

6、nline public opinion.On this basis,a price prediction model isestablished,which can provide certain reference for the regulation of relevant policies.Key words:price rise;text mining;BP neural network model;bullet chat收稿日期:2023-03-31作者简介:陈朝昱(1995-),男,河北唐山人,硕士生,会计师,数据分析师,主要研究方向:数据挖掘、服务创新。129Computer

7、Era No.9 2023公众更在意网络上讨论物价的情绪5。郭秀峰等人基于棘轮效应理论建立了VAR模型6。因此,物价对公众舆论的影响是一个复杂的问题,需要综合考虑多个因素的作用。本文将进一步深入探究物价与公众舆情、情感和态度的关系,寻找更加有效的研究方法和模型,以更好地了解物价对社会和民众的影响。2 数据处理本研究数据来源为以“猪肉价格上涨”为检索词所搜索到的热度排名前五名的 B 站视频弹幕文本。采集时间为2022年11月2日。采集字段仅包含评论内容,并经过删除空白字符和无效信息等数据清洗操作。最终,本文采集到有效弹幕数据共计643条。3 数据可视化分析3.1 弹幕内容分析词频分析通过统计和分

8、析文献正文中关键词的出现次数,可以深入了解文本的主题和内容7。如图1,猪肉涨价上涨后人们首先想到的是工资是否随价格上涨,同时还关注其他日常生活必需品的变化情况。图1词频分析结果3.2 弹幕情感倾向分析为了进一步探究猪肉价格上涨舆论与时间的关系,本研究通过SnowNLP进行训练生成关于针对猪肉物价上涨的语料库,便于后续精确的情感分析预测。本研究使用SnowNLP情感分析对弹幕文本数据进行了情绪评分,结果在0到1之间8。图2展示了网友对于猪肉价格上涨所发表的正面和负面评论的分布情况。结果显示,积极弹幕和消极弹幕之间的分布差异不大。整理弹幕关于猪肉价格上涨情感得分的区间分布可知(图3),网友对于猪肉

9、价格上涨持中立态度较为明显,结合上面词频分析可以猜测,网友们可能短期认为猪肉价格上涨影响不大,又或者网友在此问题上更关注其他的问题。图2情感分析占比图图3情感分析直方图基于以上假设,本研究进一步分析了弹幕情感与时间的关系(见图4)。结果显示,情感得分整体呈现起伏较大的分布趋势,且随着时间推移并未明显改善。该结果一方面表明情感得分的均值趋于0.5,说明网民对该事件的看法存在较为严重的两极分化;另一方面,这也说明随着时间推移,网友对该事件的态度并未发生显著的变化。图4情感分析波动图实验说明以“猪肉物价上涨”为主题的相关网络舆情,整体情感倾向较为稳定,网络舆情态势起伏相对较大。同时,也为研究提出了一

10、种可能性,即网友在130计算机时代 2023年 第9期猪肉物价上涨事件中关注的可能不仅仅是物价上涨。3.3 主题聚类识别本研究通过LDA进行主题词提取,由此获得了弹幕数据主题聚类表(表1)。结果验证了上述可能性,“物价、工资、理财产品、生活必需品”四个主题是网民真正的关注焦点。表1主题聚类表主题物价工资理财产品生活必需品特征词自信、正常、贩卖焦虑、躺平少买、只吃、贬值、工资天然气、亏、负数、卖、很难鸡蛋、菜价、粮食、很难4 预测模型构建4.1 量化标准本研究将在上文核心主题词的基础上进行量化处理,详细文本量化及对应关系如表2所示。表2文本量化对应表主题词物价工资理财产品生活必需品赋值变量CPI

11、(%)工资水平(元)A股指数(收盘)菜篮子指数(200)数据来源国家统计局中国企业招聘薪酬报告新浪财经农业农村部4.2 建立模型4.2.1 模型参数本研究的数据集来自于前面步骤的整理,前70%的数据作为训练集,后 30%数据作为测试集。具体参数如表3所示。表3模型参数配置表参数名训练用时数据切分数据洗牌交叉验证激活函数求解器学习率L2正则项迭代次数隐藏第1层神经元数量参数值0.013s0.7是否identitylbfgs0.1110001004.2.2 模型评估结果结合上述模型参数,对各因素对物价的映射关系进行预测,通过对比实测值与预测值的多组数据可知(见表4),测试样本的模型预测值与现场实测

12、值相近,说明该模型具有较好的性能,对于物价及其相关因素的预测有一定的参考意义。表4模型运行效率对比表训练集测试集MSE0.0690.171RMSE0.2620.413MAE0.1850.366MAPE9.25320.234R0.8150.6954.3 数据预测结果根据模型预测2022年第四季度的物价相关数据与实际相差并不大,可以一定程度上证明该模型合理性和有效性。同时,从表5数据可以发现,物价总体并不会一直上涨后续将呈下降的趋势,但工资水平也在短暂提高后迅速下降,但并不同步。表5模型预测预测统计表时间2022第4季度2023第1季度2023第2季度物价指数(%)1.92.10.9菜篮子指数(2

13、00)125.22124.17136.61工资水平(元)101681034110014A股指数(收盘)3155.963320.943428.665 结论5.1 研究结论弹幕文本数据相较于传统评论具有更强的时效性与参与性,本文通过对弹幕文本数据的挖掘和情感分析探索隐藏在弹幕背后的网络舆情信息,最终对物价走势进行了预测,得出以下结论:“猪肉物价上涨”事件引发公众热议,本质上是公众对未来物价、工资、理财产品和生活必需品等多方面的担忧;根据BP神经网络模型的预测结果,2022年下半年可能达到今年物价指数的峰值,情况在明年将会有所缓解,但是工资水平可能小幅度的下调,其他相关主题均有不同程度的变化,整体形

14、式较为乐观;为了避免“猪肉价格上涨”事件带来的负面影响,有关部门应该全面落实价格监测和市场巡查制度,并采取实质性措施来保障市场供应,全力维护后疫情时期的市场稳定。5.2 研究局限和展望本研究具有一定的代表性,但受限于数据来源仅来自于B站用户弹幕,存在局限性。此外,本研究还受到时间和设备等客观因素的限制,因此神经网络数据(下转第141页)131计算机时代 2023年 第9期3 杨妮,宋歌玛.土家摆手舞文化内涵及价值探析J.艺术科技,2021,34(5):2.4 欧光艳.浅析贵州苗族原生态舞蹈“锦鸡舞”的艺术特征J.大众文艺:学术版,2011(14):2.5 Xie S,Sun C,Huang J

15、,et al.Rethinking spatiotemporalfeaturelearning:Speed-accuracytrade-offsinvideoclassificationC/(ECCV),2018:305-321.6 Diba A,Fayyaz M,Sharma V,et al.Temporal 3DConvNets:New Architecture and Transfer Learning forVideo ClassificationJ,2017.7 Shi X,Chen Z,Wang H,et al.Convolutional LSTMNetwork:A Machine

16、 Learning Approach for Precipita-tion NowcastingJ,2015,28:802-810.8QiuZ,YaoT,MeiT.LearningSpatio-TemporalRepresentation with Pseudo-3D Residual NetworksC.IEEE,2017:5534.9 Ji S,Xu W,Yang M,et al.3D Convolutional NeuralNetworksforHumanActionRecognitionJ.IEEETransactionsonPatternAnalysis&MachineIntelli

17、gence,2013,35(1):221-231.10TranD,BourdevL,FergusR,etal.Learningspatiotemporalfeatureswith3DconvolutionalnetworksC.Proceedingsof2015IEEEInternationalConferenceonComputerVision.Santiago,Chile,2015:4489-4497.集中的样本量相对较少。未来研究将进一步统计更多数据,优化所构建的网络,以提高物价预测模型的准确度,让已经取得的社情民生数据发挥出更大的价值,形成网络舆情评估新方法,并在社情民生相关政策的设计

18、和实施中得到更多应用。参考文献(References):1 Gale F.Chinas Pork Imports Rise Along with ProductionCostsM.United States Department of Agriculture,2017.2 张真,马梅.传统服饰文化节目的受众满足与发展可能基于 衣尚中国 弹幕文本的研究J.视听界,2022(1):71-74.3 邵小彧,李冬梅,刘云强.新冠肺炎疫情阶段特征、公众情绪与农产品价格基于微博文本挖掘的实证研究J.四川农业大学学报,2021,39(5):688-696,704.4 刘苗,李蔚,朱述政,等.基于互联网文本情

19、感分析的消费情感指数构建J.统计与信息论坛,2018,33(8):31-38.5 戴又有,蔡定洪,张翼.网络搜索与居民通货膨胀预期的关系研究基于储户问卷与百度指数的实证分析J.上海金融,2020,484(11):42-51.6 郭秀峰.政府消费、物价波动与居民消费棘轮效应分析J.商业经济研究,2020,805(18):54-56.7 Popescu II.Word frequency studiesM.De Gruyter Mouton,2009.8 杨嘉怡,李晓英,何首武.基于手机评论文本的用户情感分析研究J.大众科技,2022,24(9):22-24,21.(上接第131页)CECEand

20、itsapplicationinretrievalJ.TheJournalofDocumentation,2004,60(5):493-502.6 宛艳萍,张芳,谷佳真.基于双窗口TextRank关键句提取的文本情感分析J.计算机应用与软件,2022,39(4):242-248.7 ZHANG,LEI,CHU,XUENING,XUE,DEYI.Identificationoftheto-be-improvedproductfeaturesbasedononlinereviewsforproductredesignJ.Internationaljournalofproductionresearc

21、h,2019,57(7/8):2464-2479.8 LAI,XINJUN,ZHANG,QIXIANG,CHEN,QINGXIN,et al.Theanalyticsofproduct-designrequirementsusingdynamic internet data:application to Chinese smart-phonemarketJ.Internationaljournalofproductionresearch,2019,57(17/18):5660-5684.9 李贺,曹阳,沈旺,等.基于LDA主题识别与Kano模型分析的用户需求研究J.情报科学,2021,39(8):3-11,36.10 GUAN,XINYU,CHENG,ZHIYONG,HE,XIANGNAN,et al.Attentive Aspect Modeling for Review-AwareRecommendationJ.ACM transactions on informationsystems,2019,37(3):28.1-28.27.11 Turney P D.Learning algorithms for keyphrase extrac-tionJ.Information Retrieval,2000,2(4):303-336.(上接第135页)CE141

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服