ImageVerifierCode 换一换
格式:PDF , 页数:8 ,大小:3.01MB ,
资源ID:733817      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/733817.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(文本方面级情感分析方法研究综述.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

文本方面级情感分析方法研究综述.pdf

1、第 22卷 第 9期2023年 9月Vol.22 No.9Sept.2023软 件 导 刊Software Guide文本方面级情感分析方法研究综述汪红松,李嘉展,曾碧卿(华南师范大学 软件学院,广东 佛山 528225)摘要:方面级情感分析(ABSA)作为细粒度情感分析领域的子任务,旨在分析给定目标中方面术语的情感极性。近年来,随着社交媒体的反馈信息增多,ABSA引起了许多研究者关注。为了适应不同场景下的ABSA,研究人员不断设计新的方法和技术来处理不同问题。首先对方面级情感分析进行概述,然后针对细粒度情感分析子任务,阐述不同场景下ABSA的研究方法及特点,最后通过回顾ABSA新出现的话题,

2、展望ABSA研究的发展趋势,以期为该领域的研究提供一定的参考借鉴。关键词:方面级情感分析;情感分类;深度学习;机器学习DOI:10.11907/rjdk.222071开 放 科 学(资 源 服 务)标 识 码(OSID):中图分类号:TP391.1 文献标识码:A文章编号:1672-7800(2023)009-0001-08Survey of Text Aspect-based Sentiment Analysis MethodsWANG Hongsong,LI Jiazhan,ZENG Biqing(School of Software,South China Normal Universi

3、ty,Foshan 528225,China)Abstract:As a sub-task in the field of fine-grained sentiment analysis,aspect-based sentiment analysis(ABSA)aims to analyze the aspect-based sentiment polarity to a given target.The growing amount of feedback on social media has caught the attention of many researchers over th

4、e past decade.In order to adapt to ABSA in different scenarios,researchers continuously devise new techniques and approaches to handle diverse research questions.We first provide an overview of ABSA,and then describe the research methods and characteristics of ABSA in different scenarios for the fin

5、e-grained sentiment analysis subtask.Finally,by reviewing the emerging topics of ABSA,looking forward to the development trend of ABSA research,with a view to providing some reference for research in this field.Key Words:aspect-based sentiment analysis;sentiment classification;deep learning;machine

6、learning0 引言文本情感分析1也称为观点挖掘2-3,是自然语言处理(Natural Language Processing,NLP)的重要内容之一,其主要任务是挖掘并分析人们对不同主题、属性等的观点和态度2。文本情感分析的主要流程如图1所示,其中数据预处理是情感抽取的准备工作,主要进行分词、命名实体识别等。情感抽取模块主要用于处理输入的数据,提取输入数据的特征表示。在情感分析领域,狭义的情感分析通常定义为对外界事物的态度,如正面、负面、中立等。传统上,情感分析一般分为 3 个层次:句子级别、文档级别、方面级别。早在2002年,Pang等4提出利用机器学习的方法,将文档的情感倾向作为情感

7、分类依据。随着研究的深入,Wawre等5 .训练集.测试集 .数据预处理情感抽取分类器情感类别 原始文本.Fig.1Text sentiment analysis processing flow图1文本情感分析处理流程收稿日期:2022-09-13基金项目:国家自然科学基金项目(62076103);广东省基础与应用基础研究基金项目(2021A15150117)作者简介:汪红松(1975-),男,CCF会员,华南师范大学软件学院讲师、硕士生导师,研究方向为自然语言处理、情感分析、对话系统;李嘉展(1998-),男,CCF会员,华南师范大学软件学院硕士研究生,研究方向为自然语言处理、情感分析;曾碧

8、卿(1969-),男,博士,CCF会员,华南师范大学软件学院教授、硕士生导师,研究方向为自然语言处理、人工智能、大数据。本文通讯作者:李嘉展。2023 年软 件 导 刊利用多种监督方式,提出将句子表达的情感极性视为分类问题。近年来,受到深度学习的影响,方面级情感分析(Aspect-based Sentiment Analysis,ABSA)逐渐成为新的研究热点,通过引入不同的场景任务来分析不同的情感元素6。1 相关研究根据文本的层次粒度,情感分析可分为粗粒度情感分析和细粒度情感分析7。粗粒度情感分析主要侧重于句子级与文档级的情感分类,细粒度情感分析通常侧重于对方面词的情感极性进行判断。随着近些

9、年研究的深入,粗粒度的情感分析缺乏捕获实体与句子中相关方面情感极性的能力,无法满足文本层次粒度更细的情感分类要求,因此细粒度文本情感分析受到更广泛的关注8。1.1方面术语抽取方面术语抽取(Aspect Extraction,AE)是ABSA中的一项关键任务,旨在提取句子中存在的方面词9。目前,方面术语抽取主要分为显式方面术语抽取与隐式方面术语抽取。显式方面术语是指文本中能够清晰指明的方面词与目标情感词,常结合统计学习的方法,如条件随机场(Conditional Random Field,CRF)和隐马尔可夫10等。Zschornack 等11利用注意力机制,提出基于 Bi-LSTM 与 CRF

10、 的分类器,借助词性标记作为辅助功能,在Bi-LSTM编码器作用下实现了显式方面术语抽取。隐式方面术语是指在文本中没有明显指出的方面词与目标情感词,如“袋子里装满了食物,无法再装下水杯”,实体词“袋子”存在一个隐式方面词“容量”。由于隐式方面术语缺乏上下文线索信息,隐式方面术语抽取具有较大难度12。Liao 等13对隐式事实情感文本进行分类,提出一种结合卷积神经网络和语义依赖树的多层语义融合模型,该模型能够学习词语级、语句级别的语义信息,识别事实隐式情感文本特征。此外,由于缺乏足够的标注数据,很难精准地抽取方面术语,Wang等14首次提出自训练学习方式来解决方面术语提取中标注数据不足的问题。1

11、.2方面级情感分析ABSA属于细粒度的情感分析任务,首先识别给定文本中的方面词与目标情感词,再预测方面词的情感极性15。ABSA 主要对方面词与相应目标情感词的关系进行建模,针对不同的方面术语提取更精细的情感信息。例如“the battery life is also relatively excellent”,方面术语“battery life”的目标词“excellent”表达正面情感。因此,ABSA侧重于分析方面词与目标情感词的关系,以获取更精细的情感极性。在早期的研究中,对于输入句子存在多个方面词的情况,常常采用多次输入同样数据的方法来分析方面词的情感极性。随着研究的深入,人们逐渐发现

12、同一个句子中不同方面词之间存在情感关联,并通过引入上下文的观念,逐步丰富关于ABSA的研究。为了进一步了解ABSA,本文以Web of science为检索文献平台,以“方面级情感分析”“Aspect Based Sentiment Analysis”为主题词,利用 Web of science 官方数据工具对20102022年以ABSA为主题的文献进行分析。同时,以主题词为中心,通过 VOSviewer工具生成如图 2所示的共现图。总体上,早期ABSA研究主要依赖于机器学习等方法,引入深度学习方法后,以深度神经网络为基础的模型成为主流的ABSA研究方法。2 方面级情感分析方法与技术目前,AB

13、SA研究主要分为传统方法和基于深度学习的方法。传统方法主要包括机器学习、情感词典等。由于机器学习在情感分析中属于浅层学习,不涉及特征学习,基于深度学习的方法利用非线性网络模型来获得更符合任务需求的函数,从而实现对数据特征的自动学习。2.1方面级情感分析数据集目前,研究者可以使用公开数据集,也可以通过收集、筛选、过滤等步骤构建数据集。表1列举了目前ABSA研究进行模型训练常用的数据集。2.2评估指标情感分类任务模型通常采用混淆矩阵来评估其性能,评价指标包括准确率(Accuracy)、精确度(Precision)、召回率(Recall)以及F1值等。评价指标由TP、FP、FN、TN几个元素组成,具

14、体公式如表2所示。其中,TP表示分类器正确地将正类样本预测为正类的样本数量,FP表示分类器错误地将负类样本预测为正类的样本数量,FN表示分类器错误地将正类样本预测为负类的样本数量,TN表示分类器正确地将负类样本预测为负类的样本数量。2.3传统方面级情感分析方法传统的ABSA任务主要通过基于规则的方法和基于统计的方法来完成16。基于规则的方法需要大量词汇极性Fig.2Co-occurrence diagram of subject words图2主题词共现图 2第 9 期汪红松,李嘉展,曾碧卿:文本方面级情感分析方法研究综述标注工作以及由语言学家制定的词典规则,分类任务的准确率与词汇标注结果和规

15、则设定相关。基于统计的方法根据上下文中相似情感词的共现频率,将其归为相同极性,因此一个词的情感极性与上下文中其他词的共现频率相关。表3列出了传统ABSA分析方法的优缺点。2.3.1基于规则的方面级情感分析基于规则的方法通常使用基础词典,通过扩充基础情感词典,挖掘目标词之间的相互联系。Zhang等17根据方面词之间的依赖关系确定句子的情感极性,通过聚合句子以预测整个文本情感;Tan等18利用先验情感词典将财经新闻分为正面或者负面,并通过构建情感词典确定财经新闻文章中每个句子的情感极性;Gao等19通过构建情感词库和识别不同语言特征来获得不同情感原因的组成比例,并提出基于规则的情感原因检测方法,实

16、验结果证明了情感词典有利于ABSA分类任务。2.3.2基于统计的方面级情感分析基于统计的方法不依赖于语言学家所制定的语言规则20,通常从给定的单个语料库中提取方面词,但不同语料库中方面词分布特征的差异未得到充分利用。因此,Pu等21利用逐点互信息检测名词短语,并降低依存关系的负面影响,再根据句法依存规则对方面词进行提取;Han等22提出一种基于特定领域情感词典的分类方法,通过引入互信息来分配词典中带有词性标签的方面词,并根据方面词情感值从未标记的语料库中选择训练数据,再由基于SentiWordNet的情感分类器进行文本情感分析。通过上述分析可以发现,传统的方面级情感分析方法能适应不同领域的目标

17、任务。此外,基于统计的方法不依赖于语言学家制定的规则,减少了人工干预23。基于语料库的方法虽然简单,但需要一个较大的数据集来检测方面词极性,才能对给定的文本进行情感分析,依旧无法高效地挖掘不同细粒度实体识别的情感信息。因此,为了更好地探索细粒度情感分析任务,学者们将研究方向转向面向深度学习的情感分析模型。2.4基于深度学习的方面级情感分析深度学习展现了强大的特征提取和文本表达能力以及可扩展性,受到研究人员的高度关注。因此,在 ABSA 任务中,基于深度学习的方法逐渐成为人们的研究热点。基于深度学习的ABSA分类方法利用神经网络进行情感分类时,主要有3个任务24,如图3所示。(1)文本表示。文本

18、表示通常使用关键字集,在用向量表达文本时,特征提取算法基于预定义的关键字对文本中的目标词权重进行计算,形成数字向量,即文本的特征向量25。(2)目标表示。目标表示是ABSA用于表达不同情感的重要任务之一,主要任务是生成与上下文交互的向量,通常使用词嵌入方法得到目标的向量表示。Table 1Introduction to common datasets表1常用数据集简介数据集SenEval-2014SenEval-2015SenEval-2016Weibo_sent_100kMAMSASAPTwitter概要该数据集主要用于细粒度情感分析,包含Laptop和Restaurant两个领域与SenE

19、val-2014相比,该数据集中的评论是完整的,部分样本由多个句子组成,引入了Topic的概念引入tweet quantification与five-point ordinal classification,分别为推特的量化分析和三分类任务二分类语料,含10万多条带情感极性的新浪微博评论,其中正负向评论各约5万条,标签为0和1,1代表正向评论,0代表负向评论数据集含有一万多条数据,适合ATSA任务以及ACS任务,数据集中的每个样本至少包含2个方面词,且至少有2个方面词的情感极性是不同的中文评论数据集,包含8个不同主题,每条数据样本都标注有18个预定义方面类别的情感极性一个实体级Twitter

20、情绪分析数据集,该数据集约包含7万条已标注训练样本和1千条验证样本下载地址https:/alt.qcri.org/semeval2014/task4/index.php?id=data-and-toolshttps:/alt.qcri.org/semeval2015/task12/index.php?id=data-and-toolshttps:/alt.qcri.org/semeval2016/task5/index.php?id=data-and-toolshttps:/ 2Evaluation indicators表2评估指标评估指标AccuracyPrecisionRecallF1-s

21、core公式A=TP+TNTP+FP+TN+FNP=TPTP+FPR=TPTP+FNF1=2*Precision*RecallP+R意义表示正确预测的样本与总样本数的比例表示预测正确的样本中,真正的正样本比例模型正确预测出的正类占数据集中所有正类样本的比例Precision和Recall的加权调和平均,其分数值介于01之间Table 3Analysis of advantages and disadvantages of traditional aspect-based sentiment analysis methods表3传统方面级情感分析方法优缺点分析方法基于规则的方面级情感分析基于统计

22、的方面级情感分析优点不需要训练数据,分类准确率高,不易过拟合不依赖于分类规则,减少了人工干预特征缺点存在域依赖性,不适合与上下文相关和特定领域的分类任务分类精度不高,语料库需不断扩充,词典构建困难 32023 年软 件 导 刊(3)情感分类。情感分类主要是为了识别特定目标词的情感极性。例如句子“服务器的显卡算力充足,但使用成本昂贵”中,目标词“显卡算力”对应的上下文情感词是“充足”,情感极性为积极,而“价格”对应的上下文情感词是“昂贵”,情感极性为消极。针对此类任务,通常通过引入注意力机制来解决。基于深度学习的ABSA任务关键在于文本表示和目标表示,尽管近年来该领域受到研究人员的广泛关注,但目

23、前还缺少适应多种场景任务的ABSA框架。因此,利用深度学习方法完成ABSA任务目前仍处于发展阶段。2.4.1基于注意力机制的方面级情感分析早期的研究方法依赖于人工设计或提取与目标相关的情感信息,但这些方法高度依赖于人工设计的特征向量26。为了明确目标实体与上下文中情感信息的关系,有学者提出从目标信息挖掘目标词的情感极性27,但这些方法只考虑目标信息而忽略了上下文信息。基于注意力机制的神经网络模型能隐式地将目标与上下文信息联系起来,因此在自然语言处理领域受到人们关注。Wang 等28结合注意力机制和 LSTM,提出 ATAE-LSTM(Attention-based LSTM with Aspe

24、ct Embedding)网络模型,通过将方面词与句子的隐藏特征表示相结合,提出基于方面词的注意力权重以及将方面词向量与输入向量结合的方法;Chen等29提出基于多注意机制的记忆神经网络模型(Recurrent Attention Network on Memory,RAM),通过记忆存储单元捕获长距离文本中特定方面词的情感极性;Ma等30为了充分利用上下文的语义关系,协调目标与上下文词之间的依赖关系,提出 MGAN 模型(Multi-grained Attention Network),加强了目标与上下文词之间的相互联系31。同时,有学者将传统方法与注意机制相结合。Lu等32提出基于规则的交

25、互式注意力神经网络模型(Interactive Rule Attention Network,IRAN),该模型通过语法规则编码器,进一步提高了目标词与上下文交互能力。2.4.2基于预训练语言模型的方面级情感分析在序列化语言模型中,例如RNN虽能捕获长距离依赖关系,但由于复合函数求导涉及链式法则,容易出现梯度消失问题。而对于CNN模型,由于卷积核的存在,导致特征提取时存在局部最优问题。因此,2017 年谷歌提出Transformer模型框架33,通过模块化结构引入矩阵运算,提高了模型的并行能力。针对RNN和注意力机制在建模时存在并行化能力低、梯度消失的问题,Song等34采用注意力机制的编码器

26、对目标词及上下文进行建模,提出结合BERT预训练语言模型的注意力编码网络。在ABSA研究中,通常将预训练语言模型用于处理输入文本,并将其融入到更深层次的神经网络中。Bai等35在BERT模型基础上融合语义信息,提出了图注意力网络模 型(Relational Graph Attention Network BERT,RGAT-BERT),在语义标签依赖信息的加持下,提升了ABSA的分类性能;Zhang等36为了将动态语义与ABSA模型融合,提出动态加权的语言模型(Dynamic Re-weighting BERT,DR-BERT),通过动态加权分配以更好地进行方面感知的情感理解。此外,有学者为了

27、使 ABSA 模型成为通用框架,将ABSA建模为生成类任务。Yan等37将每个ABSA子任务目标重新定义为指针索引和情感类别索引混合的序列,并使用统一的生成公式,结合预训练语言模型BART来完成所有端到端框架中的ABSA任务。2.4.3基于图神经网络的方面级情感分析虽然上述方法被广泛应用于ABSA,但这些模型缺乏解释相关句法约束和长距离词依赖性的机制,仍难以挖掘细粒度实体在文本中的句法依赖信息。为解决上述问题,Zhang等38结合依存关系树的图卷积神经网络,利用句法信息与目标词的依赖关系挖掘文本的依存信息,证明了句法信息对长距离文本分类的重要性。由于语言的复杂性,当句子中存在多个方面词时,会导

28、致目标词与上下文信息不匹配。针对这种情况,Li等39提出双通道图卷积神经网络模型(Dual Graph Convolutional Networks,DualGCN),其中包含一个具有自注意机制的情感模块,利用句法结构和语义相关性减少依赖解析的错误。当前大部分基于图神经网络的情感分类方法主要集中在学习句子依存树的上下文词与目标词的依存信息,缺乏利用特定目标词的上下文情感知识。因此,Liang等40提出基于依存关系树和情感知识的图卷积神经网络模型Sentic GCN,该模型利用上下文词与目标词之间的依赖关系和情感信息,通过聚合SenticNet中的情感知识学习上下文词语和特定方面的情感依赖关系,

29、增强方面词与上下文的语义相关性。此外,对于特定方面词的分析,Chen等41提出面向方面词的离散意见生成树模型(Discrete Opinion Tree GCN,DotGCN),该方法将方面词与上下文之间的注意力分数作为句法距离得到新的生成树。同时,由于依存句法树多数通过句法分析器生成,而句法分析器的编码模式引入了噪声。为了缓解噪声问题,Tian等42设计了类别感知网络,利用注意力机制区分不同的边缘关系,增加了方面词相关的上下文权重。类似的,Liang等43首次提出结合句子成分信息与依赖信息,构造双语法感知注意力网络(Bi-Syntax aware Graph Attention 基于深度学习

30、的方面级情感分析情感分类目标表示文本表示对方面的理解不能脱离整个文本神经网络框架中方面的向量表示特定属性在给定语言环境中的情感类别 Fig.3Aspect-based sentiment analysis tasks of deep learning图3深度学习的方面级情感分析任务 4第 9 期汪红松,李嘉展,曾碧卿:文本方面级情感分析方法研究综述Network,BiSyn-GAT),针对上下文内部与上下文之间的关系进行建模,进而提高对语法信息的有效利用率,降低无关噪声的干扰,增强方面词与上下文之间的情感交互。2.4.4基于目标的方面级情感分析目标方面级情感分析(Target Aspect-B

31、ased Sentiment Analysis,TABSA)是 ABSA 领域的另一个研究热点。TABSA的主要任务是识别目标和方面的细粒度信息,例如在句子“location1 is your best bet for secure although expensive and location2 is too far”中有“location1”和“location2”两个不同的目标词,目标词“location1”有“safety”和“price”两个不同的方面词,而目标词“location2”只有“price”一个方面词。Saeidi等44提出一个用于TABSA的基准数据集SentiHood

32、,该数据集被标注为城市社区领域,在逻辑回归函数和LSTM模型的训练下,提供一个更加强大的基线。对于TABSA,以往的方法是将方面词权重初始化为同一个值,再计算平均向量,但这种方式将不同方面词与目标之间的情感关系过度简单化。因此,Ma等45提出分层注意力模型 Sentic LSTM,通过引入外部知识来扩展 LSTM 单元,解决了分层注意力机制在推断给定目标词和相关情感词时关系不明确的问题。为了从预定义的方面词集合中提取细粒度的意见极性,Liu等46提出利用外部“记忆链”,结合延迟内存更新机制的网络架构,在 TABSA 基线任务上取得了实质性改进。针对方面词在不同上下文中具有相同向量表示而丢失了上

33、下文相关信息的现象,Liang等47在输入层嵌入预训练语言模型向量,并提出新的模型架构,利用稀疏系数向量从上下文中调整目标词和方面词的嵌入,而不是使用上下文无关或随机初始化的向量,并且在优化方面词表示过程中,让其尽量远离无关的目标词。2.4.5基于外部情感知识的方面级情感虽然神经网络在ABSA中具有优异的表现,但神经网络模型性能与数据集大小有密切联系,若缺乏数据会导致神经网络模型发挥不出应有的性能。但现有的用于ABSA的公共数据集都相对较小,为了解决数据集与神经网络不匹配的问题,学者们提出了基于外部情感知识的方法48。基于外部情感知识的方法能够减少模型对数据的依赖,并且结构化知识和情感知识能够

34、提高模型性能。在结构知识方面,Nguyen等49提出将句子结构信息融入注意力机制的网络模型ALAN,结合LSTM神经网络,取得了较好的分类效果;Wang等50认为词与从句之间的情感信息同样需要得到重视,因此在句子层面采用语义分割方法将句子分割成若干个子句,进一步证明了上下文语义信息对于方面词的重要性。2.4.6基于深度学习的方面级情感分析方法对比为了更清晰地对比上述方法,表4列举了部分基于深度学习的ABSA实验效果,表中粗体字表示同类型方法中较优的结果。在处理ABSA任务时,通常会利用不同模型的优势以及避免模型缺陷来达到较优的结果,因此可以预测未来针对ABSA的任务会更加专注于结合不同方法,并

35、且通过对预训练模型的微调,实现更好的情感分析效果。基于注意力机制的方法在计算时,考虑了目标词与上下文信息。基于预训练语言模型的方法提供了更好的模型初始化参数,将注意力机制与预训练语言模型相结合,使得目标任务具备更好的泛化性。基于图神经网络的方法能处理非连续的目标词,解决非欧式空间问题,借助语法解析树获得语义相关性更强的目标词。基于外部情感知识的方法常结合语料库来提升模型的情感分析能力。基于目标的方法需根据给定的目标词,形成目标词和方面词的组合,推断出文本的情感极性。同时,从表中可以看出,综合运用不同模型,并取其Table 4Aspect-based sentiment analysis met

36、hods based on deep learning表4基于深度学习的方面级情感分析方法模型类别注意力机制预训练模型图神经网络目标相关外部情感知识模型方法RAM29MGAN30IRAN32AEN-BERT34RGAT-BERT35DR-BERT36DualGCN39DotGCN41BiSyn-GAT43sentic LSTM45EntNet With DMU46RE+Delayed-memory47PRET+MULT48ALAN49HASA50LaptopAccuracy74.4975.3977.6279.9378.2181.4581.8081.0382.91-71.1580.4481.60

37、F171.3572.4773.8476.3174.0778.1678.1078.1079.38-67.46-66.70RestaurantsAccuracy80.2381.2581.9683.1286.6087.7287.1386.1687.94-79.1173.3580.90F170.8071.9475.0273.7681.3582.3181.1680.4982.43-66.73-68.50TwitterAccuracy69.3672.5474.8174.7176.1577.2477.4078.1177.99-76.4777.20-F167.3070.8173.5173.1375.2576.

38、1076.0277.0076.80-SentihoodAccuracy-88.8091.0092.60-F1-52023 年软 件 导 刊利、去其弊,能达到较优的效果,这也说明了当前方面级情感分析研究方法的趋势,即结合不同方法,运用大规模预训练模型并进行参数微调,以期得到更好的实验效果。上述方法的具体比较如表5所示。3 方面级情感分析发展趋势国内外学者针对不同的ABSA任务已提出了各种各样的模型框架,并取得丰硕的研究成果,模型的精度、数据处理能力都在不断提升。目前,ABSA尚处于发展阶段,仍存在许多值得研究的问题。3.1隐式情感分析目前大部分ABSA的研究对象是显式的目标情感词,而对于隐式 A

39、BSA 的研究还处在初步发展阶段。例如反讽、隐喻等特殊形式的文本,通常隐含与字面相反的意思,以夸张、比喻等手法对人或者事物进行揭露51。隐式情感的表达方式在生活中广泛存在,如“手机只是你生活的一部分,而你确是它的全部,请放下身边杂事,多陪陪手机”,该句子的真实情感是讽刺人们过度使用手机。但隐式情感分析的复杂性和不确定性使隐式情感分析成为一项具有挑战性的任务。隐式情感分析的主要任务是从文本中挖掘出蕴含的情感信息,现有的主要方法是基于特征和规则以及基于上下文的方法。Lou等52利用外部情感常识检索情感信息和句子的句法信息,为每个句子构建情感图和依赖图,通过交互式建模情感信息和依赖信息,推断出句子的

40、隐含情感;Mao等53提出无需任何预处理即可在单词级别识别和解释隐喻情感的方法,并在机器翻译任务中,能够识别隐喻词并将其替换成常见的同义词;Javdan等54在ABSA任务基础上,利用BERT模型提取上下文对话序列和对话回复之间的情感关系,并确定提取的方面词是否具有讽刺意义。3.2情感文本生成文本生成不仅仅关注文本传递的信息(摘要、问答),传递文本的方式也同样值得关注。对于ABSA而言,情感文本生成是生成以方面词为中心的文本,如具有特定情感(兴奋、生气、伤心等)的文本。Wang等55采用无监督学习的方式,在文本生成器中建立一个基于惩罚的目标,通过训练多个生成器和多分类器生成具有特定情感标签的文

41、本;Du等56提出在情感文本生成的每一步中采用自回归高斯分布对回复语义进行建模,增强了以实体词为中心的情感表达,降低了传统情感对话过程中无意义回复的频率。因此,目前在情感文本生成领域,研究热点逐渐转向以方面词为中心的情感表达,丰富以实体词为中心的情感文本信息。3.3多模态情感分析社交媒体上并不仅有文本能够表达人们的情感,图片、音频、视频等同样能够表达人们的情感。因此,通过设计用于提取视觉特征语义的新方法对多模态数据进行统一分析已成为一个重要的研究领域。进行多模态情感分析时,需要对带有情感色彩的图文、视频等多媒体信息的主题或某些方面进行分析、处理、归纳和推理。Liang等57将多模态情感分析与讽

42、刺识别相结合,从模态内情感依赖关系和模态间情感依赖关系两方面出发,对输入样本进行联合学习,推断多模态数据的讽刺识别结果;Ju等58结合多模态方面术语提取和多模态情感法分类,提出带有辅助的跨模态关系检测联合学习方法,利用辅助文本图像控制视觉信息的应用,并根据联合提取的方面信息获取方面级别的情感分类。总而言之,ABSA的研究热点和未来面临的问题与挑战还不止于此。对于文本而言,不仅需要考虑最终的情感极性,而且需要考虑用户生成的文本是否符合语法规则,以及如何处理表情符号等问题。此外,寻找一个合适的统一框架来完成各种ABSA任务也是目前的发展趋势之一。4 结语随着信息技术的快速发展,社交平台数量的急剧上

43、涨,以用户为中心的言论信息量也呈爆发式增长。言论信息可用于情绪化分析,已广泛应用于电子商务、心理治疗、舆情监控等领域,具有较高的商业价值与社会价值。在情感分析领域,对于ABSA的研究是一个重要的子任务。本文简要介绍了情感分析的常用方法,主要阐述ABSA近年来常用的分类技术和研究热点,并简要分析ABSA未来的发展趋势。目前,深度学习具有自动提取特征、较强的非线性数据处理能力以及能显著降低人工标注成本等优势,在情感Table 5Comparison of aspect-based sentiment analysis methods based on deep learning表5基于深度学习的方

44、面级情感分析方法比较方法注意力机制预训练模型图神经网络目标相关外部情感知识优点减少了对人工标注数据的依赖,能够更加深入地关注文本的层次结构,获取有效的上下文语义信息能更准确地捕获语法、语义信息,且捕获信息的距离较长,能够并行化处理任务优化了上下文语义信息,能够捕获与目标词联系更紧密的上下文信息当用随机初始化或固定的向量表示目标和方面时,能区分不同上下文的目标词和方面词能解决数据量与神经网络不匹配的问题,并能有效降低模型过拟合概率不足对于长距离语义的分析能力较弱,在文本粒度方面不够细化模型参数量大,结构灵活性较差,计算量大;应用领域受限,迁移能力受限当上下文信息与目标词联系不紧密时,在构造图矩阵

45、时可能存在语义缺失情况语义信息通过稀疏矩阵进行构造,可能造成信息缺失需要选择合适的情感知识库,同时需要对库中的知识进行筛选 6第 9 期汪红松,李嘉展,曾碧卿:文本方面级情感分析方法研究综述分析研究中得到了广泛应用,但是深度学习所带来的红利也渐进尾声,单纯的模型复用和模型叠加并不能很好地提高分类效果。随着研究的深入,基于浅层的情感分类任务逐渐陷入瓶颈。文本情感分析的研究任务逐渐向情感理解、情感生成、情感交互方面不断深入,研究范围已从单模态数据逐渐拓展到多模态数据。因此,ABSA的研究还在不断发展中,对于复杂语法、讽刺识别、跨领域多模态等情感分析任务的研究正方兴未艾。参考文献:1 NASUKAW

46、A T,YI J.Sentiment analysis:capturing favorability using natural language processingC/International Conference on Knowledge Capture,2003:70-77.2 LIU B.Sentiment analysis and opinion mining M.Berlin:Spring,2012.3 BO P,LEE L.Opinion mining and sentiment analysisM.Delft:Now Publishers Inc,2008.4 PANG B

47、,LEE L,VAITHYANATHAN S.Thumbs up?sentiment classification using machine learning techniques C/The 2002 Conference on Empirical Methods in Natural Language Processing,2002:79-86.5 WAWRE S V,DESHMUKH S N.Sentiment classification using machine learning techniques J.International Journal of Science and

48、Research,2016,5(4):819-821.6 ZHANG W,LI X,DENG Y,et al.A survey on aspect-based sentiment analysis:tasks,methods,and challenges DB/OL.https:/arxiv.org/pdf/2203.01054.pdf.7 ZHANG J,ZHANG A,LIU D,et al.Customer preferences extraction for air purifiers based on fine-grained sentiment analysis of online

49、 reviewsJ.Knowledge-Based Systems,2021,228:107259.8 NAZIR A,RAO Y,WU L,et al.Issues and challenges of aspect-based sentiment analysis:a comprehensive survey J.IEEE Transactions on Affective Computing,2020,13:845-863.9 ZHANG W,DENG Y,LI X,et al.Aspect sentiment quad prediction as paraphrase generatio

50、n DB/OL.https:/arxiv.org/pdf/2110.00796.pdf.10 YIN Y,WEI F,DONG L,et al.Unsupervised word and dependency path embeddings for aspect term extraction DB/OL.https:/arxiv.org/pdf/1605.07843.pdf.11 ZSCHORNACK R S F,LINHARES C D S T,FERNANDES D M J A.Aspect term extraction using deep learning model with m

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服