收藏 分销(赏)

基于BERT的金融文本情感分析与应用.pdf

上传人:自信****多点 文档编号:1872681 上传时间:2024-05-10 格式:PDF 页数:6 大小:1.03MB
下载 相关 举报
基于BERT的金融文本情感分析与应用.pdf_第1页
第1页 / 共6页
基于BERT的金融文本情感分析与应用.pdf_第2页
第2页 / 共6页
基于BERT的金融文本情感分析与应用.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第26卷第11期2023年11月软件工程 S O F T W A R E E N G I N E E R I N GVol.26 No.11Nov.2023文章编号:2096-1472(2023)11-0033-06DOI:10.19644/ki.issn2096-1472.2023.011.008收稿日期:2 0 2 3-0 2-2 7基于B E R T的金融文本情感分析与应用季玉文1,陈 哲2(1.浙江理工大学计算机科学与技术学院,浙江 杭州 310018;2.浙江理工大学信息科学与工程学院,浙江 杭州 310018);摘 要:针对金融文本情感倾向模糊问题,设计了一种基于B E R T(B

2、 i d i r e c t i o n a l E n c o d e r R e p r e s e n t a t i o n s f r o m T r a n s f o r m e r s,基于T r a n s f o r m e r的双向编码技术)和B i-L S TM(B i d i r e c t i o n a l L o n g S h o r t-T e r m M e m o r y N e t w o r k,双向长短时记忆网络)的金融文本情感分析模型,以B E R T模型构建词向量,利用全词掩盖方法,能够更好地表达语义信息。为搭建金融文本数据集,提出一种基于深度

3、学习模型的主题爬虫,利用B E R T+B i-G R U(双门控循环单元)判断网页内文本主题相关性,以文本分类结果计算网页的主题相关度。实验结果表明:本文所设计的情感分析模型在做情感分析任务时取得了8 7.1%的准确率,能有效分析文本情感倾向。关键词:情感分析;主题爬虫;长短时记忆网络;预训练语言模型中图分类号:T P 3 9 1 文献标志码:AF i n a n c i a l T e x t S e n t i m e n t A n a l y s i s a n d A p p l i c a t i o n B a s e d o n B E R TJI Yuwen1,CHEN Z

4、he2(1.School of Computer Science and Technology,Zhejiang Sci-Tech University,Hangzhou 310018,China;2.School of Inf ormation Science and Engineering,Zhejiang Sci-Tech University,Hangzhou 310018,China);A b s t r a c t:Aiming at the problem of vague sentiment orientation in financial texts,this paper p

5、roposes to design a financial text sentiment analysis model based on BERT(Bidirectional Encoder Representations from Transformers)and Bi-LSTM(Bidirectional Long Short-Term Memory Network)is designed.The BERT model is used to construct word vectors,and the whole word masking method is employed to bet

6、ter express semantic information.To construct a financial text dataset,a theme crawler based on a deep learning model is proposed,which uses BERT+Bi-GRU(dual Gate Recurrent Unit)to determine the topic relevance of text within a webpage,and calculates the topic relevance of the webpage based on the t

7、ext classification results.The experimental results show that the proposed sentiment analysis model achieves an accuracy of 87.1%when performing sentiment analysis tasks,and can effectively analyze text sentiment orientation.K e y w o r d s:sentiment analysis;theme crawler;long short-term memory net

8、works;pre-training language model0引言(I n t r o d u c t i o n)金融市场的发展水平是衡量社会商品经济发展水平的重要指标。学者们长期以来一直通过历史交易数据研究和预测市场变化规律。但是,金融市场的变化波动受到政策、股本、金融公司变动等多方面因素的影响,其数据具有非线性、非平稳性和高噪声等特点,因此研究难以取得有效的成果。软件工程2023年11月随着互联网和科学技术的发展,人们开始意识到可以通过网络监控金融舆情信息,进而分析行业动向和市场前景。已有研究表明,网络舆情信息可以影响投资机构或投资者的投资行为,进而对股市产生影响1。然而,网络文本

9、数据的噪声高、数据量大,传统的经济学方法难以准确挖掘文本中隐藏的信息,因此学者们开始将深度学习技术应用于该领域。本文基于深度学习主题爬虫,创建金融文本情感标注数据集,填补了当前金融文本情感标注数据集的空白;采用目前文本分析领域应用效果最好的B E R T模型,并结合B i-L S TM模型,丰富了深度学习方法在金融领域的研究。1相关研究(R e l a t e d r e s e a r c h)1.1主题爬虫主题爬虫是一种特殊类型的网络爬虫,它的初始统一资源定位符(U n i f o r m R e s o u r c e L o c a t i o n,U R L)集合是与预定义主题高度相

10、关的页面。主题爬虫从这些种子U R L开始,分析页面并提取与主题相关度高的链接,形成一个扩展U R L集合。主题相关度计算是主题爬虫的核心模块,它决定了爬虫是否能够很好地保留主题相关的网页和过滤掉与主题无关的网页。目前,主题爬虫常用的相似度计算策略主要分为两类:基于网页链接结构的搜索策略和基于内容评价的搜索策略。胡萍瑞等2根据互联网站点同一版块U R L在结构和语义特征上的相似性,设计了一种基于U R L模式集的主题爬虫,能够在下载页面之前判断主题相关度。于林轩等3将P a g e R a n k算法应用于主题爬虫,构建了一个垂直搜索引擎。需要注意的是,基于链接分析的搜索策略主要依据U R L

11、的构成进行主题相关度判断,忽略了网页正文内容,容易造成“主题漂移”的现象。传统的基于内容评价的搜索策略使用词频和向量空间模型作为核心算法,通过对当前爬取的页面正文内容、网页结构进行分析,判断当前页面是否与主题相关。Y OHA N E S等4采用遗传算法改进局部爬虫算法的缺陷,精确爬取和遍历主题相关的W e b,使爬虫主题更加聚焦。D U等5采用将向量空间模型和语义相似度模型相结合的方法,改进了主题相关度计算模块。近年来,随着深度学习在文本、语音和图像等数据处理领域的不断发展,它在文本分类问题上的应用也已经取得了显著的成果。W o r d 2 V e c、B E R T等词编码技术及T e x

12、t C N N、L S TM等模型的提出和发展极大地提高了分类的准确率。HU A N等6将多种深度学习模型结合使用,提高了分类的准确性。本文将主题爬虫中的主题相关度问题看作是一个文本分类问题,首先收集主题相关的文本数据集并训练模型,其次依据模型计算网页中文本的主题相关度,计算网页的主题相关度。1.2文本情感分析目前,主流的文本情感分析方法可分为基于情感词典、机器学习和深度学习三类。基于情感词典的方法是传统的情感分析方法,它利用情感词典中的情感极性计算目标语句的情感值。国外最早的情感词典是S e n t i W o r d N e t,李寿山等7使用英文种子词典和机器翻译系统构建了最早的中文情感

13、词典。尽管基于词典的分析方法实现简单,但准确率在很大程度上依赖于构建词典的质量,并且构建情感词典需要耗费大量人力物力,对新词的适应能力也较差8。相对于基于词典的方法,机器学习在文本情感分析任务上能够取得更高的准确率。唐慧丰等9使用几种常见的机器学习方法(如S VM、K N N等)对中文文本进行情感分类,通过多次实验比较,研究特征选择方法、文本特征表示方法等对分类结果的影响。刘丽等1 0和唐莉等1 1将条件随机场与依存句法规则等结合,实现了特征与情感词的提取。前者利用复杂句式规则进行粗粒度分析,计算整体情感倾向;后者基于情感词二分网,采用MH I T S(拓展的基于超链接的主题搜索)算法对特征词

14、和情感词的权值进行计算排序。虽然机器学习在文本情感分析方面取得了不错的效果,但是需要专业人员对相关特征进行专业分析和提取且其泛化能力较差。深度学习的自动提取特征的特点弥补了机器学习在特征提取困难,泛化能力差等方面的不足,它只需要对已标注的数据进行多次迭代训练,就可以实现高准确率的文本情感分析。潘红丽1 2基于R N N(循环神经网络)和L S TM(长短时记忆网络)对英文文本中的情感信息 进 行 分 析,准 确 率 达 到 了9 4.5%。B A S I R I等1 3提出了一种基于注意力的双向C N N-R N N(卷积神经网络-循环神经网络)模型(A B C DM),它考虑了时间信息流的双

15、向性,同时结合注意力机制突出重要的词语。近年来,研究者发现W o r d 2 V e c和G l o V e学习得到的是静态的词向量,忽视了上下文的关系,动态词向量算法E L M o和B E R T的提出解决了这种语境问题。刘思琴等1 4和方英兰等1 5利用B E R T预训练语言模型代替W o r d 2 V e c和G l o V e训练词向量,嵌入其他模型后获得了更好的分类效果。2主题爬虫设计(D e s i g n o f t h e m e c r a w l e r)主题爬虫的设计包括四个关键模块:网页获取、网页解析、搜索调度和网页存储。网页获取模块负责从目标U R L获取H TM

16、 L文件。网页解析模块则负责从H TM L文件中提取出当前网页的链接和文本,并根据链接目标与爬虫主题的相关性判断链接的主题相关度。搜索调度模块基于主题相关度或其他规则,制定合理的访问调度策略。网页存储模块将目标网页存储到数据库中。本文所采用的主题相关度计算是基于网页中文本的分类,在爬取新的网页时,先判断该网页包含的文本集合与爬虫主题的相关性,并根据结果计算该网页的主题相关度。这个过程是主题爬虫中至关重要的一环,它保证了爬虫能够针对性地爬取与主题相关的网页。2.1文本主题相关度判断模型2.1.1搭建数据集首先,在综合考虑各个金融网站的用户量和知名度等因素的基础上,筛选出排名靠前的几个U R L作

17、为主题爬虫的种子U R L集合,并从这些网站中获取短文本数据。其次,人工排除与主题无关的文本,将剩余的与主题相关的文本加入语料库,43第 26卷第 11期季玉文等:基于 BERT 的金融文本情感分析与应用并标记为1。此外,从T HU C N e w s、C h n S e n t i C o r p和今日头条新闻等数据集中选择部分非主题分类的数据集加入语料库,并标记为0。经过处理后,得到的语料库样例如表1所示。表 1 语料库样例Tab.1 Corpus sample语料标记商务部:上周食用农产品和生产资料价格有所下降12月9日:“农产品批发价格2 0 0指数”比昨天下降0.3 3个点1沪指振荡

18、收跌1%医药板块再遭重挫1美女如云的俄军:保卫祖国是她们最大的荣耀0“开国上将”都是什么级别的?在军队中担任什么职务?02.1.2文本主题相关判断模型相关度计算采用的模型是B E R T+B i-G R U模型,B E R T模型基于双向T r a n s f o r m e r结构生成上下文感知的动态词向量,能够更好地表示上下文语义信息。首先利用B E R T模型将中文字符转换为包含文本信息的词向量,其次将B E R T输出的词向量输入B i-G R U模型进行特征提取。G R U模型是L S TM模型的一种变种,相比L S TM,G R U只有两个门控开关,其一是将L S TM中的输入门和

19、遗忘门合二为一的更新门,用来控制前一神经元保留的数据量,其二是重置门,用于控制要遗忘多少过去的信息。G R U状态的传输是从前到后的单向传输,由于文本语义信息是由前后文语境综合得出,所以采用包含一个前向G R U和一个后向G R U的B i-L S TM作为特征提取模型,分别学习序列中各个词的左右和上下文信息。G R U合并了L S TM的门控函数,其参数数量要少于L S TM,所以G R U的计算更简单,实现更容易,也更加节省计算资源。2.2网页主题相关度计算对于网页中一个新的U R L链接,相关度计算的步骤如下。(1)判断新的U R L是否已被爬取。(2)分析网页内容,获取其中的所有文本集

20、合。(3)将集合中的短文本依次输入神经网络获得每一个短句是否为与主题相关的分类。(4)将“步骤(3)”中得到的两种分类数目的比值作为最终的主题相关度。2.3主题爬虫设计结合深度学习模型的主题爬虫具体步骤如下。(1)选择1 0个初始种子链接作为种子集合,将之放入等待队列W a i t Q u e u e中。(2)计算种子集合中各U R L的主题相关度。(3)选择集合中相关度最高的网页进行爬取解析并存储其中与主题相关的短句。(4)对“步骤(3)”中选择的U R L解析的新U R L集合进行相关度计算,并选取相关度最高的前1 0个U R L加入种子集,从种子集中删除当前U R L。(5)判断网页存储

21、数量是否到达目标数量,否则重复“步骤(3)”。3文本情感分析(T e x t s e n t i m e n t a n a l y s i s)3.1数据预处理文本情感分析数据集是通过主题爬虫爬取,专业软件数据导出等方式进行收集,并请金融从业专家进行标注。收集的原始文本数据样例如表2所示。表 2 原始文本数据样例Tab.2 Sample of original text data序号时间标题来源链接12 0 2 2-0 5-1 8A股三大指数收涨:创 业 板 指 涨1.6%北向资金净买入5 9亿元证券时报网h t t p:w w w.s t c n.c o m/a r t c l e/d e

22、 t a i l/7 1 5 2 4 8.h t m l22 0 2 2-0 5-1 8A股日报:创业板指涨逾3%资 金抢筹华润双鹤经济参考报h t t p:w w w.j j c k b.c n/2 0 2 2-1 1/0 3/c_1 3 1 0 6 7 2 7 3 7.h t m 针对表2中文本的处理工作主要包括数据清洗、数据标注等。具体来说,首先去除与金融无关的文本数据,其次去除文本数据中多余的符号和连接词等无用字符。再次邀请三位金融从业专家分别标注数据集,按照文本情感偏向分类,积极标1,消极标-1。最后将三位金融从业专家对每一条文本数据的标注值取平均值,大于0取1,小于0取-1,得到最

23、终的分类标注。最终标记完成的文本数据如表3所示。表 3 预处理结果Tab.3 Pretreatment results序号文本数据标注1标注2标注3最终标注1创业板指大涨逾3%新能源、芯片与医疗板块走强11112A股高台滑雪、4 0 0 0家下跌各种“茅”伤亡报告出炉-1-1-1-13德讯证顾:市场延续振荡 但 不 缺 结 构 性机会1-1113.2基于B E R T+B i-L S T M的金融文本情感分析模型本文采用基于B E R T+B i-L S TM的金融文本情感分析模型共包含四层,模型结构如图1所示。图1 模型结构F i g.1 M o d e l s t r u c t u r

24、e53软件工程2023年11月3.2.1B E R T预训练模型获得文本的向量表示本文采用哈尔滨工业大学讯飞语言认知计算联合实验室发布的中文预训练语言模型B E R T-w w m-e x t作为预训练模型。相比原始B E R T模型,随机掩盖1 5%的字进行上下文预测,B E R T-w w m-e x t模型采用WWM(W h o l e W o r d M a s k i n g)方法,将同一个词中的每个字全部掩盖,从而预测整个词,进一步增强了模型对上下文的理解能力和语义信息的学习1 6。该方法是当前中文预训练模型中最为适合的方法,能够为金融文本情感分析任务提供较高的语义信息提取和表达能

25、力。3.2.2B i-L S T M提取特征R N N常用于捕捉序列之间的依赖关系,通过将前一个神经元的输出作为后一个神经元的输入利用序列间的隐藏信息。然而在训练过程中,函数迭代会导致梯度消失或梯度爆炸问题。为了解决这个问题,L S TM被设计出来,它是一种特殊的R N N,具有独特的“门”机制。每个L S TM细胞都包含三个门和一个记忆单元,L S TM细胞的结构如图2所示。L S TM可以有效地处理长序列的训练,并在文本情感分析中表现出色。图2 L S TM细胞结构F i g.2 C e l l s t r u c t u r e o f L S TM遗忘门用来决定前一个细胞中信息的保留或

26、丢弃,它读取ht-1和xt,经过S i g m o i d函数输出一个在0 1的值,对于每个在记忆单元Ct-1中的元素,1表示完全保留,0表示完全舍弃;具体计算方式如公式(1)所示:ft=(Wfht-1,xt +bf)(1)输入门用于更新细胞状态,确定什么样的信息内存放在记忆单元中,包含以下两个部分。(1)S i g m o i d层同样输出0,1 的数值,决定候选状态Ct有多少信息需要存储,如公式(2)所示:it=(Wiht-1,xt +bi)(2)(2)t a n h层会创建候选状态Ct,如公式(3)所示:Ct=t a n h(Wcht-1,xt +bc)(3)输入门完成工作后,要更新细胞

27、状态,将Ct-1更新为Ct。首先将旧状态Ct-1与ft相乘,遗忘掉由ft确定的要遗忘的信息,然后加上被筛选后的候选状态,得到新的记忆单元,如公式(4)如下:Ct=ftCt-1+itCt(4)输出门ot将内部状态的信息传递给外部状态ht,同样传递给外部状态的信息也是过滤后的信息。首先,S i g m o i d层确定记忆单元的哪些信息被传递出去 如公式(5)所示。其次,将细胞状态通过t a n h层进行处理,并将它和输出门的输出相乘,最终外部状态仅仅会得到输出门确定输出部分,如公式(6)所示:ot=(Woht-1,xt +bo)(5)ht=ot t a n h(Ct)(6)情感分析模型采用双向的

28、L S TM模型,结合前向传播和反向传播得到的向量,同时捕获上下文语义信息。本文实验中,使用B E R T对字符进行编码,并将输出乘以权重W作为B i-L S TM的输入。B i-L S TM在不同方向的隐层上进行计算,最终将两个方向的计算结果拼接输出。3.2.3情感计算首先将B i-L S T M输出的特征向量作为一个全连接层的输入,其次将全连接层的输出经过一个S o f t m a x函数得到一个向量,该向量表示该条文本属于积极或消极的概率值,介于0 1。4实验结果分析(A n a l y s i s o f e x p e r i m e n t a l r e s u l t s)4.

29、1文本情感分析实验结果分析4.1.1数据采集与标注本实验使用的数据主要来源于C h o i c e金融数据终端和主题爬虫从种子U R L集合开始爬取的网络文本,总计获得7 0 0 0条文本数据。数据集的分布结果如表4所示。表 4 数据集分布结果Tab.4 Dataset distribution results情绪分类训练集/条验证集/条测试集/条总数/条积极情绪2 4 5 07 0 03 5 03 5 0 0消极情绪2 4 5 07 0 03 5 03 5 0 0总数4 9 0 01 4 0 07 0 07 0 0 04.1.2评价指标本实验使用准确率(A c c u r a c y)、召回

30、率(R e c a l l)、精确率(P r e c i s i o n)和F1值(F1-S c o r e)评价模型预测效果1 7。准确率是预测正确的样本数量占总体样本数量的比例。精确率反映的是在所有预测为正向的样本中,预测正确的比例。召回率反映的是预测为正的数量与实际为正的数量的比例。F1值是为了调和精确率和召回率而设计的指标。各项指标的计算如公式(7)至公式(1 0)所示:A c c u r a c y=T P+T NT P+T N+F P+F N(7)P r e c i s i o n=T PT P+F P(8)R e c a l l=T PT P+F N(9)F1=2P r e c

31、i s i o nR e c a l lP r e c i s i o n+R e c a l l(1 0)其中:T P表示预测为正且真实为正的样本数量,T N表示预测为负且真实为负的样本数量,F P表示预测为正真实为负的样本数量,F N表示预测为负真实为正的样本数量。4.1.3模型与参数设置模型参数的设置对实验结果的好坏起到决定性作用,本实验经过多次调整后,最终选取的参数如表5所示。63第 26卷第 11期季玉文等:基于 BERT 的金融文本情感分析与应用表 5 模型参数Tab.5 Model parameter参数数值词向量维度7 6 8B i-L S TM维度7 6 8L e a r n

32、 i n g_r a t e2 e-5d r o p o u t0.5b a t c h_s i z e3 2e p o c h s1 04.1.4结果分析为验证本文所使用的预训练模型与特征提取模型的有效性,本文设计多组对比实验,对比结果如表6所示。表 6 实验对比结果Tab.6 Comparison test results方法准确率/%精确率/%召回率/%F1值/%W o r d 2 V e c+B i-L S TM8 2.48 0.98 4.98 2.8B E R T+L S TM8 3.98 2.58 6.08 4.2B E R T+B i-G R U8 6.18 4.58 8.68

33、6.5B E R T+B i-L S TM8 7.18 5.19 0.08 7.5 由实验结果可知,B E R T+B i-L S TM模型取得了8 7.1%的准确率和8 7.5%的F1值,相比W o r d 2 V e c+B i-L S TM模型,准确率提升了4.7%,精确率提升了4.2%。由此证明:B E R T-w w m-e x t模型能更有效地将文本信息转化为向量表达。相比B E R T+L S TM模型,B E R T+B i-L S TM的 准 确 率 提 升 了3.2%,说明双向L S TM能够更好地提取文本特征。通过比较B i-L S TM和B i-G R U模型的结果可知

34、,尽管G R U模型在参数数量和计算效率上具有一定优势,但由于参数减少,导致准确率略有下降。4.2主题爬虫实验结果分析主题爬虫的应用主要可以分为两个方面:一是爬取大量的文本数据用于训练情感分析模型,二是每日爬取当天的股评、新闻等文本,用于市场情绪的可视化。在为文本情感分析模型爬取数据集时,本研究共爬取了5 0 0个网页中的5 0 0 0条数据。为了评估主题爬虫中文本主题相关度判断模型的性能,本研究采用准确率、召回率、精确率以及每1 0 0条数据的判别时间作为评价指标。B E R T+B i-L S TM和B E R T+B i-G R U的实验结果如表7所示。表 7 实验对比结果Tab.7 C

35、omparison test results模型准确率/%精确率/%召回率/%判别时间/sB E R T+B i-L S TM8 7.38 6.18 7.91.9B E R T+B i-G R U8 6.58 6.18 6.61.3 经过对比发现,尽管B E R T+B i-L S T M的准确率比B E R T+B i-G R U高0.8%,但它每百条文本的判别时间比B E R T+B i-G R U高了0.6 s,这对于包含大量文本数据的网页来说,并不是最优选择。因此,在主题爬虫的文本相关性判断中,使用B E R T+B i-G R U模型能够获得更好的效果。4.3市场情绪可视化实验结果及

36、应用4.3.1市场情绪值的计算市场情绪值的计算是根据当日网络媒体中的短文本集合进行的,具体的计算步骤如下。(1)利用主题爬虫爬取5 0 0 0条当日互联网中与金融相关的文本并存储。(2)将文本集依次输入文本情感分析模型,得出每条文本的情感倾向。(3)计算文本集中情感倾向为1的文本数量与总文本数量的比值,作为当日的市场情绪。4.3.2应用本次实验结果已经作为市场技术分析的一部分被金融软件“对聪易”采用,市场情绪可视化应用结果如图3所示。图3 市场情绪可视化应用结果F i g.3 M a r k e t s e n t i m e n t v i s u a l i z a t i o n a p

37、 p l i c a t i o n5结论(C o n c l u s i o n)市场情绪对于个人投资、公司经营、政府监管等方面都有重要意义。本文结合自然语言处理和网络爬虫技术,搭建了金融相关的主题爬虫,并利用爬虫为情感分析模型爬取数据。使用基于B E R T和B i-L S TM的深度学习模型,对金融文本数据进行情感分析,并将模型运用到交易软件的搭建中。在未来的研究过程中,可以从两个方向继续深入探索。一方面,可以引入注意力机制提升情感分析过程中某些关键词的权重,同时降低非关键词的权重,从而获得更好的分析效果。另一方面,本文只考虑了积极、消极两种情绪,未来可以考虑更多元的分类或者量化分类,以

38、更好地反映市场情绪的变化。这些深入研究的探索,将有助于更准确地把控市场情绪,帮助投资者、企业家和政府监管者更好地做出决策。参考文献(R e f e r e n c e s)1 WO N G W K.R e v i e w o n b e h a v i o r a l e c o n o m i c s a n d b e h a v-i o r a l f i n a n c eJ.S t u d i e s i n E c o n o m i c s a n d F i n a n c e,2 0 2 0,3 7(4):6 2 5-6 7 2.2 胡萍瑞,李石君.基于U R L模式集的主题

39、爬虫J.计算机应用研究,2 0 1 8,3 5(3):6 9 4-6 9 9,7 2 6.3 于林轩,李业丽,曾庆涛.P a g e R a n k算法在主题网络爬虫中的应用J.北京印刷学院学报,2 0 2 0,2 8(1 0):1 4 3-1 4 7.4 Y OHA N E S B W,HA N D O K O H,WA R D A N A H K.F o-c u s e d c r a w l e r o p t i m i z a t i o n u s i n g g e n e t i c a l g o r i t h mJ.T E L K OMN I K A(T e l e c

40、o m m u n i c a t i o n C o m p u t i n g E l e c t r o n i c s a n d C o n t r o l),2 0 1 1,9(3):4 0 3-4 1 0.5 D U Y J,L I U W J,L V X J,e t a l.A n i m p r o v e d f o c u s e d c r a w l e r b a s e d o n S e m a n t i c S i m i l a r i t y V e c t o r S p a c e M o d e lJ.A p p l i e d S o f t C

41、 o m p u t i n g,2 0 1 5,3 6:3 9 2-4 0 7.6 HU A N H,G U O Z L,C A T T T,e t a l.A t e x t c l a s s i f i c a t i o n m e t h o d b a s e d o n a c o n v o l u t i o n a l a n d b i d i r e c t i o n a l l o n g s h o r t-t e r m m e m o r y m o d e lJ.C o n n e c t i o n S c i e n c e,2 0 2 2,3 4(1

42、):2 1 0 8-2 1 2 4.73软件工程2023年11月7 李寿山,李逸薇,黄居仁,等.基于双语信息和标签传播算法的中文情感词典构建方法J.中文信息学报,2 0 1 3,2 7(6):7 5-8 1.8 钟佳娃,刘巍,王思丽,等.文本情感分析方法及应用综述J.数据分析与知现,2 0 2 1,5(6):1-1 3.9 唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术比较研究J.中文信息学报,2 0 0 7,2 1(6):8 8-9 4,1 0 8.1 0 刘丽,岳亚伟.面向高校学生微博的跨粒度情感分析J.计算机应用研究,2 0 1 9,3 6(6):1 6 1 8-1 6 2 2.

43、1 1 唐莉,刘臣.基于C R F和H I T S算法的特征情感对提取J.计算机技术与发展,2 0 1 9,2 9(7):7 1-7 5.1 2 潘红丽.基于R N N弱监督网络的英语语义分析技术研究J.电子设计工程,2 0 2 1,2 9(1 5):9 7-1 0 1.1 3 B A S I R I M E,N E MA T I S,A B D A R M,e t a l.A B C DM:A n a t t e n t i o n-b a s e d b i d i r e c t i o n a l C N N-R N N d e e p m o d e l f o r s e n t

44、i m e n t a n a l y s i sJ.F u t u r e G e n e r a t i o n C o m p u t e r S y s-t e m s,2 0 2 1,1 1 5:2 7 9-2 9 4.1 4 刘思琴,冯胥睿瑞.基于B E R T的文本情感分析J.信息安全研究,2 0 2 0,6(3):2 2 0-2 2 7.1 5 方英兰,孙吉祥,韩兵.基于B E R T的文本情感分析方法的研究J.信息技术与信息化,2 0 2 0(2):1 0 8-1 1 1.1 6 C U I Y M,C H E W X,L I U T,e t a l.P r e-t r a

45、i n i n g w i t h w h o l e w o r d m a s k i n g f o r C h i n e s e B E R TJ.I E E E/A C M T r a n s a c t i o n s o n A u d i o,S p e e c h,a n d L a n g u a g e P r o c e s s i n g,2 0 2 1,2 9:3 5 0 4-3 5 1 4.1 7 许雪晨,田侃.一种基于金融文本情感分析的股票指数预测新方法J.数量经济技术经济研究,2 0 2 1,3 8(1 2):1 2 4-1 4 5.作者简介:季玉文(1 9

46、 9 4-),男,硕士生。研究领域:自然语言处理。陈 哲(1 9 9 8-),男,硕士生。研究领域:图像分割,自然语言处理。(上接第4页)5 WO J C I K G M,K AM I N S K I W A.L i q u i d s t a t e m a c h i n e b u i l t o f H o d g k i n-H u x l e y n e u r o n s a n d p a t t e r n r e c o g n i t i o nJ.N e u r o c o m p u t i n g,2 0 0 4,5 8-6 0:2 4 5-2 5 1.6 Y AM

47、A Z A K I T,T A N A K A S.T h e c e r e b e l l u m a s a l i q u i d s t a t e m a c h i n eJ.N e u r a l N e t w o r k s,2 0 0 7,2 0(3):2 9 0-2 9 7.7 B U R G S T E I N E R H,K R L L M,L E O P O L D A,e t a l.M o v e-m e n t p r e d i c t i o n f r o m r e a l-w o r l d i m a g e s u s i n g a l i

48、q u i d s t a t e m a c h i n eJ.A p p l i e d I n t e l l i g e n c e,2 0 0 7,2 6(2):9 9-1 0 9.8 R H A UM E F,G R E N I E R D,B O S S .M u l t i s t a t e c o m b i-n a t i o n a p p r o a c h e s f o r l i q u i d s t a t e m a c h i n e i n s u p e r v i s e d s p a t i o t e m p o r a l p a t t

49、e r n c l a s s i f i c a t i o nJ.N e u r o c o m p u t i n g,2 0 1 1,7 4(1 7):2 8 4 2-2 8 5 1.9 R O Y S,B A N E R J E E A,B A S U A.L i q u i d s t a t e m a c h i n e w i t h d e n d r i t i c a l l y e n h a n c e d r e a d o u t f o r l o w-p o w e r,n e u r o-m o r p h i c V L S I i m p l e m

50、e n t a t i o n sJ.I E E E T r a n s a c t i o n s o n B i o m e d i c a l C i r c u i t s a n d S y s t e m s,2 0 1 4,8(5):6 8 1-6 9 5.1 0 Z HA N G Y,L I P,J I N Y,e t a l.A d i g i t a l l i q u i d s t a t e m a-c h i n e w i t h b i o l o g i c a l l y i n s p i r e d l e a r n i n g a n d i t s

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服