收藏 分销(赏)

基于跨模态语义学习的谣言判定方法.pdf

上传人:自信****多点 文档编号:2335735 上传时间:2024-05-28 格式:PDF 页数:4 大小:2.20MB
下载 相关 举报
基于跨模态语义学习的谣言判定方法.pdf_第1页
第1页 / 共4页
基于跨模态语义学习的谣言判定方法.pdf_第2页
第2页 / 共4页
基于跨模态语义学习的谣言判定方法.pdf_第3页
第3页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 年 月计 算 机 应 用 文 摘第 卷 第 期基于跨模态语义学习的谣言判定方法娄豪森,郑芸珂,刘柏伽,王 杰(中央司法警官学院,河北 保定)摘 要 随着信息时代的发展 以互联网为基础的社交网络为人们的生活带来了便利 与此同时 谣言也不可避免地在社交网络上传播 网络谣言这一新问题是整个国际社会理论界高度研究和共同关注的社会热点 也是国内外理论界学者近年来一直重点开展的相关研究和讨论工作中的一个难题 在当今网络 自媒体 的文化时代 网络社交媒体平台依靠用户活动来竞争 这使得控制用户内容变得困难 同时 也有一些人为了获得关注而歪曲事实 导致虚假信息在社交网络上传播 此外 谣言和信息很容易通过互联网

2、迅速传播 严重影响了全国社会群体的基本生活 因此 为了有效地控制谣言 应努力开展谣言检测与分析 传播渠道建模和传播阻断 提高网民对谣言的辨别能力等方面的研究 文章通过学习卷积神经网络并使用跨模态语义学习方法获取网络信息的特征 然后通过线性分类器对其进行分类和判别 最终得到判断结果 该方法具有高效 便捷等优点 关键词 跨模态检索 卷积神经网络 图像识别 文本识别 谣言判定中图法分类号 文献标识码 引言目前国内的谣言判断系统还不成熟,导致集中的数据无法准确存储,难以实现谣言判定。在大数据时代,人们不知道自己在网络上获得的信息是否为谣言。如果传播的是谣言,将对社会和人们的日常生活造成极大的危害。现在

3、很多文献都提到了谣言判定,对本文研究项目有一定的指导意义。例如,庄佳敏提出了一种跨模态检索方法,分别提取图像文本中的图像信息和图像特征。刘建勋等提出了多标签图卷积基金项目:中央司法警官学院 年校级大学生创新创业训练计划项目:基于跨模态语义学习的谣言判定方法()网络中的表示学习方法。上述主题中提出的方法与本设计类似,但核心不同,这些方法都没有将语义特征的实时匹配和谣言判定作为研究内容。该主题可以更具体地解决现实世界中的问题,具有更高的实用价值。研究目的随着数字科技手段的不断向前发展,世界科技也正在逐渐进入数字化的时代。在现代信息技术传播与互联网商业互动营销相结合的“双驱动”框架下,随着移动社交网

4、络市场的迅速繁荣,虚假信息不断涌现。当人们使用互联网时,他们会发表自己的一些言论,一些不实言论逐渐成为谣言,也有许多不法分子利用传播谣言来牟取利益。谣言的传播不仅造成强烈的社会冲击,危害人民群众的公共生活权益,还损害了公共利益。由于网络谣言和信息以异常快的速度迅速传播,事件范围广泛,一旦一些网络谣言扩大到一定规模,就可能造成严重的不良影响,甚至造成整个社会秩序的不稳定。基于这一现象,计划设计一套完整的谣言检测方法,通过分析网络中的文本、音频、视频等来提取特征,并通过训练的正负样本来确定当前信息是否属于谣言。所设计的谣言判定方法可以嵌入实时网络监控分析中,以检测谣言并遏制其传播。研究内容 技术总

5、路线本文以深度学习为基础,设计出一种基于跨模态语义学习的谣言判定方法。首先使用网络爬虫技术来抓取历年来的谣言信息,以训练神经网络并获取谣言的语义特征;对于未知的网络信息通过比对获取的特征,判定信息为谣言或非谣言。技术路线总况如图 所示,系统可分为 层,具体如下。()数据获取层:采用网络爬虫技术,在各网页中抓取谣言信息。()数据训练集中的验证数据建立层:解压验证数据,读取并生成验证数据,生成验证数据字典并解析验证的数据列表,自动划分验证数据训练集及解析数据字典验证数据训练集。()跨模态检索层:将获取的图像或文本信息通过卷积神经网络提取语义特征,并将其映射到一个公共的特征空间中。()分类层:将提取

6、到的语义特征通过线性语义转化器进行分类,并将其分为谣言集和非谣言集。()判断层:计算得到的未知信息与谣言集和非谣言集中数据之间的余弦距离,然后通过余弦距离的大小来判定其是否为谣言。图 技术路线总况谣言数据的来源主要来自以下三方面。()内部谣言集散地:朋友圈、门户网站及各大网络平台等。()外部谣言集散地:微信、微博、论坛、贴吧及新闻媒体等。()自媒体发言人:头条号、百家号、自媒体号等。谣言的传播通常以如图 所示的途径传播,由外部谣言集散地、外部谣言集散地和自媒体发言人循环传播;数据集的建立是通过多媒体数据及网页爬虫技术在各个网页进行抓取并放入数据集中。通过数据集中的数据来训练网络参数。所抓取的内

7、容是由文本和图像构成的,需要用到跨模态检索方法来提取其语义特征,最终通过线性分类器将信息分为谣言信息和非谣言信息。数据集的获取模块如图 所示,网络爬虫技术是指一种能完全按照一定程序的运行规则,自动而高效地去抓取万维网中的所有信息资源数据的程序或者脚本。在本文中,其主要用于抓取样本数据,为本方法提供足够的样本数据。数据集的建立层数据集的建立如图 所示。收集数据:利用网络爬虫技术在各个网页中抓取信息。解压数据:读取并解析所抓取的数据。生成数据列表:主要作用是更快、更准确地读取数据,以训练判定模型。训练数据:通过训练得出,两个数据集分别为谣言信息和非谣言信息。计 算 机 应 用 文 摘 年第 期图

8、网络爬虫技术图 数据集的建立 跨模态检索层目前,跨模态检索使用的主流方法是一种基于语义公共空间的语义学习理论数据挖掘方法,其分析依据为不同模态数据中具有相似程度的数据语义,如数据语义中存在的对象、方位、背景信息等数据语义信息。存在相似语义特征的数据也具有一些潜在的相关性,可以通过构建一个公共语义空间模型并将所有不同语义模态类型相关的数据都投影到这个公共空间中进行语义相关性度量分析。分类层如图 所示,该方法首先对图像和文本进行检测,并将其放入公共语义特征空间,然后将这些特征通过线性分类器进行传递,得到正标签和负标签。图 网络结构 判断层通过跨模态卷积神经网络获得新获取信息的语义特征,使用所获得的

9、语义特征和数据集中的特征来计算余弦相似度。余弦相似度最小取值点的取值范围可设为,两个向量之间的最大相似度范围设为。余弦距离的取值范围为,。计算过程中涉及的数学公式如下。余弦相似度定义的公式为:(,),()归一化后:,()余弦距离:(,)(,)()主要观点卷积神经网络算法是基于深度机器学习算法的研究领域中的一类多层结构化算法,主要框架可以由下述几类结构层构成:输入层、卷积层、层、池化层和全连接层。本文方法利用卷积神经网络提取特征,通过线性分类器将其分为正标签和负标签,最终将得来的新的特征与得到的标签进行余弦距离的计算,并观察结果与其标签的相似度。卷积神经网络如图 所示。网络层次结构参数和网络权重

10、参数都确定无误后,图像数据将依次进入卷积层、池化层、全连接层,通过向前传播的算法进行迭代化计算,并通过反()等算法继续进行数据反向的传播,对网络参数进行动态地调整。当误差值满足预设值时或迭代的计算次数满足预设值时,网络开始停止迭代训练并最终输出结果,形成一个完整的卷积神经网络。图 卷积神经网络 技术路线如图 所示,首先通过网络爬虫技术获取数据,然后通过数据集训练网络参数,将获得的文本或者图像信 息 输 入 多 层 感 知 机(,)和 卷积神经网络并对其进行特征提取,得到文本或者图像的语义向量。最后进入线性分类器,得到正标签和负标签。图 技术路线(下转第 页)年第 期 计 算 机 应 用 文 摘

11、 配电网存在较高的 比,且有功与无功存在较大的耦合,不能起到良好的调度效果。因此,本文在功率预测的条件下,设计了含分布式电源电网无功调度方法。从无功电压优化、调度模型等方面对电网进行无功调度,使无功设备的输出功率更低,并使有功设备提升更多的功率,从而达到更高的调度效果,降低电网运行成本。参考文献:任景,胡威,薛晨,等含有有功损耗的 风电场优化调度策略计算机与数字工程,():吕志强,孙超,王艳蓉,等基于 的电网调度云应用容器管理系统的实现工业控制计算机,():毛宏亮,艾孜尔古丽,陈德刚基于多头注意力的电网调度领域命名实体识别计算机技术与发展,():王佳琪,俞灵,夏文岳,等基于 模型的电网调度领域

12、命名实体识别方法电力信息与通信技术,():余建明,刘赫,单连飞,等基于 和 融合模型的电网调度意图识别方法 电力系统保护与控制,():黄尽云,罗倩,成梁成基于规则引导 的多目标电网调度算法北京信息科技大学学报(自然科学版),():张楠,李立周,郭自豪,等基于电网运行状态评价指标的电网调度工作自动评分系统的建立流体测量与控制,():马建伟,覃海,李颖杰,等基于随机森林的电网调度多源故障信息数据融合系统设计电子设计工程,():作者简介:梁毅辉(),本科,工程师,研究方向:电网建设。(上接第 页)结束语本文将机器学习中的技术应用于谣言判定中,设计了一套能够智能判别谣言信息的系统。通过建立数据集来获取

13、样本信息,然后将其输入成熟的网络系统中进行学习,学习完毕后会生成各种数据的特征,通过线性分类器来分别建立正标签和负标签。如果获得新的信息,将其输入网络中,通过判断其语义特征与正标签、负标签的相似性,从而判定其是否为谣言信息。本系统具有成本低、速度快、操作简便等特点,可以广泛应用于日常生活的谣言判定,从而更好地维护人们的正常生活。参考文献:冯方向基于深度学习的跨模态检索研究北京:北京邮电大学,李志义,黄子风,许晓绵基于表示学习的跨模态检索模型与特征抽取研究综述情报学报,():李志欣,施智平,陈宏朝,等基于语义学习的图像多模态检索计算机工程,():,:魏成网络谣言止于“智治制”者新闻与写作,():作者简介:娄豪森(),本科,研究方向:机器学习。郑芸珂(),本科,研究方向:机器学习、计算机视觉。年第 期 计 算 机 应 用 文 摘

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服