收藏 分销(赏)

东北抗联历史人物事件知识图...—以陈翰章烈士生平事迹为例_王佳莹.pdf

上传人:自信****多点 文档编号:233312 上传时间:2023-03-29 格式:PDF 页数:3 大小:1.62MB
下载 相关 举报
东北抗联历史人物事件知识图...—以陈翰章烈士生平事迹为例_王佳莹.pdf_第1页
第1页 / 共3页
东北抗联历史人物事件知识图...—以陈翰章烈士生平事迹为例_王佳莹.pdf_第2页
第2页 / 共3页
东北抗联历史人物事件知识图...—以陈翰章烈士生平事迹为例_王佳莹.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、2023年第22卷 第1期产业与科技论坛2023(22)1Industrial&Science Tribune东北抗联历史人物事件知识图谱的构建及应用 以陈翰章烈士生平事迹为例王佳莹 裴 尧【内容摘要】本文以陈翰章烈士生平事迹为例,整理归纳了 年期间公开发表的 篇相关文献,共获得 种实体,种关系,,个三元组。运用 软件对文献中的东北抗联历史人物事件进行数据挖掘,并在此基础上用 软件对相关历史人物之间以及历史人物和事件之间的相互关联进行可视化展示与分析,进而构建了陈翰章烈士人物事件知识图谱。通过本文的研究,能够将东北人民在中国共产党领导下,同日寇在艰苦险恶环境中英勇顽强斗争的史实,进行图谱化的展

2、示。该方法通过知识图谱的构建,能够揭示东北抗联相关历史人物及事件之间的关联性,为大数据挖掘在东北抗联相关研究中的应用拓宽了渠道。【关键词】知识图谱;东北抗联;陈翰章【基金项目】本文为吉林省教育科学“十四五”规划 年度思政专项课题“东北抗联红色文化资源创新高职思政课实践教学研究”(编号:)成果。【作者简介】王佳莹,女,吉林电子信息职业技术学院讲师;研究方向:东北抗联红色文化、马克思主义理论与当代社会裴尧,吉林大学教授;研究方向:课程思政及地学大数据教学 一、引言东北抗联历史是东北人民在中国共产党领导下,浴血抗日过程中涌现的可歌可泣的红色过往。年“九一八”事变后,东北沦陷,党组织第一时间发表对日宣

3、言,并派遣杨靖宇、赵一曼、魏拯民、周保中等党员到东北开展抗日工作。在日伪军力量薄弱的农村地区陆续组织东北反日游击队、东北人民革命军、东北抗日联军、东北民主联军,组织群众工作,建立东北游击根据地,开展游击战,牵制了大量日军。在与党中央失去联系、无后勤补给的情况下,抗联战士克服了东北恶劣自然环境的挑战,仍坚持同装备精良的侵略者开展了 年的浴血抗争。近年来,东北抗联的相关研究工作已经成为国内的研究热点,包括东北抗联史、东北抗联红色文化资源、东北抗联红色资源与思政课相结合的研究、东北抗日游击根据地研究及东北抗联数据库建设等。随着东北抗战史料的不断挖掘以及研究方法的创新,国内学者从各个角度展开深入研究,

4、撰写文章、提出观点,形成了丰硕的研究成果。随着近年来文献史料的整理和深入挖掘,有关东北抗联研究也取得了丰硕的研究成果,积累了大量的文献资料。这些文献中隐藏着众多史实、事件、人物及其错综复杂的关系,不仅包括东北抗日联军内部人物之间的关系,还涵盖东北抗日联军与东北义勇军、中国共产党组织、共产国际、苏联、朝鲜的关系等,这些信息均以非结构化的文本数据的形式呈现。想要系统地阅读研究这些文献资料,需要耗费大量的时间,且很难发现其众待和处理代理人的机会主义行为,以保证委托研发项目的成果。当然,本研究仅是针对代理人单群体做了基于简单解析的分析,其理论深度和细度还不够充分。【参考文献】许儒航 基于计算机视觉技术

5、的建设项目监管机理及方法研究 华北电力大学,黄颖,王勉,张铀 企业研发活动中的委托代理问题研究 科技进步与对策,():王宁,陈思 基于委托代理理论的企业研发活动研究科学学与科学技术管理,:舒红娟,宁宣熙 公共研发机构与政府之间的委托代理关系研究 中国科技论坛,():崔立红,梁婉颖 科技成果委托研发过程中政府权力与利益分配机制研究 郑州大学学报(哲学社会科学版),():冯芬芬 基于博弈论的串标行为分析及对策探讨 遵义师范学院学报,():,():,():周林荣,史文涛,关晓溪 基于权利结构不对等的“农超对接”供应链有机农产品的定价研究 遵义师范学院学报,():,产业与科技论坛2023年第22卷 第

6、1期Industrial&Science Tribune2023(22)1多历史人物和事件之间的复杂关系。知识图谱由节点和边组成,是一种利用图模型描述知识之间关联关系的技术方法。通过采集结构各异、来源不同的东北抗联重大史实和人物资源数据,对庞大的文本数据进行大数据挖掘,发现人物和事件之间的相互关系,进而构建知识图谱,能够把我党领导下的东北地区抗战历史以更直观、动态、关联的形式可视化呈现。该方法有助于促进东北抗联史的研究,挖掘蕴含其中潜在的历史和学术价值。二、理论基础与研究现状 公司于 年提出了知识图谱概念,知识图谱包含实体、概念、属性、关系等信息,能够使用人与机器共同理解的语言,以图的形式描述

7、真实世界。知识图谱的主要目的是根据知识之间的关系构建图谱,利用知识结构进行搜索,是人工智能研究的重要方向之一。国内外科技公司和研究机构纷纷开始构建知识图谱,如德国马普所的、清华大学的、复旦大学的 及谷歌的 等。目前,知识图谱在国内外引起了极大的重视,在如语义搜索、智能问答、辅助决策等领域都取得了极大的发展。刘勘等通过构建营商环境知识图谱,为政府业务流程整合以及制定优化营商环境决策提供了依据;沈旺等构建了数字人文视域下民国报纸的知识图谱;闻子墨等基于 构建知识图谱可视化地分析了临床用药及对治疗疾病的应用。是一款开源的跨平台可视化分析软件,其能够将 软件提取出的东北抗联历史人物事件进行知识图谱可视

8、化。通过构建东北抗联人物知识图谱,能够直接形象地用图谱化的形式将东北 年抗战时期的历史人物及其关系可视化展现出来,拓宽东北抗联研究渠道,充实东北抗联研究。创新东北抗联红色文化资源的传承方式,让文本的文字以图形的形式立体直观的呈现出来,方便学习和研究。本文以陈翰章烈士生平事迹为例,构建东北抗联人物事件知识图谱,以知网下载的与陈翰章烈士有关的研究文献为素材,基于 软件提取实体,抽取节点和边,构建知识图谱三元组,在此基础上利用 软件建构可视化的东北抗联历史人物事件知识图谱,以期为进一步指导东北抗联史相关研究提供基础和参考意义。三、数据来源与词典构建从 下载东北抗联历史中陈翰章烈士的生平事迹资料,共检

9、索到 年有关陈翰章烈士的 篇文章,将所有数据整合为 文件格式存储。基于简单共现关系,编写 代码,从 文本中提取与陈翰章将军生平相关联的人物事件,建立关系网络,并用 生成可视化图谱。在进行知识图谱构建之前,首先需要对数据进行预处理。对于数据挖掘来说,数据的预处理可能直接关系到数据分析和挖掘的结果准确性。本次研究工作,我们通过词典指定人物事件名称的方式进行实体识别。准备字典之前先要确定数据源,比如从知网下载张彦夫和吕博循发表的吉林籍抗日名将陈翰章生平事迹考为例,将下载的文本资料中的人名与历史事件写入自定义词典中,如“陈翰章”“东北反日联合军”“东北抗联第一路军”“魏拯民”“杨靖宇”等,将主要人物事

10、件的名称保存至文件 中,为下一步提取实体做准备。对于实体识别,建立词典是一种效率较高的做法。但在提取实体的过程中,有时会提取到与所研究内容无关的词汇,如在本文档中提取出的“安详、郜先生、幸吉、敬佩、周旋”等词,对于知识图谱的建构无用,因此需要建立停用词表,将知识图谱中不需要的词汇放置在“停用词”文本中。为后续实体识别、实体抽取和关系建立做好准备。四、陈翰章烈士人物事件知识图谱构建就知识图谱的构建方法而言,主要涉及到命名实体识别、实体关系抽取、知识图谱构建等领域的研究。知识图谱中的节点称之为实体,比如一位人物,或是抽象的概念,比如重大史实、历史人物、重要事件等。知识图谱中的边表示实体之间的关系,

11、如人物和历史事实之间的关系、人物和重要事件之间的关系等。(一)文本中实体识别。构建知识图谱的第一步是获取文本中的实体,从待测文本中识别出被标注为命名实体的部分,加以提取并归类。实体是生活中具体的实物,知识图谱中的实体通常通过文本中的词汇或短语进行描述,如东北抗联红色文化资源中的人名、游击根据地名称、战役名称、重要会议名称等。在陈翰章烈士生平事迹文本中,像“陈翰章”“魏拯民”“杨靖宇”“东北抗日联军第一路军”“敦化”等即为实体,这些实体之间有着复杂的关系。从下载的文本语料中挖掘出尽可能多的高质量词汇,读入已下载文本的每一行,以自定义词典为依据提取该行(段)中出现的实体。在文本中由于同一实体其相似

12、名称有多种,如“抗联二军第二师”即“东北抗日联军第二军第二师”。因此,需要将实体进行清洗和归一化,比如将“敦化县”、“敦化城”、“敦化”等都统一清洗归一为“敦化市”,以提高所构建知识图谱的质量和效率。(二)实体间关系抽取。命名实体识别是知识图谱构建的基础,而关系是知识图谱最重要的组成成分之一。知识图谱中用节点来代表实体,用边来描述实体间的关系及属性。关系抽取旨在从无结构的文本中抽取不同实体之间的关系。在关系抽取部分,主要研究内容为关键历史人物、事件之间相互关系网络的挖掘。由于每个人物及历史事件均具有自己的属性信息,因此可将人物之间的关系、人物与事件之间的关系以及事件与事件之间的关系抽象为社会网

13、络。首先,将每个实体(人物、事件)抽象为一个节点,而每个节点具有自己的属性信息,如名字、年龄、性别等。如果一个人物与另一个人物具有联络信息,则可视为两个节点之间具有边,而人物之间联络次数的多少则决定了边的强度,故而可以推断,两个节点之间边的强度越大,则说明这两个人物和相关关系在整个网络中权重越大,则越有可能是整个关系网中的关键人物和关系。实体关系抽取是在命名实体识别的基础上,抽取文本中实体间相互关系,并将其生成 实体,关系,实体 的三元组,这对于知识图谱的构建具有重要意义。比如在吉林籍抗日名将陈翰章生平事迹考这一文本中,“年 月初,在安图县两江口村汉窑沟,抗联第一路军第三方面军建立,陈翰章担任

14、指挥”。实体为“安图县”、“抗联第一路军第三方面军”、“陈翰章”,这里抽取的三元组为 陈翰章,指挥,抗联第一路军第三方面军 、陈翰章,活动地,安图县 、抗联第一路军第三方面军,成立地,安图县 ,在知识图谱中具体表示如图 所示。2023年第22卷 第1期产业与科技论坛2023(22)1Industrial&Science Tribune图 陈翰章事迹知识图谱实体间关系举例(三)东北抗联历史人物事件知识图谱构建。东北抗联历史人物事件知识图谱主要就是由节点和边组成,因此知识图谱实际是一张图,知识图谱中可以标示出所有与节点间相关的连接边。使用 软件能够将陈翰章生平中的人物事件可视化,本文以陈翰章烈士生

15、平事迹为例,构建的知识图谱共包含 个节点,条边,,个三元组,部分结果展示如图 所示。可视化技术的主要应用是对挖掘出的数据信息结果进行知识表达,在本文中主要指对挖掘的东北抗联历史人物事件相关信息进行可视化表达。图 陈翰章事迹知识图谱实体间关系举例(基于 软件)通过图 可以看出,“陈翰章”“周保中”“杨靖宇”“魏拯民”“东北抗日联军第一路军第三方面军”“东北义勇军”等节点最大。本次工作以句子为单位计算不同人物事件之间出现在文本中的频次,如“陈翰章”与“东北抗日联军第一路军第三方面军”共出现 次,这两个实体之间关联紧密。“东北义勇军”与“周保中”共出现 次,说明这两个节点关联较为紧密。各节点之间的关

16、系强度是由节点之间的连线粗细来体现的,连线越粗,表示人物事件之间的联系越紧密。由图 中我们还可以看到,陈翰章加入过东北义勇军,指挥东北抗日联军第一路军第三方面军打下许多著名战役。“九一八事变”后,陈翰章加入救国军(在图谱中统一归为东北义勇军),投身于抗日斗争,在救国军中结识了共产党员周保中同志,并经过战斗的历练加入中国共产党,逐步成为周保中同志的得力干将。现有研究论文中,关于陈翰章一生中打下的胜仗,主要涉及其指挥东北抗日联军第一路军第三方面军进行的寒葱岭伏击战、安图县大沙河战役、牛心顶子战役等。其中,图谱中展示的大沙河战役是在东北抗联著名将领魏拯民指挥之下进行的战斗。年,东北抗日联军第一路军军

17、长杨靖宇牺牲后,陈翰章带领第三方面军继续坚持游击战争,战斗至生命的最后一刻,牺牲于镜泊湖畔。由图 可见,由于目标文本中涉及的人物均与“陈翰章”为核心,提取的其他人物和事件亦是以陈翰章为核心进行关系提取的,其他人物和事件之间其实也存在关联,但是由于目标文本中提及次数不多或者没有重点介绍,因此在图谱中没有连接边,随着文本资料的增多,相关的关系也会显示清楚。五、结语本文通过对 下载相关文献资料的梳理与挖掘,提出东北抗联历史人物事件知识图谱构建框架,实现非结构化文本的实体识别、关系抽取及图谱构建。共获得东北抗联历史人物事件相关的 种实体、种实体关系和,个实体关系三元组。通过有效的知识整合解决了东北抗联

18、研究中知识分散、冗余和碎片化的问题,提取到的实体关系三元组为知识图谱的构建奠定了数据基础,填补了相关研究领域知识图谱的空缺。将抽取到的信息借助 生成具有一定规模的东北抗联历史人物事件知识图谱,展现东北抗联研究领域知识之间的关联性,为更好地对相关领域进行研究提供了科学依据。目前知识图谱在东北抗联研究中的应用有限,但是随着挖掘的数据量不断扩大,知识图谱研究对于拓展对东北抗联相关历史事实的认知与传播、弘扬东北抗联精神,增强历史自觉的驱动作用将会不断显现。基于知识图谱的大数据技术与东北抗联研究的结合,将会以新的形式重新翻开历史的篇章。【参考文献】,:,:,:,:刘勘,徐勤亚,於陆 面向营商环境的知识图谱构建研究 数据分析与知识发现,():沈旺,陈玖瑜,潘梦雅 数字人文视域下民国报纸知识图谱构建研究 图书馆杂志,():闻子墨,袁东超,裴宇鹏,张哲 基于 可视化分析血府逐瘀汤的现代临床应用 中华中医药学刊,():关迎晖,向勇,陈康 基于 的可视分析方法研究与应用 电信科学,():谢丹丹,何晓涵,臧乐乐,赵步阳,刘丹 基于微信公众平台的老门西文化资源知识图谱构建 文化产业,:张彦夫,吕博循 吉林籍抗日名将陈翰章生平事迹考延边党校学报,():王佳莹 东北抗联精神融入吉林高职思政课的必要性探讨 产业与科技论坛,():

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服