1、第 14卷 第 4期2023年 8月指挥信息系统与技术Command Information System and TechnologyVol.14 No.4Aug.2023基于动态本体的战场目标数据关联技术刘伟1 翟崎2 李子1 李东敏3 李彭伟1(1 中国电子科技集团公司第二十八研究所 南京 210023)(2 武警部队研究院建设发展研究所 北京 100012)(3 解放军 31001部队 北京 100094)摘 要:针对战场目标相关数据呈现的海量、异构、网络化分布、内涵丰富以及关联应用前景广阔等特征,利用动态本体的灵活组织特性,提出了基于动态本体的战场目标数据关联方法,支撑了不同场景下以
2、战场目标为中心的信息挖掘分析。结合具体工程实践,描述了典型动态本体技术,并与超大本体(LO)与顶层本体(TO)2种生成方法进行了对比试验。试验结果表明,该方法可有效构建战场动态本体,具有可行性。关键词:战场目标;动态本体;信息关联分析中图分类号:TP311 文献标志码:A 文章编号:1674909X(2023)04005106Technology for Battlefield Target Data Association Based on Dynamic OntologyLIU Wei1 ZHAI Qi2 LI Zi1 LI Dongmin3 LI Pengwei1(1 The 28th
3、Research Institute of China Electronics Technology Group Corporation,Nanjing 210023,China)(2 Construction and Development Research Institute,Research Academy of Armed Police Force,Beijing 100012,China)(3 Unit 31001 of PLA,Beijing 100094,China)Abstract:In view of the characteristics of battlefield ta
4、rget-related data,such as massive,heterogeneous,networked distribution,rich connotation and broad application prospect,a battlefield target data association method based on the dynamic ontology is proposed by using the flexible organization characteristics of dynamic ontology.Thus,it can support the
5、 information mining and analysis of battlefield targets in different scenarios.Combined with the practical engineering,the typical dynamic ontology technology are described,and a comparative test is carried out with the large ontology(LO)generation method and the top ontology(TO)generation method.Ex
6、perimental results show that the method can effectively construct the battlefield dynamic ontology,and it is feasible.Key words:battlefield target;dynamic ontology;information correlation analysis0 引 言 对各类战场目标进行数据关联分析的过程是以目标为中心,逐步挖掘和组织与目标相关的历史、实时和预期等要素,包括目标的历史活动规律与活动分析统计情况、当前状态与能力以及战场动向与意图趋势等,通过对这些信
7、息进行融合,形成更高层级的态势估计与威胁估计,支撑威胁量化分析、侦察任务筹划和作战辅助决策等业务。目前,已有专家在战场目标数据关联方面开展实践与应用doi:10.15908/ki.cist.2023.04.009收稿日期:2022-07-24引用格式:刘伟,翟崎,李子,等.基于动态本体的战场目标数据关联技术 J.指挥信息系统与技术,2023,14(4):51-56.LIU Wei,ZHAI Qi,LI Zi,et al.Technology for battlefield target data association based on dynamic ontology J.Command I
8、nformation System and Technology,2023,14(4):51-56.指挥信息系统与技术2023年 8月了研究工作13。研究工作分析可见,战场目标数据关联仍存在以下问题:1)相关数据来源复杂,既有格式化的和易于理解的标准化数据,又有来源于历史积累、实时动态、开源信息和传感器探测等准格式化的数据,还有来自专业人员或专业部门长期围绕相关目标开展的非格式化行业分析数据,这些数据具有实时与非实时相结合以及标准规范不统一等特点,缺乏统一的组织与描述,导致基于目标的战场信息关联组织困难,制约了目标处理效率和效益的提升;2)随着联合作战背景下战场目标跨域关联分析处理的需求日益增
9、长,目标关联涉及的对象、属性、关系和事件等要素维度不断扩展,对网络化环境下的跨域数据应用与信息组织的要求越来越高。战场数据有效关联的本质是促进数据到信息的转换,从而形成相对完善的战场知识管理体系。知识表达是战场知识管理的前提,而作为知识组织模型之一,本体定义了领域术语及其之间的关系,不但能有效表达知识,同时还可解决知识管理中的语义问题46。近年来,本体技术研究取得了进展,如本体构建技术、本体推理技术、本体映射技术和本体集成技术等79,这些技术为本体的应用提供了良好的技术基础。随着科学技术的进步,本体的发展和应用逐渐成熟,但仍有一些问题有待解决,尤其是在复杂情报产品生产领域910。复杂情报产品生
10、成涵盖多个要素,因此构建一个包括所有战场情报要素的复杂情报产品领域本体难度极大,原因如下:1)领域名词数量繁多且描述各异,以机场为例,与机场相关的专业术语有 100个以上;2)涵盖要素类型多,如描述民用机场和军用机场涉及的要素截然不同,需关联的内容差异极大。为适应基于知识表征的目标信息关联处理的要求,本文提出了一种基于动态本体的战场目标数据关联方法(本文方法),在对各类战场目标进行本体描述的基础上,对各类本体进行归纳总结,形成以类为中心的对象,并通过动态适配与按需扩展方式实现本体的实例化与具象化。1 战场目标数据关联系统架构 面对庞大、复杂且丰富的海量数据资源,基于这些数据开展的信息挖掘与组织
11、会直接影响用户的认知和判断,因此需对数据进行建模处理。先将数据抽象成具有上下文背景意义的对象,再为对象赋予相应的操作,最终给用户呈现出战场目标本体。由于本体是根据行业背景、数据特征进行的相对固定并单一的描述,故无法满足数据动态变化和自适应生长的需求。为此,可实现灵活动态适配、派生和衍化的动态本体技术应运而生1112。本文方法在传统的静态或概念描述基础上,以描述战场目标运动特征和变化趋势为出发点,广泛组织各类关联数据,通过信息增强技术动态更新生成战场目标的组成对象、补齐各类属性、挖掘推理相互间关联关系与行为特征等;挖掘目标的时空要素属性,建立基于梯度依次衰减的编码索引机制,实现网络化条件下的数据
12、关联组织,实现数据的所见即所知、所见即所得,提升数据的使用效率。战场目标数据关联的系统架构如图 1所示。战场目标数据关联的系统架构涵盖数据的概念定义、多维组合以及本体映射 3个部分,其中,概念定义是根据数据特征进行的抽象总结,包括数据的元信息提取及概念组织,同时面向应用场景匹配模板完成实体定义;多维组合是对属性进行的细分与刻画,关联相应行为,并提供各类关系的访问接口;本体映射在概念定义和多维组合的基础上进行本体化组织,核心是将各类格式化、非格式化和准格式化等数据进行本体映射,本质是对各类数据进行概念识别和关系组合,形成一个有背景意义的个体。本体生成后,可根据需要构建具体的访问对象,也就是促进数
13、据向信息生成。上述过程中,可根据信息组成进行属性补齐,包括时空、状态和活动等,并根据这些信息开展直接或间接关系的抽取,形成行为活动描述图。2 动态本体构建技术 2.1 动态本体技术基于动态本体的数据访问是一种语义范式,旨在促进并提升各类异构数据源的访问效率13。动态图 1 战场目标数据关联的系统架构52第 14卷 第 4期刘伟,等:基于动态本体的战场目标数据关联技术本体技术提供了对数据存储的便捷支持和面向用户的友好接口,支持从海量分布式异构战场数据中实现目标关联信息的高效抽取,有效突破了战场数据应用瓶颈。基于动态本体的战场目标关联信息组合中,一个动态本体包括对象、属性和关系 3个部分。其中,对
14、象指任何可被建模的战场目标实体,如机场、港口、基地、机舰目标、卫星、车辆和人员等;属性主要是在静态描述的基础上增加了各类动态内容,如机场的历史变化过程、适停机型和保障特征等;关系是挖掘或推演实体与实体间的直接或间接关系,如机场与其他实体间的保障关系、备份关系和调度关系等。2.2 动态本体构建步骤与战场目标分析相关的动态本体建模过程可分为概念定义、关联组合和本体映射 3个阶段,基于动态本体的数据表示模型如图 2所示。动态本体构建包括以下 5个步骤14:1)任务需求解析:若接收的任务需求是通过文本格式输入的,则利用文本分析对其内容进行语料提取和关键词划分,其重点是按该领域的重要术语集或词典确定符合
15、上下文语义条件的关键词列表;若接收的任务需求是通过格式化方式导入的,则按任务分解条件与规则解析任务的相关特征,确定符合实际任务条件的关键词列表。2)任务与领域本体匹配:以需求解析阶段获取的关键词列表为检索条件,先采用 Lucene文本分析与检索引擎,对领域内相关本体的依据和概念建立文本型索引,再分解领域本体内概念间的语义定义距离,并调节产生适当的概念权重,同时根据概念权重建立匹配数值型索引,最后使用 Lucene里的权重指标打分机制,计算可检索领域相关本体的分值,并按分值大小和阈值过滤条件确定直接关联的领域本体资源。3)领域内本体子集过滤:将关键词生成的基本集合列表作为基准,按语义扩展对检索到
16、的直接相关领域本体进行处理;使用层次遍历法处理语义扩展,主要以关键词元为遍历的首点,分别执行向上扩展和向下扩展,将语义距离小于阈值的节点作为保留节点,且为其恢复或重建领域本体内原有关系,最后形成以关键词元为中心的领域本体子集集合。4)领域内本体关系映射:利用本体映射方法对领域本体子集集合中的基本概念、关联关系和规范公理分别计算组织结构、字符/词元以及语义规范的相似度,并对这些相似度进行加权融合,从而建立领域本体节点之间的映射关系,实现领域本体子集集合中的本体关系映射。5)关联本体的迭代组织:采用基于任务领域范畴论的方法和基于形式化概念表征分析的方法对上述步骤确定的本体映射进行处理,从而实现领域
17、本体子集的融合,并通过反复迭代来实现完全动态本体的构建。2.3 动态本体构建示例本节以机场为例,对动态本体及其作用进行描述。传统上对机场类目标主要以静态本体方式描述机场的位置、跑道方向、材质结构和作用等级等15,而基于动态本体的机场目标在关联飞行计划、能力构成、开源动向和专家经验等数据基础上可进一步描述适停机型、起降次数、通信保障方式、保养供给模式、经济地位、人员变化和历史发展脉络等信息,甚至可以直接关联飞行计划以计算出相关航班的起降机场、通联方式和可能的飞行员等信息16。此外,战场体系分析时,动态本体构建技术可辅助生成关键节点和抗毁顽存样式等信息,从而更好地实现基于动态能力计算的筹划推演、临
18、机方案调整与作战效果评估等。针对机场目标,本文给出了传统的和基于动态本体的 2 种目标信息组织方式。其中,传统的目标信息组织方式可阶段性地对目标进行描述17;基于动态本体的目标信息组织方式可全周期、全维度和全领域关联地对目标进行体系描述。图 3给出了针对机场目标的 2种信息组织方式,图 4给出了传统的战场目标数据关联过程,图 5 给出了基于动态本体的数据关联过程。本文以某军事行动为例,产生以下任务:筹划打击某军事机场,确定目标情报分析方案,满足体系破击要求。解析用户需求,使用领域词典和中文分词算法进行分词,从而获得符合检索意图的关键词元图 2 基于动态本体的数据表示模型53指挥信息系统与技术2
19、023年 8月集合为 某,军事机场,目标情报,体系破击。通过任务领域本体匹配,使用检索算法的打分机制对检索结果进行打分,获得分值较高的领域本体,分别为机场领域本体、态势领域本体和目标领域本体。通过领域本体子集界定,使用数据挖掘里的聚类算法18,分别以关键词集合为初始类别对领域本体中的概念进行评分,获得领域本体子集。某机场相关的领域本体示例如图 6所示。通过领域本体子集映射和领域本体子集合并,采用本体映射技术和本体集成技术对领域本体子集进行合并,获得动态本体。基于任务的动态本体构建示例如图 7所示。2.4 动态本体评价由于动态本体在构建过程中能去除部分不相关的要素及其对应关系,因此动态本体更能满
20、足用户需求。本文对动态本体构建模型中要素的数量和质量进行计算分析,并基于计算结果评价动态本体。在要素质量计算方面,通过动态本体中要素与需求的相似度计算,得到相关度指标,记为R。本文利用相似度计算方法,通过计算字符串之间的q、s、r和t值来获得相似度值,这也是一种基于字符串的相似度计算方法。其中,q为存在于信息串Ix和信息串Iy中的内容数量;s为存在于信息串Ix而不存在于信息串Iy的内容数量;r为存在于信息串Iy而不存在于信息串Ix的内容数量;t为不存在于信息串Ix和信息串Iy的内容数量19。信息串相似度Sim(Ix,Iy)与相关度R的计算公式20如下:Sim(Ix,Iy)=q/(q+r+s+t
21、)(1)图 3 针对机场目标的 2种信息组织方式图 4 传统的战场目标数据关联过程图 5 基于动态本体的数据关联过程图 6 某机场相关的领域本体示例图 7 基于任务的动态本体构建示例54第 14卷 第 4期刘伟,等:基于动态本体的战场目标数据关联技术R=1nSim(Ci,T)(2)其中,Ci S;S为动态本体的要素集;T为动态本体的需求;C为亲密度指标,指动态本体中与任务密切相关的要素与所有要素数量之比,公式如下:C=card(Cr)/card(C0)(3)其中,card为集合Cr的元素数量;c为动态本体中的单个要素;Cr=c S|R(c,T);C0=c S。3 试验验证 为了直观描述动态本体
22、的建模过程并验证本文方法的优势,本文选择超大本体(LO)与顶层本体(TO)2种本体生成方法开展比对性试验。LO 指覆盖多领域、细粒度和大规模的本体,LO 生成法利用本体集成技术直接集成领域本体资源以获得 1 个LO 并加以应用21。TO 指由领域本体资源中普遍适用的共同对象构成的本体模型,收录的核心词表可用于描述一套领域对象,在应用过程中可与领域本体资源配套使用22。本文以机场目标为例,分别选取了结构、厚度、位置、跑道和状态 5 个领域本体的部分示例,设定 2 类用户需求来展示动态本体即时构建特性,并对构建的动态本体进行评价。2类用户需求如下:1)任务 1(T1):筹划打击某机场,确定地位的重
23、要性及装备能力。2)任务 2(T2):确定骨干机场位置,满足航路和航线的规划需要。通过用户需求解析,使用领域词典和中文分词算法进行分词,可得到符合检索意图的关键词元集合分别为:T1=机场,地位,装备,T2=机场,航路,航线,规划。通过任务领域本体匹配,采用检索算法中的打分机制对检索结果进行打分,获得分值较高的领域本体分别为结构本体(E1)、位置本体(E2)、能力本体(E3)和装备本体(E4)。通过领域本体子集界定,采用数据挖掘中的聚类算法23对领域本体中的概念进行评分,将T1和T2分别作为初始类别,并在选择概念时设定阈值,以此获得领域本体子集,本文设=0.7。通过领域本体子集映射和领域本体子集
24、合并,采用本体映射和本体集成技术合并领域本体子集,获得动态本体。不同用户需求获得的动态本体是不同的,这体现了动态本体即时构建的特性。针对T1和T2,分别计算了 LO 生成法、TO 生成法和本文方法下的用户需求与本体之间的C与R值。3种方法下 2类任务需求结果如表 1所示。可见,与 LO 生成法和 TO 生成法相比,本文方法与用户需求的关联度更高;与 2类任务结果相比,本文方法的动态本体节点规模更小,即相关度更高。本文试验中,E1、E2、E3和E4 4个领域本体的规模平均约5 0006 000个节点。需说明的是,上述 4 个领域本体构建获得超大本体的规模约 11 00022 000 个节点,构建
25、顶层本体的规模约 7 0008 000个节点,而本文试验中的 2类任务需求下构建的动态本体节点规模约 5080 个节点。4 结束语 本文的基于动态本体的战场目标数据关联方法可处理 PB级的海量异构情报数据,网络化数据处理节点不少于 5 个,动态本体数量涵盖战场目标的所有类型,在任务背景明确的情况下关联率可提高至98%以上。利用本文方法,可促进战场目标从点状的静态性、片段化和单样式的概念描述转化为多目标之间的线性串联、网状互联和泛在关联,实现战场目标信息组织从点到线再到面和体的模式跃升,同时可支撑战场目标认知的知识涌现,辅助指挥员、情报人员和作战人员更充分理解与认知战场目标的历史发展过程、当前能
26、力状态和未来发展变化。为进一步处理海量复杂的异构情报数据,后续需对基于动态本体的数据关联技术进行延伸性研究。参考文献(References):1陈曦,夏宇垠,李娟慧,等.基于特征信息隶属度的目标关联分析技术 J.航天电子对抗,2021,37(2):15-18.2成磊峰,覃锋,贾莹,等.基于时空相似性的跨域目标关联分析方法 J.电讯技术,2019,59(4):426-430.3项威.事件知识图谱构建技术与应用综述 J.计算机与现代化,2020(1):10-16.4刘娇,李艳玲,林民.人机对话系统中意图识别方法综述 J.计算机工程与应用,2019,55(12):1-7.5ZHAO S D,WANG
27、 Q,MASSUNG S,et al.Constructing and embedding abstract event causality networks from text snippetsC/Proceedings of the 10th ACM 表 13种方法下 2类任务需求结果项目LO生成法TO生成法本文方法T1R0.011 50.101 40.726 3C0.017 90.210 70.818 2T2R0.011 30.125 50.799 8C0.016 50.218 00.729 055指挥信息系统与技术2023年 8月International Conference on
28、Web Search and Data Mining.Cambridge:ACM,2017:335-344.6LIU S B,CHENG R,YU X M,et al.Exploiting contextual information via dynamic memory network for event detection C/Proceedings of 2018 Conference on Empirical Methods in Natural Language Processing.Brussels:ACL,2018:1030-1035.7HAN R J,NING Q,PENG N
29、 Y,et al.Joint event and temporal relation extraction with shared representations and structured prediction C/Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing(EMNLP-IJCNLP).Hong Kong:ACL,2
30、019:434-4448高李政,周刚,罗军勇,等.元事件抽取研究综述 J.计算机科学,2019,46(8):9-15.9YANG S,FENG D,QIAO L,et al.Exploring pre-trained language models for event extraction and generationC/Proceedings of the 57th Annual Meeting6 of the Association for Computational Linguistics.Florence:ACL,2019:5284-5294.10 GUO Z,ZHANG Y J,SU
31、 C,et al.Character-level dependency model for joint word segmentation,POS tagging and dependency parsing in ChineseJ.IEICE Transactions on Information and Systems,2016,99(1):257-264.11 冯俐.中文分词技术综述 J.现代计算机,2018(34):17-20.12 吴杰胜,陆奎.基于多部情感词典和规则集的中文微博情感分析研究 J.计算机应用与软件,2019,36(9):93-99.13 朱少华.基于 MLN 的中文事
32、件推理方法的研究 D.苏州:苏州大学,2016.14 LE Q,MIKOLOV T.Distributed representations of sentences and documentsC/Proceedings of the 31st International Conference on International Conference on Machine Learning.Beijing:ACM,2014:1188-1196.15 LIU X,LUO Z C,HUANG H Y.Jointly multiple events extraction via attention-ba
33、sed graph information aggregationC/Proceedings of 2018 Conference on Empirical Methods in Natural Language Processing.Brussels:ACL,2018:1247-1256.16 WANG Z Q,ZHANG Y,CHANG C Y.Integrating order information and event relation for script event prediction C/Proceedings of 2017 Conference on Empirical M
34、ethods in Natural Language Processing.Copenhagen:ACL,2017:57-67.17 李彭伟,李亚钊.面向事件画像的事理图谱构建方法J.指挥信息系统与技术,2021,12(5):54-60.18 张非,马永征,阎保平.LDAP 目录服务在科学数据网格查询服务中的应用研究 J.计算机应用,2003,23(S1):224-226.19 杜然,黄秋兰,阚文枭,等.基于Chord算法的可扩展高性能元数据存储环设计 J.计算机工程,2016,42(8):1-8.20 关丽,程承旗,肖林.全球格网系统的元数据管理模型J.测绘科学,2009,34(1):138
35、-140.21 蒋炎华.计算资源共享平台中非集中式的元数据管理J.计算机应用,2011,31(2):462-465.22 刘帆.关系数据库中实时高效元数据存储算法优化研究 J.科学技术与工程,2017,17(17):255-260.23 周建慧,刘继红,杨海成.面向复杂产品工程知识管理的动态本体 J.计算机辅助设计与图形学学报,2016,28(11):1957-1964.作者简介:刘伟,男(1991),工程师;翟崎,男(1982),高级工程师;李子,男(1984),高级工程师;李东敏,女(1979),高级工程师;李彭伟,男(1983),高级工程师。(本文编辑:马 岚)(上接第 50页)20 黄凡.一种基于方位估计的双站被动声呐航迹关联方法 J.数字海洋与水下攻防,2020,3(5):387392.21 张中科,方青,田明辉.基于纯方位信息的多传感器航迹融合仿真分析 J.舰船电子对抗,2014,37(3):16.22 蒯冲,龚剑扬,那云啸,等.基于极大似然估计的最优航迹融合方法 J .哈尔滨工程大学学报,2003,24(4):419421.作者简介:崔 化 超,男(1986),高 级 工 程 师;宋 筱 轩,男(1986),高级工程师;晏谢飞,男(1980),研究员级高级工程师;王海宁,男(1968),研究员级高级工程师。(本文编辑:李素华)56