收藏 分销(赏)

动车组故障知识图谱构建方法研究.pdf

上传人:自信****多点 文档编号:617172 上传时间:2024-01-17 格式:PDF 页数:6 大小:3.29MB
下载 相关 举报
动车组故障知识图谱构建方法研究.pdf_第1页
第1页 / 共6页
动车组故障知识图谱构建方法研究.pdf_第2页
第2页 / 共6页
动车组故障知识图谱构建方法研究.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 43 卷第 4 期2023 年 8 月铁 道 机 车 车 辆RAILWAY LOCOMOTIVE&CARVol.43 No.42023Aug.动车组故障知识图谱构建方法研究韩子威1,2,朱建生2(1 中国铁道科学研究院 研究生部,北京 100081;2 中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)摘 要 动车组故障分析对动车组事前维修有着重要的意义,利用知识图谱技术对动车组故障信息进行知识管理,可有效地提升动车组故障智能化水平。针对一段时间内复兴号的故障数据进行研究,提出了一种自顶向下的动车组故障知识图谱构建方法。首先对故障数据进行分析,针对数据存在的多源异构的

2、问题,提出动车组故障数据模型。其次将故障数据采用 D2RQ 工具,利用 R2RML 标准将其转化成 RDF 三元组形式。最后通过映射将三元组存入 Neo4j 图数据存储工具中。该知识图谱已经将研究对象中大部分信息进行了映射存储。关键词 动车组故障;故障模型;知识图谱;知识映射;图形数据库中图分类号:U269 文献标志码:A doi:10.3969/j.issn.1008-7842.2023.04.03动车组故障分析是动车组智能运维中非常重要的一道环节。近年来,随着我国铁路移动装备的发展,越来越多的研究者开始关注动车组的故障分析。在动车组故障的相关研究中,研究者大多倾向于使用故障树的方式对故障进

3、行诊断1。故障树是一种由上往下单一方向的存储结构,具有很强的逻辑性,但缺乏对故障之间隐藏的关联的挖掘和展示。并且动车组装备大多数故障是多因素、多层次共同作用导致的结果。针对某个动车组故障现象来说,可能是由于多个故障影响因素造成,而针对某一故障原因,也可能出现多个故障现象。例如动车组高压系统故障现象为高压系统无法工作,故障产生原因可能是检测系统检测空开断开、检测系统检测 21-K42 继电器失电、检测系统检测 21-K67 继电器得电,检测系统检测 21-S06 按钮动作等多个原因造成。而对于检测系统检测空开断开这一故障原因,有可能会出现隔离开关无法工作、高压系统无法工作等多个故障现象。其各个故

4、障现象与故障模式、故障原因、故障影响因素构成了庞大的知识体系网络。仅通过故障树分析,难以全面地描述故障信息及其之间的关联规则和推导过程。同时,检修车间排故专家积累的大量案例经验也没有被有效地共享。关于知识图谱的研究,目前国内外研究与应用发展迅速。一般地,将知识图谱分为通用知识图谱及领域知识图谱2。通用知识图谱包括国外的 DBpedia、YaGo 等,国内的百度知心、CN-DBpedia 等。领域知识图谱在国内仍大多数处于学术研究范围。例如冯钧等人总结了现有领域知识图谱的研究现状,提出了在水利领域的应用3。喻凡坤等人采用自底向上和自顶向下融合的方式构建了基于无人系统的知识图谱,用于军事的智能搜索

5、与智能问答应用4。针对上述存在的问题,文中深入研究了动车组故障数据,构建领域知识图谱框架,对历史多源故障进行映射,将历史故障数据转化为有价值的知识,从而探索各故障之间的关联关系,并将知识与关系可视化。1 动车组故障数据分析 随着工业生产智能化水平的提高,动车组系统结构越来越复杂,仅凭故障表象很难快速定位故障零部件,并确定故障模式及原因。从而检修时间成本和难度大幅提升,大幅降低了生产效率。同时,动车运用所车间多年累计的故障案例、专家文章编号:1008-7842(2023)04-0017-06引用格式:韩子威,朱建生.动车组故障知识图谱构建方法研究J.铁道机车车辆,2023,43(4):17-22

6、.基金项目:中国铁道科学研究院集团有限公司青年专项(2021YJ182)作者简介:韩子威(1992-)男,博士研究生(修回日期:2022-08-26)铁 道 机 车 车 辆第 43 卷 经验和每天采集的故障数据不能被有效地利用和共享。动车组故障数据来源于车载数据、库内检修数据、轨旁监测数据、试验数据等5。目前,故障数据主要包括乘务日志 181 故障、库内检修故障、质量鉴定(部级、局级和段所级)故障、质检返修故障、车载信息无线传输系统(WTDS)故障、地面安全监测系统故障和检修设备系统故障。各个故障来源分散于各个系统中,并且命名不规范,不利于运维人员利用,尚未形成统一的故障多源分析。动 车 组

7、故 障 数 据 存 在 于 各 个 分 散 的 系 统 之中,由于各系统设计理念不同、应用功能不同、结构体系不同。各个系统数据及数据标准存在严重的不一致性。我们将各个系统产生的故障数据进行调研发现,从数据内容来看,除了常见的动车组状态信息、故障现象、故障原因等,各系统均有特有字段。例如行车故障管理中,使用者更关注是否影响了运营情况,增加了是否影响后续列车、停开类型、是否启用热备车等字段。而在检修故障管理中,使用者关注故障的处理情况,增加了是否为遗留故障、是否为惯性故障、故障质检结果等字段。从数据结构来看,包括结构化数据,如动车组车型车号、配属局段、运行区间、故障编码、故障级别等;半结构化数据,

8、如故障模式、解决方案、故障原因、紧急处理措施等;还有非结构化数据,如故障处理报告等。从数据收集频次上来看,包括每日收集,如检修故障;每小时收集,如运行故障,每分钟收集,如监测检测故障。从数据采集方式来看,分为人工录入、直接采集、监测检测设备转发等方式。因此,亟需一套综合性数据抽取及融合技术方案。2 动车组故障知识图谱构建 动车组故障知识图谱是指由动车组实际发生的故障案例知识实体和这些案例实体之间的某种二 元 关 系 所 构 成 的 动 车 组 故 障 案 例 的 知 识 网 络库。知识图谱的构建分为自底向上和自顶向下 2种方式6。针对动车组故障知识图谱,因为业务需求固定,并且数据存储于结构数据

9、库中,数据质量较高,所以采用自顶向下的模式。即先定义概念模型,再将实体即其关系填写到知识图谱中7。动车组故障知识图谱构建过程包括领域概念建模、故障数据映射、故障知识管理等步骤。2.1动车组故障领域概念建模由 于 采 用 自 顶 向 下 的 模 式 构 建 故 障 知 识 图谱,应根据动车组故障领域专家经验构建概念模型,包括概念、概念属性、概念间的层次关系。定义“实体属性属性值”、“概念关系概念”以事件为核心的知识图谱模型8。实现对故障概念、实体、属性的表示,还可以对动态影响因素、故障事件组合进行表示。通过“名词+动词”的知识表示方法来描述故障事件。为后续知识的抽取与融合提供对应的规范。依据动车

10、组运维管理的特点,文中对动车组故障信息进行模型化处理,建立了标准化、多维度描述的故障模型。故障模型将动车组故障相关信息要素按照故障主体、故障发现、故障处理、故障分析、故障解决方案分层归类,并使用统一标准语言将这些信息格式化,是描述动车组故障关键核心 信 息 的 集 合。对 运 行 影 响 较 大 的 行 车 设 备 故障,需在故障发现层及故障分析层补充更多的信息。动车组故障模型组成结构如图 1 所示,通过故障领域概念模型的建立,就可以将多源异构故障按照固定的规则进行收集汇总。故障模型的构建是基于动车组故障事件已发生的事实,组成故障的特征信息必须是客观发生和存在的。文中的动车组故障模型仅适用于故

11、障已经发生的状态,不涉及对动车组部件及产品可靠性、故障模式、故障影响等因素的潜在性及预见性失效分析。故障模型的特征信息必须是客观发生且可验证的,或是通过技术手段采集获取的,或是基于前 2 点信息科学合理地分析得到的。通过故障模型的构建,我们将多源异构的故障数据进行了模型化,并按照此模型,统一将各来源的数据抽取到关系型数据库中进行存储。2.2知识映射知识映射是指从各个系统中存储的动车组故障数据进行人工或自动映射到故障模型。由于动车组故障案例数据虽然散落在各个系统中,但大部分都存储在 Oracle 关系数据库(RDB,Relational Database)中。因此文中采用基于模式的数据映射机 制

12、 完 成 从 关 系 数 据 库 转 化 为 资 源 描 述 框 架(RDF,Resource Description Framework),RDB2RDF。为了规范化 RDB 转换成 RDF,W3C 制定了 2个映射语言的标准,第 1 个为“Direct Mapping”(A 18第 4 期动车组故障知识图谱构建方法研究Direct Mapping of Relational Data to RDF)即为直接映射。直接映射基于约定的规则,将数据库中的表作为实体,数据表中的列作为属性,行作为一个实例。这种映射的优势在于规则简单、执行便捷。缺点是不能把数据库的数据映射到我们定义的模型 上。第 2

13、 个 为“R2RML”(RDB to RDF Mapping Language),它支持用户设置映射规则,具有较高的灵活性9。文中采用 D2RQ 工具,利用 R2RML 标准,对 RDB 数据表中的数据转化为 RDF。D2RQ 提供了基于 RDF 的访问模式,但不需要把数据以 RDF 的形式存储。它的一个重要特性是以 虚 拟 RDF 图 的 方 式 访 问 关 系 数 据 库。使 用D2RQ 针 对 关 系 数 据 库 生 成 Mapping 文 件,通 过Mapping 文件,D2RQ 将关系数据库中的数据转化为 RDF 三元组形式。D2RQ 映射机制中最重要的 2 个概念为 d2rq:Cl

14、assMap 和 d2rq:PropertyBridge。其 中 d2rq:ClassMap 标识为一个或一组相似概念的类,一般来讲,会映射到关系数据库中的一张表。d2rq:PropertyBridge 标识为 Class 中的属性,一般来讲,会映射到关系数据库中某个表的一列数据。d2rq:ClassMap 可以被描述为式(1):d2rq:ClassMap:d2rq:Class,d2rq:UriPattern(1)式 中:d2rq:Class 为 该 ClassMap 对 应 的 一 个 类;d2rq:UriPattern 为一个 URI 模板,用来生成实例化资源的正式 URI。d2rq:Pr

15、opertyBridge 可以被描述为式(2):d2rq:PropertyBridge:d2rq:belongsToClassMap,d2rq:property,d2rq:column,d2rq:refersToClassMap(2)式 中:d2rq:belongsToClassMap 为 该 PropertyBridge属于的 ClassMap;d2rq:property 为该 PropertyBridge所对应的属性;d2rq:column 为该 PropertyBridge 对应 的 数 据 表 列 项;d2rq:refersToClassMap 为 该PropertyBridge 引用

16、了其他的 ClassMap,此属性的属性值不在该 ClassMap 的数据表中,而是在引用的ClassMap 的数据表中。一般地,会配合 d2rq:join 标识关联条件使用,d2rq:refersToClassMap 类似于数据表中的外键,而 d2rq:join 类似于 SQL 语句中的where 条件语句。根据上述映射机制以及动车组故障案例中的概念逻辑关系,构建映射实例结构,实例中部分内容如图 2 所示。其中,设定的 2 个 ClassMap 分别是标识动车组的 TrainSet 和动车组功能分类的 SysFunc。在 TrainSet 中包括 4 个 PropertyBridge,分别为

17、车次号、车型、车组号、功能分类编码。这 4 个属性 的 属 性 值 分 别 对 应 数 据 表 中 s_carno、s_trainsettype2、s_trainsetid、s_sysfunctionid 这 4 列数据。其中功 能 分 类 编 码 refersToClassMap 动 车 组 功 能 分 类SysFunc。根据动车组故障部分数据映射关系图,可以将 关 系 型 数 据 库 表 中 的 数 据 可 以 转 化 为 三 元 组实体,属性,属性值的形式标识,部分内容如图 3图 1动车组故障模型组成结构19铁 道 机 车 车 辆第 43 卷 所示。其中,上半部分表格为关系型数据库中的数

18、 据 表,其 中 包 括 对 应 的 数 据 行 和 属 性 列,为D2RQ 的输入部分。下半部分表格为通过映射产生的 RDF 三元组数据集。通过 D2RQ 服务将关系数据库中的数据表,按照故障模型进行映射,形成三元组。将数据库中的扁平化数据转变为网状结构化数据,丰富了知识图谱中知识实体与属性。2.3故障知识管理通过映射获得的三元组需要在图谱构建工具中进行存储管理。在图谱构建工具中,Neo4j 拥有多种优点,包括完整的 ACID 支持、高可用性、轻易扩展到上千万级别的节点和关系、通过工具可以高速检索数据9。Neo4j 使用 Cypher 语言,用法直观。并且可以快速集成到任何应用中。基于以上优

19、点,文中选择 Neo4j 作为图谱构建工具。Neo4j 中 存 储 2 类 数 据:节 点(node)和 边(edge)。节点是实体,例如人物、动车组或其他具体事物。边是连接节点的概念、事件或事物。将数据用边连接起来分布到不同的节点上,构建知识 图 谱 才 是 有 意 义 的。节 点 和 边 都 可 以 拥 有 属性。例如节点代表动车组,动车组可以拥有车号、车型等属性。而边的属性可以描述 2 个动车组之间的关系是何时建立的,关系的性质等等。Neo4j 官方只介绍了 CSV 导入方法。将三元组导入到 Neo4j 中,仍使用映射的方式。上文方法得到的三元组均是实体,属性,属性值的形式。我们可以将实

20、体和属性值作为 Neo4j 数据库中的节点,属性作为关系进行存储;但这样存储会导致所有一一对应的字典表中冗余节点增多。例如功能分类 ID 为 5311 在字典表中仅对应牵引电机。所以制定规则 1:三元组的主体映射为节点;规则 2a:若属性值与主体为一一对应的关系,则三元组中属性作为主体的一个属性名,属性值为该属性名的值;规则 2b:若属性值与主体不为一一对应的关图 2动车组故障部分数据映射关系图图 3动车组故障部分数据 R2RML 转换图20第 4 期动车组故障知识图谱构建方法研究系,建立属性值为节点,属性为关系。基于以上 3条规则,可以将三元组映射为 Neo4j 中的节点和关系,如图 4 所

21、示。2.4故障知识图谱实现基于上述方法,我们将一段时间内的复兴号动车组故障按照故障模型的方式进行了梳理,按照故障发现层、故障主体层、故障处理层分类后进行映射。构建的图谱实体类型包括故障发现信息类、故障处理信息类、动车组车辆信息类、铁路局信息类、职工信息类、结构分类类、故障模式类等共 10 个。其中,故障发现信息类 1 964 个节点,故障处理信息类 33 个节点,结构分类类 87 个节点,功能分类类 96 个节点,故障模式类 85 个节点等。所构建的知识图谱节点间的关系类型共计 9 个。其中动车组故障发现关系 1 964 个,动车组故障处理关系 571 个,动车组结构分类关系 345 个,结构

22、分类故障模式 141 个,故障模式处理方式109 个等。由于知识图谱中节点和关系内容较多,为了展示效果更清晰,文中选取了一部分知识图谱的内容进行可视化展示,如图 5 所示。文中以“清洁”这种处理方式为检索语句,首先检索出所有处理方式为“清洁”的故障模式,图中粉色圆形表示“清洁”这 种 处 理 方 式;黄 色 圆 形 表 示 对 应 的 故 障 模式,如堵塞、脏污、漏油等;随后检索出这些故障模式对应的故障部件,图中以绿色圆形表示对应故障部件,如构架、车外标记、过滤器等;随后检索出对应的故障部件对应的车组信息,图中以蓝色圆形表示。利用知识图谱,可以在图中清晰地看到目前有 6 种故障模式对应的处理方

23、式为清洁。对应同一故障模式,如附着异物,轴装制动盘、构架均可能附着异物。针对构架附着异物的故障,可以看到有众多动车组都发生过这样的故障。动车组故障知识图谱明显地改善了故障知识的组织方式,有利于挖掘一类故障处理方式、故障模式等存在的关联关系。该知识图谱已经将原始文档中大部分信息进行了映射存储,实现了动车组故障知识图谱的构建。3 结论 故障管理是动车组运维的核心组成部分,文中结合动车组故障多年来存在的问题,提出了动车组故障模型,对多源异构的故障数据进行模型化处理。借鉴其他领域知识图谱的成功经验,提出面向动车组故障的知识图谱构建方法。利用此方法,使用 D2RQ 工具将动车组故障信息映射为三元组,并构

24、建了动车组故障知识图谱。知识图谱图 4动车组故障部分数据 R2RML 存入 Neo4j 效果图21铁 道 机 车 车 辆第 43 卷 这种组织方式对动车组故障的整合利用率有了极大的提高,有利于多角度多维度地对一类故障进行分析。未来可以利用不断产生的故障数据,进行动态知识更新,进一步扩大知识图谱。从而形成完整的动车组故障知识体系,更好地服务于智能化应用。并且,利用知识图谱提供的知识基础,在智能推荐、智能问答等方向继续进行应用研究。参考文献1 赵 倩.数控设备故障知识图谱的构建与应用J.航空制造技术,2020,63(3):96-102.2 张 秀.复杂工程科技领域视角下的知识图谱构建方法J.知识经

25、济,2019(8):46-47.3 冯 钧,杭婷婷,陈 菊,等.领域知识图谱研究进展及其在水利领域的应用J.河海大学学报(自然科学版),2021,49(1):26-34.4 喻凡坤,胡超芳,罗晓亮,等.无人系统故障知识图谱的构建方法及应用J.计算机测量与控制,2020,28(10):66-71.5 杨 晨.动车组多源故障管理平台设计J.铁路计算机应用,2021,30(4):36-39.6 刘烨宸,李华星.领域知识图谱研究综述J.计算机系统应用,2020,29(6):1-12.7 王仁武,袁 毅,袁旭萍.基于深度学习与图数据库构建 中 文 商 业 知 识 图 谱 的 探 索 研 究 J.图 书

26、与 情 报,2016(1):110-117.8 朱国丞.基于大数据平台的知识图谱存储访问系统的设计与实现D.南京:东南大学,2018.9 刘 冰.基于知识图谱的网络空间资源关联分析技术研究D.武汉:华中科技大学,2019.Research on Construction Method of EMU Failure Domain Knowledge MapHAN Ziwei1,2,ZHU Jiansheng2(1 Postgraduate Department,China Academy of Railway Sciences,Beijing 100081,China;2 Institute o

27、f Computing Technology,China Academy of Railway Sciences Corporation Limited,Beijing 100081,China)Abstract:Failure analysis of EMU has great significance to the pre maintenance of EMU.The knowledge management of EMU fault information by using knowledge map technology can effectively improve the inte

28、lligent level of EMU fault.Based on the fault data of Fuxing train for a period of time,a top-down fault knowledge map construction method of EMU is proposed.Firstly,the fault data is analyzed.Aiming at the problem of multi-source and heterogeneous data,the data model of EMU fault domain is proposed

29、.After that,the fault data is transformed into RDF triples by using D2RQ tool and R2RML standard.Finally,the triples are stored in Neo4j graph data storage tool through mapping.The knowledge map has mapped and stored most of the information in the research object.Key words:EMU fault;fault model;knowledge map;knowledge mapping;graphic database图 5动车组故障部分数据在 Neo4j 中展示效果图22

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服