收藏 分销(赏)

生物医学领域基于知识图谱的知识发现方法综述.pdf

上传人:自信****多点 文档编号:3020421 上传时间:2024-06-13 格式:PDF 页数:7 大小:1.24MB
下载 相关 举报
生物医学领域基于知识图谱的知识发现方法综述.pdf_第1页
第1页 / 共7页
生物医学领域基于知识图谱的知识发现方法综述.pdf_第2页
第2页 / 共7页
生物医学领域基于知识图谱的知识发现方法综述.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、生物医学领域基于知识图谱的知识发现方法综述梅佳月孙佳侯跃芳(中国医科大学健康管理学院沈阳 )摘要目的 意义 综述生物医学领域基于知识图谱的知识发现方法,为科研人员提供参考。方法 过程通过系统检索及阅读分析相关文献,总结基于知识图谱的知识发现方法,对比各类知识发现方法的优势和不足;指出现阶段生物医学领域基于知识图谱的知识发现方法的局限性和挑战,并提出建议和展望。结果结论 未来研究应提升知识发现结果的可解释性,构建有效的结果评估框架,建立规范化、多领域专家协同的知识发现流程,提高知识发现研究的质量和效率。关键词生物医学;知识图谱;知识发现 中图分类号 文献标识码 ,;修回日期 作者简介梅佳月,硕士

2、研究生;通信作者:侯跃芳,博士,教授,硕士生导师。基金项目辽宁省教育厅科学研究经费项目(人文社科类基础研究项目)(项目编号:)。引言随着科学技术的飞速发展,生物医学领域不断进步,大量科研文献随之产生。截至 年 月,包含的生物医学文献已超过 万篇 ,其中包含大量未被发现的有价值的知识信息。如何依据日益增加的现有知识数据进行隐含知识发现,医学信息学杂志 年第 卷第 期 ,是当前生物医学领域数据挖掘的重要研究内容。知识图谱本质是语义网知识库,由实体和实体间的关系构成知识网络,形成直观且易于理解的知识结构框架 。知识图谱能够对大量多源异构的医学信息进行有序化组织,有效关联和管理数据,从而提高海量医学数

3、据的利用价值 。在生物医学领域,知识图谱在临床决策支持、文献可视化分析、智能问答、智能检索等方面已得到广泛应用 。知识发现是从大量数据中提取出有用新知识的过程 。利用知识图谱进行知识发现可以从海量数据中挖掘深层次的潜在知识关联,为生物医学领域科研人员提供建议和参考。本文综述了基于知识图谱的知识发现方法,总结分析各方法的优势和不足,并针对现阶段生物医学领域知识发现方法存在的局限性提出建议和展望。基于知识图谱的知识发现方法医学知识图谱聚焦生物医学领域,将大量复杂的生物医学数据以网络形式存储与组织,实现大规模医学数据的有效管理。知识实体之间不仅可以通过关系直接关联,还可以通过多个知识实体和关系间接关

4、联起来,进而产生深层次的隐含知识,知识发现能够从知识图谱中挖掘出这种隐含的新知识。目前,生物医学领域基于知识图谱的知识发现方法主要包括知识推理、路径发现、链路预测和基于神经网络的发现方法。知识推理 基于规则的知识推理根据技术手段可将知识推理分为基于规则的知识推理和基于人工智能的知识推理。于 年首次提出了一种 模型,即当两类不存在直接相关关系的知识实体 和 同时与另一个知识实体 相关时,通过推理可得 与 之间存在潜在关联。知识推理与 模型同理,是指领域专家根据实体类型和语义关系类型,结合专业知识,定义知识推理规则,构建规则库,实现知识推理。本文定义的推理规则之一:如果已知药物 抑制靶点 ,靶点

5、促进肿瘤,那么可以认为药物 可能治疗肿瘤 。早期经典的 模型在数据量较小、实体关联较为简单清晰时取得了较好效果。等 构建了“沙利度胺(药物)白细胞介素 (免疫途径)疾病”规则来推断沙利度胺的治疗应用。陈延雪等 人工构建推理规则,挖掘突发事件知识图谱中的隐含关系。利用 模型得到的知识发现结果准确性较高,可理解性较强,适用于小型数据集,但是推理发现的范围不够广,结果存在一定局限性。人工构建推理规则也存在成本较高、不适用于动态变化的知识图谱、迁移性较差等缺陷 。基于人工智能的知识推理除了领域专家人工构建推理规则外,还可以通过机器学习等方法自动从知识图谱中挖掘归纳规则和特征,完成推理。该方法克服了人工

6、定义规则带来的成本高等缺点,在小规模知识图谱中表现出较好推理效果 。等 提出一阶规则学习算法,将知识图谱中的全部关系分别形成集合,以此作为特征来预测实体之间是否存在关系。等 提出一种关联规则挖掘算法(,),依次学习预测每种关系的规则,并利用这些规则进行预测,实现知识发现。付子轩等 构建了急腹症知识图谱,采用“随机游走”算法实现更加准确有效的知识推理进而补全知识图谱。等 构建了一个基于规则的框架算法,利用该框架探索潜在的药物相互作用机制。路径发现 基于规则的路径发现为了解决 发现模型的局限性,等 提出了 框架,其中 (,)表示 和 中的多个中间实体。与 模型同理,路径发现从复杂的知识网络中发现有

7、价值的关键路径,但不同的是,路径发现可以挖掘较为复杂的实体间关系。等 定义了 多跳路径,认为 表示从实体 到实体是由 个关系连接的 个实体,通过路径能医学信息学杂志 年第 卷第 期 ,够寻找可能存在的实体关联。胡正银等 利用 的多深度关系节点查询,通过自定义路径长度,挖掘出若干条知识路径,发现“疫苗()”和“胎盘生长因子()”除了能直接通过“恶性肿瘤()”进行关联外,还可以通过“白血病,细胞(,)”“癌症治疗()”等 知 识 实 体,通 过“治 疗()”“共现()”“使用()”“相关()”等关系词进行关联,并发现两条路径具有一定的启发意义,见图 。图 关联路径示例除此之外,还有学者运用路径发现

8、方法进行知识发现。等 提出了“药物补充剂 基因 药物”“药物补充剂 基因 功能 基因 药物”等路径,用于发现药物 补充剂相互作用。等 将“神经乳糖酰胺”作为路径的头节点,将“动脉硬化”作为路径的尾节点,寻找基因、药物或细胞等中间实体,并通过排序挑选出最有可能具有生物学意义的相关实体。路径发现方法可以挖掘深层次知识,结果较为全面,同时也存在路径较长会导致可解释性较差的缺陷,因此选择合适的路径长度是路径发现方法的关键。基于人工智能的路径发现对于长路径的知识发现,有专家利用人工智能方法进行研究。路径排序算法(,)是一种典型的自动挖掘路径规则算法。该算法将两个实体之间的多条序列路径作为特征,输入 回归

9、模型实现推理 。等 提出了一种基于关系路径特征嵌入的卷积神经网络,运用 从知识图谱中提取疾病 药物关系路径特征,利用经过训练的模型挖掘新的治疗药物。等 利用 挖掘苍耳子化合物与糖尿病之间的有效路径,得到治疗糖尿病的潜在药物。为提高 路径搜索的效率和知识发现效果,还有学者提出耦合路径 排 序 算 法(,)、增强链接预测(,)等改进算法。链路预测链路预测通过各种算法计算两个知识实体之间的紧密程度和相似性,进而预测其产生关联的可能性 。链路预测是一种基于知识图谱进行知识发现的重要方法。常见的用于知识发现的链路预测指标可以分为以下 种 。基于局部信息的相似性指标基于局部信息的相似性指标一般通过节点局部

10、信息计算得出。这类指标算法比较简单,适合大规模网络应用,但是计算涉及信息量有限、预测精度较低。常见的基于局部信息的相似性指标包括共同邻居指标(,)、含权的共同邻居指标(,)、指标()、含权的 指标(,)等。其中,、等指标只考虑节点相似性,而 、等含权指标在此基础上还考虑了边的权重,在预测性能方面更有优势。等 通过使用 、等指标对医学主题词表(,)网络进行链路预测,发现 指标性能最佳。马代川等 分析药物 蛋白相互作用网络结构特征,运用链路预测实现药物重定位。基于路径的相似性指标基于路径的相似性指标主要有 个,分别是局部路径指标(,)、指标和 。基于局部路径的相似性指标是在 的基础上提出来的,指标

11、考虑两个节点之间的二阶路径,而 考虑三阶路径 。指标 相当于考虑全部路径的 指标。的原理是如果 和 两个节点中任一邻居节点 与另一节点相似,那么节点 和节点 相似。等 开发了基于 指标的预测模型,预测长链非编码核糖核酸(,)与环境因素之间的潜在关系,预测结果较好。袁华兵等 提出了一种基于多关系路径的链路医学信息学杂志 年第 卷第 期 ,预测方法,并将其与 、等 种链路预测算法进行对比分析,获得更为精确的结果。基于随机游走的相似性指标随机游走实际上是一个马尔可夫过程,认为随机游走粒子每一步都可以移动到任一邻居节点,且移动到每一个节点的概率相等 。基于随机游走的相似性指标包括基于全局随机游走和局部

12、随机游走,全局随机游走指标包括平均通勤时间(,)、重启随机游走(,)、等,局部随机游走指标包括局部随机游走(,)、有叠加效应的局部随机游走(,)等。等 基于 指标提出一种预测模型,以结直肠癌为实例预测微小 (,)与疾病之间的关联,结果表明该模型效果较好。等 基于 指标提出了一种 指标,预测冠心病临床用药的联合使用,结果证明该指标具有较强预测能力。基于神经网络的发现方法神经网络是通过大量数据训练来求解某个问题的算法。知识图谱中基于神经网络的知识发现能够对复杂非线性关系进行建模,深入学习语义三元组的结构特征和语义信息,实现实体和关系的有效预测。目前在基于知识图谱的知识发现中,基于循环神经网络(,)

13、、卷积神经网络(,)和图神经网络(,)的方法应用较为广泛。基于 的发现方法 是一种基于循环结构提取知识序列特征的模型,通过输入知识路径结构或实体文本描述进行预测。陆洪钰 基于 模型提出一种神经网络推理模型(,),能够适应知识图谱中不断更新的动态知识推理以及缓解模型可解释性差等问题。等 提出一种基于知识的循环神经网络(,)模型算法,从脑瘫知识图谱中提取诊断知识,具有一定通用性,同时在性能方面也更具有竞争力。基于 的发现方法通过卷积操作获取知识局部特征来预测图谱中缺失的关系。等 提出一种结合知识图谱和深度学习的加权 模型,该模型大大提高了水质预测效果。刘禹琪 利用基于深度学习的卷积神经网络模型 (

14、)对中医名方知识图谱中药物与疾病之间的隐含关系进行预测,实现知识图谱补全。基于 的发现方法将图谱中节点和关系的图形结构和节点内容信息作为输入进行训练,从知识图谱中提取拓扑结构特征进行预测,实现知识发现。该方法能够同时考虑知识图谱的语义信息和结构信息,逐渐成为热门研究方法 。黄紫阳 利用节点类型感知的多关系图神经网络学习知识图谱中的药物特征,挖掘图谱中复杂的语义关联模式,实现了药物 药物相互作用预测。等 在 基础上设计了一种多关系图注意力网络模型来优化知识图谱补全工作,该模型考虑了不同节点的权重影响,优化了网络结构,显著提高预测性能。基于知识图谱的知识发现方法对比上述各种知识发现方法中,知识推理

15、规则的路径较短,发现结果的准确性和可解释性均存在一定优势。路径发现方法挖掘较长路径,能够发现更深层次的隐含知识,同时路径越长其准确性和可解释性就越差。链路预测简单、高效,但这类方法往往容易忽略节点之间的语义关系。基于神经网络的发现方法具有强大的特征捕捉能力,效果较好,但由于整个过程由算法训练得出,仍存在解释性不足等问题。随着科学技术的发展和进步,越来越多学者运用深度学习等方法对知识图谱进行发现和挖掘,其中不乏深度学习与传统推理相结合的研究。总体来看,利用人工智能的知识发现方法往往具有更高效率,在处理大规模知识图谱时更有优势,但仍然存在可解释性较差等不足,见表 。医学信息学杂志 年第 卷第 期

16、,表 基于知识图谱的知识发现方法对比知识发现方法具体方法优势不足代表文献知识推理基于规则的知识推理结果准确性较高,可理解性较强依赖领域专家的专业知识,推理规则难以归纳 等 基于人工智能的知识推理自动挖掘推理规则,节省人工成本规则学习搜索空间大,效率低;发现深度有限,适用于小型数据集 等 路径发现基于规则的路径发现能够挖掘深层次的隐含知识路径越长可解释性越差胡正银等 基于人工智能的路径发现自动挖掘推理路径,为知识发现节省时间和人力成本难以处理关系稀疏的数据 等 链路预测基于局部信息的链路预测计算简单,具有较好的普适性预测精确度有限;忽略网络结构,效果相对一般 等 基于路径的链路预测利用更多的网络

17、信息,效果相对较好忽略网络结构袁华兵等 基于随机游走的链路预测发现结果的精确度高无法准确预测边的语义信息 等 基于神经网络的发现方法 、具有强大的特征捕捉能力;减少人工参与所带来的知识偏见和限制神经网络结构相对复杂,模型难以训练;可解释性较差黄紫阳 讨论基于知识图谱的知识发现能够全面、深入地对知识信息进行挖掘,发现有价值的潜在信息,为科研人员提供线索和参考。本文聚焦生物医学领域,阐述基于知识图谱的知识发现方法研究进展,对比分析此类方法的优势和不足。目前此类方法仍在不断革新,知识发现效果也趋于更加准确与高效。针对现有方法的局限性提出以下建议。提高知识发现结果的可解释性基于 模型构建的知识推理规则

18、清晰且容易解读,而后来的 模型路径较长,构建推理规则存在一定困难,导致知识发现结果的可解释性较差。链路预测往往只能判断两个节点的相似性,而不能给出具体语义关系。深度学习的整个过程由算法训练得出,因此仍然存在解释性差的缺陷。未来应继续思考如何提升知识发现过程及结果的可解释性。探寻更加有效的结果评估方法目前知识发现结果的常见评估方法有基于 模型的闭合式验证、基于证据的评估方法 、时间片划分法 和专家评估法 等。本课题组基于 模型,通过探寻两个知识实体之间的共同相关节点进行闭合式验证 ,这种评估方法与基于证据的评估方法均比较容易实现,但需要耗费大量人力且通用性较差;时间片划分法只能评估已经发现的知识

19、,无法对新发现的知识进行验证;专家评估法的评估效果仍然存在人工影响。以上评估方法均存在一定不足,构建一个科学可靠的金标准数据集是解决知识发现评估问题的关键。降低专家参与的执行难度生物医学领域专业性较强,因此在知识发现过程中,除了数据专家和情报专家的分析外,还需要生物医学领域专家提供专业知识。然而不同领域专家对领域知识发现的了解程度不同。未来需要确立一套多领域专家协同的统一知识发现流程,为各领域专家建立规范可量化的执行标准,提高知识发现研究的准确性。结语随着生物医学知识数量的不断增长,大规模知医学信息学杂志 年第 卷第 期 ,识图谱将成为研究趋势。如何优化知识发现方法,提高模型效率,增强知识发现

20、结果的准确性和有效性是研究的重点和难点。未来研究中,建议提升知识发现结果的可解释性,构建有效的结果评估框架,规范化、多领域专家协同的知识发现流程,从而提高知识发现研究整体效果。利益声明:所有作者均声明不存在利益冲突。参考文献 :谭玲,鄂海红,匡泽民,等 医学知识图谱构建关键技术及研究进展 大数据,():范媛媛,李忠民 中文医学知识图谱研究及应用进展 计算机科学与探索,():胡红娟,周阳,匡泽民,等 医学知识图谱应用研究进展 医学信息学杂志,():唐晓萍 数据挖掘与知识发现综述 电脑开发与应用,():,():,:,():陈延雪,杨长春,葛天一,等 基于知识推理的医疗应急响应机制研究 小型微型计算

21、机系统,():蒋川宇,韩翔宇,杨文蕊,等 医学知识图谱研究与应用综述 计算机科学,():田玲,张谨川,张晋豪,等 知识图谱综述 表示、构建、推理与知识超图理论 计算机应用,():,:,?,():付子轩,周鹏,任海燕,等 基于知识图谱的中西医结合急腹症诊疗推理分析 中国实验方剂学杂志,():,:,:,:,胡正银,刘蕾蕾,代冰,等 基于领域知识图谱的生命医学学科知识发现探析 数据分析与知识发现,():,:,():,():董文波,孙仕亮,殷敏智医学知识推理研究现状与发展 计算机科学与探索,():,():,():,:,陈钦况,陈珂,伍赛,等关于主动学习下的知识图谱补全研究 计算机科学与探索,():,医

22、学信息学杂志 年第 卷第 期 ,:,():吕林媛,周涛 链路预测 北京:高等教育出版社,():,():马代川,罗代兵 基于网络链路预测的药物分子重定位研究 化学研究与应用,():张月霞,冯译萱 链路预测的方法与发展综述 测控技术,():,():,():王林,商超 无标度网络中的链路预测问题研究 计算机工程,():,:袁华兵,刘敏,杨延庆 知识图谱中基于多关系路径的链路预测方法 电子测量技术,():李栋基于网络结构的链路预测方法研究 沈阳:沈阳航空航天大学,():,():,:,(),():,:,():陆洪钰基于逻辑规则与深度学习的知识推理算法研究 西安:西安电子科技大学,:,():,():刘禹琪中医名方知识图谱构建与链路预测模型的研究及应用 长春:东北师范大学,孙水发,李小龙,李伟生,等 图神经网络应用于知识图谱推理的研究综述 计算机科学与探索,():黄紫阳基于生物医学知识图谱和药物分子结构的药物 药物相互作用预测 武汉:华中农业大学,:,:,:,():郎宇翔 基于图神经网络的文献知识发现研究 北京:中国科学院大学(中国科学院文献情报中心),():,():孙佳 基于网络链路预测与路径发现的药物 疾病知识发现研究 沈阳:中国医科大学,医学信息学杂志 年第 卷第 期 ,

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服