收藏 分销(赏)

知识图谱在医疗领域的构建及应用_刘月.pdf

上传人:自信****多点 文档编号:608253 上传时间:2024-01-12 格式:PDF 页数:3 大小:1.48MB
下载 相关 举报
知识图谱在医疗领域的构建及应用_刘月.pdf_第1页
第1页 / 共3页
知识图谱在医疗领域的构建及应用_刘月.pdf_第2页
第2页 / 共3页
知识图谱在医疗领域的构建及应用_刘月.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、人工智能本栏目责任编辑:唐一东Computer Knowledge and Technology电脑知识与技术第19卷第4期(2023年2月)第19卷第4期(2023年2月)知识图谱在医疗领域的构建及应用刘月,冯佳鑫,张晓孪(宝鸡文理学院 计算机学院,陕西 宝鸡 721016)摘要:近年来,医学知识图谱引起越来越多的关注。医学知识图谱的构建可以对医学海量数据中提取出的医学知识实现高效管理、共享及应用,对医院的智能化、信息化管理和智慧医疗有着非常重要的价值和意义。本文对医疗领域的知识图谱的构建流程、方式及应用情况进行梳理和研究,分析了目前医学知识图谱国内外的研究现状,并指出今后的研究方向。未来医

2、学知识图谱将在数量、质量、标准化程度和分级应用等方面继续改进和不断提升。关键词:知识图谱;医学知识;构建;深度学习中图分类号:TP391文献标识码:A文章编号:1009-3044(2023)04-0021-02开放科学(资源服务)标识码(OSID):1 概述2006年万维网之父Tim Berners-Lee提出了数据链接的思想,旨在推广和完善RDF和OWL技术,不断掀起了语义网络(Semantic Network)的研究热潮。2012年5月,美国的谷歌(Google)公司为了提升搜索引擎的能力,进一步改善用户良好的搜索体验提出了知识图谱(Knowledge Graph,KG)的概念,并发布了基

3、于知识图谱的智能化语义搜索引擎产品。知识图谱是用图模型来描述知识和建模世间万物之间的关联关系的技术方法,表示形式有多种。在大数据环境下,现代知识图谱具有规模越来越大、表达直观易理解、语义表达能力强的特点,对可解释人工智能具有非常重要的作用1。近年来,知识图谱也成为人工智能最热门领域之一,各大互联网公司纷纷推出了自己的知识图谱产品,例如百度的“知心”和搜狗“知立方”。目前知识图谱已经在语义搜索、数据分析、智能问答、自然语言理解、视觉理解等多个方面发挥出越来越大的价值。比如在推荐系统中引入知识图谱技术,可以较好地解决在没有大量用户数据的情况下数据稀疏性与冷启动问题2,有效地提升推荐系统的效果。2

4、医学知识图谱知识图谱从不同角度有多种分类方法,按照适用的范围分为通用知识图谱和领域知识图谱,两者在知识来源、规模和对质量的要求方面有区别。医学知识图谱是知识图谱在医疗领域的落地和实际应用,知识图谱能够有效地整合和组织医疗知识,解决医疗大数据中诸多问题,比如知识复杂且分布分散、异构、知识的重复和碎片化等。知识图谱构建可以对海量医学数据中提炼出的医学知识实现高效的管理、共享及应用,对当今医院的智能化、信息化管理和智慧医疗有着非常重要意义。2019年12月,新型冠状病毒感染(COVID-19)席卷了全世界,给全世界多个国家的经济和金融造成了巨大影响,同时给人类生活很多方面也都带来了巨大影响。在新冠疫

5、情不断多点暴发和防控等级不断提升的情况下,越来越多的人投入这场战“疫”中。为了对上层应用提供可靠的知识来源与大数据支持,相关领域的大数据及知识被迅速整合构建为知识图谱。国内多个大学和研究机构积极助力抗击疫情,相继发布了多个新冠病毒知识图谱;中文开放知识图谱OpenKG共享了多个涵盖临床、诊疗、物资、英雄等方面COVID-19知识图谱。知识图谱在病患轨迹跟踪、疫情大数据筛查、药物推荐等方面发挥着积极的作用3。当前,国内外也不断研究和开发出了很多优秀的医学知识图谱和知识库系统,国外在医疗领域著名的医学知识图谱有一体化医学语言系统UMLS、医学系统命名法-临床术语SNOMED CT、解剖学基础模型本

6、体FMA、人类表型本体HPO、基因本体GO、关联生命数据集LLD等。与国外相比,国内在数据管理、数据规模、数据维护模式和知识信息整合层面相都还有一定的差距。国内目前比较完善的有中国医学科学院医学信息研究所开发研制的中医药学语言系统TCMLS、中文一体化医学语言系统CUMLS、医药卫生知识服务系统、中文医学知识图谱CMeKG和开放医疗与健康联盟的OMAHA医学知识库等。国内也有不少的学者针对某种疾病的预测和诊疗对医疗知识图谱进行了研究和实现。总体来说,将知识图谱用于医学领域不仅能提高医学数据智能化处理水平,而且将助力上层医学的应用和落地,有望将来成为打开医疗AI市场的主钥匙。医学知识图谱具体落地

7、的表现形式是构建专科疾病知识图谱,如心收稿日期:2022-09-20基金项目:宝鸡文理学院2020年大学生创新创业训练计划项目(编号:2020XJ167);宝鸡文理学院第十六批校级教学改革研究项目(编号:21JGYB24)作者简介:刘月(2000),女,陕西宝鸡人,本科,研究方向为人工智能;冯佳鑫(2001),男,陕西宝鸡人,本科,研究方向为智能信息处理;张晓孪(1978),女,陕西宝鸡人,副教授,硕士,研究方向为知识图谱等。E-mail:http:/Tel:+86-551-65690963 65690964ISSN 1009-3044Computer Knowledge and Techno

8、logy电脑知识与技术Vol.19,No.4,February202321DOI:10.14004/ki.ckt.2023.0192本栏目责任编辑:唐一东人工智能Computer Knowledge and Technology电脑知识与技术第19卷第4期(2023年2月)第19卷第4期(2023年2月)脏病知识图谱,并在此基础上才能进一步开发其智能化应用。医学知识图谱是今后实现更精准的医疗服务和智慧医疗的基础,但是目前构建知识图谱的技术在医学领域中普遍存在来源复杂、专业性较强、效率不太高、限制多、拓展性不高等问题4。3 医学知识图谱的构建流程及方式医学领域知识图谱目前是很活跃的一个研究领域,

9、学术界和工业界针对其构建方式以及应用场景已经开展了许多研究工作。其构建方式有人工构建和机器构建两种,从实现技术角度上分析构建过程,该过程会涉及多方面的技术,而医学知识图谱的利用则涉及描述性数据分析、语义搜索、知识问答、自动推理等多个方面。要构建并利用好知识图谱并非单个领域的单一技术,要求系统性地综合利用多个相关交叉领域的技术。目前,医学知识图谱构建还面临着一些挑战和困难。在构建流程上可以分为以下几个步骤。(1)医学知识建模。知识图谱由节点和边组成,从逻辑结构角度一般可分为数据层和模式层(也称本体层),模式层在数据层之上构建。三元组G=(head,relation,tail)是知识图谱的一种常用

10、表示形式,数据层中存储的是知识图谱中的三元组信息,模式层对数据层知识结构进行提炼和概念约束。医学知识建模是构建医学知识图谱的基础,其目标是建立概念模式,良好的模式定义可以减少医学数据的冗余并实现对医学知识的合理组织。知识建模一般有自顶向下和自底向上两种途径,由于医学领域的知识结构比较复杂,知识类型特殊且知识专业性很强,因此医学领域的图谱构建一般采用自顶向下方式进行,首先定义数据模式即本体(Ontology),这个过程一般需要领域专家人工编制,从最顶层的概念开始定义,然后逐步细化,最终形成结构良好的分类层次结构。本体构建之前,一般需要选择合适的本体描述语言和本体建模工具。目前比较有代表性的本体描

11、述语言有 XML、RDF、RDFS 和 OWL 等。常见的本体建模工具有 Protg、OntoStudio、TopBraid Composer、Semantic Turkey等,其中Protg是最熟悉最常用的开源工具。(2)医学知识抽取。医学知识抽取是构建医学知识图谱的重要环节和核心技术,是分析、识别和理解医学知识的过程。不同类型的医学数据源所涉及的抽取技术和需要解决的问题也有所不同。知识抽取根据目标任务主要分为医学实体识别、医学实体关系抽取、医学事件抽取。在医学领域相关实体和实体之间的关系也比较复杂,医学实体涉及症状、疾病、药物、解剖结构、化学成分等,而这些实体之间又互相关联。为了有效表达这

12、些概念和关联,产生了很多的医学知识库。医学实体识别的研究开展最早,已有的研究方法可分为基于规则的方法、基于统计模型的方法和基于深度学习的方法。关系抽取方法可分为基于模板的方法和基于监督学习的方法。目前医学事件抽取在医学领域应用还不是很广泛,已有的事件抽取方法可分为流水线方法和联合抽取方法。医学领域知识抽取的难点在于如何提高开放领域的知识抽取的正确率以及如何实现多模态医学大数据处理和特征提取。(3)医学知识融合。由于多个医学知识图谱之间存在异构性和多样性,为了解决异构和冗余问题出现了医学知识融合技术,旨在对不同来源的知识进行对齐、合并工作。医学知识融合包含数据模式层融合和数据层融合两个方面,研究

13、内容涉及医学本体映射、医学实体对齐以及实体链接等。目前已有的知识图谱融合技术可归结为基于自然语言处理(NLP)进行术语比较、基于结构进行匹配和基于实例的机器学习等方法。(4)医学知识存储。医学知识图谱数据管理的挑战是如何面对日益增长的知识图谱规模,实现高效的知识存储和信息查询。目前有三类知识图谱存储方案分别是基于关系数据库存储、面向RDF的三元组数据库和原生图数据库存储。关系数据库技术出现最早且发展成熟,RDF的三元组数据库优点是直观、格式统一,原生图数据库存取效率最高。当前医学知识图谱主要采用图数据库进行存储,近几年,以Neo4j为代表的图数据库因具有高性能、轻量级等优势,越来越受到关注。(

14、5)医学知识推理。医学知识推理是基于知识图谱中的已有事实和关系推断出未知事实和关系的过程。基于医学知识图谱的推理能够支持人工智能医疗领域的很多应用,在医学知识图谱的发展演变过程中有重要的作用,已成为近年来的研究热点。在医学知识图谱中,医学知识推理能够协助医生完成疾病诊断和提高医生的工作效率。知识推理在知识图谱构建过程中主要应用于图谱补全和图谱质量的检验。典型的推理策略包括基于演绎的推理和基于归纳的推理策略,每种推理策略又包含了多种推理方法,未来两种不同推理方式将逐渐融合和互相补充。今后如何利用多模态、多种来源的医学数据融合技术提高知识推理的完整性、可靠性以及实现医学知识推理的可视化是下一步的研

15、究趋势。4 医学知识图谱的应用随着医疗信息系统智能化水平的提高,知识图谱为医疗信息系统中的医疗大数据组织、管理及利用提供了一种更为有效的方式。目前医学知识图谱技术应用广泛,主要用于语义搜索、公共卫生事件响应、医疗决策和医疗问答等。(1)基于语义的医疗信息搜索:传统的基于关键词的搜索缺乏对知识的理解和处理能力,语义搜索则是不拘泥于用户所输入请求语句的字面本身,而是准确地捕捉到输入语句后面的真正搜索意图,从而更准确地返回最符合用户需求的搜索结果。将知识图谱应用于搜索是当前实现语义搜索的有效解决方案。知识图谱描述了事物的分类、属性和关系,具有丰富的语义信息,可以为语义搜索提供极大的底层支持。基于医学

16、知识图谱的语义搜索目前被用于医学百科知识、医学健康资讯、临床指南/文献、医疗保健信息等内容的推荐。语义搜索主要包括搜索意图理解、目标查找、结果呈现和实体探索四个步骤。(2)公共卫生事件的快速响应:2020年新冠疫情席卷全球后,全世界各国对突发公共卫生事件的关注度日益提高,事件预警和快速响应机制成为今后研究的重点,该领域是一个新的研究方向。知识图谱在公共卫生事件的一些场景中采用图存储数据的方式可以协助实现流行病调查中的人员分布、人员活动轨迹、发病时间等信息的收集。收集出的信息能方便地用于病例之间相关性分析,进而梳理出感染源头。另外可以构建疫情相关事件知识图谱,分析疫情发生事件脉络,查找到多个事件

17、存在的因果关。事件知识(下转第25页)22人工智能本栏目责任编辑:唐一东Computer Knowledge and Technology电脑知识与技术第19卷第4期(2023年2月)第19卷第4期(2023年2月)络中常见的激活函数Sigmoid函数,对其进行修改优化后控制作业机构阀门开度,具体阀门开度与行人距离的对应关系为:O=100%1+e-2y min+N(2)其中参数N根据yTH的值进行确定,N值越大,S型函数的整体向右偏移越大,通过设置合适的N值,可以在距离较小时获得适当的“死区”,以达到当行人处于较近距离内时阀门无法开启的效果。如图5所示,当设置N值为12,从相应的阀门开度曲线可

18、以看出,行人距离小于3米时阀门基本处于关闭状态,当行人距离为9米时,阀门基本完全打开。024681012行人距离/m010%20%30%40%50%60%70%80%90%100%工作阀门开度N=6N=12N=18N=12时“死区”图5阀门开度与行人距离的对应关系3 结论本文设计了一种基于视觉图像与激光雷达感知融合的智能环卫车系统方案。通过基于HOG+SVM的行人检测算法检测视野范围内是否存在行人,检测到行人目标存在后,通过提取行人目标检测框内的激光雷达深度信息,获取行人距离并判断其是否处于环卫车作业范围内。若在环卫车辆行驶作业过程中检测到作业范围内行人存在,则根据行人距离自动调整车辆作业核心

19、装置的阀门开度。该方案提升了环卫车的智能化水平,节约了人力物力,能够有效降低环卫车辆作业期间对行人产生的干扰。参考文献:1 Wang J,Yu X P,Liu Q,et al.Research on key technologies of intelligent transportation based on image recognition and anti-fatigue drivingJ.EURASIP Journal on Image and Video Processing,2019,2019(1):1-13.2 Enzweiler M,Gavrila D M.Monocular

20、pedestrian detection:survey and experimentsJ.IEEE Transactions on Pattern Analysisand Machine Intelligence,2009,31(12):2179-2195.3 白辰甲.基于计算机视觉和深度学习的自动驾驶方法研究D.哈尔滨:哈尔滨工业大学,2017.4 徐渊,许晓亮,李才年,等.结合SVM分类器与HOG特征提取的行人检测J.计算机工程,2016,42(1):56-60,65.5 Chu X G,Zheng A L,Zhang X Y,et al.Detection in crowdedscene

21、s:one proposal,multiple predictionsC/2020 IEEE/CVFConference on Computer Vision and Pattern Recognition(CVPR).June 13-19,2020,Seattle,WA,USA.IEEE,2020:12211-12220.6 向滨宏.基于汽车雷达和摄像头信息融合的目标检测方法研究D.重庆:重庆大学,2017.7 牛萍娟,刘雷.基于神经网络的毫米波雷达与视觉传感器联合标定方法J.天津工业大学学报,2019,38(5):64-69.8 刘超群.基于摄像头和激光雷达信息融合的智能汽车环境感知技术研

22、究D.重庆:重庆大学,2020.【通联编辑:代影】(上接第22页)图谱可以有效预测网络舆情,帮助发现潜在的公共威胁并降低舆情风险。(3)医疗决策支持:知识图谱技术推动了搜索模式从传统的网页搜索转变为基于深层语义的搜索。相较于传统搜索,知识图谱在搜索中实现了三方面的优化:一是提高搜索结果准确度;二是搜索到的相关联结果呈现更详细;三是可以通过互动、点击拓展搜索的深度和广度。今后,知识图谱技术可以在医疗大数据分析、管理与决策方面发挥重要作用,可以根据病人的症状和检查等医疗数据,快速生成诊断说明和治疗方案,对医生给出的诊疗方案进行智能化分析,大大降低医生的误诊率。(4)医疗问答系统:基于知识图谱的问答

23、系统能利用其丰富的结构化语义信息,深层次理解用户提出的问题并给出较准确的答案。知识图谱问答系统的目标是通过查询知识图谱获得相关知识,自动回答人类提出的自然语言问题。早期知识库问答系统由于受到知识资源数量及自然语言理解能力的制约,被限制在一个封闭的领域内。近年来,随着知识图谱的发展和开放领域问答数据集的不断提出,基于知识图谱医疗问答系统用于开放领域问题已成为可能。知识图谱问答主要有语义解析和信息检索两种解决方法。基于知识图谱的问答系统创建过程一般为三个阶段,首先是对用户给出的自然问句进行信息抽取;其次是将抽取出的实体映射到知识图谱中;最后涉及知识推理过程,搜索知识图谱获取答案并显示结果。5 结束

24、语在人工智能和大数据时代,知识图谱的发展迅速已成为大数据分析和表示的重要手段之一。近年来医疗领域产生了大量的医疗数据,如何利用海量的医疗信息资源更好地为人们服务,引起很多人的关注。随着智能医疗时代的到来,通过大数据和知识图谱将各种医学数据的聚合,构建综合智能医疗系统,不仅可给患者、临床医生和科研工作者提供帮助,成为未来医疗的发展方向,而且也为医疗事业发展提供更有力的保障和支持,因此在医学领域的知识图谱的探究有着重要的现实意义和价值。今后的一个研究方向是如何将深度学习技术和知识图谱技术相互融合,对医学文本信息抽取方式进行优化,提高医疗知识抽取的覆盖率与准确率5。未来医学知识图谱将会朝着数量更大、

25、质量更高、标准化程度更好和分级应用更明显的方向发展。参考文献:1 王西锋,张晓孪.知识图谱在医疗领域的应用研究J.宝鸡文理学院学报(自然科学版),2021,41(4):86-90.2 秦川,祝恒书,庄福振,等.基于知识图谱的推荐系统研究综述J.中国科学:信息科学,2020,50(7):937-956.3 杨帅,王小红,赵志刚,等.COVID-19知识图谱构建与应用研究J.青岛大学学报(工程技术版),2021,36(4):22-29.4 侯梦薇,卫荣,陆亮,等.知识图谱研究综述及其在医疗领域的应用J.计算机研究与发展,2018,55(12):2587-2599.5 刘知远,韩旭,孙茂松.知识图谱与深度学习M.北京:清华大学出版社,2020:15.【通联编辑:唐一东】25

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服