收藏 分销(赏)

数据挖掘技术在临床决策中的应用研究.docx

上传人:快乐****生活 文档编号:3843688 上传时间:2024-07-22 格式:DOCX 页数:10 大小:13.43KB
下载 相关 举报
数据挖掘技术在临床决策中的应用研究.docx_第1页
第1页 / 共10页
数据挖掘技术在临床决策中的应用研究.docx_第2页
第2页 / 共10页
数据挖掘技术在临床决策中的应用研究.docx_第3页
第3页 / 共10页
数据挖掘技术在临床决策中的应用研究.docx_第4页
第4页 / 共10页
数据挖掘技术在临床决策中的应用研究.docx_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、数据挖掘技术在临床决策中的应用研究【摘要】 介绍数据挖掘技术的概念、工作原理,在阐述医学数据特点的基础上,探讨数据挖掘技术在临床决策中的应用过程,并以糖尿病为例,提出基于数据挖掘的辅助临床决策支持系统设想,以利于提高医院的临床决策能力。【关键词】 数据挖掘; 临床决策; 决策树 1 前言 随着国家信息基础结构建设目标的实施,企业在各种活动中普遍采用现代信息技术来提高竞争力。传统的基于数据的管理信息系统已不能满足决策者对数据质量的需求,面向决策的知识管理系统正在蓬勃兴起,智能决策支持技术成为目前迫切需要发展的方向。 医学领域也不例外,临床决策研究已成为临床医学中的一个重要领域,当下的临床决策问题

2、涉及到医学信息学、循证医学、费用-效益评估、卫生技术评估、医学伦理与法律等学科领域,因此在临床决策中单一的经验-描述的研究纲领已不适应当代医学发展的需要,需要引入综合的决策方法,以使临床医疗达到最佳疗效。 2 数据挖掘 近年来,随着电子信息技术的迅速发展,医院信息系统和医疗设备的广泛应用,医院数据库的信息容量不断膨胀。数据库技术的发展解决了海量数据的存储和数据检索的效率问题,但无法改变“数据爆炸但知识贫乏”的现象。如何充分利用些宝贵的医学信息资源来为疾病的诊断和治疗提供科学的决策,促进医学研究?如何在医院信息系统中积累了大量的管理信息和临床信息资源中挖掘深层次的、隐含的、有价值的知识?数据挖掘

3、有解决这方面问题的能力,利用数据挖掘技术开展科学研究,提高医学技术和医院管理水平是很有必要的。 数据挖掘的概念 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。 数据挖掘可粗略地理解为三部曲:数据准备、数据挖掘,以及结果的解释评估。将数据挖掘技术应用到医学信息数据库中,可以发现其中的医学诊断规则和模式,从而辅助医生进行疾病诊断,实现临床决策支持的效果。 临床决策支持系统 在医院信息系统中,主要有两大分支:医

4、院管理信息系统和临床信息系统。HMIS主要目标是支持医院的行政管理与事务处理业务;而CIS主要目标是支持医护人员的临床活动,收集和处理病人的临床医疗信息,丰富和积累临床医学知识,提供临床咨询、辅助诊疗、辅助临床决策,提高医护人员的工作效率。 临床决策支持系统是属于CIS中的一部分。CDSS是用人工智能技术对临床医疗工作予以辅助支持的信息系统,它可以根据收集到的病人资料,做出整合型的诊断和医疗意见,提供给临床医务人员参考。系统主要采用基于决策树和真值表的方法,接着出现了基于统计学方法的系统,研究人员针对不同医疗领域开发不同的临床CDSS。基本的临床CDSS由数据库、模型库和对话系统3个部分组成,

5、如图1所示。 挖掘算法 对医学数据库进行数据挖掘和知识发现的主要目的是预测疾病和对疾病进行分类。分类和预测是两种数据分析形式,可以用于描述重要数据类的模型或预测未来的数据趋势。 常用的数据挖掘算法有:关联规则、决策树、粗糙集、统计分析、神经网络、支持向量机、模糊聚类、基于范例的推理(Case-Based Reasoning 简称CBR)、贝叶斯预测、可视化技术。在数据挖掘技术中,常用于辅助临床疾病诊断的方法,主要有Bayes判别分析;人工神经网络;决策树。其中,决策树是一种非常有效的机器学习分类算法。决策树方法的起源是概念学习系统CLS,然后发展到ID3方法而为高潮,最后又演化为能处理连续属性

6、的。有名的决策树方法还有CART和Assistant。 决策树学习着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,在决策树的叶结点得到结论。所以从根到叶结点的一条路径就对应着一条合取规则,整棵决策树就对应着一组析取表达式规则。基于决策树的学习算法的一个最大的优点就是它在学习过程中不需要使用者了解很多背景知识,只要训练例子能够用属性结论式的方式表达出来,就能使用该算法来学习。 近年将临床诊断与治疗设计成决策树的形式,目的就是把决策思维在一定程度上予以具体化和规格化,使临床决策思

7、维按一定的程序进行,不致发生偏差和遗漏。 3 数据挖掘技术的应用 数据挖掘是从数据中识别真实、新颖、有用的、可理解的信息的复杂过程。尽管如今人们的研究重点放在对挖掘算法的研制、分析与应用上,但数据选择和数据的预处理却是整个挖掘过程中最耗时的活动,并且它们的结果影响整个过程是否能够成功产生结果。图2描述了数据挖掘的一般过程,实质上是一个迭代的过程。 什么是医学数据 医学数据挖掘是一门涉及面广、技术难度大的新兴交叉学科。医学数据首先是以治愈为目的而搜集的,其次才是用于医学研究的资源。医学数据具有如下特点 医学数据的隐私性医学数据不可避免地涉及到患者的一些隐私信息,当这些隐私信息使患者在日常生活中遭

8、遇到不可预料的侵扰时,就产生了隐私性问题。医学数据挖掘者有义务和职责在保护患者隐私的基础上进行科学研究,并且确保这些医学数据的安全性和机密性。 医学数据的多样性由于医学数据是从医学影像、实验数据以及医生与病人的交流中获得的,所以原始的医学数据具有多种形式。医学数据的多样性是它区别于其它领域数据的最显着特征。 医学数据的不完整性医学数据的搜集和处理过程经常相互脱节,以及一些人为因素使得医学数据库不可能对任何疾病信息都能全面地反映。 医学数据的冗余性医学数据库是一个庞大的数据资源,每天都会有大量的记录存储到数据库中,其中可能会包含重复的、无关紧要的、甚至是相互矛盾的记录。 此外,医学数据还具有时间

9、性特征。 构建数据仓库 数据仓库是支持决策过程的、面向主题的、集成的、与时间有关的、持久的数据集合,它以传统的数据库技术作为存储数据和管理资源的基本手段,以统计分析技术作为分析数据和提取信息的有效方法,以人工智能技术作为挖掘知识和发现规律的科学途径,是与网络通信技术、面向对象技术、并行技术、多媒体技术、人工智能技术等相互浸透、互相结合与综合应用的技术。 创建基于HIS的数据仓库,是从已有数据出发的数据仓库的设计方法,称之为“数据驱动”的系统设计方法,它的基本思路是:利用以前建设的数据库系统的数据,按照分析领域对数据及数据之间的联系重新考虑,组织数据仓库中的主题,利用数据模型有效地识别数据和数据

10、仓库中的主题的数据的“共同性”。 从数据仓库的定义我们可以知道,构建一个HIS数据仓库需要完成:抽取主题;组织数据;获取与集成数据和建立应用。随着数据仓库的数据量增长,日积月累的数据之间有无关系,是否存在着一些潜在的模式或趋势?这些我们都无法用眼或简单的通过某种计算方式获知,而必须对这些数据加以证明或修正,这时,数据挖掘技术就派上用场了。 数据挖掘应用举例 数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程。 疾病的诊断过程实际上也是一个疾病分类的过程,是根据病人的疾病特征划归到某个疾病或疾病类的过程。一般的医学书上把这一复杂的问题逐次分解成一个个小问题 如果患者性别为男性,

11、起病较急,病情较重,年龄是25岁,有自发性酮症表现。那么,根据上述算法进行决策,可以得出结论:患者患有1型糖尿病的几率为95%。这就达到了辅助医生决策的目的。 无论最终挖掘出来的结果是用来描述/理解、预测或是干预,我们寻求只是的目的就是为了运用知识,提高决策支持的能力。由于数据挖掘技术的发展,为决策支持系统开辟了新的发展方向,数据挖掘作为决策支持系统中的一部分发挥着重要的作用。4 结束语 数据挖掘的目的是利用所获取的知识理解事物、预侧未来情况、进行积极的干预,为下一步的工作或决策提供基础。 医学领域的数据是一个复杂的数据库,包括电子病历、医学影像、病理参数、化验结果等,而目前数据挖掘技术主要应

12、用于以结构化数据为主的关系数据库、事务数据库和数据仓库,对复杂类型数据的挖掘尚处在起步阶段。但是,随着数据库技术的发展,数据挖掘技术作为一种解决方案,成为医学信息技术领域重要的研究方法,必将为决策支持、科学研究带来很大的方便和可观的效益。 【参考文献】 1 周爱华, 郑应平, 王令群. 医学数据挖掘综述. 中华医学实践杂志, 2005, 4(2):126128. 2 屈景辉, 廖琪梅, 许卫中, 等. 医学信息数据库的建立与数据挖掘. 第四军医大学学报. 2001, 22(1):8889.3 胡于进, 凌玲. 决策支持系统的开发与应用. 北京:机械工业出版社,2006,9:1688.4 王向辉, 匡晓宁, 刘伟达, 等. 数据挖掘技术及其在决策支持系统中的应用. 计算技术与自动化. 2004,23:99102.

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服