资源描述
建立医院数据中心系统技术方案探讨
21
2020年4月19日
文档仅供参考,不当之处,请联系改正。
建立医院数据中心系统技术方案探讨
武汉大学中南医院信息中心 430071
商建国 肖辉 张方
摘要:使用基于数据库级的成熟的集成软件工具,如:IBM Datastage、Oracle数据集成套件,满足医院环境下的数据转换。实现数据集中交互模式,经过分析数据库的日志文件来实现数据同步转换,从而大大提高了数据的实时性、大大降低系统集成难度。实现基础业务与综合业务分离,提高了基础业务系统的稳定性,并适应医院不断变化的综合业务需求。
当前非关系的电子病历数据由于受到系统环境的制约,各产品之间的电子病历存贮差异巨大,完全不符合CDA文档交换标准,也不能脱离各自的系统环境进行电子病历展示。
经过数据中心的数据转换,将非关系型电子病历的展示格式与数据整合,实现符合CDA标准交换文档的生成。使此文档能够完全脱离各自应用系统的制约,达到区域数据交换与数据挖掘的需求。
经过分析集成平台的应用,理顺数据仓库数据架构,将不变的需要经常查询的信息,存入数据库关系型字段名,将个性化的信息存入数据库中XML非关系型字段中。最终形成适应各医院需要统一的数据中心平台数据架构。
关键字:集成平台、数据中心
引言:由于中国新医改不断深入,医院与社会对医院综合信息资源处理与应用的需求不断提高,各种多业务数据并发处理过程越来越复杂。原医院内各系统间的数据交换模式,极大地阻碍了信息共享与区域数据交换,极大阻碍了医院信息系统的发展。经过医院数据中心建立,理顺各业务系统关系、减轻业务系统数据压力与维护负担。从根本上解决信息孤岛,不同异构系统间数据标准,有效地解决了医院内部各应用系统间数据传递与区域数据共享。
医院数据中心是建立在医院局域内,同构数据库系统之上。在此应用环境上,实时性强;大数据量多用户同步数据交换,与区域数据中心接口与运行环境完全不同。不能将建立区域数据中心技术,照搬到医院数据中心的建立。
由于HL7是针对各医院之间,设备与业务系统接口而设计的标准医疗信息交换标准。它只适用单个病人,单个文档的数据交换。不完全适应医院内部各系统之间的实时高效,多病人信息的横向数据交换与存贮。
一、数据中心存在的意义
数据中心是企业的业务系统与数据资源进行集中、集成、共享、分析的场地、工具、流程等的有机组合[1]。它将不同业务系统之间需要共享的信息、综合业务系统与区域共享需要的业务数据,按行业标准转换明文方式长期存贮在一个数据仓库中。
当前医院各业务系统面临的最大问题:
1、系统业务无统一数据标准
数据标准是指卫生信息采集表的处理过程中涉及到的标准,主要是指数据采集里的标准,定义各类数据标志的含义,规范数据采集的数据集能在不同系统之间传递的电子报文或者是电子文档[2]。
由于医院各业务系统产生的数据需要长期保存,但建立在这些业务数据基础之上的各种字典,由于医改的需要在不断地变化,系统中各类字典也不断膨胀,为减少业务数据错误与系统维护工作,很多系统设计者只能将明文保存的基础业务数据表,造成业务系统运行效率低下,维护困难。
数据中心的建立,就是要将原各系统不能共享的孤岛信息,转换成符合国家或卫生部相关标准的数据集。为全院系统打造一个共享平台,统一字典维护,降低业务系统标准字典维护量,为区域共享提供可进行信息统计与挖掘的标准数据集。
涉及到医院系统的主要标准有:疾病代码、科室分类、药典、非药品记费项目。
2、业务系统数据接口
由于医院业务管理系统,是一个长期运行,不断完善的情况下壮大成长起来的,医疗信息技术标准没有惯彻到整个业务中。由此造成上线系统越来越多,各系统之间数据的调用频繁,数据接口也就越来越多,越来越复杂。经常出现某个业务系统升级无法到相关信息,或因某业务系统升级造成其它业务系统数据混乱的现象。
3、医院业务需求扩张
各业务系统随着用户应用不断深入产生新的业务需求:如质控、CA认证、闭环医疗等。这些应用必须建立在多个系统之上,若将这些应用需求不断加入到基础业务系统中,势必造成基础业务系统数据量不断膨胀,造成基础业务系统的可维护性与运行效率越来越差。
4、病人信息综合处理
当前医院的系统是按功能进行划分的,如:HIS系统保存病人费用与医嘱内容、LIS保存病人检验数据、PACS保存病人影像信息等。医生对病人的诊断往往来源于医院各业务系统,对其数据进行综合的结果。将这些来源不同系统并标准不统一信息,整合在一个界面中进行综合处理,存在巨大的障碍与分析效率低下的问题。
将基本业务产生的数据,对其进行质量控制、清洗、转换保存到综合医疗业务数据仓库,长期海量保存。使基本业务与综合医疗业务的运行建立不同数据仓库中,实现分布式并行运行,有效地解决了高效、稳定的前台业务与多变的综合展示业务之间运行效率的矛盾,极大地提高了基础业务系统的维护性与稳定性。
二、WebService数据接口分析
当前各医院实施的集成平台的接口方案大多建立WebService在线应用服务基础上。
Web Services是由企业发布的完成其特定商务需求的在线应用服务,其它公司或应用软件能够经过Internet来访问并使用这项在线服务。
实际上,WebService的主要目标是跨平台的可互操作性,易通信。为了达到这一目标,WebService完全基于XML(可扩展标记语言)、XSD(XMLSchema)等独立于平台、独立于软件供应商的标准,是创立可互操作的、分布式应用程序的新平台。由此能够看出,在跨防火墙、异构数据库系统、B2B的数据交易集成,使用WebService会带来极大的好处。
业务数据库
构造XML文档
数据中心
数据库
解析XML数据转换适配字典
触发器
SQL执行
定期轮询
各业务系统
业务系统
但对于医院局域网而言,不需要跨跃防火墙,并为同构数据库系统,使用DCOM会比SOAP/HTTP有效得多。这与区域的数据中心接口环境完全不同。
三、数据中心集成架构
为了更好地实现医院不同业务的需求,将关键基础业务与综合信息处理业务分离,实现整个数据中心松耦合架构平台。
关键基础业务应用:如HIS、PACS、LIS等。这些应用系统与相对应的数据库是医院整个业务的核心,必须是相对稳定与高效的。不能因业务需求扩张而随意改变其应用系统模块与数据库结构。
综合信息处理业务:如病历质量控制、闭环医嘱、CA认证、医生门户、病人综合信息分析与展示、以电子病历为基础的科研、教学、信息挖掘与院长决策等。这些应用的共同之处是,信息来源与不同的业务系统,需要的信息量大,与基础业务应用无紧密业务关系,用户需求的变化大,信息变化少。由此可见这一部分业务必须建立数据中心,信息也来源于数据中心数据仓库中。
数据中心主要由:数据接口、数据转换平台与数据仓库组成。
数据接口:主要使用WebService、触发器、数据库日志等技术,经过推或拉模式实时或异步接收各业务系统数据。
数据转换平台:将各系统的数据进行清洗、过滤、数据质量控制,并根据参数配置表转换为标准到数据仓库。
数据仓库:按数据逻辑关系,保存各业务系统提供的需要共享的标准数据,为各业务系统与综合信息应用系统提供数据。
对当前医院各系统数据接口类型分析有:数据库、WebService、HL7、DICOM。HIS、LIS、PACS等系统无集成平台的接口方案,大都采用中间表来实现的,LIS或PACS系统与设备的数据接口多使用WebService传递信息、另外一些医疗设备,如:心电、重症监护则使用HL7标准进行数据交互。
数据分散交互模式
当前医院中实施在集成平台方案都使用一种分散交互模式,各系统按HL7标准设计信息交换文档,经过WebService进行交换。
这种交互模式虽然解决了医院系统集成的复杂性,但由于交互过程中需要将信息构造成XML文档,经过WebService传递给不同系统,再进行解析、保存等环节处理。大大增大了系统运行风险,加大了数据集成交换难度。
在实际业务中,如HIS系统办理入院,EMR得到病人入院信息。按数据分散交互模式,HIS为主动发起方推送病人入院信息,EMR为被调用方,集成平台轮询接收HIS发起的信息。在此过程中定期轮询与XML文档转换都需要一定时间完成,交互效率大为降低。
当前在医院广为流传的Ensemble集成平台,就是建立在此基础之上。加入了平台开发层与平台管理层,以适应HL7交互转换标准等需求。
病人信息新增Ensemble处理流程[4]如下图
医院中的信息交换,实时性强,如:在门诊一卡通系统中,病人在检验医技窗口经过LIS系统收单时,必须与HIS系统交换病人收费信息后,方可决定是否收单。这种交换模式很难完成,医院环境下大数据量、多用户并发、实时交换模式。
数据集合难度大,灵活性差:由于医院系统大多由不同公司开发,使用上述数据交互方式需要各公司在需要进行信息交互的系统节点上,按统一交换标准修改系统传递或接收交换信息。若由于医院需求变更时,系统必须重新修改。
数据集中交互模式
将各系统需要交互的数据经过统一的ETL或ELT接口模式(Extract取出àTransform转换àLoad加载),实时同步、转换、保存到数据中心平台的数据仓库中,各业务系统需要其它业务系统的数据,是经过标准的数据仓库得到的。此方案实现了统一的同步数据转换配置方案,减少了系统间构造与解析XML文档环节,提高了工作效率。对于设备与系统间的信息传递,不能直接传递到数据仓库中,需要经过各子系统完成数据转换后传递数据仓库。
CDA是以单一病人的纵向临床文档交换为目的的,它是描述临床文档的结构和语义的文档标记标准。不适应在医院内部实时高效的,大数据量数据交换。可想而知,若将医嘱、处方、病人入院等关系型简单的数据传递,经过CDA文档构造与解析进行交互,大大系统降低运行效率。
但对医院中病人检验检查申请、结果与电子病历格式等非关系结构文档能够按CDA架构进行传递与保存。这些文档能够由各系统构造完成,或由数据中心的数据适配转换集中完成。
HIS
HL7
WebService
数据仓库
转换
PACS
EMR
LIS
接口
得到其它系统数据
区域平台
CDA文档
CT
设备
远程医疗
四、基于专业数据整合方案的接口方法
由于数据中心与各业务建立在二个不同的数据库,在方案设计时,必须考虑传递过程中的高可靠性、事务一致性与实时性的数据同步。而且必须支持在医院大业务量,多用户同时并发操作下的数据同步、转换与响应时间。
Oracle数据集成套件是一套综合数据管理组件,可用于构建、部署和管理企业数据集成解决方案。支持企业数据架构师对数据进行统一和管理,以及将数据分发到企业应用程序和编排的业务流程中。Oracle数据集成套件采用了Oracle的核心技术,是业界功能最强大且最轻量级的数据集成解决方案[3]。
ORACLE的数据整合工具GoldenGate TDM为用户提供异构环境下交易数据实时捕捉、变换、投递,主要支持异构数据库环境下的变化数据同步。具有高性能、可扩展、高可靠等性能。
它就是经过分析数据库的日志文件来实现数据同步的。它从数据库的日志解析数据的变化(数据量只有日志的四分之一左右)。GoldenGate将数据变化转化为自己的格式,直接经过TCP/IP网络传输,无需依赖于数据库自身的传递方式,而且能够经过高达9:1的压缩率对数据进行压缩,能够大大降低带宽需求。在目标端,GoldenGat能够经过交易重组,分批加载等技术手段大大加快数据投递的速度和效率,降低目标系统的资源占用,能够在亚秒级实现大量数据的复制,而且目标端数据库是活动的。其工作示意图如下:
Oracle Data Intergrator提供了具有划时代意义的、完全基于Java的E-LT引擎、能够满足所有最重要的数据集成要求。Oracle Data Intergrator新一代的提取、加载和转换(E-LT)体系结构,充分利用了不同的关系数据库管理系统(RDBMS)引擎来处理和转换数据。这种方法优化了性能和可扩展性,简化了数据中心体系结构,并降低了解决方案和维护成本。
Oracle Data Intergrator可靠性与断点续传能力,保证交易时的一致性,并具备各种故障下的恢复能力。
Oracle Data Intergrator采用批处理、实时、同步和异步模式,简化了系统间的数据移动和转换。其模块化设计和到所有主要数据库、数据仓库设备以及分析型应用程序的内置连接极大地提高了用户效率。
Oracle数据集成套件包含一套紧密集成功能,涵盖数据集成、数据分析和数据质量管理。关键的管理功能包括应用数据的分析和时间分片、自动数据质量规则生成、内联一次性清理、标准化以及消除重复的数据记录。
使用Oracle数据集成套件,实现的数据集中交互模式,经过分析数据库的日志文件来实现数据同步转换、加工,从而大大提高了数据的实时性、大大降低系统集成难度、提高了业务系统的稳定性。
五、数据中心存贮架构分析
医院数据中心是医院各业务系统的数据集合,它不是各业务系统数据库简单的数据集合。主要是为医院各业务系统与区域医疗信息共享提供数据,为基于数据中心综合应用系统的需求服务。区别于以病人健康资料档案为中心的区域数据中心平台建设。
架构原则如下:
1、关系与非关系数据类型并存
当前在传统关系型数据库系统中,大多都支持XML格式的非关系的数据存贮与检索功能。由于医院数据中心来自医院各业务系统,数据繁杂,必须从数据中心综合应用与区域病人健康档案建立的需求出发,将灵活的存贮结构与快速定位查询兼顾考虑。将非结构化、查询机率少的数据保存到XML类型字段中,将各医院中比较通用的与经常使用的数据保存到关系型字段中。
2、数据标准转换与电子病历数据整合
数据中心数据的标准化是数据统计与挖掘的基础。在数据中心必须建立各种符合国家、卫生部下发的各种字典表,建立与医院各业务系统中不符合相关标准的字典表的对应关系表。数据交互时,将各业务系统的非标准代码信息进行转换。
当前非关系的电子病历数据由于受到系统环境的制约,各产品之间的电子病历存贮差异巨大,完全不符合CDA文档交换标准,也不能脱离各自的系统环境进行电子病历展示。
经过数据中心的数据转换,将电子病历的展示格式与数据整合到符合CDA标准的转换文档,并保存到数据仓库中的XML类型字段中。使此文档能够完全脱离各自系统的制约,达到区域数据交换与数据挖掘的需求。
3、数据离线保存
为了适应数据长期保存与CA认证明文进行数字签名要求,数据中心保存的数据必须脱离各业务系统的数字字典与格式字典的支持,以明文形式保存到数据库中。
保存在XML类型字段中文档必须符合CDA标准,并能够在广泛可得的配置了XML的浏览器中浏览和打印,而且是由一般的用标准XSLT语言编写的转换样式转换。这类文档主要是:申请报告单与相应格式、门诊住院病历信息与显示格式。
由于数据仓库中的数据为长期海量保存,需要数据库系统支持分区数据文件离线功能,支持并行查询运算功能。
针对病人信息可分为以下层次关系:
第一层:病人基本信息表:保存病人ID号、姓名、性别、出生等基本情况。
第二层:就诊记录表:与病人基本信息表病人ID号关联。门诊挂号表与住院病人基本情况表,产生门诊就诊ID号与住院号+次数,保存病人在住院登记或门诊就诊的信息。
第三层:门诊部分有:门诊病历、门诊医嘱,与门诊就诊ID号关联。
住院部分有:住院医嘱、病历资料、病人护理,与住院号+次数关联。
第四层:医嘱分类:处方单、检查单、检验单、其它单据。住院还有:手术、输血、医嘱过程控制等。这些记录分别与住院或门诊医嘱号关联。
检查单、检验单为门诊住院共用的表,保存申请单内容、报告单相关信息、申请与报告单CDA文档。
病历类:门诊病历、病案首页、病历其它文档(入院记录、出院记录、会诊记录等)、病程记录(首程、日常病程、交班记录等)、知情同意书。这些记录分别与门诊就诊ID号与住院号+次数关联。
护理类:三测记录、护理单等。这些记录与住院号+次数关联。
第五层:检验报告明细:保存检验报告中病人的明细指标。与检验单号关联。
病人基本信息表
门诊挂号表
住院病人表
门诊医嘱表
门诊处方表
其它单据明细表
检验记录表
门诊病历表
住院医嘱表
住院处方表
检验报告明细
病案首页
其它单据明细表
病历其它资料
病程记录
知情同意书
手术记录表
三测表
医嘱过程控制表
输血记录表
检查记录表
护理单
六、数据中心应用分析
数据中心的数据仓库建立之后,不但能够为各业务系统互通信息,还能够在此基础上建立各种综合业务应用系统,提供高效的,大信息量,过去单系统无法实现的应用服务,为医护人员提供全方位的医疗信息服务。在此数据中心的应用系统架构应为B/S架构,以适应医护人员经过宽带网进行访问的需求。
数据中心的应用是以综合业务为主,是指此需要提取医院不同系统数据的业务。这些业务有的自成体系,有的则是为其它系统提供数据。
1、医疗质控管理:提到质控,多数人认为,此项工作是电子病历的一部分,即病历书写质量控制。但医院信息系统中,能够为医护人员提供的质控内容还很多,如:过去体现在LIS系统中检验结果质量控制;在医嘱开立环节的质量控制;临床路径质控;检查结果质控;闭环医嘱执行过程控制;还有输血、手术、护理等。将这些信息进行分析,综合展示给各类医护人员,实时为患者医疗安全提供保障。
2、CA认证:随着医院信息化的不断深入,医疗服务逐渐走向无纸化。CA认证(身份认证、带有时间戳的数字签字)是医疗信息系统正常运行的重要保障。
在医院信息系统中需要电子签章与CA认证的数据大部分与病人在医院就诊时所产生的资料有关,如:门诊处方、住院医嘱、病人病历、知情同意书等。这些资料都保存在数据库中,并以多种形式保存。这些资料与社会上需要CA认证的文件有许多不同之处。如:格式多、关联多、签名环节多、签名的文档修改再签名。甚至有时程序员打库直接修改数据,这些因素存在,很难保证签名的有效性。
将CA认证的签名封装在数据中心系统中,在数据仓库中,对明文文档进行数据签名,不对基础业务系统进行改造,降低了业务系统的存贮量与维护量,降低了签名文档失效的风险。
3、闭环医嘱:闭环医嘱是对医嘱从开立、执行到结束整个过程监控管理。其数据来源于医院各基础业务系统,按常规实现方法,必须在各系统执行与医嘱相关的过程中,将信息写入医嘱过程控制表,从而加大了各业务系统的存贮与维护负担。
将闭环医嘱过程控制中产生的信息封装在数据中心系统中,设计出各类医嘱的执行流程。对各业务系统处理医嘱的数据库日志进行分析,得到相关信息写入医嘱过程控制表。实现不修改业务系统的基础上完成闭环医嘱信息的采集。
在医生工作站与PDA的医嘱表中显示每组医嘱的执行进程,若需要本系统执行的医嘱,用红底字提示医护人员执行。
长期医嘱
序号
项目名称
每次剂量
频次
用法
执行进程
开始时间
开立医生
1
左卡尼汀针5ml
10ml
QD
IVGT
配药中
2
氯化钾针10ml
5ml
3
果糖250ml
250ml
4
血栓通粉针150mg
600ml
QD
IVGT
分方
临时医嘱
序号
项目名称
每次剂量
频次
用法
数量
执行进程
开始时间
开立医生
1
三大常规
1
融血:重新采样
2
CT结肠平扫
1
预约 -02-23 10:30
3
结肠癌根治术
1
手术 -02-24 10:20
双击执行进程栏,系统显示此组医嘱执行的全过程。
序号
执行序号
执行名称
执行人
执行时间
备注
质控
1
1
开立
张医生
-10-19 08:12
2
2
分方
张医生
-10-19 08:16
1天
3
3
护士审核
刘护士
-10-19 09:30
4
4
输液单
刘护士
-10-19 09:32
5
5
皮试
吴护士
-10-19 09:36
6
6
皮试结果
吴护士
-10-19 09:40
阴性
时间未到
7
7
核对
吴护士
-10-19 09:45
李护士
8
8
计费
周药师
-10-19 09:50
349.40元
9
9
药房发药
周药师
-10-19 09:50
10
10
取药核对
王支助
-10-19 09:51
11
11
配药
吴护士
-10-19 10:01
12
12
输液
吴护士
-10-19 10:10
滴数:60
13
13
巡视
吴护士
-10-19 10:21
正常
14
13
巡视
吴护士
-10-19 10:41
正常
15
14
输液完毕
吴护士
-10-19 11:56
………
15
停止
张医生
-10-21 08:27
16
护士审核
王护士
-10-21 09:05
4、医生门户:医生门户是代表当代先进电子病历系统的具体体现。这些信息在某个系统是孤立,但对一个患者来说,多个孤立信息综合分析就会对病人疾病诊断与治疗产生重大的意义。
经过医生可定制的医生门户,大信息量综合显示各系统医生关注的信息,有力于医生快速掌握分析本人管辖病人的病情。医生门户可分为:
科室门户:集中展示本人管辖病人的概况,如:新增病人、出病转科病人、手术病人的情况,管辖病人中危急值、会诊、消息、临床路径进程、质控与医疗进程栏目等。
病人门户:显示某病人的综合信息,如:危急值、质控、医嘱、医嘱执行状况、临床路径进程、护理内容、手术情况、既往史等。
专业门户:根据具体专业情况展示相关内容,如:放化疗科、肿瘤科对病人的治疗方案或会诊记录等。
5、院长决策:院长决策系统是建立在全院大数据量、大信息量综合分析的结果展示。建立在数据中心的自定义院长决策系统,能够充分满足医院管理者对信息系统的要求也越来越高。
医院管理者利用该系统,能够找到对医院发展至关重要的业务信息,为医院的科学管理提供支持,及时分析问题,查找原因,调整资源,有助医院更快地健康发展。
6、综合病人信息展示:综合病人信息展示系统是近几年来发展起来的,是按病人时顺轴,对病人诊疗事件进行图形曲线分析。此系统为医护人员直观的分析方法,为医护人员全面掌握病人情况提供了一种新的手段。
利用数据中心数据将大大提高展示速度,增大展示内容。
7、数据挖掘:依据数据中心标准字典,建立基于数据中心的,病人综合资料搜索引擎,为医护人员提供更多、质量更好的科研数据。
8、区域与远程医疗平台接口:将病人资料按CDA标准,定时、完整、安全地将病人档案资料传递给区域医疗信息或远程医疗平台。
[1]什么是数据中心?来源:CIO时代网
[2] 医疗信息化建设加快 技术标准统一指日可待
-07-01 胡建平
[3]ORACLE企业级数据中心解决方案
[4]基于Ensemble的医院信息系统集成平台研究与应用 武汉中心医院信息中心 杨国良
-02-29
联系人:商建国
地址:武汉武昌东湖路169号
邮箱:
邮编:430071
展开阅读全文