1、2015张伟 2015/6/28 医疗大数据分析应用平台产品解决方案初稿目录1.背景简介62.产品愿景93.产品定位93.1解决问题93.2达到效果104.产品理念105.总体思路105.1对接数据源,获取医疗卫生大数据115.2对获取医疗卫生大数据预解决机制115.3建立医疗卫生大数据存储机制125.4医疗卫生大数据解决和分析算法分类和形成135.5开发专项大数据分析,形成专项大数据应用145.6开发机构大数据分析,建立机构大数据应用145.7建立平台应用实行推广组织机制145.8建立平台产品优化升级服务组织机制156.医疗卫生信息大数据建模描述和分析156.1 咱们给出有关数据模型166.
2、2 卫计委给出有关数据模型166.3 有关数据特性对比分析197.大数据分析应用平台支持业务主题场景207.1 医疗卫生服务机构应用227.1.1各级医院自身应用237.1.2 基层医疗机构自身应用267.1.3 区域卫生医疗联合体应用267.1.4医疗卫生机构合规应用297.2患者医疗治疗应用317.2.1患者就医过程提示服务317.2.2患者服药提示服务317.2.3患者饮食、运动、习惯注意事项服务317.2.4患者体征和治疗效果服务327.2.5患者交流交往服务327.3个性化医疗服务应用327.3.1基因测序分析应用327.3.2个性化药物应用327.3.3个人健康管理应用337.4慢
3、性病防止治疗应用(疾控中心)347.4.1慢性病检测、发现、预警服务347.4.2慢性病诊断服务357.4.3慢性病防控治疗服务357.5居民健康保健应用(疾控中心)367.5.1居民自我健康保健应用367.5.2政府卫生管理部门进行居民健康管理应用367.5.3政府医疗规划构造进行居民健康保健决策应用367.6医疗卫生管理机构应用(卫生局)377.7医疗保险管理机构应用(医保局)377.7.1基本医疗保险决策支持分析397.7.2基本医疗保险费用单据智能化审核397.7.3基本医疗保险有效支付和治理应用407.7.4基本医疗保险和服务监管应用407.7.5减少看病率提高医疗效果应用407.8
4、医药监管机构应用(药监局)437.9医药研发生产经营应用(医药公司)437.9.1医药研发公司应用437.9.2医药生产公司应用447.9.3医药流通公司应用447.9.4医药零售公司应用467.10医疗卫生资源配备管理规划应用(政府主管部门)467.10.1医疗卫生资源服务现状分析477.10.2医疗卫生资源财务供应能力分析477.10.3医疗卫生资源规划指标对比477.10.4医疗卫生资源政策建议487.11商业医疗保险应用(保险公司)487.11.1获得新客户和保存已有客户分析应用487.11.2有效控制医疗费用分析应用497.11.3商业医疗保险保障设计和精算定价497.11.4商业医
5、疗保险理赔运营管理应用507.11.5商业医疗保险市场和销售拓展应用517.12公共卫生服务应用(卫生防疫中心)527.12.1传染病预警预报537.12.2 公共卫生舆情监测预警537.12.3疾控和保健应用547.13政府监管应用(政府主管部门)547.13.1医药监管应用547.13.2医疗监管应用557.13.3医保监管应用567.13.4医疗服务机构和医生监管应用577.14新型医疗卫生服务应用(政府主管部门)577.14.1远程医疗577.14.2移动医疗577.14.3互联网医疗587.14.4数字医疗587.14.5大数据医疗597.14.6智慧医疗597.14.7精准医疗59
6、8.大数据分析应用平台支持专项大数据应用608.1患者分析(基于电子病历EMR)618.1.1患者数据预解决618.1.2患者个体(个性)分析618.1.3患者群体(记录)分析618.2疾病分析(基于电子病历EMR和电子健康档案EHR)628.2.1常用疾病分析628.2.2慢性疾病分析628.2.3疾病诱因分析628.2.4疾病记录分析628.2.5临床途径分析628.3医生及医护人员分析(基于医疗卫生资源数据)628.3.1医生及医护人员资历资格分析628.3.2医生及医护人员行医记录分析628.3.3医生及医护人员培训进修分析628.4处方分析(基于电子病历EMR)628.4.1医生用药
7、分析638.4.2患者用药分析638.4.3处方用药分析638.4.4医院科室用药分析648.4.5安全用药分析648.4.6处方符合性分析648.4.7处方用药-诊断结论关联分析648.4.8诊断结论-处方总价聚类分析648.4.9患者特性-诊断结论分类分析658.4.10患病时间-诊断结论序列分析658.5居民人口分析(基于电子健康档案EHR)658.5.1居民个体健康分析658.5.2人口群体健康分析658.5.3人口亚健康有关因素关联分析658.5.4人口健康有关因素关联分析658.5.5人口健康时间空间分布分析658.5.6人口健康预测分析658.6药物分析(基于医药产业链数据)66
8、8.6.1药物种类分析668.6.2药物研发分析678.6.3药物生产分析698.6.4药物销售分析698.6.5药物物流分析708.6.6药物资金流分析708.6.7药物信息流分析708.6.8药物库存分析708.6.9药物质量偏差分析738.6.10药物不良反映药物群体不良事件分析748.7医疗健康检查检测分析(基于电子健康档案EHR)748.7.1生理信号检测分析748.7.2医学影像图像分析748.7.3 DNA检测和DNA序列分析748.7.4重要人体征数据分析748.7.5远程自助健康医疗检测分析748.8医疗安全风险分析(基于电子病历EMR)758.8.1医疗安全分析758.8.
9、2医疗风险分析758.8.3假药、过期药、成分异常药使用分析758.8.4医疗事故诱因分析758.8.5医疗安全风险记录分析758.9医疗卫生资源分析(基于政府医疗卫生资源数据)758.9.1医生护理人员分析758.9.2 医院床位分析758.9.3医疗检测检查能力分析758.9.4医疗卫生资源需求分析768.9.5医疗卫生资源匹配度分析768.9.6医疗卫生资源对比分析768.10医疗卫生效果分析(基于电子健康档案HER和医疗卫生资源数据)768.10.1医疗卫生满意度分析768.10.2医疗卫生问题诱因分析768.10.3医疗卫生规划符合度分析769.核心核心技术和算法769.1大数据分析
10、能力779.2大数据分析技术779.3大数据存储技术和系统789.4大数据业务模型建模789.5大数据实时查询809.6大数据复杂分析8110.用医疗卫生大数据为业务服务8310.1核心理念8410.2管理闭环8411.将来市场前景分析8612.总结87医疗大数据分析应用平台产品解决方案(草稿)本应用平台产品总体方案思路是:基于当前医疗服务机构及有关机构已有HLI、NHLI、HIS等关于系统形成并积累医药医疗大数据和信息,采用最新大数据技术、云计算技术、BI和数据挖掘技术,形成对医疗行业具备新视角、全方位、智能性、预测性、可视性深层次展示分析效果(Insight),揭示医疗行业整体规律和内在发
11、展趋势,揭示患者个体独有特质并形成个性医疗,将医疗行业宏观大势与每个患者微观个体定性定量描述有机结合,达到支撑和形成医疗行业新应用场景和新服务模式。“医药医疗大数据”是具备更强决策力、洞察发现力和流程优化能力海量、高增长率和多样化信息资产,但需要新计算解决模式。1. 背景简介依照国际知名分析机构Gartner给出定义:大数据就是那些具备规模大、速度快、种类多三大特性数据资产。大数据分析从海量数据中筛选出有用信息,然后通过各种手段将信息转化为洞察力,从而做出对的决策,并最后推动业务发展。通过一系列分析解决,大数据可以协助公司制定明智且切实可行战略,获取前所未有客户洞察,支持客户购买行为,并构建新
12、业务模式,进而赢得竞争优势。随着人们生活水平不断提高,健康也越来越受到家庭关注。 年2 月27 日,国内卫生部发布第四次国家卫生服务调查成果显示,截止至 年,国内居民脑血栓,糖尿病,高血压等慢性病病例数达到2.6亿,占全国总人数20%,其中高血压病人对自身疾病知晓率只有30%,同步这些病人中治疗率只有25%,控制率仅为6%,糖尿病病人中,能坚持做到规范治疗也只有33%。由此咱们可以看出,建立科学、规范、高质量慢性病管理方略,实现对人体慢性病监护具备重大意义。通过慢性病初期诊断和监护,不但能提前防止和控制各种疾病,还能协助她们合理用药,减少医药开支。另一方面,国内公共医疗卫生资源紧缺,城乡医疗卫
13、生资源差距比较大,都市人口平均拥有医疗卫生资源是农村人口2.5倍以上,例如,占全国总人口近70%农村拥有全国医疗卫生资源30%,而占全国总人口30%都市却占有全国医疗卫生资源70%,优质医疗卫生资源集中分布在都市,特别是大都市。因而,实现城乡之间医疗卫生资源共享成为丞待解决重要问题。同步,随着国家积极倡导“3521”医疗系统建设,国内医疗领域信息化限度得到了很大提高,预测在全国会浮现上百个医疗数据中心,每个数据中心都将承载近1000 万人口医疗数据,数量多、更新快且类型繁杂,使医院数据库信息容量不断膨胀,这就产生了医疗大数据。医疗大数据普通具备如下特性:(1) 数据巨量化:区域医疗数据普通是来
14、自于拥有上百万人口和上百家医疗机构区域,并且数据呈持续增长趋势。依照医疗行业有关规定,患者数据普通至少需要保存50 年。(2) 服务实时性:医疗信息服务中会存在大量在线或实时数据分析解决需求。例如:临床中诊断和用药建议、健康指标预警等。(3) 存储形式多样化:医疗数据存储形式各种各样,例如各种构造化数据表、非( 半) 构造化文本文档、医疗影像等。(4) 高价值性:医疗数据对国家乃至全球疾病防控、新药研发和顽疾攻克均有着巨大作用。因而,如何在海量医疗大数据中提取信息能力正迅速成为战略性发展方向,通过大数据分析挖掘出有价值信息,将对疾病管理、控制和医疗研究均有着非常高价值。当前,大数据、云计算是已
15、经普及并成为IT 行业主流技术。国内外都已经进入了大数据、云计算研究热潮,同步大数据、云计算技术也逐渐成熟,大规模区域医疗信息系统和大型数据中心建立也在同步进行。而云计算是大数据成长驱动力,与此同步,由于医药医疗大数据越来越多,对云计算需求日益增长,因此两者是相辅相成。随着医疗数据急剧增长,如何充分运用这些数据,运用大数据、云计算技术,搭建合理先进数据云服务平台,为广大患者、医务人员、科研人员提供服务和协助,必将成为将来信息化工作重要方向。“大数据时代”已经降临,“大数据”正在对每个领域都导致影响。在商业、经济及其她领域中,决策行为将日益基于数据和分析成果,而非基于经验和直觉;而在公共卫生、经
16、济发展和经济预测等领域中,“大数据”预见能力也已经崭露头角。3月,美国政府发布了“大数据研发筹划”(Big Data Research and Development Initiative)。该筹划目的是改进人们从既有海量和复杂数据中获取知识能力。其中,与医疗卫生领域有关有生物传感2.0、虚拟实验室环境(VLE)、癌症基因组图谱(TCGA)、神经科学信息框架(NIF)、患者报告成果测量信息系统(PROMIS) 等10 余项。美国公共数据开放项目OpenFDA上线之后,先导项目开放了“300万份药物不良反映报告”,这些数据是至间被提交给FDA药物不良反映和医疗过错记录。对医疗机构来说,不良反映和
17、医疗过错记录起到是长远贡献作用,能减少医疗悲剧重现。依照国内居民第三次死因调查报告显示,脑血管病已成为居民第一死因。脑卒中发病率正以每年8.7%速率上升,国内每年用于治疗脑血管病费用约在100亿元以上。,GE医疗中华人民共和国联合国家卫生计生委脑卒中防治工程委员会(脑防委)启动了“脑卒中行动”合伙战略。GE医疗“脑卒中行动”法宝之一就是大数据。特别是GE构建三级筛查网络,对双侧内膜增厚高危人群检出率提高了近10%。GE搭建脑卒中信息管理系统可以与医院Lis和His系统全面对接,记录患者基本信息、初筛信息、复筛信息、用药信息、实验室检查、体格检查信息及其随访信息等,全面跟踪患者诊治流程。还可以与
18、PACS系统对接,全面记录患者影像学信息,实现患者影像信息共享。同步,可对患者全流程疾病影像信息回顾,减少患者重复检查承担,协助医生对患者疾病信息全面判断。在上述这些大背景下,我司提出并筹划研发“医疗大数据分析应用平台”(如下简称“本平台”)产品,以期为国内医疗卫生实现数字医疗、智慧医疗、健康医疗发挥重要作用。从而达到:服务模式(以患者为中心,形成居民健康全过程服务),从被动到积极;医疗模式(以防止为主,人人享有基本医疗卫生服务,将医疗卫生工作重点由后治前移到防止保健),从治病到防病;诊断模式(避免各自为政,实行上下联合,专业分工),从排斥到联动;数据模式(从业务系统数据向整体数据转变,变化过
19、去数据不统一、不互通、不共享),从隔离到整体;技术模式(采用各种新技术手段,涉及大数据、云计算、物联网、移动互联等,形成技术合力),从简朴到综合转变。2. 产品愿景形成充分发挥大数据技术,针对医疗医药行业,能充分适应医疗卫生信息特性大数据分析应用支撑平台,通过大数据分析,达到发现知识、发现规律、预测将来,将医疗卫生行业推动进入大数据时代提供技术可行性。3. 产品定位本平台以医疗卫生行业整体数据架构(数据模型、数据构成、数据关系)为基本和原则,以相应医疗卫生业务数据为输入,通过大数据技术,形成针对医疗卫生行业中不同机构、角色和业务活动智能化应用,因而本平台不是代替已有医疗卫生信息化系统,而是在各
20、种方面强化已有医疗卫生信息化系统,涉及任意查询、即兴分析、业务增强、规则约束、预测将来、发现知识,并提供互动性、及时性、预知性、洞察性,从而达到实现智慧医疗目的。3.1解决问题当前医疗卫生信息化建设重要问题是各个区域内不同医疗机构中患者基本信息和各种临床信息资源分散、重复、孤立,导致有效信息闲置、信息重复或不一致,很难得到有效运用。通过本平台实现国家医疗卫生信息化规划中“4631-2”三大基本数据库,即电子健康档案数据库、电子病历数据库和全员人口个案数据库应用落地;通过本平台实现智慧医疗核心某些,即医疗卫生服务体系智能化,使医疗卫生各种应用提高水平;通过本平台为“看病难、看病贵”解决提供科学定
21、量判断根据、对比分析根据和方案效果评价根据;3.2达到效果本平台预期布置到云平台上运营,采用SOA理念进行架构开发,通过度层将公共大数据算法模型封装为服务,对业务应用提供服务,同步平台业务应用也是服务形式存在,即应用单位不再需要购买布置自己服务器硬软件环境,只需要开通相应服务就可以了。各个应用单位依照自己业务需要定制服务,平台支持“开通即用”服务模式,为实现业务应用集成,本平台将对外支持Web Service方式接口服务。本平台但愿将医疗卫生智慧功能应用普及到业务角色和过程方方面面,涉及医生(涉及专科医生、全科医生、保健医生等)、患者(涉及慢性病患者、潜在患者等)、管理者(涉及医疗管理者、医疗
22、保险管理者、医药监管管理者、公共卫生管理者等)、医药经营者(药物研发、药物生产、药物物流、药物零售等)以及商业医疗保险经营者(健康险、大病险、医疗意外险等)。4. 产品理念医疗卫生、健康保健、医药器械形成海量数据就象一座待开发金矿,运用大数据技术、云计算技术、物联网技术和便携设备技术最新成果,将给医疗卫生事业带来全新革命性变化,明显解决看病难和看病贵问题,达到医疗卫生资源配备分布合理、大病小病治疗各司其职、疾病防止治疗有机结合、公民健康保健全过程覆盖。5. 总体思路通过建立医疗卫生大数据统一原则和规范,形成可被有关业务应用所运用医疗卫生大数据源和交互机制,在此基本上,一方面形成专项大数据应用,
23、这些应用品有跨部门和组织机构通用性,并具备良好稳定性,由于这些应用是面向医疗卫生专项;基于专项大数据应用,依照医疗卫生有关部门和组织机构业务规定,可开发形成各种业务大数据应用,并且随着平台推广,积累医疗卫生业务大数据应用实例将会越来越多,并最后形成不同方向最佳应用样例。5.1对接数据源,获取医疗卫生大数据医疗卫生大数据中心为本平台进行医疗卫生大数据分析提供数据源,但不在本平台范畴内,并平台只是开发提供一套与该数据中心数据读取接口,并具备监控数据读取状况汇总记录和异常提示功能。该数据中心定位:整合区域内不同医疗机构中患者/健康人群各种临床诊断数据、健康数据,在相对集中逻辑/物理环境中,构建一种以
24、存储和解决患者/健康人群诊断信息为核心,覆盖多学科、多专业面向区域内重要卫生行政主管部门、临床医疗机构和社会公众医学(医药、医疗、健康)信息资源共享机制-区域性医学数据中心。区域性医学数据中心建设以行政业务解决、医疗、防止、保健、康复为服务主线,以健康人群和患者医疗活动需求为基本。区域卫生数据中心通过制定原则数据接口,建立基于广域网信息互换、数据采集和传播机制,对区域内医疗卫生信息数据进行采集、传播、清洗和汇总,将医院、社区、医药公司以及公共卫生机构各类数据、系统有机地整合起来,生成区域卫生大数据。5.2对获取医疗卫生大数据预解决机制医疗卫生大数据预解决重要完毕对已接受数据辨析、抽取、清洗等操
25、作,目是将数据按统一格式提取出来,然后再转化,集成,载入数据仓库工具 (ETL) 涉及:抽取:因获取数据也许具备各种构造和类型,数据抽取过程可以协助咱们将这些复杂数据转化为单一或者便于解决构型,以达到迅速分析解决目;清洗:对于大数据,并不全是有价值,有些数据并不是咱们所关怀内容,而另某些数据则是完全错误干扰项。 因而要对数据通过过滤“去噪”从而提取出有效数据。5.3建立医疗卫生大数据存储机制虽然关系型数据库系统(RDBMS)在安装和使用上依然占有重要地位,但毋庸置疑,非关系型数据库NoSQL技术已经成为今天发展最快数据库技术。NoSQL是对数据库系统总称,在某种限度上,它性能和用途也许完全不同
26、。当前除了关系型数据库外,还重要存在有如下四种NoSQL数据管理系统:键值数据库:当数据以键形式访问时,例如通过国际原则书号ISBN找一本书,键值数据库是最抱负。在这里,ISBN是键,书籍其她信息就是值。必要懂得键才干查询,但是值是一堆无意义数据,读取之后必要通过翻译。文档数据库:该数据库以文档形式管理和存储数据。有点类似于键值数据库,但文档数据库中数据有构造。与键值数据库中值是一堆无意义数据不同,文档数据库中数据以文档构造被描述,典型是JavaScript Object Notation (JSON)或XML。文档存储数据库中数据可以通过定义任何模式进行查询,但键值数据库只能通过它键进行查询
27、。列式数据库:也被称为列式存储或宽列存储,一改之前行式存储方式,对数据进行列式存储。在老式关系型数据库中,数据经常以行来访问。以列式管理记录NoSQL数据库可以管理大规模动态列。由于没有固定模式,因此列名和键可以变换。列式数据库合用于不经常写状况,要满足ACID(原子性、一致性、隔离性和持久性)规定并不难,并且模式是变化。图型数据库:图型数据库关注值与值之间关系,用图型数学概念存储数据。图型数据库用带有点、边沿和属性图构造表达和存储数据。在图型数据库中,每一种元素都包括一种直接指向它毗邻元素点,因此也就不需要索引查找。每个种类NoSQL数据库均有合用不同类型应用程序和用例,这就涉及到一种NoS
28、QL社区惯用一种话题,即多样持久性,或者说依照数据库解决应用程序需求不同,使用不同数据库系统,用于不同应用程序和用例。5.4医疗卫生大数据解决和分析算法分类和形成l 技术分类办法 依照挖掘任务:分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等; 依照挖掘对象:可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web; 依照挖掘办法:可分为:机器学习办法、记录办法、神经网络办法和数据库办法。l 重要解决和分析技术 预言解决:用历史预测将来; 挖掘规律解决:理解数据中潜在
29、规律; 关联分析:查找存在于项目集合或对象集合之间频繁模式、关联、有关性、或因果构造; 序列模式解决:给定一种由不同序列构成集合,其中,每个序列由不同元素按顺序有序排列,每个元素由不同项目构成,同步给定一种顾客指定最小支持度阈值,序列模式挖掘就是找出所有频繁子序列,即该子序列在序列集中浮现频率不低于顾客指定最小支持度阈值; 分类(预言)分析:预测分类标号(或离散值),依照训练数据集和类标号属性,构建模型来分类既有数据,并用来分类新数据。建立持续函数值模型,例如预测空缺值; 聚类分析:聚类是一种无监督分类法:没有预先指定类别。在同一种类中,对象之间具备相似性;不同类对象之间是相异度分析;把一种给
30、定数据对象集合提成不同簇。将物理或抽象对象集合分构成为由类似对象构成各种类;聚类在不同应用领域,用作描述数据,衡量不同数据源间相似性,以及把数据源分类到不同簇中;聚类是将数据分类到不同类或者簇这样一种过程,因此同一种簇中对象有很大相似性,而不同簇间对象有很大相异性;聚类与分类不同,聚类所规定划分类是未知; 异常检测分析:异常检测是数据挖掘中一种重要方面,用来发现”小模式”(相对于聚类),即数据集中间明显不同于其他数据对象; 可视化分析。数据可视化可以让数据自己说话,让顾客直观感受到成果; 数据挖掘算法。分割、集群、孤立点分析尚有各种算法让咱们精炼数据,挖掘价值。这些算法要可以应付大数据量,同步
31、还具备很高解决速度; 语义引擎。人工智能从数据中积极地提取信息。涉及机器翻译、情感分析、舆情分析、智能输入、问答系统等; 数据质量和数据管理。透过原则化流程和机器对数据进行解决可以保证获得一种预设质量分析成果。5.5开发专项大数据分析,形成专项大数据应用面向医疗卫生专业所特有专项,开发形成一系列专项大数据应用。在充分调研和分析医疗卫生行业业务特性基本上,研发形成具备国内医疗卫生行业特性分类专项大数据分析,并依照专项构成和业务功能规定形成满足该业务专项大数据应用,如心脏病专项大数据应用,涉及其成因大数据分析、其寻常行为对病情影响大数据分析等,为关于机构进行心脏病关于活动(预测、防止、治疗、恢复)
32、提供支撑。5.6开发机构大数据分析,建立机构大数据应用面向不同医疗卫生机构和部门及其有关公司机构,开发形成针对不同机构和部门业务机构大数据应用,如医疗卫生机构应用、医疗卫生管理机构应用等。在上述专项大数据应用基本上,结合所承担有关医疗卫生及其有关机构项目,进行机构大数据应用定制开发。5.7建立平台应用实行推广组织机制在本平台开发和布置基本上,逐渐形成基于本平台开发应用项目实行推广组织机制,涉及市场宣传、营销推广、实行维护和售后服务等。5.8建立平台产品优化升级服务组织机制本平台作为公司主打产品系列,要建立严格版本控制,并依照市场反馈和内部技术发展,进行有筹划平台版本升级,并将新版本升级信息和文
33、档,按规定规定告知已有顾客,并及时进行产品升级,并提供维护服务。6. 医疗卫生信息大数据建模描述和分析随着着中华人民共和国医疗卫生服务信息化进程推动,将产生大量数据。这些数据重要来源于医疗业务活动、健康体检、公共卫生等9项医疗卫生服务。数据内容涉及来自医院大量电子病历、区域卫生信息平台采集居民健康档案等。其中大量充斥着非构造化/半构造化数据,涉及图像,office文档,以及XML构造文档等。医疗大数据应用,核心是整合所有也许得到这些数据,为机构和政策制定者来找到如何刺激经济并减少共享数据技术门槛。6.1 咱们给出有关数据模型国内医疗卫生行业涉及数据实体对象种类非常众多,涉及医疗机构科室医生(门
34、诊、住院)、大众群体患者、医疗管理部门卫生局疾控中心医保中心发改委中医药管理局、医药管理部门药监局、医药研发医药生产医药经营药物(处方药、ODC药)、医疗器械研发医疗器械生产医疗器械经营医疗器械、商业医疗保险公司、体检中心体检医生、APP服务等。如下图所示。6.2 卫计委给出有关数据模型 年终,原卫生部完毕了“十二五”卫生信息化建设工程规划编制工作,初步拟定了国内卫生信息化建设路线图,简称“3521-2工程”,即建设国家级、省级和地市级3级卫生信息平台,加强公共卫生、医疗服务、新农合、基本药物制度、综合管理等5项业务应用,建设健康档案和电子病历2 个基本数据库和1 个专用网络建设,进行医疗卫生
35、信息原则化体系和安全保障体系2个体系建设。11月,卫生部和计生委合并后,信息化建设工程规划顶层设计规划又调节为“4631-2工程”,其中,“4”代表4级卫生信息平台,分别是:国家级人口健康管理平台,省级人口健康信息平台、地市级人口健康区域信息平台及区县级人口健康区域信息平台;“6”代表6项业务应用,分别是:公共卫生、医疗服务、医疗保障、药物管理、筹划生育、综合管理;“3”代表3个基本数据库,分别是:电子健康档案数据库、电子病历数据库和全员人口个案数据库;“1”代表1个融合网络,即人口健康统一网络;最后一种“2”是人口健康信息原则体系和信息安全防护体系。依托中西医协同公共卫生信息系统、基层医疗卫
36、生管理信息系统、医疗健康公共服务系统打造全方位、立体化国家卫生计生资源体系。卫计委规划三大基本数据库互有关系和涉及重要数据如下图所示。电子健康档案数据架构是以人健康为中心,以生命阶段、健康和疾病问题、卫生服务活动(或干预办法)作为三个纬度构建一种逻辑架构,用于全面、有效、多视角地描述健康档案构成构造以及复杂信息间内在联系。通过一定期序性、层次性和逻辑性,将人毕生中面临健康和疾病问题、针对性卫生服务活动(或干预办法)以及所记录有关信息有机地关联起来,并对所记录海量信息进行科学分类和抽象描述,使之系统化、条理化和构造化。个人健康档案三维概念模型,可以清晰地反映出每个个人不同生命阶段、重要疾病和健康
37、问题、重要卫生服务活动三者之间互相联系。同步,坐标轴上三维坐标连线交叉所圈定空间位置(域),表达了人在特定生命时期、因特定健康问题而发生特定卫生服务活动所需记录特定记录项集。由于三维空间中任意一种空间位置都相应着某个特定健康记录,从而构成了一种完整、立体健康记录,这些健康记录全面地反映了个人健康档案内容全貌。l 第一维(X轴):生命阶段按照不同生理年龄可将人整个生命进程划分为持续若干生命阶段,如:婴儿期(01岁)、幼儿期(13岁)、学龄前期(36岁)、学龄期(612岁)、青春期(1220岁)、青年期(2145岁)、中年期(4660岁)、老年期(60岁以上)等八个生命阶段。也可以依照基层实际工作
38、需要,将人群化分为:小朋友、青少年、育龄妇女、中年和老年人。l 第二维(Y轴):健康和疾病问题每一种人在不同生命阶段所面临健康和疾病问题不尽相似。拟定不同生命阶段重要健康和疾病问题及其优先领域,是客观反映居民卫生服务需求、进行健康管理重要环节。l 第三维(Z轴):卫生服务活动(或干预办法)针对特定健康和疾病问题,医疗卫生机构开展一系列防止、医疗、保健、康复、健康教诲等卫生服务活动(或干预办法),这些活动反映了居民健康需求满足限度和卫生服务运用状况。个人健康档案(EHR)基本构造6.3 有关数据特性对比分析从医药医疗健康大数据分析应用角度,本平台需要一种尽量全和细数据集合,因此抱负状态是结合上两
39、某些数据内容形成超集集合,甚至涉及某些非医疗健康数据,如考察研究某种药对某种疾病医疗效果时,如果能获得本地气象天气信息,也许分析出成果将明显不同。此外可以看出当前所给数据都是构造化数据,如果从大数据分析应用角度,抱负数据还应当涉及图像、图形、文本等半构造和非构造数据,以及非关系数据(多维数据),才干构成满足医药医疗健康大数据分析应用需求。 年以来,国内医疗数据生成和采集重要局限于各大医院。近几年,随着社区系统、新农合系统、村卫生室系统等基层医疗卫生信息系统逐渐上线,医疗卫生数据源头也越来越多,数据量越来越大。从卫生服务类型看,区域卫生信息类型重要有:医疗服务类、公共卫生服务类、社区卫生服务类、
40、卫生业务类、卫生管理服务类数据。依照估算,中华人民共和国一种中档都市(1千万人口规模)50 年所积累医疗卫生数据量就会达到10PB级。随着各地区域卫生信息平台建设,存储于各医疗卫生机构数据将逐渐通过各种方式实现整合与共享。多维数据由于医疗数据是各种数据源数据汇总,数据之间关系非常复杂。如下图所示:以患者为中心服务需要把一种患者全周期数据按照时间轴排列,并分析诊断、用药和患者生命体征、检查检测值之间关联;以医生为中心服务又需要把与医生有关患者数据挑拣出来,并进行分类;以科室为中心服务也许需要既从科室所属医生角度,又要从在该科室就诊患者角度进行分析;针对社区服务也许需要记录整个社区居民某项指标(例
41、如血压、血糖)达标率。医疗数据多维度、多粒度为各种信息服务多角度、多层次分析提供了也许,但同步也为大数据分析带来了挑战。由于不也许为每一种信息服务存储一份特定优化模式数据,况且也无法枚举出所有也许信息服务需求。这就需要医疗数据存储模型可以适应灵活多变多维记录分析需求。7. 大数据分析应用平台支持业务主题场景本平台支持业务主题应用场景将尽量以国务院发布全国医疗卫生服务体系规划纲要()内容和目的为根据,即“优化医疗卫生资源配备,构建与国民经济和社会发展水平相适应、与居民健康需求相匹配、体系完整、分工明确、功能互补、密切协作整合型医疗卫生服务体系,为实现基本建立覆盖城乡居民基本医疗卫生制度和人民健康
42、水平持续提高奠定坚实医疗卫生资源基本。”最后形成国内医疗卫生服务体系总体布局,如下图。本平台将以患者个人生命全周期、个人疾病全周期、医疗卫生服务、医药供应链所产生大数据源为主,以支持个人、医疗卫生服务机构、医药生产经营公司、医疗卫生管理机构、医疗保险机构、公共卫生服务机构、医药监管机构等业务大数据应用为重要应用场景。以个人为中心全生命周期阶段划分,如下图:医疗卫生服务也从局限于医院内部检查、诊断和治疗,扩展到未病、病前和病后全过程医疗卫生活动。这些活动如下图:7.1 医疗卫生服务机构应用医疗卫生服务机构要实现业务信息智慧洞察目的,必要使用恰当技术架构平台来支持业务数据分析系统。办法涉及应用大数
43、据、数据仓库和商业智能技术,集成医院各类数据资源,实现医疗服务机构各类管理指标预警监控,并提供多维综合分析平台。从而应用大数据解决和商业智能技术,分析挖掘医院运营各个方面信息数据,通过预警监控、多维联机分析等技术手段,可以有效地提高医院医疗质量,提高医院科学管理水平,辅助管理层决策。7.1.1各级医院自身应用医院核心业务每天产生大量医疗数据,具备丰富价值,通过数据挖掘等手段分析,构成指引决策数据,这对医院发展、决策非常重要。“当前一种医生,最多能管理30个糖尿病患者,但是大数据研究一做出来,一种医生能管理200个糖尿病患者,光这一种应用,咱们就可以增长七倍生产力。”通过全面分析患者特性数据和疗
44、效数据,然后比较各种干预办法有效性,可以找到针对特定患者最佳治疗途径。通过对在患者档案方面大数据分析,可以拟定哪些人是某类疾病易动人群,使她们尽早接受防止性干预。这些办法也可以协助患者选取恰当治疗方案。 临床决策支持分析:大数据分析将使临床决策支持系统更智能,这得益于对非构造化数据分析能力日益加强.例如:可以使用图像分析和辨认技术,辨认医疗影像数据,或者挖掘医疗文献数据建立医疗专家数据库,从而给医生提出诊断建议此外,临床决策支持系统还可以使医疗流程中大某些工作流向护理人员和助理医生,使医生从耗时过长简朴征询工作中解脱出来,从而提高诊断效率。l 就诊人数及走势分析,使医院管理人员及时精确地理解各
45、科室工作量,有效地指引筹划、人员筹划及药物材料筹划,大大增进对将来工作量把握度;l 药物材料消耗及供应商分析,指引医院采购行为;l 医疗能力分析:医院各级领导及时精确地理解各科室医疗能力状况,治愈率和好转率;l 医疗效率分析,分析人均住院时间、人均治疗时间等,对各科室效率进行分析;l 库存分析,用于理解西药、中药、材料库存状况,指引资源使用;l 医疗质量分析,涉及对门诊质量、住院质量、检查质量等分析。 医疗数据可视化分析:依照医疗服务提供方设立操作和绩效数据集,可以进行数据分析并创立可视化流程图和仪表盘,增进信息透明流程图目的是辨认和分析临床变异和医疗废物来源,然后优化流程。仅仅发布成本!质量
46、和绩效数据,虽然没有与之相应物质奖励,往往也可以增进绩效提高,使医疗服务机构提供更好服务,从而更有竞争力。公开发布医疗质量和绩效数据还可以协助病人做出更明智健康护理决定,这也将协助医疗服务提供方提高总体绩效,从而更具竞争力。 医学图像挖掘分析:医学图像(如CT,!MRI,PET等) 是运用人体内不同器官和组织对X 射线!超声波!光线等散射、透射、反射和吸取不同特性而形成它为对人体骨骼、内脏器官疾病和损伤进行诊断!定位提供了有效手段 医学领域中越来越多地使用图像作为疾病诊断工具。 DNA分析:随着人类基因组筹划开展产生了巨量基因组信息,区别DNA序列上外显子和内含子成为基因工程中对基因进行辨认和
47、鉴定核心环节之一。使用有效数据挖掘办法从大量生物数据中挖掘有价值知识,提供决策支持 当前已有大量研究者努力对DNA数据分析进行定量研究,从已经存在基因数据库中得到导致各种疾病特定基因序列模式。某些DNA分析研究成果已经得到许多疾病和残疾基因,以及新药物!新办法发现。 合理用药应用分析:为临床医药卫生技术人员提供了一种有效掌握、以便查询、可运用价值高权威信息源,为临床医药卫生技术人员节约大量时间、实现医疗专业人员对临床药物信息有效掌握和运用、提高临床人员合理用药专业水平、减少用药差错,避免医疗纠纷。 医药药物分析:分析医院用药状况,涉及税金占比、处方用药、大处方(500元-1000元处方、1000元以上处方)、抗生素使用、医嘱用药等详尽分析,可以详细查到每个医生每张处方用药状况,以及医院药物使用排名、医