收藏 分销(赏)

2023医疗大数据白皮书 -数据资产化 大数据新基建 开启千亿市场序幕.pdf

上传人:Stan****Shan 文档编号:1300478 上传时间:2024-04-22 格式:PDF 页数:57 大小:6.88MB
下载 相关 举报
2023医疗大数据白皮书 -数据资产化 大数据新基建 开启千亿市场序幕.pdf_第1页
第1页 / 共57页
2023医疗大数据白皮书 -数据资产化 大数据新基建 开启千亿市场序幕.pdf_第2页
第2页 / 共57页
2023医疗大数据白皮书 -数据资产化 大数据新基建 开启千亿市场序幕.pdf_第3页
第3页 / 共57页
2023医疗大数据白皮书 -数据资产化 大数据新基建 开启千亿市场序幕.pdf_第4页
第4页 / 共57页
2023医疗大数据白皮书 -数据资产化 大数据新基建 开启千亿市场序幕.pdf_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、前言前言过去十年,国内医疗大数据产业从零开始发展,如今已然初具规模。但受地域政策、数据伦理等因素影响,整个产业一度在 2019 年抵达巅峰,随后陷入停滞,直至今年才又重新复苏。推动产业回到“高速公路”的动力主要分为两个层面。政策层面,“十四五”大数据产业发展规划出台,数据被重新界定为“生产要素”,重要性直接升至国家战略高度;“数据二十条”的发布与国家数据局的建立,为大数据产业基础制度体系指明建设方向,确立指导制度建设责任主体。技术层面,新兴的大语言模型、生成式 AI 借助底层逻辑的重构带来了一批类似 Chat GPT的“杀手级应用”,反哺上游大数据产业发展。该趋势下,医疗数据持有方开始进行主动

2、改革,规模化开展医疗数据治理,为未来可能的数据资产化做好准备。多重因素复合之下,医疗大数据产业迎来重大发展机遇。为了厘清医疗大数据的发展现状及未来价值,蛋壳研究院此份报告,全面梳理医疗大数据产业,绘制医疗大数据的产业前景。核心观点核心观点一、因担忧数据因素、数据安全方面的风险,医疗大数据产业在 2020 年前一直重基建而轻应用,但自 2020 年开始国家政策风口开始转向,“数据二十条”发布、国家数据局建立,均在推动医疗大数据朝着标准化、产业化的方向发展,进而建立完善的交易体系。二、伴随信息技术和网络技术的跨越式发展,现代医院的运营特征表现为医疗业务的智能化与应用部署的敏捷化,使得医院业务产生的

3、信息朝着复杂化、专业化、海量化的方向发展,并对各系统之间的互联互通提出更高层级的要求。因此,部分医院开始转变信息化建设思路,借助云技术打造新一代医院数据中心,综合利用各类数据服务临床、决策和科研过程,提高医院管理的科学化、规范化、精细化水平,由此创造了一个千亿级的新兴医疗 IT 市场。三、尽管基础设施已经初具规模,但多数医院大数据应用开拓情况仍处于低位,三级医院应用数量占比不足 20%,二级医院应用数量占比不足 5%。因此,在大数据应用供不应求的情形下,在找到有效商业模式的前提下开拓大数据应用是医疗 IT 公司面临的重要机遇。四、大语言模型(LLM)的出现为医疗大数据产业确立了新的增长点。目前

4、医疗垂直大模型使用的数据仍局限于互联网医疗过程中产生的行为数据,未来若能将临床数据规模化纳入其中,国内医院的智能化建设将进一步加速。目录第一章:数据基础建设即将确定,数据资产化亟待破解.11.1 聚焦医院:产生医疗大数据发展问题的原因.21.2 聚焦政策:政策频出,医疗大数据宏观环境迎来多轮利好.31.3 数据资产化,需打通四重要素.5第二章:基建扩容,千亿市场的根基.72.1 新一代医院数据中心开启千亿市场序幕.92.2 影像补位,AI 企业成为基建主角.122.3 临床科研发力,科研药研加速数据库建设.132.4 物联网、AI 支持的医院智慧后勤.172.5 大数据赋能的智慧医学教育.18

5、2.6 医院大数据中心建设的常见问题探讨.19第三章:应用创新,数字医疗建设进行时.223.1 临床大数据应用.233.2 运营大数据应用.263.3 院外其他大数据与应用.30第四章:数据安全,成为应用推广的必要保障.354.1 医疗大数据安全现状.364.2 大数据安全体系的构建.374.3 数据安全的保障逻辑.38第五章:前沿讨论,大语言模型的构建与数据交易的可能.415.1 讨论一:LLM 对于多模态大数据治理的潜在影响.425.2 讨论二:应用级医疗大数据的交易可能.43第六章:企业价值,助推医疗信息化进程的重要力量.47参考目录:.53122014 年,为推动整体化卫生信息系统建设

6、,国家卫计委规划了开创性的“46312”工程。意在搭好医疗大数据基础设施建设的骨架,将碎片化的“大量医疗数据”转化为规范、可用的“医疗大数据”。图表 1 国家卫计委规划的“46312”工程数据来源:蛋壳研究院这是一种“自上而下”的建设模式。沿着这一路径进行推进,框架内的卫生信息平台、基础数据库、融合网络、业务应用、信息安全防护体系、人口健康信息标准体系相继建立,国家层面的数据基础设施基本建设完毕。不过,完好的顶层架构虽有效推动了区域、医院的大数据相关建设,但却未能全面覆盖整个大数据产业。实际之中,这些建设更多围绕基础设施展开,真正能够传递价值的应用部分相较式微,没有达到等同于基础设施建设的投入

7、规模。探索这一问题的成因及现阶段的解决之道是本报告的研究目的之一。本章之中,我们将从多个角度分析限制医疗大数据的关键要素,并回答“医疗大数据前景几何”这一问题。1.11.1 聚焦医院:隐私与认知制约医疗大数据发展聚焦医院:隐私与认知制约医疗大数据发展千禧年后的第二个十年,移动医疗、人工智能等前沿技术的发展唤起医疗数据的需求。作为算法、算力、数据三要素中最常见但又最难获取的要素,医疗数据彼时仍以碎片化、非标准化的形态分散于医院各个系统中。为了寻找智能模型所需的养料,大量科技医疗创业公司找到三级医院进行合作,在帮助医院进行数据治理的同时,打造智慧化的临床应用。医院科室的参与、政策对于信息化建设的强

8、制要求,合力促使医院围绕互联互通、智慧医院等方向开启规模化建设。不少医院开始打造医院大数据中心、科研级大数据平台,完成了医3疗大数据基础设施的构造,也与企业合作开发了不少智慧化的应用。但在 2019 年中美贸易争端开启后,包含个人私密信息医疗数据成为关注重点之一。由于对此类数据进行治理、集成、应用存在一定泄露风险,医院与企业的合作目的开始转变。为避免政策风险带来的不确定性,不少医院期望大数据及其研究结果以医院范围为界限展开,使得医疗大数据的研究重心转向医院科研需求。此趋势下,医疗大数据产业转化一定程度减少,医疗大数据行业发展整体放慢。不过,政治因素并非钳制医疗大数据发展的唯一因素,更需关注的是

9、该类建设投资回报及参与度问题。对于绝大多数而言医院而言,院内外规范化的 IT 建设是一项难以计量回报的投资,在缺乏合适的工具估算大数据建设的产出时,医院对于相关投资仍然持有保守态度。此外,要让该项建设发挥价值,医院动用资金支持仅是一部分,更重要的是医院深入了解医疗大数据建设内容,将系统与业务有效融合,才能构造行之有效的大数据体系从目前来看,尽管存在各类标准推动医疗数据的互通互认、治理应用,但只有完整做好每一类场景全流程数据的收集、清洗、归纳、存储都一系列步骤,才能形成多模态、跨流程、可服务于应用的大数据,真正将医疗数据沉淀下来。这个建设过程应由所有相关成员的共同参与的过程,目前医院还需提升主体

10、积极性,实现全流程、高参与度的数据治理。只有将医疗大数据的被动应用转变为主动管理,才能真正用好医疗大数据。1.21.2 聚焦政策:政策频出,医疗大数据宏观环境迎来多轮利好聚焦政策:政策频出,医疗大数据宏观环境迎来多轮利好尽管院内的大数据建设存在诸多问题,但自 2020 开始,政策的加持与技术的推动已在潜移默化中消解这些问题。2020 年 4 月,中共中央、国务院印发关于构建更加完善的要素市场化配置体制机制的意见,将将“数据数据”列为劳动力列为劳动力、土地土地、资本等之外的第五大生产要素资本等之外的第五大生产要素,明确要加快培育数据要素市场,推进政府数据开放共享、提升社会数据资源价值、加强数据资

11、源整合和安全保护,制定出台新一批数据共享责任清单。2021 年 11 月,“十四五”大数据产业发展规划提出了更为精确的总体目标,要求“到到20252025 年我国大数据产业测算规模突破年我国大数据产业测算规模突破 3 3 万亿元万亿元,年均复合增长率保持年均复合增长率保持 25%25%左右左右,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。”2022 年 12 月,中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见4(后简称:数据二十条)对外发布则以构建基础制度为目标以构建基础制度为目标,从数据产权、流通交易、收益分配、安全治理等四个方面,对制定数据基础制度进行了全面

12、部署,最终构建公平与效率相统一的数据要素按贡献参与分配的制度。2023 年 3 月,国家数据局组建完毕,中央网络安全和信息化委员会办公室、国家发展和改革委员会共同管理,两大机构将在后续协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。图表 2 国家数据局的管理义务划分数据来源:蛋壳研究院上述政策中,关于构建更加完善的要素市场化配置体制机制的意见与“十四五”大数据产业发展规划 为医疗大数据的产业化做好背书,有效提升了医疗机构及相关大数据企业的信心。“数据二十条”、成立国家数据局则聚焦于成立良好的市场制度,完善交易流通所需的市场要素,保障大

13、数据市场公平、高效地开展下去。双管齐下,众多政策突显了国家规范发展数据相关产业的决心。技术方面的迭代同样推动着医疗大数据产业的发展。2022 年末,大语言模型(LLM)ChatGPT的火热带动人们重新审视人工智能的价值,并聚焦于背后支撑应用的技术生成式 AI(Generative AI)。2023 年开始,不少医疗 IT 公司、医疗 AI 公司、互联网医疗公司均已开发出自己的大语言模型,并尝试在医院场景之中开发各项新式 AI 应用。拆解这一新兴人工智能仍是算法、算力、数据、知识四要素,但对于国内企业而言,算法部分均用的开源模型,算力可以根据需求购置 GPU 实现,知识可以通过向权威知识库购买或

14、达成战略合作得到,唯独数据需要企业与医院达成合作,在脱敏、不出院的情况下训练模型。政策与技术双向驱动,医疗大数据产业再度火热。如今,更多医院开始参与大数据基础及应用建设,大企业们也嗅到风向,广泛参与其中,为产业注入新的活力。51.31.3 数据资产化,需打通四重要素数据资产化,需打通四重要素宏观条件完备后,微观层面同样需要跟进,即需要各个医院一改过去满足政策要求、被动建设的模式,主动参与到医疗大数据的相关建设中。目前,医管部门通过强化医院对于科研相关能力的要求,促使医院主动收集数据推动回顾性试验研究、前瞻性试验研究,已经一定程度推动医院转向主动数据治理。而要进一步提升这一主动性,转变医院对于医

15、疗大数据的认知态度,则需推动数据资产化,将医疗大数据的治理工程由成本项转变为收入项,让医院医生将数据视作一种极具潜力的资产。这是一个极具挑战的转变。回顾劳动、土地、资本等生产要素形成的市场,流通是其最大化价值实现的必经之路。对于数据这类新式生产要素,怎样保证流通过程的安全顺畅,怎样保障要素市场的公平稳定等问题,需要多个参与方协力解决。目前,限制数据流通的核心要素可归纳为以下五点。数据要素服务相关制度亟需完善数据的交易流通需要数据归属、定价、交易、权益分配、安全等基础制度的保障。当前制度尚未形成统一的保护机制,从国家到省市再到区县,跨委办局、垂管系统的数据共享仍然困难。国家数据局或在未来解决统筹

16、建设的问题,推动各项数据标准的制定,但从成立到发挥关键作用,尚需时日化解从理论到实践过程中遭遇的种种问题。缺乏有效的数据归属权界定标准目前尚无法律法规对医疗数据的归属权进行界定。有观点认为医疗大数据反映的是个人的健康状况,理应属于患者个人;有观点认为医疗大数据是由医院采集、录入才能产生的,存储和保存也在医疗机构,理应属于医疗机构;还有观点认为医疗数据的所有权在于患者个人、控制权在于医院、管理权在于政府,第三方机构需借助政府支持和医院配合方能对其进行商业化开发和利用。一方面,模糊的数据归属权可能导致利益分配纠纷,进而提高数据流通成本。因此,产业必须及早明确数据归属权并建立合理的分配制度,保障数据

17、流通的公平公正公开。另一方面,由于数据易复制的特性,数据提供给其他实体后,两者是价值关系,而不是一次性收益。因此,需要法律法规确保供应商获得应得、持续的收益流。市场机制尚无法满足流通交易需求6数据的需求方和数据的拥有方当前没有合适的发现对接机制,市场没有形成上下游的关系。专利权和著作权有国家知识产权保护,数据权益当前缺少相应法律法规的保护。虽然国内已有不少大数据交易所开始运营,但数据要素流通市场整体形式仍较为单一,通过交易所挂牌数据较少,从量和质上都无法满足数据市场的需求。相较之下,大量的场外数据交易市场活跃,但缺乏有效监管和安全保障。医疗方面,已有不少交易所将为“医疗卫生”数据设置交易品类,

18、但绝大部分交易所该品类下并无供应商品,仅贵州大数据交易所上架了一款“儿童构音障碍早筛语音数据”的产品,售价 25 万元,仅交易两笔。图表 3 儿童构音障碍早筛语音数据截图数据来源:蛋壳研究院要解决这一问题,数据交易市场必须建立以政府为主导、市场化的数据要素交易机构和服务平台组成的体系。数据供应方进行有效的数据归集、加工;交易中心提供供需对接服务,实现数据升值、数据变现,监管机构保障市场监管和质控,营造良好的流通环境。总的来说,我国数据要素流通市场仍处于发展的初级阶段,在数据交易需求持续高涨的趋势下,一方面需要国家主导完善数据要素服务相关制度,引导培育数据要素交易市场,另一方面也需培养更多供应商

19、丰富数据供应体系,并加大数据交易所传播力度,最终实现在有效市场支撑下的数据供需匹配,让各类数据要素高效安全地流通起来。78医疗大数据的价值挖掘是对医疗数据的收集、整理、再利用。换句话说,高效掘取医疗大数据价值,首先需要建立先进的信息技术系统和数据平台,帮助医疗机构有效存储、整合数据,其次才是构建、利用工具,对治理后的医疗大数据进行分析,进而为医疗决策提供科学依据、提升医疗效率。相较于后一环节的医疗大数据应用,前端的治理显然更为繁琐。一个患者的全生命周期数据不仅包含产生于医疗机构的就诊、治疗、康复等临床数据,还包含与生俱来的基因组数据、可穿戴设备生成的个人健康数据。以医疗机构产生的临床数据为例,

20、患者在选择医疗机构时需考虑疾病严重程度、地理位置、优势学科等要素,一生之中的就诊不会局限于单家医院,因而其临床数据往往分散于多个医疗机构中;一家医院的临床数据分散在多个不同业务系统中,HIS、CIS、PACS、RIS 之间未必能够实现互联互通。有需求就有市场。为了治理过往沉积的数据,标准化后续生成的数据,不少医院开始投身于数据的数据中心的建立与数据平台的运营,两个模块如今已经孕育起一个十亿级的市场。全民健康信息化调查报告曾对医院信息平台的基本功能统计。数据表明:已有超过一半医院进行了一定程度的数据中心部署。但在人工智能、物联网、语言模型等一众新式技术的推动之下,越来越多的数据中心面临升级、扩容

21、、云化等需求,进而演化为新时代的医疗大数据市场。图表 4 2021 年各类医疗机构大数据应用开展情况(单位:%)数据来源:全民健康信息化调查报告92.12.1 新一代医院数据中心拉开千亿市场序幕新一代医院数据中心拉开千亿市场序幕伴随信息技术和网络技术的跨越式发展,现代医院的运营特征表现为医疗业务的智能化与应用部署的敏捷化,使得医院业务产生的信息朝着复杂化、专业化、海量化的方向发展,并对各系统之间的互联互通提出更高层级的要求。此趋势下,围绕网络带宽、服务器性能、交换机处理能力等设备运行特征建设数据中心机房的思路无法应对新型数据结构下涌现的数据安全保障、线上业务支撑、数据资产管理等需求,亟需引入新

22、的 IT 架构来应对新的业务对计算资源、存储资源、网络资源的新要求。因此,部分医院开始转变信息化建设思路,借助云技术打造新一代医院数据中心,综合利用各类数据服务临床、决策和科研过程,提高医院管理的科学化、规范化、精细化水平。2.1.12.1.1 新一代数据中心的优势新一代数据中心的优势传统大数据中心分为两类形式。一类是以业务支撑为主、整合电子病历的临床数据中心(CDR),其作用是支撑日常的医疗活动,收集与呈现医疗过程中的数据,绘制常规报表统计等。另一类以管理和科研为主的大数据中心,其作用是面向临床研究、医院管理与智能产品开发,满足科研、管理活动中的数据批量处理的挖掘与分析需求。目前国内大部分全

23、院级 CDR 完成了医院各业务数据的物理汇聚,但数据质量仍处于原始状态,对数据的深层架构与逻辑关系尚未进行梳理,针对现有 CDR 开展临床相关的数据分析挖掘仍具有极大困难。此外,由于不同科研数据库一般采用自定义的数据模型,在建立多中心数据池、数据共享或数据合并时需要花费大量时间和资源进行数据映射和重新编码,一旦出错很容易导致计算机数据调用、分析过程和结果出现混乱。要解决传统大数据中心存在的问题,新一代大数据中心应具备以下能力。1.满足医院创新业务需求。提供多种大数据应用开发工具并支撑大数据应用部署,例如利用 NLP 从海量电子病历数据中提取知识,辅助临床科研;利用深度学习从海量的医学影像中训练

24、人工智能模型,辅助医生临床诊断。2.满足医院管理发展的需求。支撑人工智能应用为医院运营管理提供更深的洞察和更敏捷的反应;支撑实时流计算,能够应用大数据分析技术并将分析结果实时反馈到临床业务;支撑边缘计算与物联网技术实现智慧后勤。3.满足医院智慧应用配置需求。支持搭建安全、有弹性、可扩展的对外服务平台;支撑区块链等创新技术解决数据共享、流通、归集和安全问题。104.满足跨部门业务协同需求。支撑云网融合技术,能够在保证内外网间数据交换的安全性的前提下以打通院内系统、外部系统及云上系统,以实现医院业务的连续性。5.满足数据治理需求。可提供的全局数据服务需要覆盖数据标准管理、基础数据管理、数据采集、数

25、据汇聚、数据深度加工、数据资产管理、数据质量管理、数据安全管理等对数据的全生命周期治理服务。6.满足数据服务需求。支撑医院内部实现系统互联互通和数据对接共享的需要;医院提升海量数据资源质量的需要,数据驱动医院进行科学决策的需要,面对数据安全风险的需要。图表 5 云上新一代医院数据中心主要特征数据来源:新一代医院数据中心建设指导2.1.22.1.2 新一代数据中心的架构新一代数据中心的架构在新一代医疗数据中心建设指导一书中,新一代医院数据中心被定义为以私有云为主,多云结合为特征的医疗云数据中心,并将新一代医院数据中心的架构划分为医院基础设施服务层(laaS)、医院应用支撑服务层(PaaS)、医院

26、应用层(SaaS)。图表 6 新一代医院数据中心架构11数据来源:新一代医院数据中心建设指导在基础设施之上,医院应用支撑服务层提供平台应用服务,包括应用开发和测试的平台服务、通用应用服务、数据服务(DaaS)以及医疗行业特定的服务。最上层的医院应用层提供各种类型的医院业务应用,主要分为三大类,即事务型业务、数据分析型业务以及跨院业务。这些业务应用通过平台即服务(Plantform-as-a-Service,PaaS)层提供的 API 使用平台服务。此外,统一安全管理及统一运维管理将贯穿数据中心的各个层次,保证整个系统在安全环境稳定运行。2.1.32.1.3 新一代数据中心的部署方式新一代数据中

27、心的部署方式目前,医疗健康行业对安全和隐私方面的高要求使得医院数据中心主要以私有云为主,这种方式不但可以保证医院完全控制其安全措施,也可以确保其数据中心能够满足相关法律法规。私有云部署也可以使医院明确知道自己所购买软硬件成本,使数据中心成本可预测。但是私有云部署的总体成本相对较高,也带来了医院管理的复杂性,而且数据中心的扩展性也受到医院本身条件的限制。有些医院为简化管理,提高灵活性等因素考虑部分非核心业务也可能会选择托管公有云,由第三方服务商进行管理和运行,成本可控但其灵活性仍然有限。但出于对公有云可扩展性、高性能、低成本等优势的需求,医院越来越多地选择将其一些对外服务业务和 IT 能力部署在

28、公有云上。12混合云技术的使用仍在探索中,该部署方式使得医院未来能够在私有云和公有云之间灵活地部署和迁移其工作负载,其典型的场景是将单个或多个私有云和单个或多个公有云结合为一体的混合云和多云环境。医院云数据中心也会通过互联网或专线与第三方平台对接,例如区域影像中心、全民健康信息平台和医保信息平台等。2.22.2 影像补位,影像补位,AIAI 企业成为基建主角企业成为基建主角自深度学习广泛应用于计算机视觉后,围绕医学影像展开的人工智能开发催生了独立建设影像大数据中心的需求。因此,不少企业尝试在 PACS、RIS、PIS 等涉及医学影像的业务系统之上,以中台形式搭建一个能够综合管理应用全院所有影像

29、的大数据平台,更标准、更便捷、更经济的方式对影像类数据进行汇总,进而推动相关科学研究的进行。对比新一代数据中心,影像数据中心的需要同样宽泛。作为医疗数据大国,我国的影像数据占据了 80%90%的份额,维持 30%的增速持续增长,但大量数据停留在纸质化的阶段,超过 80%的数据为非结构化数据。因此,围绕影像展开的医疗大数据中心建设能够有效触及此类需求,易联众、卡易、富士胶片等传统医疗 IT 企业及深睿医疗、汇医慧影等人工智能企业均围绕此业务深化信息化布局,一方面为医院搭载治理影像数据的平台,另一方面借助平台协同医院推出新的人工智能解决方案。现有的医学影像大数据中心通常具备两类智能。其一为集成智能

30、化影像应用。伴随人工智能技术的规模落地,一家医院常常会安装多个人工智能辅助诊断应用。为了方便医生在不同应用之间无感切换,医学影像大数据中心可以起到业务中台的作用,将众多人工智能软件集成,便于医生使用。同时,大数据中心还可以通过互联网实时更新新的人工智能应用,医生需要时可直接联网下载。其二为助力影像数据资产化。由于影像数据量本身体量较大,医院很难精准评估影像数据集价值,可能在数年之后需要调阅时才发现文件发生损坏。在这一场景下,影像大数据可以助力影像数据治理,在数据生成后便及时打上标签并归类,并注明其可能存在的价值。核心能力外,还有一些企业的大平台会打造一些特色功能。以深睿医疗新发布的 Deepw

31、iseMetAI 智慧影像&数据新平台为例,该平台以计算机视觉、NLP、深度学习等 AI 技术为基础,实现影像扫描后重建、打印、诊断、会诊、教学、科研的一站式影像科全周期智能管理。这个过程中,深睿医疗能够帮助医院生产高效精准的结构化数据,逐步积成影像科的优质数据资产。同时,深睿医疗也在借助大数据平台打造以科研创新及应用为导向,实现数据到成果再到应用的创新闭环模式,加速科研成果转化,助力学科高水平发展。目前,深睿医疗已与四川大学华西医院、南京市中医院、浙江大学医学院附属儿童医院等国内多家医疗机构合作,依托13全院级科研数据中心,探索疾病智能化诊疗的新模式、产出高质量的成果、全面促进成果转化。2.

32、32.3 临床科研发力,科研药研加速数据库建设临床科研发力,科研药研加速数据库建设临床科研数据库的建设需求基本可分为两大类:一是数据沉淀需求,通过积累数据资产,为尚未明确的研究课题和研究方向做探索准备,如医院对积累患者多组学数据的需求;申办方对积累临床研究数据资产的需求;积累医患管理数据的需求等。二是临床研究需求,如辅助已明确方向和课题的研究者发起的临床研究(IIT),以及药企发起的临床试验(IST)完成定向数据治理、质控、锁定和应用等相关工作。人工智能、大数据等技术出现后,临床科研数据库的部署开始由“人力支撑”向“智能支撑”、从“强平台能力”和“强科研服务”的转变;专病库与临床研究数据采集系

33、统(EDC)两类重要产品开始融合,逐步合并为一套系统。临床科研数据库的价值随之深化。某肿瘤医院每年收治数千例宫颈癌、子宫内膜癌、卵巢癌等妇科恶性肿瘤新发病例,诊疗数据均存储在该院业务系统中,没有统一的标准规范和格式,且为非科研所需的结构化数据,非常不利于临床医生精准定位患者和统计分析数据。而在搭建了本地专病库后,患者群体定位能力和科研效率显著提升,数据处理成本降低,医院还获得更多科研机会。此外,该项目还反哺临床场景,帮助提升院内病历质量,增强规范诊疗能力。图表 7 临床科研数据库的分类及特点数据来源:临床科研数据库系统的现状与未来2.3.12.3.1 临床试验数据库临床试验数据库伴随数据科技的

34、发展与医院对于临床试验数据库的日益重视,临床试验数据库的能力界限与发展路径都迎来的新的改变。其一,融合院后随访数据。院后随访数据作为患者临床结局的反映,是多数临床研究中必须收集的数据。但传统的院后随访要么需要患者前往门诊主动随访,要么依靠临床研究人员电话随访。前者需要患者频繁往返医院,患者体验较差、后者存在随访工作量大、失访率高、数据质量受限等普遍性问题。14移动通信技术及应用广泛发展,临床研究人员如今可通过网页、微信、App 等多种形式提供患者院后随访服务以及收集患者自报告结局(PRO)。由于随访问卷、查体原始报告等信息可以由患者直接录入或上传,随访频率及随访质量均得到有效提高。为了更好地融

35、入院后随访数据,临床试验数据库应与新型的院后随访系统相集成,实现临床数据与随访数据的一体化整合,从而有效提升科研数据完整度。其二,融合电子病历数据。临床科研数据采集需求会更多地体现在医疗业务信息系统中,两类系统之间的协同互补将是发展的趋势,但与医疗业务信息系统的协同,从医疗记录中回顾性提取科研数据,实践中始终存在着原始记录不全、结构化技术要求高的困难。为此,医院应建立“临床科研一体化”的电子病历系统,补全缺失的结构化数据。但就国内医院目前的互联互通建设水平而言,绝大部分医院无法实现全结构化的电子病历。要解决这一问题,一方面可把结构化的科研数据表单以“插件”形式集成到临床电子病历系统中,兼顾临床

36、记录的描述性和科研数据的结构化,另一方面可从专科化的检查方面推行结构化报告,逐步向全院进行延伸。其三,完善数据加工功能。回顾性研究数据收集利用模式的改变在目前的科室专科专病数据库中,有相当一部分是为未来的回顾性研究而建设。一方面,在研究问题不确定的情况下,建设和维持科研数据库需要投入专门力量,长期持续难度大;另一方面,随着电子病历数据的完善和数据处理分析技术能力的提升,研究人员提出问题时,能够针对研究问题直接从原始数据中提取所需特征变量开展研究。在专业化的数据服务能力支持下,直接提取科研数据有更高的效率,能最大程度地减轻临床科室工作量,这一趋势在医院的大数据中心工作实践中已经开始显现。未来,临

37、床科研数据库系统的数据加工功能会进一步优化,入库的数据会更为精准、数目缩小,预先建库的模式将更多地转为有研究问题时的即时建库和数据加工,整个过程将进一步简化。2.3.22.3.2 病例注册数据库病例注册数据库病例注册数据库主要用于支持疾病或治疗措施的观察性研究,通常为多中心数据库。研究设计者围绕研究主题和特定的研究问题,设计统一的病例数据采集表单,组织真实世界病例数据录入汇集,形成大规模的观察性病例数据库。现实中,一些队列研究数据库具有与病例注册数据库相似的特点,亦可归入此类。病例注册数据库具有以下特点:通常为多中心数据库,对数据标准化定义要求较高;各个医疗机构的信息系统并不相同,病例注册系统

38、与各医疗机构信息系统建立接口的可能性较低,数据采集主要依靠人工录入,因而病例登记表所涉及的变量数通常不宜设计过多;多中心采集场景下,对病例注册系统的数据录入和共享权限有特定要求。152.3.32.3.3 专科专病数据库专科专病数据库专科专病数据库主要用于支持临床科室按专科或病种收集病例数据和开展观察性研究,其所收集的病例数据项较广。在实际工作中,科室建立专科或专病数据库可分为两种情况:一种是有研究目的但研究问题尚不明确,建库是为未来的科研问题积累数据,其所收集的病例数据项较广,病例表单构成较复杂;另一种是围绕特定科研问题的病例数据收集,数据项相对较少,病例表单相对简单。随着医疗信息化的发展所提

39、供的便利性增加,近年来此类数据库的建设需求越来越多。此类数据库与注册数据库的特点有类似之处,但由于属于单中心数据库且未来研究问题存在不确定性,所以多数数据库设计包含数据项较多,数据标准化定义要求相对宽松;对从医院电子病历数据资源库(CDR)获取数据的要求较高。2.3.3.12.3.3.1 专病数据库的构建趋势专病数据库的构建趋势传统临床科研数据收集因采取人工录入而存在数据格式、标准不规范以及利用率、成果转化率较低等问题,无法满足日益增长的科研需求。因此,各分支学科均存在专病大数据建设需求,即通过建立专病数据库对医疗大数据进行整合与分析利用,提高专科疾病医疗服务质量及预测治疗效果,进而规避和降低

40、医疗风险、抑制医疗成本等。医学科技和信息技术的飞速发展,使得医院诊疗数据和病理及影像等数据,正在以惊人的速度增长。包括基因组、表观组、蛋白组和代谢组在内的组学技术迅猛发展,促使生物医学领域快速进入“大数据”时代。依靠快速增长的生物医学数据,重新审视疾病,对疾病进行细化分层,使得医学研究的重点更加精细和深入,逐渐集中于亚专业和专病,特别聚焦在高发病率、高死亡率、高疾病负担,严重影响人群健康的重大疾病上。此趋势下,专病数据库的建设也需沿着新的建设方向发展。首先,建立目标专病数据模型及相关技术标准和规范专病大数据平台建设难点在于多源异构数据整合,需要建立通用数据标准,形成统一数据模型及相关技术标准和

41、规范,以汇聚更多模态、来源更广的专病数据。其次,应实现规范化数据汇集机制为对接医院业务系统临床信息进行底层数据集成,基于目标专病特点,利用标准化、规范化的数据元、术语库和同义词库,通过前置机及在线分析技术,根据机器学习智能推断数据结构、主外键关系、数据字典等元数据信息,采用自然语言处理、知识图谱和人工智能等技术对数据进行清洗、质量控制、结构化和归一化等处理,根据患者主索引及标准化数据模型建立肝硬化专病数据仓库,实现源数据自动化采集、数据解析与清洗、结构化与标准化预处理、基于逻辑与规则编写的指标抽取以及规则挖掘、知识查询、关联分析、图像处理、异常检测和预测分析。同时,需建立统一的规范化数据汇集机

42、制,兼顾数据安全、处理性能和跨域传输能力,提供全量规则的医学临床真实数据。16最后,应建立高性能、高可靠性、高扩展性的存储架构目标专病大数据存储既包含 NoSQL类型的数据库如 HBase、MongoDB 等,也包含 MySQL 等关系型数据库;存储架构引入Redis、Memcached 等内存型数据库以提高实时计算速度;分布式计算框架则包含Spark/Flink 流处理框架、Hadoop 等批处理框架、图计算引擎、数据挖掘引擎、TensorFlow等人工智能处理引擎的多种分析框架,以满足不同分析场景需求。该存储系统具有分布式特点以应对数据规模增长;具有分层特点,即由高速和低速存储混合构成,高

43、速存储保障在线实时或近实时分析,低速存储实现离线批处理等;同时具有完备的数据管理能力以满足数据冗余备份、同步、隔离等处理。2.3.3.22.3.3.2 专病数据库的应用及效率评价专病数据库的应用及效率评价专科数据库支持医院各级医疗工作者和科研人员对目标专病的常规临床诊疗与医院管理所需的数据管理、查询、统计与可视化;可为临床与科学研究提供有力支持,可根据特定研究目标选定纳入标准、排除标准及输出指标来选择研究人群特征,以进一步在线特征描述、特征分析或下载相关数据开展更深入的数据挖掘和人工智能应用研究,例如大型队列、多模态数据融合的疾病预后、随访等临床科学研究;可支持基于标准应用程序接口的大数据分析

44、挖掘及机器学习、深度学习等人工智能分析算法和模块的接入、嵌入,支撑未来数据驱动的目标专病临床与科学研究。效率方面,过去通过编程方式实现 CRF 表单的设计与制作需要 13 个月的时间,而可视化、交互式的 CRF 表单配置可将时间缩短至 3 天;医生手工整理 1 份病历花费约 1 小时时间,而借助 NLP 处理,辅以手工填写补充,可将时间缩短至 20 分钟内。2.3.3.32.3.3.3 尚需解决的问题尚需解决的问题尽管科研专病数据库系统平台建设已为医院科研带来一定成效,但现有的信息化系统仍存在一定不足:大量不同时期电子病历文件、检查报告、病理报告等非结构化的内容需要做结构化处理,但针对医学用语

45、的 NLP 其数据理解能力仍有提升空间,对电子病历的语义分析有待加强。现有的科研专病数据库系统中缺乏随访数据,后续还需加强互联互通建设,将专病数据库与随访系统对接,补齐科研数据短板,实现随访数据的共享利用。数据库的维护和应用还不理想,建库容易维护难,课题结束后大部分的科研专病数据库处于无人问津的状态,造成新的资源浪费,需建立长期的数据采集和维护管理及奖励机制,鼓励临床医生和科研专病数据库研发建设的 IT 工程师,不断完善平台功能、定时补充更新数据,丰富科研专病数据库的内容。172.42.4 数智化技术赋能,智慧后勤打开新需求数智化技术赋能,智慧后勤打开新需求伴随医院的规模及能力日益增长,越来越

46、多的数字化设备(医技设备、监护设备、智能楼宇和视频监控等)进入到医院。此趋势下,过去粗犷式的后勤管理模式已经难以控制高涨的后勤成本。面对水、电、气、电梯、停车、物流、视频监控、高值耗材等要素组成的复杂的后勤体系,医院必须寻求创新技术实现更为精细化的管理。要解决上述问题,首先需要医院进行有效的顶层设计,将繁多的设备统一至单个系统管理,并保证运营过程中的数据采集、数据治理、数据应用。人工智能支持下的 IT/OT 系统是一种理想的管理方式,该系统将信息技术(IT)与操作技术(OT)融合,并融入大数据技术进行包括物联网数据在内的异构数据存储以及快速数据访问和处理;借助边缘计算与物联网技术实现对智慧后勤

47、业务需求的支撑。不过,现阶段少有企业能够提供融合多重信息流的一体化系统。实际中,供应链、物流分属不同解决方案。峰禾科技、国医科技、海遇医疗、德荣医疗、万序健康、医贝、微萌、图特、爱惠、联众智慧等企业可提供 SPD 及对应硬件,赋能医院供应链管理;三维海容、瑞仕格等则可提供特定环境下的物流系统。美的楼宇科技、达实智能等少数企业能够提供医院级的后勤系统。以美的楼宇科技旗下智慧医院 LIFE2.0 解决方案为例,该解决方案从交通流、信息流、体验流、能源流四个维度进行顶层规划,全面覆盖医院所面向的管理者、医护人员、病患和后勤人员等多维度人群不同空间的多元化需求。图表 8 美的楼宇科技 LIFE 智慧医

48、院框架体系数据来源:美的楼宇科技18大数据工具支持下,医院各个场景产生的数据不再独立,且可实时传输至控制中心。在这一情况下,医院可以根据各个场景的运行情况调度及时调度资源,并根据历史时间数据对未来场景流量进行预测。如在暖通工程这一场景,美的暖通设备匹配驱动算法软件有效联动,能够自动控制各等级手术室及病房的室内温度、空气湿度、空气洁净度、气流分布,提高患者就医环境的舒适度和医院用能效率,可将相关能耗降低约 30%。总的来说,全局性的智慧后勤将为医院带来一场管理革命。但由于医院物流设计、暖通工程安装等环节对于医院的空间设计提出了很高要求,且很多医院在设计前并未考虑复杂工程的改造。因此,智慧后勤的市

49、场规模会伴随医院院区的更迭不断提升,有望在未来持续发力。2.52.5 大数据赋能的智慧医学教育大数据赋能的智慧医学教育随着现代医学技术不断更新和创新,医学教育也必须不断创新,保证教育方式与教育内容的先进性,以便培养出具备先进医学技能和知识的医生。智慧医学作为一种新的医学教育方法,采用了现代信息技术,结合大数据和人工智能技术,将医学知识技能和经验转化为数字化数据,已在教育和临床医学实践中丰富应用。相较于传统医学教育,智慧医学教育具备以下特征:人性化教学。智慧医学在临床医学教育中可以根据学生的学习能力、兴趣和需求进行人性化教学。例如,使用虚拟仿真技术和实验室等工具和资源,对于不同的学生可以提供不同

50、的个性化课程和培训模式。“虚拟患者”可以提供一系列的可控情境,帮助学生进行实践操作和审诊,同时又不会造成真实患者的危险和风险。实时监测。智慧医学可以利用传感器和移动设备等技术实时监测学生的实践操作和诊断过程。这样可以在实践中及时发现学生的错误和欠缺,及时纠正和给出指导,引导学生不断改进和提高。协同学习。智慧医学在临床医学教育中可以应用协同学习技术,使学生之间的互动和合作得到增强。这样有利于增加学生之间的交流,从而促进学术研究。我们可以结合成套的代表医学病例,对学生进行分组的探讨,进而学习各种临床技能,比如医学写作技巧、临床操作操场技,以及团队合作技巧等。跨学科合作。智慧医学可促进不同专业之间的

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服