收藏 分销(赏)

毒蛇咬伤专病数据库的建设实践与思考.pdf

上传人:自信****多点 文档编号:3104736 上传时间:2024-06-18 格式:PDF 页数:6 大小:810.06KB
下载 相关 举报
毒蛇咬伤专病数据库的建设实践与思考.pdf_第1页
第1页 / 共6页
毒蛇咬伤专病数据库的建设实践与思考.pdf_第2页
第2页 / 共6页
毒蛇咬伤专病数据库的建设实践与思考.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、卫生管理信息学第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024基金项目:福建省卫生健康科技计划项目(编号:2020GGB038)作者简介:施婉玲(1978.11-),女,福建晋江人,博士,主任医师,副院长,主要从事毒蛇咬伤、周围血管病、疮疡的临床和研究毒蛇咬伤专病数据库的建设实践与思考施婉玲袁张美吉袁李凡珂袁谢文明渊福建中医药大学附属人民医院疮疡蛇伤脉管外科袁福建 福州350000冤摘要院我院在实时对接医院系统数据的基础上袁利用人工智能技术袁通过数据标准化尧结构化尧归一化等数据治理袁形成对医疗全

2、量数据的汇集袁构建毒蛇咬伤专病数据库遥累计完成2012年以来的2427例患者的临床数据有效整合袁可实现智能病例检索尧数据填充尧数据导出尧统计分析和患者随访等功能袁有效支撑医生的临床研究工作袁为福建省毒蛇伤咬伤流行特征分析及防治策略研究提供平台袁更好地指导各地市二级工作站的蛇伤救治袁同时助力科研成果转化遥建设毒蛇咬伤专病数据库袁为提升医生的科研效率袁实现诊疗流程的数据标准化袁以及后续开展二级作站的多中心科研项目奠定基础遥关键词院毒蛇咬伤曰专病数据库曰数据治理中图分类号院R646曰R-05文献标识码院BDOI院10.3969/j.issn.1006-1959.2024.06.006文章编号院100

3、6-1959渊2024冤06-0036-06Practice and Thinking on the Construction of Special Disease Database for SnakebiteSHI Wan-ling,ZHANG Mei-ji,LI Fan-ke,XIE Wen-ming(Department of Pyocutaneous Disease and SnakebiteVascular Surgery,Peoples Hospital Affiliated to Fujian Universityof Chinese Medicine,Fuzhou 350000

4、,Fujian,China)Abstract:On the basis of real-time docking of hospital system data,our hospital used artificial intelligence technology to form a collection of totalmedical data through data standardization,structuring,normalization and other data governance,and constructed a database of snakebite.The

5、 effectiveintegration of clinical data of 2427 patients since 2012 has been completed,which can realize the functions of intelligent case retrieval,data filling,data export,statistical analysis and patient follow-up,and effectively support the clinical research work of doctors.It provides a platform

6、 for theanalysis of the epidemiological characteristics of snakebite in Fujian Province and the study of prevention and control strategies,better guides thetreatment of snakebite in the secondary workstations of various cities,and helps the transformation of scientific research results.The construct

7、ion of aspecial disease database for snakebite lays the foundation for improving the scientific research efficiency of doctors,realizing the data standardizationof the diagnosis and treatment process,and subsequent multi-center scientific research projects of secondary stations.Key words:Snakebite;S

8、pecializeddatabase;Data governance据世界卫生组织统计,至 2019 年,全球有约540 万例毒蛇咬伤,其中 180 万270 万例发生了中毒,导致 8.1 万13.8 万人死亡1。我国有毒蛇 80 多种,剧毒蛇 20 种,主要分布在长江以南地区,每年毒蛇咬伤达 10 万人次,其中 73%为中青年,蛇伤死亡率为 5%10%,蛇伤致残丧失劳动能力者占 25%30%2,3。福建蛇类繁多,数量亦甚,与人类的生活息息相关。据调查4,福建地区现有已知蛇类 86 种,隶属 7 科 45 属,在全国蛇类总种数的 219 种中占39.27%,种类数居全国第 3 位。其中毒蛇 3

9、2 种,居全国毒蛇总数首位。由于受医疗条件的限制,患者不能及时得到准确的诊断而耽误治疗,导致残废,甚至丧生。我院为福建省蛇伤急救中心、国家级福建黄氏蛇伤学术流派传承工作室建设单位,已在全省各地市搭建了 10 个二级蛇伤工作站。中心每年收治大量毒蛇咬伤患者,为探索毒蛇咬伤患者诊疗数据的汇集方法,构建毒蛇咬伤专病数据库,在实时对接医院系统数据的基础上,通过数据标准化、结构化、归一化等数据治理,形成对医疗全量数据的汇集,并基于国内外临床指南、高分文献、专家临床经验等筛选变量,形成高标准的蛇伤专病数据集,以期为福建省毒蛇伤咬伤流行特征分析及防治策略研究提供平台,更好地指导各地市二级工作站的蛇伤救治,同

10、时助力科研成果转化。1需求分析在传统的临床科研过程中,科研人员将 28%的时间花费在病例筛选上,41%的时间花费在数据提取上,并手工将数据录入科研数据库。这种传统的数据采集方式不仅耗时费力,性价比低5,而且存在诸多问题,如病历搜索不方便耗时费力、数据质量不高难以直接便用、需持续的人工成本支出、数据标准更窑卫生管理信息学窑36卫生管理信息学第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024图1传统数据采集存在问题新迭代时需重新手工补录数据、数据真实性难以验证、同样数据复用于多项研究时需重新录入等问题

11、,见图 1。2建设过程为节省科研人员时间,帮助临床科研人员摆脱传统科研数据采集提取的困难,我院在现有临床业务系统的基础之上,利用人工智能技术,完成临床数据的集成和治理,建立临床数据中心,形成用于蛇伤科研项目的专病数据库。系统架构见图 2。3建设流程3.1 制定专病标准数据集 根据实际科研需求,以CDISC 数据标准为基础6,参考国内外相关蛇伤数据模型及数据标准进行整理,并完成数据变量 IT 标准的定义,包括:数据元的命名、定义、数据类型、值域、等级、来源等,去除相似数据元以保证内容无冲突,去除非法字符以保证内容正确性,最后将数据元按照架构和分类统一编码。最终确认了包括 618 个字段的 33

12、个数据表,包含蛇咬伤信息、基本信息/人口学资料、就诊信息、转科信息、诊断信息、诊疗费用、症状信息、中医四诊信息、中医辨证信息、体格检查、专科检查、既往情况、家族病史、过敏史、生活习惯、实验室检查、心电图检查、影像学检查、中医治则治法、中医治疗信息、西医治疗信息、不良事件记录等,构建了蛇伤专病标准数据集。在此基础之上,确定了患者入组的纳排条件,实现蛇伤专病库上线后符合条件的患者数据自动填入专病数据库,见图 3。图2系统架构图图3蛇伤专病库建设流程耗时费力袁性价比低数据质量不高难以直接使用院内院外数据提取过程繁琐病例搜索不方便耗时费力临床论文数据挖掘数据提取病理筛选开题综述临床科研过程的时间分布3

13、7卫生管理信息学第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.20243.2 基于医学人工智能的专病数据自动采集3.2.1 数据集成 采用基于容器技术的分布式架构Kubernetes(k8s)部署,Kubernetes 集群技术是一个容器编排引擎,支持自动化部署、大规模可伸缩、应用容器化管理,满足扩展要求、故障转移、部署模式等7。采用 PostgreSQL 的大规模并行数据库。具有较高的性能与稳定性8,可以支持到数 PB 的海量数据。实时数据集成方案:针对我院的实际情况,确定实时数据通过数据库数据变化

14、日志实时捕获数据。具体解决方案为:淤Oracle:Data Guard 主从备份(支持 1 主多从)+异步在线日志 CDC(数据变更捕获);于Sql server:数据库复制+CDC;盂Cache:数据库镜像 shadow 库,见图 4。历史数据集成方案:Oracle/SqlServer。为了降低对实时数据集成的影响,制定本集成方案进行大量历史数据的集成工作。在历史数据抽取步骤,采用从备份数据库中。通过 ETL 技术实现临床数据抽取9,见图 5。ScurceDatabaseNetwork(TCP/IP)TargetDatebaseTransationLogExtractServerCollec

15、torLocalTrailManagerDataPumpRamoteTrailManagerReplicat时间戳data senershadow sener中间库middle 库etl 工具数据治理数据抽取HDR医院数据中心更改表源表变更数据捕获查询函数日志捕获进程数据仓库提取、转换和加载图4实时数据集成诊疗业务数据运营数据患者数据其他.实时非实时前置桥接接入(结构化/非结构化)直接接入(结构化/非结构化)服务 API 接入流式接入(如物联网、监控)数据来源多源接入统一汇聚调度器监控器管理器库表管理连接管理任务管理作业管理图5非实时渊历史数据冤集成诊疗业务数据运营数据患者数据其他.实时非实时

16、前置桥接接入(结构化/非结构化)直接接入(结构化/非结构化)服务 API 接入流式接入(如物联网、监控)数据来源多源接入统一汇聚调度器监控器管理器库表管理连接管理任务管理作业管理数据管理HISBAKEMRBAKLISBAKPACSBAKOTHERBAK数据抽取ETL 工具ETL 规则库ETL 日志库大数据中心MDM/EMPI/SDR38卫生管理信息学第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024通 过 临 床 数 据 中 心 集 成 了 HIS、LIS、EMR、PACS、手术麻醉系统等多个临床

17、业务系统的数据10,并依据数据治理的复杂程度。对上述 618 个字段进行了分类,其中 273 个字段为 L1 级别,即可以通过单一数据来源直接利用数据字典映射填充的结构化数据,包括人口学统计学信息、既往治疗情况、就诊情况等。利用自然语言处理技术可以完成 90.77%的字段填充。264 个字段为 L2 级别,即需要利用自然语言处理(NLP)技术对非结构化的文本数据进行结构化和标准化处理,结合临床、药学、检查检验等医疗专业词库。通过分析上下文关系构建多层级语义分析模型,找出文本中不同实体、属性、关系之间的关联信息,实现结构化转换;再通过数据字典映射进行字段填充,包括来自 EMR 系统的主诉症状、手

18、术记录、家族肿瘤病史。利用自然语言处理技术可以完成 83.71%的字段填充。81 个字段为 L3 级别,即需要利用临床规则。通过对多个来源的字段进行复杂逻辑运算后填充,利用自然语言处理技术可以完成 98%的字段填充。3.2.2 数据治理及质控 蛇伤专病库核心技术是临床数据治理引擎。基于先进的自然语言处理、知识图谱等 AI 引擎,实现各类临床数据的结构化、标准化和归一化等处理。针对数据驱动的临床研究场景,能够将医院积存的海量临床数据自动结构化、标准化成可被临床研究直接分析、利用的科研数据。引擎基于通用数据模型及各类型蛇伤专病数据模型,对临床文本数据做颗粒化、后结构化处理。运用人工智能结合医学知识

19、图谱自动转化非结构化文本数据11,以满足回顾性查询所需的数据细化程度。同时针对提取出的医学信息,结合医学知识图谱自动完成数据的标准化,进一步提升数据的可用性、可交互性。数据标准化:数据标准化是通过医学术语建设、标准化术语基线与分类建设,以及标准化术语本体库建设等,实现实体映射的一致,消除语义鸿沟12。包括:疾病术语标准化、药品术语标准化、症状体征术语标准化、检验/检查术语标准化等。参照医学术语系统命名法-临床术语(Systematized Nomencla原tureof Medicine-Clinical Terms,SNOMED CT)的设计理念,结合观测指标标识符逻辑命名与编码系统(Log

20、ical Observation Identifiers Names and Codes,LOINC)、国际疾病分类 手术编码 6.0 标准 等术语集,构建符合国内实际应用场景的术语体系13标准,见图 6。后结构化:针对病历文本信息,以自然语言处理技术为基础,结合临床、药学、检查检验等医疗专业词库,通过分析上下文关系构建多层级语义分析模型,找出文本中不同实体、属性、关系之间的关联信息,实现结构化转换,见图 7。图6医学术语标准体系39卫生管理信息学第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024

21、数据质控:数据采集和治理的过程中,对数据的完整性和规范性进行实时质控。通过发现数据缺失或异常值等问题,溯源至原始病历,督促专病中心医生规范病历书写,提高科研数据质量,避免研究结果的偏倚或失真。数据清洗:对质量较差的数据,可通过多维数据清洗功能,如标签、离散化、数据填补、自定义变量等,保证数据的准确性及可靠性14。专病数据建模:治理后的数据,通过语义分析模型、医疗知识图谱等,形成以疾病为中心、具有完整时间序列的专病数据库,并可视化展现数据间深层关联关系,为临床研究提供更多可能方向。专病库还支持导入医师手工采集的课题数据(多为 Excel表格式),经结构化处理、数据清洗及分析后,与中心端数据库中原

22、有数据融合,形成个性化的完整科研数据集。4建设成果从 2021 年 1 月起,经过了 6 个月的建设,我院临床数据中心完成了 2012-2022 年全量医疗数据的筛选和抽取,蛇伤专病数据库累计完成入库患者2427 例,入库病历 8322 万份。4.1 智能病历筛选 蛇伤专病数据库建设完成后,科研人员可以在科研平台上按照科研需求通过年龄、诊断、检查报告等多个维度对病历进行智能检索和筛选,节省病历数据筛选时间。4.2 数据填充 建立科研项目后,蛇伤专病数据库中已有数据可自动填充至专病科研项目中,科研人员也可以按需手动录入和修改数据,并保留数据提交、修改的稽查轨迹。与此同时,系统与科研人员都可以对科

23、研数据进行核查质控。4.3 数据导出 如有数据导出需求,可通过科研平台的数据探索功能导出专病项目数据,数据探索包括变量选择,字段搜索,多变量互斥逻辑判定等功能,查询结果导出格式可选择 Excel/CSV/SPSS/SAS。4.4 统计分析 科研人员可利用科研平台对数据进行描述性分析、差异性分析或预测建模并形成可视化图形展示。描述性分析方法包括频数分析、缺失值分析、四分位分析和数据分布分析。差异性分析包括图7自然语言处理技术40卫生管理信息学第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024Pear

24、son 卡方、Fisher 精准概率、Wilcoxon 秩和检验等分析模型。预测模型包括随机森林回归模型,线性回归,样本随机化,二分类 Logistic 等。4.5 机器学习 科研人员可采集蛇伤患者数据利用机器学习算法建立蛇伤预测模型,可以预测患者生存和辅助治疗的益处,以指导个性化的治疗决策,最终的结果可以是一个数学方程,计算出在接受或不接受特定疗法的情况下单个患者的生存曲线。5总结与展望医疗大数据的利用与发展给医疗机构及健康医疗模式都带来了深刻变化,许多医疗机构均在积极探索海量诊疗数据的挖掘与利用15-18,希望通过专病数据库的建设,依托大数据、数据挖掘、数据处理等技术,结合临床诊疗、科研、

25、管理等需求,构建面向科研工作者、医生、患者、管理人员的临床科研一体化平台,为提高医疗质量、疾病防治、科研转化提供支持19,20。基于具体临床诊疗场景的需求,以专病数据库为基础建立蛇伤疾病风险预测模型,通过自动人工智能技术对变量进行筛选,利用批量算法实验对模型进行评估,找出最优预测模型,为临床医生预测疾病风险,辅助临床监测和治疗提供支持。我院蛇伤专病数据库的建设有助于提升医生的科研效率,推动我院在蛇伤领域的科研工作,加速科研成果在临床诊疗场景中落地应用,形成临床科研与临床诊疗之间的良性反哺闭环临床诊疗为科研提供高质量数据,科研成果在临床诊疗场景中落地应用。此外,未来可将我院蛇伤专病数据集在全国范

26、围内进行推广,专病标准数据集覆盖诊疗全流程数据,与实际业务场景和临床路径紧密相连,让临床和科研无缝衔接,在业务流程中完成科研数据收集,实现诊疗流程的数据标准化,为后续开展二级作站的多中心科研项目打下基础。参考文献院1Suhita R,Begum I,Rashid M,et al.Systematic review andmeta-analysis of global prevalence of neurotoxic and hemotoxicsnakebite envenomation J.Eastern Mediterranean Health Jour鄄nal,2022,28(12):90

27、9-916.2史超,苏秋香,施婉玲,等.2013-2020年福州及周边地区毒蛇咬伤流行病学特征分析J中国烧伤创疡杂志,2022,34(1):23-28.3黄培颖,曾仲意,刘强,等.竹叶青蛇咬伤的流行病学调查及院前影响因素分析J.临床急诊杂志,2020,21(5):393-396,401.4施婉玲,史超,王世军.福建省2458例毒蛇咬伤流行病学分析J.医学理论与实践,2023,36(12):2126-2129.5吴乐乐,高白,张燕,等.临床科研一体化数据采集系统的设计与实现J.中国数字医学,2019,14(2):82-84.6ClinicalDataInterchangeStandardsCon

28、sortium.CDISC.Mission&PrinciplesEB/OL.2018-01-05(2023-07-03).http:/www.cdisc.org/mission-and-principles.7Zhou N,Georgiou Y,Zhong L,et al.Container orchestrationon HPC systemsC/2020 IEEE 13th International Conferenceon Cloud Computing(CLOUD),Beijing,China,2020:34-36.8Viloria A,Acu觡a GC,Franco DJA,et

29、al.Integration of datamining techniques to PostgreSQL database manager systemJ.Procedia Computer Science,2019,155:575-580.9周浩成.ETL技术的装备大数据治理应用J.无线互联科技,2022,19(5):81-82.10王少伟,孙咸江.医院数据中心建设研究J.电子世界,2020(21):27-28.11聂莉莉,李传富,许晓倩,等.人工智能在医学诊断知识图谱构建中的应用研究J.医学信息学杂志,2018,39(6):7-12.12Cha S,Abusharekh A,Abidi

30、SSR.Towards aBigHealth DataAnalytics PlatformEB/OL.(2015-3-30)2023-07-03.https:/doi.org/10.1109/BigDataService.2015.13.13赵前前.基于大数据科研平台的专病数据库建设及应用J.中国数字医学,2020,15(12):89-92.14钱余发,张玲.基于大数据的数据清洗技术及运用J.数字技术与应用,2023,41(3):84-86,113.15王淑,陈敏,凌琦鸣,等.基于临床数据中心的专病研究系统建设与实践J.中国医院,2017,21(8):16-18.16费晓璐,李嘉,黄跃,等.医

31、疗大数据应用中的数据治理实践J.中国卫生信息管理杂志,2018,15(5):554-558.17李慧杰,张晴晴,刘瑞红,等.大数据背景下临床专病数据库建设实践与思考J.中国卫生事业管理,2020,37(8):574-576,591.18袁骏毅,潘常青,李榕,等.基于临床数据中心的冠心病专病数据库的构建与实现J.中国卫生信息管理杂志,2022,19(5):707-712.19Subrahmanya SVG,Shetty DK,Patil V,et al.The role of datascience in healthcare advancements:applications,benefits,andfuture prospectsJ.Ir J Med Sci,2022,191(4):1473-1483.20Ngiam KY,Khor IW.Big data and machine learning algo鄄rithms for health-care delivery J.Lancet Oncol,2019,20(5):e262-e273.收稿日期:2023-07-21;修回日期:2023-08-21编辑/肖婷婷41

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服