非结构化数据表征增强的术后风险预测模型.pdf

资源描述

1、第3 8卷第1期2 0 2 4年1月中文信息学报J OUR NA LO FCH I N E S EI N F O RMAT I ONP R O C E S S I NGV o l.3 8,N o.1J a n.,2 0 2 4文章编号:1 0 0 3-0 0 7 7(2 0 2 4)0 1-0 1 5 6-1 0非结构化数据表征增强的术后风险预测模型王亚强1,2,3,杨潇1,2,3,朱涛4,郝学超4,舒红平1,3,陈果4(1.成都信息工程大学软件工程学院,四川成都6 1 0 2 2 5;2.成都信息工程大学数据科学与工程研究所,四川成都6 1 0 2 2 5;3.成都信息工程大

2、学软件自动生成与智能服务四川省重点实验室,四川成都6 1 0 2 2 5;4.四川大学华西医院麻醉手术中心,四川成都6 2 1 0 0 5)摘要:准确的术后风险预测对临床资源的规划、应急方案的准备以及患者术后风险和死亡率的降低具有积极的作用。目前,术后风险预测主要基于患者的基本信息、术前的实验室检查及术中的生命体征等结构化数据,蕴含着丰富语义信息的非结构化术前诊断的价值尚待验证。针对上述问题,该文提出一种非结构化数据表征增强的术后风险预测模型,利用自注意力机制,将结构化数据与术前诊断进行信息加权融合。基于临床数据,该文将所提出的模型与术后风险预测常用的统计机器学习模型以及最新的深度

3、神经网络进行对比,在肺部并发症风险预测、I C U入室风险预测和心血管不良风险预测任务上的F1值平均提升了9.5 3 3%,同时预测模型还具有良好的可解释性。关键词:术后风险预测;自注意力机制;数据表征;信息融合中图分类号:T P 3 9 1 文献标识码:AA nU n s t r u c t u r e dD a t aR e p r e s e n t a t i o nE n h a n c e dM e t h o d f o rP o s t o p e r a t i v eR i s kP r e d i c t i o nWAN GY a q i a n g1,2,3,YAN

4、GX i a o1,2,3,Z HUT a o4,HAOX u e c h a o4,S HU H o n g p i n g1,3,CHE NG u o4(1.C o l l e g eo fS o f t w a r eE n g i n e e r i n g,C h e n g d uU n i v e r s i t yo f I n f o r m a t i o nT e c h n o l o g y,C h e n g d u,S i c h u a n6 1 0 2 2 5,C h i n a;2.I n s t i t u t e f o rD a t aS c i e

5、n c ea n dE n g i n e e r i n g,C h e n g d uU n i v e r s i t yo f I n f o r m a t i o nT e c h n o l o g y,C h e n g d u,S i c h u a n6 1 0 2 2 5,C h i n a;3.S i c h u a nK e yL a b o r a t o r yo fS o f t w a r eA u t o m a t i cG e n e r a t i o na n dI n t e l l i g e n tS e r v i c e,C h e n g

6、 d uU n i v e r s i t yo f I n f o r m a t i o nT e c h n o l o g y,C h e n g d u,S i c h u a n6 1 0 2 2 5,C h i n a;4.D e p a r t m e n to fA n e s t h e s i o l o g y,S i c h u a nU n i v e r s i t y,C h e n g d u,S i c h u a n6 2 1 0 0 5,C h i n a)A b s t r a c t:P o s t o p e r a t i v e r i s k

7、p r e d i c t i o nh a s ap o s i t i v e e f f e c t o nc l i n i c a l r e s o u r c ep l a n,e m e r g e n c yp l a np r e p a r a t i o na n dp o s t o p e r a t i v er i s ka n dm o r t a l i t yr e d u c t i o n.T oe m p l o y t h eu n s t r u c t u r e dp r e o p e r a t i v ed i a g n o s i

8、sw i t hr i c hs e m a n t i c i n-f o r m a t i o n,t h i sp a p e rp r o p o s e sap o s t o p e r a t i v er i s kp r e d i c t i o nm o d e lv i au n s t r u c t u r e dd a t ar e p r e s e n t a t i o ne n h a n c e-m e n t.T h em o d e lu t i l i z e ss e l f-a t t e n t i o nt of u s et h es

9、t r u c t u r e dd a t aw i t hu n s t r u c t u r e dp r e o p e r a t i v ed i a g n o s i s.C o m-p a r e dw i t ht h eb a s e l i n em e t h o d s,t h ep r o p o s e dm o d e l i m p r o v e sF1-S c o r eb ya na v e r a g eo f9.5 3 3%o nt h et a s k so ft h ep u l m o n a r yc o m p l i c a t i

10、o nr i s kp r e d i c t i o n,t h eI C Ua d m i s s i o nr i s kp r e d i c t i o na n dt h ec a r d i o v a s c u l a ra d v e r s er i s kp r e d i c t i o n.K e y w o r d s:p o s t o p e r a t i v er i s kp r e d i c t i o n;s e l f-a t t e n t i o nm e c h a n i s m;d a t ar e p r e s e n t a t

11、i o n;i n f o r m a t i o nf u s i o n收稿日期:2 0 2 3-0 3-1 9 定稿日期:2 0 2 3-0 7-0 4基金项目:四川大学华西医院135项目(Z Y J C 2 1 0 0 8);国家重点研究与发展计划项目(2 0 1 8 Y F C 2 0 0 1 8 0 0)1期王亚强等:非结构化数据表征增强的术后风险预测模型0 引言术后并发症(如肺部并发症1、心血管不良2、I C U入室3等)风险(后文简称“术后风险”)所导致的术后3 0天内死亡,已成为全球排名第三位的人群死亡原因4。准确的术后风险预测对医生进行合理的临床资源规划、应急方案准备具有重

12、要的辅助作用,对患者的术后风险发生和死亡率降低具有积极的意义5-6。目前,术后风险预测主要基于患者的基本信息(如体温、血压、体重等)、术前的实验室检查(如氧分压、氧饱和、蛋白等)、术中的生命体征(如出血量等)等结构化数据,利用极限梯度提升(e X t r e m eG r a d i e n tB o o s t i n g,X G B o o s t)、逻辑回归(L o g i s t i cR e g r e s s i o n,L R)、随机森林、人工神经网络等模型实现2,5。近年来,深度神经网络在各领域的预测任务中表现优秀,受到研究者的广泛关注,也被引入术后风险预测任务6。F r i

13、t z7等人构建了一种多路径卷积神经网络,提取和融合患者基本信息、共病情况、术前实验室检查和术中生命体征等结构化数据中的特征,用于患者术后死亡风险预测。B a r b i e r i8等人利用双向门控循环单元,将结构化数据之间的时间信息以拼接的方式融入数据表征,采用注意力机制提取重要特征,用于患者术后I C U入室风险预测。现有方法的核心是如何将结构化数据中的离散型和连续型特征向量化,形成基于深度神经网络的术后风险预测模型的数据表征。在术前数据中,除结构化数据外,还包含语义丰富的非结构化术前诊断数据。术前诊断中不仅包含医生基于的医学知识,还包含根据局部的结构化数据,对患者病情的总结信息,以及医

14、生以整体的结构化数据为依据,利用经验知识,对患者病况的推断信息。如图1中患者1的术前数据所示,根据结构化数据收缩压1 5 6 mmH g(毫米汞柱)与舒张压7 6mmH g,基于医学知识“成人的收缩压和舒张压正常范围应在9 0 mmH g至1 2 0 mmH g之间”,因此,医生在术前诊断中总结该患者有“高血压病”,且属于“3级很高危”。此外,依据目前患者整体的结构化数据,医生根据经验知识,推断患者是“肺部感染”。更进一步地,术前诊断的整体描述,反映了当前患者的全局状态。这些语义信息能够丰富术后风险预测的特征,有助于增强预测模型的性能。图1 结构化的患者基本信息和术前实验室检查数据然而

15、,术前诊断数据尚未在术后风险预测任务中被有效利用。如何充分地利用非结构化的术前诊断数据,形成有效的术后风险预测数据表征,尚有待进一步探索。综上,本文围绕非结构化的术前诊断数据如何增强术后风险预测任务这一问题展开研究,主要的贡献包括以下三个方面:(1)与围术期医学专家合作,经过清洗、处理、转换和去隐私过程,构建了一份包含1 22 4 0个实例、面向术后风险预测任务的数据集。该数据集的结构化数据部分包含了9 5列离散型变量、6 1列连续型变量、一列非结构化的术前诊断变量以及三列二元的术后风险标签变量,分别表示肺部并发症、心血管不良和I C U入室风险的发生情况。(2)为充分地利用非结构化的术前诊断

16、数据,本文提出一种非结构化数据表征增强的术后风险预测模型,利用自注意力机制,将结构化数据与局部的细粒度实体信息及全局的粗粒度文本语义加权融合,有效地将非结构化数据用于增强术后风险预测性能。(3)本文提出的基于自注意力机制融合结构化与非结构化数据的模型结构,为术后风险预测带来了良好的可解释性。细节实验结果分析发现,利用自注意力机制获得的关系权重矩阵,可以解释和展示出非结构化数据,不仅增强了重要的结构化数据的贡献度,而且还补充了风险预测信息。实验结果表明,本文提出的非结构化数据表征增强的术后风险预测模型明显优于所对比的常用统751中文信息学报2 0 2 4年计机器学习模型和最新的深度神经

17、网络,在三种重要的术后风险预测(包括肺部并发症风险预测、I C U入室风险预测和心血管不良风险预测)任务上,本文提出的模型均取得了最优的结果,F1值分别达到了6 6.9 0 9%、6 0.8 3 3%和5 5.8 8 8%。此外,通过消融实验,进一步验证了本文提出的模型有效地加权融合了局部的细粒度实体信息和全局的粗粒度文本语义信息。利用非结构化术前诊断数据表征增强术后风险预测模型后,肺部并发症风险预测的F1值提升了6.8 7 8%,I C U入室风险预测提升了7.6 4 1%,心血管不良风险预测提升了9.5 4 1%。1 相关工作术后风险预测是医学信息学领域的研究热点问题。当前的研究主要集中在

18、验证统计机器学习模型在术后风险预测任务上的有效性,以及面向特定类型的术后并发症风险的特征分析两个层面。C a n e t9等人利用逻辑回归模型,确定了7个独立且具有良好鉴别能力的危险因素后,构建了术后肺部并发症风险预测指标,用于评估和预测术后肺部并发症的个体风险。H i l l1 0等人采用随机森林模型,自动地发现重要的术前特征,将结构化的美国麻醉医师协会身体状况特征与术前特征相结合,提升术后死亡风险的预测性能。与先前工作不同,本文提出了一种非结构化数据表征增强的术后风险预测模型,该模型基于自注意力机制,在预测中有效地融合结构化数据和非结构化语义信息,并提供

19、良好的可解释性。术后风险预测目前的主要研究对象是术前和术中的结构化数据,其中包含两种类型的变量,一种是离散型变量,另一种是连续型变量。其中连续型变量通常会被离散化后,与离散型变量一同构建特征向量,作为术后风险预测模型的输入1 1。本文的实验主要基于结构化的患者基本信息和术前的实验室检查数据。本文采用与先前工作相同的连续型变量的基本处理方法。差异在于本文借鉴F r i t z7等人的思想,将离散型变量和离散化的连续型变量构建离散特征词典,并基于深度神经网络学习离散特征的嵌入表征。术后风险预测除可利用术前和术中的结构化数据作为特征之外,通过观察发现,包含医学语义信息的非结构化术前诊断数据也可用于增

20、强术后风险预测。Z h a n g1 2等人提出将英文临床文本利用D o c 2 V e c模型1 3直接形成数据表征,然后与结构化数据合并的方式,将非结构化数据与结构化数据融合,应用于住院死亡率、住院时间长短和术后3 0天再入院的预测任务,该方法在英文临床数据M I M I C-I I I1 4上进行了实验验证。与该工作不同,本文首次探索了将中文非结构化临床文本引入术后风险预测的方法。此外,本文通过观察还发现,在非结构化的术前诊断中,既包含全局的粗粒度文本语义信息,还包含局部的细粒度医学实体信息,它们均可为术后风险预测提供医学语义特征(图1)。为将这些信息与离散特征的嵌入表征相融合,本

21、文首先基于常用的中文M e d B E R T获得实体的嵌入表征,并将术前诊断视为句子后,采用词嵌入平均池化的方法将其向量化。然后利用自注意力机制1 5,将离散特征的嵌入表征与实体的嵌入表征以及向量化的术前诊断进行加权融合,在综合地利用全局和局部的文本语义信息的基础上,还为模型带来了良好的可解释性1 6。2 术后风险预测2.1 任务定义本文将术后风险预测定义为一项二分类任务,采用有监督学习方法解决。定义(x,y)为一个训练实例,x中包含xn u m、xc a t和xP D三种类型的特征。其中,xn u m表示表格数据中的连续型特征,共m列,xc a t表示表格数据中的离散型特征,共n列,xP

22、 D表示非结构化的术前诊断文本数据,y表示术后风险发生的情况,用1或0分别表示风险的发生或未发生。2.2 表格数据的向量表征本文提出的术后风险预测模型主要利用结构化表格数据和非结构化术前诊断文本数据对术后风险进行预测(模型的结构如图2所示)。结构化表格数据由xn u m和xc a t组成。本文采用分类与回归树算法1 7,先将连续型特征转换为离散型特征,在引入医学语义信息的同时,降低数据的复杂度。转换后的连续型特征不仅能够表达医学语义,还被统一成离散型特征。转换后的连续型变量表征被定义为851UR L:h t t p s:/c o d e.i h u b.o r g.c n

23、/p r o j e c t s/1 7 7 51期王亚强等:非结构化数据表征增强的术后风险预测模型xn 2 c a t,如式(1)所示。xn 2 c a t=d i s c r e t i z e(xn u m)(1)处理离散型变量表征的常用方式是采用实体嵌入1 8的方法,即为每一个离散型变量构建一个特征词表,词表大小为当前离散型变量的不同取值的数量。然而该方法在建模的过程中仅考虑了单一变量下的不同取值之间的语义关联,而不同的变量之间的相关性未被考虑其中。为引入全局不同变量之间的语义关联,本文改进了原始的实体嵌入方法,让所有的离散型变量共用特征词表。每一个离散型变量(包括xc a t和xn2

24、 c a t)的不同取值,都会被赋予唯一的索引值xi,其中,i0,|V|,|V|是所有的离散型变量的不同取值的数量总和,即共用的特征词表的词表大小。每个xi都将通过学习过程被映射为一个维度为d的向量,定义为et a b u l a r,其中d为超参数。通过构建全局共用的特征词表,原始的离散型变量转换为语义向量之后,不仅扩充了医学语义信息,并且不同的离散型变量之间也产生了语义关联。相比原始的实体嵌入方法,该方法解决了不同离散型变量之间语义关联缺失的问题。最后,将所有的et a b u l a r拼接形成表格数据的向量表征Et a b u l a r。图2 模型结构图2.3 文本数据的向量表征术前

25、诊断文本xP D主要包含医生总结的病人身体症状和初步推断的病情描述,两者可统一定义为病症实体。因此,术前诊断文本可以归纳为由多个病症实体、连接词以及标点符号构成的集合,每个实例xP D包含lm a x项的病症实体,lm a x表示数据集中,xP D中最多可饱含的病症实体数量。术前诊断文本可以有两种向量表征方法,一种是形如利用D o c 2 V e c模型1 3得到的全局语义向量,获取该类向量表征的方法我们称之为粗粒度文本的向量表征方法;另一种是直接将病症实体对应的语义向量拼接,形成细粒度文本的向量表征。后文将具体介绍它们获取术前诊断文本粗粒度语义信息和细粒度语义信息的方法。2.3.1 粗粒度语

26、义向量表征方法为获取术前诊断文本的粗粒度语义向量表征,本文先将文本进行了分词,得到分词列表t o k e n0,t o k e n1,t o k e np,其中p表示文本分词后得到的词的数量。将分词列表输入领域微调后的预训练模型M e d B E R T中,生成维度为7 6 8的动态词向量列表e7 6 80,e7 6 81,e7 6 8p。其中,7 6 8是M e d B E R T的词向量维度。为进一步获取句子向量,本文采用平均池化的方法整合词向量的语义信息。对词向量矩阵中的每一列求均值,将词向量矩阵压缩为包含整951本文实验中直接采用了h t t p s:/h u g g

27、i n g f a c e.c o/h f l/c h i-n e s e-m a c b e r t-b a s e的内置分词工具中文信息学报2 0 2 4年个术前诊断语义信息的粗粒度语义向量表征es e n t e n c e,如式(2)所示。es e n t e n c e=M e a n P o o l i n g(e7 6 80,e7 6 8p)(2)2.3.2 细粒度语义向量表征方法将术前诊断文本分词后,通过M e d B E R T生成的词向量被压缩为单一向量,会导致局部语义信息的丢失,且无法明确术前诊断文本中哪些信息在术后风险预测过

28、程中起到了关键作用。为保留术前诊断文本中的局部细粒度实体语义信息,本文首先利用医学领域数据集,基于B E R T+B i L S TM+C R F模型训练得到实体抽取模型1 9,然后利用该模型抽取xP D中的病症实体,形成病症实体集合w0,wk,wK,其中,K表示当前xP D中抽取得到的病症实体数量。图3 细粒度语义向量的补全与降维转换方法因为xP D中包含的实体数量可能不一致,为后续处理统一,本文将病症实体数量未达到lm a x的集合,通过补全特殊字符P A D 的方式,形成数量均为lm a x的实体集合(图3)。然后,每一个实体wk将通过M e d B E R T转换为蕴含医学语义的向量

29、e7 6 8k。为后续与表格数据的向量表征进行融合,细粒度语义向量进一步通过全连接层降维,从7 6 8维降至d维,得到降维后的细粒度语义向量集合ed0,ed1,edlm a x。最后,将含有全局语义信息的粗粒度向量表征和含有局部语义信息的细粒度向量表征组合,得到最终的术前诊断文本的向量表征Et e x t如式(3)所示。Et e x t=ed0,ed1,edlm a x,es e n t e n c e(3)2.4 特征融合方法在特征融合层,本文选择采用S e l f-A t t e n t i o n机制1 5将表格数据表征Et a b u l a r与文本数据的向量表征Et e x t进行

30、特征融合(如图4所示)。首先,将表示表格数据信息的数据表征Et a b u l a r与表示文本语义信息的数据表征Et e x t拼接,形成新的特征向量集合EX,并将EX通过三个参数矩阵WQ、WK和WV映射为三个不同的矩阵Q、K和V。然后对Q和KT执行点积并利用dk放缩结果,以保证训练过程中梯度的稳定性。其中,dk是指矩阵K的维度,计算方法如式(4)的S o f t m a x函数的输入所示。随后执行S o f t m a x函数进行归一化,得到不同的数据表征之间(包含表格数据表征和文本数据表征)的注意力权重Ww e i g h t,其计算方法如式(4)所示。W

31、w e i g h t=S o f t m a xQ KTdk(4)图4 特征融合方法最后将Ww e i g h t与V相乘得到增强后的特征表示A。具体计算过程如式(5)式(7)所示。EX=Et a b u l a rEt e x t(5)Q=EXWQ,K=EXWK,V=EXWV(6)A=A t t e n t i o n(Q,K,V)=Ww e i g h tV(7)通过注意力机制,模型可以自动地学习到特征在推理过程中的重要性或贡献度。因此,在模型推理过程中,可以通过提取并分析注意力权重矩阵,来0611期王亚强等:非结构化数据表征增强的术后风险预测模型探究在模型预测过程中,各特征发挥作用的

32、重要程度,从而为模型带来良好的可解释性。为了解决梯度消失问题,受文献2 0-2 1 的启发,表征矩阵A在输入前馈神经网络之前,还经过了残差网络和层标准化操作。接着将向量输入到带有S i g m o i d激活函数的前馈神经网络中,计算预测术后风险的发生概率P如式(8)所示。P=S i g m o i d(WTA+b)(8)在式(8)中,W和b是前馈神经网络将学习的参数。最后,模型的损失定义为如式(9)所示。L o s s=-1MMi=1(yil o gPi+(1-yi)l o g(1-Pi)(9)其中,M指批量包含的实例数量。3 实验3.1 实验数据本文实验采用了从医院的临床管理系统中获取的

33、数据,其中包含患者的基本信息、术前实验室检查数据和术前诊断,以及病人术后发生的肺部并发症风险、I C U入室风险和心血管不良风险结局。该数据经过了如下基本的预处理过程:(1)删除了有关患者身份的个人信息;(2)删除了缺失率高于5 0%的变量。最终得到包含1 22 4 0个实例的术后风险预测数据集,该数据集中包含9 5项离散型变量和6 1项连续型变量以及1项术前诊断变量。数据集中包含的三种术后风险的标签分布如图5所示,肺部并发症风险的阳性率为1 5.9 3%,I C U入室风险的阳性率为6.2 5%,心血管不良风险的阳性率为3.0 2%。实验中,本文将数据集按照712的比例划分得到训练集、验证集

34、和测试集。图5 实验数据中的标签分布3.2 评估指标为了评估模型的效果,本文采用精确率(P r e c i s i o n)、召回率(R e c a l l)和F1值作为主要的评估指标,具体的计算如式(1 0)式(1 2)所示。P r e c i s i o n=T PT P+F P(1 0)R e c a l l=T PT P+F N(1 1)F1=2P r e c i s i o nR e c a l lP r e c i s i o n+R e c a l l(1 2)其中,T P表示在阳性实例中,模型预测为阳性的实例数量;F P表示在阴性实例中,模型预测为阳性的实例数量;F N表示在阳

35、性实例中,模型预测为阴性的实例数量。3.3 参数设置模型训练采用了A d a m优化器,初始学习率设置为3 e-4,1=0.9,2=0.9 9 9,批量大小设置为1 2 8,训练轮次设置为1 0 0,超参数d设置为3 2,D r o p o u t比例参数设置为0.5。在以上超参数设置条件下,本文提出的术后风险预测模型达到了收敛。本文为验证所提出模型在术后风险预测任务上的有效性,在实验中选择了两种常用的统计机器学习模型L R和X G B o o s t以及两种最新的基于表格数据分类的深度神经网络W i d e&D e e p2 2和T a

36、b t r a n s f o r m e r2 3作为对比模型。L R和X G B o o s t采用s c i k i t-l e a r n框架2 4实现,W i d e&D e e p和T a b t r a n s f o r m e r采用开源的代码库实现。3.4 实验分析首先,在三项术后风险预测任务上对比了模型的预测性能,实验结果如表1所示。从表1所列结果可以观察到,W i d e&D e e p和T a b t r a n s f o r m e r在三项术后风险的预测任务上均优于L R和X G B o o s t,特别是在阳性率较低的心血管不良风险预测任务上,W i d

37、 e&D e e p和T a b t r a-n s-f o r m e r的表现远优于L R和X G B o o s t。该结果说明,深度神经网络在术后风险预测任务上的性能优于统计机器学习模型,这与文献6-7 报告的结果保持一致。161h t t p s:/g i t h u b.c o m/j r z a u r i n/p y t o r c h-w i d e d e e p/t r e e/p y t o r c h_w i d e d e e p中文信息学报2 0 2 4年表1 实验整体结果(单位:%)模型肺部并发症风险I C U入室风险心血管不良风险P r e c i

38、s i o nR e c a l lF1P r e c i s i o nR e c a l lF1P r e c i s i o nR e c a l lF1L R7 1.5 0 83 1.0 6 84 3.3 1 67 2.8 4 03 6.8 7 54 8.9 6 34 5.8 3 31 3.4 1 52 0.7 5 5X G B o o s t6 9.9 6 54 8.2 9 35 7.1 4 37 4.1 1 83 9.3 7 55 1.4 2 94 1.1 7 68.5 3 71 4.1 4 1W i d e&D e e p7 3.2 1 45 4.0 8 96 2.2 1 57

39、4.6 0 33 7.6 0 05 0.0 0 05 2.7 7 82 9.7 8 83 7.2 5 5T a b t r a n s f o r m e r6 8.5 6 36 0.4 2 26 4.2 3 67 5.3 8 53 9.2 0 05 1.5 7 95 5.5 5 63 0.3 0 33 9.2 1 6O u r6 8.3 7 86 5.7 2 36 6.9 0 96 5.0 8 85 7.6 6 46 0.8 3 37 7.3 9 54 4.2 6 05 5.8 8 8 此外,从表1中所列结果还可以看出,通过引入术前诊断文本数据表征,本文提出的模型在肺部并发症、心血管不良和I

40、 C U入室三个术后风险预测任务上均取得了最优的性能,F1分别达到了6 6.9 0 9%、5 5.8 8 8%和6 0.8 3 3%。该结果证明,本文提出的文本数据表征增强的术后风险预测模型是有效的。进一步观察表1中的结果发现,相比于其他模型,本文提出的模型是在保持了良好的精确率的条件下,大幅地提升了召回率,从而提升了F1。该结果说明,当模型引入非结构化的术前诊断数据表征后,进一步丰富了特征的医学语义信息,对阳性实例的预测带来了额外的医学语义信息补充,从而帮助模型将之前无法判断的阳性实例准确地预测为阳性,进而提高了模型的召回率。3.5 消融实验为进一步验证文本数据表征

41、对模型预测效果增强的作用,并探究文本中粗粒度语义信息和细粒度语义信息对预测任务的影响,本文还设计了不加入文本以及分别加入粗粒度和细粒度语义信息的对比消融实验,结果如表2所示,其中,“-E”表示模型中去除细粒度语义向量表征,“-S”表示模型中去除粗粒度语义向量表征,“-E-S”表示模型中去除所有的文本数据。表2 消融实验结果(单位:%)模型肺部并发症风险I C U入室风险心血管不良风险P r e c i s i o nR e c a l lF1P r e c i s i o nR e c a l lF1P r e c i s i o nR e c a l lF1O u r-E-S6 0.8 4

42、25 9.4 4 46 0.0 3 15 3.8 7 85 2.5 9 85 3.1 9 25 2.8 5 44 2.6 8 74 6.3 4 7O u r-E6 2.5 46 2.3 9 46 2.7 5 45 6.3 6 55 3.6 7 05 4.9 1 35 3.5 5 14 2.6 6 34 6.9 0 5O u r-S6 8.0 8 96 6.0 1 06 6.8 8 36 1.1 2 95 8.1 5 25 9.5 7 07 9.6 9 74 3.0 2 95 5.5 7 7O u r6 8.3 7 86 5.7 2 36 6.9 0 96 5.0 8 85 7.6 6 46 0

43、.8 3 37 7.3 9 54 4.2 6 05 5.8 8 8 表2中在加入文本数据后,本文提出的模型在肺部并发症风险预测任务上的性能提高了6.8 7 8%,在I C U入室风险预测中提高了7.6 4 1%,在心血管不良风险预测中提高了9.5 4 1%,并且无论是单独加入粗粒度文本的语义向量还是细粒度文本的语义向量,模型的预测性能均得到明显改善。该结果说明,非结构化术前诊断中的信息对术后风险预测具有积极的作用,为术后风险预测提供了额外的决策信息,有效地增强了模型的预测能力。此外,观察表2还可以发现,阳性率越低的术后风险,通过引入非结构化术前诊断数据

44、表征后,模型的预测性能提升越高。该结果说明,对于阳性实例更少的术后风险,模型需要更多的特征才能更准确地预测阳性病例,引入非结构化的术前诊断能够为模型带来更丰富的医学语义信息,从而使本文提出的模型在阳性率越低的术后风险预测中表现得越出色。从表2结果还能够看出,相比于全局的粗粒度语义向量表征的缺失,模型对于局部的细粒度语义向量表征的缺失更加敏感。该结果说明,在术后风险预测的过程中引入围术期医学领域知识,对模型的预测性能提升具有重要的作用,这也进一步说明了本文提出的非结构化数据表征增强的术后风险预测模型的有效性和应用价值。更进一步地,从表2中还可以看出,当模型同时2611期王亚强等:非结构化数据表征

45、增强的术后风险预测模型引入粗粒度语义向量表征和细粒度语义向量表征时,模型的预测性能达到最优。该结果说明,当用非结构化数据表征增强术后风险预测模型时,既需要引入粗粒度语义向量表征携带的全局语义信息,又需要引入细粒度语义向量表征携带的局部语义信息。3.6 细节分析本文提出的模型通过自注意力机制为术后风险预测模型带来了可解释性。为验证和说明该效果,本文选取了一个发生了术后心血管不良的病人的案例,观察模型的注意力权重矩阵。该实例的术前诊断是“右肺上叶结节,高血压3级”。本文提出的模型准确地预测该实例的术后心血管不良风险结局。提取模型的注意力权重矩阵Ww e i g h t,并画出其热力图(图6)

46、。在图6中,横轴上的“右肺上叶结节”和“高血压3级”是术前诊断中的实体病症,P A D 是补全的字符,其余行的描述以及列的描述均是表格数据包含的变量。图6 心血管不良实例的注意力权重热力图从图6可以看出,在术前诊断描述中,“高血压3级”显著地与表格数据中的收缩压和舒张压变量具有强关联。该强关联预示着模型通过训练,学习到了数据集中包含的医学领域知识关联信息,该关联信息保存在了Ww e i g h t中,在术后风险预测中起到了重要的预示作用。另一个方面,该结果还说明,利用自注意力机制为术后风险预测模型带来了可解释性。总体地,实验结果验证了本文提出的模型在增强术后风险预测性能方面的鲁棒性和可解释性。

47、通过对比引入非结构化数据表征前后,Ww e i g h t中包含的权重值按列求和后得到的每个变量在术后风险预测中的权重比率排序,进一步观察在术后风险预测中起重要作用的变量与术后风险结局是否存在医学语义的相关性,对比结果如图7所示。从图7可以看出,权重比率越高,说明变量在预测中具有更高的重要性。从结果可以看出,在引入非结构化数据表征后,与术后心血管不良风险强相关的医学变量收缩压与舒张压的权重比率排序更加靠前。该结果进一步证实了本文提出的模型在提升术后风险预测性能的同时,还学习到了医学领域知识,具有更好的可解释性。从图7中还可以看到,在引入非结构化数据表征后,临床医生根

48、据经验总结或推断得到的额外的重要医学语义信息,也在风险预测中起到了重要的作用,例如临床医生基于收缩压和舒张压总结并记录下的“高血压3级”疾病。一方面,该结果证明了本文提出的模型学习到了医学领域知识,并对术后风险预测起到了积极的作用。另一方面,该结果还说明,本文通过直觉观察提出的模型是正确的,术前诊断中包含了大量的医学语义信息,这些信息既包含表格数据中已有的医学语义信息,还包含大量可用于丰富原始表格数据的额外的医学领域知识,这些信息会对模型的预测性能提升起到积极的作用。更进一步地,该结果也说明,本文提出的模型在提升了术后风险预测性能的同时,还具有良好的鲁棒性和结果可解释性。图7 变量在模型术后风

49、险预测中的重要性排序361中文信息学报2 0 2 4年4 结束语术后风险预测在临床医学中具有重要意义,基于表格数据构建统计机器学习模型和深度神经网络,实现术后风险预测是常见的方式。非结构化术前诊断数据中蕴含了大量额外的医学领域知识,可为术后风险预测提供丰富的医学语义信息,然而它们尚未被有效利用。针对该问题,本文提出了一种新的模型,用非结构化数据表征增强术后风险预测,并在模型中引入自注意力机制,在有效融合表格数据和非结构化数据的同时,为模型带来良好的可解释性。实验结果表明,本文提出的非结构化数据表征增强的术后风险预测模型的性能显著高于其他比较的基线模型和先进模型。通过消融实验,验证了在

50、术后风险预测中引入非结构化术前诊断数据的重要性,证明了本文提出的模型的有效性。此外,通过对模型的注意力权重的细节分析发现,利用自注意力机制将表格数据与非结构化的术前诊断融合用于术后风险预测,为模型带来了良好的可解释性。参考文献1 魏娟,邓惠民,吕欣.术后肺部并发症围手术期风险因素及防治策略J.同济大学学报(医学版),2 0 2 1,4 2(6):7 3 6-7 4 3.2 L UN D B E R GS,NA I RB,VAV I L A L A M,e ta l.E x-p l a i n a b l em a c h i n e-l e a r n i n gp r e d i c t i

展开阅读全文