1、技术与应用生命科学仪器 2023 第21卷/1期56Abstract:In order to improve the accuracy of lung nodule prediction,a method based on improved denoising auto encoder(DAE)model for lung nodule CT image prediction was proposed.Methods Taking the CT images of pulmonary nodules as the research object,the 3D voxel reconstruct
2、ion of the CT images of pulmonary nodules was carried out by using the surface rendering method to obtain the 3D images of pulmonary nodules,and the lower layer characteristics of the 3D pulmonary nodules were characterized by using the thermonuclear feature representation method.Finally,the improve
3、d DAE model was used to predict the CT images of pulmonary nodules.The simulation results show that the proposed method can realize the prediction of pulmonary nodule disease and assist doctors in diagnosing pulmonary nodules.Compared with the standard DAE model,deep belief network(DBN),pyramid matc
4、hing(ISPM),and reduced Bi harmonic distance matrix(RBiHDM),the proposed method has stronger accuracy,with the recognition accuracy of 81.2%and 96.2%for 2D data and 3D data,respectively,which has strong effectiveness and superiority.Key words:Prediction of pulmonary nodules;CT image;Three dimensional
5、 voxel reconstruction;Thermonuclear characteristics基于CT影像数据和改进降噪自编码器的肺结节生长预测模型万光艺,孔杰俊*,张璐(南京胸科医院(南院区),江苏南京,210029)Prediction of lung nodule growth based on CT image data and improved noise reduction self encoderWAN Guangyi,KONG Jiejun*,ZHANG Lu (Nanjing Chest Hospital(South Hospital Area),Nanjing,21
6、0029)摘要:为提高患者肺结节疾病诊断的准确率,提出一种基于改进降噪自编码器(denoising auto-encoder,DAE)的三维肺结节CT图像预测方法。其中,采用面绘制法对肺结节CT图像进行三维体素重建,以获取三维肺结节图像,采用热核特征表示方法表征三维肺结节低层特征,最后采用改进的DAE网络对肺结节进行预测,以实现肺结节CT影像的精准预测。仿真结果表明,相较于标准的DAE模型和深度信念网络(deep belief network,DBN)、金字塔匹配(intrinsic pyramid matching,ISPM)、降调距离矩阵方法(reduced Bi-harmonic dis
7、tance matrix,RBiHDM),本研究提出的方法对二维数据和三维数据的识别准确率分别达到81.2%和96.2%,具有更高的准确性。由此得出,改进降噪自编码器可识别肺结节影像,更好的辅助医师诊断。关键词:肺结节预测;CT影像;三维体素重建;热核特征中图分类号:TP39 文献标识码:A DOI:10.11967/2023210208作者简介:万光艺(1977.03-)男,汉,江苏南京,本科,主管技师,研究方向:医学影像技术。技术与应用生命科学仪器 2023 第21卷/1期570 引言肺癌是一种最常见的肺部原发性肿瘤,其发病率和致死率极高。据相关数据显示,2021年全球有220万人确诊为肺
8、癌,其中死亡人数达到180万。因此,肺部肿瘤的早期筛查和诊断对治疗肺癌具有重要的意义。目前,肺部肿瘤的诊断主要依据CT扫描患者肺部影像,然后医师根据CT图像及病人临床表现进行诊断。然而由于该方法依赖于医师经验,可能存在漏诊或误诊的问题。近年来,随着计算机技术和人工智能技术的快速发展,为肺癌的智能诊断提供了参考。张怀瑢等提出一种基于深度学习的人工智能肺癌诊断方法,通过采用软组织算法(B10)、标准算法(B31)、高分辨率算法(B70)3种不同重建算法对常规胸部CT图像进行肺结节识别,并记录肺结节的大小和密度,认为该方法有利于提高肺结节的智能识别效率,进而辅助医师诊断肺癌1。马景旭等提出一种肺部影
9、像人工智能诊断方法,通过人工智能诊断鉴别肺结节良恶性,以及肺癌病理类型结果与病理检查结果的一致性,认为人工智能可鉴别诊断肺结节性质与肺癌病理类型2;罗亚敏等通过将人工智能应用于肺结节CT图像诊断,认为人工智能可明显提高放射科医师在CT筛查中对肺结节的检出能力,辅助医师诊断肺癌3。Qi Jian等基于无细胞甲基化DNA免疫沉淀和高通量测序(cfMeDIP-seq)技术,提出一种肺结节无创预测模型,可实现恶性肺结节的区分4。通过上述研究可以发现,基于深度学习和人工智能的诊断方法已广泛应用于肺癌和肺结节的辅助诊断中,但在肺癌和肺结节的预测方面,相关研究较少,且存在预测准确性低的问题5。因此,提出一种
10、基于改进DAE模型的肺结节CT影像预测方法。1 基本算法1.1 降噪自编码器(denoising auto-encoder,DAE)DAE是一种具有降噪功能的特征提取自编码器,通过在数据输入层引入随机噪声,并采用无监督分层预训练获取深度网络权值。该自编码器可学习到鲁棒性强的特征,具有更强的鲁棒性6。DAE基本结构如图1所示,包括编码器和解码器两部分。定义原始数据为,加入噪声后输入编码器F的数据为,d表示输入层数量,隐含层为,r为隐含层数量,则编码器编码过程中z的输入可表示为7:(1)式中,分别为输入层与隐含层连接权重和偏置。解码器解码过程G则是隐藏层对原始输入y的映射,可表示为8:(2)式中,
11、分别为隐含层与输出层的连接权重和偏置。为更好的优化权重和偏置,对标准编码后损失函数进行最小化,如式(3)9:(3)式中,分别为编码器中各层权重和偏差,为第i个训练样本,N为训练样本数量,为有效训练样本数量。1X2X3X4XnX1+1x2x3x4xnx1+1X2X3X4XnX图1 DAE模型结构DAE模型具有良好的鲁棒性,可提高图像的去技术与应用生命科学仪器 2023 第21卷/1期58噪性能,对于复杂度较高的图像数据,单层DAE通常不能达到理想的效果10。因此,研究对DAE模型进行了改进。1.2 DAE模型改进改进DAE模型结构如图2所示。构建改进DAE模型时,第一级编码器将输入图像映射到中间
12、隐含层,解码器则将中间隐含层输出映射到第二级输入图像中。整个过程中,中间隐含层的输出相当于是对输入数据的判断。因此,对于中间隐含层而言,是描述第i个输入数据的变化过程。最后,将T-1时刻获取的隐含层输出输入到下一层,并进行反复过程训练,直至整个模型训练结束。同时,为优化模型的学习效果,改进DAE模型的输入使用多类型,并通过编码器和解码器过程实现非线性变换。12g解码器12f解码器11g解码器11f解码器21g解码器21f解码器图2 改进的DAE模型网络结构2 基于改进DAE模型的肺结节预测方法基于上述改进的DAE模型,为更好地实现CT影像辅助肺结节诊断,研究利用改进DAE模型为预测模型,通过将
13、肺结节CT图像进行三维体素重建,并以三维肺结节图像低层热核特征表示作为模型输入进行训练,实现对肺结节的预测。2.1 肺结节CT图像三维体素重建考虑到肺结节CT图像为二维空间平面图像,已不能满足日益增长的图像处理需求。因此,为更好实现图像处理与更精确地表示立体图形,研究采用面绘制法对肺结节CT图像进行了三维体素重建11。肺结节CT图像面绘制法三维体素重建就是在体素内对肺结节CT图像小三角面片进行体素跟踪,并配合图像的明暗进行处理,实现三维体素重建。三维体素重建后的肺结节图像如图3所示。(a)肺结节CT图像(b)肺结节三维体素重建结果图3 肺结节三维体素重建结果2.2 三维肺结节低层特征表示三维图
14、像低层特征表示方法众多,其中,Jian Sun等提出的热核特征方法因具有等距不变性的特点,广泛用于三维图像形状的分割与分类12。因此,本研究利用热核特征法表示肺结节三维图像低层特征。假设肺结节三维图像对应在形状网格曲面含有个顶点,采用核密度描述符对热扩散时间t上第i个形状的热核特征估计为,对应形状分布为,其中N为热核特征数量,则采用高斯核函数对形状分布进行预测,可将表示为:(4)技术与应用生命科学仪器 2023 第21卷/1期59式中,为扩散时间t中高斯核带宽,可通过式(5)计算13:(5)式中,为扩散时间t热核特征产生的标准偏差。对式(4)中参数s进行参数化,如式(6),可形成一个离散形状分
15、布表示形状:(6)式(6)中,分 别 为的 最 大 值 和 最 小 值,。采用热核特征表示的三维肺结节低层特征如图4所示。图中,(a)为二维肺结节CT图像,(b)为三维重建得到的对应肺结节,(c)为(b)的热和特征表示形状描述符。由图可知,不同形状的三维肺结节图像热扩散过程不同,连续扩散时间也不同。(a)(b)(c)图4 三维肺结节低层特征热核表示2.3 肺结节预测方法基于上述三维肺结节低层特征热核表示,采用改进DAE模型进行预测,具体流程如下:(1)CT图像三维体素重建。采用面绘制方法对CT图像进行三维体素重建,获取对应的三维肺结节图像表示;(2)三维肺结节低层特征热核表示。利用热核特征方法
16、三维肺结节低层特征进行形状描述,获取三维肺结节形状描述符。在形状描述符中,提取的低层特征为不同扩散时间下肺结节三维图像形状的热核特征分布;(3)模型训练。训练一个改进DAE模型,学习嵌入在隐含层中的高层特征,待当前层训练稳定后,中间隐含层输出到下一层进行特征深层学习。训练完成后,保存输出训练得到的改进DAE模型;(4)模型预测。将获取的三维肺结节形状描述符输入训练完成的改进DAE模型中进行预测,并输出结果,即可实现对肺结节的预测。上述流程可用图5示意。假设存在D种不同形状的肺结节CT图像,首先利用面绘制法构建D种不同形状的肺结节三维图像,然后分别输入构建的改进DAE模型不同网络层中。其中,第一
17、层第j个网络是扩散时间j形状分布pi,j扩散时间j+1形状分布的pi,j+1映射,则整个模型的损失函数计算过程可表示为14:(7)式中,分别表示矩阵权重和偏置,为第一层第j个改进DAE模型输出,分别为改进DAE模型的编码解码过程。通过实验,。12g解码器12f解码器11g解码器11f解码器21g解码器21f解码器3=t2=t1=t图5 基于改进DAE的肺结节预测模型结构3 仿真实验3.1 实验环境搭建本次实验基于MATLAB2018b软件构建自编码网技术与应用生命科学仪器 2023 第21卷/1期60络模型,并在Windows10操作系统上进行仿真。系统配置i7-6700中央处理器,运行内存为
18、16GB,硬盘为1000GB。3.2 数据来源及预处理本次实验数据选用某医院20182020年确诊为肺结节患者的CT图像,共2930张,作为测试集。同时选用疑似患者每次复诊的CT图像,共7100个,作为训练集。3.3 参数设置本次实验设置所提改进DAE模型参数为:网络层数L=2,第一层编码器和解码器结构分别为64-500-250-50和50-250-50-64,隐藏层特征表示大小为50,第二层编码器和解码器结构分别为50-125-250-15和15-250-125-50,输入特征尺寸为50。设 置 实 验 参 数 为:采 样 时 间 间 隔 为,采样时间T=26,形状分布尺寸15。3.4 结果
19、与分析3.4.1 参数敏感性分析为探究实验参数对所提改进DAE模型的性能影响,研究分析了不同采样时间T和不同形状分布尺寸m时所提模型的预测平均准确率,结果如图6所示。由图6a可知,不同T值下平均准确率曲线相对稳定,说明不同T值对所提模型模型预测平均准确率的影响较小。由图6b可知,随着形状分布尺寸的增大,所提模型的预测平均准确率先快速上升再维持稳定,说明当形状分布尺寸较低时,所提模型的性能较低,即地位形状分布不能良好表征形状。0.840.860.880.90.920.940.96255075100125150预测平均准确率/%扩散间隔中采样点的数量DAE(a)不同采样时间下模型准确率0.80.8
20、20.840.860.880.90.920.940.960.98164472100125150预测平均准确率/%估计形状分布的尺寸改进DAE(b)不同形状分布尺寸下模型的准确率图6 不同时间和形状分布下自编码器的平均精度3.4.2 模型验证为验证所提改进DAE模型的有效性,实验分析了所提模型对不同肺结节CT影像的形状描述符,结果如图7所示。由图7(a1)和7(a2)可知,不同位置变化的模型描述符曲线相似,由图7(b1)和7(b2)可知,不同肺结节模型的形状描述符不同。由此说明,位置变化对所提模型的肺结节三维建模影响较小,且模型的自编码网络中隐藏层特征具有同类变化小异类变化大的特点,有利于对不同
21、肺结节的识别与分类。图7 不同肺结节形状描述符表示图为分析所提模型的有效性,实验对比了所提改进DAE模型与标准DAE模型的形状分布准确率召技术与应用生命科学仪器 2023 第21卷/1期61回曲线。图8为所提模型形成的一个1250维描述符表征的形状分布准确率召回曲线与DAE模型的形状分布准确率召回曲线。图中,SDE表示形状状态,PSDE表示增强形状状态。由图可知,所提的改进DAE模型具有更强的准确性,可提高网络的整体性能。0.80.820.840.860.880.90.920.940.960.98164472100125150精确率估计形状分布的尺寸形状抖动SDEPSDE图8 形状分布准确率召
22、回曲线为定量分析所提改进DAE模型的对不同描述符识别的准确率,研究对比了所提模型与DAE模型的准确率数值,结果如表1所示。由表可知,相较于对比模型DAE模型,所提模型在等距、偏好变换等情况下,对不同形状描述符识别的准确率更高,说明所提模型可对同一类别正样本和不同类别负样本进行字典学习,且能取得良好的预测性能。表1 不同算法对不同描述符识别准确率对比3.4.3 模型验证为探究所提改进DAE模型的有效性和优越性,实验对比了所提模型与DAE模型在不同数量的训练样本中预测平均精度,结果如图9所示。由图9a可知,当训练样本为全类别样本时,所提模型和SDE模型均能获得较为稳定的预测准确率,但当训练样本量小
23、于20%时,两种模型的预测准确率较低,但整体来看所提模型相较于DAE模型,预测的平均准确率明显更高。由图9可知,当采用部分训练样本对模型进行训练时,所提模型与对比模型DAE模型的预测平均精度波动上升,所提改进DAE模型的平均准确率高于DAE模型,但相较于采用全类别作为训练样本,所提模型和DAE模型的平均准确率更低。综合来看,所提改进DAE模型相较于DAE模型,在不同数量的训练样本下,预测准确率更高,具有一定的优越性。0.820.840.860.880.90.920.940.960.10.20.30.40.50.6平均精度(MAP)部分类别训练样本数量DAE改进DAE(a)全类别训练样本0.70
24、.750.80.850.90.95123456平均精度(MAP)部分类别训练样本数量DAE改进DAE(b)部分训练样本图9 不同模型在不同数量训练样本下的平均精度对比为进一步验证所提改进DAE模型对CT影像数据的肺结节预测性能,实验对比了所提模型与其他预测模型DBN模型、ISPM模型和RBiHDM模型对CT影像二维数据和三维数据的识别准确率。其中,二维数据每类选用6个不同形状训练所提改进DAE模型,其余用于测试;三维数据每类选用12个不同形状训练所提改进DAE模型,其余用于测试。为避免随机误差对实验结果的影响,研究分别采用所提模型和对比模型对二维数据和三维数据进行了技术与应用生命科学仪器 20
25、23 第21卷/1期62重复30次实验,并以其平均值为最终结果,如表2所示。由表可知,所提的改进DAE模型对二维数据和三维数据的识别准确率最高,分别达到81.2%和96.2%,相较于对比模型均得到了不同程度的提升。由此说明,所提的改进DAE模型可根据CT影像形状预测肺结节,辅助肺部疾病的诊断。表2 不同模型识别准确率对比(%)4 结论综上所述,所提的基于改进DAE模型的肺结节CT图像预测方法,通过将体素重建的肺结节CT图像热核表示低层特征输入改进DAE模型,可实现肺结节疾病的预测,辅助医师进行肺部疾病诊断。相较于标准DAE模型,所提的改进DAE模型具有更强的准确性,可提高网络的整体性能;相较于
26、DBN模型、ISPM模型和RBiHDM模型,所提改进DAE模型的识别准确率更高,对二维数据和三维数据的识别准确率分别达到81.2%和96.2%,具有较强的有效性和优越性。参考文献1张怀瑢,孙潇,田兴仓,等.基于深度学习的人工智能诊断系统在不同重建参数下对肺结节的识别研究J.临床放射学杂志,2020,39(11):2203-2206.2马景旭,陈欢,王红.分析肺部影像人工智能诊断系统鉴别诊断肺结节性质J.临床肺科杂志,2021,26(6):842-846.3罗亚敏,赵林,江远亮,等.肺结节CT筛查中人工智能诊断系统应用价值评估J.华南国防医学杂志,2022,36(7):521-524.4Qi J
27、ian,Hong Bo,Tao Rui,Sun Ruifang,Z,et.A prediction model for malignant pulmonary nodules based on cfMeDIP-seq and machine learning.J.Cancer science,2021,112(9).5王昭珏,赵静,王孟昭.孤立性肺结节恶性概率预测模型的研究进展及临床应用J.中国肺癌杂志,2021,24(9):660-667.6吴则良,叶建川,王江,等.基于深度自动编码器神经网络的飞行器翼型参数降维与优化设计J.兵工学报,2022,43(6):1326-1336.7陈鹏,吴一凡
28、,蔡爽,等.基于自编码压缩与多尺度特征提取的抽水蓄能机组劣化趋势评估与预测J.水利学报,2022,53(6):747-756.7刘炎,龚思哲,王福利,等.基于堆叠有监督降噪自编码的运行状态评价J.仪器仪表学报,2022,43(4):271-281.8钱炜,郑威,徐伟,等.多层降噪自动编码器的心电信号去噪算法J.计算机与数字工程,2021,49(10):1957-1962.9何慧茹,李晓峰,张鑫,等.基于DAE的单细胞RNA测序数据聚类研究J.现代电子技术,2020,43(24):144-148.10蔡林沁,易文渊,黄宇婷,等.面向脑胶质瘤影像分析的混合现实技术J.软件学报,2022,33(9)
29、:3347-3369.11杨熙,黄健民.利用改进的热核特征分析三维网格的局部对应J.计算机应用与软件,2021,38(10):267-272+329.12钱炜,郑威,徐伟,等.多层降噪自动编码器的心电信号去噪算法J.计算机与数字工程,2021,49(10):1957-1962.13王浙超,曾九孙,谢磊,等.基于去噪自编码器的故障隔离与识别方法J.信息与控制,2021,50(6):641-65014唐智贤,王一淼,周靓怡,等.人工智能技术在肺部影像辅助诊断中的应用进展J.中国医学物理学杂志,2022,39(5):655-660.15欧建宏,郑穗敏,郑玉劲,等.基于人工智能诊断系统在胸部CT中肺结节检出能力的评估J.现代医用影像学,2021,30(3):479-482.