收藏 分销(赏)

基于高灰度值注意力机制的脑白质高信号分割.pdf

上传人:自信****多点 文档编号:2261043 上传时间:2024-05-24 格式:PDF 页数:9 大小:1.80MB
下载 相关 举报
基于高灰度值注意力机制的脑白质高信号分割.pdf_第1页
第1页 / 共9页
基于高灰度值注意力机制的脑白质高信号分割.pdf_第2页
第2页 / 共9页
基于高灰度值注意力机制的脑白质高信号分割.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、计算机与现代化JISUANJI YU XIANDAIHUA2023年第12期总第340期收稿日期:2023-01-10;修回日期:2023-04-06基金项目:国家自然科学基金资助项目(62076074);华为“智能基座”人工智能项目(211210176)作者简介:张伯泉(1974),男,山东临沂人,副教授,硕士生导师,博士,研究方向:智能控制与信息处理,嵌入式系统及其应用,E-mail:;麦海鹏(1998),男,广东广州人,硕士研究生,研究方向:计算机视觉,医学图像分割,E-mail:;陈嘉敏(1998),女,湖南郴州人,硕士研究生,研究方向:计算机视觉,E-mail:;通信作者:逄锦聚(1

2、972),男,青岛胶南人,高级工程师,本科,研究方向:大数据,互联网技术,E-mail:。文章编号:1006-2475(2023)12-0067-090引言脑 小 血 管 病(Cerebral Small Vessel Disease,CSVD)是老年人常见的一种脑血管疾病,通常由脑内小动脉、毛细血管以及小静脉血管壁等损伤引起。其临床表现包括急性缺血性卒中症状、轻度认知功能障碍及痴呆、步态异常、情绪或行为异常和运动障碍等1。脑小血管病的致残率高,康复难,因其发病隐匿,易被病人及医师忽略,严重危害中老年人的健康,为家庭、社会带来沉重负担。基于高灰度值注意力机制的脑白质高信号分割张伯泉1,麦海鹏1

3、,陈嘉敏1,逄锦聚2(1.广东工业大学计算机学院,广东 广州 510006;2.青岛西海岸新区教育和体育局,山东 青岛 266427)摘要:脑白质高信号是脑小血管病的常见影像学表现,对脑小血管病患者临床诊断有重要参考价值。脑白质高信号分割是临床诊断的基础工作之一,往往需要极具经验的医师进行手动刻画,极其耗费时间且繁琐。脑白质高信号是脑核磁共振成像T2加权像或者液体衰减反转恢复序列图像(Fluid Attenuated Inversion Recovery,FLAIR)中的高信号影,其灰度值明显高于其它正常的脑部组织。为提高对脑白质高信号区域的关注,根据脑白质高信号的影像学特征,提出一种具有高灰

4、度值注意力机制的网络模型。基于UNet网络,设计并引入高灰度值注意力模块,使网络模型更加关注于图像中灰度值较高的区域;为提高网络模型的特征提取能力,引入残差混合注意力模块。该方法明显地提升了脑白质高信号分割效果,DSC指标和Recall指标分别达到0.8330和0.8870,优于现有算法。消融实验也验证了高灰度值注意力模块和残差混合注意力模块的有效性。本文为基于FLAIR影像的脑白质高信号病灶分割提供了一种新方法,同时验证了传统图像分割方法与深度学习技术相结合的可行性。关键词:脑白质高信号;深度学习;医学图像分割;UNet网络;高灰度值注意力机制中图分类号:TP391文献标志码:ADOI:10

5、.3969/j.issn.1006-2475.2023.12.012White Matter Hyperintensities Segmentation Based on High Gray ValueAttention MechanismZHANG Bo-quan1,MAI Hai-peng1,CHEN Jia-min1,Pang Jin-ju2(1.School of Computer Science,Guangdong University of Technology,Guangzhou 510006,China;2.Education and Sports Bureau,Qingdao

6、 West Coast New Area,Qingdao 266427,China)Abstract:White matter hyperintensities,commonly seen in the image of cerebral small vessel disease(CSVD),shed light onthe clinical diagnoses of patients with cerebral small vessel disease.White matter hyperintensities segmentation,as a basic workin clinical

7、diagnosis,often requires experienced doctors to carry it out manually,which is time-consuming and intricate.Whitematter hyperintensities,referring to the hyperintense shadows in T2 weighted magnetic resonance images of the brains or fluid-attenuated inversion recovery sequence images,are of higher g

8、ray values than other brain tissues.To enhance the attention to areas of white matter hyperintensities,this paper proposes a network model of a high gray value attention mechanism in light of theimaging characteristics of white matter hyperintensities.The model,based on the UNet,introduces a module

9、of high gray valueattention so that it can pay more attention to the areas of relatively high gray values in the images.It also introduces a residualmixed attention module to enhance the ability for extracting features of the net model.As a result,it significantly enhances thesegmentation effect of

10、white matter hyperintensities,with its DSC and Recall indicators reaching 0.8330 and 0.8870,respectively,which is better than existing algorithms.Moreover,ablation experiments verified the effectiveness of the high gray valueattention module and the residual hybrid attention module.This paper provid

11、es a new method for the FLAIR-based segmentationof white matter hyperintensities lesion,and verifies the feasibility of combining the traditional method for image segmentationwith in-depth learning technology.Key words:whitematterhyperintensities;deeplearning;medicalimagesegmentation;UNet;highgrayva

12、lueattentionmechanism计算机与现代化2023年第12期脑 白 质 高 信 号(White Matter Hyperintensity,WMH),亦称为脑白质疏松(Leukoaraiosis,LA),由加拿大神经病学专家 Hachinski 等人2于 1987 年提出,是脑小血管病的常见影像标记物之一3。脑白质高信号在核磁共振成像T2加权像(T2 Weighted Image,T2WI)或者液体衰减反转恢复序列图像中通常表现为脑白质部位的高信号影。根据病变部位,脑白质高信号分为侧脑室旁白质高信号(PeriventricularWhite Matter Hyperintensi

13、ty,PWMH)和深部白质高信号(Deep White Matter Hyperintensity,DWMH)这2大类4。侧脑室旁白质高信号紧贴在脑室周围,信号分布均匀,具体形态包括“帽状征”“线缘征”“浓晕征”以及“淡晕征”等4种。深部白质高信号常以斑点状分布在侧脑室四周,不与侧脑室直接接触5。多项研究表明,WMH体积变化能够反映脑小血管病患者早期认知功能的变化6-8。WMH 体积越大,全脑功能或特定区域认知功能越低9-11。因此,WMH体积可以作为临床脑小血管疾病诊断及治疗的重要指标。而精准分割脑白质高信号病灶是脑小血管病诊断的基础工作,在主治医师于脑小血管病患者临床诊断的过程中起到重要作

14、用。目前,脑白质高信号病灶往往由极具临床经验的医师进行手工分割,非常耗费时间与精力,也常常存在人为误差。因此,研究高效、精准、自动化的脑白质高信号分割方法成为了临床医学上的迫切需求,具有重要的理论研究意义以及临床应用价值。现今脑白质高信号分割算法的研究成果可分为机器学习以及深度学习2大类。在机器学习方法中,Samaille等人 12 提出了一种新的脑白质高信号自动分割算法(White Matter Hyperintensity Automated Segmentation Algorithm,WHASA),该方法增加FLAIR和T1图像中脑白质高信号区域与周围组织之间的对比度,交替使用非线性扩

15、散滤波模型以及分水岭分割模型,根据受试者自动计算出的阈值和解剖信息分割出脑白质高信号。Dadar等人13的实验表明,随机森林方法相比于大多数线性分类器和非线性分类器,在缺乏FLAIR扫描信息的情况下,依然可以有效地检测出脑白质高信号病灶区域。Griffanti等人14提出了基于K-近邻算法的脑强度异常分类算法(Brain Intensity Abnormality Classification Algorithm,BIANCA)。该方法相比于其它基于K-近邻算法的分割方法,提供了不同的空间信息加权选项、局部空间强度平均选项、训练点数量以及位置,有效地分割出脑白质高信号病灶区域。针对用于图 像

16、分 割 的 马 尔 可 夫 随 机 场(Markov RandomField,MRF)算法的时间和空间复杂性随着表示相邻像素之间的统计依赖关系边的数量增加而急剧增加的问题,Schwarz等人15在不显著影响脑白质高信号病灶区域分割性能的前提下,从完整的MRF中去除边缘,在纵向序列中对大脑的核磁共振影像(Magnetic Resonance Imaging,MRI)进行建模,有效地降低MRF的参数量以及推理的计算复杂度。在深度学习方法中,Moeskops等人16的实验表明,基于卷积神经网络的分割方法能够在MRI中将脑组织区域以及脑白质高信号病灶区域进行分离。Li等人17提出了一项利用深度全卷积网

17、络和集成模型,利用FLAIR图像以及T1核磁共振扫描图像来进行脑白质高信号分割实验,该算法在 MICCAI 2017的WMH分割挑战赛中,Dice相似系数(Dice Similarity Coefficient,DSC)达到了 0.80,获得比赛的第一名。Gong等人18提出了由UNet分割模型和UNet分类模型组成的级联 UNet模型(Cascade UNet),并使用组合损失函数对网络进行训练,实现在二维FLAIR图像的室周脑白质高信号和深部脑白质高信号的分割以及区分。Huang等人19提出了一种半监督模型V-Net,提出并使用一种半监督损失函数水平集损失(LSLoss)进行模型训练,用于

18、FLAIR图像上的脑白质高信号分割。该网络模型在训练过程中不需要手动标记的 WMH 标签,DSC 指标达到了 0.78。Wang 等人20提出了一种两阶段多尺寸FCNs网络,用于MRI中的脑白质高信号分割,通过集成网络将不同的分割结果融合,提高了脑白质高信号的分割精度。Sundaresan等人21提出了一种集成大脑MRI图像3个方向 切 片 的 神 经 网 络 模 型(Triplanar Ensemble U-Net),通过结合大脑MRI的3个不同方向切片以提高脑白质高信号病灶分割的精准度。赵欣等人22提出了一种融合残差、金字塔池化和注意力机制的3D全卷积深度神经网络模型。该模型采用残差连接避

19、免深层网络的梯度消失;采用金字塔池化聚合更多的上下文信息;采用注意力机制定位感兴趣的目标。Liu等人23针对现行存在的脑白质高信号分割算法不能准确区分脑白质高信号病灶区域以及缺血性卒中的病灶区域的问题,提出了一种深度卷积神经网络(Multichannel2DConvolutionalNeuralNetwork,M2DCNN),可以准确地分割脑白质高信号病灶区域并将其与缺血性卒中病变区分开。Zhu等人24提出使用较轻量化的2D VB-Net用于脑白质高信号病灶区域分割,在常规临床诊断上收集的数据集以及公开数据集上均表现出良好的分割效果。Chen等人25提出了TransUNet网络模型,通过将Tr

20、ansformer结构融入UNet模型中,在各医学图像分割任务上均取得较好的效果。目前,现有的脑白质高信号病灶分割研究重心在于让分割网络模型更加精细、高效地分割脑白质高信号病灶区域,更加贴切于临床应用。不少研究为了提高分割精准度,使用更加深层次的网络或提出级联网络模型同时对FLAIR影像以及T1加权像进行检测,因网络层数的增加或级联多个UNet网络,往往会带来极高的模型参数量。且在临床应用上,常通过FLAIR影像来判断患病程度。为更贴近临床实际应用,本文直接使用FLAIR影像来进行实验。本文依据脑白质高信号病灶区域在FLAIR影像中灰度值较高的这一影像学特点,通过将传统阈值分割技术与深度学习中

21、的注意力机制模块结合,提出高682023年第12期灰度值注意力模块(模块1)并将其应用到UNet网络模型中,通过对灰度值较低的区域进行减弱或过滤,有效提高对图像中高灰度值区域的关注。引入残差混合注意力模块(模块2),其中,在空间维度、通道维度上生成相应的注意力,提高网络模型的特征提取能力;引入残差短路连接结构,解决由网络模型层数加深而造成的梯度消失、模型退化问题。在实验部分中,通过进行仅UNet、UNet+模块1、UNet+模块2的消融实验,分别验证2个模块均能提高UNet神经网络模型对脑白质高信号病灶区域的提取能力。通过与几种常用的医学图像分割网络模型以及Li等人17、Zhu等人24所提出的

22、模型进行对比,本文提出的基于高灰度值注意力机制的脑白质高信号分割算法达到了更高的分割精准度,实现了更好的分割效果。1本文方法基于 UNet 网络结构,根据脑白质高信号在FLAIR影像中的特征,提出高灰度值注意力模块,构建一种脑白质高信号分割模型,网络结构如图 1 所示。FLAIR图像进入阈值分割模块,经过最大类间阈值算法(Otsu)和三角阈值分割算法自动计算出合适的分割阈值,生成用于构建高灰度值注意力模块的高灰度值区域掩码。高灰度值注意力模块可以减弱或过滤灰度值较低的区域,使模型更加关注图像特征中灰度值较高的区域。为提升网络的特征提取能力,在UNet的“编码器”中添加残差混合注意力模块。经过对

23、比实验验证,残差混合注意力模块以及高灰度值注意力模块均能提升网络对脑白质高信号分割的准确率。图1高灰度值注意力UNet残差混合注意力模块高灰度值注意力模块残差混合注意力模块残差混合注意力模块残差混合注意力模块残差混合注意力模块高灰度值注意力模块高灰度值注意力模块高灰度值注意力模块阈值分割模块22422242112256228214214228228228256256256211221122112222422242224213264128256512512256256128128128256646464323212242卷积归一化ReLU激活跳跃连接下采样上采样1.1UNet网络结构本文以 Ro

24、nneberger 等人26提出的 UNet 模型作为主干网络,在保留UNet整体结构的基础上,添加高灰度值注意力模块、残差混合注意力模块对网络结构进行改进。UNet具备典型的“编码器译码器”左右对称结构。编码器由卷积层、最大池化层、ReLU激活函数层构成,对图像进行下采样操作,进行特征提取。译码器由卷积层、反卷积层、ReLU激活函数层构成,对特征图进行上采样操作,进行特征信息复原。UNet的每次下采样操作会使得特征的尺寸缩小、通道数翻倍;相反,上采样操作则会使得尺寸增大、通道数减少。UNet使用了跳跃连接(Skip Connection)将下采样和上采样过程产生的特征图进行融合,即将编码器和

25、译码器的路径相连接,跳跃连接能够帮助网络在解码阶段中更好地恢复图像的细节特征。UNet网络结构如图2所示。1.2阈值分割本文首先对图像进行阈值分割操作,通过自动计算合适的阈值来得到图像高灰度值区域掩码。首先,针对样本中存在大量的背景像素点的问题,采用最大类间方差法27将背景与脑部组织进行分离。在剔除背景像素点后,选取脑部组织直方图的波峰所对应的灰度级值Tpeak以及图像中灰度级最大值Tmax,通过三角阈值分割法28-29找到较大一侧的波谷灰度级值T。取波谷所对应的灰度级值T对图像进行二值阈值分图2UNet33卷积,ReLU激活跳跃连接下采样上采样11卷积57225702284214026823

26、221 64256512102456826428221282802128138213622566625126423022825125425225621042256102210025122002198212819623922128 64 645722239023882张伯泉,等:基于高灰度值注意力机制的脑白质高信号分割69计算机与现代化2023年第12期割得到高灰度值区域掩码,如图3所示。(a)FLAIR图像(b)阈值分割后的掩码图图3阈值分割1.2.1Otsu阈值分割法设灰度图像尺寸为 MN,图像像素点灰度级范围为 0,L-1,ni为不同灰度级对应的像素点个数,灰度级i出现的概率为Pi=ni/

27、(MN)。设图像中灰度级T 0,t 的像素点为 C0类,灰度级 T t+1,L-1 的为C1类。设C0类像素点出现的概率为P0(t),C0类平均灰度级为u0(t);C1类像素点出现的概率为P1(t),C1类平均灰度级为u1(t)。则有:P0(t)=i=0tPi(1)P1(t)=i=t+1L-1Pi=1-P0(t)(2)u0(t)=i=0t(iPiP0(t)(3)u1(t)=i=t+1L-1(iPiP1(t)(4)图像的平均灰度级u可表示为:u=i=1LiPi=P0(T)u0(T)+P1(T)u1(T)(5)设图像的两类间方差为2b(t),则有:2b(t)=P0(T)(u0(T)-u)2+(P1

28、(T)u1(T)-u)2(6)当类间方差2b(t)为最大时,可获得最佳灰度级值TOtsu:TOtsu=arg max1 t L(2b(t)=arg max1 t L(P0(T)(u0(T)-u)2+(P1(T)u1(T)-u)2)(7)根据TOtsu对图像进行分割,剔除图像背景后,图像的直方图如图4(b)所示。(a)原图的直方图(b)经Otsu算法剔除背景后的直方图(c)三角阈值分割法示意图图4直方图及三角阈值分割法示意图 1.2.2三角阈值分割法在经过 Otsu算法分离背景后,使用三角阈值分割法寻找倾向高灰度级一侧的波谷灰度级。选取直方图中的波峰灰度级值 Tpeak所在的点,对应坐标为(Tp

29、eak,Npeak);图像中灰度级最大值Tmax所在的点,对应坐标为(Tmax,Nmax)。Tpeak、Tmax对应的2点可构成形式为 Ax+By+C=0 的直线 l,其中 A=Tpeak-Tmax,B=Nmax-Npeak,C=NpeakTmax-NmaxTpeak。计算脑部组织直方图上每个点到直线l上的距离d。当距离d达到最大时,取对应的灰度级值作为分割阈值T,对图像进行阈值分割得到高灰度值区域掩码M。d=|Ax0+By0+CA2+B2(8)1.3高灰度值注意力机制在FLAIR影像中,脑白质高信号的灰度值明显高于脑脊液信号等的灰度值,故使用传统阈值分割技术对脑白质高信号区域进行分割具有可行

30、性。但使用传统阈值分割技术存在阈值选取问题。若阈值选取过高会将部分脑白质高信号区域过滤掉,若阈值选取过低会有一部分无关区域信息残留。目前,在脑白质高信号分割应用上,常使用深度学习技术来对脑白质高信号病灶区域进行分割,尚未有实验提出将传统阈值分割方法与深度学习技术结合并应用在脑白质高信号分割上。鉴于使用传统阈值分割技术能在一定程度上将脑白质高信号分离,本文提出高灰度值注意力机制模块,将传统阈值分割技术与深度学习技术结合。高灰度值注意力机制模块能够对灰度值较低的区域进行减弱或过滤,使网络更加关注图像中灰度值较高的区域,进一步提高分割精准度。高灰度值注意力机制如图5所示。图像在经过阈值分割模块后得到

31、高灰度值区域掩码M,将该掩码M与输入特征F进行点乘操作得到高灰度值特征Ft。输入特征F与高灰度值特征Ft同时经过一个卷积层进行特征提取,通过批归一化层以缓解梯度弥散问题并加快模型的收敛速度,两者逐元702023年第12期素相加以融合相同尺度的特征信息,使用ReLU激活函数进行非线性函数映射以提升模型的非线性表达,增强网络的拟合能力。再次通过卷积层和批归一化层进行降维,使用Sigmoid激活函数将数据映射到(0,1)区间上,得到高灰度值注意力Mt(F)RH W 1。最后高灰度值注意力Mt(F)与输入特征F相乘得到输出特征F RH W C。Mt(F)=Sigmoid(W2(ReLU(W0(F)+W

32、1(Ft)(9)F=F Mt(F)(10)式中,W0、W1、W2代表卷积层BN层的参数权重。1.4残差混合注意力机制为提高模型特征提取的能力以及解决由于网络层数加深而导致的模型退化问题,在网络模型中添加具有残差混合注意力机制模块。其主要由通道注意力机制模块、空间注意力机制模块以及残差短路连接结构组成。1.4.1通道注意力机制如图6所示,在通道注意力模块30(Channel Attention Module,CAM)中,输入特征图F RH W C首先分别通过最大值池化层(Max Pooling)和平均值池化层(Average Pooling),在通道维度上压缩特征,得 到 2 个 不 同 的 通

33、 道 描 述Fmax,c R1 1 C和Favg,c R1 1 C。随后将2个通道描述输入由多层感知机(Multilayer Perceptron,MLP)构成的共享网络来进行降维和升维操作,然后对从共享多层感知机输出的2个通道描述进行逐元素相加操作,并通过Sigmoid 激 活 函 数 处 理,得 到 通 道 注 意 力 特 征 图Mc(F)R1 1 C,最后将通道注意力特征图Mc(F)与输入特征F相乘生成通道注意力模块的输出特征Fc。Mc(F)=Sigmoid(MLP(FAvgPool,c)+MLP(FMaxPool,c)=Sigmoid(W1(W0(Favg,c)+W1(W0(Fmax,

34、c)(11)图6通道注意力1.4.2空间注意力机制如图 7 所示,在空间注意力模块31(Spatial Attention Module,SAM)中,输入特征图F RH W C分别通过最大值池化层和平均值池化层,在空间维度上压缩特征,得到2个不同的空间描述Favg,s RH W 1和Fmax,s RH W 1,并对这2个空间描述进行空间拼接操作。随后对一个77的卷积核降维到尺寸HW1为的特征图,并经过 Sigmoid激活函数处理得到空间注意力特征图Ms(F)RH W 1。最后将空间注意力特征图Ms(F)与输入特征F相乘生成输出特征Fs。Ms(F)=(f77(AvgPool(F);MaxPool

35、(F)=(f77(Favg,c;Fmax,c)(12)图7空间注意力1.4.3残差短路连接结构在早期深度学习技术的发展历程中,不少学者通过堆叠神经元或加深神经网络层数的方法来提高网络模型的性能效果。但网络层数增加到一定程度的时候,会发生模型退化、梯度消失或梯度爆炸等现象,模型的性能不仅没有得到提升,反而急剧下降。He等人32针对这一网络模型退化问题,提出了残差学习网络,通过在网络模型中引入恒等映射,很好地解决了深层次网络由于网络层数增加,在训练中出现的梯度消失或者梯度爆炸等造成的网络退化问题,使得网络模型的深度可以加深至更高层。残差学习网络结构广泛应用于深度学习中的各种神经网络模型。1.4.4

36、残差混合注意力模块如图8所示,残差混合注意力模块包含残差短路连接结构,以及通道注意力与空间注意力 2 个子模块。输入特征F先依次通过通道注意力模块以及空间注意力模块,获取相应的输出特征F,输入特征F再直接与经过混合注意力模块处理的输出特征F进行相加处理,生成输出特征F。在训练过程中低层图5高灰度值注意力机制卷积层卷积层BN层BN层卷积层BN层输入特征F高灰度值掩码M高灰度值特征Ft高灰度值注意力Mt(F)输出特征F按位相加按位相乘Sigmoid激活ReLU激活输入特征F平均池化层最大池化层共享多层感知机通道注意力Mc(F)输入特征F最大池化层平均池化层空间注意力Ms(F)卷积层图8残差混合注意

37、力通道注意力空间注意力通道注意力Mc(F)空间注意力Ms(F)输入特征F输出特征F”张伯泉,等:基于高灰度值注意力机制的脑白质高信号分割71计算机与现代化2023年第12期误差可以通过捷径快速地向上一层进行传递,保证了反向传播过程中参数的更新,充分利用图像上下文信息,提高网络模型的对关键特征的提取能力,避免了由网络加深而造成的梯度消失、模型退化等问题,通过在网络模型结构中添加残差混合注意力模块,有效且充分地利用图像上下文信息,提高网络模型的对关键特征的提取能力,同时也解决了由网络加深而造成的模型退化、梯度消失等问题。2实验2.1数据集介绍本文采用医学影像处理和计算机辅助介入会议(Interna

38、tional Conference on Medical Image Computing and Computer Assisted Intervention,MICCAI)的脑白质高信号公开数据集进行实验33。该数据集来源于3家不同医院的不同扫描仪器,共包含60例患者的头颅MRI影像。每个病例样本中均包括FLAIR模态图像、T1WI模态图像、脑白质高信号病灶的金标准分割图。由于数据集由3台不同仪器采集所得,所以在规格参数上有一定的差异性。数据集详细特征如表1所示。表1数据集详细情况采样机构UtrechtSingaporeGE3T扫描设备3.0T Philips Achieva3.0T Sie

39、mens TrioTim3.0T GE Signa HDxt体素大小/mm30.960.953.001.001.003.000.980.981.20切片尺寸2402404825223248132256832.2数据预处理2.2.1数据读取及尺寸调整首先,利用 nibabel库对 FLAIR 影像数据进行读取并将格式转换为常用的图像格式,获得患者脑部轴向切片的图像数据。其次,由于数据集来源于3台不同的扫描设备,脑部组织区域在图像中的比例有所差异,存在一部分的无关背景像素点。根据不同的比例对来自不同扫描设备的图片数据进行裁剪,以剔除部分无关背景像素点。最后,因经过裁剪后的图像尺寸不一,需要对图像进

40、行缩放操作,将各切片的图像尺寸大小统一调整为224224。2.2.2数据增强由于原始数据集的规模较小,不足以训练出很好的网络模型。为提高模型的泛化能力以及更好的分割效果,本文采用翻转、旋转以及弹性形变映射3种方式进行数据增强。如图9所示。1)翻转:通过镜像翻转图像以增大数据量规模。2)旋转:通过将图像随机旋转5到10以增大数据量规模。3)弹性形变:调用 Albumentations 库中的 ElasticTransform函数来对图像进行弹性形变操作,以增大数据量规模。原图翻转操作旋转操作弹性形变操作图9数据增强2.3实验细节本文实验使用Python3.8进行开发,使用Pytorch框架来进行

41、网络结构搭建,使用 NVIDIA GeForceRTX 3070显卡进行模型训练。具体实验参数:批量大小设置为 16,初始学习率为 0.001,优化器使用Adam,动量衰减参数为310-4,总共训练300轮。使用交叉验证法验证本文提出的算法。2.4评价标准采用以下5种训练指标,设G为金标准分割图,P为预测分割图。2.4.1DSC相似系数DSC相似系数是一种集合相似度度量函数,通常用于计算2个样本的相似度,取值范围为 0,1。DSC=2|G P|G+|P(13)2.4.2平均容积差AVD平均容积差(Average Volume Difference,AVD)是指分割结果与金标准间的绝对体积差,即

42、像素点个数的差别。其中,VG为真实标签的像素点总数,VP为预测分割图中像素点总数。AVD=|VG-VPVG(14)2.4.3豪斯多夫距离95%豪 斯 多 夫 距 离(95th-percentile of Hausdorff Distance,HD95)用于测量2个对象之间的相似程度,其中距离值越低代表匹配程度越好,即象征着分割效果越好。同时,为保持整体数值稳定性,剔除一些由离群点造成的不合理距离,选择从小到大排名前95%的距离作为实际豪斯多夫距离。H()G,P=maxsupx Ginfy Pd()x,y,supy Pinfx Gd()x,y(15)2.4.4召回率召回率(Recall)亦称为敏

43、感度,定义为分割的病灶像素点总数除以真实病灶像素点总数,即正确预测为正样本像素点总数占实际正样本像素点总数的比例。公式中,NG为标签中病灶的像素点总数,NP为预测正确的病灶像素点总数。Recall=NPNG(16)2.4.5F1-scoreF1-score是统计学中用来衡量二分类模型精确度的一种指标,它同时兼顾了分类模型的精确率和召回率。F1-score可以看作是模型精确率和召回率的一种加权平均。公式中,NP为预测正确的病灶像素 722023年第12期点总数,NF为预测错误的病灶像素点总数。F1-score=NPNP+NF(17)2.5损失函数针对本文实验数据集存在的数据不平衡情况,即病变体素

44、数量远低于非病变体素数量,实验使用Tversky Loss34作为网络训练过程中的损失函数。在Tversky Loss公式中,N是总像素点数量;P1i为第i个像素点被预测为阳性样本的概率值;P0i为第i个像素点被预测为阴性样本的概率值;g1i为第i个像素点真实标签为阳性样本的概率值,若第i个像素点真实标签为阳性样本,g1i为1,否则为0;g0i为第i个像素点真实标签为阴性样本的概率值,若第i个像素点真实标签为阴性样本,g0i为1,否则为0。通过调整超参数和,控制假阳性和假阴性之间的权衡。在本文实验中,设置超参数=0.3,=0.7。T(,)=i=1Np0ig0ii=1Np0ig0i+i=1Np0

45、ig1i+i=1Np1ig0i(18)2.6神经网络模型参数量测试神经网络模型的参数量主要取决于网络模型的架构、层数等。在卷积层中,参数量主要取决于输入特征通道数量、输出特征通道数量、卷积核的大小等。为客观对几种基于UNet网络模型进行改造的神经网络模型进行模型参数量测试,在神经网络模型中的4次下采样阶段中,输入特征数量及输出特征数量分别为 32,64、64,128、128,256、256,512。结果如表2所示,本文提出的算法模型的参数量为8.76M,与UNet模型的参数量8.63M对比,仅增加了0.13M。本文提出的算法在不显著增加网络模型参数量的前提下,提高了网络对脑白质高信号病灶区域的

46、分割性能。表2模型参数量对比表网络模型名称UNet17UNet+34AttentionUNet35EnsembleUNet212D VBNet24TransUNet25UNet+模块1UNet+模块2本文算法参数量/M8.639.168.7225.915.0267.018.728.668.762.7消融实验本文为验证高灰度值注意力模块1以及残差混合注意力模块2均能有效提高网络模型对脑白质高信号病灶区域的分割能力,对神经网络模型进行消融实验。消融实验模型组如下:1)UNet网络。2)在UNet网络模型的基础上,添加高灰度值注意力模块1。3)在UNet网络模型的基础上,添加残差混合注意力模块2。4

47、)在UNet网络模型的基础上,同时添加高灰度值注意力模块1以及残差混合注意力模块2。实验结果如表3所示。由表3可知,本文提出的模型在各项指标上均优于UNet网络模型。其中,消融实验模型1的DSC指标为0.8023,消融实验模型2和消融实验模型 3 的 DSC 指标分别达到 0.8213、0.8263,而消融实验模型4(本文算法)的DSC指标为0.8330。这验证了2个模块均能有效提高网络模型对脑白质高信号病灶区域的分割能力。表3性能评价指标结果网络UNet17UNet+35AttentionUNet36UNet+CBAM37UNet+模块1UNet+模块22DVBNet24TransUNet2

48、5本文算法DSC0.80230.81630.81210.81570.82130.82630.80610.82590.8330AVD0.26770.28010.29050.23240.23710.23830.18280.21970.2013F1-score0.85900.85610.85530.86010.86150.87240.86700.87280.8740HD95/mm6.35096.29966.45256.50876.11045.83146.12005.47005.8025Recall0.84730.84410.84400.85360.86200.88150.86780.85240.88

49、702.8实验结果分析与效果展示表3为各网络模型在脑白质高信号病灶区域分割任务上的性能评价指标结果。其中,Li等人17使用UNet网络模型对脑白质高信号区域进行提取,该方法在 MICCAI 2017的 WMH分割挑战赛中获得了第一名,DSC指标达到了80.23%;Zhu等人24提出的2DVBNet网络模型,在减少参数量模型的情况下,其AVD 指标达到了 18.28%;基于 Transformer 结构的TransUNet模型在 HD95指标上达到了 5.47 mm。此外,使用如UNet+35、AttentionUNet36等几种常用的医学图像分割网络模型进行实验,UNet+的DSC指标为 81

50、.63%、AttentionUNet 的 DSC 指标为 81.21%、UNet+CBAM 的 DSC 指标为 81.57%。本文提出的算法在DSC指标、F1-score指标以及Recall指标上均达到了最优值,分别为83.30%、87.40%、88.70%,比Li等人17所使用的方法在DSC指标上提高了3.07个百分点,体现出本文提出的算法可以更好地识别出脑白质高信号病灶区域,具备更优的分割性能。图10为各种算法的分割结果图,从实验结果中可以看出,相较于其他的网络模型,本文提出的算法在脑白质高信号病灶分割任务上表现出更好的分割性能。在图像整体中,本文提出的算法通过高灰度值注意力机制能够更好地

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服