基于改进SE-Net网络与多注意力的脑肿瘤分类方法.pdf

资源描述

1、第卷第期西华师范大学学报(自然科学版)()年月.:./.收稿日期:基金项目:四川省教育厅重点项目()西华师范大学英才科研基金项目()作者简介:张晓倩()女硕士研究生主要从事图像处理研究通信作者:罗建()男博士副教授硕士生导师主要从事图像处理研究:.引文格式:张晓倩罗建杨梅等.基于改进网络与多注意力的脑肿瘤分类方法.西华师范大学学报(自然科学版)():.()():.基于改进网络与多注意力的脑肿瘤分类方法张晓倩罗建杨梅金芊芊朱熹(西华师范大学电子信息工程学院四川南充)摘要:手工筛选肿瘤图像来预测脑肿瘤类别的方法非常耗时而将深度学习与医学图像相结合的方

2、式可以在一定程度上帮助医生解决这一问题因此提出改进的网络首先将激活函数代替批归一化和特征融合后的激活函数使模型更好地学习有效特征其次在第一层和第二层卷积层后分别添加和改进的注意力模块在空间和通道个方向并发进行特征提取使目标特征充分被利用最后在注意力模块中添加全局最大池化利用双通道池化层提取有效特征抑制无效特征提高模型准确率在公开的数据集中进行训练与测试最终结果表明该方法在脑肿瘤分类测试集中的准确率、召回率、精确率和值分别达到、.、.和.充分验证了改进模型的有效性关键词:脑肿瘤多注意力机制深度卷积神经网络计算机辅助诊断系统分类中图分类号:文献标志码:文章编号:()脑肿瘤也

3、指颅内肿瘤包括垂体瘤、脑膜瘤和胶质瘤是常见且致命的肿瘤之一如果能尽快确定脑肿瘤的类型及时确定治疗方案那么脑肿瘤患者的生存率将明显提高通常手工筛选肿瘤图像来预测脑肿瘤的类别非常耗时而利用脑肿瘤辅助诊断系统将深度学习与医学图像相结合可以在一定程度上帮助医生解决这一问题脑肿瘤辅助诊断系统是在大量脑肿瘤图像数据的基础上结合以往的诊断结果、医生的个人经验以及患者的既往病史帮助医生快速得出诊断结论近年来卷积神经网络已经成为图像处理中最流行的方法等提出了一种残差学习框架来训练深度网络并在图像分类任务中取得了最好的效果它摒弃了以往简单叠加卷积层的方法在网络上增加跳跃连接并将浅层特征信息带到网络的深

4、层很大程度上解决了网络梯度消失或梯度爆炸的问题但残差网络没有对关键信息进行聚焦等提出了一种不同的结构通过在卷积层、最大池化层和层的每一层后都添加全连接层可对脑膜瘤、胶质瘤和垂体瘤实现准确分类但是结构对信息的提取有限并且当网络层数太深时采用反向传播调整内部参数会使靠近输入层的参数改动较慢等提出了一种将与全局平均池化相结合的方式来解决在深度网络中存在的梯度消失和过拟合的问题该方法的平均准确率高达.能对脑膜瘤、胶质瘤和垂体瘤进行高质量分类虽然此方法利用全局平均池化避免过拟合但是没有关注目标信息存在一定的信息丢失情况夏景明等提出网络框架利用双通道池化层、深度残差结构、多尺寸卷积核对脑膜

5、瘤、胶质瘤和垂体瘤进行有效分类但没有对有效信息给予关注使得网络对信息学习的不够充分由于深度网络容易出现信息丢失因此可以利用残差结构给网络深层带来浅层特征来解决这一问题针对上述情况本文将从以下几个方面展开研究:()利用激活函数同时代替批归一化和特征融合后西华师范大学学报(自然科学版):./年的激活函数与激活函数相比并没有屏蔽过多的特征这可以使模型更好地学习有效特征对脑肿瘤图像进行有效分类()在第一层卷积、批归一化和激活函数后插入注意力提取通道特征信息弥补深层网络存在信息丢失的情况能使得模型更好地学习到有效信息()在第二层卷积、批归一化和激活函数后插入注意力用激活函数代替激活

6、函数在通道和空间上并发的提取特征信息使特征信息得到充分利用()注意力模块中加入全局最大池化将全局平均池化和全局最大池化相结合使提取的高维信息互补更有利于特征提取本文基于改进的网络利用多注意力机制提取特征信息在空间和通道上获取有效特征在分类上取得了较好的效果方法描述.网络模型()是由自动驾驶公司的高级工程师胡杰提出的一种基于加权特征图思想的网络结构它可以在结构或残差网络中嵌入注意力模块注意力模块主要对特征通道间的相关性进行建模促使网络能对有效特征聚焦能更好的提取目标特征以提高模型的表达能力简而言之是通过对重要特征信息进行强化来提升准确率本文基于的思想在残差网络中嵌入注意力

7、模块本文的网络模型如图所示:首先在批归一化后用激活函数代替激活函数与激活函数相比并没有屏蔽过多的特征这可以使模型更好地学习有效特征其次在特征融合后用激活函数代替激活函数激活函数处处可导且连续光滑与激活函数相比可以显著提高模型的表达能力此外在全局最大池化后的第一个卷积层(包括卷积、批归一化和激活函数)后增加注意力模块将其在通道特征中聚焦以最大限度地提取通道信息然后在第二层卷积层之后加入改进的注意力机制让其在空间和通道个方向并发进行特征提取使目标特征发挥极致作用通过试验发现通道特征更有利于信息提取可以提高模型的准确率因此采用改进的注意机制可获取更多通道信息提

8、高模型的表达能力在输入特征图后模型将执行个步骤首先通过步骤对特征图进行数据预处理包括卷积、批归一化、激活函数和全局最大池化然后对处理后的图像分别进行保留操作和步骤操作包括个子步骤分别为卷积和批归一化以及激活函数、注意力模块、注意力模型和注意力模块将步骤循环处理多次若保留数据和输出数据的尺寸不相同则对保留数据再添加一次卷积操作若两者数据尺寸相同则直接进行融合处理最后通过步骤进行全局平均池化和全连接层后输出?1SE NetFig.1 Model map of the improved SE Net network-XX?.ECA?1?2?3?Sigmoid?1Ck=31CBA

9、M?Sigmoid?MC(F)MS(F)M(F)FF?+?+?Swish?SE?第卷第期张晓倩等:基于改进网络与多注意力的脑肿瘤分类方法 .激活函数深度网络中激活函数的选择对模型的性能有显著影响校正线性单元()是应用最广泛的激活函数激活函数在深度网络中往往表现优秀激活函数又称自门控激活函数是谷歌在年提出的经验证在同等情况下激活函数比激活函数更能提高模型的精准度激活函数的表达式如式()所示:()()()式中:可以是常数也可以是通过训练得到的参数当激活函数即为激活函数当时激活函数则变成线性函数因此激活函数则可看作是两者之间的平滑激活函数当时不存在梯度消失的

10、情况当时神经元不会像激活函数那样死亡同时与激活函数相比激活函数的导数不是一成不变的而且激活函数处处可导连续光滑.注意力模块?Sigmoid?XX?2Fig.2 Structure of the double channel pooling layer.双通道池化层平均池化更突出背景信息用于将图片中激活的平均值作为最终输出最大池化更突出纹理信息用于将图片中激活的最大值作为最终输出本文在注意力模块中将平均池化与最大池化相结合采用双通道池化层的方式主要步骤如下:将分别传入最大池化和平均池化两个路径后使用函数将两部分的结果合并最后使用激活函数来捕捉非线性因素然后输出进入下一步

11、操作双通道池化层结构如图所示3 SEFig.3 Structure of SE attention module?(b)SE(a)SE?CCC/rC/rCCWWHHCCX?ReLU?Sigmoid?Sigmoid?X?ReLU?Sigmoid?W H C/r/rCCCCCW H CXX.改进的注意力模块图()为原始的注意力模块主要由压缩和激励组成改进后的注意力模块如图()所示主要步骤如下:首先是操作先将的特征图通过双通道池化层可得到的全局信息描述符再经过操作由两次全连接层来预测通道间的重要性先通过第一个全连接层来缩放输入与输出分别为和 /其中为缩放参数再通过第二

12、个全连接来还原输入与输出分别为 /和之后利用输出特征图中各层权值的向量最后是操作将输出的权值向量与特征图相乘获得有权值信息的特征图这一步骤聚焦有效特征避免无效特征更好地提取目标特征在一定程度上提高模型的精准度.注意力模块注意力模型是等在年提出的一种高效的通道注意力它主要是通过获取通道间的西华师范大学学报(自然科学版):./年关系来提高目标特征的表达能力相对于传统的注意力方法它可能解决降维对模型预测带来的副作用本文采用注意力模块增强卷积层后通道间的相关性便于有效特征的提取图是注意力模块的结构在同等条件下特征图先通过全局平均池化再利用权重共享的一维卷积进行学习在此期

13、间将考虑通道间的相关性来获取跨通道交互可以明显降低模型的复杂度随后将通过激活函数最后将激活函数输出的信息与特征图相乘后输出公式()是自适应选择一维卷积核大小的方法 ()()式中:代表一维卷积核大小为通道数通过此公式可以确定局部跨通道交互的覆盖范围即确定的取值?4 ECAFig.4 Structure diagram of ECA attention moduleX?Sigmoid?Ck=3CX.注意力模块主要由通道和空间注意力模块组成是年提出的注意力模块它可以与任何前馈卷积神经网络集成提取有效特征信息注意力模块的结构如图所示特征图的尺寸是依次表示为特征图的通道数

14、、高度和宽度经过注意力模块后输出特征图()尺寸大小为最终输出的特征图为 ()()式中:指个向量对应相乘()指通道与空间注意力模块融合后的特征图()为()()()()式中:表示激活函数()表示通道注意力后的输出特征()表示空间注意力后的输出特征为了更有效地提取特征本文用激活函数代替通道和空间注意力中的激活函数在同等条件下可以提高模型的准确率?MC()FMS()FM()F?5 BAMFig.5 Structure diagram of BAM attention moduleSigmoid?FF通道注意力模块的主要步骤如下:首先对特征图进行全局平均池化再通过方法获得通道间的相关

15、性最后通过全连接层输出特征图空间注意力模块的主要步骤如下:首先将特征图进行卷积卷积核大小为然后分别进行空洞卷积(卷积核大小为 )和普通卷积(卷积核大小为 )最后输出特征图第卷第期张晓倩等:基于改进网络与多注意力的脑肿瘤分类方法通过式()和()输出最后的注意力特征图对重要的特征信息分配更多的注意力提高模型的精确率试验.数据集本文所使用的数据集来自于的公开脑肿瘤数据集通常用于分类此数据集包含类肿瘤图像:胶质瘤、脑膜瘤、垂体瘤和无肿瘤数据集一共有来自张脑图像其中胶质瘤例脑膜瘤例垂体瘤例以及正常脑图像例在本次肿瘤分类任务中由于数据集图像统一并且分布均衡对训练数据集

16、进行随机裁剪图像大小为、随机水平翻转以及归一化操作对于验证和测试数据集将原图片中短边尺寸统一缩放到、裁剪图像大小为和归一化操作将数据集划分为训练集(张)、验证集(张)、测试集(张)在训练集中包含胶质瘤例、脑膜瘤例、垂体瘤例以及无肿瘤例在验证集中包含胶质瘤例、脑膜瘤例、垂体瘤例以及无肿瘤例在测试集中包含胶质瘤例、脑膜瘤例、垂体瘤例以及无肿瘤例.试验参数本文试验的硬件环境:为()().个内存为为显卡软件环境:.深度学习框架在训练模型的过程中学习率采用策略初始学习率设置为.最终学习率为.迭代批量设置为训练次数为用优化器进行优化动量设置为.评估指标图像分类

17、的常用评价指标包括准确率、精确率、召回率和值准确率指所有样本中被模型预测为正确的比例精确率则是指正确被模型预测为正的占模型全部预测为正的比例召回率可以理解为正确被模型预测为正的占样本中所有实际为正的比例值被定义为精确率和召回率的调和平均数值受精确率和召回率的影响精确率越高召回率越高值越高公式如下:准确率 ()精确率 ()召回率 ()()?6SE NetFig.6 Confusion matrix of prediction results of theSE Net model-improved400350300250200150100500Confusion matrix witho

18、ut mormalization?000200110000297299303405式中:指预测为正确(实际为正确)的正样本个数指预测为正确(实际是错误)的负样本个数指预测为错误(实际是正确)的正样本个数指预测为错误(实际是错误)的负样本个数本文使用宏平均计算准确率、精确率、召回率和值模型训练完成后使用测试数据集对本文中改进的模型进行评估生成的混淆矩阵如图所示改进的模型在脑肿瘤图像的分类任务中具有较好的准确率出现错误分类的个体较少能对脑肿瘤进行精准分类模型的错误分类图像如图所示()()是模型预测结果()()是图像的真实标签可以看出()垂体瘤图像诊断为脑膜瘤存在的问题可能是病

19、灶区域较小模型对于较小的肿瘤敏感度较低()脑膜瘤图像诊断为胶质瘤存在的问题可能是大多数胶质瘤生长西华师范大学学报(自然科学版):./年于在脑内即不靠近颅底脑膜瘤是个相对规则和规整的球形形态常常位于颅板内侧颅底但在这张图像中肿瘤区域位于脑内但真实标签是脑膜瘤属于特殊情况模型对于这一类特殊情况还不具备分辨能力()和()都是将胶质瘤图像诊断为脑膜瘤通过图像可以看出肿瘤区域较小且脑膜瘤和胶质瘤有一定的相似性所以模型出现了判断错误通过对错误分类的个体图像分析可以得出由于肿瘤区域较小且胶质瘤和脑膜瘤有一定的相似性模型对于两者的区分出现少部分的错误但对于诊断为脑肿瘤这一结果是没有问题的对于具体的肿瘤类型还

20、需借助肿瘤专家的帮助但总体来说改进的模型对脑肿瘤可以实现精准分类能大大缩短诊断时间证明了模型的有效性?：?：?(a1)(b1)(c1)(d1)(a2)(b2)(c2)(d2)?7Fig.7 Image of Error cases.网络整体性能?8Fig.8 Training loss chart050100150200250300350400450?/?1.61.41.21.00.80.60.40.20本文模型在训练时损失函数值的变化如图所示:当迭代次数增大网络的损失值慢慢减小在迭代次数接近次左右网络的损失值开始收敛并且趋于稳定由于保存值时每隔次迭代保存次损失值即一共有次迭代数

21、据.消融试验为了验证改进的模块对网络模型的有效性进行了消融试验所有试验在相同的环境下进行消融试验结果如表所示首先在的基础上在特征融合和批规范化后使用激活函数替换原有的激活函数在深层网络中效果优于激活函数的同时也不会出现神经元死亡的情况使得模型能更好地学习随后在注意力模块中添加全局最大池化来突出目标特征通过全局平均池化和全局最大池化相结合的方式使提取的高维信息互补更有利于通道特征信息的提取为了进一步的提取更多地特征信息加入和注意力模块在通道和空间两个方面都再一次进行目标特征提取使得目标信息能充分利用最终能准确地对肿瘤实现分类在消融试验中验证了更改激活函数添加最大池化、和注

22、意力模块的性能其中影响最大的是在特征融合后使用激活函数在深度网络中其表现良好优于激活函数对模型的准确率有一定的提高表消融试验对比结果可见改进后的模型的准确率可达到.在同时更换激活函数、添加最大池化、注意力以及注意力后对表中测试集的准确率值进行比较最终结果较原模型增加了.充分验证了改进后模型的可行性第卷第期张晓倩等:基于改进网络与多注意力的脑肿瘤分类方法表消融试验对比结果特征融合后使用激活函数批规范化后使用激活函数注意力模块添加最大池化添加注意力模块添加注意力模块测试集的准确率/.与其他方法对比表模型对比结果模型评价指标/准确率召回率精确率值.本文

23、.为了验证本文改进的模型的有效性将其与目前先进的算法进行对比由于大多数的分类模型是基于和改进的所以本文将和优秀的变体进行对比试验对比结果如表:在同等试验环境下采用的公开数据集进行训练与测试在准确率、精确率、召回率和值中都取得了最优的结果由此可见本文提出的改进模型在脑肿瘤分类中表现优秀能大幅度的提升模型的性能.可视化分析为了更好地对模型的注意力模块进行解释本文使用梯度加权类激活映射()方法生成了热图用于可视化分析模型在判别脑肿瘤类别时所依据的病灶区域如图所示本文分别将个类别的脑肿瘤图像进行可视化分析从左到右图像的类别分别为垂体瘤、脑膜瘤、胶质瘤以及无肿瘤从上到下组图

24、像中第一组图像是原始图像第二组到第四组图像都是热图暖色部位表示模型对该位置的关注度关注度越高模型学习到的特征越丰富其中第二组图像是原始图像使用基础模型生成的热图第三组图像是在基础模型的基础上将激活函数更换为激活函数、在注意力模块中添加最大池化以及添加注意力模块后生成的热图第四组图像是在第三组的基础上添加注意力模型后生成的热图通过可视化结果可以看到使用基础模型对个类别的图像进行可视化时模型对疾病位置和面积关注度准确度不高如第二组图像所示当第二组模型的基础上添加注意力可以从图中看到模型更加聚焦病灶范围这也使得模型避免学习病灶区周围无用特征如第三组图像所示最后在第三组模型的基础

25、上添加注意力从通道和空间两个部分捕捉特征信息使得模型对病灶区域定位更加准确如第四组图像所示通过可视化分析模型也充分解释了模型中添加注意力模型的可行性对模型的准确率的提高有着不可或缺的作用结论利用深度学习与医学图像相结合的方法来辅助临床医师减少脑肿瘤患者的死亡率有着至关重要的作用本文基于多注意力提出一种改进的网络能够大幅度提高模型的准确率高质量的对脑肿瘤实西华师范大学学报(自然科学版):./年(a)?(b)?(c)?(d)?(1)Original_Images(2)SE-ResNet-50_Model(3)SE-ResNet-50+ECA(4)SE-ResNet-50+BAM?9

26、Fig.9 Location heat map of brain tumor lesion area现分类通过对例数据进行测试并和先进的变体进行试验对比表明了提出的方法能够准确对肿瘤的类别分类是省时和准确高的辅助诊断工具参考文献:./.:./:(.).:.():.夏景明邢露萍谈玲等.基于的脑肿瘤分类方法.南京信息工程大学学报(自然科学版)():./.:./.().:/第卷第期张晓倩等:基于改进网络与多注意力的脑肿瘤分类方法./.张焕张庆于纪言.激活函数的发展综述及其性质分析.西华大学学报(自然科学版)():.():.石丽裴莉莉陈昊等.改进的水泥路面露骨病害检测.计算机系统应用():.:/().:.赵杰伦张兴忠董红月.基于尺度不变特征金字塔的输电线路缺陷检测.计算机工程与应用():.:/.().:/./.唐东林吴续龙周立等.结合深度学习与注意力机制的墙体安全检测模型.安全与环境学报():.().:/./.:.():./().:.:/.:./().:./.().:/./.:/().:.():.:

展开阅读全文