收藏 分销(赏)

基于改进MobileNetV3-Small的皮肤肿瘤分类.pdf

上传人:自信****多点 文档编号:2345066 上传时间:2024-05-28 格式:PDF 页数:9 大小:1.93MB
下载 相关 举报
基于改进MobileNetV3-Small的皮肤肿瘤分类.pdf_第1页
第1页 / 共9页
基于改进MobileNetV3-Small的皮肤肿瘤分类.pdf_第2页
第2页 / 共9页
基于改进MobileNetV3-Small的皮肤肿瘤分类.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基于改进 MobileNetV3-Small 的皮肤肿瘤分类石兴,方睿,罗鸣,刘天锴(成都信息工程大学计算机学院,成都610103)通信作者:方睿,E-mail:摘要:许多皮肤癌疾病具有明显的初期患病征兆.目前皮肤癌诊断主要依靠具有专业知识的医务工作者进行诊断,其存在着耗时长、复用性低等问题.针对上述问题,该研究提出一种基于改进 MobileNetV3-Small 的轻量级皮肤肿瘤识别模型.首先提出了一种基于坐标注意力机制模块(coordinateattention,CA)的 CaCo 注意力模块.其次针对皮肤肿瘤数据集样本分布不均衡,提出了一种联合多损失函数来增强模型对少样本病例的学习能力.

2、实验结果表明,改进的 MobileNetV3-CaCo 模型精确率、平衡准确性和模型参数量分别为 93.39%、86.35%和 2.29M,达到了理想的识别效果.关键词:皮肤癌;轻量级模型;注意力模块;联合损失函数引用格式:石兴,方睿,罗鸣,刘天锴.基于改进 MobileNetV3-Small 的皮肤肿瘤分类.计算机系统应用,2023,32(12):120128.http:/www.c-s- Tumor Classification Based on Improved MobileNetV3-SmallSHIXing,FANGRui,LUOMing,LIUTian-Kai(CollegeofC

3、omputerSciences,ChengduUniversityofInformationTechnology,Chengdu610103,China)Abstract:Manyskincancerdiseaseshaveobviousearlysymptoms.Currently,thediagnosisofskincancermainlyreliesonmedicalworkerswithprofessionalknowledge,bringingtheproblemssuchaslongtimeconsumptionandlowreusability.Inresponsetothese

4、problems,alightweightskindiseaserecognitionmodelbasedonimprovedMobileNetV3-Smallisproposedinthisstudy.Firstly,aCaCoattentionmodulebasedoncoordinateattention(CA)mechanismisproposed,Secondly,fortheunevendistributionofthesamplesofskin-cancerdatasets,acombinationofmultiplelossfunctionsisproposedtoenhanc

5、ethelearningabilityofthemodelforcaseswithfewsamples.TheimprovedMobileNetV3-CaComodelhasanaccuracy,balanceaccuracy,andmodelparameterquantityof93.39%,86.35%,and2.29M,respectively,thusidealrecognitionresultsareachieved.Key words:skincancer;lightweightmodel;attentionmodule;jointlossfunction皮肤肿瘤是全世界常见的健康

6、问题,也是造成全球疾病负担的主要原因1.2013 年,Karimkhani 等在调查全球疾病负担时,皮肤病造成的负担占全球疾病负担的 1.79%,且成为非致命性疾病负担和残疾的第 4大原因2.常见的皮肤癌筛查手段为皮肤镜检查与病理组织检查.皮肤镜又称表皮透光显微镜,其能对活体表皮等肉眼难以观察的细微结构提供清晰的图像.相比于肉眼诊断的准确率(约 70%),经过皮肤镜诊断的皮肤病变,其病理符合率可高达 95%.病理组织检查是诊断皮肤恶行肿瘤的金标准3.通过有创性取样,得到病变部位的组织,病理医生通过在显微镜下观察进行病理诊计算机系统应用ISSN1003-3254,CODENCSAOBNE-mai

7、l:ComputerSystems&Applications,2023,32(12):120128doi:10.15888/ki.csa.009350http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:国家重点研发计划(2020YFA0608000)收稿时间:2023-06-08;修改时间:2023-07-12,2023-07-27;采用时间:2023-08-11;csa 在线出版时间:2023-11-17CNKI 网络首发时间:2023-11-20120系统建设SystemConstruction断.以上两种诊断方法都需要在医院进行专业的

8、诊断,存在着不可复用性、经济成本高、耗时长等问题.因此寻找一种快速诊断、准确率适中、复用性高的诊疗手段非常具有现实意义.随着人工智能的快速发展,深度学习被广泛地应用于皮肤癌分类领域.基于深度学习的医学影像处理技术目前已被证明在某些领域达到甚至超过了人类专家水平,因此这项技术也逐渐走向临床,开始辅助医生的日常工作4.Han 等5使用 ResNet152 模型对 12 种不同的皮肤疾病的临床图片进行了分类.他们的研究结果表明,该算法在某些情况下与专业皮肤科医生的诊断性能相媲美,甚至更好,为自动化皮肤疾病诊断系统的开发提供了基础.王诗琪等6使用 5094 幅色素痣和脂溢性角化病(SK)的皮肤镜图像对

9、 CNN 网络 ResNet-50 通过迁移学习进行训练,建立 CNN 二分类模型.同时在测试时对两种疾病各 30 张图片进行自动分类,通过对该模型预测结果与 95 位有经验的皮肤科医师进行比较.结果显示,该 CNN 自动分类模型在这两种疾病的分类性能上与有经验的皮肤科医师水平相当.斯坦福大学工程学院和医学院团队在 Nature 上发布了在皮肤癌诊断领域的最新突破7,利用在 ImageNet 上预训练后的 GoogleInception-v3 模型对 129450 张皮肤表面图片进行训练.最后通过模型预测后的识别精度和 21 位皮肤科医生的识别准精度分别达到 69.4%和66%左右.但由于其选

10、用的基准模型参数量较大,在移动端部署存在困难.Han 等8使用传统卷积神经网络对 174 种疾病合计 20 余万张图片进行训练,该模型可准确预测恶行肿瘤,提出主要治疗方案.通过在 134 种疾病中进行多类别分类,提高医疗专业人员的诊断能力.Fujisawa 等9开发了一个基于 GoogLeNet 皮肤病变分类器,该分类器旨在诊断皮肤肿瘤.该论文证明了深度学习和计算机视觉技术在医学领域,特别是皮肤科诊断方面的潜力.尽管他们使用了一个相对较小的数据集且该模型,但他们的模型仍能实现高准确率的皮肤肿瘤诊断.其模型主要缺点是在不同疾病识别性能上差异较大.王璐10提出了一种多特征融合的方式,利用典型相关分

11、析法对单一特征进行融合后训练 SVM分类器,同时通过选择不同的核函数优化分类器.在自建的含有 90 种常见皮肤病共计 4702 张图片的皮肤病临床图像数据集上 Top-1 准确率达到 65.7%.由于该数据集为自建数据集,在实验结果对比评判上存在不确定性.孔祥勇11、Li 等12提出了一种基于乘法的数据融合方法,通过在元数据的一维卷积序列提取系数来提升分类精度.尽管通过结合元数据训练可以提高模型的识别准确率,但这种识别模式适用性不是很强,需要综合多元信息进行预测.殷文君等13提出一种融合皮肤肿瘤临床患者元数据的密集卷积网络分类模型,但其使用的网络模型参数较大,分类精度不高.Hekler等14使

12、用深度神经网络对组织病理学图像进行分类,特别是对黑色素瘤的组织病理学图像进行分类.尽管该网络对皮肤肿瘤图像的分类精度不高,但也证明深度学习对黑素瘤组织病理学诊断存在潜在帮助.随着深度学习技术的进一步发展,训练速度更快、参数量更少的轻量级模型不断出现.其中 MobileNet 系列模型1517能够快速准确地识别类间差异,具有速度快、灵活度高的特点,其可以嵌入到移动设备.目前已被广泛应用于病虫害识别18、果实识别19等领域,但在皮肤镜图像识别的应用较少.基于以上神经网络所存在的模型识别精度不高、模型参数量大、不易复现等不足之处,本研究通过实验对比后采用轻量级网络模型 MobileNetV3-Sma

13、ll 作为基准模型来使模型达到轻量化的需求.首先采用迁移学习方法,从 PyTorch 官方代码仓库中获得预训练权重进行模型参数初始化,使模型训练收敛速度更快,缩短训练时间;其次将 MobileNet 模型中的原 SE 注意力模块更换为改进的 CaCo 注意力模块,增强模型对皮肤肿瘤图像的位置信息感知能力.然后针对皮肤肿瘤数据集分布不均衡引入联合损失函数来增强模型对少样本病例的学习能力.最后通过实验验证构建的 Mobile-NetV3-CaCo 皮肤肿瘤识别模型的效果.1模型构造方法1.1 MobileNetV3-Small 模型2019 年 Google 团队提出了继 MobileNetV21

14、6之后的新一代轻量级神经网络 MobileNetV317.该网络模型在 ImageNet20分类中实现了比 MobileNetV2 低 20%的时延,同时提高了 3.2%精度.对比 MobileNetV2 模型,MobileNetV3 加入了 SE 注意力模块,SE 模块主要作用是通过学习的方式获取每个 channel 的重要程度,然后依照这个重要程度来对各个通道上的特征进行加权,从而突出重要特征,抑制不重要的特征.简单来说就是训练一组权重,对各个 channel 的特征图加权.与此同时还更新了激活函数,引入了新的非线性 h-swish激活函数.MobileNetV3 的 block 模块如图

15、 1 所示.2023年第32卷第12期http:/www.c-s-计 算 机 系 统 应 用SystemConstruction系统建设12111,NLDwise,NLPoolFC,ReLUFC,h-swish图 1MobileNetV3block 结构图除了网络模型上的更新外,还使用了 NAS(neuralarchitecturesearch)搜索参数,作者通过使用 NAS 搜索之后得到的网络,对网络结构的推理时间进行逐层分析,针对某些耗时的层结构做了进一步优化.MobileNet系列主要通过深度卷积(depthwiseconvolution)和逐点卷积(pointwiseconvoluti

16、on)替代传统卷积操作提高模型效率,使模型更容易用在移动端.1.2 迁移学习迁移学习是一种机器学习方法,它利用已有知识来解决不同但相关领域的问题.这种方法放宽了传统机器学习的两个基本假设:首先,传统机器学习要求训练样本和测试样本在统计分布上是独立且相同的;其次,传统方法通常需要大量的训练样本来构建良好的模型21.当前,迁移学习方法主要基于卷积神经网络(convolutionalneuralnetwork,CNN).这意味着我们可以利用在源领域中训练得到的权重信息.然后通过结合目标领域的分类任务,重新构建模型的全连接层,并使用目标领域的数据对模型进行微调,以适应新的分类要求.这种方法不仅可以减少

17、训练时间,还能够实现更好的分类性能22.2MobileNetV3 的改进2.1 改进 CA计算机视觉中的注意力机制是让模型更加关注于图像中的重点信息,忽略干扰信息,其已经被广泛应用于多个领域2325.MobileNetV3-Small 在瓶颈结构中加入了 SE 注意力模块,但 SE 模块主要作用是增强对通道的注意力.而在特征图中位置信息也是尤为重要的,坐标注意力模块26的基本结构如图 2 所示.输入Input残差ResidualCH1CHWCHWCH1ConvSigmoidSigmoidConvCH1Concat+ConvdBatchNorm+SwishC1WC1WC1W重标定Re-weigh

18、t输出OutputC/r1(W+H)C/r1(W+H)X AvgPoolY AvgPool图 2坐标注意力模块基本结构图 2 中 X/YAvgPool 为 X/Y 方向平均池化;Concat代表拼接;BatchNorm 代表批量归一化;Swish 和Sigmoid 代表非线性激活函数;C 为通道数;H 为特征图的高度;W 为特征图的宽度;r 为缩减系数.对于给定的输入 X 的通道数为 C,高度为 H,宽度为 W.沿着输入特征图的水平方向(H,1)和垂直方向(1,W)分别进行池化操作,从而获得输入特征图的 x,y 轴相关位置信息.水平方向上得到的一维特征如式(1)所示:zhc(h)=1W0iWx

19、c(h,i)(1)垂直方向上得到的一维特征如式(2)所示:zwc(w)=1HOjHxc(j,w)(2)Xchi0,W wj0,H其中,为特征图在第 通道具体位置的特征信息;为特征图的具体高度,为特征图的宽度,取值范围是;为特征图的具体宽度,为特征图的高度,取值范围为.接下来,将 2 个方向上的特征图进行空间拼接,并使用 11 卷积变换将维度变为原来的 C/r,在经过批量归一化和 Swish 激活操作得到包含 2 个方向信息的中间特征图,如式(3)所示:f=(F1(Zh,Zw)(3)计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第12期122系统建设SystemCons

20、tructionfF1ffhfwfhfwX其中,为空间信息在 2 个方向编码得到的中间特征图,为激活函数 Swish,为 11 的卷积变换函数.首先沿 2 个方向的空间维度将 分解为 2 个单独的张量和.然后利用 2 个 11 卷积变换函数将和转换成与输入 具有相同通道数的张量,再经过激活函数后得到在 h 和 w 上的注意力权重.最后将拓展后的注意力权重与 X 做乘法加权操作,得到坐标注意力模块的输出,如式(4)所示:yc=xc(i,j)(Fh(fh)(Fw(fw)(4)ycFhFw其中,为第 c 通道的输出,为激活函数 Sigmoid,和为在高度和宽度上的卷积变换函数.坐标注意力模块能够通过

21、在像素坐标系上的有效定位,使模型能集中对感兴趣区域的注意力,获取兼顾皮肤镜图像中通道和位置的信息,减少对干扰信息的关注,从而提升模型的特征表达能力.但坐标注意力模块仅关注空间范围内的信息,缺乏对通道的注意力.两种不同的注意力各自的作用是不同的.序列化地使用两种注意力机制,要比并行化使用效果要好27.同时先使用通道注意力要优于先使用空间注意力.因此对CA 进行改进,在其前面添加通道注意力机制,由此得到改进的 CA 模块CaCo,让模型可以兼顾关注通道和空间两个维度的信息,增强模型的识别能力.改进CaCo 注意力模块的结构如图 3 所示.InputResidualRe-weightRe-weigh

22、tOutputShared MLPConv2d+SigmoidConv2dConv2dConcat+Conv2dSplitBatchNorm+Non-linearSigmoidSigmoidCHWCHWC11C11C1WC1WC1WCH1CH1CH1Channel AvgPoolChannel MaxPoolY AvgPoolX AvgPoolC/r1(W+H)C/r1(W+H)图 3改进 CaCo 注意力模块结构2.2 改进损失函数Focal-loss 损失函数是 He 等28在目标检测任务提出的,其主要目的是增加那些少样本的损失权重,降低多样本的损失权重,focal-loss 函数是基于交

23、叉熵损失函数改进而来的.Focal-loss 损失函数的定义如式(5)所示:LF=f(x)=(1P)logP,y=1Plog(1P),y,1(5)0其中,为调节系数;为平衡因子.时,可以减小易于分类样本的损失,使模型注重于更加分类困难和复杂的样本.此外,作为平衡因子可以平衡数据集中因正负样本分布不均衡问题.Label-distributionawaremargin(LDAM)29损失函数是另一种缓解类不平衡问题的损失函数.一般来说,同一类别样本的特征在特征空间上的距离是比较接近的,不同类别样本的特征在特征空间上距离是比较远的.于是分类问题本质上是在找一条决策边界,使这些特征点能被正确的划分到对

24、应的类别.LDAM 核心思想就是对少数类引入比多数类更强的正则化,以减少它们的泛化误差,从而使其保持模型学习多数类并强调少数类的能力.LDAM 损失只使少数类获得相对较大的决策边距,更加偏向于少数类地学习,以达到最优地分类效果.LDAM 损失函数的定义如式(6)所示:LLDAM(x,y);f)=logezyyezyy+j,yezj(6)j=cn1/4jj 1,k其中,相较于交叉熵损失函数,LDAM 损失函数可以增大少数类的分类间距,并且该距离由样本数量调节.Focal-loss 使模型更加注重于难以分类的样本,而LDAM 损失函数则是通过数据集的类数量来判断权重.由此可以通过联合 focal-

25、loss 和 LDAM 损失函数来同时监督 MobileNetV3-CaCo 网络的训练,提高模型对皮肤肿瘤图像的整体识别精度.联合损失函数如式(7)所示:L=LF+(1)LLDAM(7)其中,是用来调节损失的权重因子,通过实验证明,使用联合损失函数有效提高了皮肤肿瘤分类的准确性,并且当=0.5 时模型识别效果最好.2023年第32卷第12期http:/www.c-s-计 算 机 系 统 应 用SystemConstruction系统建设1232.3 MobileNetV3-CaCo 整体结构为了准确定位皮肤镜图像中的感兴趣区域,引入改进后兼顾通道和坐标信息的注意力机制.具体的来说是将 Mob

26、ileNetV3-Small 原通道注意力挤压-激励(squeeze-and-excitation,SE)模块替换为改进后的 CaCo注意力模块,增强其对位置信息的关注度,提升模型的识别效果.改进后的 MobileNetV3-CaCo 模型整体结构如图 4 所示.输入InputConvConvAKIECDFBKLBCCPoolBottleneck-CaCoCaCo 注意力模块输出Output图 4MobileNetV3-CaCo 模型整体结构3实验结果与分析3.1 数据集介绍本文训练与测试所采用的数据集是 HAM 数据集30,该数据集由 10015 张分辨率为 600450 像素的皮肤镜图像组

27、成,包含了 7 个不同的类别,分别是:黑色素细胞痣(melanocyticnevi,NV)、基底细胞癌(basalcellcarcinoma,BCC)、黑色素瘤(melanoma,MEL)、良性角化病(benignkeratosis,BKL)、皮肤纤维瘤(dermato-fibroma,DF)、血管性皮肤损伤(vascularskinlesion,VASC)和光化性角化病(actinickeratosis,AKIEC).其中基底细胞癌(BCC)和黑色素瘤(MEL)是恶性的,其余皮肤肿瘤都是良性的,所有黑色素瘤的诊断都是通过活检的组织病理学评估来证实的,而黑色素细胞痣的诊断则是通过组织病理学检查

28、(24%)、专家共识(54%)或其他诊断方法来证实的.数据集类别示例展示如图 5 所示.数据统计情况如表 1 所示.(a)光化性角化病(b)基底细胞癌(c)良性角化病(d)皮肤纤维瘤(e)黑色素瘤(f)黑色素细胞痣(g)血管性皮肤损伤图 5数据集类别示例表 1皮肤肿瘤样本分布情况临床诊断样本数黑色素细胞痣(NV)6705基底细胞癌(BCC)514黑色素瘤(MEL)1113良性角化病(BKL)1099皮肤纤维瘤(DF)115血管性皮肤损伤(VASC)142光化性角化病(AKIEC)327在进行数据预处理时,采用随机水平翻转、随机垂直翻转、旋转(90,180)、随机颜色变换、随机缩放等方法对 HA

29、M 数据集进行数据增强.3.2 实验环境及参数设置本文算法基于 PyTorch 框架在 Python 中实现.训练时将数据集按照 8:1:1 的比例分为训练集、验证集和测试集,训练时训练集与验证集采取交叉验证方式进行训练,测试集的数据与训练时的数据集不重叠.实验过程中,统一设置 epoch 为 100,优化器采用 AdamW优化器,学习率设置为 5E4,weightdecay 设置为 5E2,batchsize 设置为 128.训练时均使用 PyTorch 官方代码仓库中的预训练权重参数初始化模型权重.实验使用的硬件配置为:华硕 X570-PRO 主板、AMDRyzen93900 x12-co

30、reProcessor 的 CPU、16GB计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第12期124系统建设SystemConstructionDDR42133MHz 内存、NVIDIAGeforceGTX3080Ti10GB 显卡,软件配置为:CUDA11.7、Python3.9、Cudnn8.2.1、并采用 PyTorch1.13.1 深度学习框架以及 Ubuntu18.04 操作系统.3.3 评价指标为了全面评价 MobileNetV3-DA 模型的性能,本实验选取正确率(Accuracy)、特效度(Specificity)、灵敏度(Sensitivity)

31、和平衡准确性(balanceaccuracy,BACC)等指标综合评估模型的识别效果.计算公式如式(8)式(11)所示:Accuracy=TP+TNTP+FP+TN+FN(8)Specificity=TNTN+FP(9)Sensitivity=Recall=TPTP+FN(10)BACC=Sensitivity+Specificity2(11)其中,TP、FP、FN 和 TN 分别为混淆矩阵中分类模型对不同皮肤肿瘤的分类情况统计.其中,TP(truepositive)代表真实值为正样本且识别也为正样本的数量,FP(falsepositive)代表真实值为负样本但识别为正样本的数量,FN(fal

32、senegative)代表真实值为正样本但识别为负样本的数量,TN(truenegative)代表真实值为负样本且识别也为负样本的数量.进行皮肤肿瘤识别时,把要识别样本的实际类别数视为正样本数,把其他所有类别数之和视为负样本数.3.4 MobileNetV3 与其他模型性能对比在医学图像处理领域,医学图像数据集的数据量通常比较小,使用预训练策略可以有效提升模型的泛化能力.He 等31从随机初始化权重的情况下训练不同的神经网络.然后用 COCO 数据集进行目标检测和示例分割任务,结果显示预训练策略在目标任务上数据不足的时候可以带来大幅提升,还能规避一些目标数据的优化问题,同时还可以缩短研究周期.

33、本实验同样在不同的初始化策略下对不同参数量的 MobileNetV3以及 ResNet18 进行测试,实验结果如表 2 所示.对不使用预训练权重的 ResNet18 与 MobileNetV3进行比较,表 2 中的结果表明,在训练策略相同的情况下,ResNet18 的性能表现优于 MobileNetV3.这是因为前者拥有更多的参数量,在模型精度上表现得更好.同样,分别对使用预训练策略的 ResNet18 与 Mobile-NetV3 和未使用预训练策略的 ResNet18 与 MobileNetV3进行比较.表 2 结果表明,在其余训练策略相同的情况下,使用预训练策略要比未使用预训练策略具有更

34、好的泛化能力.表 2不同初始化策略的模型对比模型准确率(%)平衡准确性(%)模型参数量(M)ResNet18(withoutpre-training)89.8880.6711.18ResNet18(withpre-training)91.4884.2311.18MobileNetV3(withoutpre-training)87.1773.712.18MobileNetV3(withpre-training)90.8883.442.18为了验证轻量级卷积神经网络 MobileNetV3 的有效性,对不同深度学习模型进行比较.相关结果对比见表 3 及图 6.表 3不同模型性能对比模型准确率(%)

35、平衡准确性(%)模型参数量(M)ResNet1891.4884.2311.18ShuffleNetV291.3884.255.36GhostNetV288.8878.636.16EfficientNetB091.2983.425.29MobileNetV390.8883.442.18(a)训练集损失1.00.80.6损失值0.40.200 6 12 18 24 30 36 42 48训练轮次54 60 66 72 78 84 90 96ResNet18EfficientNetB0GhostNetV2ShuffleNetV2MobileNetV3-Small(b)验证集准确率1.000.950.

36、850.90准确率0.800.750.700 6 12 18 24 30 36 42 48训练轮次54 60 66 72 78 84 90 96ResNet18EfficientNetB0GhostNetV2ShuffleNetV2MobileNetV3-Small图 6模型实验结果对比由表 3 可以看出,ResNet18 模型利用残差网络构建了较深的神经网络,具有较好的特征提取能力和反向传播能力,在实验中表现出较好的分类性能,但是训练的时间长,耗费的内存和计算资源较大;ShuffleNetV22023年第32卷第12期http:/www.c-s-计 算 机 系 统 应 用SystemCons

37、truction系统建设125利用分组卷积的思想降低了参数量,但与此同时其收敛过程不稳定,导致模型的稳定性能受影响.Mobile-NetV3-Small 模型以较小的模型参数量取得较好的分类效果,训练结果接近 EfficientNetB0,优于 GhostNetV2.由图 6 可以看出,在经过 100 个 epoch 后,各个模型的损失值和准确率趋于稳定,这表明模型已经训练充分.与其他模型相比 MobileNetV3-Small 在训练过程中表现出更平稳的收敛过程,损失值和准确率也较早的稳定在最优值附近,以较少的参数量实现了较好的分类识别效果.3.5 MobileNetV3-CaCo 与其他模

38、型性能对比通过对改进后的 MobileNetV3-CaCo 结合不同的损失函数进行对比,相关结果对比见表 4.表 4MobileNetV3-CaCo 结合不同结合损失函数性能对比模型准确率(%)平衡准确性(%)模型参数量(M)MobileNetV390.8883.442.18MobileNetV3-CaCo91.7885.702.29MobileNetV3-CaCo+focal91.9885.742.29MobileNetV3-CaCo+LDAM91.7886.312.29MobileNetV3-CaCo+改进损失函数93.3986.352.29表 4 中前面 2 种未标注损失函数的表示统一使

39、用交叉熵函数优化模型,后面 3 种表示改进后的 Mobile-NetV3-CaCo 模型分别采用 focal-loss 和 LDAM 以及改进后的混合损失函数提升模型的性能.从表 4 中可知,通过使用 focal-loss 或 LDAM 损失函数后,模型的准确性以及平衡准确性都有所提升.这是因为这两种损失函数分别注重于更加分类困难的样本和更加偏向于少数类地学习,在模型训练过程中都可以更好的调节因数据量不均衡而对不同样本数量的关注度差距.通过结合这两种损失函数改进的混合损失函数在模型识别精度以及平衡准确性上均有所上升,能够有效识别少数量类的皮肤肿瘤图像.通过对不同注意力模块组合进行比较,相关结果

40、对比见表 5 及图 7.其中 MobileNetV3-CBAM 表示MobileNetV3-Small 的 SE 注意力模块替换为 CBAM模块,MobileNetV3-SeCo 表示在原 SE 模块后引入坐标注意力模块,MobileNetV3-Eca 表示将 MobileNetV3-Small 的 SE 注意力模块替换为 Eca 模块,MobileNetV3-CaCo 表示本文构建模型.从表 5 可知,MobileNetV3-CBAM、MobileNetV3-SeCo、MobileNetV3-Eca 和MobileNetV3-CaCo 模型的识别准确率为 91.48%、89.68%、90.9

41、8%和 91.78%,相比其他 3 类模型,MobileNetV3-CaCo 能够更加准确的识别皮肤镜图像,有效提升模型精度.表 5不同注意力模块组合加损失函数性能对比模型准确率(%)平衡准确性(%)模型参数量(M)MobileNetV390.8883.442.18MobileNetV3-CBAM91.4885.722.20MobileNetV3-SeCo89.6878.702.64MobileNetV3-Eca90.9882.642.08MobileNetV3-CaCo91.7885.702.29MobileNetV3-CaCo+改进损失函数93.3986.352.29从图 7 可以看出,通

42、过对不同注意力模块组合或者引入不同的注意力模块,对模型的识别效果影响参差不齐.其中较另外两种模型比较,引入 CBAM 模块效果较好,尤其体现在对皮肤纤维瘤识别效果较好.本文构建的 MobileNetV3-CaCo 模型的识别果优于其余模型的识别效果.特别是在引入联合损失函数后,模型对每种皮肤镜图像识别效果更均衡,明显提升模型对少数量类的识别能力.在少量增加模型参数量的情况下,模型的正确率和平衡准确性均得到提升.4结论与展望针对皮肤镜图像难分类的问题,本研究对 MobileNetV3-Small 模型进行了改进,构建了 MobileNetV3-CaCo 皮肤镜图像识别模型.将 MobileNet

43、V3-Small 中SE 注意力模块更换为改进后的 CaCo 注意力模块,以此在保留模型对通道的注意力的同时增强模型对位置信息的感知能力,提升了模型的信息表达能力;同时采用改进联合损失函数来提升模型的识别精度.结果表明:1)MobileNetV3-CaCo 模型能够准确识别皮肤镜图像.针对数据集改进的混合损失函数可以有效提升模型识别精度.MobileNetV3-CaCo 在测试集上的识别准确率为 92.29%,对比 ResNet18、GhostNetV2、EfficientNetB0 和 ShuffleNetV2 这些常见轻量级分类模型分别高 1.91、4.71、2.51 和 2.01 个百分

44、点.2)MobileNetV3-CaCo 模型满足了轻量化的要求.MobileNetV3-CaCo 的模型参数量为 2.29M,较好的平衡了模型的复杂度和识别效果.模型测试结果表明,本研究构建的 MobileNetV3-CaCo 模型能够快速、准确地识别皮肤镜图像.下一步将考虑将模型部署到移动终端,实现皮肤镜像图片的快速智能识别.计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第12期126系统建设SystemConstructionAKIECAKIECBCCBCCBKLBKLDFDFMELMELNVNVVASCVASCPredicted labelTrue label

45、1.00.80.60.40.20(a)MobileNetV3AKIECAKIECBCCBCCBKLBKLDFDFMELMELNVNVVASCVASCPredicted labelTrue label0.81.00.60.40.20(e)MobileNetV3-CaCoAKIECAKIECBCCBCCBKLBKLDFDFMELMELNVNVVASCVASCPredicted labelTrue label0.81.00.60.40.20(f)MobileNetV3-CaCo+联合损失函数AKIECAKIECBCCBCCBKLBKLDFDFMELMELNVNVVASCVASCPredicted l

46、abelTrue label0.80.60.40.20(c)MobileNetV3-SeCoAKIECAKIECBCCBCCBKLBKLDFDFMELMELNVNVVASCVASCPredicted labelTrue label0.80.60.40.20(d)MobileNetV3-EcaAKIECAKIECBCCBCCBKLBKLDFDFMELMELNVNVVASCVASCPredicted labelTrue label1.00.80.60.40.20(b)MobileNetV3-CBAM图 7引入不同注意力机制模型的混淆矩阵参考文献樊文龙,王红心,杨晓雨,等.19902019 年亚洲

47、6089 岁老年人皮肤病的疾病负担.中国皮肤性病学杂志,2022,36(11):12571264.1KarimkhaniC,DellavalleRP,CoffengLE,et al.Globalskindiseasemorbidityandmortality:Anupdatefromtheglobal2burden of disease study 2013.JAMA Dermatology,2017,153(5):406412.doi:10.1001/jamadermatol.2016.5538中华医学会皮肤性病学分会皮肤肿瘤研究中心,中国医师协会皮肤科医师分会皮肤肿瘤学组.皮肤基底细胞癌诊

48、疗专家共识(2021).中华皮肤科杂志,2021,54(9):757764.3姚侃敏,潘自来,宋琦,等.影像云在放射诊断质控工作中42023年第32卷第12期http:/www.c-s-计 算 机 系 统 应 用SystemConstruction系统建设127的应用价值.中国医学计算机成像杂志,2018,24(5):401405.doi:10.3969/j.issn.1006-5741.2018.05.009HanSS,KimMS,LimW,et al.Classificationoftheclinicalimagesforbenignandmalignantcutaneoustumorsu

49、singadeeplearningalgorithm.JournalofInvestigativeDermatology,2018,138(7):15291538.doi:10.1016/j.jid.2018.01.0285王诗琪,刘洁,朱晨雨,等.皮肤科医师与深度卷积神经网络诊断色素痣和脂溢性角化病皮肤镜图像比较.中华皮肤科 杂 志,2018,51(7):486489.doi:10.3760/cma.j.issn.0412-4030.2018.07.0026EstevaA,KuprelB,NovoaRA,et al.Dermatologist-levelclassification of s

50、kin cancer with deep neural networks.Nature,2017,542(7639):115118.doi:10.1038/nature210567Han SS,Park I,Chang SE,et al.Augmented intelligencedermatology:Deep neural networks empower medicalprofessionals in diagnosing skin cancer and predictingtreatment options for 134 skin disorders.Journal ofInvest

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服