ImageVerifierCode 换一换
格式:PDF , 页数:10 ,大小:5.95MB ,
资源ID:2328660      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/2328660.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(基于特征类内紧凑性的不平衡医学图像分类方法.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

基于特征类内紧凑性的不平衡医学图像分类方法.pdf

1、CNAIURCIENCEJuly,20232023年7 月JOURNANIVERSITYVol.59,No.4第59 卷第4期南京大学学报(自然科学DOI:10.13232/ki.jnju.2023.04.005基于特征类内紧凑性的不平衡医学图像分类方法孟元,张轶哲*,张功萱,宋辉(南京理工大学计算机科学与工程学院,南京,2 10 0 94)摘要:近些年,基于深度学习的算法和模型在各种图像分析任务中都取得了显著的成功,与常见的自然图像相比,医学图像数据集依然面临高度不平衡的问题,不平衡数据会导致特征空间里的决策边缘倾向样本多的类别,导致分类效果的下降,为了解决该问题,提出一种基于卷积神经网络考

2、虑特征类内紧凑性的不平衡医学图像分类方法(Z-ScoreCompactness-based Convolutional Neural Network,ZC3NC).首先,从一个卷积神经网络的最后一层卷积层提取训练集样本与测试集样本的特征图,随后引人一个新的Z分数来度量测试集数据的特征图相对训练集每个类在特征空间上的偏离度,偏离度的度量基于类内的紧凑度,其主要关注样本的分布特性,对各类样本数量的不平衡性不敏感。最终,根据计算的偏离度,对测试集的数据进行分类.在DermaMNIST数据集上的实验表明,在不对数据和神经网络模型做任何额外增强的情况下,该方法的平衡准确率比原卷积神经网络模型平均提高11

3、.15%,最多提高14.0 8%,证明提出的分类方法能有效地提高多种卷积神经网络对不平衡医学图像数据的分类性能.此外,和最先进的不平衡分类方法Under-BaggingKNN相比,该方法的性能平均提升了2.36%.关键词:卷积神经网络,类别不平衡,医学图像,特征,分类中图分类号:TP391.4文献标志码:AImbalanced medical image classification based onintra-class compactness of featuresMeng Yuan,Zhang Yizhe,Zhang Gongxuan,Song Hui(School of Compute

4、r Science and Engineering,Nanjing University of Science and Technology,Nanjing,210094,China)Abstract:In recent years,algorithms and models based on deep learning have achieved significant success in various imageanalysis tasks.However,compared to common natural images,medical image datasets often fa

5、ce highly imbalancedproblems,which lead to decreased classification performance.Imbalanced data causes decision boundaries in the feature spaceto tend towards the class with more samples.To solve this problem,this paper proposes an imbalanced medical imageclassification method based on convolutional

6、 neural networks considering intra-class compactness of features(Z-ScoreCompactness-based Convolutional Neural Network,ZC3NC).First,feature maps of training and testing set samples areextracted from the last convolutional layer of a convolutional neural network.Then,we introduce a new Z-score basedm

7、easure to test the deviation of the testing set data feature maps relative to each class of the training set in the feature space.The measure of deviation is based on intra-class compactness,which focuses on the distribution characteristics of the samplesand is insensitive to the imbalance of the nu

8、mber of samples in each class.Finally,based on the calculated deviation,weclassify the testing set data.Experiments on the DermaMNIST dataset show that without any additional data or neuralnetwork model enhancements,the balanced accuracy of the proposed method increases by an average of 11.15%compar

9、ed tothe original convolutional neural network model,with a maximum increase of 14.08%.This verifies that the proposed基金项目:国家自然科学基金(6 2 2 7 2 2 32,6 2 2 0 12 6 3),江苏省自然科学基金(BK20220949)收稿日期:2 0 2 3一0 6 一19*通讯联系人,E-mail:孟581元等:基于特征类内紧性的不平衡医学图像分类方法第4期classification method effectively improves the class

10、ification performance of various convolutional neural networks forimbalanced medical image data.Furthermore,compared to the state-of-the-art imbalanced classification method,Under-bagging KNN,the average improvement of ZC3NC is 2.36%Key words:convolutional neural network,class imbalance,medical imag

11、e,feature,classification目前的医疗实践中,临床医生对疾病监测和诊断的主观判断可能存在误差 1,为了克服这一问题,研究者提出了许多计算机辅助检测和诊断方法来帮助临床医生更有效地阅读医学图像并作出诊断决策.医学图像分类是其中的热点研究之一,通过该方法可以将从CT、X 射线、皮肤镜等医学检测中得到的不同图像正确地划分到各自的类别中,协助医生得到更可靠的诊断结果 2.近年来,深度学习已经成为医学图像分类中使用最广泛的技术之一 3,其优势是在处理非常复杂的数据时,可以在训练过程中自动提取特征,并利用多层次的神经网络对数据进行抽象表示,提高分类器的性能,然而,由于在医学环境中收集罕

12、见疾病或其他不寻常的实例的固有困难以及获取医学图像数据和标记的高昂成本或隐私风险,许多医学图像的数据集具有高度不平衡的长尾分布(Long-TailedDistributions)的特点 4),即常见病拥有最多的样本数量,而罕见疾病的样本数量极少。如图1所示,在色素性皮肤病变的多源皮肤镜图像数据集DermaMNIST5的训练集中,占比最高的一个疾病类别的样本量比其他的类别样本的总和更多.由于深度学习技术普遍需要足够的图像来进行训练,这种高度不平衡会导致模型在部分疾病类上的表现明显下降 6,这对于临床诊断是不可接受的,为了提高深度学习对不平衡医学图像数据集的分类性能,研究者主要从数据和模型两个层面

13、500040003000200010000MELNVBKLBCCAKIECVASCDF皮肤病类别图1DermaMNIST数据集中各类别的数量Fig.1Class distribution of the DermaMNIST dataset进行改进.从数据的角度出发,主要是结合欠采样(Under-Sampling)和过采样(Over-Sampling)两种方法 7.HassanandHaque8采用可调Q因子小波变换信号处理技术和RUSBoost分类模型来设计自动阻塞性睡眠呼吸暂停的筛选方案,结合随机欠采样方法训练分类网络,实现睡眠呼吸暂停的自动检测.Xuetal设计了一种混合采样算法,将面向错

14、误分类的合成少数过采样技术(M-SMOTE)和基于随机的编辑最近邻欠采样(EditedNearestNeighbours,ENN)相结合,并动态调整M-SMOTE和ENN的几率,可以利用甲状腺功能体检图像来筛查甲状腺功能的异常.在模型层面,研究者使用修改模型来强调少数类的重要性.Ghorbani etal0基于图卷积网络,提出一种重新加权的对抗图卷积网络,在训练时对类样本加权并改变每个样本对分类器的重要性:此外,还有一些研究者使用集成学习的方法将多个模型结合到一个任务中,在数据不平衡场景下也取得了很好的表现然而,以上大部分解决方案都缺乏通用性,对其他模型不兼容,或者和原模型相比使用难度更高 1

15、.针对上述挑战,本文提出一种适用于多种卷积神经网络的基于特征类内紧凑性的不平衡医学图像分类方法ZC3NC,无须重新训练即可进一步优化已有卷积神经网络模型在不平衡数据集上的分类结果.该方法的大致流程:首先,得到训练集训练完成的模型最后一层卷积层的特征图并按类集群,计算得到类内紧凑性信息;然后得到测试集特征图,引人Z分数来衡量未知类特征图偏离每个类的程度,实现对网络的分类优化.在Derma-MNIST和EyePacs数据集上,分别将该方法应用于 ResNet18,ResNet50,ResNeXt50 和 GoogLe-Net四类卷积神经网络进行分类,结果其平衡准确率分别比原模型平均提升11.15%

16、和7.0 2%,显示出良好的性能和对不同网络的适用性。Tn业+582第59 卷南京大学学报(自然科学)1背景知识1.1卷积神经网络卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,由一系列卷积层、池化层、全连接层组成,现已被广泛应用于图像分析和语音信号处理等任务 12,如图2 所示.输入层卷积层池化层全连接层图2卷积神经网络的结构Fig.2Thearchitectureof CNN其中,卷积层是CNN的核心,每个卷积层包括多个可学习的卷积核,负责对输人图像进行扫描,生成一组高维特征图.每个卷积核可以捕捉输入图像的某种特定模式,如边缘、纹理、形状

17、等,其计算如式(1)所示:y=f(w;?a;+b.)(1)其中,,是第层卷积的输入数据,是卷积计算,w,是卷积核权重矩阵,b,是偏置项,f表示激活函数,y是输出特征图.池化层是CNN的降采样层,可以降低特征图的维度,减少模型参数和计算量,在保留重要信息的同时避免过拟合:全连接层是CNN的输出层,负责将池化层输出的特征图展开成一维向量,并通过权重矩阵和偏置向量与输出节点相结合,最后由输出节点对应模型的分类或回归任务。1.2Z分数(Z-Score)也称标准分数(Stan-dard Score),是统计学中常用的一个概念,表示某一数据点与其所在数据集的平均值之间的差异,以标准差的形式来衡量,其计算如

18、式(2)所示:(x-)Z=(2)其中,是需要测量的值,代表总体的平均值,代表总体标准差:Z分数是一种测量某分数在分布中相对位置的方法 13,可以描述需要测量的值高于或低于某特定总体平均值的标准偏差.乙分数的绝对值越大,说明其偏离该平均值的程度越大,差异越显著.如今,乙分数已被广泛应用于数据归一化、异常检测、财务状况预测等领域 141.3类内紧凑性类内紧凑性(Intra-ClassCompactness)被用于衡量同一类别内部样本的近似程度和聚集性,机器学习任务中通常希望同一类别的样本彼此之间更加接近,形成更紧凑的簇,这有助于提高分类准确性,降低泛化误差,增强模型的可解释性 15.类内紧凑性可以

19、通过计算样本之间的距离或相似度来度量,例如方差、类内平均距离和DB指数等.较小的类内距离表示同一类别内的样本更相似,而较大的类内距离则意味着类内分散性较高,样本之间的差异性更大。本文不关注如何修改模型或样本来提高某一类别特征的类内紧凑性,而是考虑利用不同类之间类内紧凑性的差异,比较测试集特征图和不同类训练集特征图的实际偏离程度,进而提升不平衡数据集的分类效果:2ZC3NC方法本文提出的ZC3NC方法的基本结构如图3所示.ZC3NC主要包含两个部分:基础网络模块和度量模块其中,基础网络模块即需要提升的卷积神经网络,用于对训练集和测试集数据进行特征提取;度量模块在基础网络模块的最后一个卷积层末端引

20、人,用于度量未知类特征图偏离测试集各类特征图集合的程度:2.1牛特征提取特征(feature)指图片在经过CNN堆叠的卷积层和池化层后产生的结果,AliAmirshahietal16证明,通过CNN提取图像的特征在大多数质量衡量标准中优于其他方法制作的特征.本文用Q:衣小万种经网络:中,ER是输人数据,c是类别数.设网络Q有L层,Q代表网络的第l层,q代表第1层的输出(其中q=),即输人通过第一层到第/层的非线性变换后获得的特征图网络Q的每一层都允许提取和输人的独特特征,而卷积神经网络的最后一层卷积层,即网络的倒数第二层Q-1通常会提取对于分辨输入类很重要的特征 17.因此,本文方法将从卷积神

21、经网络中提取训练集和测试集孟583元等:基于特征类内紧凑性的不平衡医学图像分类方法第4期CNN训练数据提取特征按类集群DtrainCNNoutput特征集群提取特征测试数据D度量模块testCNN图3基于特征类内紧凑性的不平衡医学图像分类方法框架Fig.3The framework for imbalanced medical image classification based on intra-class compactness of features图像的q-1用于度量模块.图4展示了在DermaMNIST数据集上训练的ResNet18模型倒数第二层提取的特征的二维表示,通过DensMA

22、P算法 18-19进行了可视化,可以直观地看出数据集中不同类的特征已被较好地分隔开.VASCDFBKLAKIECBCCNVMEL图4在DermaMNIST上训练的ResNet18模型的倒数第二层中提取的特征的二维表示Fig.4Two-dimensional representations of featuresextracted from a ResNet18 model trained on the Derma-MNIST dataset2.2度量模块原理通过提取训练集和测试集的特征图来分析图像是很常见的方法,然而其中大多数都是直接比较特征之间的距离或重新训练新的分类器模型.这类方法仅能体现

23、类内或类间的相对关系 2 0,却没有考虑同类特征图之间的距离、方差等类内要素,忽略了测试集特征图和训练集特征图的实际偏离程度.在特征空间中分类新样本时可能出现如图5所示的情况,无论是将新样本特征图与最近邻居A,B比较,或与两类中心点值A,B比较,都可能错误地将该样本分类为类别1样本特征图类别2 样本特征图O新样本特征图图5在特征空间比较新样本的示意图Fig.5Illustration of comparing new samples in the fea-turespace类别2,因此无法提升分类效果,针对上述问题,本文认为应当在样本分类时重点考虑某些类别样本特征图内部的紧凑性,以此为依据,重

24、新确定拥有更远绝对距离但更近相对距离的特征图的分类情况.因此,本文提出利用乙分数对测试集特征与不同类训练集特征集群之间的偏差程度进行度量并分类,具体地,度量模块首先将训练集样本的特征图按类集群,分别计算每类集群内特征图两两之间的距离,并求平均距离及其标准差,以此表示不同类训练集特征图的类内紧凑性.然后,将新样本特征图分别与每个类的样本特征计算平均距离,最后代人Z分数得到新样本相对于每个类的偏差程度,以此判断新样本的类别.2.3ZC3NC算法去本方法的算法流程图如图6所示,算法流程如下.输入:不平衡数据集的训练集Drain,测试集未知类图像Dtest:2.3ZC3NC算法本方法的算法流程图如图6

25、所示,算法流程如下,输入:不平衡数据集的训练集Drain,测试集未知类图像Dtest:输出:Dtes分类结果,584第59 卷南京大学学报(自然科学)开始不平衡数据集D训练集D测试集Dtraintest按类提取特征提取特征特征图q1特征图q2特征图q:特征图分类计算Q:0aidistance(q,qt)计算2计算2 2计算么输出最小类结束图6ZC3NC算法的流程图Fig.6The algorithm flowchart of ZC3NC1.使用训练好的卷积神经网络模型,从最后一层卷积层Q-1分别提取Dtrain中每类的特征图q:和Dtest特征图.2.计算训练集每类特征集合q:内部特征两两之间

26、的距离矩阵A(NN),如式(3)所示:lqi,qillqi,qXN)(3)qn,qi其中,,y表示特征和y之间的欧式距离,N是集合qi中特征的数量,3.计算集合q:的矩阵A(nN)的平均距离g.和标准差0g,如式(4)和式(5)所示:17N从(4)N2a.6ZNN2Aa.6一(5)N24.使用测试集特征,分别与训练集每类特征图集合q.的计算平均距离distance(q,qi),如式(6)所示:disane(a.g.)=Zx-ll.gil(6)5.将训练集特征集q.的平均距离g、标准差.和特征Q与集合q:的平均距离distance(,q)代人式(1),计算新样本相对于类i的偏差程度并求绝对值,若

27、distance(,q:)一a,取负,绝对值越大同样说明特征过于紧凑,如式(7)所示:distance(q,q(7)其中,训练集特征集q;相对于m类集合的偏差程度zi,形成数列Z=z1,2,zm.6.取数列乙的最小值所在索引作为分类结果,如式(8)所示:j=argminz1,z2,zm(8)3实验与结果分析本文对方法的验证主要包括三部分:(1)构建ResNet18,ResNet50,ResNeXt50和GoogLeNet四类卷积神经网络并设计网络参数,在数据集中进行训练和测试.(2)从上述四类卷积神经网络中提取特征图,应用ZC3NC方法与原模型进行比较,验证方法的有效性.(3)应用本文方法与多

28、种不平衡数据集分类方法进行比较,3.1实验数据集为了验证提出的ZC3NC分类方法的有效性,在色素性皮肤病变的多源皮肤镜图像数据集DermaMNIST和糖尿病视网膜病变图像数据集EyePacs211上进行实验.数据集的大小、类别数和不平衡比等详细信息如表1所示,表1实验使用的数据集信息Table1Information of datasets used in experimentsDatasetsInstancesClassesMajorityMinorityIRDermaMNIST10015766.95%1.15%58.30EyePacs88702573.67%2.16%34.14其中,不平衡

29、比率(Imbalance Ratio,IR)22是最多数类的样本量与最少数类的样本量之比,IR越大,代表数据集的不平衡程度越大。DermaMNIST是基于色素性皮肤病变的多源皮肤镜图像数据集HAM1000023处理得到的,作为MedMNIST的一个子集用于多类分类任务.该数据集由10 0 15张皮肤镜图像组成,被标记成七个不同类别,分别是黑色素瘤(Melanoma,MEL)、黑色素细胞痣(Melanocytic nevus,NV)、基底细胞癌(Basal Cell Carcinoma,BCC)、光化性角化病(ActinicKeratosis,A K IEC)、良性角化病(Benign Kera

30、tosis,BKL)、皮肤纤维瘤(Dermatofi-孟585元等:基于特征类内紧凑性的不平衡医学图像分类方法第4期broma,D F)和血管病变(Vascular Lesion,VASC).以7:1:2 的比例将数据集图像分为训练集、验证集和测试集,并将图像由36 0 0 450 调整为32 8 2 8,示例图片如图7 所示.MELNVBCCAKIECBKLDFVASC图7DermaMNIST数据集的部分示例图片Fig7Partial examples of images of the DermaMNISTdatasetEyePacs是糖尿病视网膜病变(Diabetic Reti-nopat

31、hy,D R)分级任务中最大的公开数据集,被标记了属于五种可能的DR分级,范围从DRO(无DR)到DR4(增生性DR).该数据库包括约350 0 0个训练样本和550 0 0 个测试集样本,并使用10%的训练集图像作为验证集,如图8 所示DRODR1DR225810DR3DR452922443873708DRODR1DR2DR3DR4图:Eyepacs数据集的DR分级Fig.8DR grading of the EyePACS dataset3.2实验细节采用Pytorch框架,在NVIDIAGeForce2080 Ti GPU 48 GB RBM 的 Ubantul8服务器上训练.选用Tor

32、chvision24提供的结构用于对比和提取特征的卷积神经网络模型.依照数据集推荐的超参数设置,训练网络时Batch大小为2 56,最初学习率为0.0 1,使用Multistep策略调整,衰减学习率为0.1,epoch的最大训练值为100.选取交叉熵损失函数(Cross-EntropyLoss)和自适应矩估计(AdaptiveMomentEstimation,Adam)优化器,并加入样本类权重进行训练.3.3评价指标对于不平衡数据集的分类,准确率不能很好地反映一个分类算法的性能.本文选取了更适应不平衡数据集的评价指标一平衡准确度(Balanced Accuracy,Balanced ACC)和

33、加权精确度(Weighted-Precision,Weighted-P).BalancedACC本质上是召回率的算术平均值,它给予每个类以同样的重要性,可以更好地预测整个不平衡数据集 2 5-2 6,如式(9)所示:TP;C-1Balanced ACC=(9)i=0TP,+FN,Weighted-P是一种综合考虑各个类别样本数量和预测准确性的指标,其原理是将每个类别的精确度(Precision)和该类别在总样本中的比例相乘,然后求和 2 7,如式(10)所示:Weighted-P=TP,TP,+FN,(10)TP,+FP,2(TP,+FN,)i=1=1式(9)和式(10)中,C代表数据集的种类

34、数;TP代表真正类,即实际为正类且预测也为正的样本数;FN代表假负类,即实际为正类且预测为负类的样本数;FP为假正类,即实际为负类且预测为正类的样本数。3.4实验结果与分析斤为了验证ZC3NC的通用性和有效性,分别在DermaMNIST和EyePacs数据集上使用四类卷积神经网络ResNet18,ResNet5028,ResNeXt50201和GoogLeNet30进行测试,将本文方法与原模型结果进行比较。在DermaMNIST数据集上的对比实验结果如表2 所示,表中黑体字表示最优的性能.由表可见,ZC3NC的两个指标比未应用本方法的原模型都有提升,其中BalancedACC平均提升11.15

35、%,Weighted-P平均提升2.33%.图9 展示了在DermaMNIST数据集上训练的ResNet18模型倒数第二层提取的训练集和部586第59 卷南京大学学报(自然科学)表2在DermaMNIST数据集上的实验结果Table22Experimental results of different algorithmson the DermaMNIST dataset原模型原模型+ZC3NC模型BalancedBalancedWeighted-PWeighted-PACCACCResNet1856.51%74.64%64.46%76.46%ResNet5045.62%70.46%53.10

36、%72.39%ResNeXt5053.18%72.84%57.30%75.77%GoogLeNet61.98%77.71%67.36%77.90%Avg54.32%73.91%60.56%75.63%分测试集特征的二维表示,其中圆点代表训练集特征图,三角代表测试集中原模型未成功分类而ZC3NC成功分类的特征图.由图可见,部分三角距离其他类的绝对距离更近但仍被ZC3NC方法成功分类。在EyePacs数据集上的对比实验结果如表3所示,表中黑体字表示最优的性能.应用本文方法的BalancedACC均大于原模型,只在VASCDFBKLAKIECBCCNV-MEL图9训练集和部分测试集特征的二维表示Fi

37、g9Two-dimensional representation of training setandpartial testsetfeaturesGoogLeNet模型上Weighted-P稍低,但差距很小.平均来说,和原模型相比,应用ZC3NC的BalancedACC提升7.0 2%,Weighted-P提升0.16%.表3在EyePacs数据集上的实验结果Table33Experimental results of different algorithmsontheEyePacsdataset原模型原模型+ZC3NC模型BalancedBalancedWeighted-PWeighted

38、-PACCACCResNet1847.19%72.48%51.11%72.54%ResNet5047.70%73.65%51.92%73.94%ResNeXt5048.19%73.93%52.34%74.39%GoogLeNet48.46%72.57%49.63%72.22%Avg47.89%73.16%51.25%73.27%在DermaMNIST和EyePacs数据集上,分别与经典处理高度不平衡数据集的方法SMOTE(Synthetic Minority Oversampling Technique)a1,K-MeansSMOTE(K M SM O T E)32 和目前最先进的处理高度不平

39、衡数据集的集成学习方法Un-der-Bagging KNN(U b K NN)3进行对比实验.UbKNN利用Bagging结合欠采样技术生成平衡数据集,并使用KNN算法进行分类,从理论和实验两方面验证了ZC3NC的BalancedACC的优势,对比实验结果如表4和表5所示,表中黑体字表示最优的性能.由表可见,ZC3NC的BalancedACC和Weighted-P两个指标在所有卷积神经网络模型上都稍优于上述三种方法.图10 和图11展示了DermaMNIST和Eye-Pacs数据集上,上述各种方法在四类卷积神经网络中的平均表现,图中黑体字表示最优的性能。表4各算法在DermaMNIST数据集上

40、的对比实验结果Table44 Experimental results of different algorithms on the DermaMNIST datasetSMOTEKMSMOTEUbKNNZC3NC模型Balanced ACCWeighted-PBalanced ACCWeighted-PBalanced ACcWeighted-PBalanced ACCWeighted-PResNet1860.65%73.25%59.00%74.92%64.07%76.12%64.46%76.46%ResNet5049.87%71.89%47.15%70.71%52.94%72.16%53.

41、10%72.39%ResNeXt5055.34%73.35%52.60%72.35%57.05%73.84%57.30%75.77%GoogLeNet64.75%76.92%66.57%77.59%66.91%76.62%67.36%77.90%Avg57.66%74.35%56.33%73.89%60.24%74.69%60.56%75.63%587孟元等:基于特征类内紧凑性的不平衡医学图像分类方法第4期表5各各算法在EyePacs数据集上的对比实验结果Table 5Experimental results of different algorithms on the EyePacs dat

42、asetSMOTEKMSMOTEUbKNNZC3NC模型Balanced ACCWeighted-PBalancedACCWeighted-PBalanced ACCWeighted-PBalanced ACCWeighted-PResNet1846.54%70.77%48.09%72.26%48.77%71.05%51.11%72.54%ResNet5046.02%73.91%46.66%73.01%48.83%72.52%51.92%73.94%ResNeXt5047.46%74.28%49.72%74.35%48.19%72.78%52.34%74.39%GoogLeNet47.38%7

43、0.00%46.89%70.34%49.05%71.41%49.63%72.22%Avg46.85%72.24%47.89%72.49%48.71%71.94%51.25%73.27%80.00%73.91%74.35%73.89%74.69%75.63%70.00%57.66%56.33%60.24%60.56%60.00%54.32%50.00%40.00%30.00%20.00%10.00%0.00%BalancedAccWeighted-P原模型SMOTEKMSMOTEUbKNNZC3NC图10各算法在DermaMNIST数据集上对比实验的平均结果Fig.10Average exper

44、imental results of different algo-ermaMNisTdataset80.00%73.16%72.24%72.49%71.94%73.27%70.00%60.00%51.25%50.00%47.98%46.85%47.89%48.71%40.00%30.00%20.00%10.00%0.00%BalancedAccWeighted-P温原模型SMOTEKMSMOTEUbKNNZC3NC图11各算法在EyePacs数据集上对比实验的平均结果Fig.11Average experimental results of different algo-rithms ont

45、he EyePacs dataset综上,ZC3NC方法有效提升了各类卷积神经网络在不平衡医学图像数据集上的分类性能,与经典不平衡分类方法以及最先进的方法相比,均表现相近或有一定优势,证明本文方法是一种有效的改进算法,适用于多种卷积神经网络。4结论本文针对卷积神经网络面对不平衡医学图像数据集的分类困难,提出一种基于特征类内紧凑性的不平衡医学图像分类方法ZC3NC,通过比较测试集特征图和不同类训练集特征图的实际偏离程度进行分类,达到了较好的分类效果,并在多个卷积神经网络和数据集中进行了验证.未来将在比较特征类内紧凑性的同时,结合类间松散度进一步提升方法性能,并进一步探索特征空间信息,使其能适应平

46、衡样本分类任务。参考文献1(Chen X X,Wang X M,Zhang K,et al.Recentadvances and clinical applications of deep learning inmedical image analysis.Medical Image Analysis,2022(79):102444.2郑光远,刘峡壁,韩光辉.医学影像计算机辅助检测与诊断系统综述.软件学报,2 0 18,2 9(5):147 1一1514.(Zheng G Y,Liu X B,Han G H.Survey onmedical image computer aided detec

47、tion and diagno-sis systems.Journal of Software,2018,29(5):1471-1514.)3Cai L,Gao J Y,Zhao D.A review of the applicationof deep learning in medical image classification andsegmentation.Annals of Translational Medicine,2020,8(11):713.4Singh R,Bharti V,Purohit V,et al.MetaMed:Few-shot medical image cla

48、ssification using gradient-based meta-learning.Pattern Recognition,2021(120):108111.5Yang J C,Shi R,Wei D L,et al.MedMNIST v2:Alarge-scale lightweight benchmark for 2D and 3Dbiomedical image classification.Scientific Data,2023,10(1):41.6Quellec G,Lamard M,Conze P H,et al.Automaticdetection of rare p

49、athologies in fundus photographs588第59 卷南京大学学报(自然科学)using few-shot learning.Medical Image Analysis,2020(1):101660.7Batista G E A P A,Prati R C,Monard M C.A studyof the behavior of several methods for balancingmachine learning training data.ACM SIGKDDExplorations Newsletter,2004,6(1):20-29.8Hassan A

50、R,Haque M A.An expert system forautomated identification of obstructive sleep apneafrom single-lead ECG using random under samplingboosting.Neurocomputing,2017(235):122-130.9Xu Z Z,Shen D R,Nie T Z,et al.A hybrid samplingalgorithm combining M-SMOTE and ENN based onrandom forest for medical imbalance

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服