收藏 分销(赏)

小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法.pdf

上传人:自信****多点 文档编号:3813785 上传时间:2024-07-20 格式:PDF 页数:11 大小:5.56MB
下载 相关 举报
小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法.pdf_第1页
第1页 / 共11页
小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法.pdf_第2页
第2页 / 共11页
小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第14卷第3期2024年3 月doi:10.3969/j.issn.2095-1744.2024.03.014有色金属工程Nonferrous Metals EngineeringVol.14,No.3March2024小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法王文1.2,何剑锋1.2.3,朱文松1.2 李卫东1.3,聂逢君1.3,夏汪雪元1.2.3,钟国韵1.2.3瞿金辉1.3(1.东华理工大学江西省核地学数据科学与系统工程技术研究中心,南昌330 0 13;2.东华理工大学信息工程学院,南昌330 0 13;3.东华理工大学江西省放射性地学大数据技术工程实验室,南昌330

2、0 13)摘要:针对工业领域利用深度学习模型对矿石进行在线分类时,矿石样本稀少导致的模型过拟合、分类准确率低的问题,提出一种结合X射线透射成像技术的矿石数据增强分类方法。该方法基于改进辅助生成对抗网络(Enhance-based ClassificationACGAN-gP,EC-A C G A N-g p),采用卷积和连续残差块构建判别器和生成器,引人注意力机制捕捉矿石细节特征,生成高质量样本扩充原始数据集,同时使用带梯度惩罚的Wasserstein距离重构判别器的损失函数提高对抗训练的稳定性,避免模式崩溃。通过增加辅助分类器重建样本标签信息,最终实现矿石样本的类别预测。结果表明,该方法能实

3、现矿石品位分类的精准预测,准确率可达8 9.6 2%,比现有传统方法提高3.98%。该模型生成的矿石样本泛化性良好,能够显著提高小样本数据集的泛化性,在SVM、LeNet5、VG G Ne t、R e s Ne t 上测试,精度分别提升了2.8 3%、2.36%、1.8 9%和3.7 4%,可进一步用于提升其他分类模型在矿石品位预测方面的性能。关键词:矿石分类;小样本;数据增强;辅助生成对抗网络;X射线成像;自注意力机制中图分类号:TD921;TP183X-ray Ore Image Classification Method Based on Improved ACGAN复菲1.3,文献标志

4、码:A文章编号:2 0 95-17 44(2 0 2 4)0 3-0 12 2-11Data Augmentation in Small SamplesWANG Wenl*,HE Jianfeng.23,ZHU Wensong*,LI Weidong.,NIE Fengjunls,XIA Feil-3,WANG Xueyuan-2.3,ZHONG Guoyunl-2.3,QU Jinhuil.3(1.Jiangxi Engineering Technology Research Center of Nuclear Geoscience Data Science and System,East

5、ChinaUniversity of Technology,Nanchang 330013,China;2.Information Engineering College,East China University of Technology,Nanchang 330013,China;3.Jiangxi Engineering Laboratory on Radioactive Geoscience and Big Data Technology,East China University of Technology,Nanchang 330013,China)收稿日期:2 0 2 3-0

6、8-30基金项目:国家自然科学基金资助项目(118 6 5 0 0 2,U2067202);江西省主要学科学术和技术带头人培养计划(2 0 2 2 5 BCJ22004);江西省重点研发计划(2 0 2 0 3BBG73069)Fund:Supported by the National Natural Science Foundation of China(11865002,U2067202);Training Program for Academic and TechnicalLeaders in Major Disciplines in Jiangxi Province(20225BCJ

7、22004);Key Research and Development Program of Jiangxi Province(20203BBG73069)作者简介:王文(1999一),硕士研究生,主要研究方向:双能X射线透射识别研究、计算机视觉。通信作者:何剑锋(197 7 一),博士,教授,主要研究方向:核数据采集与信号处理、嵌人式系统应用开发。引用格式:王文,何剑锋,朱文松,等,小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法J.有色金属工程,2 0 2 414(3):12 2-132.WANG Wen,HE Jianfeng,ZHU Wensong,et al.X-ray O

8、re Image Classification Method Based on Improved ACGAN Data Augmentation inSmall SamplesJJ.Nonferrous Metals Engineering,2024,14(3):122-132.第3期Abstract:Aiming at the problems of overfitting and low classification accuracy due to the scarcity of ore samplesin industrial applications of deep learning

9、models for online ore classification,a method combining X-ray transmissionimaging technology for ore data augmentation and classification is proposed.The method is based on an improvedauxiliary classifier generative adversarial network(Enhance-based Classification ACGAN-gp,EC-ACGAN-gp),whichuses con

10、volutional and continuous residual blocks to construct the network structures of the discriminator andgenerator.An attention mechanism is introduced to capture detailed ore features and generate high-quality samples toexpand the original dataset.Simultaneously,the Wasserstein distance function with

11、gradient penalty is used toreconstruct the classification loss function,achieving improved stability of adversarial training and avoiding modecollapse.Finally,an auxiliary classifier is utilized to reconstruct label information for ore sample categoryprediction.The research results show that the pro

12、posed method can accurately predict the ore grade classification,with an accuracy of up to 89.62%,which is 3.98%higher than traditional methods.The model-generated oresamples demonstrate good generalization performance,significantly improving the generalization of small sampledatasets.When tested on

13、 SVM,LeNet5,VGGNet,and ResNet,the accuracy is increased by 2.83%,2.36%,1.89%,and 3.74%,respectively.This method can further be used to enhance the performance of other classification modelsin ore grade prediction.Key words:ore classification;small-sample;data augmentation;ACGAN;X-ray imaging;self-at

14、tention矿石分类技术对于提高矿石的利用率和推动国民经济可持续发展具有重要作用。目前市场上传统的磁选、重选、浮选、化选等矿石分选方法均存在成本高,污染大,精度低,稳定性差以及受环境制约等问题1。因此,研发高效的矿石分类技术对资源的充分回收利用具有重要的工业意义。随着人工智能不断融人采矿行业,结合机器学习的矿石在线分类技术在工业上已得到广泛应用,为我国绿色矿山和生态矿山建设供了重要支撑2 。当前大多数基于机器学习的选矿方法大致可分为两类:基于传统图像分析方法和基于深度学习的方法。传统方法需要根据具体任务人工筛选特征,再通过图像分析实现矿石分类。PATEL等3 提出一种支持向量机(SVM)算法

15、,分析并提取铁矿石的特征进行分类。夏桐等4 对矿石拉曼光谱数据归一化、强度曲率预处理后,利用SVM模型进行分类。杨彦伟等5 提出将激光诱导击穿光谱技术(LIBS)与机器学习相结合,通过设定阈值选定矿石光谱特征,对10 种铁矿石进行分类。以上机器学习算法虽能实现矿石的自动分类,但人工筛选特征的主观性强、预处理过程复杂、计算效率低、耗时久。相比之下,深度学习能够通过自动学习图像特征排除非线性因素的影响,使得网络分类精度更高。王李管等使用卷积神经网络进行迁移学习,对黑钨矿石与围岩废石进行识别分类。王杉等7 提出一种基于知识蒸馏理论的 LeNet-ResNet18网络模型,对 4万张铅锌矿石样本进行训

16、练和分类。虽然上述方法均获得了较高的准确率,但仍存在两类问题。一是王文等:小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法123以上数据集仅获取矿物表层特征信息对不同品种的矿石进行分类,并未对同种矿石的品位进行深入识别。二是深度卷积网络需要大量标签样本才能取得理想的训练效果。然而在工业领域中,矿石的实地采集存在困难,通常难以获取足够规模的标签样本,导致网络在训练时易陷人过拟合,模型分类效果不理想。为解决样本不足的问题,一般采用数据增强的方法来扩充数据集。目前深度学习领域常见的数据增强方法包括几何变换、添加噪声、信号平移等,但以上传统方法只能在已有原始样本的基础上增加样本数量,而无法使

17、数据集产生新的语义信息和有效特征,对模型分类性能的提升有限。相比之下,生成对抗网络(Generative Adversarial Nets,GAN)8 能克服传统方法样本变化范围不足、结构趋同的缺点,生成符合真实数据分布特征的新数据,从而帮助模型提升训练效果。文献9-12 分别采用CGAN(Conditional Generative Adversarial Networks)和WGAN(WassersteinGAN)生成指定类别的新样本扩充数据集,并证实该方法对模型分类精度的提升超过了传统数据增强方法。唐贤伦等13 在深度卷积GAN14I的基础上添加条件约束,使之可生成指定类别的图像,并证实

18、其判别器用于图像分类的准确率明显超过深度卷积网络。由上述可知,通过GAN生成新数据的方法可以从根本上打破原始样本不足的限制,显著提高数据集的泛化性和多样性,从而缓解模型过拟合导致的分类效果差。但目前的GAN模型普遍存在训练不稳定、难收敛、生成图像124质量差等问题15 ,如何正确引入约束条件,指导生成高质量图像是提高模型性能的关键。基于此,本文提出一种小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法(Enhance-basedClassification ACGAN-gp,EC-ACGAN-gp),主要工作如下:1)利用X射线透射矿石的内部信息,建立X射线成像的矿石数据集;2)对原始

19、ACGAN网络结构进行改进,采用多个连续残差增加网络深度,提取图像深层特征,引人自注意力机制捕捉图像精细特征,利用条件信息指导生成器生成高质量样本扩充训练集;3)引入带惩罚梯度的Wasserstein距离重构判别器的损失函数,提高训练稳定性;4)利用辅助分类器重建标签信息,实现对矿石品位的良好预测。实验表明,本文模型生成矿石样本质量更优,将其扩充训练集,可获得比传统数据增强方法更高的分类精度,对解决对解决矿石标签样本匮乏的问题具有一定的参考意义,可进一步为工业领域在线选矿提供技术支持。1相关原理1.1ACGAN模型生成对抗网络(GAN)是由生成器和判别器构成的深度学习模型。GAN的工作原理如下

20、:首先,生成器接收一个随机噪声向量z作为输入,并生成新样本。判别器接收真实样本和生成样本,判断其是否为真实样本,并把判别结果反馈给生成器。二者通过对抗训练的方式迭代优化,更新参数,最终达到纳什均衡。GAN核心原理的算法描述如式(1)所示:Label c有色金属工程min maxb V(D,G)=E-Pa(,lnD(a)+ExP,(c)ln(1-D(G(z)该公式的目标是使生成器生成尽可能符合真实样本分布的数据样本,同时,判别器则能够准确区分真实样本和生成样本。式中G、D 分别表示生成器和判别器,V(D,G)表示G与D的差异值,EPdata(r)表示数学期望,表示真实样本,z表示随机噪声,G(z

21、)表示生成样本,D(G(z))表示判别器判断输人样本为真实样本的概率。Pdataa)和Pz()分别表示真实样本和生成样本的分布。在对抗训练的过程中,生成器试图最小化判别器的判别准确率,同时判别器试图最大化其判别准确率。当D()无限趋近1,此时V(D,G)变大,当V(D,G)取到极大极小值时,该模型达到最优。通常使用一些定量指标来评估生成样本的质量。例如,像素级别的评价指标(如 SSIM,PSNR)或者模型性能指标(如 Accuracy、L o s s)来衡量生成样本与真实样本的相似度。传统GAN存在训练困难和不稳定的问题,而且每生成一种类别的图像都需要训练一个独立的生成模型,这会增加工作量和计

22、算复杂度。ACGANL16是GAN的一种变体,如图1所示。它在原始GAN的基础上增加类别信息标签,通过c指导生成器G生成指定类别的样本17。同时,在判别器D中引人辅助分类器,对输人判别器D的样本进行辅助分类。这样,判别器D不仅可以判断输人样本的真假(真实样本或生成样本),还可以对每个样本进行准确的类别预测。生成器G则可以同时生成多类别的指定图像。RealimageGeneratedGeneratorimage第14卷(1)TrueFakeDiscriminatorC2:cnNoise:z图1ACGAN流程图Fig.1ACGAN flow chart第3期ACGAN的目标函数由两部分组成,分别为

23、判别器判别样本真假的损失L。和辅助分类器预测样本类别的损失Lc,定义公式如式(2)、(3):L,=ElogP(S=real Xrea)+ElogP(S=fake|Xfake)L。=Elo g P(C=c X r e a i)+ElogP(C=c|Xfake)其中,S代表样本的真假标签(real表示真实的样本,fake表示伪造的样本),C代表样本的类别标签。X_real代表真实样本的输人,X_fake代表生成样本的输人。在对抗博奔的过程中,判别器和生成器通过最大化各自的损失函数L十L和L一Ls来调整参数,以使二者达到纳什均衡状态。1.2自注意力机制自注意力机制18 (self-attention

24、mechanism)是Transformer中用于处理序列数据的核心机制。相比卷积网络,它无需依赖于局部感受野和固定的池化操作,能直接捕捉全局上下文信息,在自然语言处理任务中展现出良好的效果,并在计算机视觉、图像分类任务中广泛使用。王文等:小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法机制的计算过程如式(4)所示:Attention(Q,K,V)=softmax式中,dk为键矩阵K的维数,softmaa为softma函数。首先,由查询矩阵Q和键矩阵K的转置点积计算相似性,得到权重得分再对权Vd重进行softma归一化,得到特征权值矩阵,将其与值矩阵V进行加权运算,最后得到注意力输出

25、序列值H。125为提高网络对X射线灰度图像的识别能力,本文模型在生成网络和判别网络中分别引人自注意力机制,通过对图像不同位置间的关系进行显式建模,计算各通道的注意力权重,使网络在训练时可根据(2)权重大小对图像各区域分配不同的计算资源和关注度。其网络结构如图2 所示,输人通道数为C的特(3)征图X,将X投影到三个参数矩阵W。、W和W上,通过矩阵点乘的方式计算出查询矩阵Q、键矩阵K和值矩阵V之间的注意力权重,从而提高网络对重要特征的关注程度,并抑制无用信息自注意力(4)QKTQKW.1D1N1N一N1一1WD一!12基于改进ACGAN的矿石数据增强分类模型2.1整体网络结构ACGAN虽然能生成多

26、样性的图像,但考虑到X射线透射下成像的矿石图像噪声较多、图像模糊且缺乏纹理信息,而原始ACGAN中单一卷积和上采样容易导致生成样本质量低。KOsoftmaxoDD1X1WD图2 自注意力机制结构图Fig.2 Structure diagram of Self-Attention Mechanism为此,本文以ACGAN为主干网络,提出一种基于改进ACGAN的矿石图像数据增强分类模型EC-ACGAN-gp(En h a n c e-b a s e d C la s s i f i c a t i o nACGAN-gp,EC-ACGAN-gp),主要由生成器网络和判别器网络两部分构成,在网络结构

27、上具体做了如下改进:1)生成器中采用多个连续卷积进行特征图的变换和上下采样操作,使内容损失最小化,确保生成样DKHQ:Query matrix;K:Key matrix;V:Value matrixT:Transposition;softmaxO:softmax functionV126本与原始样本的相似性。2)为了控制生成精矿和尾矿的灰度细节,更好地提取矿石图像的深层特征,在生成器中融入自注意力机制捕捉长距离依赖,使生成矿石样本具有更好的纹理特征和多样性。3)设计残差卷积结构19,利用残差块中不同层Label:c+FCClass labelBNLeakyReluResidualConvCon

28、vx3BNLeakyReluConvSelf-Att layerBNLeakyReluResidualConvConvx2BNLeakyReluConvConvTanh(a)GeneratorFig.3 The network architecture of EC-ACGAN-gp2.2生成器网络结构生成器结构如图3(a)所示。在生成器中,先将均匀分布的10 0 维噪声向量z和标签向量c连接后得到(12 8,10 0)的输人数据,在全连接层对连接后的向量进行全连接,得到形状为(12 8,2 5 6,4,4)的张量,再经过3个残差模块,通过连续上采样将张量的尺寸依次扩大成(12 8,2 5 6,

29、8,8)、(12 8,2 5 6,16,16)、(12 8,2 5 6,32,32)的四维张量,并引人残差连接;然后经过1个自注意力模块和2 个残差块,并经过reshape后依次变为(12 8,12 8,32,32)、(12 8,6 46 4,6 4)、(12 8,32,12 8,12 8),最后输出层通过步幅为1的3X 3卷积层,和 Tanh激活函数将输出特征图转化为形状为(12 8 3,12 8,12 8)的生成图像。生成器生有色金属工程的跳跃连接传播梯度信息,提高生成样本的清晰度,提高训练过程的稳定性。4)引人带梯度惩罚的Wasserstein距离重构判别器的分类损失函数,使梯度信息能够

30、稳定反馈至生成器,提高训练稳定性。整体网络结构如图3所示。Noise:zReal.orfakeThenetworkarchitecture ofEC-ACGAN-gpReal imageGenerated image图3EC-ACGAN-gp网络模型结构成的矿石样本数据放人原始训练集进行数据扩充,并按比例均衡矿石样本,得到数据增强后的训练集,与X射线下真实的矿石样本一同送人到判别器D中进行真假判断并分类。2.3判别器网络结构判别器由连续卷积和残差块构成,采用自注意力机制突出重点区域并抑制噪声。同时,引人辅助分类器对矿石样本的真实性和品位进行协同分类。图3(b)展示了判别器的网络结构。首先,将张

31、量为(12 8,3,12 8,12 8)的生成矿石样本和真实样本一起输人判别器中,经过1个卷积核大小为4X4步幅为2 的卷积层,得到形状为(12 8,32,6 4,6 4)的特征图,再经过两个残差块进行第14卷FCPooling layerConvBNLeakyReluConvBNSelf-Att layerConvBNLeakyReluConvBNConv(b)DiscriminatorResidualConv x2ResidualConvx2第3期连续下采样,减小特征图尺寸,依次变为(12 8,6 4,32,32)、(12 8,12 8,16,16),经过注意力层后图像维度不变,后再经过2

32、 个残差块进行下采样,进一步缩小图像尺寸为(12 8,2 5 6,8,8)、(12 8,2 5 6,4,4)。接下来,对特征图进行自适应平均池化,将其转化为(12 8,2 5 6)的向量,经过全连接层得到形状为(12 8,2)的张量。最后,通过sigmoid 函数映射得到不同类别的概率值,实现对矿石品级的良好预测,并通过测试集验证算法的有效性。2.4损失函数优化尽管ACGAN引人了辅助分类器,但它仍存在传统GAN的缺点,即在训练过程中使用JS散度来衡量生成样本和真实样本之间的分布差异。由于JS散度的离散性容易导致梯度消失,模型往往难以稳定训练和收敛。为了缓解网络层数加深时出现的模型过拟合问题E

33、C-ACGAN-gp模型在真假分类损失函数上采用Wasserstein201距离代替JS散度,给生成器提供更好的梯度信息去学习潜在的矿石数据分布,缓解梯度消失。同时,引人梯度惩罚2 1 替代权重裁剪,通过限制判别器D对输人矿石样本的梯度大小,使判别器更加平滑地对矿石样本进行分类,避免梯度爆炸,并提高GAN的训练稳定性和生成矿石样本的质量。梯度惩罚项Lgp和总体损失函数L如式(5)、(6)所示。Lgp=EP(V,D()2-1)L=ErPaaD()-Ep,D(G(z)-Lp(6)式(5)为梯度惩罚项,主要用于限制判别器对生成数据的敏感度,使其在梯度下降过程中不会过于迅速地掌握生成样本的特征,从而保

34、持生成器和判别器的动态平衡。其中=(,十(1一)g,,和g分别为真实样本和生成样本间的线性插值。VD()l2 表示判别器对于样本的梯度L2范数。L为总损失函数,它由三部分组成。第一部分是ErPdataD(),表示判别器对真实样本输出的期望。这部分的目标是最大化判别器对真实样本的判别能力。第二部分是EPD(G(),表示判别器对生成数据进行判别的期望。这部分的目标是王文等:小样本下基于改进ACGAN数据增强的X射线矿石图像分类方法127最小化判别器对生成样本的判别能力。第三部分入L表示梯度惩罚项的损失函数,入表示用于控制梯度惩罚的超参数,入Lp为通过超参数入来控制梯度惩罚的程度。这部分的目标是平衡

35、生成器和判别器的训练过程。公式的整体目标是最小化总损失函数,使生成器生成更真实的矿石样本,同时最大化判别器的判别能力。3数据预处理及模型训练由于GAN网络具有对抗博奔的思想,生成器网络和判别器网络在交替训练的过程中,二者性能会相互促进。当网络达到纳什均衡状态时,生成器可拟合真实样本分布,判别器可获得准确的判别能力。本文充分利用GAN网络这一性质,通过生成器生成矿石样本扩充数据集,同时,利用判别器网络提取样本特征,用于矿石的分类预测。主要工作如下:1)介绍实验所用的X射线透射成像铅锌矿石数据集;2)验证模型的训练最终达到理想状态,即纳什均衡;3)验证所提模型的判别器网络可作为分类器,对矿石品位进

36、行预测。整体网络模型在Python的框架下搭建,集成开发环境为Pycharm。3.1X射线透射成像的矿石图像数据集由于工业选矿领域目前暂无公开的统一标准的矿石数据集,本文实验数据集采用的是自建X射线(5)透射成像的铅锌矿石图像。X射线透射矿石成像是一种非破坏性的矿石分析检测技术,它利用X射线穿过物质时的吸收和散射特性,对矿石样品进行成像分析。X射线透射矿石后,由于金属矿石与废石在原子序数、密度、结构等性质上存在较大差异,所以二者对X射线的吸收程度有明显差异。相较于废石,铅锌矿更难以被射线穿透,成像颜色呈深黑,而废石容易穿透,成像颜色呈浅灰。如图4、5 所示为精矿和尾矿经X射线透射后的图像,可以

37、看出,二者有较为明显的特征差异,可用于构建深度学习的矿石图像数据集。原始数据集共包含10 5 2 张样本图像,在深度学习中属于小样本数据集。其中精矿为正样本,尾矿为负样本。实验按8:2 划分训练集及验证集,具体划分情况如表1所示。-Loss of generator128Table 1NNumber and ratio of training and testing ofX-ray ore imageOregradeTrainingsamplesMine496Waste344Total8403.2模型训练与参数设置在整个训练过程中,判别器D和生成器G采取交替对抗的训练方式,总共分为两阶段:1)

38、训练判别器。当判别器接收到真实矿石样本输人后,最大化输出的判别概率;当接收到生成器生成矿石样本数据,最小化自身判别概率。即判别器的目标是使自身判别能力达到最优。2)训练生成器。固定判别器的参数,将判别结果输入生成器,指导生成器不断优化生成矿石样本的有色金属工程质量,直到能够“骗过”判别器,更新生成器的参数。通过重复以上动态博奔的过程,生成器和判别器相互竞争并相互提升。最终,判别器不断提高对样本的判别能力,生成器则生成质量更高的样本,使判别器难以辨别,直至二者达到纳什均衡状态。模型整体采用Adam模型优化损失函数,它易于实现,适用于稀疏梯度,内存开销小,且计算效率高。判别器和生成器的学习率均设为

39、2 e一4,batch_size设置为12 8,epoch设置为2 0 0。其中,输出层采用Tanh激活函数来减少噪声的干扰,其他层采用LeakyRule激活函数,以提供更快的计算速度收敛。每经过一层卷积都进行批归一化(Batch图4精矿Normalization),由于最大池化会保留噪声并丢失Fig.4Mine图5 尾矿Fig.5Waste表1X射线矿石图像数据样本比例划分Testsamples12587212第14卷特征。所以在分类器的池化层中使用平均池化来平滑噪声信息。自注意力模块中使用gamma函数来学习参数,控制自注意力的比例,通过输出层Sigmoid激活函数映射得到分类预测结果。如

40、图6 损失函数的变化可知,随着网络次数迭代,EC-ACGAN-gp的生成器和判别器呈相互对抗的趋势,最后损失值围绕1.0 5 附近发生波动,证明训练没有发散,模型达到纳什均衡。一般认为此时判别器与生成器的能力均达到理想状态,生成器能够生成高质量样本,而判别器能够准确区分样本。1.6Loss of disriminator1.4FNash eouilibra1.2F1.00.8F0.6Total62143110520.4Fig.6Graph of the loss function value change3.3模型性能评估3.3.1评价指标本文实验分别采用准确率(Accuracy)、精确率(P

41、r e c i s i o n)、召回率(Recall)、特异性(Specificity)和F1分数(F1 Score)作为评价各模型性能和数据增强方法的指标。其中,Accuracy为预测真实值占总真实值的比例。Fl是准确率(Precision)和召回率(Recall)的调和平均。Precision(精确率)衡量的是0图6 损失函数值变化图50100Epoch150200第3期模型对正例预测的准确性。Recall(召回率)是指在所有实际为正例的样本中,模型正确预测为正例的比例。F1 score将准确率和召回率结合在一起,以综合评估模型的性能,F1的取值范围为0 到1,越接近1表示模型性能越好。

42、3.3.2与其他分类网络对比为了验证文章所提模型的整体优越性,将该模ModelsAccuracySVM67.92LeNet573.11LeNet5rotation75.94Resnet78.45ResnetLrotation80.66EC-ACGAN-gP81.60从表2 可知,SVM分类的准确率最低,这是由于X射线矿石图像为灰度图像,较为模糊,缺少纹理特征,而 SVM对数据集的分布和特征之间的关系较敏感,导致在分类灰度图像上的准确率较低。相比不做数据增强的方法,旋转处理后的数据集在LeNet-5和Resnet上测试的准确率均有所提升,说明传统数据增强方法在一定程度上可以提升识别效果。而本文E

43、C-ACGAN-gp判别器的分类准确率达到了8 1.6 0%,且在无数据扩充的情况下,精确率、召回率、特异性和F1得分均超过了上述方法。这是因为与传统深度网络相比,EC-ACGAN-gp模型在对抗训练的过程中,生成器能够拟合真实样本的数据分布,而判别器在分类时可以从更高维度理解样本的分布规律,从而做出更精准的判断。由图7 的结果可知,本模型收敛速度最快,且80F700605040300图7测试集在不同模型上的准确率对比Fig.7Comparison chart of accuracy on testset across different models王、文等:小样本下基于改进ACGAN数据增

44、强的X射线矿石图像分类方法Table 2 Performance comparison of different modelsSpecificity0.690.800.750.810.780.830.790.850.810.860.820.88在初始时就取得了比其他模型更高的准确率。这一结果证明,以GAN的对抗博奔来迭代优化网络可以达到数据增强的目的,且效果要好于传统的数据预处理,证实该模型用于矿石图像分类具有可行性。4结果与讨论4.1数据增强方法对比由于本文主要研究的是小样本下对于矿石品位最优的数据增强方法,故将实验重点聚焦于不同数据增强方法对模型分类性能的改善,以证明本数据增强方法的优越性

45、与泛用性。实验设置5 个对照组,1为原始数据集,2 为传统数据增强方式扩充后的数据集,3为CGAN均衡后的扩充数据集,4为ACGAN扩充均衡后的数据集,5 为EC-ACGAN-gP扩充均衡后的数据集,此外,再增加传统数据增强十EC-ACGAN-gP扩充的数据集6。6 个数据集均采用EC-ACGAN-gp判别器作为分类器进行分类。其中CGAN、A C G A N和EC-ACGAN-gp的判别器内部结构均相同。几种数据增强方法的效果如表3所示。表3实验数据表明,采用GAN和传统几何变换进行数据增强的方法均能提升模型分类效果。其中,本文所提EC-ACGAN-gp模型对矿石的分类准SVM确率达到了8

46、8.2 0%,在Precision、R e c a ll、LeNet rotationResnet rotationEC-ACGAN-gP510Epoch129型的判别器网络用于矿石样本的分类任务,分别与SVM、L e Ne t 5、R e s n e t 的分类结果做对照试验(表2),其中LeNet-5 的网络结构与 EC-ACGAN-gp判别器相似,Resnet网络结构与本文判别器完全一致。其中LeNet5rotation和Resnetrotation为将数据集进行旋转处理达到数据增强目的,EC-ACGAN-gp则不做数据增强处理。表2 不同模型的性能对比PrecisionRecallSp

47、ecificity和F1这四类指标上,也明显超过传统数据增强方法。这表明在样本缺乏的情况下,本模型1520Fl Score0.490.740.610.780.650.800.680.820.720.840.720.852530生成的样本能够更好地训练分类器,有效解决样本数据缺乏时模型分类准确率低的问题。当同时采用EC-ACGAN-gp和传统几何变换进行数据扩充时,模型性能可进一步得到提升。130有色金属工程第14卷表3不同数据增强方法的分类效果Table3Classification effects of different data augmentation methodsNumberAcc

48、uracy181.60284.31384.90485.34588.20689.624.2生成样本质量评估图8 为不同的GAN模型生成的精矿和尾矿图像,第一行为真实矿石样本图像,接下来每一行分别表示CGAN,ACGAN与EC-ACGAN-gP方法生成的图像;(a)列为尾矿,(b)列为精矿。可以看出,CGAN生成的矿石样本较为模糊,与真实样本的相Precision0.850.860.750.770.800.83Recall0.740.770.870.860.900.91似度较低,ACGAN生成的图像已经初具轮廓,但是边缘特征不够清晰,如红色记号标注之处均存在程度不一的伪影。而在相同参数设置和网络结

49、构下,EC-ACGAN-gP生成的矿石图像的特征与原始图像更为接近,细节清晰。说明该模型的生成能力更为优越,能够稳定生成较高质量的矿石样本。Specificity0.880.900.840.850.870.89F1score0.790.810.800.810.850.87Real samplesGenerated samples byCGANGenerated samples by ACGANGenerated samples by EC-ACGAN-gp(a)Waste图8 不同方法生成的矿石图像Fig.8X-ray images of ore generated by different

50、methods(b)Mine第3期为了更客观地评估EC-ACGAN-gP生成矿石样本的质量,分别将CGAN、A C G A N、与本文模型生成的矿石样本扩充训练集,在四种经典的识别网络上进行训练和测试,实验结果如图9 所示。其中Baseline表示不使用任何数据增强方法扩充数据,仅使用原始训练集训练模型。100BaselineCGANACGAN80EC-ACGAN-P70.7573.1174:0674.5375-4767.9266.0368.560%/0oV40200Fig.9 Classification accuracy across different models由图9结果可知,在SV

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服