收藏 分销(赏)

基于NS-StyleGAN2的鱼类图像扩充方法_李海涛.pdf

上传人:自信****多点 文档编号:244890 上传时间:2023-05-06 格式:PDF 页数:6 大小:2.66MB
下载 相关 举报
基于NS-StyleGAN2的鱼类图像扩充方法_李海涛.pdf_第1页
第1页 / 共6页
基于NS-StyleGAN2的鱼类图像扩充方法_李海涛.pdf_第2页
第2页 / 共6页
基于NS-StyleGAN2的鱼类图像扩充方法_李海涛.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、计算机与现代化JISUANJI YU XIANDAIHUA2023年第1期总第329期0引 言随着人工神经网络的不断发展,深度学习这一人工智能重要领域有了更好的前景,其中图像识别与分类已经有了广泛的应用,包括人脸识别、停车场车牌识别、医疗图像分析、安防监控等1。但是当深度学习逐渐扩展到更多行业中时,其局限性也慢慢暴露出来:数据的不足会使深度学习与其他传统方法相比没有优势,甚至达不到其他传统方法取得的效果。这一局限性在图像识别与分类中,具体表现为数据集质量参差不齐、数据多样性不足、数据集类别不平衡等问题2。其中数据集类别不平衡问题较为常见且影响较大,表现为数据集中某几类样本的数据量较多,而另外几

2、类样本的数据量较少,若人工神经网络采用此种数据集训练,最后的判别准确率会在某几类上出现明显的偏差。解决类别不平衡问题最直观、有效的方法是对数量少的样本图像进行扩充。传统的图像扩充方法主要依据计算机图形学相关理论,通过在几何变换方面对原始图像进行平移、缩放、旋转、仿射、透视;在图像增强方面对原始图像进行亮度、色度、对比度、锐度调整;在噪声方面对原始图像添加高斯噪声或椒盐噪声3。采用传统图像扩充方法可以在不增加无意义数据的同时简单快速地扩充样本图像数量,但在数据多样性提升方面效果不佳。近年来随着神经网络不断改进变革,涌现出了卷积神经网络、递归神经网络、深度神经网络等众多复杂的多节点网络模型,依托于

3、此,诞生了生成对抗网络(Generative Adversarial Networks,GANs)及其一文章编号:1006-2475(2023)01-0013-05基于NS-StyleGAN2的鱼类图像扩充方法李海涛,胡泽涛,张俊虎(青岛科技大学信息科学与技术学院,山东 青岛 266061)摘要:图像多分类领域中经常出现类别不平衡问题,这会对分类模型的学习训练产生负面影响。通过对样本数量较少的类别进行扩充可以有效解决类别不平衡问题。生成对抗网络作为近年来新兴的一种神经网络,输入真实图像样本训练可以输出与真实样本非常相似的生成样本。根据此特性,本文结合第二代样式生成对抗网络(StyleGAN2)

4、的设计思想与鱼类图像的特点,设计一种噪声抑制样式生成对抗网络NS-StyleGAN2(Noise-Suppressed Style Generative Adversarial Networks 2)。NS-StyleGN2去除了StyleGAN2合成网络中低分辨率层的噪声输入,从而抑制低分辨率层的噪声权重,使StyleGAN2生成样本细节特征更逼近真实样本特征。采用202张鲢鱼图像进行训练,本文提出的方法在起始分数、弗雷歇起始距离、内核起始距离得分等方面均优于DCGAN、WGAN、StyleGAN2,表明该方法可以有效进行图像扩充。关键词:样式生成对抗网络;图像扩充;噪声抑制;起始分数;弗雷

5、歇起始距离中图分类号:TP391.4文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.01.003Method of Fish Image Expansion Based on NS-StyleGAN2 NetworkLI Hai-tao,HU Ze-tao,ZHANG Jun-hu(Information Science and Technology Academy,Qingdao University of Science and Technology,Qingdao 266061,China)Abstract:Category imbalance ofte

6、n occurs in the field of image multi-classification,which has a negative impact on the learningand training of the classification model.It can be effectively solved by expanding the category with fewer samples.Generative adversarial network,as a newly developed neural network in recent years,can out

7、put generated samples that are very similar to realsamples when trained by real image samples.According to this characteristic,this paper designs a noise-suppressed second generation style generation adversarial network 2(NS-StyleGAN2)by combining the design philosophy of the second generationstyle

8、generation adversarial network(StyleGAN2)and the characteristics of fish image.NS-StyleGAN2 removes the noise inputof the low-resolution layer in the StyleGAN2 s synthetic network,so as to suppress the noise weight of the low-resolution layerand make the StyleGAN2-generated samplesdetail features mo

9、re close to the real samples.202 images of silver carp are usedfor training.The method proposed in this paper is superior to DCGAN,WGAN and StyleGAN2 in inception score,Frechet inception distance and kernel inception distance,which shows this method can be used for image expansion effectively.Key wo

10、rds:StyleGAN(Style Generative Adversarial Networks);image augmentation;noise suppression;IS;FID收稿日期:2022-01-28;修回日期:2022-03-02基金项目:山东省重点研发计划(科技示范工程)项目(2021SFGC0701)作者简介:李海涛(1978),男,山东菏泽人,副教授,博士,研究方向:地理信息系统,北斗定位导航,移动物联网,E-mail:;胡泽涛(1997),男,山东菏泽人,硕士研究生,研究方向:智慧海洋,智慧渔业,E-mail:huzetao_;张俊虎(1974),男,副教授,博士

11、,研究方向:分布式数据处理,E-mail:。计算机与现代化2023年第1期系列改进网络。生成对抗网络通过生成器与判别器二者进行博弈式训练,可使生成器生成与真实样本极其相似的生成样本4。根据生成对抗网络的结构和特性,可以利用其进行有效的图像扩充,使生成图像多样性更加丰富。考虑到生成对抗网络所生成样本的分辨率、多样性等指标,本文选取 StyleGAN2 作为原始网络。在StyleGAN2的基础上,针对鱼类图像由低到高不同层级特征的变化特点,以及StyleGAN2控制不同层级特征变化的方式,本文设计一种噪声抑制样式生成对抗网络NS-StyleGAN2。NS-StyleGAN2 通过去除 StyleG

12、AN2的合成网络中44至1616分辨率层的噪声叠加模块,保留其他分辨率层的噪声叠加模块,抑制了StyleGAN2合成网络中的低分辨率层噪声输入。同时本文对DCGAN、WGAN等其他生成对抗网络进行相同实验对比,发现利用NS-StyleGAN2网络对鱼类图像样本训练,可以生成更真实、更多样化的鱼类图像样本。1生成对抗网络GANs于2014年由Goodfellow等人提出,是一种无监督学习方法5。GANs包括 2大部分:生成器 G(Generator)和判别器D(Discriminator)6。生成器将随机噪声z作为输入,经过多层网络运算处理输出生成样本图像G(z)。判别器将生成样本图像和真实样本

13、图像作为输入x,经过多层网络运算处理得到二值输出D(x),值为0时表示输入x为生成样本图像,值为1时表示输入x为真实样本图像7。最初的GANs使用梯度下降法达到纳什均衡,训练过程极不稳定,会出现梯度消失、模式崩溃(ModelCollapse)等问题,造成训练能效低、生成样本多样性低、图像质量差8-12等问题。为了解决原始GANs的问题,经过后人研究衍生了若干GANs的变种。1.1深度卷积生成对抗网络DCGAN深度卷积生成对抗网络与原始 GANs相比修改了生成器和判别器的网络结构,在生成器中使用分数步长卷积(Fractional-strided Convolutions)代替池化层,在判别器中使

14、用步长卷积(Strided Convolutions)代替池化层,以此加深网络层级,学习样本更多的特征13。为了加快网络收敛,DCGAN使用池化层将生成器和判别器的随机输入直接与卷积层特征输入进行连接,去掉了参数过多的全连接层14-15。1.2基于推土机距离的生成对抗网络WGAN基于推土机距离的生成对抗网络(WassersteinGAN,WGAN)的改进方式与 DCGAN 的根据经验调整网络架构不同,它从原始GANs的公式定理方面着手,针对推理出的问题从算法逻辑进行改进。WGAN相较于原始GANs,从理论上解决了梯度消失问题,同时引入了Wasserstein距离作为GAN训练指标,使网络训练更

15、加稳定并减少了模式崩塌现象16-18。但WGAN没有对网络结构进行大幅度调整,仍然难以生成高分辨率图像。1.3第二代基于样式的生成对抗网络StyleGAN2基于样式的生成对抗网络(Style Based GAN,StyleGAN)是英伟达公司于 2019年提出的一种基于ProGAN 改进的生成对抗网络变体19。StyleGAN 网络结构与GANs类似,包括生成器和判别器,其改进点主要集中在生成器。StyleGAN的生成器网络主要包括2个部分:映射网络(Mapping Network)和合成网络(Synthesis Network),整体网络结构如图 1 所示。图1StyleGAN网络结构Map

16、pingNetwork 主 要 对 隐 藏 空 间(LatentSpace)进行解耦,寻找数据之间耦合性高的特征之间更深层次的关系,将这些关系解耦得到隐藏特征(Latent Code)。Mapping Network的8个全连接层将Latent Code(z)仿射变换(A)为中间变量w,使z的分布函数变为非均匀密度分布函数,更符合实际情况的特征分布。通过Mapping Network模型可以生成一个不需要跟随训练数据分布的向量w,并可以减少样本特征之间的耦合性,达到控制单一特征而不影响其原始被纠缠的特征20-23。StyleGAN作为目前最先进的高分辨率图像生成方法之一,其仍存在缺点,包括网络

17、训练速度慢以及生成的各级特征图像都包含明显的斑点伪影(artifacts)。为解决StyleGAN出现的问题,NVIDIA发布了StyleGAN的升级版StyleGAN2。StyleGAN2通过实验发现出现artifacts的原因在于AdaIN操作,于是在一代的基础上修改合成网络架构,首先将AdaIN转化为归一化与调制这2个操作,并将多余的偏差和噪声广播操作移至不同分辨率层之间,最终使用解调代替归一化 24-27。StyleGAN2可以有效减少artifacts现象,加快网络训练速度。StyleGAN2网络结构如图2所示。图 2与图 1相比可明显看出,StyleGAN2生成器除了将StyleG

18、AN中的AdaIN模块使用调制解调模块NormalizeLatent Code z zFCFCFCFCFCFCFCFCw wConst 44512+AdaINConv 33+AdaIN44Const 44512+AdaINConv 33+AdaIN88.256256Mapping NetworkSynthesis NetworkAAAABNoiseBBBAABB142023年第1期李海涛,等:基于NS-StyleGAN2的鱼类图像扩充方法Mod、Demod代替,同时将噪声 B叠加的位置从 Conv模块与AdaIN模块之间移至不同分辨率层之间。图2StyleGAN2网络结构2噪声抑制样式生成网络

19、NS-StyleGAN2原始 StyleGAN2通过噪声广播将噪声叠加到合成网络的从低到高所有分辨率层,以此增加图像基础特征到高级特征的多样性,例如增加人脸图像的肤色、头发颜色、背景色到姿态、脸型、穿戴等特征的多样性。但是对于使用StyleGAN2扩充鱼类图像以增加图像识别分类准确率来说,每种鱼的基础特征,如鱼表面颜色及外轮廓应较为一致,因此需要减少图像基础特征的多样性。图3NS-StyleGAN2网络结构针对上述StyleGAN2在鱼类图像应用的问题,本文构建一种噪声抑制样式生成对抗网络(Noise-Suppressed Style Generative Adversarial Networ

20、ks 2,NS-StyleGAN2)。NS-StyleGAN2 在 44 至 1616 分辨率层中去除噪声叠加,在3232及更高分辨率层保留噪声叠加,以增加高分辨率层噪声权重,抑制低分辨率层噪声权重。图 3为 NS-StyleGAN2结构,可明显看出 44、88及 1616分辨率层没有了噪声叠加模块。基于StyleGAN2网络结构,NS-StyleGAN2网络包括生成器和鉴别器,其样本图像生成过程主要由3个步骤构成:步骤1输入随机噪声到8个全连接层,输出中间变量w。步骤2中间变量w先后经过仿射变换、调制解调,与常量或来自上一分辨率层的输出进入卷积层运算。步骤33232及更高分辨率层经过步骤2得

21、到的输出与噪声B叠加输入下一分辨率层,最高分辨率层的输出即为最终生成图像。3实验与结果分析3.1实验环境实验电脑配置如下:操作系统为Ubuntu 20.04,CPU 为 i9-9900k,GPU 为 2 张 NVIDIAGeForceRTX3090,单张显存为12 GB,内存为32 GB,Python版本为3.9.7,Pytorch版本为1.9.1。3.2实验数据集本文实验使用202幅从不同角度实际拍摄的鲢鱼图像作为数据集,每幅图像分辨率为256256,颜色为彩色。DCGAN 和 WGAN 模型训练时由于难以生成高分辨率图像,所以将DCGAN和WGAN模型训练所用图像使用中心裁剪方法裁剪至64

22、64分辨率。3.3实验评价指标本文采用起始分数(Inception Score,IS)、弗雷歇起始距离(Frechet Inception Distance,FID)、内核起始距离(Kernel Inception Distance,KID)这3种GANs常用的评价标准作为实验结果评价指标。3.3.1起始分数IS起始分数使用图片分类网络 Inception Network第3个版本以及ImageNet数据集,从生成图片的清晰度和多样性2个方面验证生成模型的性能。在清晰度方面,IS计算生成的图片属于1000类图片中某个类别的概率的熵,熵越小代表被检测图片越清晰,最理想的情况为生成的图片属于某一类

23、图片的概率极大,属于其他类别的概率极小;在多样性方面,IS计算所有生成图片在1000类图片中概率的边缘分布的熵,熵越大代表图片多样性越高,最理想的情况为生成的图片在各类图片中均匀分布。综合2方面可得公式(1):IS()G=exp()ExPgDKL()p()y|x p()y(1)其中,exp没有具体含义,xPg表示从生成器中生成图片样本分布,p(y|x)表示生成图片x属于各个类别NormalizeLatent Code z zFCFCFCFCFCFCFCFCw wConst 44512Conv 33+.256256Mapping NetworkSynthesis NetworkAANoiseBB

24、ABBModDemodw wConv 33+ModDemodw wUpsampleA4488161632326464AAAwww15计算机与现代化2023年第1期图片 y 的概率分布,p(y)表示生成器所有图片在所有类别图片上的边缘分布,DKL表示KL散度,用以衡量 2 个概率分布的距离。通过前面分析可知,生成器性能最好情况下 p(y|x)为极尖锐分布,p(y)为均匀分布,因此这2个分布的KL散度越大生成器性能越好。3.3.2弗雷歇起始距离FIDFID同样借助Inception Network得到图片样本的n 维特征并将其简化为向量,使用弗雷歇距离(Frechet Distance)计算真实样

25、本特征和生成样本特征这2个多维向量所服从分布之间的距离。2幅相同的图片样本其特征向量的分布会重合,因此FID越小,生成样本与真实样本越相似。FID计算如公式(2)所示:FID=r-g2+Tr()r+g-2(rg)1 2(2)其中,r表示真实图片的特征的均值,g表示生成图片的特征的均值,r表示真实图片的特征的协方差矩阵,g表示生成图片的特征的协方差矩阵。FID与IS不同,考虑了真实样本与生成样本的关系,而IS只依据ImageNet数据集,从判别依据上提升了合理性。同时FID不需要对生成样本进行分类,可以避免生成样本类别模糊、不存在于ImageNet数据集等多样性问题对计算结果造成的影响。3.3.

26、3内核起始距离KIDKID 与 FID 类似,使用 Inception Network 计算表征之间最大均值差异的平方来衡量生成样本与真实样本之间的差异。与FID不同之处在于,KID拥有一个3次核的无偏估计值,计算结果与人类感知类似。3.4实验过程与结果本 文 使 用 基 于 Pytorch 框 架 实 现 在 DCGAN、WGAN、StyleGAN2以及本文提出的NS-StyleGAN2网络上对相同的鲢鱼数据集进行训练,每种网络分别训练1000个epoch,每个epoch为使用训练集的全部数据对模型进行一次完整训练,使用训练完成保存的模型分别生成1000幅图像作为生成样本,最后使用生成样本计

27、算GANs评价量化指标,并通过人眼观察作出评价。图4为NS-StyleGAN2对鲢鱼数据集进行1000个epoch 训练的 FID 得分变化趋势。前 200个 epoch 训练过程中FID得分迅速下降,在第800个epoch时FID得分下降到最低值,说明NS-StyleGAN2在前1000个epoch训练中可以收敛。表1为4种模型所生成样本在IS、FID、KID量化指标上的对比情况,IS得分越高、FID与 KID得分越低表明生成样本越接近真实样本、生成器性能越好。本文提出的 NS-StyleGAN2 在 IS 分数为 3.54,FID 分数为206.56,KID分数为0.15,IS分数在4种模

28、型中最高,而FID、KID分数均最低。由于DCGAN、WGAN所生成的样本分辨率为 6464,远低于 StyleGAN2 与NS-StyleGAN2 生成样本的 256256 分辨率,所以生成样本清晰度远不如真实样本清晰度,导致DCGAN、WGAN的评价得分与StyleGAN2、NS-StyleGAN2的评价得分差距较大。NS-StyleGAN2与StyleGAN2相比,通过噪声抑制手段在减少生成样本基础特征变化的同时保持了高级特征的变化,使生成样本在更接近于真实样本的同时保持了多样性,因此NS-StyleGAN2的各项得分均优于 StyleGAN2。上述结果表明本文提出的NS-StyleGA

29、N2生成的图像与真实图像更为相似,且具有较高的质量与多样性。图4NS-StyleGAN2的FID变化趋势表14种模型的3种量化评价指标对比算法DCGANWGANStyleGAN2NS-StyleGAN2IS2.591.833.203.54FID303.12351.01216.34206.56KID0.300.410.170.15图 5 为使用原始 StyleGAN2 和 NS-StyleGAN2 生成的结果对比,通过对比发现原始StyleGAN2生成图像整体较为模糊,鱼表面有明显不同颜色色块,且缺失纹理细节。NS-StyleGAN2 生成图像整体较为清晰,鱼鳍边缘细节、鱼表面纹理较为明显,鱼表

30、面颜色过渡平滑。由于StyleGAN2在合成网络的各个分辨率层都输入了噪声,鱼表面颜色、纹理等基础特征变化幅度较大,导致其模糊不清甚至缺失;而 NS-StyleGAN2通过抑制低分辨率层的噪声输入,控制了基础特征的变化幅度,使得基础特征更加清晰、符合真实情况。因此本文提出的NS-StyleGAN2可以为鱼类识别提供更真实客观的样本。(a)真实鲢鱼样本(b)StyleGAN2生成(c)NS-StyleGAN2样本生成样本图5原始网络与改进网络生成图像图 6 为 去 除 不 同 分 辨 率 层 噪 声 叠 加 的 NS-StyleGAN2所生成图像对比。通过对比发现,去除88及以下分辨率层噪声叠加

31、所生成的图像与去除1616及以下的相比,鱼鳃及其附近的鱼鳍边界更为模糊,鱼表面颜色过渡不自然;去除3232及以下分辨率层噪声叠加所生成的图像与去除1616及以下的相比,鱼鳃形状模糊,鱼鳍形状姿态单一且丢失背鳍细节。去除噪声叠加的分辨率过低,只能抑制较少的450400350300250200150100500020040060080010001200选代次数/次FID162023年第1期基础特征变化,而去除噪声叠加的分辨率过高,会影响背鳍等高级特征的产生。因此去除1616及以下分辨率层噪声叠加的NS-StyleGAN2能够取得更理想的图像生成效果。(a)去除88及以下(b)去除1616及以下(c

32、)去除3232及以下噪声叠加噪声叠加噪声叠加图 6去除不同层级噪声生成图像图7为4种模型生成样本与真实样本对比,通过人眼观察发现,DCGAN与WGAN生成的图像较为类似,图中鱼的整体轮廓较为明显,鱼表面和背景色调与真实图像的较为一致,但由于分辨率和模型收敛程度限制,鱼鳍、鱼鳃等细节特征较为模糊,无法从图像上观察出来,且图像中噪点较为明显。StyleGAN2生成样本几乎没有噪点,鱼的外轮廓较为清晰,但细节特征仍然模糊,鱼表面呈现大量不均匀色块。而本文提出的NS-StyleGAN2生成的图像中鱼外轮廓边界鲜明,背景及鱼身颜色过渡平滑,鱼鳃、鱼鳍等结构可明显辨别。4结束语本文在生成对抗网络架构基础上

33、,提出了一种噪声抑制生成对抗网络的鱼类图像生成方法,应用于鱼类图像生成。本文方法与DCGAN、WGAN、StyleGAN2这 3 种方法各生成 1000 个样本,在 IS、FID、KID 这 3种量化指标以及人眼观察评价方面进行比较,结果表明本文方法在鱼类图像方面可以生成更加真实、客观的图像,实现对鱼类图像数据集的扩充,有助于解决图像类别不平衡问题。图74种模型生成图像(a)真实样本(b)DCGAN生成样本(c)WGAN生成样本(d)StyleGAN2生成样本(e)Ns-StyleGAN2生成样本参考文献:1 赵楠,谭惠文.人工智能技术的发展及应用分析 J.中国电子科学研究院学报,2021,1

34、6(7):737-740.2 邱根,王锂,白利兵.基于生成对抗网络数据扩充的缺陷识别方法 J.电子测量与仪器学报,2021,35(2):212-220.3 范毅晟,谢保川,李雪青.计算机图形学的发展及应用探讨 J.电子技术与软件工程,2013(22):103.4 陈佛计,朱枫,吴清潇,等.生成对抗网络及其在图像生成中的应用研究综述 J.计算机学报,2021,44(2):347-369.5 魏富强,古兰拜尔 吐尔洪,买日旦 吾守尔.生成对抗网络及其应用研究综述 J.计算机工程与应用,2021,57(19):18-31.6 吴少乾,李西明.生成对抗网络的研究进展综述 J.计算机科学与探索,2020

35、,14(3):377-388.7 GOODFELLOW I,Pouget-Abadie J,Mirza M,et al.Generative adversarial networksJ.Communications of theACM,2020,63(11):139-144.8 马永杰,徐小冬,张茹,等.生成式对抗网络及其在图像生成中的研究进展 J.计算机科学与探索,2021,15(10):1795-1811.9SHORTEN C,KHOSHGOFTAAR T M.A survey on image data augmentation for deep learning J.Journal o

36、f BigData,2019,6(1):1-48.10 黄琼男,朱卫纲,李永刚.于GAN的SAR数据扩充研究综述 J.兵器装备工程学报,2021,42(11):31-38.11于晓明,黄铧.改进GAN网络在生成短视频的应用研究J.计算机科学,2021,48(S2):625-629.12孙雄风,黄珍,陈志军,等.基于改进GAN的端到端自动驾驶图像生成方法 J.交通信息与安全,2021,39(5):50-58.13徐永士,贲可荣,王天雨,等.DCGAN模型改进与SAR图像生成研究 J.计算机科学,2020,47(12):93-99.14 RADFORD A,METZ L,CHINTALA S.Un

37、supervisedrepresentation learning with deep convolutional generativeadversarial networks J .arXiv preprint arXiv:1511.06434,2015.15裴莉莉,孙朝云,孙静,等.基于DCGAN的路面裂缝图像生成方法 J.中南大学学报(自然科学版),2021,52(11):3899-3906.16刘宇飞,周源,刘欣,等.基于Wasserstein GAN的新一代人工智能小样本数据增强方法以生物领域癌症分期数据为例 J.Engineering,2019,5(1):338-354.17胡龙辉

38、,王朝立,孙占全,等.基于WGAN的图像识别方法 J.控制工程,2020,27(12):2168-2175.18 李健宁,路阳,陶贤鹏,等.基于WGAN-GP的水稻病害图像生成方法研究 J.信息记录材料,2021,22(8):235-238.19 KARRAS T,LAINE S,AILA T.A style-based generatorarchitecture for generative adversarial networks C/2019IEEE/CVF Conference on Computer Vision and PatternRecognition(CVPR).2019:4

39、396-4405.20赵宸,帅仁俊,马力,等.基于Self-Attention-StyleGAN的皮肤癌图像生成与分类 J/OL.计算机工程与应用:1-162022-01-05.http:/ J.黑龙江科技大学学报,2021,31(2):247-253.22俞彬.基于生成对抗网络的图像类别不平衡问题数据扩充方法 D.广州:华南理工大学,2018.23林志鹏,曾立波,吴琼水.基于生成对抗网络的宫颈细胞图像数据增强 J.科学技术与工程,(下转第23页)李海涛,等:基于NS-StyleGAN2的鱼类图像扩充方法172023年第1期发 现,模 型 比 ResNet50、ResNet101、SE-Res

40、Net50、SE-ResNet101和SE-ResNeXt50模型分类效果更好,通过数据增强的方式提高了数据集的数据量,可靠性与泛化能力较强。该模型可以运用到农技科研工作人员与苹果种植农户的实际科研和工作中,结合农业专家系统提高农业智能化水平和工作效率。未来的工作将旨在通过研究其他深度神经网络模型,例如Transformer来识别苹果品种。此外,需要收集来自不同种植区的更多苹果品种的更多叶子图像,以提高模型在更多苹果品种上的泛化性能和效率。且该模型还可迁移至其他果树的品种识别甚至其他植物的品种识别。参考文献:1SO?DERKVIST,O.Computer vision classificati

41、on of leavesfrom Swedish treesD.Linkoping University,Sweden,2001.2 张善文,张传雷,程雷.基于监督正交局部保持映射的植物叶片图像分类方法 J.农业工程学报,2013,29(5):125-131.3 PANKAJA K,SUMA V.Leaf recognition and classificationusing Chebyshev moments M/Smart Intelligent Computing and Applications.2019,105:667-678.DOI:10.1007/978-981-13-1927-

42、3_70.4HALL D,MCCOOL C,DAYOUB F,et al.Evaluation offeatures for leaf classification in challenging conditionsC/Proceedings of the 2015 IEEE Winter Conference onApplications of Computer Vision.2015:797-804.5 孙宏杰.基于叶片图像分析的葡萄品种识别方法研究D.咸阳:西北农林科技大学,2016.6 ZHANG S W,JU C F.Orthogonal global-locally discrim

43、inant projection for plant leaf classification J.Transactionsof the Chinese Society of Agricultural Engineering,2010,26(10):162-166.7WEI L,HE D J,QIAO Y L.Plant leaves classificationbased on image processing and SVM J.Journal of Agricultural Mechanization Research,2013,35(5):12-15.8 LIU C Z,HAN J Y,

44、CHEN B H,et al.A novel identification method for apple(malus domestica borkh.)cultivarsbased on a deep convolutional neural network with leaf image input J.Symmetry,2020,12(2):217.DOI:10.3390/sym12020217.9 YALCIN H,RAZAVI S.Plant classification using convolutional neural networks C/Proceedings of th

45、e 5th International Conference on Agro-geoinformatics.2016:1-5.10 郑一力,张露.基于迁移学习的卷积神经网络植物叶片图像识别方法 J.农业机械学报,2018(S1):354-359.11 DYRMANN M,KARSTOFT H,MIDTIBY H S.Plant species classification using deep convolutional neural networkJ.Biosystems Engineering,2016,151:72-80.12 LEE S H,CHAN C S,REMAGNINO P.M

46、ulti-organ plantclassification based on convolutional and recurrent neuralnetworks J .IEEE Transactions on Image Processing,2018,27(9):4287-4301.13 郑艳梅,黄光耀,芦碧波,等.结合深度学习和引导滤波的苹果叶片图像分割 J.中国农业大学学报,2020,25(9):112-120.14李鑫然,李书琴,刘斌.基于改进Faster RCNN的苹果叶片病害检测模型 J.计算机工程,2021,47(11):298-304.15 周宏威,沈恒宇,袁新佩,等.基于

47、迁移学习的苹果树叶片病虫害识别方法研究 J.中国农机化学报,2021,42(11):151-158.16XIE S N,GIRSHICK R,DOLLAR P,et al.Aggregated residual transformations for deep neural networksC/Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition.2017:5987-5995.17段俊臣,梁美祥,王瑞.基于人体骨骼点检测与多层感知机的人体姿态识别 J.电子测量技术,2020,43(1

48、2):168-172.18 KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Imagenet classi cation with deep convolutional neural networksC/Proceedings of the 25th International Conference onNeural Information Processing Systems.2012:1097-1105.19 LIN M,CHEN Q,YAN S C.Network in network J.arXivpreprint arXiv:1312.4400,2013.20

49、 秦晓飞,盛凯,朱玥,等.基于注意力模型的人脸关键点检测算法 J.光学仪器,2020,42(2):45-49.21龚捷,罗聪,罗琴.基于注意力机制和残差网络的动作识别模型 J.电子测量技术,2021,44(14):111-116.22 汤文亮,黄梓锋.基于知识蒸馏的轻量级番茄叶部病害识别模型 J.江苏农业学报,2021,37(3):570-578.23 孙瑞安,张云华.结合AdaBERT的TextCNN垃圾弹幕识别和过滤算法 J.智能计算机与应用,2021,11(4):9-13.24 赵静,李志铭,鲁力群,等.基于无人机多光谱遥感图像的玉米田间杂草识别 J.中国农业科学,2020,53(8):

50、1545-1555.25 刘梦伦,赵希梅,魏宾.基于MobileNet V2-ELM的肝硬化识别 J.青岛大学学报(自然科学版),2019,32(4):17-21.26 张虹科,付振新,任前平,等.基于融合条目词嵌入和注意力机制的自动ICD编码 J.北京大学学报(自然科学版),2020,56(1):1-8.27 LOANNOU Y.A Tutorial on Filter Groups EB/OL.(2017-08-10)2021-12-01.https:/blog.yani.ai/filter-group-tutorial/.28 程可欣,王玉德.基于改进YOLOv3的自然场景人员口罩佩戴检

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-2024(领证中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服