收藏 分销(赏)

基于NAM-YOLO网络的苹果缺陷检测算法.pdf

上传人:自信****多点 文档编号:2090979 上传时间:2024-05-15 格式:PDF 页数:7 大小:4.12MB
下载 相关 举报
基于NAM-YOLO网络的苹果缺陷检测算法.pdf_第1页
第1页 / 共7页
基于NAM-YOLO网络的苹果缺陷检测算法.pdf_第2页
第2页 / 共7页
基于NAM-YOLO网络的苹果缺陷检测算法.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、计算机与现代化JISUANJI YU XIANDAIHUA2023年第10期总第338期文章编号:1006-2475(2023)10-0053-06收稿日期:2022-11-09;修回日期:2022-12-03作者简介:张嘉琪(1996),男,浙江宁波人,硕士研究生,研究方向:模式识别与机器视觉,E-mail:;通信作者:徐啟蕾(1980),女,山东青岛人,副教授,博士,研究方向:图像处理,路径规划,E-mail:。0引言中国是一个农业大国,其苹果年产量超过1700万吨。然而,大部分苹果的分拣和分级过程仍然没有实现自动化。苹果在采摘和运输过程中容易因磕碰、挤压造成机械损伤导致加速腐烂,降低苹果

2、的经济价值。目前,苹果采摘后主要采用人工分拣的方式,该方式具有很大的局限性:1)错误率高且效率低;2)由于工人对苹果缺陷判断没有标准,结果可能会有所不同1-5。部分依靠机械结构进行分拣6-8。近年来,深度学习算法被大量应用于农产品检测,应用深度学习进行苹果缺陷检测成为主要研究热点之一,国内外学者对苹果分级做了大量研究,根据苹果大小、形状、颜色等特征进行分级的方法已比较成熟9-11,而苹果缺陷的检测一直是苹果分级的一个障碍。Yu等人12基于多图像特征和加权K-means聚类算法提出了一种快速有效的苹果自动分级方法,使用顶部、底部和两侧的图像和苹果平均灰度值区分苹果缺陷、茎、花萼,准确率达到96.

3、00%,该算法处理速度较快,但精度与鲁棒性欠佳。Hu等人13提出了一种 基 于 卷 积 神 经 网 络(Convolutional Neural Networks,CNN)的方法,使用来自水果扫描网格的 3D形状信息来检测瘀伤的苹果。Fan等人14引入了一种基于计算机视觉的在线系统,该系统采用CNN实现苹果缺陷检测,实验结果表明,该方式优于支持向量机(Support Vector Machines,SVM),分级准确率达96.00%。该系统检测时每个苹果需采集6张照片,检测效率仍有提升空间。可见,采用上述方法对苹果基于NAM-YOLO网络的苹果缺陷检测算法张嘉琪,徐啟蕾(青岛科技大学自动化与电

4、子工程学院,山东 青岛 266061)摘要:针对苹果缺陷检测经常误检漏检、缺陷易混淆等问题,提出一种基于改进YOLOv5的苹果缺陷检测算法。苹果缺陷检测对苹果分拣至关重要,现有检测苹果缺陷的方法主要是通过机器学习或卷积神经网络提取颜色和纹理特征,存在错误检测、漏检和特征提取能力不足等问题,不能满足缺陷检测精度与实时性的需求。NAM-YOLO算法主要有3个核心思想:1)通过将TRANS模块添加到骨干网络,更好地融合特征与全局信息;2)通过加权双向特征金字塔网络融合不同尺度的特征;3)将基于归一化的注意力机制NAM注意机制引入颈部网络,强化目标区域的关键特征,提高网络的检测精度。实验结果表明,改进

5、算法的mAP达到98.90%,准确度为98.73%。与其他模型相比,该模型具有较好的特征融合能力,可较好地满足苹果分拣的实际需要。关键词:NAM-YOLO;YOLOv5;TRANS;注意力机制;缺陷检测中图分类号:TP391.4文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.10.008Apple Defect Detection Algorithm Based on NAM-YOLO NetworkZHANG Jia-Qi,XU Qi-lei(College of Automation and Electronic Engineering,Qingdao U

6、niversity of Science and Technology,Qingdao 266061,China)Abstract:Aiming at the problems of apple defect detection,such as frequent false detection,leakage detection and easy confusion of defects,we propose an apple defect detection algorithm based on improved YOLOv5.Apple defect detection is very i

7、mportant for apple sorting.The existing methods of apple defect detection mainly extract color and texture features through machinelearning or convolutional neural network,but there are problems such as error detection,missing detection and insufficient feature extraction ability.It can not meet the

8、 requirements of accuracy and real-time defect detection.NAM-YOLO algorithmmainly has three core ideas:1)By adding TRANS module to the backbone network,features and global information can be betterintegrated;2)The weighted bidirectional feature pyramid network is used to fuse features of different s

9、cales;3)The NAM attention mechanism based on normalization is introduced into the neck network to strengthen the key features of the target region andimprove the detection accuracy of the network.Experimental results show that the mAP of the improved algorithm reaches98.90%and the accuracy is 98.73%

10、.Compared with other models,this model has better feature fusion ability and can bettermeet the actual needs of apple sorting.Key words:NAM-YOLO;YOLOv5;TRANS;attention mechanism;defect detection计算机与现代化2023年第10期分级有着重要意义,但仍然存在分类准确度低,细小缺陷检测能力差等问题。Redmon等人15于2016年提出(You Only Look Once,YOLO)算法。YOLO系列被大量应

11、用于农业领域16-18。Valdez 等人19将YOLOv3应用于 RGB 图像中苹果的 2类分级。苹果按照缺陷与健康进行分类,健康苹果与缺陷平均检测精度分别是80.70%和69.00%,检测精度有待提升。因此,本文主要针对提高苹果缺陷检测精度与效率,克服苹果缺陷的复杂多样因素造成的误检和漏检,在原有的YOLOv5网络中加入基于Transformer的TRANS模块,改进YOLOv5的颈部特征融合网络,并引入基于归一化的注意力机制;利用改进的YOLOv5网络对苹果进行缺陷检测,优化苹果实时检测效果。1YOLOv5网络模型YOLOv5 是 Glenn Jocher 在 2020 年提出的一种单阶

12、段目标识别算法。YOLOv5主要包含4个部分,即输入端(Input)、骨干网络(Backbone)、颈部网络(Neck)和检测头(Head),其中Input经过图像预处理统一图像大小;Backbone提取图像特征;Neck包含了一系列网络层,可以根据一定的规律融合主干提取的图像特征,使特征语义信息更加丰富,并将输出处理后的特征作为预测层的输入;通过Head网络预测输入特征获得对象的类别并生成边界框的最终坐标。核心思想是将目标检测作为回归问题来处理,将数据经过特征提取、特征融合后直接定位目标位置并对目标进行归类。根据网络宽度和深度的差异,YOLOv5可分为n、s、m、l、x这5种网络模型。其中,

13、YOLOv5s网络的计算速度最快,但平均精度低。本文选择YOLOv5s作为主要研究模型,YOLOv5s 网络结构如图 1 所示。Backbone网络主要由卷积层、BN层、SiLU激活函数、空 间 金 字 塔 快 速 池 化(Spatial Pyramid Pooling-Fast,SPPF)和 集 中 综 合 卷 积(Concentrated-Comprehensive Convolution,C3)模块组成。图1YOLOv5s网络结构Sigmoid 加 权 衬 垫(SigmoidWeightedLinerUnit,SiLU)激活函数20是一种平滑非单调函数,可有效抑制训练过程中的梯度消失。B

14、ackbone中C3-1由 CBS、Resunit、Concat模块组成,在 Neck中将 C3-1中的 Resunit替换成了 CBS 模块。SPPF 结构是在空间金字塔池化(Spatial Pyramid Pooling,SPP)的基础上改进的,SPPF 可以更高效地实现 SPP 的功能。SPPF将特征图依次输入3个最大池化层Maxpool,并将特征图拼接后进行尺度统一,确保目标大小与位置保持一致,使得网络更好地提高分类精度和速度,同时提取更丰富的特征信息。Neck 采用特征金字塔(Feature Pyramid Networks,FPN)21+路径聚合网络(Path Aggregatio

15、n Network,PAN)结构,FPN和PAN结构实现了高层特征和底层特征的融合和互补。二者相辅相成,克服了各自的局限性,增强了模型的特征提取能力。图像输入Backbone后,在不同的图像粒度上聚集并形成图像特征。Neck将图像特征合并随即传输到预测层,Head预测图像特征以生成边界框和预测类别。2NAM-YOLO苹果缺陷检测算法2.1NAM-YOLO网络模型针对苹果缺陷检测经常误检漏检、缺陷易混淆等问题,降低在复杂场景下检测苹果表面不同缺陷的误检率与漏检率,本文提出一种基于改进YOLOv5s的NAM-YOLO 模型。其网络结构示意图如图 2所示,相比于传统 YOLOv5s网络,本模型分别在

16、 Backbone网络、Neck网络进行改进。在Backbone网络中添加基于Transformer的TRANS模块,以更好地融合特征与全局信息。在Neck中将BiFPN结构替换YOLOv5原有的PANet结构,以增强多尺度特征融合能力,并在Neck网络与Head之间添加一种轻量级的高效的注意力机制(Normalization-based Attention Module,NAM)22以强化目标区域的关键特征,提高网络的检测精度。图2改进后的NAM-YOLO网络结构2.2主干网络的改进本文将Transformer23引入YOLOv5s的网络模型中。Transformer模型能够关注全局图像特征

17、块之间的依赖关系,并保留足够的空间信息用于目标检测,捕获丰富的上下文信息。TRANS 结构如图 3所示。nnX542023年第10期每个TRANS编码器包含2个子层,第1个子层是多头注意力机制,多头注意力通过不同的线性变换将特征映射到不同的向量空间,这有助于网络关注当前像素,获得上下文语义24。第2个子层是全连接的前馈网络多层感知机(Multilayer Perceptron,MLP)。2个子层之间通过残差连接(Residual),然后进行层归一化(Layer Normalization,LN)25。采用残差连接可以减弱神经网络的“退化现象”。“退化现象”即在网络层数加深时,网络的损失值不降反

18、增。在Backbone前端添加TRANS模块容易触发边界回归,从而丢失部分有助于检测的上下文信息。将TRANS模块添加到特征图分辨率较小、网络层数较深的Backbone末端,可以降低计算和存储消耗,更好地提高苹果缺陷的检测效率与精度。在苹果缺陷检测数据集上,可以证明TRANS模块具有更好的性能。图3TRANS编码器的架构2.3颈部网络的改进颈部网络的作用是更好地利用骨干网络提取的特征,通过对骨干网络在不同阶段提取的特征进行上采样、下采样和融合,增强模型在不同尺度的检测能力。如图4(a)所示,FPN是从P3到P7自上而下融合构建特征图像金字塔,在特征图像金字塔的每一层提取出不同的特征,每一层都会

19、进行预测。这样精度有所提升,但计算量大、需要大量的内存。PANet结构示意图如图4(b)所示,包含一个自顶向下和自底向上的双向融合骨干网络,同时在最底层和最高层之间添加了一条“捷径”,用于缩短层之间的路径。PANet包含自适应特征池化和全连接融合2个模块。PANet识别由骨干网络提取的苹果单一缺陷这类浅层特征,效果较为明显,但难以获得深层的特征以识别复杂的缺陷。(a)FPN(b)PANet(c)BiFPN图4特征网络结构本文将加权双向特征金字塔(Bidirectional Feature Pyramid Network,BiFPN)26引入 YOLOv5s 网络,其结构示意图如图4(c)所示。

20、BiFPN通过向不同分辨率的输入特征添加额外的权重,使网络获得每个输入特征的重要性以更好地平衡不同尺度的特征信息。BiFPN通过优化多尺度特征融合方法,实现了有效的双向跨尺度连接和加权特征融合,平衡了模型的效率和精度。2.4NAM注意力机制近年来,注意力机制因其具有即插即用、有效增强信息、共享权重的特点被广泛应用于深度学习目标检测领域27。卷积块注意模块(Convolutional Block AttentionModule,CBAM)28采用了空间和通道混合注意力机制,包含2个模块:通道注意力模块和空间注意力模块。2个注意力模块采用串联的方式。NAM 在 CBAM 的基础上进行改进,按顺序重

21、新设计通道注意模块和空间注意模块,通过调整训练权重在通道维度和空间维度上的方差来调整注意力的权重。其结构如图 5 所示。NAM 使用了批归一化(Batch Normalization,BN)29中的缩放因子来表示权值的重要程度如式(1)所示,以避免如挤压与激励注意力机制(Squeeze and Excitation Module,SE)和CBAM一样增加全连接层和卷积层。图5NAM注意力机制的结构Bout=BN(Bin)=Bin-B2B+(1)MLPNormMulti_Head AttentionNormEmbedded PatchesP7P6P5P4P3P7P6P5P4P3P7P6P5P4P

22、3输入特征通道注意模块空间注意力模块改进的特征BNWeight输入特征F1通道注意力模块输入特征F2空间注意力模块MCSigmoid01230123MSSigmoidWeightFixelNormalization0123401234张嘉琪,等:基于NAM-YOLO网络的苹果缺陷检测算法55计算机与现代化2023年第10期其中,与分别为可训练尺度与移位参数,B与B分别为小批量的均值与标准差。比例因子为BN的方差,是为了避免分母为0而增加的一个接近于0的很小的值。较大的方差可以带来更多的变化以及更丰富的信息。基于通道注意模块的归一化相关权重W,可以对重要信道给予更多关注,并抑制无关的权重。假设F

23、1 R(H W C)为输入特征图,H、W和C分别表示通道的高度、宽度和数量。通道注意的输出如式(2)所示:MC=Sigmoid(W(BN(F1)(2)空间注意模块采用与通道注意模块相同的方式,将 BN 应用于空间维度中的像素,即像素归一化(PN)。根据缩放因子聚焦于信息量较大的像素,并调整相关权重W。F2 R(H W C)是输入特征图,空间注意模型的输出如式(3)所示:MS=Sigmoid(W(PN(F2)(3)为了抑制不太重要的权重,NAM向损失函数添加正则化项:Loss=(x,y)l(f(x,W),y)+pg()+pg()(4)其中:l()与g()分别表示损失函数和l1范数惩罚因子;x和y

24、分别是输入和输出;W是网络权重;p是平衡惩罚因子。本文在BiFPN结构的末端串联插入了3个NAM模块以更好地细化颈部特征融合层的通道和空间信息,高效地提取复杂的苹果表面特征。3实验与结果分析3.1实验环境配置深度学习框架为 PyTorch 1.7.0,编程语言采用Python3.7。本文实验在 Linux Ubuntu 20.04 LTS 操作系统上运行,配备 Intel(R)Core(TM)i9-10900XCPU 3.70 GHz 处理器。搭载了显存为 8 GB 的NVIDIA GeForce RTX 3070显卡以及Compute Unified Device Architecture(

25、CUDA)10.1,由 cuDNN7.6.5版本加速。内存大小为16 GB。本文改进后的YOLOv5s模型训练的超参数设置如表1所示。表1参数配置参数名称动量初始学习率迭代次数衰减系数batch-size训练类别名称参数值0.9370.013000.00058fresh_apple/stale_apple已训练好的网络模型、摄像头以及上位机软件共同构成了苹果分级检测系统,检测系统界面如图6所示。3.2苹果图像采集目前并没有统一公开的苹果缺陷检测数据集,本文所使用实验数据通过现场采集获得,自制了一个苹果缺陷检测数据集。对市场上的苹果进行图像、尺寸以及重量信息采集。拍摄图像尺寸为30243024像

26、素,得到符合条件的图像共 1800 张,保存格式为PNG,数据集图例如图7所示。经过拍摄新鲜的苹果图像共1000张,变质(包括腐烂、裂果等)的苹果图像800张。通过水平翻转、平移以及随机裁剪与填充等方式对原数据集进行扩充,将图像扩充至4800余张。YOLOv5模型采用Mosaic进行数据增强,对输入图像进行随机裁剪与排布,将4张图片进行拼接。拼接后的图片输入YOLOv5网络模型进行训练,提高了模型的泛化能力,避免过拟合现象影响苹果的检测效果。(a)正常(b)碰伤(c)裂口(d)腐烂图7苹果数据集图例3.3数据集制作本文使用的标注软件为LabelImg,将检测对象分成fresh和stale这2类

27、。根据苹果的位置标记实验中的图像并添加标签框,通过图像中标记目标样本来生成包含苹果目标类型和坐标信息的XML文件,标注如图8所示。图8数据集标注通过上述工作,完成数据集的制作。将数据集随机按8:1:1的比例划分为训练集、验证集、测试集,如图6检测系统界面 562023年第10期表2所示。表2数据集划分/张数据集原始数据集扩充数据集训练集10403869验证集130480测试集130487总数130048363.4模型性能评估指标准确率(Precision,P)、召回率(Recall,R)和各类别AP的平均值(Mean Average Precision,mAP)作为模型的评估指标。准确率是预测

28、为正的所有样本中实际为正的样本的概率,表示对正样本结果的预测精度,计算公式如式(5)。召回率是在实际正样本中被预测为正样本的概率,表示整体预测精度,计算公式如式(6)。mAP的计算公式如式(7)。P=TPTP+FP=TPn(5)R=TPTP+FN(6)mAP=1NNi=1APi(7)其中,TP表示被检测对象中被正确预测的部分,FP表示被错误地检测为目标对象的部分,FN表示目标检测对象中预测错误的部分,n表示所有由网络模型检测坏果的数量,N 表示测试样本的类别数,AP是计算出的准确率Precision在不同召回率Recall水平下的平均值。3.5消融实验本文设计了消融实验来验证每个改进模块的优化

29、效果,一共验证了6种网络,分别在YOLOv5s网络的基础上单独添加TRANS、NAM注意力机制以及在颈部更改BiFPN结构进行对比验证。采用相同的苹果缺陷检测数据集,一致的超参数配置。消融实验分别比较了各种模块组合后的准确率、召回率、mAP。表3消融实验结果模型模型1模型2模型3模型4模型5模型6模型7NAM-YOLO性能差异Bi-FPN-TRANS-NAM-准确率P/%88.2992.6390.7294.5193.2097.6196.7898.73+10.44召回率R/%95.2394.7895.8594.0294.9298.9094.8697.39+2.16mAP/%93.0795.009

30、3.4495.3295.4097.5196.1198.90+5.83模型 1 使用的是未进行改进的 YOLOv5s 模型,mAP为93.07%。模型2中采用本文改进后的颈部网络,将BiFPN结构代替YOLOv5s模型原有的PANet结构,提高了网络多尺度融合能力,mAP提升了1.93个百分点。模型3中采用本文修改后的主干网络,在原有主干的尾端增加了 TRANS结构。模型 4中,主要验证了YOLOv5s颈部末端添加NAM注意力机制对实验结果的影响,加入NAM注意力机制后,mAP提升了2.25个百分点。模型5、模型6和模型7分别是对模型2、模型3和模型4中的改进方式的两两融合,本文提出的NAM-Y

31、OLO网络模型则是同时融合上述3种改进。表3显示了每个模型的参数和消融研究结果的比较。其中,“”表示未使用改进的方法,而“”表示使用了改进的方法,“-”表示空白项。为了探究NAM-YOLO对苹果缺陷的检测能力,选取鲜果、带有碰伤、裂口和腐烂的坏果图像共230幅输入模型中进行测试。将碰伤、裂口和腐烂的苹果归为一类进行检测。部分检测效果如图9所示,对应检测结果如表4所示。NAM-YOLO对鲜果和带有裂口苹果识别效果最好,无漏检(坏果被识别为鲜果);带有碰伤的坏果漏检了2个;腐烂的坏果漏检了2个。结果表明,NAM-YOLO在分析苹果品质中更有优势,可以完整地检测苹果状态,具有良好的鲁棒性。(a)正常

32、(b)碰伤(c)裂口(d)腐烂图9苹果检测结果对比表4苹果果实检测结果参数样本数量/幅识别率/%鲜果80100坏果碰伤5096裂口50100腐烂50983.6算法对比实验为了验证改进算法的性能,本文引入主流目标检测算法YOLOv3、YOLOv5s、YOLOv7,设置相同的超参数对苹果缺陷检测数据集进行训练。对比实验选择mAP0.5作为模型评估指标。检测结果如表5所示,不同算法的mAP曲线如图10所示。图10中,横坐标为训练轮次,纵坐标为检测算法的mAP值。在经过300次迭代后,YOLOv3的mAP值最低;YOLOv5s 与 NAM-YOLO 的 mAP 值波动较小;张嘉琪,等:基于NAM-YO

33、LO网络的苹果缺陷检测算法57计算机与现代化2023年第10期改进后的 NAM-YOLO 算法较 YOLOv3、YOLOv5s、YOLOv7,mAP分别提高了18.00个百分点、5.70个百分点、3.70 个百分点。通过对比可知,改进后的NAM-YOLO算法具有明显优势。表5不同算法性能对比序号1234ModelYOLOv3YOLOv5sYOLOv7NAM-YOLOmAP/%80.9093.2095.2098.90图10不同算法mAP曲线图4结束语针对传统视觉方案下,苹果缺陷检测系统质量分析效率低、精度差的问题,本文提出了一种基于YOLOv5算法的NAM-YOLO模型,用于对苹果的坏果进行检测

34、。该模型在 Backbone 网络中加入 TRANS 模块,提高融合特征与全局信息能力,使用BiFPN模块代替颈部网络中的PANet结构,以提高模型的特征融合能力。在BiFPN模块的末端接入基于归一化的注意力机制NAM。NAM-YOLO模型在苹果缺陷检测数据集中,检测准确率达到98.73%,召回率达到97.39%,mAP达到98.90%。与改进前的YOLOv5模型对比,准确率提升了10.44个百分点,召回率提升了2.16个百分点,mAP提升了5.83个百分点。相比于主流检测算法检测精度较高,网络模型具有更优的鲁棒性。因此,本文提出的NAM-YOLO模型的检测精度高,分类效果好,能满足生产环境下

35、对苹果果实实时检测的任务需要。在进一步的工作中,将扩展数据集,设计一套集坏果检测、苹果尺寸分级一体的苹果分拣分级系统。添加苹果尺寸样本,还将考虑如何缩小模型,提高模型的检测速度。参考文献:1 HUANG Z Q,ZHANG P,LIU R G,et al.Immature appledetection method based on improved YOLOv3J.ASPTransactions on Internet of Things,2021,1(1):9-13.2 XING J,SAEYS W,DE BAERDEMAEKER J.Combination of chemometric

36、tools and image processing for bruisedetection on apples J.Computers and Electronics in Agriculture,2007,56(1):1-13.3 王亚良,计时鸣,张利,等.基于模糊算法的苹果无损分拣技术研究 J.浙江工业大学学报,2003,31(5):549-552.4 王忠飞,谢毅,王亚良.水果无损分拣技术研究 J.机床与液压,2004(11):79-80.5 李伟强,王东,宁政通,等.计算机视觉下的果实目标检测算法综述 J.计算机与现代化,2022(6):87-95.6 王丽娟,陈浩然,季石军,等.机

37、器视觉成熟度检测的苹果色选分拣机设计 J.农业与技术,2022,42(12):36-40.7 秦国防,秦明辉.视觉捕捉拾取机器人在水果分类系统中的应用 J.农机化研究,2020,42(9):212-216.8FARZAND AHMADI V,ZIYAEE P,BAZYAR P,et al.Development and testing of a low-cost belt-and-roller machine for spheroid fruit sorting J.AgriEngineering,2020,2(4):596-606.9 郑纪业,张琛,刘光,等.基于线性拟合模型的苹果大小分级方

38、法 J.山东农业科学,2020,52(12):118-125.10 LI X F,ZHU W X.Apple grading method based on features fusion of size,shape and color J.Procedia Engineering,2011,15:2885-2891.11 JI Y H,ZHAO Q J,BI S H,et al.Apple grading methodbased on features of color and defectC/Proceedings ofthe 2018 37th Chinese Control Confe

39、rence(CCC).2018:5364-5368.12 YU Y,VELASTIN S A,YIN F.Automatic grading ofapples based on multi-features and weighted K-meansclustering algorithm J.Information Processing in Agriculture,2020,7(4):556-565.13 HU Z L,TANG J S,ZHANG P,et al.Deep learning forthe identification of bruised apples by fusing

40、3D deep features for apple grading systems J.Mechanical Systems andSignal Processing,2020,145.DOI:10.1016/j.ymssp.2020.106922.14 FAN S X,LI J B,ZHANG Y H,et al.On line detection ofdefective apples using computer vision system combinedwith deep learning methods J.Journal of Food Engineering,2020,286.

41、DOI:10.1016/j.jfoodeng.2020.110102.15 REDMON J,DIVVALA S,GIRSHICK R,et al.You onlylook once:Unified,real-time object detectionC/Proceedings of the 2016 IEEE Conference on Computer Visionand Pattern Recognition.2016:779-788.16 晁晓菲,池敬柯,张继伟,等.基于PSA-YOLO网络的苹果叶片病斑检测 J.农业机械学报,2022,53(8):329-336.17 王菁,范晓飞,

42、赵智慧,等.基于YOLO算法的不同品种枣自然环境下成熟度识别 J.中国农机化学报,2022,43(11):165-171.18 王卓,王健,王枭雄,等.基于改进YOLOv4的自然环境苹果轻量级检测方法 J.农业机械学报,2022,53(8):294-302.19 VALDEZ P.Apple defect detection using deep learningbased object detection for better post harvest handling J.arXiv preprint arXiv:2005.06089,2020.20 ELFWING S,UCHIBE E,

43、DOYA K.Sigmoid-weightedlinear units for neural network function approximation in reinforcement learning J.Neural Networks,2018,107:3-11.21 LIN T Y,DOLLAR P,GIRSHICK R,et al.Feature pyramid networks for object detectionC/Proceedings of the2017 IEEE Conference on Computer Vision and Pattern(下转第64页)58计

44、算机与现代化2023年第10期ment of hard hat wearing monitoring system using deep neural networks with high inference speed C/Proceedings ofthe 2020 International Russian Automation Conference(RusAutoCon).2020:459-463.9LI Z S,XIE W Q,ZHANG L Z,et al.Toward efficientsafety helmet detection based on YOLOv5 with hi

45、erarchicalpositive sample selection and box density filteringJ.IEEE Transactions on Instrumentation and Measurement,2022,71.DOI:10.1109/TIM.2022.3169564.10 HAN K,ZENG X D.Deep learning-based workers safetyhelmet wearing detection on construction sites using multi-scale features J.IEEE Access,2021,10

46、:718-729.11 张锦,屈佩琪,孙程,等.基于改进YOLOv5的安全帽佩戴检测算法 J.计算机应用,2022,42(4):1292-1300.12 陈永平,朱建清,谢懿,等.基于外接圆半径差损失的实时安全帽检测算法 J .计算机科学,2022,49(S1):424-428.13 GIRSHICK R,DONAHUE J,DARRELL T,et al.Richfeature hierarchies for accurate object detection and semantic segmentation C/Proceedings of the 2014 IEEE Conferenc

47、e on Computer Vision and Pattern Recognition.2014:580-587.14 HE K M,ZHANG X Y,REN S Q,et al.Spatial pyramidpooling in deep convolutional networks for visual recognitionJ.IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,37(9):1904-1916.15 GIRSHICK R.Fast R-CNN C/Proceedings of the

48、2015IEEEInternationalConferenceonComputerVision(ICCV).2015:1440-1448.16 REN S Q,HE K M,GIRSHICK R,et al.Faster R-CNN:Towards real-time object detection with region proposalnetworks C/Proceedings of the 28th International Conference on Neural Information Processing Systems.2015,1:91-99.17 LIN T Y,DOL

49、LAR P,GIRSHICK R,et al.Feature pyramid networks for object detectionC/Proceedings of the2017 IEEE Conference on Computer Vision and PatternRecognition(CVPR).2017:936-944.18 DAI J F,LI Y,HE K M,et al.R-FCN:Object detectionvia region-based fully convolutional networksC/Proceedings of the 30th Internat

50、ional Conference on Neural Information Processing Systems.2016:379-387.19 REDMON J,DIVVALA S,GIRSHICK R,et al.You onlylook once:Unified,real-time object detectionC/Proceedings of the 2016 IEEE Conference on Computer Visionand Pattern Recognition(CVPR).2016:779-788.20 LIU W,ANGUELOV D,ERHAN D,et al.S

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服