基于YOLO v5的工人玩手机行为检测方法研究.pdf

资源描述

1、第卷第期年月南京工程学院学报(自然科学版)().:./.投稿网址:/.基于的工人玩手机行为检测方法研究林宝华刘坤朱一帆王晓(南京工程学院自动化学院江苏南京)摘要:为规范工人生产行为、减少安全事故发生提出一种监控工人使用手机行为检测算法.该算法以模型为基础对其网络结构和损失函数进行改进.首先优化主干网络将和结构引入浅层网络增加浅层特征的提取然后在主干网络与特征聚合网络之间构建注意力机制层过滤冗余信息最后选取损失函数代替损失函数提高模型收敛速度与检测结果的定位精度.通过自建工人使用手机行为数据集分别对原模型、改进模型以及主流模型进行对比.试验结果表明在人体和手机

2、目标检测中改进模型有更好的检测精度和检测速度.关键词:行为检测注意力机制损失函数中图分类号:收稿日期修回日期作者简介林宝华硕士研究生研究方向为图像处理、计算机视觉.引文格式林宝华刘坤朱一帆等.基于的工人玩手机行为检测方法研究 .南京工程学院学报自然科学版 .工人在各类操作环境中都有相应的操作行为规范要求正确的操作行为不仅能保证工作效率和产品质量还能避免重大安全事故的发生保障操作人员的生命安全.智能手机作为新时代的产物广泛应用于日常生活和工作中吸引了工人的注意力从而增加了安全隐患发生的概率.为了确保工人在参与生产的过程中能够专心工作减少手机的使用较为常见的做法是在工厂内安

3、装摄像头南京工程学院学报(自然科学版)年月监控工人的行为由监管人员来监看和提醒.随着社会自动化程度的不断提高使用人力进行行为监督在安全性和高效性上的弊端都愈加明显.由人力监看视频存在反馈周期较长、标准不一致、业务不熟悉等问题并且人力难免会出现疲劳、松懈等情况造成监看疏漏.随着人工智能的发展基于深度学习的检测方法逐渐替代了人力监管成为当下研究热点.文献基于目标检测算法对视频中的人体与手机信息进行提取联合手机目标直方图分布信息判断在岗员工是否存在玩手机行为文献采用神经网络对课堂视频中的学生与手机目标坐标信息进行回归通过手机目标边界框与学生目标边界框重叠面积来判断学生是否有玩手机行为文献通过图卷

4、积对人物关节点进行特征提取引入视频背景建模算法完成手部区域的动作判别实现课堂玩手机、拍照、看时间行为的区分文献通过增加属性分类器来改进目标检测算法利用行为属性特征实现图像中打电话行为的检测文献基于对视频中的行人候选区域进行提取构建分类网络完成打电话和抽烟行为的分类.这些模型主要应用于成像清晰场景且模型复杂度较高难以满足实时检测的需求.本文应用场景为工厂生产区域的视频监控手机目标相对于整个监控画面占比较小存在分辨率低、检测物体与背景颜色对比度低等问题.针对存在的问题提出改进目标检测算法用于检测工厂监控视频中是否存在工人使用手机的行为方便管理人员及时处理减少安

5、全事故的发生.模型介绍及改进.算法介绍系列目标检测算法为单阶段目标检测算法可直接回归输入图像的类别置信度与坐标信息.目前网络模型有深度与宽度不断递增的、和四种版本本文采用的基准模型为 .网络结构可分为主干模块()、特征融合模块()、预测模块()三个部分.模块包含、和结构主要实现目标特征的提取.结构通过切片操作将平面信息转换到通道维度能很大程度地减少信息损失(见图()结构中使用残差连接缓解深度神经网络中梯度消失问题结构通过不同大小的池化核进行最大池化提高网络感受野分离出显著的上下文特征(见图().模块采用与相结合结构通过下采样、上采样和堆叠操作将主干网络获得的特征反复提取能够获得

6、较强的语义信息和空间信息.模块包含先验框对应的位置、置信度和类别信息用于计算损失函数和预测结果.()结构()结构图包含结构.网络结构优化.主干网络优化手机目标存在尺寸小、监控视角下成像像素低、细节信息少等问题特征在下采样过程中容易丢失故手机小目标信息主要集中在浅层网络中.为防止手机目标信息流失在主干网络前个模块之间引入结构和来增加对浅层特征的提取在不过多增加模型复杂度的同时提高小尺寸目标的检测性能.使用现有的结构和方法通过新的架构和优化策略训练模型在数据集上实现新的准确率.结构示意图如图所示.第卷第期林宝华等:基于的工人玩手机行为检测方法研究图结构示意图包含()卷积、激

7、活函数和 ()模块.传统卷积核的通道数与输入特征的通道数相同而卷积的卷积核通道数固定为个即一个通道只被一个卷积核卷积.卷积相比于传统卷积大大减少了运算量和参数的数量控制了模型复杂度的增加.注意力机制工厂内光线偏暗导致目标与背景区分不明显在对人体与手机目标检测过程中易出现漏检、错检问题.视觉注意力机制能够学习到目标特征在特征图中重要程度关系从而增加目标特征在整个特征图中的权重提高检测物体准确率.在与之间引入卷积注意力模块()注意力放大主干网络传出的三个特征层中的目标特征权重保证在特征聚合网络中传播的信息更有效.包含通道注意力模块()和空间注意力模块()能够自适应关注目标的通道信息和平面信

8、息.注意力机制模块具体实现过程为(见图):图注意力机制 )将输入特征图()分别进行和维度的全局最大池化()和全局平均池化()得到个的特征图将两个特征图送入一个共享权值的双层神经网络()进行通道间依赖关系的学习将输出的特征进行加和操作由回归函数实现归一化获得输入特征层通道的权重将权重与输入特征图相乘获得新特征图().)将新特征图()基于维度进行最大池化和平均池化操作得到个()的特征图将特征图基于通道维度进行堆叠操作得到()的特征图降维为单通道的特征图()由回归函数实现归一化生成空间维度的权重将空间维度权重信息与特征图()相乘获得新特征图()此时新特征图中目标通道信息和平面信

9、息得到放大.改进的网络模型如图所示.损失函数优化目标定位使用矩形边界框预测目标在图像中的位置通过计算边界框损失值进行反向传播来优化预测边界框的位置.在模型中采用损失函数修正边界框的位置计算公式为:()/()式中:为真实框与预测框的交并比、分别为真实框、预测框区域为和区域的最小外接矩形.由式()可知当预测框在真实框内部时无法预测边界框和真实框的位置关系即出现如图所示情况时值的大小不变.本文采用损失函数替代损失函数作为边界框的损失函数损失函数包含预测框和真实框的重叠损失、预测框和真实框的中心距离损失、预测框和真实框的宽和高损失三个部分计算公式为:南京工程学院学报(自然科学版)

10、年月图改进网络模型结构图图预测框与真实框包含情况 ()()()()式中:、分别为预测框和真实框的中心点为和间的欧式距离为最小外接矩形对角线距离、分别为预测框的宽、高、分别为真实框的宽、高、分别为最小外接矩形宽、高.损失函数考虑了重叠面积、中心点距离、长宽边长真实差比损失函数检测效果好.试验及结果分析.试验环境及参数设置本试验在操作系统下进行为内存为为显存为 .训练环境为.、.、.、.等.试验数据集来源于网络爬虫数据与监控画面截取数据共张图像采用对图像中的人体和手机目标进行标注.数据集按照的比例划分为训练集、验证集和测试集训练集中共包括个工人目标和

11、个手机目标.利用聚类算法调整预设锚框促进模型检测效果、提高模型在训练过程中的收敛速度调整后的锚框分配见表.设定输入图像尺寸为分别进行次冻结训练与次解冻训练前个采用数据增加方式进行训练后个不采用任何数据增强方式进行训练.设置为使用余弦退火学习率及优化器进行训练最大学习率为.最小学习率为.表调整后锚框分配表特征图锚框尺寸()()()()()()()()().评估指标采用目标检测常用评估指标平均精度均值()和帧率()进行模型评估.、和的计算公式为:/()/()()()第卷第期林宝华等:基于的工人玩手机行为检测方法研究式中:为正确分类的正样本数为错误分类的负样本数为

12、平均精度为错误分类的正样本数()为以召回率为横坐标、精确率为纵坐标绘制的曲线为每个类别的均值.试验结果分析在自建数据集上训练改进模型得到损失函数曲线(见图)和训练集曲线(见图):当迭代次数接近次时模型开始逐渐收敛训练集趋于平稳最终训练集损失函数稳定在.验证集损失函数稳定在.训练集稳定在.图训练集和验证集损失函数曲线图本研究设计种模型对不同改进方法进行分图训练集曲线图析每种模型使用相同的训练参数进行训练原模型与改进模型关于人体与手机数据集指标对比如表所示.模型为对主干网络的改进模型在基准模型上提升了.、提升了./模型在模型的基础上加入注意力机制

13、模型对比模型有较大的提升且只降低了./模型引入损失函数替代损失函数作为边界框的损失函数对比模型检测精度提升了.本研究最终模型的试验结果为.、为./相较于原模型提升了.检测速度提升了.图为改进前后的检测效果图.由图可见改进模型能准确检测出目标位置且提高了置信度.表种模型各指标试验结果模型损失函数()/()/().模型.模型.模型.()模型()改进模型图原模型与改进模型检测结果对比南京工程学院学报(自然科学版)年月.不同网络模型对比试验为了检测本文算法对手机与人体目标的检测性能引入、进行对比试验.对比结果见表.表不同网络模型对比结果模型()/()/值/

14、().本文算法.由表可知本文算法达到.检测精度具有明显优势仅比最高的低./.综合检测精度与检测速度本文算法整体性能相比主流模型具有一定优势.结语针对工人异常行为问题本文提出一种改进网络模型用于检测工人使用手机行为的识别算法.将卷积模块引入浅层网络以增加对小目标特征的提取然后在主干特征提取网络与特征聚合模块之间引入混合注意力机制提高对重要特征的关注度并用自建工人与手机目标数据集来训练模型采用聚类算法重新调整预设锚框引入损失函数计算样本的定位损失.试验结果表明改进后的模型比原模型提高.、检测速度提升能够准确定位视频监控中的手机与人体目标信息.参考文献:傅建中.智能制造装备的发展现状与趋势.机电工程():.何素刚.五大趋势引领“智慧企业”发展.装备制造():.侯景严.基于机器视觉的高危企业生产过程智能监控.西安:长安大学.:/.:.:/./.王京.基于目标检测算法的课堂异常行为识别系统研究.成都:成都理工大学.冯思哲.基于深度卷积神经网络的学生课堂行为识别研究.西安:长安大学.张越.基于深度学习的抽烟与打手机行为检测算法研究.成都:电子科技大学.:/.:.包纯.基于深度学习的视频监控异常行为识别系统的设计与实现.武汉:华中科技大学.:./.:./.:.:/.:.:/().:./.:.

展开阅读全文