基于3D注意力的MobileNet图像分类算法改进.pdf

资源描述

1、第卷第期重庆邮电大学学报(自然科学版).年月 ().:./.基于注意力的图像分类算法改进收稿日期:修订日期:通讯作者:周伟松 .基金项目:重庆市科委一般项目()重庆市教委项目():()()韩晓良陈佳昌周伟松(重庆邮电大学复杂系统智能分析与决策重点实验室重庆)摘要:针对网络在图像分类任务中特征表达不足的问题提出一种结合注意力机制对网络的改进策略利用一种新颖的高效且无参的注意力模块同时结合模块来替换网络中的倒残差模块采用激活函数替代原激活函数保留更多特征结合结构进行多尺度特征提取与融合使其可以提供更强的多尺度特征表达并服务于图像分类任务使用数据扩增技术生成更多样本

2、与种方法进行对比实验结果表明采用注意力机制的网络在数据集、上以最少的网络参数分别取得.和.的最高精度表明该改进方法可以有效地进行快速图像分类关键词:卷积神经网络()图像分类结构注意力机制中图分类号:文献标志码:文章编号:()(.):.:()引言随着互联网技术的快速发展人们进入了大数据时代其中图像作为重要的信息载体包含大量的信息是当今主流的信息传播形式之一如何从大规模图像数据集当中对图像快速分类来提取视觉信息是当今分类、检测领域不断研究和突破的技术关键点传统的图像分类算法依赖于先验知识和对分类任务的认知理解会消耗大量劳动成本泛化能力差不适应急剧增长的数据集无法满足数据时代变革的需求近

3、年来人工智能领域快速发展使得借助计算机模拟人类思考方式以及神经网络的接收和反馈方式对图像进行处理、分析和理解成为可能深度学习是机器学习的延续并且使其准确度和运行速度达到工程落地的要求随着在神经网络图形运算的优势得到应用深度学习进入新的发展阶段其中卷积神经网络()快速推进了图像分类的发展年使用并行化技术在数据集使网络层数达到了层并在图像分类领域取得了突破而后发展出更深层次的、纵行加宽的、利用残差解决网络退化的等性能优秀的网络模型更深的网络意味着更多的计算量、更高的推理延迟因此这些网络模型不能部署在计算能力和存储设备有限的移动设备和嵌入式设备为了使深度神经网络技术在工程中得

4、到应用需要借助轻量型的网络架构来减少模型参数的数量提出的系列是一种小巧而高效的模型从标准卷积方面着手将其分解为深度卷积和逐点卷积有效降低了常用模型的参数和计算复杂度中提出倒残差模块替代传统残差模块实现了网络性能的提升在前人工作的基础上设计一种结合无参注意力模块与相结合的网络结构其主要思想为卷积层使用激活函数保留更多图像特征通过特征融合层传递到下一层倒残差模块的设计会导致信息损失和梯度混淆在倒残差模块的基础上提出模块在更高维度上进行恒等映射与空间变换同时在第二个深度卷积部分加入结构来获取多尺度特征有效缓解信息损失与梯度混淆受人脑注意力机制启发利用注意力

5、机制结合能量函数计算注意力权值由于空域抑制现象能量函数越低神经元与周围神经元区别越大重要性越高能够更好地提取特征信息将其与模块相结合以此代替中的倒残差模块在新的网络当中进行有效性的验证相关工作.网络结构网络作为轻量型网络的代表在移动设备中得到了应用的核心在于将经典的结构上的池化层和部分全连接层用深度可分离卷积层代替卷积运算是神经网络的主要计算量来源因此可从卷积层面着手进行轻量型网络的设计将标准卷积的过程进行进一步简化将其拆分为深度卷积和逐点卷积深度卷积通过使用与输入图像相同深度的卷积核作用于通道再通过逐点卷积进行信息融合和输出过程如图所示图深度可分离卷积.图中表示输入

6、通道数量表示输出通道数量深度可分离卷积与普通卷积参数对比如下 ()重庆邮电大学学报(自然科学版)第卷()式中:表示卷积核的大小表示特征映射图大小在采用卷积核大小为的深度可分离卷积时网络各层中卷积核数量为与所采用的卷积核大小为占普通卷积部分相比影响微乎其微可以忽略网络的深度可分离卷积运算量只有原网络模型的/有效降低了网络的参数量通过深度可分离卷积替代传统卷积使得其可以进行模型简化加快移动端设备部署.激活函数激活函数是中神经元进行非线性学习的关键点激活函数一定程度上克服了梯度消失问题和加快了训练速度但依然存在着弊端因为激活函数将所有负值都设为随着训练次数的增

7、加深度部分的卷积核所对应的权重得不到更新出现大量神经元失活现象深度卷积过程中有的神经元出现失活失活神经元仍会占用空间对于轻量型网络造成复杂度的增加这也是轻量型神经网络相比传统大型网络精度较低的原因因此采用激活函数替代激活函数来解决无法及时更新负特征信息造成的神经元失活其函数表达式为()如果其他()在训练过程中是从/中随机抽取的数值测试过程当中选取训练过程中的平均值激活函数可以保留提取到的负值特征信息一定程度上减少神经元失活从而增强卷积过程中特征提取能力.注意力机制注意力机制本质是对现有资源的一种分配机制在深度学习网络当中所分配的资源就是权重注意力机制最早在自然语言当中得到应用

8、然后拓展到图像分类领域由提出将注意力模块加入到支路当中通过加强各通道之间信息的交换在增加了小部分参数后使得网络性能得到提升对于提取到的特征信息经过注意力机制的计算突出其重要的特征从而更好地将数据进行有效区分作为中使用最广泛的注意力机制可以方便地嵌入或者网络当中分配特定的通道权重使性能得到提升但是计算权重需要增加参数计算和运行时间增加了模型复杂度不利于移动端设备的使用因此寻找更为合适的无参注意力机制与网络结合对于解决轻量型模型精确度不高的问题尤为重要改进的卷积神经网络.神经网络的结构作为轻量型网络的代表得到了广泛应用但与此同时也存在着提取特征能力不足的缺点网络的倒残差

9、模块采用先升维后降维的结构会削弱梯度跨层传播的能力通道数先升后降低使高维度特征信息压缩会造成信息丢失基于其不足于是提出模块减少模块提取特征时候的损失在深度卷积部分加入注意力模块在不增加参数运算的情况下增强对通道和位置注意力的关注加入结构提高多尺度特征提取同时针对负值特征信息采取激活函数替代激活函数将其作用于模块进行取反层特征融合经过批量归一化、交叉熵损失函数和全局平均池化层达到分类要求将网络各层的参数设置与网络保持一致并根据数据集中照片的尺寸对步距进行调整改进后的网络结构流程图如图所示其中网络参数设置如表所示其中是升降部分的倍数因子是特征矩阵深度是重复次数

10、是步距当且仅当时使用残差结构表网络参数设置.输入尺寸操作 .特征信息的提取和融合网络不断纵向加深不适应于这类轻量型网络会增加网络参数和运算时间因此将所提出的结构应用到深度可分第期韩晓良等:基于注意力的图像分类算法改进离卷积当中来通过和两个深度卷积并行的结构来横向加宽该层网络使得其感受野得以扩大可以提取更多尺寸的特征信息深度卷积所包含的局部特征信息大于潜在的局部特征信息因此对深度卷积层按照如下规则进行处理并进行特征信息融合图网络结构流程图.对输入图像进行深度卷积处理()()同时对输入图像进行深度卷积取反处理 ()()将提取到的特征信息按照如下规则进行特征融合()()

11、()()()式中:表示当前网络层表示当前层第个特征图表示作用于该层卷积核表示偏置表示深度卷积.模块在卷积神经网络当中残差网络的设计有利于缓解梯度混淆问题并且提高模型性能在中设计的倒残差模块采用先升维后降维的设计如图所示会影响梯度回传模块会保持更多的信息从层传递到层有助于梯度回传同时在第二次深度可分离卷积的时候采取结构来获取多尺度信息该模块可以在执行过程中获取更多的空间信息结构如图所示经过模块在更高维度进行空间变换相比于倒残差模块可以减少信息损失保留更多特征信息提高网络性能.注意力机制和注意力机制都提高了网络准确率但是都增加了网络参数量对于等轻量型网络的设计不匹配

12、受人脑种注意力协同工作机制启发与现有通道注意力和空间注意力相比注意力为特定层中的特征映射推断三维注意权值在视觉神经科学当中信息最丰富的神经元会显示出独特放电形式激活的神经元对周围神经元具有空域抑制利用能量函数找到每个神经元的重要性推导出能量函数的快速闭环形式的解来度量神经元之间的线性可分性图倒残差模块.图模块.重庆邮电大学学报(自然科学版)第卷注意力机制所采用的能量函数为()()()()()式中:表示偏置表示通道数表示神经元对能量函数采用二值标签并增加正则项求得最小能量函数为()()()通过对该能量函数的快速闭环形式的解来获取神经元的重要性属于无参注意力机制使得改

13、进后的网络在不增加网络参数的情况下准确率得到提升.算法步骤设置网络结构的初始学习率为.采用学习率衰减方法训练当训练到个时降为初始学习率的/个降为/算法步骤如下对训练集和验证集进行划分对数据集进行数据扩充转换为与网络相匹配的数组初始化网络权重超参数宽度系数设置为对网络进行训练利用函数输出、参数利用更新网络的权重和偏置判断每个下的精度保留最好结果训练结束时将参数写入文件实验结果与分析.实验数据集本实验采用和数据集数据集中的类图片相互排斥且没有重叠是分类下的复杂数据集数据集都采用/作为训练集/作为验证集选取验证集的精度作为网络分类的评价指标数据集部分样本如

14、图所示.实验仿真环境实验仿真环境采用.框架编程语言为.为.操作系统为位使用使用内存为以实现所有实验图数据集的部分图例.训练过程及实验对比将的图片输入网络采用随机旋转、随机裁剪等数据扩充方式采用深度卷积采取卷积核的分支部分卷积核采用相同数量的和对每次卷积所得到结果采用激活函数进行非线性特征提取和负特征信息融合利用能量函数中所提供的通道和位置权重将其作用于深度卷积部分能量越低神经元与周围神经元区别也大其重要性越高将结构作用于第二个深度卷积部分采用优化策略为了评价该改进方法在上的分类效果在相同参数设置的情况下对、这种网络对数据集进行训练个确保网络达到收敛

15、将数据集中验证集的精度记录下来进行对比结果如图和图所示比较种网络的精度图准确率变化曲线.第期韩晓良等:基于注意力的图像分类算法改进图准确率变化曲线.训练结果分析图和图分别是原网络、模块、注意力模块种情况在和的准确率变化表为实验精度和参数对比从表的实验精度对比中表明激活函数可以一定程度缓解神经元失活带来的精度降低注意力与结合的网络模型准确率明显高于和注意力机制同轻量型模型和相比网络参数更少精度更高在的实验数据当中相比基础网络注意力机制都得以提升了准确率但注意力机制相比注意力机制提升更为明显提升了.的精度在更复杂的百分类数据集当中

16、无参注意力结合能量函数所提供的权重使得相比初始网络和其他注意力机制取得了更明显的提升相比初始网络准确率得到了.的提升表实验精度和参数对比.网络结构网络参数/识别率/网络参数/识别率/.结束语深度可分离卷积可以有效地降低网络的参数量在保证精度的情况下使轻量型网络模型得到应用结合注意力机制相比于通过增加网络参数的注意力机制从人脑注意力机制着手采用无参注意力在未增加网络参数的情况下取得更好的准确率提升特别是在更多分类的复杂情况下取得更大的提升表明该轻量型网络可以胜任复杂的分类任务未来工作内容是进一步优化模块使之可以胜任更多分类任务参考文献:.:/.:.():.():./.:./.

17、:.重庆邮电大学学报(自然科学版)第卷 /.:.:/.().:/./.:/.:.:/.:.:/.:./.:.袁梅全太锋黄俊等.基于卷积神经网络的烟雾检测.重庆邮电大学学报(自然科学版)():.()():.:/.:./.().:/././:.:.:/.().:/././.:.()():./.:./.:.:/.:.作者简介:韩晓良()男河北人硕士研究生主要研究方向为图像处理、深度学习:.陈佳昌()男重庆人硕士研究生主要研究方向为图像处理、犹豫模糊集:.周伟松()男江西人副教授博士硕士生导师主要从事神经网络稳定性控制与应用方面的研究:.(编辑:刘勇)第期韩晓良等:基于注意力的图像分类算法改进

展开阅读全文