收藏 分销(赏)

基于DeepLabv3%2B的轻量级电力线语义分割方法.pdf

上传人:自信****多点 文档编号:636494 上传时间:2024-01-21 格式:PDF 页数:6 大小:2.16MB
下载 相关 举报
基于DeepLabv3%2B的轻量级电力线语义分割方法.pdf_第1页
第1页 / 共6页
基于DeepLabv3%2B的轻量级电力线语义分割方法.pdf_第2页
第2页 / 共6页
基于DeepLabv3%2B的轻量级电力线语义分割方法.pdf_第3页
第3页 / 共6页
基于DeepLabv3%2B的轻量级电力线语义分割方法.pdf_第4页
第4页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、计算机时代 2023年 第9期0 引言输电线路的定期巡检是保证国家供电稳定的重要工作,巡检内容主要包括线路相关组件巡检和电力线周边危险地物巡检。电力线是输电线路的主要构成部分,确保电力线安全是输电线路巡检的重中之重1。输电线路环境复杂,人工巡检效率低,并存在着较大的安全风险。随着无人机技术的发展,无人机能更方便地采集输电线路相关信息,但在巡检过程中无人机容易与电力线发生碰撞等危险事故,对无人机的飞行安全具有极大的威胁。无人机使用激光雷达2-3所检测电力线的精度较高,但所需要硬件的成本也相对较高,相比之下,相机成本更低并且容易在无人机上安装。现有通过相机进行的电力线识别方法可分为传统视觉方法和基

2、于深度学习的方法。传统视觉方法主要分为基于边缘检测算子的识别算法和基于联合特征的识别算法。边缘检测算子可以通过先验知识,再加上直线检测来识别电力线。基于联合特征也是DOI:10.16644/33-1094/tp.2023.09.005基于DeepLabv3+的轻量级电力线语义分割方法方家吉,赖一波,唐正涛,喻擎苍(浙江理工大学计算机科学与技术学院,浙江 杭州 310018)摘要:针对电力巡检中传统视觉电力线识别精度不高,现有基于深度学习的电力线分割速度慢的问题,提出一种基于DeepLabv3+的轻量级电力线语义分割方法。首先使用Mobilenetv2替换原始主干网络Xception,并对ASP

3、P模块进行先降维后升维的操作,在不降低模型感受野和分割精度的情况了减少了模型的参数量。使用Focal Loss和Dice Loss组合的损失函数加强了模型对电力线的分割效果,最后采用多尺度特征融合和注意力机制进一步减少了分割结果中的图像噪点。改进的DeepLabv3+相较于原网络分割速度提升了108.65%,mIoU和mPA分别提升了1.58%和2.09%。关键词:语义分割;电力巡检;DeepLabv3+;电力线提取中图分类号:TP391.41文献标识码:A文章编号:1006-8228(2023)09-19-05Lightweight power line semantic segmentat

4、ion method based on DeepLabv3+Fang Jiaji,Lai Yibo,Tang Zhengtao,Yu Qingcang(School of Computer Science and Technology,Zhejiang Sci-Tech University,Hangzhou,Zhejiang 310018,China)Abstract:Aiming at the problems of low accuracy of traditional visual power line recognition and the slow speed of existin

5、gpower line segmentation methods based on deep learning,a lightweight semantic segmentation method for power line recognitionmethod based on DeepLabv3+is proposed.Firstly,the original Xception backbone network is replaced with Mobilenetv2,and theASPP module is operated by dimensionality reducing and

6、 then dimensionality increasing,which reduces the number of parameterswithout reducing the models receptive field and segmentation accuracy.The combination of Focal Loss and Dice Loss as the lossfunction enhances the models segmentation performance on power lines.Finally,multi-scale feature fusion a

7、nd attention mechanismare used to further reduce the noise in the segmentation results.Compared to the original network,the improved DeepLabv3+hasincreased the segmentation speed by 108.65%,mIoU by 1.58%,and mPA by 2.09%.It meets the requirements for the speed andaccuracy of power line segmentation.

8、Key words:semantic segmentation;power inspection;DeepLabv3+;power line extraction收稿日期:2023-03-16作者简介:方家吉(1998-),男,浙江兰溪人,硕士研究生,主要研究方向:计算机视觉、计算机控制。通讯作者:喻擎苍(1969-),男,浙江台州人,博士,浙江理工大学教授,硕士研究生导师,主要研究方向:计算机视觉、计算机控制。19Computer Era No.9 2023通过线检测器,再加上全局辅助物或者上下文信息进行识别。文献4中使用Roberts算子和Hough变换来锁定电力线范围,之后使用总体最小二

9、乘法来提取电力线,在背景较为简单的时候有不错的提取效果。文献5提出了一种具有空间对称结构的DLCI算子,拥有非常高的识别精度,但DLCI算子最大只能容忍设计角度20 的偏差。传统图像方法由于人为地加入了一些先验知识和辅助物,导致某一种算法只在特定场合下能有较高的识别精度,在其他复杂背景下很容易失效。目前基于深度学习的语义分割方法主要有FCN、SegNet、U-Net、PSPNet 以及 DeepLab 系列等。Choi等6通过FCN网络来分割电力线,其主要目的是为了降低海量电力线数据集的标注成本,模型参数较大。Zhang等7选取了VGG-16来分割电力线,其所使用的数据集较少,但VGG-16的

10、参数量也非常庞大,不满足实时分割的要求。Yang 等8提出了 PLE-Net 模型,在复杂的自然背景下分割电力线效果较好,但没有对比模型之间的预测速度,无法得知其具体运行速度表现。本文针对现有电力线识别方法存在的问题,提出了一种基于DeepLabv3+的轻量级电力线语义分割方法。该模型包含了融合不同尺度特征的模块;用于减少参数量的改进ASPP模块;用于减少分割结果中的图像噪声的注意力机制。同时,使用DiceLoss损失函数来解决样本数据不平衡问题,采用了FocalLoss损失函数来让模型进一步关注困难样本,在提升了预测速度的同时提高了电力线分割的精度。1 基础模型理论1.1 DeepLabv3

11、+模型图1DeepLabv3+模型结构DeepLabv3+是目前主流的语义分割网络架构之一,它在 DeepLabv3 的基础上增加了解码器模块来增强分割效果。该网络的编码器部分使用了主干网络Xception来提取主要特征,此外,ASPP模块中的不同速率的并行空洞卷积被用来获取高维特征并通过11卷积进行通道压缩。在解码器部分,主干网络中提取的低维特征与ASPP模块输出的高维特征融合,然后利用33卷积和上采样精细目标边界,从而输出预测结果。图1为DeepLabv3+的模型结构。1.2 轻量级主干网络Mobilenetv2Mobilenetv2是一种轻量级的卷积神经网络架构,目的是为了在移动设备上实

12、现高效的预测。Mobilenetv2在Mobilenet的基础上引入了倒残差块,从而在仍保持效率的同时提高准确性。倒残差块主要是使用深度可分离卷积,即逐点卷积和逐通道卷积的组合来捕捉更复杂的特征。表1为Mobilnetv2模型结构。表1Mobilenetv2模型结构Input22423112232112216562242823214264142967216072320721280111280Operatorconv2dbottleneckbottleneckbottleneckbottleneckbottleneckbottleneckbottleneckconv2d 1x1avgpool7x

13、7conv2d 1x1t-1666666-c3216243264961603201280-kn1123433111-s212221211-表1中:t是扩展因子,第一层11卷积层中卷积核的扩展倍率。c是输出特征通道数量。n是bottleneck的重复次数。s是步距(仅在操作中第一层卷积的时候生效)。2 基于DeepLabv3+的轻量级图像语义分割算法2.1 总体框架基于DeepLabv3+的轻量级图像语义分割算法,是基于以下方式实现的:先使用Mobilenetv2替换原本的Xception主干网络大幅降低参数量;再通过改进ASPP模型在感受野不变的同时降低了参数量;最后通过多尺度特征融合和注意力

14、机制模块进一步提高了分割精度。改进算法的网络结构如图2所示。20计算机时代 2023年 第9期图2改进的DeepLabv3+模型2.2 改进ASPP模块左安全等人9提出的DeepLabv3+模型中提到了瓶颈级联ASPP模块,将原DeepLabv3+模型的空洞率从原先的6,12,18改为3,6,9,12,提取更细小的目标和特征的同时扩大了感受野,通过空洞卷积分支和级联空洞卷积加强对电力线的细节特征提取,减少漏分割现象。感受野是指在深度神经网络中,输出的某个特征图像素在输入图像上映射区域的大小。感受野大小对于深度神经网络的性能非常重要,较小的感受野可能会导致网络无法捕捉到输入图像中的局部特征和上下

15、文信息,而较大的感受野则可能会导致网络对于噪声和细节过于敏感。因此,在设计深度神经网络时通常需要平衡感受野大小和模型的计算复杂度。空洞卷积的感受野r计算公式为:ri=k+j=1i-1()k-1 dj其中,k是卷积核的大小,dj是第j层卷积层的空洞率,ri是第i层卷积层在输入前的感受野大小。对比原DeepLabv3+模型,空洞率为18的33空洞卷积分支参数代入式可求得经过卷积后的感受野为3939。对比之下,改进的空洞率为9的33空洞卷积分支串联卷积后感受野也为3939。表2改进ASPP模块不同卷积分支数量效果对比ASPP卷积分支数量3层4层mIoU(%)79.4179.47mPA(%)89.14

16、89.18参数量(MB)15.0115.68预测速度(frame/s)43.8741.34通过在空洞卷积前后使用 11 卷积先降维后升维的方式来减少训练参数量,参考了文献9中所提出的4层卷积分支,对比了3层卷积分支,在本文数据集中并没有过于明显的提升,如表2权衡了参数量和效果后,本文使用了3层卷积分支的ASPP改进模型,如图3所示。图3改进的ASPP模块2.3 瓶颈注意力模块BAM瓶颈注意力模块(Bottleneck Attention Module,BAM)是一种用于加强卷积神经网络特征表达能力的注意力机制。BAM模块主要由两部分组成:通道注意力模块和空间注意力模块。通道注意力模块用于自适应

17、地调整不同通道特征的重要性,而空间注意力模块用于调整特征图的空间分布。图4为BAM工作原理,本文在编码器与解码器中分别加入 BAM,用来提取出更准确的电力线特征信息,以此来获取更高的分割精度。图4瓶颈注意力模块(BAM)工作原理2.4 损失函数电力线的像素点通常在图像中所占的比例较小。当使用标准的交叉熵损失函数(Cross Entropy Loss,CE Loss)进行模型训练时,损失函数会更倾向于像素点占比更高的背景,模型难以学习到电力线的特征信息。Li等10提出,在NLP的场景中这种类别数据不均衡的问题是十分常见的,比如机器阅读理解(MRC),损失函数负样本数量远超过正样本,导致容易的负样

18、本会主导了模型的训练,因此提出了Dice Loss11,本文使用其简化的Dice Loss形式,表达式为:LDice=1-2tiyi+()ti+yi+其中,其中yi为网络预测值,取值范围为(0,1)。ti为target值,取值非0即1。是一个极小数,称为平滑系数,主要是为了避免负样本的作用为0,让训练更加平滑。21Computer Era No.9 2023何凯明团队在CE loss基础上增加动态调整因子,提出了Focal Loss12,用来处理样本不平衡的场景,同时也让模型更关注样本的难易程度。表达式为:LFocal=-t()1-ptlogpt其中,t为权重因子,()1-pt为调节因子,pt

19、为对应类别的预测概率,为聚焦参数。总损失函数表达式为:L=LDice+LFocal如表 3 所示,对于原 DeepLabv3+(Mobilenetv2)模型使用不同的损失函数组合进行训练,Focal Loss+Dice Loss 的组合要比 CE Loss+Dice Loss 的组合更好一点,说明了 Focal Loss 在处理数据集中困难样本的时候有一定的效果。表3Focal Loss和CE Loss对DeepLabv3+模型分割精度的影响损失函数CE Loss+Dice LossFocal Loss+Dice LossmIoU(%)77.5378.16mPA(%)88.9589.263 实

20、验结果与分析3.1 实验数据集现有的电力线公开数据集较少,故本文的电力线数据集一部分是无人机拍摄采集的54张80006000图片,从中裁切出 391张 15001000分辨率的天空、草地、树林和复杂背景的图片,并使用Labelme进行标注;另一部分是从现有公开集 Wire Dataset13中选取的 462 张图片。本文将数据集中的 100 张作为测试集,其余图片进行随机旋转、水平或垂直翻转、裁切、改变亮度和对比度的方式增强至3012张,将这3012张按照9:1的比例划分为训练集和验证集。图5为本文数据集中自己拍摄的电力线图片样本。图5无人机拍摄的电力线图片样本3.2 实验环境本文的实验环境为

21、Windows10,内存配置32GB,CPU 配 置 为 AMDRyzen53600,显 卡 为 NVIDIAGTX 1660super(6G),深度学习网络框架为 Pytorch1.8.1,训练轮数为100轮。3.3 实验评价指标本文使用平均交并比(mean Intersection over Union,mIoU)和平均像素精度(mean Pixel Accuracy,mPA)作为语义分割算法分割精度的评价标准。mIoU为各个类别的真实值和预测值的交并集之比,用来反应预测结果与原始图像中真值的重合程度,表达式为:mIoU=1n+1i=0npiij=0npij+j=0npji-pii其中,n

22、表示标签的类别数量;n+1表示包含背景的标签类别数量;pii中第一个i表示实际的标签类别,第二个i表示预测的标签类别,即pii表示实际为i类,预测也为i类的像素数量;pij表示实际为i类预测为j类的像素数量;pji表示实际为 j 类预测为 i 类的像素数量。mIoU的取值范围是0,1,mIoU的值越大,说明图像各个类别平均分割效果越好。平均像素精度(mPA)是正确分类的像素数量与所有像素数量的比值后的平均值,表达式为:mPA=1n+1i=0npiij=0npij其中,参数与式一致。3.4 实验与结果分析3.4.1 不同分割网络模型的对比图6展示了各个网络模型在测试集上的一部分分割结果。可以看到

23、,原 DeepLabv3+(Mobilenetv2)和DeepLabv3+(Xception)模型已能够识别出每根电力线,但当背景较为复杂或者背景颜色比较接近电力线的时候,分割出的电力线会有漏分割和错分割的现象,如图6(a)中组中草地和水泥地面的混合干扰和图6(c)中汽车边框线条的干扰。改进后的模型能减少错分割的现象,并一定程度上减少电力线中断的情况。这是由于改进后的模型在提取高维特征的同时融合了经过注意力机制的低维特征,使得模型在获取电力线区域特征的时候,注重了局部细节特征,减少了分割结果中噪声的出现。22计算机时代 2023年 第9期图6图像真实标签和各网络模型分割结果示例表4展示了各个网

24、络模型在测试集上分割精度、预测速度以及参数量上的区别。进一步结合图6可以看出,改进的DeepLabv3+在预测速度和分割精度上取得了一定的平衡,并在分割效果上优于原模型。在对比实验中,U-Net(vgg)取得了最好的效果,在分割精细度上优于其他模型,甚至在图6(b)中能够分辨出最左边的电力线有两根,但由于vgg网络庞大,在参数量和预测速度上明显不符合轻量级的定义,故不适合在移动端使用。PSPNet 在 resnet50 和 Mobilenetv2 两种主干网络下提取复杂背景下的电力线特征效果并不好。由于图6(a)分辨率是15001000,在传入PSPNet前做了resize,原本细小的电力线变

25、得更细,PSPNet无法做出预测,对比主干网络同为 Mobilenetv2的 DeepLabv3+有较大的差距。而在Wire Dataset数据集上的图像,PSPNet 虽说可以分割出导线,但仍由于分割精度的不足,分割出的电力线持续中断,且边缘过于粗糙。表4不同网络模型分割的性能对比方法改进的DeepLabv3+DeepLabv3+(xception)DeepLabv3+(mobilenetv2)U-net(vgg)PSPnet(resnet50)PSPnet(mobilenetv2)mIoU(%)81.4379.8578.1684.4663.7661.66mPA(%)91.7489.6589

26、.2692.4171.4570.07参数量(MB)18.56208.722.1894.95187.189.2预测速度(frame/s)31.3615.0341.678.8126.1183.883.4.2 消融实验与对比为了进一步验证对DeepLabv3+的改进有效,做了消融实验,如表5中“”表示使用了改进策略。表5消融实验低维特征融合ASPP改进注意力机制mIoU(%)78.1679.8279.4180.7681.43mPA(%)89.2689.3189.1491.2991.74参数量(MB)22.1825.6615.0118.4918.56预测速度(frame/s)41.6735.7343.

27、8734.3131.364 结束语在电力线识别上,针对传统视觉方法精度不高和现有神经网络不能兼顾分割速度和精度的情况,本文提出一种轻量级的电力线分割网络模型方法。使用轻量级网络Mobilenetv2来替换DeepLabv3+原始主干网络Xception,改进ASPP模块来进一步降低整体分割模型的参数量。提取低维特征进行多尺度融合来提高电力线边缘的分割精度,并加入注意力机制来减少电力线错分割和漏分割现象,最后通过消融实验来验证了改进策略的有效性。与其他分割模型对比,改进后的模型在电力线的分割精度和速度上拥有更好的平衡性,与原DeepLabv3+(Xception)相比,本文模型预测速度提升了 1

28、08.65%,mIoU 和 mPA 分别提升了1.58%和2.09%。本文改进的电力线语义分割模型兼顾精度和预测速度,可以应用于电力线的实时分割场景,意义非凡。本文模型在识别更精细的电力线时仍有较严重的漏分割现象,后续研究可尝试数据集尺度多样化,在不降低预测速度的前提下改进模型,对更细的电力线实现准确分割。(下转第28页)23Computer Era No.9 2023自己的,就能实现非法修改验证码。如图7所示,Web对用户密码的更改流程。图7密码更改流程攻击者先用自己的账户来进行一个完整“找回密码”流程,并记录流程接口数据,如果系统校验不严格,会导致攻击者输入受害者手机号发送验证码,之后直接

29、丢弃验证码检验数据包跳到输入新密码修改密码接口,以此来实现任意用户密码更改。6 结束语Web安全逻辑漏洞是开发者在系统开发时期没有充分考虑到系统的安全逻辑性所导致的,在实际Web应用环境中普遍存在,而且很难被漏洞扫描探测出来,一旦被攻击者利用,攻击行为就很难被拦截且溯源也极为困难。本文通过HTTP数据包工作机制与流程,从验证码机制缺陷、密码认证绕过、敏感信息泄露、越权漏洞、业务逻辑一致性这五个方面,且通过具体实例来阐述Web安全逻辑漏洞挖掘思路。接下来将继续对逻辑漏洞安全识别与修补做深入研究,同时结合深度学习技术,为单位与企业的Web系统的安全开发提供有效的理论参考。参考文献(Referenc

30、es):1 Douglas Jacobson.网络安全基础网络攻防、协议与安全M.电子工业版社,2016.2 谢其祥,李莎.基于沙盒技术及社会工程学角度分析和防范钓鱼攻击的研究J.广东通信技术,2022,42(9):46-51.3 陈春玲,雷世荣,陈丹伟.分布式防火墙的原理、实现及应用J.南京邮电学院学报,2002(4):5-10.4 刘欣然.网络攻击分类技术综述J.通信学报,2004(7):30-36.5 范展源,罗福强.JWT 认证技术及其在 Web 中的应用J.数字技术与应用,2016(2):114.6 马洪亮,王伟,韩臻.混淆恶意JavaScript代码的检测与反混淆方法研究J.计算机

31、学报,2017,40(7):1699-1713.参考文献(References):1 赵乐,王先培,姚鸿泰,等.基于可见光航拍图像的电力线提取算法综述J.电网技术,2021,45(4):1536-1546.2 朱钱鑫,朱钱肖,张丙珍,等.复杂地物背景下的无人机激光雷达电力线提取方法J.电工技术,2022,567(9):54-56.3 屈年赦,白晶石,曹铁军.激光雷达在输电线路巡线中的应用J.电力勘测设计,2022,168(6):6-9,40.4 操昊鹏,曾卫明,石玉虎,等.基于Hough变换和总体最小二乘法的电力线检测J.计算机技术与发展,2018,28(10):164-167.5 赵乐,王先

32、培,姚鸿泰,等.基于局部上下文信息的电力线提取算法J.高电压技术算法,2021,47(7):2553-2566.6 Choi H,Koo G,Kim B J,et al.Weakly supervised powerline detection algorithm using a recursive noisy labelupdatewithrefinedbrokenlinesegmentsJ.ExpertSystems with Applications,2021,165:113895.7 Zhang H,Yang W,Yu H,et al.Detecting power lines inU

33、AV images with convolutional features and structuredconstraintsJ.Remote Sensing,2019,11(11):1342.8 Yang L,Fan J,Huo B,et al.PLE-Net:Automatic power lineextractionmethodusingdeeplearningfromaerialimagesJ.Expert Systems with Applications,2022,198:116771.9 左安全,秦伦明,王悉,等.基于改进DeepLabv3+模型的电力线语义分割方法J.无线电工程

34、,2023,53(1):96-104.10 Li X,Sun X,Meng Y,et al.Dice loss for data-imbalancedNLP tasksJ.arXiv preprint arXiv:1911.02855,2019.11MilletariF,NavabN,AhmadiSA.V-net:Fullyconvolutional neural networks for volumetric medicalimagesegmentationC/2016fourthinternationalconference on 3D vision(3DV).Ieee,2016:565-571.12 Lin T Y,Goyal P,Girshick R,et al.Focal loss for denseobject detectionC/Proceedings of the IEEE interna-tional conference on computer vision,2017:2980-2988.13 黄巨挺,宏力,戴志坤.基于编码解码结构的移动端电力线语义分割方法J.计算机应用,2021,41(10):2952-2958.CE(上接第23页)CE28

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服