1、计算机与图像技术Computer&Multimedia Technology电子技术与软件工程Electronic Technology&Software Engineering178水下目标识别技术是声呐设备应用和水中武器系统智能化的关键技术之一1。水下目标声呐成像是通过对目标回波进行波束形成获得目标的图像2,与光学图像相比,声呐图像的分辨较低,而水下应用中声呐对目标的成像距离一般远大于目标的物体尺度,因此目标在声呐图像中轮廓特征模糊,加上水下混响与噪声影响,声呐图像中目标原有灰度值被破坏,从而对目标识别产生严重影响,所以识别前对噪声进行滤除预处理显得尤为重要。近年来,YOLO 系列的卷积神
2、经网络凭借其运算快、框架简单、存储空间小、背景误检率低在目标识别领域上受到广泛关注3。它直接对整幅图片回归训练,只需要通过一次网络就可以得到目标的位置信息和类别信息,这样大大提高了识别效率。本文将 YOLOv5s 作为目标识别网络,结合改进均值滤波算法,对前视声呐图像中的目标进行识别,通过试验验证算法的可行性和高效性。1 算法概述水下应用中声呐对目标的成像距离一般远大于目标的物体尺度,目标在声呐图像上成像面积小,表现多为一个亮斑,而噪声与混响干扰会叠加在目标成像亮斑上,对识别造成了很大难度。根据湖试采集的图像特点和目标的成像特点,本文提出了一种水下目标自主识别方法,具体流程如图 1 所示。2
3、声呐图像滤波预处理2.1 均值滤波均值滤波是一种线性滤波器,通过选取一定大小的滤波窗口,然后计算该窗口内所有像素点的灰度均值,作为中心点的输出4。该方法虽然抑制了噪声,但是会损失图像的边缘信息,从而丢失特征信息。2.2 中值滤波中值滤波是一种非线性滤波,主要用来处理脉冲噪声和椒盐噪声,而且它可以很好地保留图像细节5。它基于改进均值滤波的水下静目标识别方法研究李孟霏梁镜冯朝(中国船舶集团有限公司第七一研究所 湖北省宜昌市 443000)摘要:本文提出了一种基于改进的均值滤波目标识别方法。该方法通过剔除滤波窗口中的野值,然后以滤波窗口中像素点值与其归一化加权值相乘实现图像的滤波预处理,再用 YOL
4、Ov5s 作为目标识别网络对可疑目标进行初识别,最后通过目标尺度特征匹配完成并对深度学习识别结果的筛选。实验结果表明,该方法可以有效的提升图像的信噪比,提高声呐图像中目标识别准确率,并输出真实的目标信息。关键词:水下目标识别;前视声纳;均值滤波;目标筛选;YOLOv5s图 1:声呐软件自主处理流程图计算机与图像技术Computer&Multimedia Technology电子技术与软件工程Electronic Technology&Software Engineering179以每个像素点为中心,选取一定大小的滤波窗口,计算该窗口内所有像素点的中值,替代中心点的像素值。但是对于图像中含有较多
5、点、线、尖角细节的,不适合采用该算法除噪。2.3 改进均值滤波由于传统的滤波方法对声呐图像去噪效果不佳,本文使用了改进的均值滤波算法对噪声进行滤波处理,具体流程如下:(1)以待处理的一帧声呐图像的每一点为中心,选取 ww 大小的滤波窗口,去除窗口内极大值和极小值的像素,剩下 k 个像素的集合记为 H。H=f(i,j)|f(i,j)!=Max(f(i,j)或f(i,j)!=Min(f(i,j)(1)(2)计算 H 中像素点的平均值,记为 Mean(f(i,j)。(3)计算 H 中每个像素点的灰度值与平均值的差的绝对值,记为 Dk。Dk=|Hk-Mean(f(i,j)|(2)(4)计算 H 内所有
6、像素点 Dk的平均值,记为 T。(3)(5)将步骤 4 中求得的 T 作为一个阈值,如果某个像素点对应的Dk大于该阈值,则权值由Dk决定,否则,由 T 决定。表达式见式(4),计算 H 中各像素点对应的权值 wk(i,j)后并归一化处理,然后按式(5)将像素值和权值加权作为滤波窗口中心点的输出。(4)(5)3 声呐图像分块模型训练时,输入的图像一般为固定的小尺寸,例如640640的图片,而一般声呐图像尺寸会大于该尺寸,如果直接对图像进行缩放,那么图像会变得模糊从而损失特征信息,所以将一帧声呐图像切分成 15 块分别作为网络的输入,为了避免切分时,目标恰好出现在分割线上,让切片之间保留重合部分,
7、分割后的图片大小为640640 或 672672,识别后再将图片组合还原,经过后续测试,该模型 1 秒可以处理 50 帧图像。4 目标筛选为了降低模型的虚警率,此处需要对检测出来的目图 2:目标筛选流程图图 3:滤波处理对比图计算机与图像技术Computer&Multimedia Technology电子技术与软件工程Electronic Technology&Software Engineering180标进行筛选,选出真实目标的检测框信息输出,流程图如图 2 所示,具体操作为:(1)根据定位设备获取声呐所处位置的经纬度信息;(2)假设每帧图像的宽为 w0,高为 h0,检测框的位置信息假设为
8、(x,y,w,h),则疑似目标的位置为,根据式(6)、式(7)转换为极坐标的形式(,);(6)(7)(3)根据式(8)、式(9)可求得目标与声呐之间的距离 dist 和夹角 angle,其中 ratio 为距离分辨率,最后结合声呐的经纬度可以求得目标的经纬度。angle=(8)dist=ratio (9)5 实验结果与分析本实验使用前视声呐探测水下静态目标,在水域采集多组数据用来训练 YOLOv5s 模型和评估算法的有效性。5.1 均值滤波为了更好地显现不同滤波算法的效果,在原图像上加入了密度为 0.1 的椒盐噪声。图 3 分别为处理前、均值滤波、中值滤波和改进的均值滤波处理后的声呐图像,滤波
9、窗口大小为 55,可以看出,经过均值滤波处理后图像的边缘信息丢失,图像变得更加模糊,中值滤波在滤除椒盐噪声的同时,保留了一定的图像细节。改进的均值滤波方法相较于中值滤波,不仅有效的对噪声进行平滑,并且减少了图像的细节损失,图像细节更清晰。5.2 目标探测实验本实验的探测目标为球形目标,通过改变声呐搭载的平台的位置从多个方向进行探测,将采集到的声呐图像经分割后,从分割中的图片中选取 1374 张用来训练,使用 LabelImg 软件对图片进行标注,由于目标特点为亮斑,水中非目标的成像与目标很相似,为了降低虚警率,设置了两类标签,0 类为目标,1 类为其他。将标注好的数据随机选取 1099 张作为
10、训练集,275 张作为测试集。采用 YOLOv5s 网络作为检测模型,使用NVIDIA rtx3090 显卡、CUDA11.4 的计算机进行训练和测试。模型共进行了 300 次迭代,batch size 的大小图 4:模型的损失函数变化曲线计算机与图像技术Computer&Multimedia Technology电子技术与软件工程Electronic Technology&Software Engineering181为 128 张,从实际任务的需求出发,使用 0.2 精确率+0.3 召回率+0.5mAP 作为模型的评价指标。以第 610614 帧声呐图像为例,网络共检测出 3 个疑似目标,
11、通过观察检测框的连续性和计算目标经纬度,认为目标 1 为真实目标,通过与目标布放时真实的经纬度比较,发现目标 1 确实为真实目标,目标 2 和目标 3均为虚假目标,证明使用的筛选目标的方法是可行的。为了验证本文所提算法的性能,设置了 3 组对比实验,结果如表 1 所示,可以看到,经过改进均值滤波算法处理后,YOLOv5s 模型的识别效果有所提升,证明本文提出的方法是有效的。图 4 是模型训练过程中损失函数变化曲线,可以看到训练集上,大约 200 轮分类损失函数开始收敛,图 5是训练时精确率-召回率曲线。6 结论本文通过优化均值滤波,在滤除图像的椒盐噪声的同时,改善了传统均值滤波存在的丢失图像边
12、缘信息的问题,显著提升了图像的质量,为后续的目标识别创造了有利前提,将 YOLOv5s 模型用于水下目标识别,实验结果验证了该方法可以有效提高识别精确率,通过对目标进行筛选,进一步优化了模型的识别效果,降低虚警率。本研究预期可以在声呐图像预处理和水下目标自主识别上应用。参考文献1 弭博雯,田莹,王诗宁.基于优化卷积神经网络的人耳识别 J.辽宁科技大学学报,2018,41(4):9.2 孙亚晶.基于深度学习的声呐图像目标识别技术研究 D.东南大学,2019.3 曾子力.深度学习在计算机视觉领域的应用进展J.计算机产品与流通,2020(1):1.4 卢京晶,方中华,孙胜利.一种自适应的加权均值滤波
13、器 J.传感技术学报,2005,18(4):4.5 张恒,雷志辉,丁晓华.一种改进的中值滤波算法J.中国图象图形学报:A 辑,2004,9(4):4.6 唐聪.基于深度学习的目标检测与跟踪技术研究D.国防科学技术大学,2021.7 张佳帅,李攀,缪华桦,等.一种基于 YOLO v5s网络结构的目标检测方法及系统,CN202210528 222.5P.2022.作者简介李孟霏(1997-),女,土家族,湖南省常德市人。硕士研究生学历,助理工程师。研究方向为目标识别。梁镜(1990-),男,湖北省赤壁市人。博士学历,高级工程师。研究方向为信号与信息处理。冯朝(1987-),男,湖北省咸宁市人。研究生学历,高级工程师。研究方向为 UUV 控制。表 1:不同方法的识别结果比较检测方法精确率召回率mAP加权YOLOv5s+原始0.8690.6920.8190.791YOLOv5s+中值滤波0.8770.7030.8270.800YOLOv5s+均值滤波0.7990.5780.6670.667YOLOv5s+改进均值滤波0.8660.7430.8530.823图 5:精确率-召回率曲线