1、基于残差和注意力网络的声呐图像去噪方法赵冬冬1,叶逸飞1,陈朋1*,梁荣华1,蔡天诚1,郭新新21 浙江工业大学计算机科学与技术学院,浙江 杭州 310023;2 中国科学院深海科学与工程研究所,海南 三亚 572000 InputDIRDIRConvDCAConvDIRDIRDIROutputNoise estimate networkDenoise network摘要:前视声呐作为一种水下主动声呐设备常用于采集水下图像数据,然而会受到水下噪声的影响导致图像质量下降。针对这一问题,本文提出了一种基于密集残差和双通道注意力机制网络的前视声呐图像去噪方法。首先采用双通道注意力机制对声呐图像的通道
2、信息进行提取,统计声呐图像的全局信息,输出声呐图像的噪声图;密集残差块根据噪声图和声呐图像,充分学习不同尺度上的特征信息,经过多次学习和信息传递后输出干净声呐图像。针对前视声呐图像及其噪声特点,模拟了前视声呐图像并添加瑞利分布的乘性噪声和高斯分布的加性噪声,生成模拟数据集用于网络训练和性能评估。在模拟数据集和真实数据集的实验中表明,本文方法能够有效去除噪声,保留图像细节。关键词:前视声呐;噪声模拟;图像去噪;通道注意力;密集残差中图分类号:U666.7文献标志码:A赵冬冬,叶逸飞,陈朋,等.基于残差和注意力网络的声呐图像去噪方法 J.光电工程,2023,50(6):230017Zhao D D
3、,Ye Y F,Chen P,et al.Sonar image denoising method based on residual and attention networkJ.Opto-ElectronEng,2023,50(6):230017 Sonar image denoising method based onresidual and attention networkZhao Dongdong1,Ye Yifei1,Chen Peng1*,Liang Ronghua1,Cai Tiancheng1,Guo Xinxin21 College of Computer Science
4、 and Technology,Zhejiang University of Technology,Hangzhou,Zhejiang 330063,China;2 Institute of Deep-sea Science and Engineering,Chinese Academy of Sciences,Sanya,Hainan 572000,ChinaAbstract:As a kind of underwater active sonar equipment,forward-looking sonar is often used to collectunderwater image
5、 data.However,it will be affected by underwater noise,which leads to the degradation of imagequality.Due to this situation,a forward-looking sonar image denoising method is proposed based on denseresiduals and a dual-channel attention mechanism network.Firstly,the two-channel attention mechanism isa
6、dopted to extract the channel information of the sonar image,collect the global information of the sonar image,and output the noise map of the sonar image.Based on the noise image and sonar image,the dense residual blockfully learns the feature information at different scales and outputs a clean son
7、ar image after multiple learning andinformation transfer.Because of the forward-looking sonar image and its noise characteristics,the forward-looking 收稿日期:20230120;修回日期:20230405;录用日期:20230411基金项目:国家自然科学基金青年科学基金项目(62001418);浙江省自然科学基金项目(LQ21F010011);中国科学院战略性先导科技专项项目(A 类)(XDA22030302);浙江省属高校基本科研业务费专项资金
8、项目(RF-C2019001)*通信作者:陈朋,。版权所有2023 中国科学院光电技术研究所 Opto-Electronic Engineering 光 电 工 程 Article2023 年,第 50 卷,第 6 期DOI:10.12086/oee.2023.230017230017-1sonar image is simulated and the multiplicative noise of Rayleigh distribution and the additive noise of Gaussiandistribution are added to generate a simul
9、ation dataset for network training and performance evaluation.Experimental results on the simulated data set and real data set show that the proposed method can effectivelyremove the noise and retain image details.Keywords:forward looking sonar;image denoising;noise simulate;channel attention;dense
10、residual 1 引言随着人类社会经济的发展,在海洋区域上人们也在积极探索,海洋中所蕴含的丰富的能源、矿产和生物资源具有极高的价值,因此如何获取水下信息数据对于海洋科学和海洋经济的发展至关重要。前视声呐作为一种用于探测水下目标并测定其速度、位置、运动方向的设备,在海底勘探、海洋渔业资源捕获、军事目标检测等方面都有广泛应用。由于电磁波在水中传播时大部分能量被海水所吸收,传播距离有限,传统的光学成像系统难以获得远距离的清晰图像,前视声呐虽然有足够的探测距离。然而在水下声呐图像受到的噪声干扰严重,分辨率较低且容易出现信息缺失1-2,因此在对前视声呐图像进行去噪时,需要在去除噪声的同时,尽可能地保
11、留声呐图像的纹理、边缘等细节信息。传统去噪算法的类型大致称为:空间域滤波、变换域阈值滤波、统计模型、稀疏表示方法、字典学习方法和混合方法等3。其中空间域滤波包括局部滤波和非局部滤波,常用的降噪局部滤波器有高斯滤波器、最小均方滤波器、双边滤波器、维纳滤波器、苏珊滤波器等4。局部滤波器的实现思想是基于像素之间的相关性实现的,在高噪声水平的图像上表现较差。为了解决这个问题,Buades5等人引入了一种非局部均值滤波器,该方法以非局部的方式在整个图像区域中利用像素之间的相似性来去噪。Wu6等人提出了一种基于稀疏表示的声呐图像去噪方法,对原图进行DCT 字典分解重构和 OMP 去噪。Jiang7等人提出
12、了一种利用分析模型进行稀疏分解的去噪方法,该方法对于侧扫声呐图像的散斑噪声具有良好的去噪效果。Chen8等人提出了一种基于固定水域噪声模型的水声图像去噪方法,在对声呐图像去噪的同时保持一定的图像边缘信息和纹理信息。Stolojescu-Crisan9等人提出了一种在小波域上的声呐图像处理算法,填补了去噪时缺失像素产生的缺口。范等人10和陈等人11都提出了一种基于自适应三维块匹配滤波(BM3D)的侧扫声呐图像散斑降噪方法,有效地降低侧扫声呐图像中的散斑噪声获得了良好的视觉效果。然而传统去噪方法往往是在熟悉了噪声的规律下才能产生较好的去噪效果,对于一些复杂的或者强度水平不同噪声效果往往并不理想。随
13、着计算机硬件设备性能的飞速提升,基于深度学习的去噪方法也在蓬勃地发展,卷积神经网络在光学领域上的去噪具有非常大的发展前景。Zhang12等人为了能够使用单一模型去除不同噪声水平的图像,提出了基于下采样子图像的网络 FFDNet,该网络在推理速度和去噪性能之间的平衡性比较好。DnCNN13和 ASCN14提供了一种新的思路,通过学习真实图像和训练图像的残差分布,对降噪问题进行建模。ResNet15提出了残差思想,解决了深度 CNN 训练困难的问题,许多人将其应用创新在图像处理领域16-17,Ledig18等人提出了基于对抗生成网络(GAN)和残差网络(ResNet)的方法用于图像的去噪和超分辨率
14、,在光学图像上能够恢复较真实的图像纹理。王晓娜19等人提出了一种分通道反卷积的方法,该方法首先对原始图像进行颜色空间转换,然后对不同颜色通道进行分别处理,相比传统的反卷积,该方法在保证清晰度的同时,降低了图像噪声,并且缩短了运行时间。Cheng20等人通过学习特征空间中的一组重构基来训练一个能够分离信号和噪声的 UNet21结构网络,选择相应的信号子空间基并将输入投影到该子空间中,利用全局结构信息来保持低亮度和弱纹理的区域结构。随着注意力(Attention)机制在自然语言处理领域的成功应用,也有人将其应用到了图像处理中来实现不同的任务22-24。在图像去噪方面,Wang25等人将空间注意力机
15、制和通道注意力机制融合在一起,提出了一种通道和空间注意力神经网络(CS-ANN)用于图像去噪,采用了对称跳跃连接和残差块避免梯度消失和浅层特征的损失。Tian26等人在注意力引导机制的基础上提出了一种图像去噪卷积神经网络,网络通过稀疏块、特征增强块、注意力机制块和图像重构块串联构成,提取复杂背景中隐藏的噪声并去除。CBDNet27赵冬冬,等.光电工程,2023,50(6):230017https:/doi.org/10.12086/oee.2023.230017230017-2由噪声估计子网络和噪声去除子网络两个子网络构成。在噪声估计阶段,使用了连续的多个卷积层对输入的原图像进行噪声提取;在噪
16、声去除阶段,将提取到的噪声和原图一起输入到 Unet21中,输出去噪图像。目前基于神经网络的图像去噪方法大多都是基于光学图像上的去噪,声学图像上的应用研究并不像光学如此丰富。并且现有方法在网络加深时收敛速度容易下降,特征图经过层层传递容易丢失部分信息,导致全局信息利用不完全,且特征提取方式单一,导致训练效果变差。由于声呐图像的特殊性,公开的声呐图像数据集十分匮乏且获取困难,如何将深度学习的方法应用到声呐图像的去噪上是一个不小的挑战。Jensen28等人提出了一种利用声学原理设计的一个超声系统 FieldII,该系统可以模拟超声成像系统,通过配置不同类型的超声传感器,计算发射声场和回波声场来生成
17、图像,可以应用在医疗图像上,前视声呐也是一种声学设备,因此可以使用 FieldII 来模拟生成前视声呐数据。本文提出了一种基于密集残差和双通道注意力机制 网 络(dense in residual and dual channel attentionnetwork,DIRANet)用于前视声呐图像去噪。该算法首先使用双通道注意力(dual channel attention,DCA)模块提取声呐图像的通道信息,捕获全局信息并输出声呐图像的噪声图,之后采用密集残差(dense inresidual,DIR)模块,对原图和噪声图均采用编码-解码结构进行图像融合重建,充分学习不同尺度上的特征信息,经
18、过多次学习和信息传递之后,生成干净图像。最后使用 FieldII 生成的模拟前视声呐数据集并添加模拟噪声的数据集以及真实声呐数据集进行去噪对比实验,结果表明本文算法在各项指标上均优于对比的图像去噪算法。2 DIRANet本文提出了密集残差和双通道注意力机制网络(DIRANet)用于前视声呐的图像去噪,其中设计了双通道注意力机制(DCA)模块用于噪声估计以及密集多尺度残差块 DIR 用于噪声去除,网络整体由噪声估计和噪声去除两个阶段构成。在噪声估计阶段利用 DCA 模块提取图像通道之间的联系,统计全局信息,获得更多和噪声有关的信息,并输出噪声估计图;噪声去除阶段利用 DIR 模块对噪声估计图和原
19、图像进行不同尺度上的特征高效提取,提升网络的接受域范围,获取更多的特征信息,最终输出去噪后的前视声呐图像。图 1 为本文所提出的 DIRANet 网络结构图,该网络主要分为两个子网络。第一阶段为噪声估计子网络,第一个块为 33 的卷积层和 ReLU 激活函数构成,接着是一个 DCA 模块,用于增强特征图的通道联系,统计全局信息,最后经过一个卷积层和 ReLU 激活函数,输出噪声估计水平图。第二阶段为噪声去除子网络,该网络主体结构为编码器-解码器结构,编码器和解码器由 DIR 模块构成,DIR 模块通过块内构建的分层残差结构,对不同层的特征图进行多尺度的特征提取,提升网络的接受域范围,最终输出噪
20、声去 InputNoise estimate networkDIRDIRConvDCAConvDIRDIRDIROutputDenoise network图 1DIRANet 整体结构图Fig.1DIRANet overall structure diagram 赵冬冬,等.光电工程,2023,50(6):230017https:/doi.org/10.12086/oee.2023.230017230017-3除后的图像。2.1 噪声估计子网络在神经科学中视觉皮层神经元的感受野大小是由刺激调节的,基于这种思想,本文提出了一种基于分离、融合过程的双通道注意力机制(DCA)模块用于构建噪声估计子网
21、络,DCA 模块结构如图 2 所示。在分离阶段,使用不同卷积核大小来自适应地接受不同规模的信息,并分别将这些信息分流到下一层神经元中,这些不同的分支融合之后经过全局平均池化操作后融合生成一个全局的注意力权重信息,之后用一维卷积生成一维向量,相比于全连接层,一维卷积层在处理通道注意力权重时,可以直接对通道维度上的特征进行卷积操作,提取特征之间的相互依赖关系,而不需要将整个通道特征进行展平并传入全连接层中,获取更多信息的同时减少了计算量。U RCHWX1,X2 RCHWX1 RC/2HWX2 RC/2HWDCA 将输入的特征图分离成两组通道数相同的特征图,对其分别进行33 和 55 卷积核大小的卷
22、积得到和,获得不同感受野的特征图。X1X2FRCHWFF1 RC11F1F2 RC1将和进行连接操作得到新的特征图,随后,我们对特征图进行分组提取权重。首先通过二维全局平均池化(AverageGlobalPooling)得到,将压缩(squeeze)到二维,F2t R1CF2tw RC11然后将其进行矩阵转置(transpose)得到,对进行一维卷积操作,将结果进行维度拓展(unsqueeze)与矩阵转置得到总体权重矩阵。w=unsqueeze(conv(transpose(squeeze(avgpool(F).(1)X1w1 RC/211X2w2 RC/211对 w 进行两次相同的操作分别得
23、到特征图对应的通道权重矩阵和特征图对应的通道权重矩阵。X1X2w1w2X1X2Uout将特征图、分别和权重、相乘,并将、进行连接,得到最终输出的特征图。整体流程表示如式(2):Uout=concat(w1X1,w2X2).(2)DCA 结构有如下优势:1)相比一般的通道注意力机制的模块,本结构设计了一种双路的通道注意力机制,主要通过使用两个不同尺寸的卷积核实现,通过 33 和 55 的两个不同大小的卷积核构成两条路径,这两条路径能够获取不同尺寸的信息,提升网络的信息提取能力。2)使用一维卷积而不是传统的全连接层生成通道特征图,因为一维卷积的参数量比全连接层要少得多,并且可以直接在通道维度上进行
24、卷积操作,不需要将整个通道特征作为参数传入。并且一维卷积可以自适应地学习相邻通道之间的权重,增强通道之间的联系。InputConvConvAvgPoolSqueezeTransposeX1Fww1Uoutw2X2UX1F1F2F2tX2ConvUnsqueezeSqueezeSqueezeTransposeTransposeConvConvUnsqueezeUnsqueezeCCOutput图 2DCA(dual channel attention)模块Fig.2DCA(dual channel attention)mudule 赵冬冬,等.光电工程,2023,50(6):230017http
25、s:/doi.org/10.12086/oee.2023.230017230017-4 2.2 噪声去除子网络噪声去除子网络将上层网络输出的噪声估计图以及原始图像作为输入,进行噪声去除。网络整体结构由编码器和解码器堆叠构成,每个模块分层提取图像的浅层和深层信息,并将不同深度的信息进行合并处理,最终输出去噪后的图像。xiConvjxixi;i jxixj本文提出 dense in residual(DIR)结构如图 3 所示。为了能够在更细粒度的水平上提高多尺度的表示能力,首先将输入的特征图依据通道数划分成 s 个特征图子集,和原特征图相比,每个新子集都有相同的特征图大小,但是通道数为原特征图通
26、道数的 1/s,每一个都对应一个卷积层,为了匹配这些特征图子集,将卷积层中具有 n 个通道的 33 的卷积核替换成了 s 个通道数为 m 的 33 卷积核组,其中 n=s*w,其中每一个 卷 积 核都 可 以 都 可 以 从 特 征 图 子 集,中接受特征信息,并且每一个分割的 进行一次卷积操作之后,都可以输出一个比 更大的接受域,除了第一组卷积核只接受其对应的输入特征图,之后的每一组卷积核都接受之前所有卷积核的输出和其对应的输入特征图,直至处理完所有的输入特征图。每个卷积层之间的紧密连接,使得每一层学习到的特征能够较快地传播给下一层,其学习曲线会比较平滑,经过这样层层的不同大小的特征组合提取
27、,可以将信息进行充分地融合。DIR 结构使用了残差结构中密集连接的设计,具体而言,将 11 卷积层的输出拆分成 4 个小组,33卷积层替换成了 3 个较小的 33 卷积对特征图进行分组卷积,每一个小卷积的结果又会输入到其后面的每一个小卷积上,将所有结果进行连接操作,加上恒等映射层,输出最终结果:yi=xii=1Convi(xi)i=2Convi(y1,y2,yi1,xi)2 i g,(3)yiConvi其中,表示每一小组经过卷积后输出的特征图,表示卷积操作,其中每一个卷积层所接受的特征图大小都不相同,融合了多种尺度的特征图。DIR 模块有如下优势:1)相比一般的残差模块,本文将原有的 33 卷
28、积层切割成了若干组卷积核数量相等的 33 卷积,分组卷积可以减少参数量提升训练速度,并且前一组卷积都会将其结果作为输入传递到后一组卷积中进行处理,这种方式提升了之后每一组卷积的接收信息量,增加了信息处理的能力。2)在更细粒度上设计了残差和密集的连接方式,每一层之间的紧密连接使得信息的传递更加的快速和流畅,每一组卷积可以接收前几层所学到的知识,提升网络的特征提取能力。3 数据集 3.1 模拟前视声呐数据集本文的模拟前视声呐数据使用 FieldII 来模拟生成。设置中心频率为 350 kHz,采样频率为 1.4 MHz,圆弧形发射阵,129 个换能器,520 条波束。为了让模拟的前视声呐图像更加贴
29、近真实场景,模拟了不同形状的物体并将其放置在声呐场中的不同位置,波束形成之后得到原始声呐图像,将极坐标系下的图像转化到笛卡尔坐标系,最终得到了扇形的前视声呐图像如图 4 所示。声呐图像的噪声主要为乘性散斑噪声29-31,Yu 等人29指出散斑噪声是一种乘性的局部相关的噪声,在医学超声图像中都存在,对于图像的质量会造成不 Conv 1x1Conv3x3Conv3x3Conv3x3X4X3X2X1Y4Y3Y2Y1Conv 1x1InputOutput图 3DIR(dense in residual)结构Fig.3DIR(dense in residual)structure 赵冬冬,等.光电工程,
30、2023,50(6):230017https:/doi.org/10.12086/oee.2023.230017230017-5小的影响除了散斑噪声之外,Karabchevsky 等人30也指出了散斑噪声是存在于激光成像、雷达、SAR 和超声波成像等相干成像中的一种颗粒状噪声。散斑噪声是一种乘法噪声,即它与该区域的局部强度成正比,基于这种特性,可以用具有指数分布的乘法模型来描述这种噪声 R。R=Ax+Ay,(4)AxAy其中,R 表示瑞利分布的噪声,和表示一对具有高斯分布、均值为零、方差相同的绝对独立的随机变量。当一个随机二维向量的两个分量呈独立的、均值为零,有着相同的方差的正态分布时,这个向
31、量模呈瑞利分布。因此这两个高斯分布叠加之后的分布也就是瑞利分布。因此使用瑞利分布的模型可以模拟乘性散斑噪声。水下的环境噪声对图像质量也有一定的影响,但是相比散斑噪声对图像的影响要小得多而环境噪声可以描述为加性的高斯噪声32-33,在这里本文将前视声呐带噪声的图像模型用如式(5)表示:IR(x,y)=I(x,y)R(t)+NG(x,y),(5)IRR(t)(t)NG其中,表示含噪声图,I 表示原声呐图像,表示均值为 0、方差为的瑞利分布噪声,其方差随时间在区间 0.1,1.5 内均匀分布,可用来模拟非平稳环境下的噪声,表示均值为 0 方差为 1 的加性高斯噪声。总体上模拟图像添加了乘性的瑞利噪声
32、和加性的高斯噪声,噪声的方差会随着时间的改变而改变,这样的不稳定噪声图像可以使网络学习到更多的噪声特征并增强网络对不同噪声环境的适应能力和鲁棒性。本文使用的模拟前视声呐图像如图 4(a)所示,图 4(b)为添加噪声后的图像,最终生成了 10000 份模拟前视声呐图像噪声对,将其中的 7000 对作为网络的训练集,剩下的取 2000 对作为验证集,1000 对作为测试集。3.2 真实声呐数据集30.0130.1S52.0624.0W本文选择 Giacomo34等人通过前视声呐采集到的数据作为真实数据集,该数据集使用型号为 LBV300-5 的探测车辆,车辆上配有差分全球位置系统(DGPS)、指南
33、针以及 Teledyne BlueView 的多波束前视声呐设备。车在 位置,维持在水下 0.3 米的深度和水上 3 米的高度行驶,前视声呐设备以采集距离 50 m,开角 130 度的形态收集数据,总共收集了 2894 幅声学图像,图像里包含石头、码头、河岸、船体等物体的声学信息。4 实验结果与分析 4.1 全参考图像质量评估对于模拟生成的前视声呐图像噪声对,采用峰值信噪比(peak signal to noise ratio,PSNR)来评价噪声去除效果,使用结构相似性(structural similarity,SSIM)来评价去噪图像的信息完整性。4.1.1峰值信噪比峰值信噪比mn给定一
34、张大小为的原图像 I 与经过处理的图像 K,PSNR(公式中简写为 PPSNR)定义为:PPSNR=10log10(2B1MMSE)(6)281=255其中,B 为图像像素点表示的位数 若图像为 8 位,则其所能表示的最大像素值为,均方误差定义为 MSE(公式中简写为 MMSE):MMSE=1mnm1i=1n1j=0I(i,j)K(i,j)2.(7)PSNR 的值越大,表示去噪后的图和原图越接近,也就是去噪效果越好。4.1.2结构相似性结构相似性给定两个图像 x 和 y,两张图像的结构相似性 ab图 4模拟前视声呐图像。(a)原始图像;(b)噪声图像Fig.4Simulated forward
35、-looking sonar images.(a)Original image;(b)Noisy image 赵冬冬,等.光电工程,2023,50(6):230017https:/doi.org/10.12086/oee.2023.230017230017-6(SSIM,公式中简写为 SSSIM)定义如式(8)所示:SSSIM(x,y)=(2xy+c1)(2xy+c2)(2x+2y+c1)(2x+2y+c2),(8)xy2x2yxyc1=(k1L)2,c2=(k2L)2k1=0.01,k2=0.03其中,是图像 x 的平均值,是图像 y 的平均值,是图像 x 的方差,是图像 x 的方差,为 x
36、 和 y的协方差。,这两个值是用来维持数值稳定的常数。L 是图像像素值的动态范围。SSIM 值越大则表示两张图像越相似。4.2 无参考图像质量评估对于没有真实干净图像的声呐图像,采用一种无参考的空间域图像质量评估算法 Brisque35来评价去噪效果。该算法首先提取自然场景统计信息,计算局部归一化亮度,然后将该值拟合到广义高斯分布(GGD)来计算特征向量,最后放到支持向量机中进行训练,生成图像质量得分。4.3 模拟声呐图像对比实验BM3D10算法首先对每个参考块进行相似块匹配(Block-Matching)并得到一个三维组合,然后对该组合进行三维协同变换滤波(3D-Transform),最后对
37、滤波结果进行整合,生成最终去噪结果图。DnCNN 网络13在 VGG 网络结构的基础上进行修改,整体上是卷积层(Conv)、批量归一化层(BN)和激活函数层(ReLU)级联并不断重复的结构,模型内部不使用跳跃连接,但是网络的输出是残差图像,即噪声图像减去干净图像后的结果,因此将噪声图像减去残差图像即可得到干净图像。CBDNet27由噪声估计-噪声去除两阶段构成,对于不同的噪声,通过两个子网络强化对噪声的提取和去除,提高去噪效果。CNCL36是一种基于深度学习中的生成对抗网络,该网络中的生成器生成干净图像,判别器通过互补的方式学习图像数据集中的图像与噪声两种信息进行更加精确的判别。DeamNet
38、37是一种基于模型的去噪方法,利用自适应一致先验性模型的推理过程指导神经网络的优化,最终建立一个端到端的去噪网络,将模型知识和深度学习相结合。本文分别采用 BM3D10,DnCNN13,CBDNet27,CNCL36,DeamNet37和本文提出的算法对模拟声呐图像噪声对进行去噪实验,对测试集上的所有图片进行测试验证。实验结果如图 5 和表 1 所示,图中左侧的红色方框表示的是需要进行细节放大的区域,红色箭头指向的是该红色方框放大之后的细节显示区域。表 1 为 BM3D10,DnCNN13,CBDNet27,CNCL36,DeamNet37和本文方法处理模拟前视声呐图像噪声对得到的指标对比,其
39、中标注粗体的数值表示其实验结果最好的。首先对比传统方法和神经网络方法,观察图 5 我们也可以发现,BM3D 在去噪时去除了过多的图像信息,因为本文所用的声呐图像包含非线性噪声且图中有大量小块,导致其块匹配过程会出现一些错误匹配的情况,因此损失了不少的图像信息和细节对图像的破坏比较大,去噪图像比较模糊;DnCNN、CNCL 和 CBDNet 对于复杂噪声和非线性噪声的处理能力较弱,没有注意力机制的引导不能很好地关注到全局噪声,因此不能很好地去除噪声;DeamNet 因为其自适应一致性先验的局限性,会将一些图像信息错误判断成噪声信息,因此在去除噪声时会出现原图有些模糊的情况;综合来看本文提出的方法
40、使用双通道注意力机制捕获了全局噪声信息,并且通过密集残差块提升了图像的信息传递能力,保留了较多的图像非噪声信息,因此去噪效果最好。观察表 1,五种神经网络方法相比传统算法的 BM3D 均有比较大的优势,PSNR 和 SSIM 值均比 BM3D 要高,也就是去噪效果和图像细节保存程度均是神经网络算法表现较好。其次对比五种神经网络方法,从直观视觉来看,本文提出算法的去噪效果在几种方法里去噪效果最好。观察表 1 可以发现,本文提出的算法具有比较大的优越性,在对比实验中 PSNR 和 SSIM 值均为最佳结果。在PSNR 上,相比 DnCNN 有约 6.69%的提升,相比CBDNet 有约 5.42%
41、的提升,相比 CNCL 提升了约5.79%,相比 DeamNet 提升了约 2.73%;在 SSIM 上,相比 DnCNN 有约 3.45%的提升,相比 CBDNet 有约7.62%的提升,相比 CNCL 提升了约 8.10%,相比DeamNet 提升了约 9.02%。4.4 真实声呐图像对比实验本 文 将 BM3D10,DnCNN13,CBDNet27,CNCL36,DeamNet37和本文提出的算法作为对比算法,在所有的真实声呐数据上进行去噪实验。实验结果如图 6 和表 2 所示,图中左侧的红色方框表示的是需要进行细节放大的区域,红色箭头指向的是该红色方框放大之后的细节显示区域。表 2 为
42、 BM3D10,DnCNN13,CBDNet27,CNCL36,DeamNet37和本文算法处理真实声呐图像噪声对得到的图像质量评价指标对比,其中标注粗体的数值表示其实验结果最好。观察图 6,BM3D 算法因为声呐图像中包含的非线性噪声和图中大量的小块信息,干扰了其块匹配和滤波赵冬冬,等.光电工程,2023,50(6):230017https:/doi.org/10.12086/oee.2023.230017230017-7 原图噪声图BM3DDnCNNCBDNetCNCLDeamNet本文方法abc图 5模拟前视声呐图像去噪结果,(a)(b)(c)表示三种不同的图像Fig.5Simulate
43、d forward-looking sonar image denoising results.(a)(b)(c)Represents three different images 表 1模拟声呐图像去噪结果Table 1simulated sonar image denoising results方法PSNRSSIMBrisqueBM3D1029.840.7693104.18DnCNN1334.250.816895.27CBDNet2734.660.785298.82CNCL3634.540.781794.68DeamNet3735.570.775195.70本文36.540.845091.
44、13赵冬冬,等.光电工程,2023,50(6):230017https:/doi.org/10.12086/oee.2023.230017230017-8过程,导致有较多的图像信息和边缘细节被模糊化了,去噪范围过大,整体去噪效果较差;DnCNN、CBDNet、CNCL 和 DeamNet 缺乏对全局噪声信息的关注,在去除噪声时对于图像保留欠佳,因此对于图像信息的边界部分处理较为模糊甚至会损失部分图像细节,图像明暗对比度相对于原图也被弱化了。总体而言本文算法使用双通道注意力机制捕获全局噪声信息的同时,使用密集残差块提升网络的信息传递能力避免损失图像信息,因此在去除噪声时能够较好地保留了细节信息,
45、总体去噪效果最好。观察表 2,在指标上本文提出的算法 Brisque 指数最小,表现最好。相比 DnCNN 降低了约 7.55%,相比 CBDNet 降低了约 5.40%,比 CNCL 降低了约 11.0%,比 DeamNet 降低了约 14.7%。4.5 网络各模块有效性验证 4.5.1DCA 模块的有效性模块的有效性为了证明 DCA 模块中的双通道注意力机制的有效性,在本文方法整体结构不变的基础上,改变DCA 模块中的路径数量,在模拟数据集和真实数据集上进行对比实验。最终的实验结果评价指标 PSNR、SSIM 和 Brisque 数值如表 3 所示。对比表 3 中的数据可以看出,DCA 相
46、比单路径通道注意力模块能够获取更加丰富的噪声信息,使得网络模型的性能更好,因此验证了本文设计的 DCA 模块的有效性。4.5.2DIR 模块的有效性模块的有效性为了证明 DIR 模块中的多尺度卷积机制的有效性,在本文方法整体结构不变的情况下,对比是否使用 DIR 块内分组卷积的情况,在模拟数据集和真实数据集上进行对比试验。最终的实验结果评价指标PSNR、SSIM 和 Brisque 数值如表 4 所示。对比表 4中的数据可以看出,DIR 模块使用分组卷积和密集残差结构能够增强其细粒度上的多尺度特征提取能力,避免信息的丢失,提升网络的去噪能力,因此验证了本文设计的 DIR 模块的有效性。4.6
47、消融实验为了验证本文提出的 DIR 模块和 DCA 模块的有效性和通用性,分别在 CBDNet27和 CNCL37网络中添加了本文提出的模块进行对比实验。实验在模拟数据集和真实数据集上进行,最终的实验结果 PSNR、SSIM 和 Brisque 如表 5 所示,标注粗体的数值表示 原图BM3DDnCNNCBDNetCNCLDeamNet本文方法abc图 6真实前视声呐图像去噪结果,(a)(b)(c)表示三种不同的图像Fig.6Real forward-looking sonar image denoising results.(a)(b)(c)Represents three differen
48、t images 赵冬冬,等.光电工程,2023,50(6):230017https:/doi.org/10.12086/oee.2023.230017230017-9效果最好。对比表 5 的数据可以看出,DCA 模块可以通过多路注意力机制捕获不同尺度的信息,获取更多的全局信息,从而更好地提取噪声信息,因此验证了本文提出的双通道注意力机制模块的有效性和通用性;通过表 5 的数据可以得知 DIR 模块的多尺度卷积机制提升了整体模块感受野的信息收益,并且利用细粒度上的密集连接机制,避免了网络深度增加后的信息传输过程中的丢失,使得信息传递更加平滑快速,因此也验证了本文提出的密集残差块的有效性和通用性
49、。5 结论本文提出了一种基于密集残差和双通道注意力机制的前视声呐图像去噪方法。采用了双阶段去噪网络思想,首先通过双通道注意力机制模块,捕获全局信息生成图像噪声图,最后使用密集残差块增强信息提取能力和传递效果生成干净图像。根据前视声呐图像 表 2真实声呐图像去噪评价指标结果表Table 2Real sonar image denoising evaluation index results方法BrisqueBM3D1053.81DnCNN1343.57CBDNet2742.58CNCL3645.27DeamNet3747.21本文40.28 表 3不同注意力机制的比较Table 3Compari
50、son of different attention mechanisms模型模拟数据集真实数据集PSNRSSIMBrisqueBrisque单路注意力35.680.827694.1941.61DCA36.540.845091.1340.28 表 4不同残差块的比较Table 4Comparison of different residual block模型模拟数据集真实数据集PSNRSSIMBrisqueBrisque普通残差块35.980.836795.2641.34DIR36.540.845091.1340.28 表 5消融实验结果对比Table 5Comparison of ablat