收藏 分销(赏)

基于改进UNet的非结构化道路分割算法研究.pdf

上传人:自信****多点 文档编号:2949137 上传时间:2024-06-11 格式:PDF 页数:10 大小:4.67MB
下载 相关 举报
基于改进UNet的非结构化道路分割算法研究.pdf_第1页
第1页 / 共10页
基于改进UNet的非结构化道路分割算法研究.pdf_第2页
第2页 / 共10页
基于改进UNet的非结构化道路分割算法研究.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第5 5 卷第3 期2023年5 月智能物联技术Technology of IoT&AlVol.55,No.3May,2023智能与算法基于改进UNet的非结构化道路分割算法研究党宇,陈丽(沈阳工业大学,辽宁沈阳110 8 7 0)摘要:相对于结构化道路来说,非结构化道路的道路特征更少。针对非结构化道路分割问题,本文在UNet模型的基础上,采用加深网络层数和引人ECA注意力机制提高模型的特征提取能力,并在编码阶段融入残差网络代替原模型中的VCG16,在瓶颈阶段加入ASPP扩大模型感受野,在解码阶段加人深度监督模块获得图像各层特征信息,使最后的分割结果更加精准。在非结构化道路数据集上的实验结果表

2、明,本文方法的准确率和平均交并比分别为97.55%和8 3.2 2%,比原UNet模型和DeeplabV3模型的性能更好。关键词:UNet;道路分割;特征提取;残差网络;深度监督【中图分类号】TP391.41【文献标识码】A【文章编号】2 0 9 6-6 0 5 9(2 0 2 3)0 3-0 18-10Research on Unstructured Road Segmentation Algorithm Based onImproved UNetDANG Yu,CHEN Li(Shenyang University of Technology,Shenyang 110870,China)A

3、bstract:Compared with structured road,unstructured road has fewer road features and more complex environment.Aiming at the segmentation of unstructured road,a deeper layer of network was adopted and ECA attention mechanism wasintroduced to improve the feature extraction ability of the model based on

4、 UNet.Residual network was integrated into thecoding stage of the model to replace VGG16.ASPP was added to expand the receptive field at the bottleneck stage of themodel and the depth supervision module was added in the decoding stage of the model to obtain the feature information ofeach layer of th

5、e image,to make the final segmentation results more accurate.The experimental results on the unstructuredroad data set showed that the accuracy and average intersection ratio of the proposed method were 97.55%and 83.22%,which were higher than the original UNet model and DeeplabV3 model.Key words:UNe

6、t;road segmentation;feature extraction;residual network;deep supervision显,没有车道线等参照物,再加上道路上的杂草、落叶、泥土、积水、光照阴影、天气变化等因素影响,使0引言随着无人驾驶技术的飞速发展,机器视觉技术在无人驾驶汽车道路识别中有着很重要的作用叫。生活中常见的道路分为结构化道路和非结构化道路。结构化道路的图像语义特征相对明显,易于分割。而非结构化道路的图像语义特征则相对不明收稿日期:2 0 2 3-0 3-2 9作者简介:党宇(19 9 7-),男,河南商丘人,硕士研究生,研究方向:无人驾驶汽车路况识别;陈丽(19

7、 6 9-),女,辽宁人,博士研究生,副教授,研究方向:磁悬浮技术及应用、无人驾驶汽车路况识别。18得非结构化道路的可行驶区域检测较为困难,技术也相对不够成熟 2-3 。图像分割就是根据目标区域的语义特征,如灰度、纹理等,将目标区域从图像中分离出来。图像分割完成后,要保证各区域内部在分割特征上的同党宇,陈丽:基于改进UNet的非结构化道路分割算法研究向性以及各区域之间的各向异性。常见的分割方法有基于阈值、基于边缘检测的分割算法以及区域分割。基于阈值的分割算法要跟根据灰度5、纹理等特征确定出最大阈值,并与图像中某区域像素进行对比,从而完成分类,如最大类间差法。基于边缘检测的分割算法是在图像中找到

8、灰度值梯度较大的区域,把它定义为边缘点,然后根据这一特点找到图像中灰度变化明显的跳点集合,将这些集合连起来得出一个闭环区域,从而得到图像目标区域的边界,完成分割任务。常见算法如Sobel边缘检测算法 7 、拉普拉斯(Laplace)边缘检测算法图Canny边缘检测算法 等。区域分割包括区域分裂合并和区域生长,它们的思想都是根据图像中不同物体之间的特征不同进行分类。语义分割方法在道路识别领域也大放异彩。语义分割方法是根据图像中语义信息的不同,将图像中的物体分为多个类别,实现图像像素级的分类。常见的语义分割模型有CNN(Co n v o l u t i o n a l Ne u r a lNetw

9、ork),FCN(Fully Convolutional Networks),UNet和Deeplab等。全卷积神经网络模型FCN是使用端到端CNN语义分割的开山之作。在FCN基础上产生的一些分割模型有SegNet、U Ne t 和Deeplab等。其中,CNN具有时间复杂度小的特点,文献 10 就利用CNN提取图像全局特征,实现遥感影像的分类,从而提取出道路区域。FCN相比CNN,解除了对输人图像的像素大小要求,减少了模型参数和训练时间,但它的效率低,分割结果不准确。文献11在 FCN 的基础上提出了UNet网络模型。该模型主要用于医学图像分割、自动驾驶中的道路分割以及遥感图像分割,可对任意

10、大小的图像进行分割。CHEN等 12-13 使用空洞卷积(Dilated Convolu-tion,DC)扩大感受野,使网络可以识别更多的图像信息,而且它不会改变图像的尺寸大小。ResNet和DRSNet等则通过残差网络模块来对网络结构进行优化,提升模型性能4。目前,虽然有很多利用深度学习来进行道路分割的模型,但针对道路特征少、干扰因素多的非结构化道路,仍然存在分割精准度低和预测效果不好等问题 15 。对此,一些主流的网络模型尝试选择较大的感受野使其有助于更好地分类。如在卷积层中加上步长,或者采用池化来让神经网络获得更大的感受野。这样会使分类结果更加准确,但缺点是图像的分辨率会下降,且最大池化

11、层也会丢失部分图像细节信息,不利于分割任务。DeeplabV1模型中则引人了空洞卷积和条件随机场(Conditional Random Field,CRF)来扩大感受野并提高分割精度,同时也有效避免了图像分辨率的降低;DeeplabV2模型中则引入了新的ResNet结构,并引人了扩张率不同的空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)来扩大感受野;在DeeplabV3模型中则加人了像素级别的特征图进行更多的特征融合操作,使分割效果有显著提升,并删掉了CRF结构。总体来说,在非结构化道路的分割任务中,至今还没有一个很好的方法。基于此,本文将在 UN

12、et的基础上进行改进,使其能够完成非结构化道路的分割任务。1UNet模型改进1.1UNet模型UNet模型是一个U型结构网络,它在编码阶段的下采样和解码阶段的上采样结构与许多成熟的网络结构相似,且左右完全对称,使其有着不错的图像分割能力 6。它的模型结构如图1所示。其模型分为编码器和解码器两部分。左半部分为编码器,它的作用是特征提取,获得图片的局部特征,得到抽象语义特征。它由两个3 3 的卷积层(ReLU)和一个2 2 的最大池化层(Maxpooling)组成一个下采样模块。每经过一次下采样,图片的大小都会降低1/2,通道数扩大2 倍,一共需要4 次这样的操作 7。右半部分为解码器,即将已经在

13、前半部分进行处理的图片作为输人,在此阶段对图片恢复原尺寸,最终获得分割结果。它由一层反卷积加特征拼接加两个3 x3的卷积层(ReLU)构成一次上采样。每经过一次上采样,图片的大小就会扩大一倍,且通道数缩小1/2,一共经过4 次这样的上采样,最后接一层1x1卷积,获得分割好的原始图片 18 。解码器和编码器之间用跳跃连接对特征图进行融合,通过将低级特征图与高级特征图的拼接操作,获得更加准确的图像语义信息19。它完全对称的U型结构使得前后图像特征的融合更加彻底。编码阶段的低分辨率信息可以用来识别出物体类别;解码阶段的高分辨率信息可以精准分割出图像中的物体类别;将两者结合起来并加上左右跳跃连接进行特

14、征融合,使其能够准确完成图像分割任务。19智能物联技术1.64 64128 64 64 2inputimagetileOLSXOZS895x89Soutput886X88segmentationmap256128200conv 3x3,ReLU+12812825625651251282图1UNet模型结构Figure 1 UNet model structure diagramUNet的主干提取网络其实就是VGG-16的网络提取部分,其模块内存较大,给硬件带来了较大压力。因此可以将UNet的编码部分换成残差网络ResNet34模块,且残差网络可以解决由于模型过深而带来的梯度消失和网络退化问题。

15、更换主干网络后的UNet模型扩大一层,变成5 个编码块和5个解码块的模型。1.2融入残差网络模块在卷积神经网络中,往往网络层数越多,则越能够更好地提取出图像的特征信息,模型的分割能力也越强。但是网络模型的纵向加深也会给模型带来梯度爆炸和网络退化的问题,这对模型的收敛起到了一个反向作用 2 0 。而残差网络在模型中加人了“短路”机制,解决了梯度消失的问题,且提高了计算效率。残差网络的结构中,设输人为X,期望输出为H(x),实际输出为F(x),通过跳跃连接将X直接连接到输出,从而使实际输出变为了F()+x,目标值则为F()=H()+x,这样就使网络学习的目标内容变为了输人与输出的差值。残差网络有R

16、esNet34,ResNet50,ResNet101 和 ResNet152 等 2 1。本文的残差网络模块包含两个卷积块和一个205122561024一5121024恒等映射,只将浅层信息作恒等映射输人到深层网络,如图2 所示。其中卷积块由批归一化层(BatchNormalization,BN)、线性整流(ReLU)函数和2 个3x3卷积组成。恒等映射是将前一层的特征信息与本层经过处理后的特征信息进行相加并线性激活。残差模块的公式为:Xi+I=S(H(X),W,)+X)其中:X,和X1分别是第1个残差单元的输人和输出特征;W,是一组与第1个残差单元相关的权重;H(,)代表残差函数;()为Re

17、LU函数。ldentityXXilConv3x3ReLUConv3x3BNBN图2 残差网络结构图Figure 2 Residual network structure diagram为了增强模型的性能,将ECA(Efficient Chan-nelAttention)注意力机制引入到编码阶段的第一和第五层残差块后。copy and crop+max pool 2x2tup-conv 2x2conv 1x1ReLU(1)党宇,陈丽:基于改进UNet的非结构化道路分割算法研究1.3引入ECA注意力机制注意力机制就是模拟人类视觉注意力的感知机制,它的主要思想就是更加关注目标信息,忽略非目标信息,从

18、而获得更多的全局信息 2 2 。通道注意力机制通过关注图像通道维度的关系建模,以此获取更多关于目标的有用信息。以图X作为输人,特征图Y作为输出,W是经过此模块后得到各通道的权重向量,特征图Y可由W与X的外积“?”得到,i代表各特征通道,如式(2)所示:Y=W,OX;现如今,很多研究将通道注意力机制引人卷积神经网络,以大大提升网络的性能。如SENet(Squeeze and Excitation Network),它可以自适应调节网络模型的通道维度特征,来提高网络的表达能力;CBAM(Convolutional Block Attention Module)是轻量级的注意力机制模块,可以在通道(

19、CAM)和空间(SAM)维度上进行Attention23;还有交叉网络CCNet(Criss Cross Attention)与双注意力机制 DAN(DualAttentionNetwork)都是对特征图的非局部空间和非局部通道同时进行分割。这些模型虽然能提升图像分割能力,但是也带来了更多的计算量与复杂度。为了既能提高模型性能又不增加模型复杂度,本文在编码阶段的第一层和第五层引人ECA(Ef-ficientChannelAttention)通道注意力模块,如图3所示。FeatureuGlobalAverage Pooling图3 ECA注意力模块结构图Figure 3 Structure of

20、 ECAs attention moduleECA模块先对输人的图像u;进行全局平均池化,再对各通道的像素取平均值,最终得到图像通道维度上的全局特征 2 1,如式(3)所示。g(u)=AvgPool(u)然后,把特征图输人一个大小为1xk的一维卷积层,获得不同通道间的相关性和各通道间合适的权重分布。接着使用Sigmoid激活函数对各通道的权重值进行归一化,如式(4)所示。w=Sigmoid(C1Dx(g(u)其中:C1D代表一维卷积,其大小K为3,激活函数如式(5)所示。Z=wOu其中:代表学习权重;Z表示特征图。ECA采用的是11卷积,与全连接层不同的是它只能学习到图像局部通道之间的信息。为

21、了解决(2)不同的特征图需要提取不同范围的特征,ECA使用了动态卷积核来做1x1卷积,即在通道数较大的层使用较大的卷积核做1x1卷积,以更多地进行跨通道交互;反之,则使用较小的卷积核做1x1卷积,以较少地进行跨通道交互。动态卷积核的自适应函数如下:log2(C),b_k=(C)=Iod其中:k代表卷积核的大小;C表示通道数;oda表示k只能取奇数;和b分别设置为2 和1,用于改变通道数C和卷积核大小之间的比例。此时,模型的编码阶段增加了网络深度并且把原来的下采样模块更换为了带有残差网络模块的下采样,引入注意力机制后进一步增强了模型的特征提取能力。进人瓶颈阶段后,网络又引入了空洞空间金字塔池化(

22、Atrous SpatialPyramidPooling,ASPP)模块,它里面的空洞卷积可以在不增加模型大小的基础上增加感受野,提高网络后期对特征图New feature map的分割能力。1.4空洞空间金字塔池化(ASPP)多尺度的语义信息可以提高模型的特征提取能力,提升模型的分割效果。相对标准卷积来说,空SigmoidConvlx1(4)(5)(6)洞卷积能够在不增大模型参数量的前提下,增大模型的感受野,获得更多的语义特征 2 。空洞卷积中的扩张率(膨胀率)定义了卷积核处理数据时各值的间距,且扩张率的取值直接影响到模型感受野的大小。ASPP通过将不同扩张率的空洞卷积生成的特征图级联到一块

23、,从而生成具有多尺度信息的特征图和提升网络的性能。ASPP包含一个普通的3 3卷积层、3 个3 3 空洞卷积层和平均池化层,同时(3)在每个卷积层之后加人批归一化层以提高网络的训练速度 2 4 。ASPP能多尺度提取特征图信息,保存图像更多的低维信息,缓解细节丢失的问题,如式21智能物联技术(7)所示。采样后经过一个1x1卷积,完成对图像的分割,并Y=Concat(AvgPool(X),H1,3(X),H6,3(X),Hi2,3输出特征图。这里只在模型的最后一层解码块输出(X),H18.,3(X)(7)式中:X是输人特征图,Y是输出特征图;Concat表示对图像进行第1维度上的操作;Hrn表示

24、扩张率为r、卷积核大小为n的带孔卷积。特征图像X,经过3 x3卷积后输出为图像y1,如式(8)所示。n(i)=Zx(itk)a(h)k=1在ASPP中经过三次空洞卷积后输出为y2,y3和y4,如式(9)(10)(11)所示:y(i)=Zx(i+rixk)a(k)k=1)(i)=Zx(i+rxk)a(k)k=1y(i)=Zx(i+r:xkh)0(k)k=1其中,r代表扩张率。而空洞卷积的扩张率过大会导致丢失图像局部信息,若扩张率过小则会使感受野过小。本文选取的三个空洞卷积的扩张率分别为 ri=6,r2=12 和 r3=18。模型在引人ASPP模块后,增大了模型的感受野,进人到模型的上采样阶段,开

25、始对特征图进行尺寸和通道恢复,进行特征融合,并在最后一次上特征图。为了增强模型的分割能力,在模型的解码部分引入深度监督机制,使五层解码块都输出一次特征图,并将五张特征图进行特征拼接,最后再经过1x1卷积,完成对图片的分割。1.5深度监督改进UNet模型通过5 次跳跃连接将各层级的特征进行融合,而UNet仅在最后的解码单元(8)Decoder5后输出最后的预测分割图,没有对低、中层特征的提取过程进行直接监督。这会导致部分特征信息丢失,网络的中低层在进行训练时也无法使用更加精准的特征图,增加了训练难度 2 5 。为(9)此,在上采样阶段,模型引入深度监督模块,利用模型底层和中层特征信息辅助模型训练

26、,使得各(10)层次特征的复用能力得到增强,并且加快训练收敛速度,分割精度得到有效提升。深度监督模块的结构如图5 所示,将五个解码块的输出特征图使用(11)双线性插值上采样,倍数分别为16,8,4,2 和1,恢复不同尺度特征图尺寸至原始图像大小,分别得到图1 图5,实现多层次特征的互补,提高模型的分割精准度。再将5 个阶段的特征图进行拼接融合,并对每张特征图计算一次损失,对模型的训练过程进行监督,将监督得到的特征损失传送回早期层,并将各层的特征损失用于集成学习,以提高模型的分割性能 2 。Input featureConvKernel:3x3Rate:1ConvKernel:3x3Rate:6

27、ConvKernel:3x3Rate:12ConvKernel:3x3Rate:18AveragepoolConcatenateOutputfeature图4 ASPP模块结构图Figure 4ASPP module structure diagram22:党宇,陈丽丽:基于改进UNet的非结构化道路分割算法研究化如图7 所示。解码器1解码器2 解码器3解码器4解码器5的输出的输出的输出的输出的输出164Feature concatenate图5 深度监督模块Figure 5 In-depth supervision module不同的特征图信息在侧输出层有不同的反映,浅层提取出的信息更多反映

28、的是局部和细节,而深层提取以语义信息为主。因此,深度监督模块加人到模型中之后,一方面可以对模型的训练过程进行监督,增强各层次特征的复用能力,另一方面还能将道路场景图像中的各层级信息和多尺度信息提取出来,增强模型的鲁棒性。侧输出的损失函数如式(12)所示。Side_loss=2m=1式中:m和a分别表示模型侧输出层的个数和权重,lmside表示当前侧输出层。1.6改进后模型I-UNet本文改进的UNet网络模型I-UNet的模型结构如图6 所示。I-UNet模型输入特征图的分辨率与通道数变InputEncoderlEncoder2Encoder3Encoder4Encoder5Figure 6

29、Improved UNet model structure diagram(1)编码部分由于残差网络可以解决模型层数过深带来的梯度消失与网络退化问题,且可以使模型更加轻量2化,故将编码部分的卷积和下采样更换为ResNet34模块,构建Res-UNet网络模型,此时模型的主干网络已经更换为内存较小的残差网络。主干网络为ResNet34模块,它每层包含两个3 x3卷积、一个批归一化(BN)、一个激活函数(ReLU)和一个最大池化(Max Polling)层,一共五层,并在第一层和最后一层加入ECA注意力机制。输人图像的分辨率为10 2 4 x1024,经过第一个卷积块时,使其分辨率变为5 12 x

30、512、通道数为6 4。每经过一个卷积块都使其分辨率降低一半,通道数扩大一倍。特征图在经过编码块后,其尺寸为3 2 3 2 10 2 4。(2)瓶颈处瓶颈处引人空洞空间金字塔模块(ASPP),替换原来的两个卷积层、ReLU、批归一化和最大池化层,扩大模型的感受野且没有改变特征图尺寸大4小。ASPP包含一个3 3 卷积、3 个空洞卷积(空(12)洞率分别为6,12 和18)和1个平均池化(MeanPolling)。(3)解码部分在此加人深度监督模块,由原来的最后一层输出图片,改为每一层都输出图片,最后进行拼接。解码器包含五个扩张块(Expansive_lock)和一个最终块(Final_bloc

31、k)。扩张块由2 个3 x3卷积DecoderlMap5DecoderlMap47DecoderlDecoderlDecoderlASPP图6 I-UNet模型结构图Outputconv1x1ReLUMap3Map2Map123智能物联技术砂石路、水泥路、柏油路、土路等不同路面背景下采InputOutput102410243102410243512x512x64512x512x64256x256x128256x256x128128128256128x128x25664x64x5126464x51232x32102432x32102432x321024图7 I-UNet特征图大小与通道数变化Fi

32、gure 7 Changes in size and channels numberof I-UNet feature map层、ReLU和BN组成,用于解码过程中对特征图像分别按16,8,4,2 和1的倍数进行双线性插值上采样和特征融合操作。最终块由一个1x1卷积层、ReLU组成,用于将解码后的特征图转换为最终的输出图像。2实验与结果分析本实验基于PyTorch1.8.1框架、Python3.8实现,使用Pycharm和Anaconda软件编写程序,实验基于Windows运行环境,GPU采用了3 0 8 0 Ti-12G,CPU 为 AMD Ryzen 7 3700X 8-Core Proc

33、essor,16核,内存3 2 G,Bitch_size设置为12,Epochs设置为100。在此基础上利用自已制作的非结构化道路数据集进行非结构化道路分割网络训练、验证和预测。2.1实验数据集与预处理本文实验的数据集由自已拍摄制作。该数据集含有水泥路、柏油路、土路、砂石路等不同类型的非结构化道路,能够充分涵盖非结构化道路特征。图像采集于河南、安徽,采集时间为2 0 2 2 年1月12月,模拟自动驾驶车车载摄像头的位置,将单目摄像头放在前挡玻璃上,视角为4 5 左右进行拍摄 2 7 。数据采集时,汽车的行驶速度为10 km/h,道路宽度为3 5 m,采集视频时长约2 4 h。为了使数据集更具有

34、代表性和反映出非结构化道路的特点,分别在24集2 0 0 0 张图像作为原始样本;将图像尺寸缩放为10241024作为训练输入,以减小后期网络模型训练对计算机硬件的要求;采用数据增强的方法将数据集扩充为2 0 0 0 0 张图片,划分为训练集、验证集和测试集,比例分别为8 0%,10%和10%。训练集用来训练网络模型的权重偏执;验证集用来调试模型,使其性能更加优秀;测试集用来检测模型的分割能力 2 8 。本文利用Labelme工具对图像进行手工语义标注,只标注了两类,分别是道路的可行使区域和汽车。因为在拍摄数据集过程中并未遇到行人等目标,所以未将行人纳人分类内容,分割后的图像颜色有黑色、绿色、

35、红色,分别代表背景、道路和汽车。标注后的文件为json格式。为了使其适应本模型的训练,通过批量转换文件将标注文件转换为VOC数据集格式再进行训练,采集的样本示例如图8 所示。图8 样本图像示例Figure 8 Sample image2.2评价指标图像语义分割的评价指标一般从训练时间、内存占用、分割精准度等方面来考虑。本文的重点是分割出非结构化道路的行驶区域,并对比不同模型在此领域的性能,选取MPA(M e a n Pi x e l A c c u r a c y,平均像素精度)和MloU(M e a n I n t e r s e c t i o n o v e rUnion,平均交并比)作

36、为评价指标。若分割类别一共为k类,则需要设置为k+1类,多出的那一类为背景。i表示真实值,j表示预测值。P与Pi分别表示 FP(False Positives)与 FN(False Negatives)2。(1)MPA:每个类别被正确分类像素数与相对应类别总数的比率相加后求均值,如式(13):MPA=1k+1i=02.Pj=0Pi(13)党宇,陈丽:基于改进UNet的非结构化道路分割算法研究(2)MloU:计算真实值(groundtruth)集合和预测值(predicted segmentation)集合的交集和并集之比 3 0 。这个比例可以变形为正真比上真正TP、假负FN、假正FP(并集)

37、之和,在每个类上计算交并比并取平均值,如图9 所示。AFN图9 交并比图示Figure 9 IoU diagram其中:TP(真正):预测正确,预测结果是正类,真实是正类。FP(假正):预测错误,预测结果是正类,真实是负类。FN(假负):预测错误,预测结果是负类,真实是正类。图9 中,A和B分别占据了深灰色和浅灰色的一部分,它们分别为真实值和预测值。TP占据了深灰色区域和浅灰色区域的交集处,它是真实值与预测值的交集,属于真正部分 3 0。计算出每一个类的交并比,并对其求平均值,就得到了平均交并比,如式(14)所示。1MloU=k+1i=0j=02.3结果分析本实验对比了3 种语义分割模型,分别

38、是BUNet、D e e p la b v 3 与I-UNet在此数据集下的分割效TP果。为了保证实验的公平性,都采用一样的参数和FP配置。分割效果如图10 所示。其中红色(深灰色)部分为汽车,绿色(浅灰色)部分为道路可行使区域,黑色部分为背景。由图10 可以看出,在Image(a)中,道路上存在车辆和道路旁存在房屋的情况下,Deeplabv3和UNet模型分割不准确,I-UNet 的分割相对更加准确。Image(b)的道路场景是一个丁字路口,且道路中有两辆汽车行驶,Deeplabv3和UNet模型分割时,都把两辆汽车分割到了一块,没有使其完全分割开来,而I-UNet模型则分割得更加准确。三种

39、模型的分割效果性能指标如表1所示。由表1可以看出,I-UNet模型的分割准确率更高,且平均交并比也稍有提升。相对于UNet模型,I-UNet模型的分割准确率提升了1.9 3%,平均交并比也提升了2.13%,由此可见本文方法在非结构化道路分割中的优越性。不同模型的指标对比如PPi+Pi-Pij=0(14)Image(a)Deeplabv3UNetI-UNetImage(b)Figure 10 Segmentation results of different model networks on unstructured roadsDeeplabv3图10 不同模型在非结构化道路的分割结果UNet

40、I-UNet255 10 1520 25 30 35404550 55 60 65 70 7580859095 100Epochs智能物联技术图11所示。加人深度监督机制,使每一层提取的特征都进行输三种模型在验证集上的损失函数与准确率曲出,最后将浅层和深层特征信息进行拼接融合,从线分别如图12 和图13 所示。由图可见,I-UNet在而提高网络模型的预测能力。在本文的非结构化道训练3 0 轮之后,损失函数逐渐趋于稳定,并最终稳路数据集上的实验结果表明,与DeeplabV3和UN-定在0.0 1附近;准确率曲线在训练2 5 轮后逐渐趋et模型相比,本文提出的算法完整性和连续性更于稳定,最终稳定在

41、0.9 7 附近。好,预测精准度也更高。但是此模型对非结构化道路的边缘局部信息处理能力不强,下一步将提高此3结语模型在道路阴影、路旁杂草等复杂干扰信息处的分本文提出基于深度残差网络并引人深度监督割能力,使其能够适用于农田、建筑物、河流等多场的改进的多尺度特征融合UNet 网络模型对非结构景的道路分割任务中。化道路可行使区域的分割算法。该算法在UNet模型中更改编码阶段的主干提取网络,加人残差模块和注意力机制,并加深网络层数来增强网络的特征提取能力,以及在模型瓶颈处引人空洞空间金字塔池化(ASPP)获得更多尺度信息,并在上采样阶段表1不同模型的图像分割性能对比Table 1 Comparison

42、 of image segmentationperformance of different models序号模型1Deeplabv32UNet3I-UNet1.00.80.60.40.20.0DeeplabV3图11不同模型的图像分割性能指标对比图Figure 11 Comparison of image segmentationperformance indicators of different models26.I-UNetUNet0.08DeeplabV30.06SSOT0.040.02MPA/%MIoUI%96.4582.1595.6281.0997.5583.22MPAMIoUU

43、NetI-UNetModelsEpochs图12 损失函数曲线对比Figure 12 Comparison of loss function curve1.0-I-UNetUNet0.9DeeplabV30.80.720.60.50.45101520253035404550556065707580859095100图13 准确率曲线对比Figure 13 Comparison of accuracy curve参考文献:1 刘元周,王华朋,倪令格,等.一种端到端的基于ResNet的车辆检测追踪技术研究 警察技术,2 0 2 1(0 1):2 9-3 2.2 章晨,夏凯,冯海林.改进残差网络的遥

44、感图像场景分类 J.测绘科学,2 0 2 0,4 5(0 8):15 1-15 6.党宇,陈丽丽:基于改进UNet的非结构化道路分割算法研究3 高丹,陈建英,谢盈.A-PSPNet:一种融合注意力机制的PSPNet图像语义分割模型 J.中国电子科学研究院学报,2 0 2 0,15(0 6):5 18 5 2 3.4Martin D R,Fowlkes C,Malik J.Learning to detect nat-ural image boundaries using local brightness,color,andtexture cues J.IEEE transactions on

45、pattern analysisand machine intelligence,2004,26(5):530-549.5 Arbelaez P.Contour detection and hierarchical imagesegmentation JJ.IEEE transactions on pattern analysisand machine intelligence,2011,33(5):898-916.6Liu X L,Deng Z D,Yang Y H.Recent progress in se-mantic image segmentationJ.Artificial Int

46、elligence Re-view,2019,52(2):1089-1106.7Wang Y,Zhang H J,Huang H X.A survey of imagesemantic segmentation algorithms based on deep learn-ingJ.Application of Electronic Technique,2019,45(6):23-27.8曾诚,宋燕.改进的OTSU和最大熵结合的迭代图像分割算法 J智能计算机与应用,2 0 2 0,10(12):12 1-12 5.9杨梦,雷博,赵强等.基于改进粒子群的二维模糊散度多阈值图像分割 J计算机应用与

47、软件,2 0 2 0,37(0 9):133-138.10 ZENG D,CHEN S J,CHEN B Y,et al.Improving remotesensing scene classification by integrating global-contextand local-object fertures J.Remote Sensing,2018,10(5):734-743.11 RONNEBERGER O,FISCHER P,BROX T.U-net:con-volutional networks for biomedical image segmentationMJBerl

48、in,Germany:Springer International Publishing,2015:234-241.12 CHEN L C,PAPANDREOU G,SCHROFF F,et al.Re-thinking atrous convolution for semantic image segmenta-tionEB/0L 2021-07-10.https:/arxiv.rg/abs/1706.05587.13 WANG P Q,CHEN P F,YUAN Y,et al.Understandingconvolution for semantic segmentationCJ/Pro

49、ceedings ofIEEE Winter Conference on Applications of ComputerVision.Washington D.C.,USA.IEEE Press,2018:1451-1460.14 LI H C,XIONG P F,FAN H Q,et al.DFANet:deep fea-ture aggregation for real-time semantic segmentationC/Proceedings of IEEE/CVF Conference on ComputerVision and Pattern Recognition.Washi

50、ngton D.C.,USA:IEEE Press,2019:9514-9523.15 WANG Q,GAO J Y,LI X L.Weakly supervised adver-sarial domain adaptation for semantic segmentation inurban scenes J.IEEE Transactions on Image Process-ing,2019,28(9):4376-4386.16胡学刚,严思齐.基于FCM 聚类的图像分割算法 计算机工程与设计,2 0 18(1):15 9-16 4.17杨泽颖,张建生.基于MATLAB的图像边缘分割算法

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服