收藏 分销(赏)

基于改进教师学生网络的隧道火灾检测.pdf

上传人:自信****多点 文档编号:2256707 上传时间:2024-05-24 格式:PDF 页数:10 大小:24.64MB
下载 相关 举报
基于改进教师学生网络的隧道火灾检测.pdf_第1页
第1页 / 共10页
基于改进教师学生网络的隧道火灾检测.pdf_第2页
第2页 / 共10页
基于改进教师学生网络的隧道火灾检测.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023 年 10 月 图 学 学 报 October2023第 44 卷 第5期 JOURNAL OF GRAPHICS Vol.44No.5 收稿日期:2023-02-08;定稿日期:2023-05-23 Received:8 February,2023;Finalized:23 May,2023 基金项目:国家自然科学基金项目(62006026,62072053,U21B2041)Foundation items:National Natural Science Foundation of China(62006026,62072053,U21B2041)第一作者:宋焕生(1964),男

2、,教授,博士。主要研究方向为图像/交通视频处理、智能交通。E-mail: First author:SONG Huan-sheng(1964),professor,Ph.D.His main research interests cover image/traffic video processing,intelligent trans-portation.E-mail: 通信作者:孙士杰(1989),男,副教授,博士。主要研究方向为多目标检测跟踪、位姿估计。E-mail:shijieS Corresponding author:SUN Shi-jie(1989),associate prof

3、essor,Ph.D.His main research interests cover multi object detection and tracking,pose estimation.E-mail:shijieS 基于改进教师学生网络的隧道火灾检测 宋焕生1,文雅1,孙士杰1,宋翔宇2,张朝阳1,李旭1(1.长安大学信息工程学院,陕西 西安 710018;2.斯威本科技大学软件与电气工程学院,墨尔本 3000)摘要:隧道空间狭小,封闭性高,当发生火灾时,火势会迅速蔓延,导致救援难度增大,严重危害人们的生命财产安全。现有隧道火灾检测方法精度低且数据集匮乏,针对上述问题,提出一种基于改进

4、教师学生网络的隧道火灾检测方法。首先,通过无监督学习对没有火灾的样本进行训练从而检测火灾,可以弥补隧道火灾数据集匮乏的问题,同时采用相同结构的学生网络和教师网络组成整体网络结构,在用于知识蒸馏的残差块中加入注意力机制以减少重要信息损失,过滤无关信息,其次用 Mish 激活函数代替 Relu 激活函数以提高网络性能,最后引入 SPD-Conv 模块代替跨步卷积层和池化层以提高较小火灾区域的检测精度。实验结果表明:改进的教师学生网络在自制隧道火灾数据集的像素级 AUC-ROC 和图像级 AUC-ROC 分别达到 0.93 和 0.82,与现有隧道火灾检测算法相比,该模型检测精度均高于其他模型,验证

5、了该模型的有效性。关键词:隧道火灾检测;教师学生网络;无监督学习;注意力机制;Mish 激活函数;SPD-Conv 中 图 分 类 号:TP 391 DOI:10.11996/JG.j.2095-302X.2023050978 文 献 标 识 码:A 文 章 编 号:2095-302X(2023)05-0978-10 Tunnel fire detection based on improved student-teacher network SONG Huan-sheng1,WEN Ya1,SUN Shi-jie1,SONG Xiang-yu2,ZHANG Chao-yang1,LI Xu1

6、(1.School of Information Engineering,Changan University,Xian Shaanxi 710018,China;2.School of Software and Electrical Engineering,Swinburne University of Technology,Melbourne 3000,Australia)Abstract:Fire incidents in tunnels present serious hazards due to their rapid spread in confined spaces,endang

7、ering lives and property while making rescue operations challenging.Current tunnel fire detection methods suffer from inaccuracies and sufficient data.To address the above problems,a tunnel fire detection method based on an improved student-teacher network was proposed.Firstly,the proposed method tr

8、ained unsupervised learning on fire-free samples to detect fires,compensating for the lack of tunnel fire datasets.At the same time,the student network and the teacher network with the same structure were adopted to form the whole network structure,and an attention mechanism was added to residual bl

9、ocks for knowledge distillation to reduce the loss of important information and filter irrelevant information.Secondly,a Mish activation function was employed to replace a Relu activation function to enhance network performance.Finally,the SPD-Conv module replaced the strided convolution and pooling

10、 layer to improve the detection accuracy in smaller fire areas.The experimental results demonstrated that the pixel-level AUC-ROC and image-level AUC-ROC of the improved student-teacher network in the self-made tunnel fire dataset reached 0.93 and 0.82,respectively.Compared 第 5 期 宋焕生,等:基于改进教师学生网络的隧道

11、火灾检测 979 1 with the current tunnel fire detection algorithms,the detection accuracy of the improved model was higher than other models,substantiating its effectiveness.Keywords:tunnel fire detection;student-teacher network;unsupervised learning;attention mechanism;Mish activation function;SPD-Conv 数

12、据显示,截止 2021 年,我国高速公路总里程达 16.91 万公里,其中,隧道总长度达 2 469.89 万延米1。隧道内部结构复杂,具有环境密闭、照明通风效果差的特点。隧道内出现火灾处理困难,火灾会导致监测、照明、通讯等系统破坏,且隧道内能见度急剧下降,给消防灭火、人员疏散带来困难。因此在隧道中进行及时有效的火灾检测必不可少。目前火灾检测方法主要分为基于图像处理的传统火灾检测算法和基于深度学习的火灾检测算法2。传统火灾检测采用图像处理技术提取特征用于判断火灾是否发生。陈嘉卿等3通过提取火灾区域中的 RGB 三基色分量和相互联系判断是否有火灾发生。SUN 等4对红外图像进行自适应背景更新提取

13、疑似火灾区域,在通过改进层次分析法对红外火灾图像进行特征提取与融合提高识别火灾的精度。XIE 等5提出一种利用基于运动闪烁的动态特征和深度静态特征的视频火灾探测方法,通过分析将火灾动态和静态特征结合实现火灾探测,但对火灾的空间定位还有待提升。综上,基于图像处理的火灾检测算法提取的火焰和烟雾特征,需要与人工设定阈值进行对比,从而判断是否有火灾的发生,但人工设定阈值无法囊括火灾所有特征,使得检测效果仅仅是局部最优,提升空间非常大。基于深度学习的火灾检测算法通过卷积神经网络(convolutional neural networks,CNN)得到更多特征信息,但网络的训练需要大量数据,现有火灾数据数

14、量相对较少。为此,WANG 等6使用数据增强训练样本,避免数据样本不足导致的发散现象。王文朋等7提出的基于迁移学习的 VGG-16算法,可提升网络训练速率。张倩等8基于合成图像的 Faster R-CNN 森林火灾检测与识别算法,将模拟产生的烟雾图像以及数据集中真实的图像插入森林背景,解决了数据量少的问题,但网络模型很难在真实场景中保持同样的精度与速度。综上,现有基于深度学习的火灾检测算法难以解决隧道火灾数据集匮乏的问题,且隧道火灾实际情况和实验环境具有较大差别,不能满足隧道场景应用需求。针对上述问题,本文提出一种基于改进教师学生网络9的隧道火灾检测模型 STPM-SMSC。该模型使用无监督学

15、习10策略,首先在进行知识蒸馏11的残差块中加入注意力机制12;其次使用Mish 激活函数13并引入 SPD-Conv 模块14以提升网络的检测精度;最后构建基于无监督学习的真实隧道火灾数据集进行训练和测试,以增强网络模型的鲁棒性,弥补现有火灾数据集的不足。1 STPM 网络结构 STPM15(student-teacher feature pyramid matching)是用无监督学习检测工业异常的教师学生网络,通过相同结构的师生网络可以有效地将预训练教师网络的知识迁移至学生网络中,并且利用多尺度特征匹配策略16使得特征金字塔17中各个层级的特征能够适应不同尺度的检测任务,这些特点使得该网

16、络在图像级和像素级检测上具有较高的准确度。以本文火灾数据集为例,STPM的网络结构如图 1 所示。STPM 由相同结构的教师学生网络组成,教师网 络 是 在 图 像 分 类 任 务 上 进 行 了 预 先 训 练(ImageNet18在 ResNet1819上进行训练)的网络;学生网络是一个具有相同结构的网络,可以减少信息的损失。训练阶段,由教师网络的几个连续层组提取的特征来指导学生网络的学习。测试阶段,由于教师网络是预训练网络,具有良好的泛化性,能有效提取出火灾区域特征,而学生网络只在正常样本中进行训练,不能有效提取火灾区域特征,因此 2 个网络在不同层对火灾区域的特征提取差异较大,将不同特

17、征提取层得到的师生网络的差值特征图经过双线性插值到与输入图片尺寸一致,并相乘得到最终火灾特征图,从而检测到不同大小的火灾区域。本文使用了与 STPM 相同的损失函数,在训练时,输入一组正常的图片 D=I1,I2,In,通过损失函数使学生网络第 l 层提取的特征近似教师网络第 l 层提取的特征,从而使学生网络得到正常 980 图像处理与计算机视觉 2023 年 图 1 STPM 网络结构 Fig.1 STPM network structure 区域的特征。h w ckI 是输入的图片,其中 h 为高度;w 为宽度;c 为通道数,学生网络和教师网络第 l 层生成的特征向量在特征图位置(i,j)上

18、进行 归一化,分别被定义为()ltkijFI和()lskijFI。特征图 中位置(i,j)的损失函数由经过归一化特征向量之间的 l2距离得到,l2距离为余弦相似度,即 221()()()2lllkijtkijskijlL IFIFI(1)111()()llhwllkkijijllL IL Iwh(2)式(2)是神经网络不同层特征损失,总损失是不同层损失加权平均值,即 1()(),0lhlklkliL IL I(3)在测试阶段,h w ckJ 是输入的隧道火灾图片,l(J)是在教师学生网络在第l层特征层提取的差值火灾特征图,ij表示第l层特征图l(J)在位置(i,j)的损失,最后将不同尺度特征图

19、经过双线性插值与输入图片尺寸一致,将其相乘得到最终的异常特征图,最后选择异常图中最大值作为异常评分。STPM网络有较高检测精度和速度,但在隧道火灾检测方面,面临着光线、车辆等因素的干扰,导致检测精度不稳定,如图2所示。图 2 STPM 在不同分辨率检测结果 Fig.2 STPM detection results at different resolutions STPM通过计算教师学生网络在不同层之间特征差异检测火灾区域,图2的结果表明由于隧道中车辆与光线的影响,火灾样本的不同分辨率特征图存在大量噪点信息。而本文使用的注意力机制可以过滤掉无关信息,增强火灾样本与正常样本的差异性,Mish激活

20、函数用以弥补网络中Relu激活函数的不足,提升不同火灾区域的检测 第 5 期 宋焕生,等:基于改进教师学生网络的隧道火灾检测 981 精度,SPD-Conv模块可以代替跨步卷积层和池化层以提高较小火灾区域检测精度,提高网络性能。2 改进的教师学生网络 2.1 注意力机制 为增强网络对隧道火灾检测的准确率和泛化性,本文在教师学生网络的残差块20中引入SE(squeeze-and-excitation)注意力机制21提取特征,该机制可以过滤掉无关信息,有效利用全局信息,使模型能自适应调整各通道权重。SE注意力机制网络结构如图3所示。图 3 SE 注意力机制网络结构 Fig.3 SE attenti

21、on mechanism network structure 图3中SE注意力机制将残差操作提取的特征向量通过Global Pooling和FC层拉伸,再与原图像相乘,为每个通道赋予权重。该注意力机制具有2个全连接层,第一层的FC会降低网络通道数量,第二层的FC将通道数量增加,其不仅权重数与通道数相等,且仍可以为对应通道提供权重,最后加权操作将权重加权到相应特征值上,完成权重更新。SE注意力机制插入位置直接关系学生网络的表征能力与学习能力,若将注意力模块嵌入ResNet的第一层或最后一层卷积,很难从融合后的特征图中区分出冗余信息与关键信息,反而会导致信息传递的错误,降低网络的特征提取能力。本文

22、选择将SE注意力机制嵌入ResNet的残差块中,先将特征向量经过残差操作提取特征,再通过注意力机制突出关键特征,弱化无关信息,最后合并输出,提升网络精度。2.2 Mish激活函数 为了提高本文模型精度,特将主干网络ResNet的残差块中Relu激活函数替换为Mish激活函数,即 Mishtanh(ln(1)xxe(4)随着神经网络层数不断加深,Mish激活函数在准确性上优于Relu激活函数,这是因为Relu激活函数在负值时保持为零,在训练过程中容易出现梯度为0的情况,使网络在反向传播过程中无法进行学习,浅层网络的权值更新就会变得非常缓慢,网络在本质上只等于后面浅层网络的学习,那么通过增加网络深

23、度来提取特征就会失去意义。然而Mish激活函数不仅继承了Relu激活函数正值无边界的优点,且在理论上对于负值也允许轻微的梯度流动,规避了Relu激活函数负值直接为0的不足,从而得到更好的准确性和泛化性。2.3 SPD-Conv 由于CNN采用卷积步长和池化层,因此随着网络层数加深会导致火灾区域细节信息的损失,网络无法充分提取有效特征。本文引入SPD-Conv模块代替每个卷积步长和池化层以减少网络中信息的丢失,提升较小火灾区域的检测精度。SPD-Conv结构如图4所示。图 4 SPD-Conv 结构 Fig.4 SPD-Conv structure SPD-Conv由一个空间到深度层(space

24、-to-depth,SPD)和 一 个 无 卷 积 步 长 层(non-strided convolution,Conv)组成。在SPD部分中,如尺寸为SSC1的特征图X,可按比例形成由i+x和j+y组成的子图fx,y,每个子图按比例对X下采样。图4中比例因子为2,每个子图尺寸为S/2S/2C1。这4张子图在通道维度上拼接,获得特征图X,其尺寸为S/2S/222C1。在Conv部分中,SPD-Conv模块使用了一个步长为1的卷积层,将特征图X的尺寸变为S/2S/2C2,其中C222C1,以尽可能保留关键信息。本文教师学生网络采用ResNet18作为主干网络,其中包含4个步长为2的卷积层和一个步

25、长为2的最大池化层对输入图像进行下采样。因此在ResNet18中采用SPD-Conv替换4个跨步卷积并删除最大池化层,使网络保留更多细节信息,982 图像处理与计算机视觉 2023 年 可更有效提取特征。将SE注意力机制嵌入ResNet18的残差块中,用Mish激活函数替换残差块中Relu激活函数,在残差块后用SPD-Conv模块替换步长进行下采样的知识蒸馏层结构如图5所示。图 5 知识蒸馏层结构 Fig.5 Knowledge distillation layer structure 3 结果与分析 3.1 实验环境与数据 3.1.1 实验环境 本文实验在表1的环境平台上进行,编程语言为Py

26、thon,深度学习框架为Pytorch。表 1 实验环境 Table 1 Experimental environment 分类 设备 信息 硬件 处理器 IntelCore-i9 10900K CPU 3.70 GHz内存 64 G GPU NVIDIA GeForce RTX 2060SUPER 显存 8 G 软件 系统 Ubuntu 20.04 Cuda 版本 CUDA 10.0 平台 Pytorch 1.8.1 3.1.2 数据集 据数据显示,发生在高速公路的火灾,多由运载货物自燃形成,约占80%;交通事故的碰撞形成的火灾,约占20%22。隧道火灾多发生于车辆,本文根据高速公路场景车辆

27、构建了一个基于无监督学习的实验数据集。该实验数据集包含训练集与测试集,训练集中包含5 000张正常样本,测试集中包含150张火灾样本和正常样本,在训练集上学习正常样本特征,在测试集上检测火灾样本。训练集如图6所示。考虑到隧道火灾监控视频不易获取且隧道内存在一些干扰因素会影响火灾目标的检测,训练集包含各种场景,为通过监控视频采集到的白天、夜晚、隧道中车辆目标及公开的CoCo数据集中23车辆目标,可解决交通场景变化引起的精确度不高的问题。白天时间段场景包含了不同路段、不同监控角度下车辆样本。在夜间场景的车辆样本非常难获取,本文选取了可以观察到轮廓的车辆为样本,使火灾在昏暗的场景下可以被检测。隧道场

28、景涵盖了不同光照的车辆样本,如昏暗的黄色灯光及明亮的白色灯光,提升对隧道场景的适用性。从公开数据集中选取的车辆样本,多发生在户外场景,可增加网络的鲁棒性。图 6 训练集示例图 Fig.6 Example diagrams of training dataset 测试集包含正常样本与火灾样本,按照场景进行分类。测试集如图7所示。图 7 测试集示例图(a)(d)隧道火灾场景;(e)高速公路火灾场景;(f)自制非车辆火灾场景;(g)高速公路车辆目标非火灾场景;(h)CoCo 数据集中车辆目标非火灾场景)Fig.7 Example diagrams of test dataset(a)(d)Tunne

29、l fire scenarios;(e)Highway fire scenarios;(f)Self-made non-vehicle fire scenarios;(g)Highway vehicle target fire-free scenarios;(h)Vehicle target fire-free scenarios in the CoCo dataset)测试集为火灾区域提供了像素级标注,是全面、包含各种尺寸的隧道火灾测试集。真值选用标注工具Labelme24对测试集火灾区域进行标注,因火灾为非刚性物体,没有固定的形状,在标注时存在人为因素的影响,因此制 第 5 期 宋焕生,等

30、:基于改进教师学生网络的隧道火灾检测 983 定标注规则:对火灾的显著性特征进行标注,尽可能降低背景信息。本文为每个火灾区域提供像素精确的真值标签,测试集包含近150个手动注释的区域。3.2 评价指标 本模型的评价包括模型检测每秒检测帧数(frames per second,FPS)和模型大小(size,S)以及准确率(precision,P)、召回率(recall,R)、AUC-ROC(area under the ROC curve,AR)25,即 TPPTPFP(5)TPRTPFN(6)TPRRecall(7)FPFPRFPFN(8)10d()AUCTPRFPR(9)其中,TP为将正常样

31、本预测为正常类别的数量;FN为将正常样本预测为火灾类别的数量;FP为将火灾样本预测为正常类别的数量。ROC是以FPR和TPR为x轴和y轴绘制的曲线,ROC曲线下面积为AUC的值。像素级AUC-ROC(pixel-level AUC-ROC,ARP)是衡量输入图像是否正确检测火灾区域的指标,图像级AUC-ROC(image-level AUC-ROC,ARI)是衡量输入图像是否可以被正确地分类为火灾样本的指标。隧道火灾检测对应图像级ROC曲线和像素级ROC曲线如图8所示。3.3 实验结果与分析 3.3.1 模型训练 在实验中,根据损失函数对网络进行调参,选择损失函数收敛时的权重作为最终权重。本文

32、选择ResNet18的3个层(conv2_x,conv3_x,conv4_x)进行知识蒸馏。教师网络的参数是在ImageNet上预训练ResNet18的值,学生网络的参数随机初始化。学习率固定为0.4,动量因子为0.9,迭代100 epoch,Batch Size为32,输入图像分辨率为256256。3.3.2 加入注意力机制实验结果分析 为了衡量SE注意力机制有效性,本文将其与其他注意力机制进行对比实验。现将SE注意力机制与CA(coordinate attention)注意力机制26、CBAM(convolutional block attention module)注意力机制27、ECA

33、(efficient channel attention)注意力机制28分别嵌入主干网络的残差块中,实验结果见表2。(a)(b)图 8 ROC 曲线(a)图像级 ROC 曲线图;(b)像素级 ROC 曲线图)Fig.8 ROC curves(a)Image-level ROC curve;(b)Pixel-level ROC curve)表 2 注意力机制验证实验 Table 2 Attention mechanism verification experiment 算法模型 ARI ARP S FPS STPM 0.65 0.83 104.8 100 STPM+CA 0.72 0.84 11

34、0.4 95.6 STPM+ECA 0.75 0.86 108.0 88.4 STPM+CBAM 0.78 0.87 115.7 80.8 STPM+SE 0.76 0.87 105.3 96.5 注:加粗数据为最优值 从表2中可以看出,4种注意力机制均对精度有不同程度的提升。4种注意力机制的ARI分别提升了0.07,0.10,0.13,0.11;ARP分别提升了0.01,0.30,0.04,0.04,其中CBAM注意力机制在精度上带来的提升效果最为明显,但在检测速度和模型大小上SE注意力机制比其他的注意力机制更具有优势且精度与CBAM注意力机制相差不大。综上,本文引入的SE注意力机制在教师学

35、生网络模型中更具优越性。改进后的模型称为STPM-S。3.3.3 加入Mish激活函数实验结果分析 本文验证了Mish激活函数对改进模型的有效性,实验结果见表3。改进后的模型ARI提升了0.02,ARP提升了0.03,说明Mish激活函数在检测速度小幅度降低和模型大小略微增加的情况下提高了隧道火灾的检测精度。改进后的模型称为STPM-SM。984 图像处理与计算机视觉 2023 年 表 3 激活函数验证实验 Table 3 Activate function verification experiment 方法 ARI ARP S FPS Relu 0.76 0.87 105.3 96.5 M

36、ish 0.78 0.90 107.8 90.2 注:加粗数据为最优值 3.3.4 加入SPD-Conv模块实验结果分析 本文在STPM-SM模型中加入SPD-Conv模块的实验结果见表4。改进后的模型称为STPM-SMSC。从实验结果可知,改进后的模型牺牲了检测速度和模型大小,但ARI和ARP的提升同样十分明显,分别提升了0.04和0.03。说明SPD-Conv模块减少了网络深层的信息丢失,提升了火灾检测模型的性能。表 4 SPD-Conv 模块验证实验 Table 4 SPD-Conv module verification experiment 方法 ARI ARP S FPS STPM

37、-SM 0.78 0.90 107.8 90.2 STPM-SMSC 0.82 0.93 117.9 80.2 注:加粗数据为最优值 3.3.5 测试集验证结果 本文验证了该模型在图像的不同分辨率的准确性。表5为进行知识蒸馏的不同特征提取层提取的特征图ARI和ARP,结果表明ARI达到了0.82,ARP达到了0.93,在所有分辨率下,本模型精度均超过了原始STPM网络,具有优越的检测性能。表 5 图像不同分辨率的 AR Table 5 AR at different image resolutions 指标 算法模型 64643232 1616 结果ARP STPM 0.75 0.79 0.8

38、2 0.83STPM-SMSC 0.86 0.87 0.92 0.93ARI STPM 0.52 0.59 0.63 0.65STPM-SMSC 0.73 0.76 0.80 0.82注:加粗数据为最优值 本模型检测的火灾区域比原始STPM网络更精确,部分检测结果如图9和表5。STPM在图9(a)和(b)的场景中具有误检,不能完全消除噪声的影响,但本模型的结果图噪声更少,生成的二值图更加接近于真值图。综上,改进的教师学生网络对火灾区域的检测更准确。本文方法在自制的测试集上测试结果如图10所示,其包含火灾样本的原图、真值、3个教师学生网络的特征提取层所得火灾区域特征图和3个特征图融合后结果图及其

39、二值图。图 9 与原始 STPM 网络结果对比图(a)场景 a;(b)场景 b;(c)场景 c)Fig.9 Comparison with STPM network results (a)Scene a;(b)Scene b;(c)Scene c)通过图10(c)(g)中不同特征提取层(ResNet18的conv2_x,conv3_x,conv4_x)提取的特征图可看出,本文方法可以有效检测出各种不同大小火灾目标,最终生成的结果图与真值区域近似。虽然隧道场景复杂,受灯光、隧道环境影响,但本文方法依然可以在复杂情况下检测出火灾目标,同时图10(a)和(b)结果表明在非隧道场景下,甚至非车辆着火的

40、情况下均可以检测火灾目标。本文方法可以有效检测隧道场景下的火灾目标,且对于其他场景有一定的鲁棒性,能够有效区分火灾区域和非火灾区域。3.3.6 与现有检测方法对比实验 现有火灾检测算法大多为目标检测算法,为了进一步验证本文模型在隧道火灾检测上的有效性,将与单阶段的火灾检测模型YOLOv529,YOLOv4-Tiny30,SSD31(single shot MultiBox detector)和两阶段的火灾检测模型Faster R-CNN32以及具有滑窗操作的Swin Transformer33等模型在公开火灾数据集的5 000张图片进行训练,数据来源于江西财经大学袁非牛教授团队和韩国启明大学火

41、灾视频库,在本文的隧道火灾测试集上进行测试分析,测试结果见表6。以上5种方法训练时输入图像分辨率为256256,batch size分别设置为32,32,32,32和8,epoch均设置为100,初始学习率为0.01,动量因子为0.9。确保在网络收敛的情况下对测试集进行测试。从表6可知,本文模型在AR上相比YOLOv5和YOLOv4-Tiny提升了0.07和0.18,虽然模型大小增加,牺牲了一些内存但对检测精度提升是十 第 5 期 宋焕生,等:基于改进教师学生网络的隧道火灾检测 985 图 10 STPM-SMSC 检测结果(a)高速公路火灾场景;(b)自制非车辆火灾场景;(c)(g)隧道火灾

42、场景)Fig.10 STPM-SMSC test results(a)Highway fire scenarios;(b)Self-made non-vehicle fire scenarios;(c)(g)Tunnel fire scenarios)表 6 与现有方法对比结果 Table 6 Comparison results with existing methods 算法模型 P R AR S FPS YOLO v5 0.87 0.900.86 99.7 83.7YOLO v4-Tiny 0.74 0.780.75 76.6 97.2SSD 0.80 0.840.81 70.2 104

43、.0Faster R-CNN 0.86 0.830.85 127.5 70.6Swin Transformer 0.88 0.890.89 105.6 75.8STPM-SMSC 0.93 0.940.93 117.9 80.2注:加粗数据为最优值 分必要的。本模型在AR上相比SSD和Faster R-CNN提升了0.12和0.08,在精度上有大幅度提高,使模型综合性能更佳,可用于实时检测。与Swin Transformer对比,虽然Swin Transformer精度仅低于本文方法,但在检测速度不及本文方法。将标注真值的外接矩阵作为真值框和YOLOv5,YOLOv4-Tiny,SSD和Fas

44、ter R-CNN,Swin Transformer以及本文方法的检测结果进行对比,结果如图11所示。图11表明在YOLO系列的方法中,YOLO v5和YOLO v4的检测框比真值框小,YOLO v4受隧道灯光影响严重,出现了较多误检情况。在SSD的检测结果中,仍然存在将车灯误检为火焰的情况。在两阶段的Faster R-CNN检测结果中,检测框大于真值框,且置信度不是最优。在具有滑窗操作的Swin Transformer的检测结果中,检测精度较高,仅低于本文方法,但检测框位置存在偏移 986 图像处理与计算机视觉 2023 年 的问题。以上5种方法检测精度均低于本文方法,存在不同程度的检测框大

45、小偏移和误检的情况,本文方法生成的检测结果与真值框更相似,置信度较高。图 11 部分检测结果对比(a)原图;(b)真值;(c)YOLO v5;(d)YOLO v4-Tiny;(e)SSD;(f)Faster R-CNN;(g)Swin Transformer;(h)STPM-SMSC)Fig.11 Test result comparison(a)Original image;(b)Ground Truth;(c)YOLO v5;(d)YOLO v4-Tiny;(e)SSD;(f)Faster R-CNN;(g)Swin Transformer;(h)STPM-SMSC)综上,本模型以80.2

46、 FPS的检测速度达到最优精度,对火灾区域的检测结果定位更精确、鲁棒性较好、置信度较高,证明了本文方法对于隧道火灾检测的可行性。4 结束语 目前隧道火灾场景数据集匮乏且检测精度低,本文通过自制的隧道火灾数据集,采用基于无监督学习下改进的教师学生网络进行火灾区域检测,只需要训练大量正常样本可以实现对火灾区域检测。本文将SE注意力机制加入用于知识蒸馏的残差块中,使学生网络与教师网络在正常区域提取的特征近似,火灾区域提取的特征更具有差异性,其次更改残差块中激活函数为Mish激活函数,弥补Relu激活函数的不足,最后加入SPD-Conv模块代替步长和池化层进行下采样用以减少信息丢失以提升较小火灾区域的

47、检测精度。本文将STPM网络和现有火灾检测网络进行对比实验,结果表明改进的教师学生网络在自制隧道火灾数据集上相较于STPM网络ARI提升0.1,ARP提升0.17,牺牲了一些检测速度,但检测精度大幅度提升。相比于现有火灾检测算法,在具有检测速度和体量优势同时保持了较高的检测精度。综上所述,本文提出的模型适合隧道火灾检测的应用。目前火灾检测仅针对隧道场景,下一步将继续对其他场景的火灾检测问题进行研究,并进一步轻量化模型,提升模型检测速度。参考文献(References)1 郝瑀然.2021 年交通运输行业发展统计公报EB/OL.(2022-05-25)2022-12-06.https:/ Y R

48、.Statistical bulletin on the development of the transport industry in 2021EB/OL.(2022-05-25)2022-12-06.https:/ Chinese).2 祝玉华,司艺艺,李智慧.基于深度学习的烟雾与火灾检测算法综述J.计算机工程与应用,2022,58(23):1-11.ZHU Y H,SI Y Y,LI Z H.Overview of smoke and fire detection algorithms based on deep learningJ.Computer Engineering and A

49、pplications,2022,58(23):1-11(in Chinese).3 陈嘉卿,张冰,宋英磊.基于 RGB 统计颜色模型的火焰识别J.江苏科技大学学报:自然科学版,2017,31(2):178-184.CHEN J Q,ZHANG B,SONG Y L.Flame recognition based on statistical RGB color modelJ.Journal of Jiangsu University of Science and Technology:Natural Science Edition,2017,31(2):178-184(in Chinese)

50、.4 SUN K L,ZHAO Q C,WANG X W.Using knowledge inference to suppress the lamp disturbance for fire detectionJ.Journal of Safety Science and Resilience,2021,2(3):124-130.5 XIE Y K,ZHU J,CAO Y G,et al.Efficient video fire detection exploiting motion-flicker-based dynamic features and deep static feature

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服