1、 :引用格式:路秋叶,刘法军,丁志国,等基于改进深度学习模型的冬小麦种植面积提取研究无线电工程,():,():基于改进深度学习模型的冬小麦种植面积提取研究路秋叶,刘法军,丁志国,郭鹏,宫锟霖,(山东农业大学 信息科学与工程学院,山东 泰安;山东省地质矿产勘查开发局第五地质大队,山东 泰安)摘要:冬小麦种植面积的精确提取对粮食估产、农业政策制定、科学研究等具有重要意义。针对原始深度学习语义分割模型存在的分割效果差、提取精度低、模型复杂以及训练时间长等问题,采用主干网络、注意力机制、损失函数、组归一化和条带池化对其网络模型进行改进,以高分二号影像为数据源,利用改进的模型进行冬小麦面积的提取。结果表
2、明,单一改进模块融入对网络模型提升不高,将主干网络、卷积块的注意力模块(,)、函数、组归一化(,)和条带池化()模块都有效融入网络模型时,相比未改进的网络模型、分别提高了、,利用改进模型提取的夏张镇冬小麦面积与政府统计数据相比较,相对误差仅为,提高了;结合外业采样点,夏张镇和徂徕镇的冬小麦面积提取精度分别达到、,有力证明了改进算法在冬小麦面积提取模型中的有效性。关键词:深度学习;冬小麦;模型;高分二号;语义分割中图分类号:文献标志码:开放科学(资源服务)标识码():文 章 编 号:(),(,;,):,(),(),:;收稿日期:基金项目:山东省自然科学基金(,):(,)专题:长时序定量遥感产品重
3、建与应用 年 无线电工程 第 卷 第 期 引言冬小麦是我国北方地区的主要粮食作物之一,对国家经济发展起着举足轻重的作用。及时了解冬小麦种植面积对开展冬小麦长势监测和估产、区域粮食安全评估、制定农业政策等工作具有重要的社会意义。当前,卫星遥感技术已经成为获取大范围冬小麦种植信息的最主要方法,国内外众多学者开展了冬小麦种植面积提取研究。其中,最常见的监测冬小麦种植面积的方法有:以归一化植被指数(,)等植被指数的时间序列变化为依据,设定适当的阈值,提取出冬小麦的空间分布信息。采用机器学习的方法,对遥感图像中的各类地物进行分类,并提取出冬小麦的种植面积。然而现有的机器学习方法依赖于专业知识人为创建特征
4、,对影像特征或组合方式的选取均会影响算法的精度,且没有有效地利用影像中的特征信息。基于深度学习的卷积运算,以其特有的内部层次结构、强大的自主性与容错性能够从原始数据中自动提取特征,并对其进行逐像元的语义分割,广泛应用于作物信息提取,但存在模型复杂以及训练时间较长的问题。谷歌团队自年起提出了一系列模型,其中分割效果最优的是模型,但该模型在解码器()部分对于特征图的多尺度连接不够充分,存在漏分、错分以及边界粘合现象,最终的语义分割图的分割精细度有待提高。此外,因遥感影像中冬小麦内部差异较小,主干网络并不能很好地发挥深层网络结构的优势,导致过度拟合的风险增大;同时,过深的网络还需要更多的硬件支持,导
5、致训练时间过长。因此,本文旨在解决深度学习语义分割中存在的分割效果差、提取精度低、模型复杂以及训练时间长等 问 题,基 于 高 分 辨 率 遥 感 影 像,利 用模型,引入主干网络、注意力机制、损失函数、组归一化(,)和条带池化(),提出一种改进的模型,并应用于山东省泰安市岱岳区夏张镇和徂徕镇的冬小麦种植面积提取,取得了较为满意的结果。研究区概况与数据预处理 研究区域概况山东省泰安市岱岳区位于泰山以南,属于温带季风气候,四季分明,寒暑适宜,光温同步,雨热同季,气温年平均值 ,年平均降水量 ,年际变幅较大。受地貌影响,东部降水多于西部,山区降水多于平原,具有春旱、夏涝、晚秋又旱的水情特点。夏张镇
6、位于岱岳区西部,地势北高南低,在良好的土壤墒情和适宜的气候下,冬小麦种植基本实现全覆盖,主要集中在东南部的平原地区,且大面积连片种植,小部分集中在西部;徂徕镇位于岱岳区东南部,地势东南高西北低,耕地主要集中在北部和西部,冬小麦分布分散且占比小。数据及预处理高分二号卫星是我国自主研制的首颗空间分辨率优于 的民用光学遥感卫星,搭载台高分辨率 全色、多光谱相机。影像采集时间为年月日和年月日。利用软件对原始影像进行辐射定标、大气校正和正射校正等预处理,并裁剪成 的小样本,然后使用工具包绘制冬小麦标签。本文采用旋转、旋转、旋转、水平翻转和竖直翻转共种方式对原图和标签图进行数据增强,以提高模型精度,防止过
7、拟合现象,如图所示。经过筛选去除问题影像,最终生成 对样本数据,并依照 的比例生成训练集、验证集、测试集,从而完成数据集的构建。图数据增强 专题:长时序定量遥感产品重建与应用 研究区采样点分布通过对夏张镇和徂徕镇的实地调研,根据研究区的地形、土地利用、冬小麦分布等布设采样点,共布设夏张镇冬小麦采样点个,徂徕镇冬小麦采样点个,采样点位置分别如图()和图()中的绿色三角符号所示。获取的实际采样点不仅可以为样本数据集的制作提供数据支撑,还可以用于岱岳区夏张镇和徂徕镇冬小麦种植面积提取结果的精度验证。()夏张镇采样点示意()徂徕镇采样点示意图采样点示意 模型与方法 模型是一种基于编码器()与相结合的语
8、义分割模型。采用主干网络和空洞空间金字塔池化(,)提取的深层特征通过上采样()进入解码器,并将其与原始浅层特征图融合,再利用上采样还原特征图,最终得到冬小麦分割结果。原始的网络结构如图所示。图网络结构 改进模型针对 模型对图像分割的拟合速度慢、目标边缘分割精度不高的问题,对 模型做以下五方面的改进。改进的 语义分割网络整体结构如图所示。专题:长时序定量遥感产品重建与应用 年 无线电工程 第 卷 第 期 图改进后的网络结构 替换主干网络本文采用轻量化改进的网络模型,在利用深度可分离卷积的基础上,通过引入倒置残差模块和线性瓶颈层的方法,极大地降低模型参数量,从而加快网络的收敛速度。卷积块的注意力模
9、块(,)结合通道注意力模块和空间注意力模块,将其按顺序串联处理,如图所示。该模块通过对各通道及各像素点的处理,对输入图像的特征进行自适应优化,使模型获得最优的处理效果,且能够节约参数和计算力。图 组归一化批归一化(,)是指一种在批次维度上进行归一化的操作,并受批次大小()的影响。错误率随的减小而增大,若过小则计算均值和方差会不准确,若太大则显存可能不够用。而组归一化(,)算出的是每个组的均值和方差,避免了对模型的影响,基本保持不变。组合损失函数是评价分类器性能的函数。原始模型使用交叉熵损失函数(,)计算损失时未对不同类别进行限制。相似系数损失函数()是一种基于区域的损失,从全局出发计算损失,而
10、焦点损失函数()是基于分布的损失,是交叉熵损失的一种变体,二者结合可通过降低简单示例的权重来解决类别不平衡难易样本的不平衡问题。条带池化条带池化采用水平垂直的条带状池化的方法,有效处理目标为长条状时的情形,并可获得孤立区域间的远距离关系,进而获得上下文信息。与条带池化并联能够更好地捕捉多尺度信息,适应不同大小的目标。同时,条带池化和都具有参数共享的特性,它们可以共享相同的参数减少训练数据量,降低过拟合风险,并增强模型的鲁棒性和稳定性。实验环境设置实验过程中使用 、;硬件实验环境采用显卡为 。设置为,初始学习率设置为,训练轮数为。评价指标本文利用平均交并比(,)、准确率()和平均像素精度专题:长
11、时序定量遥感产品重建与应用 (,)作为识别结果评价指标。其中为计算真实值和预测值个集合的交集和并集之比;为预测类别正确的像素数占总像素数的比例;为计算每个类内被正确分类的像素数之后求所有类的平均值。,(),(),()式中:为预测为冬小麦的像素数,为将冬小麦预测为背景的像素数,为将背景预测为冬小麦目标的像素数,为预测为背景的像素数。结果与分析 改进前后结果对比为解决由于网络过深而导致的过拟合现象,本文选择作为主干网络,由于其具有轻量化的网络结构,可以对训练时间、预测时间及参数数量等方面进行优化。不同的主干时间和参数量情况如表所示,替换主干网络之后的单张训练时间降低到 ,预测时间缩短到,参数量减少
12、到 ,从数据上完成轻量化网络的任务。损失值是反映预测值和真实值之间的差距,改进前后损失函数曲线如图所示。表不同主干网络训练时间与参数量的结果对比 主干网络单张训练时间 单张预测时间 参数量 ()模型图()改进模型图图改进前后对比 由图()可以看出,随着训练次数的增多,前次训练时,以为主干网络的模型的训练集值()不断降低,但测试集值()反升,表明网络虽在训练集上能够取得较好的效果,但难以将其扩展到训练集以外的其他数据上,因而造成严重的过拟合现象;当进行第次迭代训练时,模型逐渐收敛,最后的训练集最小值为,测试集最小值为。由图()可以看出,以为主干网络的改进模型在训练前期值出现振荡,但总体上变化幅度
13、较小,且训练集和测试集的值均呈现出下降趋势;模型在次迭代后逐渐收敛,损失函数值最终均收敛为,与原始模型主干网络相比,分别降低了、,说明轻量化主干能够有效减少过拟合现象,改进模型具有较好的损失函数收敛性,这将有利于提高冬小麦图像分割精度。深度学习方法提取结果与有效性验证本文选取夏张镇和徂徕镇进行冬小麦种植面积提取,从定性和定量个方面对改进后的模型提取冬小麦结果进行分析,以验证改进模型在提取冬小麦方面的优越性。使用网络模型对原样本图进行训练,结果如图所示。图()图()为夏张镇影像及其提取结果图,图()图()为徂徕镇影像及其提取结果图,绿色椭圆为原始模型错分和漏分明显的部分。可以明显看出,不论冬小麦
14、的种植区是密集或者分散,改进后的模型均可识别出冬小麦,虽然仍存在少量的错分和漏分问题,但个地区改进后的模型提取结果相对于原始网络模型边界线表现相对平滑、棱角分明,对于识别线性地物的效果良好,提高了规则和不规则地块的提取效果。专题:长时序定量遥感产品重建与应用 年 无线电工程 第 卷 第 期()原始夏张镇图()夏张镇原始模型图()夏张镇模型改进图()原始徂徕镇图()徂徕镇原始模型图()徂徕镇模型改进图图结果对比 为验证本文改进模型的有效性,引入、进行有效性验证,精度结果如表所示。可以看出,改进后的模型相较于原模型分别提高了、和,表明改进后的模型比原始的模型有明显的精度提升效果。表模型改进前后的精
15、度结果对比 模型 改进后的 为进一步评价改进模型的提取精度,利用 软件对改进前后夏张镇和徂徕镇的冬小麦提取结果进行叠加分析。结合研究区的采样点(图()和图(),对比改进模型提取的夏张镇冬小麦提取结果,其中处分类正确,错误分类点个,分类精度为,较原始的模型的精度提高;改进 模型在徂徕镇的结果,处验证点正确分类,个出现误分,分类精度为,较原始的模型的精度提高,结果有力证明了改进算法,使得模型模型在冬小麦提取时具有更高的提取精度。改进 消融实验结果为了进一步验证本文提出的方法是否有效及改进部分是否对模型的整体性能起到积极作用,将本文提出的改进方法在原始模型基础上进行消融实验,并制定多种评估方案,记录
16、每一种方案及其对应结果,如表所示。其中方案为原始模型,方案 均在方案基础上做出改进。表消融实验结果评估 方案条带池化 对比方案和方案的精度结果可以发现,基于原始的模型,在引入改进的作为主干网络后提高了;方案和方案相比,引入 组合后,并没有损失过多的精度,仅减少;方案和方案相比,添加后,提高了,结果表明,虽然注意力机制对精度有一定的改善,但是其提高幅度并不大,是由于原始的模型因过深网络而造成过拟合现象;方案和方案相比,引入替代后,提高了;方案和方案相比,添加条带池化,提高了;方案和方案相比,结合条带池化后,明显提高了。将种改进方案结合后精度显著提高,即改进的模型专题:长时序定量遥感产品重建与应用
17、 的提高了,进一步验证了本文方法的可行性。夏张镇冬小麦分布信息提取本文利用改进后的模型,基于高分二号遥感数据提取夏张镇,以获得冬小麦的空间分布信息,结果如图所示。对比图()和图()可以看出,改进前后模型都可以较好地提取冬小麦种植范围,但改进后的模型显著地减少了错分部分,如图()中红色椭圆圈出的部分,主要以湖泊和与冬小麦特征相似的其他植物为主。()原始模型的夏张镇冬小麦提取结果()改进模型的夏张镇冬小麦提取结果图夏张镇冬小麦提取结果 对夏张镇冬小麦种植面积统计与分析结果如表所示。可以看出,改进的模型提取的夏张镇冬小麦种植面积与官方统计面积相差仅 万亩,相对误差仅为,提高了。分析提取误差出现的原因
18、:一是由于背景地物种类较多,而发生错误的样本点多为零星分布的冬小麦,极易产生误差;二是训练集对样本点的标注也有一定影响,大量的人工工作必然会带来不确定性,导致人为干预下的标注不够精确,从而对分类效果造成一定影响。表夏张镇冬小麦种植面积 地区提取结果万亩政府统计万亩误差万亩相对误差改进前夏张镇 改进后夏张镇 徂徕镇冬小麦分布信息提取利用改进前后的模型对徂徕镇冬小麦分布信息提取,如图所示。对比图()与图()可以看出,改进后模型提取效果明显优于原始模型提取效果。通过将实际影像中冬小麦的种植范围与改进模型提取出的种植范围对比,发现仍有小部分误差。分析造成提取误差的主要原因为徂徕镇的冬小麦分布分散,导致
19、改进的模型有效利用的上下文特征较少,以及人工标注对于分类结果造成不可避免的影响。()原始模型的徂徕镇冬小麦提取结果专题:长时序定量遥感产品重建与应用 年 无线电工程 第 卷 第 期()改进模型的徂徕镇冬小麦提取结果图徂徕镇冬小麦提取结果 结束语针对基于深度学习的语义分割模型中存在的分割效果差、提取精度低、模型复杂以及训练时间长等问题,本文提出了一种适用于遥感冬小麦种植面积提取的改进模型。在模型的基础上,替换主干网络为主干网络,极大地降低了模型的参数量,减轻模型训练对硬件条件的依赖,从而加快网络的收敛速度;条带池化有效改善深层特征复杂冬小麦分割效果和边界细节分割不精确;加强冬小麦的分割精度与边缘
20、完整度;组合更准确地衡量预测结果与实际结果之间的差别及处理类别不平衡和难样本的问题;结合条带池化后,明显提高了,有效地提高了模型的精度。同时,改进模型的、和分别达到、和,相较于原模型分别提高了、和。利用本文改进方法对夏张镇和徂徕镇冬小麦种植面积进行提取,错分、漏分现象明显少于原始模型,边缘划分的效果得到了进一步改善,将提取的夏张镇冬小麦面积与官方提供数据相比较,相对误差仅为,精度较原始模型提高了。结合外业采样点计算提取精度,精度分别达到、,证明了改进模型对冬小麦提取结果的有效性。?参考文献蒋?,张丽丽,薛平,等我国小麦产业发展情况及国际经验借鉴中国农业科技导报,():李海泳,殷贵鸿从国家粮食安
21、全角度探讨我国小麦育种发展趋势江苏农业科学,():,():刘新杰,魏云霞,焦全军,等基于时序定量遥感的冬小麦长势监测与估产研究遥感技术与应用,():王利民,刘佳,姚保民,等基于影像年度间相关分析的冬小麦面积变化监测农业工程学报,():,():刘胜威,彭代亮,陈俊杰,等基于影像的冬小麦收获面积测算遥感技术与应用,():冯志立,肖锋,卢小平,等基于随机森林特征优选的冬小麦分类方法测绘通报,():关士英,谢传节,袁占良,等基于的高分时序冬小麦种植区提取研究遥感技术与应用,():,:,():曹峰梅,田海杰,付君,等结合特征图切分的图像语义分割中国图象图形学报,():,():,:,():专题:长时序定量
22、遥感产品重建与应用 ,():任月娟,葛小三改进网络的遥感影像道路综合提取方法测绘通报,():孟?,徐磊,郭嘉阳一种基于改进的网络语义分割算法电子学报,():王梦梦,黄德启,刘爽娜基于改进的路面损伤检测激光杂志,():乌兰,苏力德,贾立国,等基于改进网络的马铃薯根系图像分割方法农业工程学报,():,():,():():,:肖鸿鑫基于深度学习的医学图像分割算法研究广州:广州大学,宫锟霖基于改进的冬小麦分布信息提取方法研究泰安:山东农业大学,作者简介路秋叶女,()。主要研究方向:机器学习遥感图像解译。(通信作者)刘法军男,(),硕士,正高级工程师。主要研究方向:农业生态遥感。丁志国男,()。主要研究方向:机器学习遥感图像解译。郭鹏男,(),博士,副教授,硕士生导师。主要研究方向:遥感图像解译。宫锟霖男,(),硕士。主要研究方向:农业信息服务技术与工程。专题:长时序定量遥感产品重建与应用