1、第 卷,第 期自 然 资 源 遥 感,年 月 ,:引用格式:郭晓萌,方秀琴,杨露露,等 基于人工神经网络的西辽河流域根区土壤湿度估算 自然资源遥感,():(,():)基于人工神经网络的西辽河流域根区土壤湿度估算郭晓萌,方秀琴,杨露露,曹 煜(河海大学水文水资源学院,南京)摘要:土壤水是衔接大气、地表、土壤和地下的水分转换和循环的核心,土壤湿度是全球气候观测系统的基本气候变量之一,在区域尺度的水分和能量交换中起着重要作用。根区土壤湿度的估算和时空变化特征的获取,对农业产量评估、洪水和干旱预测、水土保持等均具有重要意义。以西辽河流域作为研究区,基于人工神经网络,以遥感表层土壤湿度、累积降水量、累积
2、日最高温、累积日最低温、相对湿度、日照时长、云覆盖度、风速、土壤属性、归一化植被指数、实际蒸散发量等作为解释变量,以站点实测的根区土壤湿度作为目标变量,采用 年的数据训练模型,估算研究区内 年每天的根区土壤湿度。结果表明,基于人工神经网络的根区土壤湿度估算值与站点实测根区土壤湿度之间的平均均方根误差为 ,平均相关系数为 ,表明人工神经网络模型能够有效地估算西辽河流域内的根区土壤湿度。研究发现土壤湿度的变化量与降水量密切相关。关键词:根区土壤湿度;人工神经网络;西辽河流域;遥感土壤湿度中图法分类号:文献标志码:文章编号:()收稿日期:;修订日期:基金项目:国家自然科学基金项目“土壤湿度时空分布对
3、半干旱区水文过程的作用机制研究”(编号:)和国家重点研发计划项目“小流域暴雨洪水及灾害风险关键因子辨识量化”(编号:)共同资助。第一作者:郭晓萌(),女,硕士研究生,主要研究方向为地表参数遥感反演、干旱预报预警等。:。通信作者:方秀琴(),女,教授,主要研究方向为地表参数遥感反演、分布式水文模型及山洪灾害防治。:。引言土壤水分是衔接大气、地表、土壤和地下的水分转换和循环的核心,土壤湿度是全球气候观测系统的基本气候变量之一,对于区域尺度的水分和能量交换也中起着至关重要的作用。虽然土壤水分仅占世界水资源的一小部分,但是在不同的地表和地下条件中,土壤水分对水循环的水量和能量平衡起着至关重要的作用。由
4、于土壤特征、土地利用、植被、地形以及气候条件的差异,土壤湿度的时空变异非常大,传统的站点观测由于站点的数量有限、观测需要大量的人力、物力等而无法高效地获得大范围连续的观测数据。卫星遥感是获取土壤水分的一种有效的方式,可以提供地表土壤湿度的空间信息,能够对地表进行连续且大规模的观测。但卫星遥感仅能获取近地表()的土壤湿度信息,无法获取根区土壤湿度(,)的时空分布信息。研究表明,位于植被根系层的 对土壤表层的蒸发过程和植被蒸腾作用以及土壤 植被 大气界面的水分和能量收支有着显著影响,是蒸发、蒸腾、径流、地下水补给等水分分配的关键。因此 的定量估算及其时空变化特征对于水文、农业和气象的研究和应用都非
5、常重要。的估算方法主要包括同化法、指数滤波器、土壤水分分析关系(,)模型 和人工神经网络(,)等。其中 模型能够模拟土壤水分之间的非线性相互作用,考虑土壤水分的传输特性以及地表通量的影响。等提出利用 从地表测量中估计根区土壤水分的方法;吴善玉基于 系列卫星中的 数据、光学数据以及 亮温数据,分别在青藏高原那曲地区和西班牙萨拉曼卡地区训练了 神经网络模型反演地表土壤水分,结果表明在 神经网络中加入表达地形要素的坡度因子可以更好地训练网络,得到更高精度的反演结果;杨晓霞等针对神经网络收敛速度慢、易陷入局部最优的问题,提出基于动量自 然 资 源 遥 感 年因子和自适应学习率的 神经网络改进方法,用于
6、土壤湿度的时序预测,结果表明该方法在预测精度、收敛速度方面都优于其他 种方法。辽河是我国东北地区南部第一大河,流经河北、内蒙古、吉林、辽宁 省区,西辽河流域占其面积的,流域地处农牧交错地带,是典型的干旱半干旱地区,同时也是我国重要的商品粮基地。在西辽河流域开展根区土壤湿度时空分布的精确估算,对西辽河平原水旱灾害防治、水资源有效利用以及社会经济可持续发展具有重要意义。综上所述,本文将西辽河流域作为研究区,利用 方法,以 年的数据训练模型,基于模型估算西辽河流域内 年的,分析其时空变化特征,为减轻西辽河流域水旱灾害、有效保护及合理开发利用水资源,提高水土保持能力以及社会经济可持续发展提供科学依据。
7、研究区概况和数据源 研究区概况西辽河流域地处我国北方农牧交错带东段三北交界处,地理范围为 ,面积约 万,主要在内蒙古自治区境内,小部分边缘区域位于吉林省、辽宁省和河北省境内,如图 所示。流域北、西、南 面环山,东邻辽河平原,地势西高东低,海拔在 ,干流长 ,水流方向为自西向东,最后汇入辽河,流域内较大的支流有西拉木伦河、老哈河、新开河、西辽河等。西辽河流域平原区是典型的干旱半干旱地区,属温带大陆性气候,季节分明,干旱少雨,年降雨量在 之间,的降雨量多集中在 月,年平均气温在 之间,年日图 研究区地理位置、地形和水系图 ,照时数在 之间。由于西辽河流域地理区位特殊,自然环境、人类活动的双重影响使
8、得沙漠化现象逐年严重,当地农牧业直接或间接地受到影响,西辽河流域成为我国东北地区生态环境最为脆弱的地区。数据及预处理 遥感表层土壤湿度数据本研究采用的遥感表层土壤湿度数据来自欧洲航天局气候变化倡议项目()的土壤湿度数据集 融合产品(:),该产品以 ,等散射计产品和,和,等辐射计产品为基础,采用合并算法 融合成长时间序列的土壤湿度数据集。数据的空间分辨率为 ,时间分辨率为 ,研究采用 年每天的数据。站点实测土壤湿度数据本研究采用的实测土壤湿度数据来自国家气象局的站点土壤湿度数据,以体积含水量()为单位,包括,和 等深度的土壤湿度,时间分辨率为。考虑到西辽河流域为半干旱地区,研究表明在自然条件下的
9、半干旱区土壤,土壤水分的入渗深度一般在 左右,植被根系主要分布在地下 左右,因此本研究将地下 的土壤湿度作为研究区内的根区土壤湿度,将 ,和 深度的实测土壤湿度数据均值作为站点实测。实测站点的分布情况如图 所示。第 期郭晓萌,等:基于人工神经网络的西辽河流域根区土壤湿度估算 土壤属性数据本研究使用的土壤属性数据来自 等的研究成果,土壤物理属性数据包括土壤各个深度的沙砾含量、粉粒含量和黏粒含量,单位为 ,土壤水文属性数据包括土壤各个深度的田间持水量、萎蔫含水量、残余含水量、饱和含水量、饱和导水率、土壤容重和孔隙度,含水量的单位为 ,饱和导水率的单位为,容重的单位为 ,孔隙度的单位为 。以上土壤属
10、性均包括,),),),),)和,多个深度数据,将,)和,)的土壤属性分别作为土壤表层和根系层的土壤属性数据,并将土壤属性数据重采样为分辨率为 的栅格数据。气象数据本研究所采用的气象数据来自国家气象局,时间分辨率为每日,包括 年每天的云覆盖度 、日最高温、日最低温、日降水量()、相对湿度、风速()和日照时长,将所有气象数据重采样为 的栅格数据。植被指数数据归一化植被指数(,)与光合作用吸收辐射占总辐射的比例有关,是最常使用的反映植物叶绿素活性的植被指数,计算公式为:,()式中:为近红外波段反射率;为红光波段反射率。本研究使用的红光波段和近红外波段来自 遥感影像数据(:),遥感影像数据是由美国对地
11、观测计划 发射的极地轨道环境遥感卫星 携带的中分辨率成像光谱仪()获取的 级网格数据产品,影像提供波段()和波段()的表面光谱反射率估计值,并针对气体、气溶胶和瑞利散射等大气条件进行了校正,投影方式为正弦曲线投影,空间分辨率为,时间分辨率为 ,数据格式为 。对 年期间覆盖西辽河流域()的所有 影像进行投影转换,重采样为 空间分辨率,并裁剪得到研究区内反射率数据序列。将波段 作为红光波段,波段 作为近红外波段,根据式()计算得到研究区内 年每天的 分辨率 数据。实际蒸散发本研究选取 产品表征西辽河流域内的实际蒸散发。模型基于 公式,利用来自不同卫星的遥感观测数据反演得到空间分辨率 的日实际蒸散发
12、。模型由 个相互联系的单元组成:截留模型;土壤模块;胁迫模块;模块。将高大冠木、低矮植被以及裸土这 种有具体物理特性的陆地表面类型分开计算。本文使用的 模型估算的全球陆地蒸散发,空间分辨率是 ,时间分辨率为 ,时间跨度为 年,具体模型结构可参考文献。等于 年详细评价了 蒸散发产品在中国区域的适用性,因此本研究不再单独评价其在西辽河流域的适用性。研究方法 模型在过去 中,模型已广泛应用于水文学领域。在各种神经网络模型中,多层感知机(,),又称前馈神经网络,能够捕捉系统中的非线性,被广泛应用于预测在复杂大气和作物生长条件下的土壤湿度。研究表明,在训练样本数量足够、权重取值合理和模型结构设置恰当的情
13、况下,具有一个隐藏层的多层感知机模型能够拟合任何连续且有界的函数。因此本研究使用 层 模型,包括一个输入层、一个隐藏层和一个输出层(图)。第一层的神经元代表模型的输入变量,将加权输入变量和偏差之和传递给隐藏层中的神经元,计算隐藏层神经元中内图 模型结构示意图 自 然 资 源 遥 感 年置的激活函数,得到隐藏层神经元的输出,将隐藏层神经元的加权输出和偏差之和传递给输出层,计算输出层神经元的激活函数,得到整个网络模型的输出值。这一过程可表示为:(),()式中:为神经网络的输出变量;为输入变量;和 分别为输入层神经元和隐藏层神经元的权重;和 分别为输入层和隐藏层的偏差;和 分别为输出神经元和隐藏神经
14、元的激活函数。算法捕捉非线性特征的能力主要依赖于神经元中使用的非线性激活函数。研究表明,正切 型函数反对称性的特点通常会加速学习过程,在以往研究中被证明是在水文模型中更好的选择,因此将正切 型函数设置为隐藏层神经元的激活函数。以往研究未发现输出神经元的非线性函数对模型有明显改善效果,为了简化模型,选择线性函数作为输出层的激活函数。隐藏层的神经元的个数一般在 个之间,研究发现隐藏层神经元个数越多,模型拟合越精确,但模型容易过拟合。等采用 个隐藏层神经元模拟小规模,能够取得较好的效果。本研究中的模型训练数据总共包含 个样本,数据规模与 等采用的数据规模相近,因此本研究分别采用,和 个隐藏层神经元训
15、练模型,发现隐藏层神经元个数为 个时,模型模拟的 与站点实测 之间的相关性较高,因此将隐藏层的神经元个数设置为 个。将每个输入 目标对视为 学习的一个样本,每个样本的估计值与相应的目标值之间存在误差,神经网络可以通过调整神经元之间的权重来最小化误差函数,从而增强其拟合目标的能力。在本研究中,均方误差(,)被用作所有模型训练的误差函数,计算公式为:(),()式中:为样本数;和 分别为模型输出值和相应的目标变量值。为了获得最小代价函数,采用 算法(简称 算法)对 模型进行训练,该算法被证明因其平衡了牛顿法的速度和最快下降法的收敛性而比其他算法更近有效。为了避免 模型过拟合,用于训练模型的数据集分为
16、 部分:训练集()、验证集()和测试集()。当测试集的 或达到最大迭代次数 时停止迭代。基于 的 估算由于 是数据驱动的方法,训练数据集的代表性和大小会对模型性能产生很大影响。根系层中的土壤水分动态受多种水文过程的影响,主要包括土壤表层到根系层的水分渗透,根系层土壤水分的下渗、毛细管上升、横向流动和植被根系对根系层土壤水分的吸收等。研究表明,土壤含水量和土壤的物理和水文属性影响土壤表层和根系层之间的水分运动,根系生长程度影响根系吸收水分的强度,降水量、气温、风速等气象条件通过影响植被生长状况和土壤表层含水量间接地影响根系层的土壤湿度。由于西辽河流域位于半干旱地区,因此根系层的水分输入主要来自表
17、层土壤水分下渗,水分输出主要为蒸散发,所以选择与 关系最密切的遥感表层土壤湿度作为解释变量之一。考虑到研究区在不同时段和不同地区的气象状况不同,还选择了影响根区土壤水分和能量平衡的各种气象变量作为输入变量,包括日尺度的相对湿度、降雨量、最高温、最低温和风速。和蒸散发能够为模型提供蒸发和蒸腾作用的相关信息,因此解释变量也包括 和蒸散发。作为低通过滤器,与大气具有正反馈机制,累积降水量和温度是用于估算 的更有效的输入变量。前 和 的累积降水量被认为是有效输入,研究表明采用前 的累积输入的模型的效果更好,为了较为全面地考虑降水量带来的影响,将当天的降水量、前 的累积降水量和前 的累积降水量作为模型中
18、与降水量有关的解释变量。综上所述,本研究以站点实测的 作为目标变量,以站点所在栅格的遥感表层土壤湿度、土壤的黏粒含量、沙砾含量、粉粒含量、凋萎含水量、田间持水量、土壤容重、当天降水量、前 累积降水量、前 累积降水量、前 累积日最高温、前 累积日最低温、相对潮湿度、日照时长、风速、云量、和实际蒸散发量作为神经网络模型的输入变量,采用 层 模型建立 估算模型。隐藏层中包括 个神经元,训练算法为 算法。以 年的数据训练模型,基于模型估算西辽河流域内 年的 时空分布。结果与分析由 模拟的 年西辽河流域内每天的 与站点实测 之间的统计对比(表第 期郭晓萌,等:基于人工神经网络的西辽河流域根区土壤湿度估算
19、)可知,模拟 与站点实测 之间的平均均方根误差(,)为 ,平均相关系数 为 ,所有 相应的 ,表明以土壤质地数据、土壤水文特征、降水累积值、气温累积值、和蒸散发作为解释变量,基于 建立 估算模型能够取得较好的效果。表 模拟 与站点实测 之间的 和 站点名称巴雅尔吐胡硕 富河 扎鲁特 巴林左 舍伯吐 科左中 (续表)站点名称巴林右 林西 克什克腾 阿鲁科尔沁 开鲁 通辽 翁牛特 岗子 赤峰 奈曼 敖汉 喀喇沁 八里罕 图 图 分别为 年克什克腾、岗子和敖汉的降水量、模拟 时间序列和站点实测 时间序列。图 年克什克腾的 模拟 与站点实测 时间序列 图 年岗子的 模拟 与站点实测 时间序列 自 然
20、资 源 遥 感 年图 年敖汉的 模拟 与站点实测 时间序列 对比降水量和站点实测 可知,西辽河流域 月的降水量较为丰富,相应地,月的 较高,其峰值一般出现在站点所在位置降水量增加的 内,且 的变化梯度不等。但并不是每次的降水量增加都必然导致 的增大:如克什克腾站点 年 月下旬的实测、岗子站点 年 月下旬和 年 月中旬的实测 和克什克腾站点 年 月 日和 年 月 日的实测,说明降水量的突然增加并不是 的唯一影响因素。总的来说,的年内变化表现为 月数值小而平稳,月随降水量等因素的变化而波动变化,月急剧下降。对比 模拟 时间序列和站点实测 时间序列可知,模型模拟的 时间序列比站点实测 时间序列的数值
21、波动大,但二者有着相近的时间变化趋势,表明 模型模拟的 能够较好地捕捉根系层土壤水分的变化动态。但 模型估算 也存在不足,具体表现为在一年中降水较丰富的 月份,模型容易高估降水量增加后的 的变化梯度,从而高估 的实际值,表明采用当天的降水量、前 的累积降水量和前 的累积降水量作为与降水相关的解释变量存在局限,且模型对根系层土壤水分的水分损失相关的解释变量考虑不够。由 年 月 日和 年 月 日的西辽河流域的 估算值(图 和图)可知,西辽河流域的 数值在 之间,流域内的 的空间异质性较高,整体呈现出从西向东,逐渐增大的空间分布特征。在整个流域的空间范围内,流域北部和西北部边缘处的 最小,数值在 左
22、右。图 年 月 日西辽河流域根区土壤湿度估算值 ,图 年 月 日西辽河流域根区土壤湿度估算值 ,结论与讨论根区土壤湿度的估算对农作物估产、水文模型第 期郭晓萌,等:基于人工神经网络的西辽河流域根区土壤湿度估算构建、水资源管理等具有重要意义。本研究将 年每天的 土壤湿度数据、风速、前 的累积降水量、前 的累积日最高温、前 的累积日最低温、相对潮湿度、土壤质地、土壤水文属性、和蒸散发等作为解释变量,将 年每天站点实测的 作为目标变量,基于 算法建立 估算模型,估算 年西辽河流域每天的。主要结论如下:)结果表明,模型模拟的 时间序列与站点实测 时间序列之间的平均 为 ,平均 为 ,表明 模型能够取得
23、较为可靠的 估算值。)模型模拟的 时间序列和站点实测 时间序列有着相近的时间变化趋势,表明 模型模拟的 能够较好地捕捉根系层土壤水分的动态变化,但 模型容易高估降水量增加后的根区土壤湿度的变化梯度,从而高估 的实际峰值,可能的原因包括:采用当天降水量、前 累积降水量和前 累积降水量作为与降水相关的解释变量存在局限;模型对根系层土壤水分的水分损失相关的解释变量考虑不够;模型的模式学习和现实状况中的不确定性之间的矛盾。)西辽河流域 的年内变化表现为 月数值小而平稳,月随降水量等因素的变化而波 动 变 化,月 急 剧 下 降。月 的 较高,其峰值一般出现在站点所在位置降水量增加的 内,但并不是每次的
24、降水量增加都必然导致 的增大。流域内 的数值在 之间,空间异质性较高,整体呈现出从西向东,逐渐增大的空间分布特征。总之,将遥感表层土壤湿度数据、气象条件、土壤属性、和实际蒸散发等作为解释变量,站点实测 作为目标变量,建立 模型来估算半干旱的西辽河流域 的时空分布及其动态变化特征,为水文模型建模、干旱预报预警等提供科学依据。然而,本研究也存在许多不足:首先,在选择 模型的解释变量时,未对解释变量进行分析和筛选,而是根据 的物理意义选择模型中的解释变量,且未讨论累积降水量和累积气温的天数对模型效果的影响;其次,从结果来看,本研究建立的 模型容易高估降水量增加后的 的变化梯度,从而高估 的实际值,表
25、明模型对根系层土壤水分的水分损失相关的解释变量考虑不够,解释变量的选择和筛选还需要进一步讨论。模型的精度高度依赖于解释变量的选择和模型结构的设置,对于 的估算来说,解释变量的选择对模型有效性的影响更大,未来可进一步探讨降水量累积值的天数、水分损失相关变量对 估算的影响。参考文献():,:,():聂 艳,马泽玥,周逍峰,等 阿克苏河流域土壤湿度反演与监测研究 生态学报,():,():高 露,张圣微,赵鸿彬,等 退化草原土壤理化性质空间异质性及其对土壤水分的影响 干旱区研究,():,():,():,(),():,():,:,:,():,():,():,():自 然 资 源 遥 感 年 ,():,(
26、):,():吴善玉 基于神经网络算法的多源遥感联合反演土壤湿度研究 南京:南京信息工程大学,:,杨晓霞,贾 嵩,张承明,等 一种基于神经网络的土壤湿度预测方法 江苏农业科学,():,():朱丽亚,孙 爽,胡 克 西辽河流域植被 时空分布特征及其影响因素研究 广西植物,():,(),():赵子娟,范蓓蕾,王玉庭,等 年西辽河流域植被覆盖度时空变化特征及影响因素研究 中国农业资源与区划,():,():宫丽娟,刘 丹,赵慧颖,等 西辽河地区植被气候生产潜力及其对气候变化的响应 生态环境学报,():,():崔一娇,朱 琳,赵力娟 基于面向对象及光谱特征的植被信息提取与分析 生态学报,():,():孙小
27、舟,封志明,杨艳昭,等 西辽河流域近 年来气候变化趋势分析 干旱区资源与环境,():,():谢冰绮,吕海深,朱永华 基于遥感土壤湿度反演中尺度流域水储量季节性变化 中国农村水利水电,():,():,():,():,():,():,荀其蕾,董乙强,安沙舟,等 基于 数据的新疆草地生长状况遥感监测研究 草业学报,():,():张仁平,冯琦胜,郭 靖,等 年中国北方草地 和气候因子时空变化 中国沙漠,():,():杨秀芹,王国杰,潘 欣,等 基于 遥感模型的中国 年地表蒸散发时空变化 农业工程学报,():,():,():,():,():,?,():,第 期郭晓萌,等:基于人工神经网络的西辽河流域根区土壤湿度估算 ,():,:王青青,张 珂,叶金印,等 安徽省土壤湿度时空变化规律分析及遥感反演 河海大学学报(自然科学版),():,(),():,():,():,():,(),():,():,():,:,():,():,(,):,(),(),:;(责任编辑:李 瑜)