收藏 分销(赏)

基于LSTM模型预测不同水保工程措施条件下土壤侵蚀量——以辽西北地区为例.pdf

上传人:自信****多点 文档编号:2050020 上传时间:2024-05-14 格式:PDF 页数:8 大小:1.61MB
下载 相关 举报
基于LSTM模型预测不同水保工程措施条件下土壤侵蚀量——以辽西北地区为例.pdf_第1页
第1页 / 共8页
基于LSTM模型预测不同水保工程措施条件下土壤侵蚀量——以辽西北地区为例.pdf_第2页
第2页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第4 3卷第4期2 0 2 3年8月水土保持通报B u l l e t i no fS o i l a n dW a t e rC o n s e r v a t i o nV o l.4 3,N o.4A u g.,2 0 2 3 收稿日期:2 0 2 2-0 9-2 8 修回日期:2 0 2 3-0 1-1 7 资助项目:中煤科工集团沈阳设计研究院有限公司科研基金项目“神东煤炭矿区采煤沉陷区耕地复垦技术研究”(NK 0 0 2-2 0 2 1)第一作者:李明伟(1 9 8 4),男(汉族),辽宁省朝阳市人,学士,高级工程师,主要从事水土保持监测、水土保持监理方向研究。E m a i l:l

2、 m-wm t 1 9 8 41 6 3.c o m。基于L S TM模型预测不同水保工程措施条件下土壤侵蚀量 以辽西北地区为例李明伟(中煤科工集团沈阳设计研究院有限公司,辽宁 沈阳1 1 0 0 1 5)摘 要:目的准确模拟和预测不同水保工程措施下土壤侵蚀量,为辽西北地区精准预测土壤侵蚀量提供技术和理论依据。方法基于野外径流小区2 0 1 12 0 2 1年的监测数据,包括:最大3 0m i n和6 0m i n降雨强度(I3 0和I6 0)、降雨历时(T)、降雨量(P)和土壤侵蚀量,建立了长短期记忆神经网络(L S TM)分别对3种工程措施(水平槽、果树台田和梯田)下的土壤侵蚀量进行预测。

3、并将L S TM预测结果与3个经典机器学习模型 反向传播神经网络(B P)、随机森林(R F)和支持向量机(S VM)预测的结果进行对比。结果在3种工程措施中,I3 0,I6 0,T和P对土壤侵蚀量的影响程度不同,但I3 0,I6 0和T对土壤侵蚀量的影响大于P。利用B P模型预测土壤侵蚀量的相对均方根误差(N RM S E)均大于0.2。相比于R F和S VM模型,L S TM模型在3种工程措施下(水平槽、果树台和梯田)预测土壤侵蚀量的N RM S E分别降低了约0.0 40.0 8,0.0 20.0 8,0.0 50.0 8。利用I3 0和T作为L S TM模型的输入特征预测土壤侵蚀量的精

4、度与使用I3 0,I6 0,T和P为输入特征时的预测精度相近。结论在辽西北地区3种水保工程措施中,利用L S TM模型基于最大3 0m i n雨强和降雨历时对土壤侵蚀量进行预测,取得了较其他传统模型高的预测精度。这说明L S TM模型可在同类地区土壤侵蚀量的精准模拟和确定水土保持措施中推广和应用。关键词:土壤侵蚀量;水土保持工程;机器学习模型;长短期记忆神经网络;深度学习模型;辽西北地区文献标识码:B 文章编号:1 0 0 0-2 8 8 X(2 0 2 3)0 4-0 1 6 2-0 8 中图分类号:S 1 5 7.1文献参数:李明伟.基于L S TM模型预测不同水保工程措施条件下土壤侵蚀量

5、J.水土保持通报,2 0 2 3,4 3(4):1 6 2-1 6 9.D O I:1 0.1 3 9 6 1/j.c n k i.s t b c t b.2 0 2 3 0 5 0 8.0 1 0;L i M i n g w e i.E s t i m a t i n gs o i le r o s i o nu n d e rd i f f e r e n t s o i l a n dw a t e rc o n s e r v a t i o ne n g i n e e r i n g m e a s u r e su s i n gL S TM m o d e lJ.B u l l

6、 e t i no fS o i la n dW a t e rC o n s e r v a t i o n,2 0 2 3,4 3(4):1 6 2-1 6 9.E s t i m a t i n gS o i lE r o s i o nU n d e rD i f f e r e n t S o i l a n dW a t e rC o n s e r v a t i o nE n g i n e e r i n gM e a s u r e sU s i n gL S TM m o d e lAC a s eS t u d y i nN o r t h w e s tL i a o

7、 n i n gP r o v i n c eL iM i n g w e iC h i n aC o a lT e c h n o l o g ya n dE n g i n e e r i n gG r o u p(C C T E G)S h e n y a n gE n g i n e e r i n gC o mp a n y,S h e n y a n g,L i a o n i n g1 1 0 0 1 5,C h i n aA b s t r a c t:O b j e c t i v eT h es o i le r o s i o nu n d e rd i f f e r

8、e n tc o n s e r v a t i o ne n g i n e e r i n g m e a s u r e s w a sp r e c i s e l yp r e d i c t e di no r d e rt op r o v i d eat e c h n i c a la n dt h e o r e t i c a lb a s i sf o rf o r m u l a t i n ga p p r o p r i a t ec o n s e r v a t i o nm e a s u r e s i nN o r t h w e s tL i a o

9、n i n gP r o v i n c e.M e t h o d sW eu s e de x p e r i m e n t a l p l o t d a t a f r o m2 0 1 1 t o2 0 2 1 t h a ti n c l u d e dm a x i m u mp r e c i p i t a t i o n i n t e n s i t y i n3 0a n d6 0m i n u t e s(I3 0a n dI6 0),p r e c i p i t a t i o nd u r a t i o n(T),a n dp r e c i p i t a

10、 t i o n(P)t oc o n s t r u c tal o n gs h o r t-t e r m m e m o r yn e u r a ln e t w o r k m o d e l(L S TM)t op r e d i c ts o i le r o s i o nu n d e rt h r e ed i f f e r e n tw a t e r-a n d-s o i lc o n s e r v a t i o n m e a s u r e s(h o r i z o n t a lt r o u g h,f r u i tt r e et e r r a

11、 c e,t e r r a c e).R e s u l t s f r o mt h eL S TM m o d e lw e r ec o m p a r e dw i t ht h er e s u l t so f t h r e ec l a s s i c a lm a c h i n el e a r n i n gm o d e l s,i.e.,a r t i f i c i a ln e u r a ln e t w o r k s(B P),r a n d o mf o r e s t(R F),a n ds u p p o r tv e c t o rm a c h

12、i n e(S VM).R e s u l t s T h e i m p a c t so fI3 0,I6 0,T,a n dPo ns o i l e r o s i o nw e r ed i f f e r e n t f o r t h e t h r e ed i f f e r e n t c o n s e r v a t i o nc o n d i t i o n s,b u t i ng e n e r a l,I3 0,I6 0,a n dTh a ds i g n i f i c a n t i m p a c t e do ns o i l e r o s i o

13、 n.T h en o r m a l r e l a t i v em e a ns q u a r e e r r o r(N RM S E)o f t h eB Pm o d e l u n d e r t h e t h r e ed i f f e r e n tw a t e r-a n d-s o i l c o n s e r v a t i o nm e a s u r e sw e r ea l l g r e a t e r t h a n0.2.C o m p a r e dw i t ht h eR Fa n dS VM m o d e l s,t h eL S TM

14、 m o d e ld e c r e a s e dN RM S Eb y0.0 40.0 8,0.0 20.0 8,a n d0.0 50.0 8u n d e r t h et h r e ed i f f e r e n tw a t e r-a n d-s o i l c o n s e r v a t i o nm e a s u r e s,r e s p e c t i v e l y.T h eL S TM m o d e lb a s e do no n l yt w o i n p u t f e a t u r e s(I3 0a n dT)h a das i m i

15、l a ra c c u r a c yw i t ht h eL S TM m o d e lb a s e do n f o u r i n p u t f e a t u r e s i np r e d i c t i n gs o i l e r o s i o n.C o n c l u s i o nT h eL S TM m o d e lw a su s e d t op r e d i c t t h e s o i l e r o s i o na m o u n tb a s e do n t h em a x i m u m3 0m i nr a i n f a l

16、l i n t e n s i t ya n dr a i n f a l l d u r a t i o n,a n dt h ep r e d i c t i o na c c u r a c yw a sh i g h e r t h a no t h e r t r a d i t i o n a lm o d e l s.T h i ss h o w s t h a t t h eL S TM m o d e l c a nb ep o p u l a r i z e da n da p p l i e d i nt h ea c c u r a t es i m u l a t i

17、 o no fs o i l e r o s i o na n dt h ed e t e r m i n a t i o no fs o i l a n dw a t e rc o n s e r v a t i o nm e a s u r e s i ns i m i l a ra r e a s.K e y w o r d s:s o i le r o s i o n;s o i la n d w a t e rc o n s e r v a t i o ne n g i n e e r i n g;m a c h i n el e a r n i n g m o d e l;l o

18、n gs h o r t-t e r mm e m o r yn e u r a l n e t w o r km o d e l;d e e pl e a r n i n gm o d e l;N o r t h w e s tL i a o n i n gP r o v i n c e 水土流失是中国面临的主要环境问题之一1。据统计,2 0 2 1年中国水土流失面积达到了2.6 71 06k m22。研究 表 明,降 雨 是 水 土 流 失 的 主 要 动力3。一般来说,降雨强度和降雨量对水土流失的影响最大3-4。肖继兵等5研究发现I3 0与土壤侵蚀量之间存在显著的正相关关系。大量研究探索

19、了不同降雨特征对土壤侵蚀量的影响。但定量描述降雨特征和土壤侵蚀量之间的关系对合理确定水保措施,降低水土流失具有更重要的现实意义。目前,对不同降雨特征下土壤侵蚀量确定,主要采用传统的实地监测方法3,但该方法成本较大。为此,一些学者使用模型对不同降雨特征下土壤水土流失量进行了预测模拟,其中最著名的5个传统物理和经验模型是修正的土壤流失方程(RU S L E)、通用土壤流失方程(U S L E)、水土预测模型(WE P P),水土评估模型(SWAT)和水土侵蚀模型(WAT EM)等6。Z h a n gH u a等7使用RU S L E模型基于降雨、土壤、植被覆盖、坡度和水土保持能力等5个参数,对兰

20、州市水土流失量进行了模拟,并取得了良好的模拟效果。但该模型计算过程复杂,需要参数较多。综上所述,使用传统的监测和模型方法确定土壤侵蚀量具有成本高和过程复杂等缺点。近些年,随着机器学习算法的发展,并且机器学习模型能够有效拟合特征和目标变量之间的线性和非线性关系8。因而,一些学者开始使用机器学习模型对土壤侵蚀量进行预测。关于利用机器学习模型对土壤侵蚀量的研究也大致经历了3个阶段。第一阶段,众多学者开始关注单一机器学习模型对土壤侵量的预测。R a h m a t i等9比较了7个经典机器学习模型对土壤侵蚀量预测的精度,最终发现S VM模型对土壤侵蚀量预测精度最高。在这个阶段S VM模型在众多的研究中

21、均取得了较高的精度9。第二阶段,考虑到单一机器学习模型虽然可以在预测土壤侵蚀量的任务中取得一定的精度,但不同的机器学习模型具有不同的特点。因此,大量研究开始关注集成学习模型对土壤侵蚀量的预测。通过不同的算法,将不同的机器学习模型进行集合。在此阶段使用较多方法是基于s t a c k i n g,b o o s t i n g和b a g g i n g算法 对 相 同 和 不 同 机器 学 习 模 型 进 行 集合6。Z h a n gY o n g h o n g等1 0比较了X G B o o s t和单一经典模型对土壤侵蚀量的预测精度,发现X G B o o s t模型对土壤侵蚀量的预测

22、精度最高。N g u y e n等6将基于b a g g i n g算法的随机森林模型和基于b o o s t i n g算法的G BM模型与传统的机器学习模型(线性回归、B P神经网络、S VM模型等)进行了比较,结果发现G BM模型对土壤侵蚀量的预测精度最高。在该阶段R F模型和基于b o o s t i n g算法的集成学习模型取得了较高的预测精度。第三阶段,随着近些年深度学习模型的发展,如卷积神经网络、残差神经网络、循环神经网络等,一些学者开始探索深度学习模型对土壤侵蚀量的预测。但研究表明并非所有深度学习模型对土壤侵蚀量的预测结果均高于集成学习算法。如,S a h o u r等8使 用

23、 多 元 线 性 回 归 模 型、基 于b o o s t i n g的集成学习模型和深度学习模型对土壤侵蚀量进行了预测,结果发现基于b o o s t i n g的集成学习模型预测土壤侵蚀量的精度最高。虽然使用机器学习模型对土壤侵蚀量的预测取得了一定的成果,但这些模型在预测土壤侵蚀量时,仅仅只考虑了当前的特征。实际上,降雨特征对土壤侵蚀量的影响具有累积效应,即土壤侵蚀量会受到历史降雨等特征的影响。为增加模型的预测精度,一些学者将前期的降雨或土壤特征作物特征输入预测当前的土壤侵蚀量,并且提高了模型的预测精度。但该方法增加了特征的选择难度,而且具有一定的经验性。实际上,土壤侵蚀量的预测是一个时间

24、序列问题,因而使用擅长处理时间序列的机器学习模型,如循环神经网络(R NN)、长短期记忆神经网络(L S TM)等会提升模型对土壤侵蚀量的预测精度1 1。研究表明长短期记忆神经网络模型(L S TM)可以“记住”历史特征,因而在大量研361第4期 李明伟:基于L S TM模型预测不同水保工程措施条件下土壤侵蚀量究中取得了较高的精度,被认为是处理时序变量回归任务时的首选模型1 2。目前,L S TM模型在预测土壤侵蚀量的研究中仍不多见。另外,监测土壤侵蚀量的影响特征,如降雨量、降雨历时,最大3 0 m i n和6 0m i n降雨强度也会增加工作量。因而探索基于少量重要特征对土壤侵蚀量进行精准预

25、测,对降低成本和提高预测土壤侵蚀量效率具有重要意义。为探究L S TM模型利用重要降雨特征对土壤侵蚀量预测的可行性,本文以2 0 1 12 0 2 1年水土流失动态监测站数据为基础,首先综合评价了4个降雨特征(I3 0,I6 0,T和P)对于预测土壤侵蚀量的重要性。然后使用L S TM模型分别利用2个最重要的特征和全部4个特征对3种水保工程措施条件下土壤侵蚀量进行预测,并将预测结果与传统机器学习模型(B P,R F和S VM)预测的结果进行对比。以期为辽西北地区土壤侵蚀量的精准预测和合理制定水土保持措施提供理论和技术依据。1 材料与方法1.1 研究区概况与数据收集本研究基础数据(2 0 1 1

26、2 0 2 1年)来源于辽宁省朝阳市朝阳县东大道小流域全国水土流失动态监测站(1 2 0 0 1 0 0 E,4 1 2 6 0 0 N)。监测站平均降雨量、风速、气温分别为4 5 0mm,2.9m/s和8.2。监测站中有3个典型水保工程措施(监测小区),分别为水平槽、果树台田和梯田。径流小区内土壤为褐土,土壤容重为1.1 3g/c m3。监测小区投影长度、宽度和坡度分别为2 0m,5m和1 2。小区末端设有长度为5m,宽度为0.6m的集流槽,且流槽上缘与地面同高,确保小区地表径流汇入槽内。槽壁采用水泥抹面,确保水流面光滑;底部向下及向中间倾斜,保证水流顺利汇入分流桶。小区径流经集流槽流入分流

27、桶,分流桶为砖混结构,根据当地降雨及产流情况,确定分流桶长宽高均为1m,设1个分流孔。分流孔距分流桶底面6 0c m。分流桶下方设置集流桶,规格为1m1m1m,收集径流量较大时由分流桶流入的清水,下部设放水孔1处。每次降雨之后,测定分流桶深度,计算总的径流量。随后通过混匀样本,采用烘干法测定泥沙浓度,计算土壤流失量。气象数据由监测站附近的人工气象观测站及T RM-Z S 2型自动气象站观测1 3。本研究中将间隔时间超过6h的两次降雨,定 义 为 两 次 降 雨 事 件。通 过 对2 0 1 12 0 2 1年监测数据和侵蚀数据的整理,本文共计得到1 7 7条数据每条数据记录包含4个降雨特征(I

28、3 0,I6 0,T和P)和土壤侵蚀量。本文中水平槽中土壤侵蚀量的最小值、最大值和标准差分别为0.3 4,1 7.1 5和5.8 9k g;果树台田中为0.0 6,1 3.3 8,4.0k g;梯田中为0.1 4,4 0.3 8,9.9k g。该结果表明本研究土壤侵蚀量波动较大。1.2 模型介绍随机森林模型(R F):随机森林是基于b a g g i n g集成算法的一种拓展1 4。它是在以决策树为基本学习器,使用b a g g i n g集成学习算法的基础上,进一步采用自助采样法对特征进行随机选择,使得由决策树构成的“森林”中每一棵“树”均不一样1 5。建立随机森林模型主要是对于决策树数量的

29、选择及每一个决策树的内部结点数和叶结点数量的确定。因此本文在建模过程中主要是对这3个参数进行率定。支持向量机模型(S VM):支持向量机基本思路是将给定的数据集正确分开,同时使得不同类别之间的间隔最大化1 6。建立支持向量机模型时需要选择核函数g a mm a和损失参数C,因此本文对参数g a mm a和C进行率定。本文采用的B P神经网络是指含有2个隐含层的B P神经网络模型。前一层和后一层之间通过全连接方式连接。根据B P神经网络的原理,本文在建立B P神经网络模型时,选择R e l u函数为激活函数1 7。这是因为R e l u激活函数相比于传统的s i g m o i d函数,有效解决

30、了梯度消失问题,同时还能使模型的收敛速度维持在一个稳定的范围之内1 8-1 9。长短期记忆神经网络(L S TM):L S TM模型是经典的循环神经网络,且L S TM中的记忆单元能够“记住”历史信息,从而提高当前的预测精度。本文使用的长 短 期 记 忆 神 经 网 络 结 构 图 如 图1所 示2 0。L S TM具体计算过程如公式(1)(6)1 1:ft=s i g m o i d(Wfhi-1+UfXt+bf)(1)it=s i g m o i d(Wihi-1+UiXt+bf)(2)Ct=t a n h(Wchi-1+UcXt+bc)(3)Ct=ftCt-1+itCt(4)Ot=s i

31、 g m o i d(W0ht-1+U0Xt+b0)(5)ht=Ott a n h(Ct)(6)式中:s i g m o i d,t a n h为激活函数;ft,it分别为考虑了t时间点的输入Xt和t-1时间点输出ht-1的结果;Ct,Ct-1分别为忘记矩阵和记忆矩阵;Ct为新的记忆矩阵;Ot为没有进行选择的输出;ht为经过选择的最终输出。从公式(4)(5)中可以看出,最终的预测输出由Ot和Ct计算得到,而Ot和Ct不仅与当前输入Xt有关,也和上一个输出ht-1有关。因而,L S TM可以“历史”信息对当前的影响。另外,由公式(4)和图1中可以发现,记忆矩阵Ct也在进行更新,因而L S TM模

32、型在不断训练会加强对重要信息的记忆。461 水土保持通报 第4 3卷1.3 模型的建立与评估本研究采用P y t h o n3.0中S c i k i t-l e a r n库对B P,R F和S VM模型进行建立和训练。本研究中,使用P y t h o n3.0中T e n s o r F l o w2库对L S TM模型进行建立和训练。本文中将收集到的1 7 7条记录分成训练集和测试集两个部分。首先根据8 0%训练集和2 0%训练集对总样本进行分割,同时考虑到本研究中样本数量 较 少,增 加 了 测 试 样 本 量。最 终 确 定 训 练 集1 5 2条和测试集2 5条。另外,数据按时间序

33、列排序分割。其中模型参数的选择使用3-折交叉验证的方法,即将训练集样本随机分成3份,依次取其中2份样本训练模型,剩下1份样本验证模型,最终选出合适的参数。采用相关系数(R2)和相对均方根误差(N RM S E)两个判断指标作为模型预测精度好坏的评价指标1 2。注:s i g m o i d,t a n h为激活函数,ft,it分别为t时间点的输入Xt和t-1时间点输出ht-1的结果;Ct,Ct-1分别为忘记矩阵和记忆矩阵;Ct为新的控制矩阵;Ot为没有进行选择的初步输出;ht为进行选择后的最终输出。图1 L S TM模型基本结构F i g.1 S t r u c t u r eo fL S T

34、M m o d e l2 结果与讨论2.1 基于随机森林的特征选择从图2可知,研究区不同的水保措施下,I3 0,I6 0,T和P对土壤侵蚀量的影响程度不同。在水平槽中降雨因素对土壤侵蚀量的影响程度为:I3 0I6 0TP;在果树台中降雨因素对土壤侵蚀量的影响程度为:TI3 0I6 0P;在梯田中降雨因素对土壤侵蚀量的影响程度为:I3 0TI6 0P。该结果与之前使用模糊贴近度法的计算结果类似2 1。由图2还可以看出,I3 0,I6 0和T在3种水保措施中对土壤侵蚀量的影响均达到了显著水平。该结果与林锦阔等4研究结果类似,认为I3 0和降雨历时是影响土壤侵蚀量的主要原因。然而,陈钊柱等3研究发现

35、降雨量与土壤侵蚀量之间存在显著的正相关关系。这种不一致的结果可能是由于降雨特征所在地区不同和土壤理化性质不同造成的2 2。综上所述,基于随机森林模型,I3 0,I6 0和T是该地区影响土壤侵蚀量的主要降雨特征。为了提高模型的预测精度,同时也为了降低监测降雨特征的工作量,本研究选择I3 0和T作为输入特征对土壤侵蚀量进行预测,并将该结果与使用全部4个降雨特征作为输入特征预测的土壤侵蚀量进行对比。注:I3 0,I6 0,T和P分别为最大3 0m i n和6 0m i n降雨强度、降雨历时和降雨量。图2 研究区各特征因子对土壤侵蚀量的重要性程度F i g.2 I m p o r t a n c eo

36、 f c h a r a c t e r i s t i c f a c t o r s t os o i l e r o s i o ni ns t u d ya r e a2.2 水平槽中土壤侵蚀量预测表1列出了分别使用2个特征(I3 0和T)和4个特征(I3 0,I6 0,T和P)对研究区水平槽中土壤侵蚀量的预测精度。从表1可以看出,B P模型在训练集和验证集上的N RM S E均大于0.2,表明B P模型对水平槽中土壤侵蚀量预测精度较低。R F和S VM模型在训练集和验证集上的N RM S E虽然小于0.2,但均大于0.1 5,表明R F和S VM模型在预测水平槽工程中土壤侵蚀量时精度

37、一般。与R F和S VM模型相561第4期 李明伟:基于L S TM模型预测不同水保工程措施条件下土壤侵蚀量比,L S TM模型提高了R2约0.0 30.0 8,同时降低了N RM S E约0.0 40.0 8(表1)。该结果说明,对于水平槽工程中土壤侵蚀量的预测,L S TM模型的精度最高。另 外,L S TM模 型 在 训 练 集 和 验 证 集 上 的N RM S E最大为0.1 2,最小为0.0 6,表明L S TM模型预测水平槽工程中土壤侵蚀量达到了较高的精度。在4个模型中,L S TM模型的精度最高,S VM和R F次之,B P模型最低。这是因为L S TM模型考虑了时间序列对水平

38、槽工程中土壤侵蚀量的影响。在本研究中,L S TM模型考虑了前两次降雨对当前土壤侵蚀量的影响。该结果与C h e nZ h i j u n等1 2研究结果类似,认为与传统机器学习模型(B P,R F,S VM和线性回归模型等)相比,深度学习模型(尤其是考虑时间变化的L S TM模型)对目标变量的预测精度更高。从表1还可以看出,在仅使用I3 0和T两个特征时,在验证集上,L S TM模型对水平槽中预测土壤侵蚀量的N RM S E为0.1 1。在使用全部4个特征(I3 0,I6 0,T和P)时,L S TM模型水平槽工程中预测土壤侵蚀量的N RM S E为0.0 9。该结果表明,在增加两个特征后,

39、L S TM模型的精度并未得到显著提高。从图3中可以看出,在2特征和4特征情景中,虽然在一些观测点上L S TM预测的土壤侵蚀量与实测土壤侵蚀量之间的相对误差较大,但多数观测点上L S TM模型的预测值与实测值之间误差较低,且总体上误差也在可接受范围内(表1)。L S TM模型在一些观测点上产生较大的相对误差,这可能是因为样本数据中土壤侵蚀量波动较大。从图3还可以看出,虽然基于4特征的L S TM模型的相对误差较小,但基于2特征的L S TM模型总体误差也较低(表1)。因此,在水平槽工程中L S TM模型使用I3 0和T这2个特征可以较准确预测土壤侵蚀量。这是因为在水平槽工程中,I3 0和T对

40、土壤侵蚀量具有显著影响。综上所述,在水工槽中,相比于B P,R F和S VM模型,L S TM模型对土壤侵蚀量的预测精度最高。同时,L S TM使用I3 0和T作为特征和使用全部4个特征(I3 0,I6 0,T和P)对土壤侵蚀量的预测精度没有显著差异。表1 各模型在研究区水平槽中预测土壤侵蚀量的精度T a b l e1 P r e c i s i o no fm o d e l s i np r e d i c t i n g s o i l e r o s i o no fh o r i z o n t a l c h a n n e l i ns t u d ya r e a数据集模型2特

41、征R2N RM S E4特征R2N RM S EB P0.8 20.2 50.8 80.2 2训练集R F0.8 90.1 80.9 10.1 5S VM0.9 20.1 60.9 30.1 3L S TM0.9 50.1 20.9 70.0 6B P0.8 40.2 30.8 00.2 4验证集R F0.8 80.1 90.8 90.1 8S VM0.9 10.1 90.9 20.1 6L S TM0.9 90.1 10.9 90.0 9图3 研究区水平槽中L S TM模型预测值与实测值对比F i g.3 C o m p a r i s o nb e t w e e nL S TM-p r

42、e d i c t e dv a l u ea n dm e a s u r e dv a l u eo fh o r i z o n t a l c h a n n e l i ns t u d ya r e a2.3 果树台中土壤侵蚀量预测表2列出了在果树台田措施中,各模型预测土壤侵蚀量的R2和N RM S E。从表2可以看出,在果树台田措施中,B P模型在训练集和验证集上的R2为0.8 30.8 4,处于较高水平,表明B P模型预测的土壤侵蚀量的趋势与实测土壤侵蚀量的趋势较为一致。但B P模型在训练集和验证集上的N RM S E较大,均大于0.2。该结果说明使用B P模型预测果树台田措施

43、中土壤侵蚀量的误差较大。R F和S VM模型的预测精度相近,在预测果树台田措施中土壤侵蚀量的R2和N RM S E分别为0.8 70.9 1,0.1 20.1 9。该结果表明R F和S VM模型的预测精度较好。与R F和S VM模型相比,L S TM模型提高了R2约0.0 80.1 1和降 低 了N RM S E约0.0 20.0 8。该 结 果 说 明L S TM模型对果树台田措施中土壤侵蚀量的预测精度最高。传统的机器学习模型,如B P,R F和S VM,661 水土保持通报 第4 3卷在预测土壤侵蚀量时仅考虑了本次降雨特征对土壤侵蚀量影响。而L S TM模型通过内部的记忆单元可以记住之前降

44、雨特征对土壤侵蚀量的影响。在实际中,前一次降雨对土壤的侵蚀会影响下一场降雨对土壤侵蚀量的影响,尤其是两次降雨事件接近时。因此,L S TM在众多时序数据的预测研究中取得了较高的精度2 2。在使用2特征和4特征情景中,L S TM模型在验证集上的R2均为0.9 9,说明L S TM模型能够很好地预测土壤侵蚀量的变化趋势。这是因为在实际中,降雨特征与土壤侵蚀侵蚀量之间的线性关系较强,而L S TM模型能够通过时间序列的记忆,很好地处理线性和非线性关系2 3。但L S TM在2特征和4特征情景中预测果树台中土壤侵蚀量的N RM S E均大于0.1。该结果说明,L S TM在预测精度方面不如预测趋势精

45、确。但是,L S TM在2特征和4特征情景中预测果树台中土壤侵蚀量的N RM S E分别为0.1 3,0.1 1,说明L S TM对果树台中土壤侵 蚀量的预测精度较高。同时,使用2特征和4特征对土壤侵蚀量预测的精度类似。从图4也可以看出,L S TM模型在2特征和4特征情景中对土壤侵蚀量预测的相对误差相近。虽然在有些观测点上相对误差较大,但多数点的相对误差较低。该结果说明,L S TM模型使用2个特征预测土壤侵蚀量时精度较好。L S TM模型使用4个特征预测土壤侵蚀量的精度并没有显著优于使用2个特征预测土壤侵蚀量的精度。这可能是因为:本研究中使用的两个特征(I3 0和T)是影响果树台田措施中土

46、壤侵蚀量的主要降雨特征(图2);4个降雨特征I3 0,I6 0,T和P之间存在相关性,因此有些特征对于预测土壤侵蚀量来说是冗余信息2 4。综上所述,在果树台田措施中,L S TM模型的预测精度最高。同时,L S TM仅使用最重要的两个降雨特征(I3 0和T)即可较准确地预测土壤侵蚀量。表2 各模型在果树台田中预测土壤侵蚀量的精度T a b l e2 P r e c i s i o no fm o d e l s i np r e d i c t i n g s o i le r o s i o no f f r u i t e r t e r r a c e l a n d s数据集模型2特征

47、R2N RM S E4特征R2N RM S EB P0.8 40.2 20.8 50.2 5训练集R F0.8 70.1 90.9 10.1 7S VM0.8 80.1 70.8 90.1 2L S TM0.9 80.0 90.9 70.0 7B P0.8 40.2 38 30.2 3验证集R F0.8 80.1 80.8 90.1 7S VM0.8 80.1 50.9 10.1 7L S TM0.9 90.1 30.9 90.1 1图4 果树台田中L S TM模型预测值与实测值对比F i g.4 C o m p a r i s o nb e t w e e nL S TM-p r e d i

48、 c t e dv a l u ea n dm e a s u r e dv a l u eo f f r u i t e r t e r r a c e l a n d s2.4 梯田中土壤侵蚀量预测表3列出了B P,R F,S VM和L S TM模型对梯田中土壤侵蚀量的预测精度。从表3可以看出,4个模型预测梯田中土壤侵蚀量的R2均大于0.7 9。该结果说明,4个模型均能很好预测梯田中土壤侵蚀量的变化趋势。但B P模型在训练集和验证集上预测梯田中土壤侵蚀量的N RM S E均大于0.2,说明B P模型对梯田中土壤侵蚀量的预测精度较低。与在水平槽和果树台田措施中类似,在梯田中R F和S VM模

49、型的预测精度相近。从表3可以看出,R F和S VM模型预测梯田中土壤侵蚀量的N RM S E均相差0.0 10.0 3。与大多数结果一致,在传统机器学习模型中,R F和S VM模型在回归和分类任务中均取得了较高的精度2 5。但与深度学习模型相比,R F和S VM模型的精 度 较 低。相 比 于R F和S VM模 型,L S TM模型降低了N RM S E约0.0 50.0 8(表3)。主要原因与在水平槽和果树台中类似:L S TM模型通过长短期记忆单元,在预测土壤侵蚀量的同时不仅考虑了本761第4期 李明伟:基于L S TM模型预测不同水保工程措施条件下土壤侵蚀量次降雨 特征的影响,还考虑了之

50、 前降雨特 征 的 影响2 5。此外,在2特征和4特征情景中,L S TM模型预测梯田中土壤侵蚀量的N RM S E分别为0.1 2,0.0 9。该结果表明,相比于2特征情景,在4特征情景中L S TM模型预测梯田中的土壤侵蚀量提高了0.0 3。从图5也可以看出,L S TM模型使用2特征和4特征预测的梯田土壤侵蚀量与实测值之间差异分别为0.6 5%4 8 9.7%和0.1 8%1 8 4.8%。L S TM模型在一些观测点上产生较大的相对误差,这可能是因为样本数据中土壤侵蚀量波动较大。但总体上L S TM使用2个重要降雨特征(I3 0和T)预测梯田中土壤侵蚀量时,仍然取得了较高的精度(表3)

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服