收藏 分销(赏)

基于随机森林和多源数据江西省降雨量空间反演研究.pdf

上传人:自信****多点 文档编号:2327383 上传时间:2024-05-28 格式:PDF 页数:3 大小:1.61MB
下载 相关 举报
基于随机森林和多源数据江西省降雨量空间反演研究.pdf_第1页
第1页 / 共3页
基于随机森林和多源数据江西省降雨量空间反演研究.pdf_第2页
第2页 / 共3页
基于随机森林和多源数据江西省降雨量空间反演研究.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、第10 期2023年10 月文章编号:16 7 3-9 0 0 0(2 0 2 3)10-0 0 49-0 3陕西水利Shaanxi Water ResourcesNo.10October,2023基于随机森林和多源数据江西省降雨量空间反演研究杨承亮(南昌市水利规划设计院,江西南昌330 0 0 0)【摘要降雨是维系地表生物多样性、地表能量物质流动、可持续旱涝灾害管理中的关键因素,精细反演省域降雨量分布式信息具有重要意义。以江西省8 9 个气象站点2 0 2 0 年降雨资料、DEM和经纬度等环境变量为数据基础,采用随机森林(RF)算法拟合环境变量一一降雨量之间回归关系,进而反演了江西省降雨量空

2、间分布特征。结果表明:RF模型建模、验证的R为0.7 8、0.7 6,MAE为9 1.8 1mm、12 1.11mm,R MSE 为139.8 1mm、151.7 0 mm。反演结果显示,降雨量栅格面值域介于12 8 0 mm2340mm,并呈现自东北向西、北递减分布,降水量中心位于赣东鹰潭等地。该方法可为其他地区的降雨量空间反演研究提供有益借鉴。【关键词降雨量;随机森林算法;空间反演;环境变量中图分类号P426.6【文献标识码B随着气候变化和自然灾害频发,对降雨量准确空间反演变得愈发重要。江西作为南方立体农业核心区,其降雨量分布对水资源管理和灾害防控具有重要意义。然而,由于该省地形复杂、降雨

3、量具有明显的时空变化特征,传统的降雨量观测手段难以全面准确地获取其空间分布信息 2 。为此,许多研究者关注基于多源数据和机器学习算法的降雨量空间反演研究。其中,随机森林(RF)作为一种强大的非参数机器学习方法,已经在许多领域展现出了良好的预测能力 3-4。通过结合多源数据,如气象站点观测数据、卫星遥感数据以及地理信息系统数据,可以获得更丰富的降雨量信息,提高空间反演的准确性 5。因此,本研究以江西省为研究对象,旨在利用RF算法和多源数据,实现对省域降雨量空间反演,为区域水资源管理、气象灾害预警等提供科学依据。1研究区概况如图1所示,江西省位于中国中东部、鄱阳湖南侧、武夷山北麓,总面积16.7

4、万km。区域地形自东、南、西向中北部倾斜,海拔介于0 2 16 0 m,形成环鄱阳湖平原、江南丘陵、幕府山地、武夷山系等折叠地貌,境内有长江赣江自南向北通过,具有径流量大、汛期长特点。2数据来源与研究方法2.1数据资料本研究中的降雨量数据从气象科学数据中心(https:/ 0 2 0 年8 9 个气象站日降雨资料。该数据经0.1mm精度的质量控制,具有良好应用性。为实现对省域降水量进行空间反演,选择地理空间数据云(http:/)平台提供的STRMDEM数据作为辅助,其空间分辨率为9 0 m,可精确反映局部地形变异;另外还基于DEM数据提取了坡度和坡向信息。为反映降雨量经纬度地带性特征,以获取的

5、DEM数据为基础,先通过ArcGIS10.8平台中的ratertopoint工具将DEM栅格转成成空间点数据,然后利用属性表中Calculategeometry工具计算每一格点的经度和纬度,再通过pointtoraster模块生成区域栅格式经、纬度信息。将全部栅格数据利用cubic方法重采样成50 0 m分辨率,用作空间反演辅助变量集。114E115E116E117E118E119ENN.08人N.6N.82N.87N.L2160N.90雨量站5150km01130E114E1115E116E117E图1江西省地形特征和气象站点分布2.2随机森林方法随机森林RF是基于Boostrap抽样和ba

6、gging 理论的一种河流N.收稿日期2 0 2 3-0 5-2 9【作者简介杨承亮(19 9 4),男,江西德安人,助理工程师,主要从事水文与水资源工作。49第10 期2023年10 月组合器算法,它由许多决策树或回归树组成,每棵树依赖于独立采样的随机向量的值,并且数据中所有树的分布相同。在RF建模中使用boostrap采样允许袋外数据用于估计一般误差,预测结果是所有聚合预测的平均输出 0。RF建模需要两个用户定义的参数:用于生长每棵树的变量数量(mtry)、林中树数量(ntree)。m t r y 参数确定每棵树的强度和树之间的相关性,增加mtry还会增加每棵树的强度和树之间的相关性。RF

7、模型性能通过增加树木强度和降低树木之间的相关性而得到改善。2.3降雨量空间反演精度评价RF机器学习作为数据驱动模型对数据结构具有一定敏感性,将8 9 个样本点按照7:3的比例随机划分成训练集(6 2个)和验证集(2 7 个),分别执行模型训练、独立验证。对于训练集、测试集,应用十折交叉验证方法计算模型的决定系数(R)、均方根误差(RMSE)、平均绝对误差(MAE)来评估模型预测能力和空间反演精度。R=NRMSE=N11MAE=Nly-ypl式中:yp、y。为预测值与实际值;p、。为预测与实测序列的平均值;r为实测值与预测值之间皮尔逊相关系数;V,、V。分别为预测值、实际值的方差。3结果与分析3

8、.1站点降水量统计特征江西省2 0 2 0 年8 9 个标准气象站点观测的降雨量统计特征见表1。年降雨量最小值出现在彭泽站,仅为12 8 5.6 1mm最大值为资溪站的2 340.46 mm,两者相差10 54.8 6 mm;统计平均值为17 9 9.53mm,中值为18 34.8 3mm,单样本KS检验显示其呈偏态分布。全部样带数据的离差系数为16.6 0%,表明全省降水量呈中度异质性。表1江西省站点降水量统计特征(n=89)最大值最小值平均值中值标准差离差系数实际2340.461285.61 1799.531834.83298.7log变换3.37为深人认识站点降雨资料空间变异特征,使用A

9、rcGIS10.8Geostatistical analysisWizard kriging工具得到其半方差函数Semivariance结构图,其结果见图2。由图2 可知,区域降雨量空间分布符合高斯(Gau)模型,块金值为0.35,偏基台值Partial Sill为2.2 3,块基比(Nugget/Sill)为13.56%,具有强烈空间自相关性(2 5%Nugget/Sill75%),其空间自相关范围为6 0 0 km。这表明,研究区不同空间位置上降水量具有一定相关性,局域降水量存在互相影响。:50.陕西水利Shaanxi WaterResources图2 江西省站点降水量Semivarian

10、ce结构图3.2随机森林模型构建分析本研究以样本植被为输人变量,以站点时间降雨量为输出目标,在Rstudio平台中运用Caret程序包设计RF回归模型。RF模型结构受超参数影响,为确保模型稳健性和拟合能力,2使用gridsearch方法进行参数寻优,其结果见图3。可见,模(1)型训练精度R随着ntree数量增加先呈急剧增加后平稳趋势,当ntree大于2 0 0 时,R趋于稳定。由于输人变量较少,因此设置mtry参数寻优区间为2 8,可见当其取值为8 时达到最(y,.)2(2)(3)单位:mm16.60%3.113.26No.10October,20232.52.01.51.00.500大值。据

11、此,选择ntree、mt r y 的超参数配对依次为2 0 0、8。0.820.60.40.2246mtry图3基于RF算法降雨量插值模型优化过程基于以上优化过程此训练RF模型,并分别利用训练集计算精度评价指标R、MA E 和RMSE,结果见图4。可见RF建模精度良好,其R达0.7 8,MAE和RMSE分别为9 1.8 1mm、139.81mm。训练集里真实值与预测值分布于1:1线两侧,并具有局部离散特征,表明该模型在训练过程中较好拟合了降雨量与环境之间关系。因此可用以对未知区降水量进行插值预测。2600y=1.0902x149.672300R=0.783MAE=91.813.262.48(h

12、)=0/35+2.23Gau(6 0 0)Niuggel/Sill=13.56150300空间自相关距离/km0.30.40.50.60.780100200300400500ntree训练集RMSE=139.81/i20001700140011001100图4随机森林模型训练精度45014001700预测降雨量/mm600200023002600第10 期2023年10 月3.3降雨量空间分布特征将上述训练好的RF模型代人栅格变量数据集,进而对省域降雨量空间分布进行预测,其结果见图5。由图5可知,降雨量栅格面值域介于12 8 0 mm2340mm,栅格平均值为18 2 3mm,离差系数为2 3

13、.54%,这与表1中站点统计值一致,表明预测的降雨量分布集成了站点降雨特性。降雨量呈现自东北向西、北递减分布,降水量中心位于赣东鹰潭等地,局部降雨量可达19 0 0 mm以上;赣中地区次之,分布范围为1600mm1900mm之间;赣南地区降水量呈现自西向东增加分布,介于150 0 mm1750mm;赣西北地区的幕阜山地区最少,仅为12 8 0 mm1500mm。这种分布特征主要受季风运移路径和地形影响。从局域特征来,该非线性插值结果并未出现“牛眼”“机械渐变”等非自然特征,而较好体现了经纬度地带性和地形变异,因而反演的降水量分布更符合区域实际。114E115E116E117EN.0%N.87N

14、.L7N.9201130E114E图5随机森林方法反演的降水量空间分布3.4降雨量空间反演精度评价为进一步评价RF模型反演精度,基于测试集计算了精度评价参数,并绘制散点图,其结果见图6。可知其独立验证的R达0.7 6,MAE和RMSE依次为12 1.11mm、151.7 0 m m,相对于训练精度的R减小了2.56%,MAE和RMSE分别增大了-31.9 1%、8.50%,表明RF模型在移植后发生了一定程度精度下降,但依然在可接受范围内。图6 显示,预测值与实际观测降雨量之间具有良好线性关系,因此空间反演结果在研究区具有一定替代性,同时表明RF模型能挖掘降雨量一环境因素间显性、隐式关系进而更稳

15、健拟合区域降雨分布。综合来看,使用多源环境变量与RF算法反演省域尺度降雨陕西水利Shaanxi Water Resources量空间分布过程中不存在过拟合而且具有良好适用性。2600y=1.1692x-261.152300R=0.76MAE=121.11RMSE=151.7020001700140011001100图6区域降雨量反演独立验证精度4结论118E119EN人N.62N.8N.L7降雨量/mm23401280雨量站150km115ENo.10October,2023验证集?1400本研究通过联合GIS与RF机器学习技术,准确反演了省域尺度50 0 m空间分辨率的降雨量分布式信息,结论

16、如下:RF模型基于站点降水量与环境因子之间非线性关系假设,模拟省域降雨量面分布,该方案克服了气象站点数据密度缺陷且促进了气候过程模式理解,可作为具有前景的数据解析技术,并能够移植到其他地区帮助构建稳健的气候要素反演模型,绘制更为精细的气候面空间图。然而,模型预测能力依赖于环境变量,本研究仅考虑了地形和经纬度因子,后续研究应纳人大气含水量、气温、地表温度等信息,进而改进模型性能;此外还应定量分析各环境因子重要性,深刻解释环境因子对降雨量空间异化的影响。N.忆参考文献1郎立晨,唐诚,高星,等.复杂地形下降水的高空间分辨率插值116E117E1700-2000预测降雨量/mm方法研究 J.地理学报,

17、2 0 2 3(0 1):10 1-12 0.2邢贞相,段维义,刘明阳,等.四种网格化降水产品估算中国大陆区域降雨侵蚀力比较 J.农业工程学报,2 0 2 3(0 5):10 0-10 9.3】崔新强,唐俊,徐静,等.智能网格气温降水实况插值方法优选研究 J.沙漠与绿洲气象,2 0 2 3(0 1):10 4-10 9.4庞冉,王文,武晶,等.基于空间插值逐日降水格点数据的福建省降水时空变化分析 J.水土保持学报,2 0 2 3,37(0 1):17 6-187,203.5李治军,王华凡,侯岳,等.缺资料地区降雨量空间插值方法比较 J.水利科学与寒区工程,2 0 2 2(0 8):6 8-7

18、1.6 Breiman L.Random forestsJ.Machine learning,2001(45):5-32.7 Biau G,Scornet E.A random forest guided tourJ.Test,2016(25):197-227.23002600(上接第 48 页)广应用做好基础工作。7结语HHSWNUG-1型光电测沙仪是一种新型的在线含沙量监测设备,监测的精度高,含沙量监测范围大,能满足高含沙河流及现行规范的要求。其功能有扩展空间,如垂线监测方法、输沙率测验等。其野外承载方式、比测方法、注意事项需要我们不断的探索,从而保证精测的精度,为其大范围推参考文献1王志勇,孙建民.HHSWNUG-1型光电测沙仪的应用研究 J.甘肃水利水电技术,2 0 2 1.2凌建明,林小平,赵鸿铎.圆柱形桥墩附近三维流场及河床局部冲刷分析 J.同济大学学报,2 0 0 7.51

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服