收藏 分销(赏)

基于机器学习与气象灾害指标的苹果相对气象产量预测.pdf

上传人:自信****多点 文档编号:2352526 上传时间:2024-05-28 格式:PDF 页数:13 大小:8.26MB
下载 相关 举报
基于机器学习与气象灾害指标的苹果相对气象产量预测.pdf_第1页
第1页 / 共13页
基于机器学习与气象灾害指标的苹果相对气象产量预测.pdf_第2页
第2页 / 共13页
基于机器学习与气象灾害指标的苹果相对气象产量预测.pdf_第3页
第3页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023年9 月第54卷第9 期农报业机械学doi:10.6041/j.issn.1000-1298.2023.09.035基于机器学习与气象灾害指标的苹果相对气象产量预测罗琦1.2茹晓雅1,2姜元12冯浩2.3于强3.4何建强1,2(1.西北农林科技大学旱区农业水土工程教育部重点实验室,陕西杨凌7 12 10 0;2.西北农林科技大学中国旱区节水农业研究院,陕西杨凌7 12 10 0;3.中国科学院水利部水土保持研究所黄土高原土壤侵蚀与旱地农业国家重点实验室,陕西杨凌7 12 10 0;4.陕西省气象局秦岭和黄土高原生态环境气象重点实验室,西安7 10 0 16)摘要:为及时准确地预测我国黄

2、土高原苹果产量,首先选取黄土高原苹果产区8 6 个基地县的气象观测数据,分别提取出苹果生长季内不同月份的气温、降水量、太阳辐射等气象特征变量,花期冻害时间、连阴雨时间和标准化降水蒸发指数(Standardizedprecipitationevapotranspiration index,SPEI)等气象灾害特征变量,以及气象站点经度、纬度和高程等空间特征变量,再根据斯皮尔曼相关性分析确定影响苹果产量的最重要气象特征变量。然后,采用梯度提升树(Gradientboostingdecisiontree,G BD T)、支持向量机(Supportvectormachine,SVM)、贝叶斯正则化反向

3、传播神经网络(Bayesian regularization back propagation artificial neural network,BRBP)和多元线性回归(Multiple linearregression,M LR算法,建立苹果相对气象产量的预测模型,并确定最佳模型输人特征变量组合。最后,基于不同生育期和生长季内各月份最佳模型输入特征变量组合,分析不同模型预测苹果相对气象产量的提前期。结果表明:影响苹果相对气象产量的最重要气象特征变量为最高气温、最低气温、空气相对湿度、降水量和太阳辐射;最佳模型输人变量组合为最重要气象特征变量、空间特征变量和灾害特征变量;基于最佳模型输人变

4、量组合,GBDT和BRBP模型精度较好(相关系数为0.7 7,均方根误差(RMSE)为0.44;r为0.7 0,RMSE为0.44),而MLR模型表现最差(r为0.6 3,RMSE为0.49)。在苹果不同生育期内,GBDT和BRBP模型在各个生育期内均能获得相对较高的苹果相对气象产量预测精度,SVM和MLR模型可在果实膨大期获取较为理想的苹果相对气象产量模拟结果。在苹果生长季内各月份,GBDT、SV M、BRBP和MLR模型可在苹果成熟期前1 2 个月实现对苹果相对气象产量的早期预测。本研究可为黄土高原苹果产量早期产量预测提供科学依据和技术参考。关键词:苹果;产量预测;机器学习;气象灾害;黄土

5、高原中图分类号:S165.27文献标识码:A文章编号:10 0 0-12 98(2 0 2 3)0 9-0 352-13OSID:Prediction of Apple Relative Meteorological Yields Based on MachineLearning and Meteorological Disaster IndicesLUO Q:l.2RU Xiaoya.2JIANG YuanFENG Hao23YU Qiang1,21,23,4HE Jianqiang1,2(1.Key Laboratory for Agricultural Soil and Water En

6、gineering in Arid Area,Ministry of Education,Northwest A&F University,Yangling,Shaanxi 712100,China2.Institute of Water-saving Agriculture in Arid Areas of China,Northwest A&F University,Yangling,Shaanxi 712100,China3.State Key Laboratory of Soil Erosion and Dryland Farming on the Loess Plateau,Inst

7、itute of Water and Soil Conservation,Chinese Academy of Science and Ministry of Water Resource,Yangling,Shaanxi 712100,China4.Key Laboratory of Eco-Environment and Meteorology for the Qinling Mountains and Loess Plateau,Shaanxi Provincial Meteorological Bureau,Xi an 710016,China)Abstract:Aiming to p

8、redict apple production in Loess Plateau in a timely and accurate manner,basedon historical weather records in a total of 86 counties in the apple producing areas of the Loess Plateau,the data of different meteorological feature variables(e.g.,temperature,precipitation,and radiation in收稿日期:2 0 2 3-0

9、 3-2 0 修回日期:2 0 2 3-0 6-14基金项目:国家重点研发计划项目(2 0 2 1YFD1900700)、陕西省重点研发计划重点产业创新链(群)-农业领域项目(2 0 19ZDLNY070 3)、西北农林科技大学人才专项资金项目(千人计划项目)和高等学校学科创新引智计划(111计划)项目(B12007)作者简介:罗琦(1997 一),女,博士生,主要从事农业生态系统模拟研究,E-mail:q i l u o n w a f u.e d u.c n通信作者:何建强(197 7 一),男,教授,博士生导师,主要从事农业生态系统模拟研究,E-mail:ji a n q i a n g

10、 _h e n w a f u.e d u.c n353罗琦等:基于机器学习与气象灾害指标的苹果相对气象产量预测第9 期different apple growing months),spatial feature variables(e.g.,latitude,longitude and elevation ofmeteorological stations),and meteorological disaster feature variables(e.g.,time of freezing damage atflowering stage,time of continuous rain,

11、and standardized precipitation evapotranspiration index(SPEI)were extracted at first.The influential feature factors were determined according to Spearmancorrelation analysis.Nextly,the prediction models for apple relative meteorological yield were establishedbased on different algorithms(i.e.,gradi

12、ent boosting decision tree,GBDT;support vector machine,SVM;Bayesian regularization back propagation artificial neural network,BRBP;multiple linearregression,MLR).At the same time,the optimal combination of model input feature variables wasdetermined for each of the established yield prediction model

13、s.Finally,based on the optimalcombinations of input feature variables in different apple growth periods and in different months of applegrowing seasons,the prediction leading time were analyzed for different simulation models for applerelative meteorological yield.The results were as follows:the inf

14、luential meteorological feature variableswere the highest temperature,lowest temperature,air relative humidity,precipitation and solar radiation.The best model input variable combination was selected as the influential meteorological,spatial anddisaster feature variables.Based on the best combinatio

15、n of model input variables,the GBDT and BRBPmodels had better prediction accuracy(r was 0.77,RMSE was 0.44;r was 0.70,RMSE was 0.44),while the MLR model performed the worst(r was 0.63,RMSE was 0.49).In different growth periods ofapples,the GBDT and BRBP models could obtain relatively high apple yiel

16、d prediction accuracy in eachgrowth period,while the SVM and MLR models could obtain relatively ideal simulation results in applefruit expansion period.In each month of the apple growing season,the GBDT,SVM,BRBP and MLRmodels could realize early prediction of apple relative meteorological yield abou

17、t one to two months beforeapple maturity.The research result can provide a scientific foundation and technical reference for appleyield prediction on the Loess Plateau.Key words:apple;yield prediction;machine learning;meteorological disaster;Loess Plateau0引言目前,我国黄土高原是全世界最大的苹果(M a l u s p u m i l a M

18、 i l l.)种植区之一,其苹果种植面积和产量分别占全球的2 5.2%和2 6.3%1-2 。由于苹果种植业的经济效益较高,黄土高原大部分传统农田都已改建为苹果园,苹果产业已成为当地农村经济的支柱产业之一,是当地农民的主要收入来源。因此,及时准确地预测苹果产量对当地苹果产业的发展具有重要意义。黄土高原大部分地区光热资源丰富、昼夜温差大,对苹果树的生长发育和结果极为有利3。降水、气温和太阳辐射是影响苹果生长发育的重要气象要素,但气象灾害也会对苹果产量形成过程造成极大的影响。黄土高原地区干旱少雨,属于典型生态脆弱区,容易发生各种气象灾害。已有相关研究分析了各类气象灾害对苹果产量的影响。例如,RO

19、DRIGO4发现春季花期冻害很少导致果树死亡,但会严重损害苹果花芽,是限制苹果产量的关键因素;韩文静等5 采用连阴雨指标分析发现苹果着色成熟期和采收期受到连阴雨危害的程度高于其他生育期;戴安然等6 研究结果表明,旱灾是限制中国苹果生产发展的主要因素之一,会使果树正常生长受到抑制,导致叶片萎焉、落果、枝条抽干等。此外,干旱指标中标准化降水蒸散发指数(Standardizedprecipitation evapotranspiration index,SPEI)对降水和潜在蒸散发同样敏感,1一6 个月尺度的SPEI可用于评估农业干旱,且该指标还被广泛应用于不同作物的产量预测模型中7 为了量化气象因

20、子和气象灾害因子对苹果产量的影响,有必要建立上述因子和苹果产量之间的数学映射关系。但是不同气象因子和气象灾害因子之间存在较强的共线性,并且这些因子与苹果产量之间通常为非线性关系,将传统的线性模型应用于作物产量预测往往不能获得理想的预测结果。近年来,机器学习算法由于其众多优势而逐渐被广泛应用于作物产量预测研究8 。这类方法从训练数据集中提取信息建立统计模型,随后根据测试数据集评估模型模拟精度,从而在自变量和非自变量之间建立非线性关系9-10 。相关研究表明机器学习算法可在苹果产量预测中取得较好的效果。例如,LI等!利用气象数据和支持向量机(Supportvectormachine,SVM)算法对

21、陕西省2 8 个基地县的苹果进行了估产,但研究区域只限制于陕西省;KHAN等12 基于农业生产总值建立了基于列文伯格马夸尔特(LevenbergM a r q u a r d t o p t i mi z a t i o n,LM)、尺度共轭梯度(Scale conjugate gradient back propagation,SCG)、贝叶斯正则化反向传播神经网络(Bayesian农2023年机354报业学械regularization back propagation,BRBP)算法的苹果产量预报模型,但其选择的模型输人变量并不包括影响苹果产量形成的环境因素;景辉等13 采用气象数据和多

22、元线性回归(Multiplelinearregression,MLR)、反向传播神经网络(Back propagationneuralnetwork,BPNN)算法建立了苹果产量早期预测模型,但并未考虑气象灾害因子对苹果产量的影响,且只考虑了各生育期内气象因子对苹果产量的影响。总体而言,上述研究的不足在于研究区域往往较小,所选择的苹果产量预测模型输人特征变量较少考虑苹果生长季内不同月份气象因子的影响,以及气象灾害因子对苹果产量的影响。本文以我国黄土高原苹果产区为研究区域,基于气象、空间和气象灾害3类特征变量与产区苹果单产统计数据,选择梯度提升树(Gradient boostingdecisio

23、ntree,GBDT)、SV M 和BRBP神经网络3种机器学习算法和MLR算法,构建黄土高原苹果相对气象产量预测模型。首先,采用斯皮尔曼相关性分析确定影响黄土高原苹果相对气象产量的最重要气象特征变量,然后以最重要气象特征变量、气象灾害特征变量和空间特征变量为输人变量,选择苹果相对气象产量预测模型的最佳模型输人特征变量组合,最后基于不同生育期和生长季内各月份的最佳模型输人特征变量组合,分析不同模型预测苹果产量的提前期,以期为黄土高原苹果产量早期预测提供科学依据和技术参考。1材料与方法1.1研究区域研究区域为我国黄土高原苹果产区,主要包括河南、山西、陕西和甘肃4省在内的共8 6 个苹果基地县(3

24、42 2 37 42 N,1045311246E,海拔844216m,图1)。黄土高原属于半干旱大陆性季风气候,是我国最大的苹果优生区,其多项气象因素能满足优质苹果生长需求。研究区内年均温为6 16,年降水量为2 0 1 10 10 mm,年日照时数为1 294 2 900 h。1.2数据来源与处理1981一2 0 17 年共37 年的逐日气象观测数据(包括降水量、平均气温、最高气温、最低气温、日照时数及空气相对湿度等)来源于中国气象科学数据共享网(CMDSSS,http:/c d c.c ma.g o v.c n/)。气象观测站空间位置信息(包括经度、纬度、海拔)来自各县市内的气象观测站。河

25、南、山西、陕西和甘肃共86个县级行政区的苹果单产数据来自河南统计年鉴14】、山西统计年鉴【15】、陕西统计年鉴【16 和气象站点N口苹果基地县Not海拔/m421684NoLSN.SE0125250500ikm104E108E112E图1黄土高原8 6 个苹果生产基地县和气象站点分布图Fig.1 Distribution of 86 base apple-producingcounties and weather stations on Loess Plateau甘肃发展年鉴【17】,以及各市人民政府依申请公开数据(表1)。本文剔除了各县市单产缺失年份,共获得18 52 个有效单产数据。数据归

26、一化处理可消除不同数据的量纲影响,提升模型各项性能18 。因此,模型建立前统一对输人数据进行归一化处理,最后将模型输出值进行反归一化处理。计算公式为min(1)nmaxmin式中归一化后的输出数据待归一化的输人数据max待归一化输人数据最大值min待归一化输人数据最小值1.3模型输入特征变量和目标变量1.3.1模型输人特征变量优选依据文献19 2 0,黄土高原产区的苹果全生育期为本年11月至次年10 月,可主要划分为落叶期(本年11月)、休眠期(本年12 月一次年2 月)、萌芽幼果期(次年3一5月)、果实膨大期(次年6 一8月)和着色成熟期(次年9 一10 月)。本文选取不同苹果生育期内的9

27、个气象特征变量、3个空间特征变量和3个气象灾害特征变量作为构建苹果相对气象产量预测模型的输人变量,具体特征变量如表2所示。太阳辐射数据根据各气象站点观测的日照时数和AngstromPr e s c o t t 经验公式2 1 进行估算,公式为R.=(.+b.)R(2)其中R。=(2 4 6 0/)Gs.d.(,sinpsin+cospcos)(3)d,=1+0.033cos(2J/365)(4)8=0.409sin(2J/365-1.39)(5)w,=arccos(-tanptans)(6)355罗琦等:基于机器学习气象灾害指标的苹果相对气象产量预测第9 期表1黄土高原苹果产区8 6 个生产基

28、地县产量记录年份Tab.1Years with observed apple yield for 86 base apple-producing counties on Loess Plateau省份市县年份河南三门峡灵宝、绳池、陕县19812017运城河津、稷山、绛县、临猗、平陆、芮城、万荣、闻喜、夏县、盐湖、永济、垣曲20072017山西临猗安泽、大宁、汾西、浮山、古县、洪洞、侯马、霍州、吉县、蒲县、曲沃、襄汾、乡宁、县、尧都、翼城、永和20072017晋中祁县、榆次、平遥、太谷20072016延安安塞、宝塔、延川、延长、宜川、富县、洛川铜川宜君、耀县陕西渭南白水、芮城、合阳、富平、韩城、

29、澄城19812017宝鸡陇县、千阳、凤翔、陈仓、岐山、扶风咸阳旬邑、长武、淳化、永寿、乾县、彬县、礼泉庆阳合水、华池、环县、宁县、庆城、西峰、镇原、正宁20002016甘肃平?崇信、华亭、泾川、静宁、崆、灵台、庄浪20002017天水甘谷、秦安、秦州、清水、麦积、武山、张家川20062017表2 苹果相对气象产量模拟模型输入特征变量Tab.2Input feature variables of prediction models of apple relative meteorological yields特征变量变量计算方法平均气温Tmean()月日平均气温的算术平均值最低气温Tmin()月

30、平均气温极小值最高气温Tmax()月平均气温极大值气温特征变量月平均气温日较差T。()月平均日最高气温与最低气温的差值气象特征变量5有效积温AT()月日平均气温与5之差的总和负积温NT()月低于0 的逐日日平均气温的总和需水特征变量空气相对湿度RH%)月日空气相对湿度的算术平均值供水特征变量降水量P(mm)月日降水量的总和辐射特征变量太阳辐射R(MJ/(m.d)Angstrom-Prescott经验公式花期冻害时间N40(d)4月日最低气温小于等于0 的时间气象灾害特征变量连阴雨时间CR(d)910月连续3d降水量大于等于0.1mm的时间1个月尺度标准化降水指数(SPEI)Thornthwai

31、te法经度Lon()气象观测站经度空间特征变量纬度Lat()气象观测站纬度海拔 Ele(m)气象观测站海拔N=24w,/T(7)N=24Ws/T(式中N一最大可能日照时数,h-太阳时角,rad-纬度,rad太阳磁偏角,radJ-年内某天的日序数d.一日地间相对距离的倒数Gse-太阳常数,取0.0 8 2 MJ/(mmin)R。大气外总辐射,MJ/(mmin)a.、b.一经验系数,取0.19 和0.542 2 n实际日照时数,hR.一-地表总辐射,MJ/(mmin)1个月尺度标准化降水指数(SPEI)根据Thornthwaite法2 3】通过R语言中的SPEI”包计算得到,具体计算过程主要分为3

32、个步骤。(1)计算潜在蒸散量PET,计算式为10T,AmeanPET;=16(8)H1.514T其中meanH:(9)5A=6.7510-7H-7.71 10-5 H+1.792 10-2 H+0.49(10)式中A一常数H一年热量指数PET,月潜在蒸散量,mm/d(2)计算气候水平衡,计算式为D;=P;-PET;(11)式中D:-月降水量与蒸散量差值,mm/dP;-月降水量,mm/d(3)对D,数据序列标准化,采用三参数的log-logistic概率分布F()对其进行拟合,计算出每个D,对应的SPEI值,计算式为农2023年机356报业学械Co+C,W+C,W?SPEI=W.(12)1+d,

33、W+d,w?+d,ws其中W=-2lnP(13)1-F()(P0.5)(14)PL1-P(P 0.5)式中SPEI1个月尺度标准化降水指数其中C。、C、Cz、d,、d z、d,为常数项,取2.515517、0.802853、0.0 10 32 8、1.4322788、0.18 9 2 6 9、0.001 308。为消除气象变量多年周期性循环的影响,本文将苹果多年生长季内的气象特征变量进行平均,再将其与目标变量(苹果相对气象产量)进行斯皮尔曼相关性分析(Spearman correlation analysis),选择对苹果产量影响最大的重要气象特征变量,以减少输人数据的复杂程度。在每类气象特征

34、变量中,选择与目标变量的相关系数绝对值最大且显著的特征变量。如果同类特征变量之间的相关系数小于0.5且其与目标变量显著相关时,则可选择多个特征变量。1.3.2模型目标变量构建苹果产量的形成受多种因素的影响,主要包括气象要素、技术措施和其他因素,相应地苹果产量可以分解为气象产量、趋势产量和随机产量。为了能更好地反映气象要素造成的苹果产量波动,降低时间和地域对产量影响的限制,采用相对气象产量作为目标变量定量评估气象要素对产量形成的影响。计算公式为yw(15)其中MMy,=ao+a;cos(wit)+b,;sin(wit)(16)i=1i=1y。=y-y,+y,(17)式中y实际产量,kg/hmyw

35、相对气象产量,正值表示气象要素有利于作物生长发育即产量增加,负值表示产量减少趋势产量,kg/hm,可采用一阶傅里叶拟合来估算2 4气象产量,kg/hm随机产量,kg/hm,本文忽略不计ao常系数,取-2.9 410 1 2.17 10 11W-常系数,取0.30 0.9 0a;各级系数,取-2.17 10 2.9 41010b;各级系数,取-2.0 9 10 4 1.2 2M-一傅里叶展开级数,取1t年份1.4苹果相对气象产量模拟模型1.4.1机器学习算法(1)梯度提升树梯度提升树(GBDT)是基于Booting方法的集成模型。该类方法采用加法模型和前向分步算法实现学习优化2 5。GBDT回归

36、算法中以回归树作为弱学习器,学习任务时,利用损失函数的负梯度作为当前学习器的伪残差,根据伪残差拟合回归树,直到满足要求停止重复此过程。GBDT算法一般比随机森林算法的训练结果更准确9 ,收敛速度快且不易出现过拟合。R语言中提供了CBDT算法包“gbm”所需要的参数包括:分布函数(distribution,选择“gaussian”)、树终节点的最小个数(n.m i n o b s i n n o d e,取10)、学习率(shrinkage,取0.01)、回归树数量(n.trees,取2 0 0)以及单棵回归树最大深度(interaction.depth,以1为步长在0,10内取值)。(2)支持

37、向量机支持向量机(SVM)通过非线性映射将自变量映射到高维的特征空间,在高维特征空间中寻找一个最优超平面,使得所有训练样本距离该最优分类面误差最小2 6 。对于回归应用,SVM算法主要利用核函数构造线性回归方程求得最优超平面2 7 。该算法可利用R语言提供的“e1071”包来实现,所需参数包括:核函数类型(Kernel,定为高斯径向基核函数)、核函数系数(gamma,以0.0 1为步长在0.01,1.00内选择)以及惩罚系数(cost,以0.1为步长在0.1,10 0 内确定)。(3)贝叶斯正则化反向传播神经网络贝叶斯正则化反向传播神经网络(BRBP)融合传统反向传播神经网络算法和贝叶斯理论自

38、动选择最优的正则化参数,能够避免过拟合问题,极大提高模型的泛化能力2 8 。采用包含输人层、隐含层和输出层的3层神经网络拓扑结构,隐含层的节点数根据试凑法,以预测误差最小为原则来确定。Matlab软件中的“newff函数可以实现该类算法,所需参数包括:输人节点数、输出节点数b、隐含层节点数l、节点传递函数(隐含层为tanh,输出层为purelin)、训练函数(trainbr)、送代次数k、学习率m以及目标函数误差(goal)。其中,参数k、n、g o a l 经反复试算后分别取10 0 0,0.1、10-5(4)多元线性回归多元线性回归(MLR)是一种广泛应用于单个目标变量与2 个及以上输入特

39、征变量的线性回归方法2 9 。目标变量通常受多种特征变量的影响,因此357罗琦等:基于机器学习!象灾害指标的苹果相对气象产量预测第9 期多元线性回归相对于一元线性回归更具适用性。在多元线性回归中,方程的参数通过最小二乘法获得30 。R语言提供的“1m函数可实现 MLR算法。1.4.2苹果相对气象产量模拟模型构建如图2(图中M、G、D 分别表示最重要气象灾害特征变量、空间特征变量、气象灾害特征变量)所示,以GBDT算法为例,简述苹果相对气象产量yw预测模型的建立过程。首先,基于苹果全生育期最重要气象特征变量,逐次添加空间特征变量和气象灾害特征变量,形成不同的模型输人特征变量组合。其次,应用GBD

40、T算法建立模型估算苹果相对气象产量,以y估算值和实测值之间的误差最小化为优化目标,获得最佳模型输人特征变量组合。然后,逐次添加苹果落叶休眠期、萌芽幼果期、果实膨大期、着色成熟期内的最佳模型输人变量组合,构建不同生育期的苹果相对气象产量预测模型,以模型测试集均方根误差(RMSE)最小化为依据,确定苹果相对气象产量预测的提前生育期。最后,逐次添加苹果生长季内各月份的最佳模型输入特征变量组合,构建苹果生长季内不同月份的苹果相对气象产量预测模型,以模型测试集归一化RMSE最小化为依据,确定苹果相对气象产量预测的提前月份。并且在不同生育期和生长季内不同月份的模型预测精度分析过程中,将相对气象产量转换为实

41、际产量,比较其与以相对气象产量为目标变量的机器学习模型精度,从而判断苹果相对气象产量模拟模型构建方法精度。模型模拟前,随机选取7 0%观测数据作为训练数据集,30%数据作为测试数据集,以10 折交叉验证误差为原则对模型参数进行寻优。为降低模型精度极大值和极小值的影响,模型的最终精度为10 0次运行误差的50%分位数。1.5模型精度评价采用皮尔逊相关系数(Pearsoncorrelationcoefficient,r)和均方根误差(Root mean square error,RMSE)2个统计指标来评价模型模拟精度。2结果与分析2.1影响苹果产量的气象特征变量本文分析了目标变量(苹果相对气象产

42、量)与气象特征变量之间的相关关系(图3,P0.05),发现气温特征变量Tmean、T mi n、T ma x、T a、A T、NT 与目标变量之间存在正相关关系,其中Tmax与目标变量的相关性最高(r=0.26)。为了避免输人因子间共线利用机器学习算法和气象灾害指标预测黄土高原苹果相对气象产量气象数据空间位置数据苹果产量数据归一化一阶傅里叶筛选模型输人变量趋势产量:受技术措施影响的产量斯皮尔曼气温/降水量/辐射/M空气相对湿度相关性分析气温变量TT气象产量y:受气象因素影响的产量min需水变量RHmaxG纬度/经度/高程立供水变量P相对气象产量y:降低时空限制,反映受气象因素D冻害/连阴雨/千

43、旱辐射变量R影响的产量特征变量组合选择&多模型训练GBDT模型数据加权数据加权数据加权数据构建产量预测模型特征变量GBDT拟合拟合拟合组谷10折交最佳特征训练集SVMM变量组合测试集叉验证:BRBP;RMSEM+GM+G+D决策树决策树决策树决策树M+G+DMLR预测预测集成预测模型精度分析不同生育期的模型预测精度分析生长季内不同月份的模型预测精度分析图2苹果相对气象产量模拟模型流程图Fig.2Flow chart for establishment of simulation model of relative meteorological yield of apple农2023年机358报

44、学业械性对模型精度的影响,可同时选择与Tmax相关系数小于0.5的其他气温特征变量,其中符合要求的两个气温特征变量为Tmin与NT,但是它们之间存在较强的相关性,且Tmin与目标变量之间的相关性强于NT,因此最终只选择Tmax和Tmin作为模型输入的气温特征变量。需水特征变量RH与目标变量之间呈负相关关系,而供水特征变量P、辐射特征变量R与目标变量之间的相关性系数较小。因此,本文最终选取Tmax、T mi n、RH、P、R作为苹果相对气象产量模拟模型输人的最重要气象特征变量。1.0mean0.80.89Tmin0.60.710.45Tmax0.40.380.650.1870.20.970.81

45、0.760.27AT00.850.880.450.520.71NT-0.20.060.060.140.180.160.18RH-0.40.090.020.090.270.120.010.27P0.60.180.270.040.260.110.310.530.21R-0.80.180.110.260.040.180.070.010.030.01-1.0图3目标变量(苹果相对气象产量)与气象特征变量关联热图Fig.3 Heat map of correlation between target variableof apple relative meteorological yield and m

46、eteorologicalfeaturevariables2.2基于多种特征变量的不同苹果产量模型模拟精度分析分别使用苹果整个生长季内的最重要气象特征变量组合(M),最重要气象特征变量和空间特征变量组合(M+G),以及最重要气象特征变量、空间特征变量和气象灾害特征变量组合(M+G+D)作为不同的模型输人特征变量组合,分别驱动基于GBDT、SVM、BRBP和MLR算法的苹果相对气象产量模拟模型,并比较不同模型测试数据集的模拟精度(图4,图中虚线表示1:1线;*表示P0.01)。当仅以最重要气象特征变量M作为模型输人变量特征组合时,SVM模型具有最大的r值(0.7 0),而BRBP模型的预测误差最

47、小(RMSE为0.46)且数据点均匀分布在1:1线的两侧(图4a、4d、4g、4j)。当以M+G作为模型输人特征变量集时,与仅以M作为模型输人特征变量的情形相比,GBDT和BRBP的RMSE分别降低2%、2.17%,同时GBDT、BRBP和MLR模型的分别提升4.7 6%、2.9 9%和1.72%,但SVM模型的精度无变化(图4b、4e、4h、4k)。可见在模型输人气象特征变量中再加人空间特征变量,可以提高苹果相对气象产量模拟模型的预测精度。进一步在上述模型输人变量中再添加气象灾害特征变量(M+G+D),结果表明增加气象灾害特征变量可使GBDT、BRBP和MLR模型预测精度进一步提升,其中GB

48、DT模型的模拟精度提升效果最为明显,其r增加16.6 7%,RMSE减少10.20%,而SVM模型的模拟精度则有所下降(图 4c、4f、4i、41)。总体而言,基于GBDT和BRBP这2 种机器学习算法和M+G+D输人特征变量组合建立的苹果相对气象产量预测模型,其模拟精度普遍优于MLR算法模拟。这可能是因为苹果相对气象产量与最重要气象特征变量、空间特征变量和气象灾害特征变量之间存在较强的非线性关系,而机器学习算法比多元线性回归方法更能准确描述这种非线性关系。因此,本文采用M+G+D组合作为最佳的模型输入特征变量组合。2.3模型模拟误差空间分析以苹果整个生长季内的M+G+D特征变量组合作为模型输

49、人变量,驱动基于不同算法建立的苹果相对气象产量模拟模型,可进一步分析不同模型在黄土高原各省份的总体模拟精度(图5,图中每个箱体包含各省苹果生产基地县的苹果相对气象产量模拟结果,箱体上、下限为数据的上四分位数和下四分位数,中间实线为数据中位数,箱体外的两条线为上边缘和下边缘,超出上下边缘的值为异常值)。由图5可知,不同模型在不同省份的表现存在较大差异,其中BRBP模型在河南省和陕西省表现最佳,SVM模型在山西省和甘肃省表现较佳。河南、山西、陕西和甘肃各省最佳模型的RMSE均值分别为0.47、0.11、0.39 和0.2 0。在这4个省份中,山西省的模型总体估计误差相对较小,4个模型的RMSE平均

50、值仅为0.2 4,且误差分布相对较为集中。但河南省RMSE箱型图的箱体最长,这可能由于本文中河南省仅有3个苹果基地县,数据量较少使得箱型图的分布范围较大。2.4苹果不同生育期输入特征变量组合对模型模拟精度的影响进一步探究在M+G+D输人变量组合下,不同模型在不同生育期(落叶休眠期、萌芽幼果期、果实膨大期、着色成熟期)的苹果产量预测精度(图6)。当以相对气象产量作为目标变量时,对于GBDT和BRBP模型,各生育期模型的模拟精度无明显变化,其RMSE分别保持在0.44 0.46 和0.440.45之间,这表明这2 种模型在苹果各个生359罗琦等:基于机器气象灾害指标的苹果相对气象产量预测第9 期2

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服