1、由于大气实际探测方式较多,观测时间不统一,空间分辨率不均匀,不利于历史资料统计分析。20世纪 90 年代之后,美国、欧洲和日本等推出了自己的“再分析资料”,较好地解决了常规观测资料历史反演的困难。随着当前探测方式和探测资料的不断增多,资料同化技术的迅速提升,计算机性能的高速发展,给“再分析资料”注入了新的活力,使其在时间分辨率和空间分辨率上有了质的提升。欧洲中期天气预报中心(ECMWF)是较早开展再分析资料研发的机构,最新的 4D-Var 方法也是最早投入业务运用。时至今日,ECMWF 推出了五代再分析资料产品,分别为:第一代再分析产品(FGGE)1、第二代再分析产品(ERA-15)2、第三代
2、再分析产品(ERA-40)3、第四代再分析产品(ERA-Interim)4和第五代再分析产品(ERA-5)5。第五代再分析产品从数据量、时空分辨率以及同化方法上都有了较大的提高。再分析资料质量如何,能否反映历史真实的大ERA5 再分析资料在辽宁省的适用性分析与订正孙虹雨1,2,王迪3,刘成瀚2,张燕4,王式功1,5*(1.成都信息工程大学大气科学学院/高原大气与环境四川省重点实验室,四川成都 610225;2.辽宁省气象台,辽宁沈阳110166;3.河南省气象台,河南郑州 450003;4.凉山州气象局,四川凉山彝族自治州 615000;5.成都平原城市气象与环境四川省野外科学观测研究站,四川
3、成都 610225)摘要:基于 20092018 年辽宁省 62 个地面站和 9 个探空站(省内 4 部,省外 5 部)资料,提取了温度、湿度、气压、风场等常用物理量,采用统计分析方法对 ERA5 资料在辽宁省的适用性进行了分析,并尝试使用机器学习的方法订正 ERA5 资料的偏差。结果表明:在地面观测要素分析中,2 m 温度相关系数普遍较高,均方根误差普遍偏低,辽河流域及其西侧地区效果好于其他地区;10 m 风速对比结果总体稍差,U 分量相关系数总体低于 V 分量;ERA5 资料质量有明显的月变化特征,相关系数总体呈现春秋季高于夏冬季,且相关系数总体较高的季节,均方根误差也普遍偏高。在高空观测
4、要素分析中,辽宁中部地区的数据质量高于东西部,温度的平均相关系数最高,相对湿度相关系数平均较低,均方根误差总体较大;相对湿度的相关系数在春夏之交时最低,夏季上升较快,夏秋之交时达到最高,相关系数快速上升的月,均方根误差也呈现出快速上升的趋势;高空 U 风场和 V 风场的均方根误差总体相差不大,且均方根误差月变化一致,总体经向风(V 风场)质量低于纬向风(U 风场)。通过机器学习的订正方法有效提升了地面温度和相对湿度的应用能力,使 ERA5 地面温度资料的均方根误差缩小 0.5耀1.0 益,地面相对湿度资料的均方根误差缩小最高可达 26%。关键词:再分析资料;适用性;均方根误差;相关系数;机器学
5、习中图分类号:P413文献标识码:A文章编号:1002-0799(2023)04-0101-10收稿日期:2022-11-19;修回日期:2023-03-21基金项目:海南省南海气象防灾减灾重点实验室开放基金项目(SCSF202007);辽宁省气象局科学技术研究项目(ZD202224)作者简介:孙虹雨(1985),女,高级工程师,主要从事短期天气预报研究。E-mail:通信作者:王式功(1955),男,教授,主要从事环境气象和天气预报技术方面的研究。E-mail:wangsg 孙虹雨,王迪,刘成瀚,等.ERA5 再分析资料在辽宁省的适用性分析与订正J.沙漠与绿洲气象,2023,17(4):10
6、1-110.doi:10.12057/j.issn.1002-0799.2023.04.014开放科学(资源服务)标识码(OSID):沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology研究论文第 17 卷 第 4 期2023 年 8 月101研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月气状况,近年来备受关注,国内外很多专家和学者针对不同的再分析资料做过很多质量评估工作。孟宪贵等6通过对 ERA5 资料的实用性进行了分析,指出ERA5 资料的海平面气压和 2 m 温度
7、与实况相关性好于 2 m 相对湿度和 10 m 风场。朱景等7利用浙江省 71 个台站观测的日平均气温和地表(0 cm)温度资料对两套再分析资料(ERA5 和 ERA-Interim)进行评估,指出两套资料总体实用性均较高。秦艳慧等8研究表明再分析资料能较好地再现高原多年冻土区的地表温度基本特征,并能较好地描述地表温度的季节变化。滕华超等9和白磊等10通过分析ERA-Interim 风速再分析资料的适用性,指出 ERA-Interim 风速再分析资料整体具有较高的可信度,且ERA-Interim 再分析资料的气压、温度的可信度要优于 NCEP/NCAR 数据,但局部有差异。支星等11-12对再
8、分析资料年平均高空温度在中国地区的可信度进行系统分析,指出三种再分析资料(NCEP/NCAR、ERA 和 JRA)高空温度较探空资料高空温度偏低,ERA 和 JRA 在对流层中下层与探空资料更加接近。陈艳春等13分析了五种再分析资料在本地的适用性,指出在环渤海区域 10 m 风场中,JRA 资料与观测站的相关系数最高,ERA 资料的均方根误差最小。袁松等14,指出 NCEP 资料中温度、相对湿度、U 风场和 V 风场绝对差值随地点、高度、季节变化较小。高淑新等15和谢潇等16指出,不同再分析资料存在一定的共性,但不同地区不同时间尺度下差异显著,辽宁西部地区再分析资料可用性差异较大。郑艳萍17通
9、过研究 ERA5 再分析资料在广东省的适用性指出,ERA5 再分析地面资料的海平面气压、温度表现较好,相对湿度表现稍差。王秀明等18选取 60 个超级单体风暴个例,研究再分析资料在我国强对流天气环境分析中的适用性,指出 NCEP 再分析资料计算的对流有效位能、水汽参数与观测值差异较大,用K 指数、温度直减率来分析大气层结稳定度效果较好。夏凡等19通过对 WRF 预报的 2 m 温度进行验证,指出 08 时的预报效果好于 20 时,且白天预报效果好于晚上。许敏等20和李翔翔等21指出,GRAPES和 T639 模式对大雨及以上降水和小雪预报效果较好,T639 模式 TS 评分高于 GER、JPN
10、 等模式;通过订正 JAR55 再分析资料,其地面温度均方根误差得到有效缩小。陈艳春等22运用环渤海气象台站资料与 NCEP/NCAR 等 5 种再分析资料研究其适用性问题,指出 ERA-Interim 资料水平分辨率较高,强风时可重点参考。邓小花等23也指出各种再分析资料所使用的同化方案、数据来源、质量控制算法及相关的偏差校正方法不同,应从经验出发分析各类再分析资料在不同方面的优缺点。由于大气的状态和变化具有很强的地域性,已有的研究成果可为科研和业务应用提供思路和参考依据,部分成果和参数在辽宁省不一定适用。本文将重点分析 ERA5 资料在辽宁地区的适用性,并根据ERA5 资料的误差结果,运用
11、机器学习的方法进行订正,缩小 ERA5 资料与实况资料的差距,为 ERA5资料在辽宁适用性的研究和应用提供借鉴和参考。1资料和方法1.1资料来源1.1.1ERA5 再分析资料为便于计算和提高运算效率,结合辽宁省边界,资料范围为 38毅耀44毅N,118毅耀126毅E。ERA5 再分析资料选取业务中常用资料包括地面温度、露点、风向和风速资料,高空选取不同高度的气压、位势高度、温度、露点、风向和风速资料。为尽可能保证评估的普适性和代表性,选用 2009 年 1 月 1 日2018 年12 月 31 日(北京时,下同)共 10 a 资料;地面和高空时间分辨率为 1 h,空间分辨率为 0.25毅伊0.
12、25毅,高空选用 11 个标准层(1 000、925、850、700、500、400、300、250、200、150、100 hPa)。1.1.2实况观测资料辽宁省共有国家地面站 62 个,探空站 4 个,站点分布如图 1 所示。文中涉及的地图,均来自于“标准地图服务网”下载的中国标准地图,审图号为 GS(2020)4619 号。实况资料时间为 2009 年 1 月 1日2018 年 12 月 31 日共 10 a 资料,地面观测资料选取 62 个国家站的温度、露点、风向和风速资料,探空资料选取气压、高度、温度、露点、风向和风速资图 1辽宁省国家气象观测站和探空站分布102料。由于 ERA5
13、再分析资料的时间分辨率为 1 h,所以地面资料也选用逐小时资料进行匹配;高空选用每日 2 次(08、20 时)的探空资料。所有观测资料来自辽宁省气象局,本文使用的站点均为考核站点,数据质量可信度较高。1.2评估方法为分析和检验实况观测资料和 ERA5 再分析资料的差异,很多专家运用不同的方法将再分析资料匹配到实况观测站点上,其中有双线性插值法和邻近点匹配法等。朱景等7通过研究指出,双线性插值会带来插值误差,而且邻近点匹配法误差相对较小;所以本文将采用邻近点匹配法,将 ERA5 再分析资料和地面及高空实况观测资料进行匹配。为定量评估再分析资料的性能,选用均方根误差和相关系数来检验再分析资料对实况
14、观测的偏离程度。相关系数(RR)公式:RR=Ni=1移(XERA5,i-XERA5)(Xobs,i-Xobs)Ni=1移(XERA5,i-XERA5)2姨Ni=1移(Xobs,i-Xobs)2姨,(1)均方根误差(RMSE)公式:RMSE=Ni=1移(Xobs,i-XERA5,i)2N姨.(2)式中:N 为样本数量,i 为每一个样本,XERA5为 ERA5再分析资料,Xobs为实况观测资料。1.3机器学习订正方法为提升 ERA5 资料的适应性,减小资料与实况资料的均方根误差,提高相关系数,本文采用机器学习的方法对 ERA5 地面温度和相对湿度资料进行订正。机器学习模型选用线性回归中的岭回归算法
15、(Ridge),采用“K 折交叉验证”的方法将训练集和评估集随机分离,运用“10 折交叉验证”的方法评估模型准确度。岭回归算法最大的优势是可用于共线性分析的有偏估计回归方法,通过损失部分信息的代价,获取更真实可靠的回归方法。本文采用 Python的 Sklearn 库包,调用岭回归算法模型来实现24。2结果分析2.1地面气象要素适用性分析2.1.1地面气象要素相关系数分布由全省站点相关系数分析可知,2 m 温度相关系数跃0.99 的站点大多集中于辽河流域及其西侧地区,大连、葫芦岛地区相关系数相对较低,但均跃0.94,也属强相关。2 m 露点温度相较于 2 m 温度,相关系数跃0.99 的地方较
16、少,主要分布于沈阳和铁岭地区,但逸0.98 的地区较多,在全省均有分布;2 m 露点温度相关系数低值区依然集中于大连和葫芦岛地区。地面气压相关系数均较高,平均值高达 0.994,仅有个别站点相关系数出现约0.95 的情况,说明 ERA5 再分析资料在地面气压的反演中表现优越。10 m 风速的对比中发现相关系数总体下降,平均相关系数仅0.684,但辽河流域及两侧地区依然是相关系数高值区,抚顺、丹东、葫芦岛地区最低,仅达到 0.550.60;大连、本溪部分地区较低。由于风向为 0毅耀360毅,对比验证不便,故采用 U、V 分量形式对比验证,U 分量代表纬向风,V 分量代表径向风。由 10 m 风场
17、 U、V 分量相关系数可知,U 分量相关系数明显低于 V分量,这和均方根误差 U 分量高于 V 分量有明显不同,在业务应用时要特别注意;且 U 分量相关系数平均值仅 0.666,V 分量相关系数平均值仅 0.818,U、V 分量相关系数高值区主要位于辽河流域地区,丹东、本溪、朝阳地区较低,最低仅 0.44;V 分量相关系数虽然较 U 分量高,但跃0.90 的站数仅 13 个,高相关系数区位于辽河流域及以西区域,东部站点的相关系数明显偏小。2.1.2地面气象要素均方根误差分布由全省站点均方根误差分布可知,2 m 温度(图2a)的均方根误差总体约2 m 露点温度(图 2b),2 m温度均方根误差最
18、低为 1.56 益,平均为 2.0 益,而2 m 露点温度均方根误差最低为 1.89毅 益,平均为2.4 益;从空间分布也能直观看出,2 m 温度的均方根误差在 1.5耀2.0 益分布较广,特别是辽河流域以西最为集中,且仅有个别点均方根误差跃2.6 益;2 m露点温度均方根误差在 1.5耀2.0 益的仅有 4 个站点,均分布于辽宁北部的沈阳和铁岭地区,均方根误差在 2.1耀2.5 益分布最广,大连地区的均方根误差较大且分布集中。由地面气压的均方根误差分布(图2c)可知,最低为 0.46 hPa,均方根误差大值区集中于辽宁的东部和西部,误差最高为本溪桓仁站(32.2 hPa),均方根误差较低的地
19、方主要集中于辽河流域及其西侧地区。10 m 风速(图 2d)均方根误差高值和低值在全省分布较为分散,全省 14 个地市中,均有误差高值和低值区。经统计发现,风速误差最低为 1.2 m/s,最高为 2.9 m/s,平均为 1.76 m/s,总体表现良好;跃2.0 m/s 的站点多分布于沿海地区,推测可能是受孙虹雨等:ERA5 再分析资料在辽宁省的适用性分析与订正103研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月海洋影响,ERA5 再分析资料反演质量较差造成。根据U、V 风场空间分布可知(图2e、2f
20、),辽宁中北部地区 U 风场均方根误差低于 V 风场,10 m 风场 U 分量均方根误差平均值为 1.5 m/s,较 10 m 风场 V 分量总体较低,特别是辽宁中北部地区均方根误差均约1.5m/s,大连、朝阳、葫芦岛地区误差相对较高,大连地区的误差最高,但大多臆2.8m/s;10 m 风场V 分量误差平均值为2.0 m/s,高误差地区全省分布较为分散,误差跃2.5 m/s 的地区位于大连、抚顺、营口和葫芦岛地区。2.1.3地面气象要素相关系数及误差逐月变化特征为研究地面各观测要素和 ERA5 资料对比状况,根据各要素在不同月份的平均相关系数和平均均方根误差对比特征,绘制了月变化分布图(图 3
21、)。选取了相对湿度(RH)、风速(V)、U 风场(u)、V 风场(v)分量等 4 个月变化特征相对明显的要素,其他月变化特征不明显的要素在此省略。根据相关系数逐月分布可以看出地面相对湿度的相关系数要高于风速、U 风场和 V 风场,各要素月变化特征明显;14月相关系数呈波动上升趋势,4 月达到最大值后开始下降,7 月达到最低,而后开始上升至 10 月;总体呈现春秋季平均相关系数好于夏冬季。因相对湿度(RH)平均均方根误差较大,为清楚显示风速、U 风场、V 风场月变化特征,故在图 3 均方根误差图中右图 2地面气象要素均方根误差空间分布(a 为 2 m 温度,b 为 2 m 露点温度,c 为地面气
22、压,d 为 10 m 风速,e 为 10 m 风场 U 分量,f 为 10 m 风场 V 分量)104图 4高空气象观测要素相关系数分布(a 为温度,b 为相对湿度,c 为 U 风场,d 为 V 风场)侧单独列出相对湿度坐标轴(红色)。由平均均方根误差月分布(图 3b)可以看出,相对湿度的均方根误差最高,所有要素的均方根误差月变化特征明显,春季最高,夏季最低;相关系数高的季节,均方根误差也偏高。U、V 风场的月变化中,U 风场平均相关系数低于 V 风场,但风场的平均均方根误差为 1.773,U风场平均均方根误差也小于 V 风场;而风速的平均相关系数仅有 0.670,在业务和科研使用中需要注意。
23、2.2高空气象要素适用性分析辽宁省共有 4 个探空气象站,分别为沈阳、大连、丹东和锦州站,为保证研究区域的全面性,增加辽宁省周围的 5 个探空站进行补充分析,分别是吉林省的长春和临江站,内蒙古的通辽和赤峰站,以及河北省的乐亭站。2.2.1高空气象观测要素相关系数分布根据探空站的 ERA5 再分析资料和实况资料对比相关系数分析发现(图 4),总体上温度的相关系数最高,在高空 300 hPa 以下,相关系数均超过0.95,300 hPa 以上丹东站和锦州站相关系数略有降低,锦州站在 150 hPa 处最低,为 0.74。从温度相关系数随气压的分布廓线(图 4a)可知,锦州站最低、图 3辽宁省所有地
24、面站点各要素平均相关系数(a)和平均均方根误差(b)逐月分布孙虹雨等:ERA5 再分析资料在辽宁省的适用性分析与订正105研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月丹东站次之,其他站点分布较为一致,且相关系数随高度变化较小;平均相关系数最高为大连站,达到0.991,其次是通辽站;ERA5 高空资料在辽宁中部地区的质量要高于东西部地区,这可能和地形有关,辽宁中部为辽河流域平原地带,海拔较低,东西部分别为山区和丘陵地带,地形可能影响了 ERA5 资料同化。而 ERA5 资料的相对湿度(图 4b)质量
25、相比于温度稍差,多数站在低层相关系数高于高层,丹东和锦州站相关系数在中层及以下明显较其他站点偏小,大连站相关系数在中层突然大幅度减小,其他层结相关系数较高;相对湿度的平均相关系数最高是大连站,为 0.723,其次是通辽站,为 0.675,最低是临江站,为 0.547;相对湿度的诊断在天气预报中至关重要,在日常业务和研究中,若使用 ERA5 再分析资料的相对湿度数据时,应谨慎使用。由 U 风场的相关系数(图 4c)分布可知,中低层以上相关系数整体较高,且越往高空相关系数基本呈现升高趋势(除 150 hPa异常偏低);相关系数在低空普遍较低,1 000 hPa 丹东和锦州站偏低尤为明显;除丹东和锦
26、州站,其他站在中层及以上相关系数均超过 0.9,相关性较强,说明 ERA5 资料对东西方向的风整体质量较高,优于南北方向。相较于 U 风场,V 风场(图 4d)相关系数整体偏低,特别是丹东和锦州站的 V 风场相关系数较低,且两站从中层到高层相关系数逐渐减小,100 hPa 达到最小,此时锦州站相关系数仅为0.701。除丹东和锦州站外,其他站点的 V 风场相关系数总体较高、整层平均相关系数均超过 0.9,平均相关系数最高是大连站,为 0.963。2.2.2高空气象观测要素均方根误差分布高空 ERA5 资料和实测资料对比均方根误差分布如图 5 所示。根据温度均方根误差分布(图 5a)可知,ERA5
27、 资料在丹东站和锦州站的均方根误差最大,与这两地的相关系数较低相一致;总体呈现中层均方根误差最小,低空均方根误差整体较高;最大温度均方根误差出现在锦州站的 950 hPa,为 4.089;各层平均均方根误差最高的为锦州站,均方根误差为 3.134,其次为丹东站,最小是通辽站,为 0.904。相对湿度的均方根误差(图 5b)总体较大,从低空到300 hPa 均方根误差上升较快,在 300 hPa 达到最大,各站在 300 hPa 平均均方根误差为 35.540;从各站平均均方根误差看,通辽站最小,为 21.933,最大是临江站,为 25.096;在分析天气时,如需研究相对图 5高空观测要素均方根
28、误差分布(a 为温度,b 为相对湿度,c 为 U 风场,d 为 V 风场)106图 6辽宁省所有探空站各气象要素平均相关系数(a)和平均均方根误差(b)逐月分布孙虹雨等:ERA5 再分析资料在辽宁省的适用性分析与订正湿度或湿度相关物理量时要特别注意。由 U 风场均方根误差分布(图 5c)可知,误差较大的站点出现在丹东站和锦州站,其中丹东站误差最大,平均均方根误差,为 5.838,其次是锦州站为 4.968,平均均方根误差最小是通辽站,为 2.290;由垂直分布可以看出,大多数站点的均方根误差集中在 2 左右,且越往高空,误差越大,在 150 hPa 误差急剧升高达到最大;误差最大值是 150
29、hPa 的丹东站,为 9.127。由 V 风场的均方根误差垂直分布(图 5d)可知,误差最大的站点依然出现在丹东站和锦州站,且平均均方根误差值明显超过 U 风场,丹东站平均误差最大,锦州站次之,最大误差出现在 250 hPa 的丹东站,为 9.392;大多数站点的各层均方根误差也都集中于 2 附近,这种分布方式和 U 风场类似,但V风场的总平均误差要高于 U 风场;从低层到高层,V 风场均方根误差呈现上升趋势,但在 250 hPa 达到最高,再往高空误差下降,这种分布和 U 风场既有相似之处,又有区别;再次说明,ERA5 资料总体经向风(V 风场)质量低于纬向风(U 风场)。2.2.3高空气象
30、要素相关系数及误差逐月变化特征根据所有探空站点实测资料,与 ERA5 资料各层次一一匹配,绘制了温度(T)、相对湿度(RH)、U风场(u)和 V 风场(v)平均相关系数和平均均方根误差逐月分布图(图 6)。由于相对湿度的相关系数较其他要素低,均方根误差较其他要素高,特将相对湿度用单独坐标轴绘制(右侧红轴)。由相关系数分布(图 6a)可知,相对湿度相关系数最低,但其有很强的月变化特征,呈现“单峰单谷”型,从年初相关系数迅速下降,到 4 月达到最低(相关系数为 0.636),然后从 6 月开始快速上升,8 月达到最高,相关系数为0.750,之后继续下降;可见相对湿度的平均相关系数在春夏之交时最低,
31、夏季相关系数上升较快,夏秋之交时相关系数达到最高。平均相关系数最高的为温度,月变化较小,各月平均相关系数均在 0.99以上。U 风场平均相关系数是明显高于 V 风场,这和上文的研究结果相一致,U 风场全年月变化不及V 风场明显,V 风场相关系数从年初开始升高,5 月达到最高(相关系数为 0.947),而后缓慢下降。从平均均方根误差的分布(图 6b)来看,相对湿度误差分布依然具有很强的月变化特征,呈现“单峰”型,6 月最高(均方根误差为 27.892),1 月最低(均方根误差为 21.524),在相关系数快速上升的月(68 月),平均均方根误差也呈现出快速上升的趋势。温度的平均均方根误差最小,年
32、平均值为 1.6,且波动较小。U风场和 V 风场的均方根误差相差不大,U 风场稍低一些,而且 U、V 风场平均均方根误差月变化较一致,季节性变化明显,冬季最高,夏季最低。2.3基于实况资料的 ERA5 再分析资料订正为提升 ERA5 再分析资料的业务和科研应用,结合前面的分析发现,ERA5 资料温度的数据质量相对较高,而相对湿度的数据质量相对较低,鉴于文章篇幅有限,本次选择了两种具有代表性的要素进行试验订正,订正方法选择机器学习模型,将地面ERA5 资料的温度和相对湿度进行订正。将每一个国家站点的 ERA5 与实况资料的均方根误差(以下简称为“原误差”)减去机器学习模型订正结果资料和实况资料的
33、均方根误差(以下简称为“订正后误差”),得到均方根误差之差空间分布(图 7)。由国家站点的地面温度均方根误差之差可知,原误差平均值为 2.1,订正后误差平均值为 1.9,说明基于岭回归算法的机器学习订正方法有效缩小了ERA5 资料与实况资料的差距;由各站点地面温度原误差与订正后误差空间分布(图 7a)可知,正值误差越大说明机器学习订正算法效果越好,负值越大说明机器学习订正算法起到反作用越大,差值大部分集中在 0耀1.0,0耀0.5 分布最多,证明机器学习订正算法可有效缩减小误差 0.5耀1.0 益,其中辽河平原地区提升效果明显;辽宁南部的部分地区订正有反107研究论文研究论文沙 漠 与 绿 洲
34、 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月图 7各国家站点地面温度(a)和相对湿度原误差(b)与订正后误差之差空间分布作用,分布比较分散,但均臆-0.7益,业务运用或科研中注意适当调整。由国家站点的地面相对湿度均方根误差之差可知,原误差平均值为 11.7,订正后误差平均值为 10.3,订正效果好于地面温度;由各站点地面相对湿度原误差与订正后误差空间(图7b)分布可知,相对湿度的订正最好的地区普遍位于辽宁的南部地区,大连、营口、丹东地区分布最集中,辽西的葫芦岛地区也有较多分布,误差最高可降低 26%;辽宁中部地区的本溪、辽阳地区订
35、正反作用较为集中,但起到反作用的站点数理明显低于正作用的数量。从机器学习的岭回归算法订正结果的综合分析可知,本方法可有效提升 ERA5 资料的应用能力,有效缩小与实况资料的差距。3结论与讨论(1)地面要素相关系数中 2 m 温度整体较高,大多集中于辽河流域及以西地区,2 m 露点温度相关系数稍低于 2 m 温度,但大多超过 98%,2 m 温度均方根误差约2 m 露点温度;地面气压相关系数均较高,平均值高达 0.994,辽宁的东部和西部地区均方根误差较大。高空站点温度的相关系数最高,低层均方根误差整体高于中高层,相对湿度相关系数整体较低,均方根误差较大。(2)地面 10 m 风速平均相关系数整
36、体相对较低,辽河流域及两侧地区依然是相关系数高值区,均方根误差全省分布不均;地面风场 U 分量相关系数明显低于 V 分量,且辽宁中北部地区 U 分量均方根误差低于 V 分量。高空站点辽宁中部地区的数据质量要高于东部、西部地区;U 风场的相关系数从中低层以上整体比较高,且往高空相关系数呈现升高趋势,均方根误差集中在 2 左右,且越往高空,误差越大;ERA5 资料在高空总体经向风(V 风场)质量低于纬向风(U 风场)。(3)地面相对湿度、风速、U 风场和 V 风场平均相关系数和均方根误差月变化特征明显,相对湿度相关系数和均方根误差整体最高,相关系数总体呈现春秋季高于夏冬季,所有要素的均方根误差分布
37、呈现春季高、夏季低的状态,且相关系数高的季节,均方根误差也偏高;U 风场相关系数低于 V 风场,U风场均方根误差也低于 V 风场。(4)高空资料逐月分布中,温度的相关系数最高,均方根误差最小;U 风场平均相关系数明显高于V 风场;相对湿度的相关系数在春夏之交时最低,夏季相关系数上升较快,夏秋之交时达到最高;而相对湿度在相关系数快速上升的月,均方根误差也呈现出快速上升的趋势。U 风场和 V 风场的均方根误差相差不大,且均方根误差月变化相一致。(5)通过机器学习的订正方法可有效提升地面温度和相对湿度的应用能力,ERA5 地面温度资料的均方根误差减小主要集中在辽河流域,误差减小0.5耀1.0 益;地
38、面相对湿度资料的均方根误差减小主要分布于辽宁南部地区,降低误差最高达到 26%。参考文献:1BENGTSSON L.FGGE 4-demensional data assimilationatECMWF J.Bulletin of the American MeteorologicalSociety,1982,63:29-43.2GIBSON J K,HERNANDEZ A,KALLBERG P,et al.TheECMWF reanalysis project(ERA)-plans and current statusR.Amer Meteor Soc,1994.3UPPALA S M,KA
39、LLBERG PW,SIMMONS AJ,et al.TheERA-40 reanalysis J.Quarterly Journal of the RoyalMeteorological Society,2005,131(612):2961-3012.4SIMMONS A,UPPALA S,DEE D,et al.ERA-Interim:new ECMWF reanalysis products from 1989 onwardsJ.ECMWF Newsletter,2007,10:25-35.108孙虹雨等:ERA5 再分析资料在辽宁省的适用性分析与订正5HERSBACH H.The ER
40、A5 atmospheric reanalysisC.AGUFall Meeting,2016.6孟宪贵,郭俊建,韩永清.ERA5 再分析数据适用性初步评估J.海洋气象学报,2018,38(1):91-99.7朱景,袁慧珍.ERA 再分析陆面温度资料在浙江省的适用性J.气象科技,2019,47(2):289-298.8秦艳慧,吴通华,李韧,等.ERA-Interim 地表温度资料在青藏高原多年冻土区的适用性J.高原气象,2015,34(3):666-675.9滕华超,陈艳春,汤子东.ERA-Interim 风速再分析数据在山东省的适用性评估J.山东气象,2016,36(1):27-31.10白
41、磊,王维霞,姚亚楠,等.ERA-Interim 和 NCEP/NCAR再分析数据气温和气压值在天山山区适用性分析J.沙漠与绿洲气象,2013,7(3):51-56.11支星,徐海明.3 种再分析资料的高空温度与中国探空温度资料的对比:年平均特征J.大气科学学报,2013,36(1):77-87.12支星,徐海明,米卫红,等.中国东北和西北地区三种再分析资料与探空资料的温度对比J.气象与环境学报,2014,30(6):147-157.13陈艳春,王娜,顾伟宗,等.环渤海区域再分析资料地面风速场的适用性对比分析J.海洋气象学报,2017,37(1):67-72.14袁松,程华,王东勇,等.模式再分
42、析与实际探空资料的对比分析J.气象科学,2012,32(1):62-67.15高淑新,宋晓巍,李琳琳,等.CLIGEN 天气发生器在中国东北三省模拟温度的适用性评价J.气象与环境学报,2019,35(4):77-84.16谢潇,何金海,祁莉.4 种再分析资料在中国区域的适用性研究进展.J.气象与环境学报,2011,27(5):58-65.17郑艳萍.ERA5 再分析资料在广东省的适用性初步分析C/中国气象学会.第 35 届中国气象学会年会 S20 深度信息化:应用支持与智能发展.中国气象学会,2018:7.18王秀明,俞小鼎,朱禾.NCEP 再分析资料在强对流环境分析中的应用J.应用气象学报,
43、2012,23(2):139-146.19夏凡,杨晓霞,刘诗军,等.WRF 模式 2 m 温度在山东预报效果的评估J.气象与环境学报,2019,35(5):10-17.20许敏,丛波,刘艳杰,等.廊坊地区 5 种数值模式降水预报性能检验与评估J.气象与环境学报,2016,32(1):09-15.21李翔翔,黄淑娥,杨军,等.多种再分析地面气温资料在江西省的适用性J.气象科技,2020,48(6):877-886.22陈艳春,王娜,顾伟宗,等.环渤海区域再分析资料地面风速场的适用性对比分析J.海洋气象学报,2017,37(1):67-72.23邓小花,翟盘茂,袁春红.国外几套再分析资料的对比与分
44、析J.气象科技,2010,38(1):1-8.24魏贞原.机器学习 Python 实践M.北京:电子工业出版社,2018:211.109研究论文研究论文沙 漠 与 绿 洲 气 象Desert and Oasis Meteorology第 17 卷 第 4 期2023 年 8 月Applicability Analysis and Revision of ERA5 Reanalysis Datain Liaoning ProvinceSUN Hongyu1,2,WANG Di3,LIU Chenghan2,ZHANG Yan4,WANG Shigong1,5(1.School of Atmosp
45、heric Sciences,Chengdu University of Information Technology/Plateau Atmosphereand Environment Key Laboratory of Sichuan Province,Chengdu 610225,China;2.Liaoning Meteorological Observatory,Shenyang 110166,China;3.Henan Meteorological Observatory,Zhengzhou 450003,China;4.Liangshan Meteorological Burea
46、u,Liangshan 615000,China;5.Chengdu Plain Urban Meteorology and Environment Sichuan Provincial Field Scientific Observation andResearch Station,Chengdu 610225,China)AbstractIn order to systematically study the applicability of ERA5 reanalysis data in Liaoningprovince,this studyextractedtemperature,hu
47、midity,pressure,windfieldandothercommonlyused physical quantities from 62 ground stations and 9 sounding stations(4 within the provinceand 5 outside the province)in Liaoning province during 2009-2018.Statistical analysis wasused to analyze the applicability of ERA5 data in Liaoning province,and mach
48、ine learningmethods were attempted to correct the deviations in ERA5 data.The results show that in theanalysisofgroundobservationelements,thecorrelationcoefficientof2mtemperatureisgenerally high,and the root mean square error is generally low,meanwhile,the effect is betterin the Liaohe River Basin a
49、nd its western region than in other areas;The comparison results of10mwindspeedaregenerallypoor,andthecorrelationcoefficientofU-componentisgenerally lower than that of V-component;There is a clear monthly variation in the quality ofERA5 data,with the correlation coefficient generally higher in sprin
50、g and autumn than insummer and winter.In seasons with high correlation coefficients,the root mean square error isgenerally high.In the analysis of sounding observation elements,the data quality in the middleofLiaoning province is higherthan that in the eastern andwesternregions;Theaveragecorrelation