收藏 分销(赏)

基于机器学习分类算法的臭氧浓度等级预报在长沙的应用.pdf

上传人:自信****多点 文档编号:2332681 上传时间:2024-05-28 格式:PDF 页数:9 大小:1.73MB
下载 相关 举报
基于机器学习分类算法的臭氧浓度等级预报在长沙的应用.pdf_第1页
第1页 / 共9页
基于机器学习分类算法的臭氧浓度等级预报在长沙的应用.pdf_第2页
第2页 / 共9页
基于机器学习分类算法的臭氧浓度等级预报在长沙的应用.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、李细生,张华,喻雨知,等.基于机器学习分类算法的臭氧浓度等级预报在长沙的应用J.热带气象学报,2023,39(4):453-461.文章编号:1004-4965(2023)04-0453-09基于机器学习分类算法的臭氧浓度等级预报在长沙的应用李细生1,张华2,喻雨知3,邓新林2,谢倩雯2,舒磊2(1.气象防灾减灾湖南省重点实验室,湖南 长沙 410118;2.株洲市气象局,湖南 株洲 412003;3.长沙市气象局,湖南 长沙 410017)摘要:为准确预报臭氧浓度等级,基于EC_THIN全球天气模式产品和我国自主研发的CMA_GFS全球天气数值预报产品以及华南GRACEs大气成分模式输出产品

2、,融合气象和环境观测数据,使用6种机器学习智能算法,构建耦合数值预报模式和机器学习的混合模型,旨在充分发挥数值预报与机器学习智能算法的优势和互补协同作用,实现臭氧浓度等级预报准确度的跨越式提升。共设置4个控制试验,选取不同的特征产品,依次使用机器学习经典分类算法对长沙市未来4天的臭氧浓度等级进行分类预报,取测试准确度最高的模型输出结果作为结果统计。发现:最优模型14天的测试准确度分别为81.7%、81.7%、78.3%、60.9%,大大高于大气成分模式预报和预报员经验,达到预期设计目标;高质量的天气模式产品对模型贡献大,而大气成分模式产品对模型贡献有限;模型3天以内预测性能较好,低等级预测性能

3、较好,高等级预测性能一般。提出解决方案供讨论:增加高等级样本数量,增强模型对此类事件的识别能力;加强高等级臭氧污染的机理分析,组合出更精炼的因子供模型使用。关键词:机器学习;分类;臭氧;大气成分;数值模式中图分类号:X513文献标志码:ADoi:10.16032/j.issn.1004-4965.2023.041收稿日期:2022-10-27;修订日期:2023-04-08基金项目:湖南省气象局2020年重点课题(XQKJ20A001)资助通讯作者:李细生,男,湖南省人,硕士,高级工程师,主要从事环境气象研究。E-mail:。第39卷 第4期2023年8月热 带 气 象 学 报JOURNAL

4、OF TROPICAL METEOROLOGYVol.39,No.4Aug.,20231 1 引引言言近年来,臭氧污染作为环境污染的一个重要单项,越来越受到关注1-5。臭氧通常存在于离地30 km左右的高层大气中,能有效阻挡紫外线,保护人类健康。臭氧具有较强氧化性,低层大气中低浓度的臭氧有消毒作用,但是高浓度的臭氧对人体就会造成极大的危害。我国实施的新 环境空气质量标准(GB 3095-2012)6中,增加了臭氧(O3)监测项目,据观测,近年来我国近地层臭氧污染呈上升趋势。臭氧产生的机制较为复杂,一般认为7其前体物是氮氧化物和挥发性有机物,而臭氧污染的形成与地形、气象条件密切相关,和天气一样,

5、具有较高程度的可预报性8。中国气象局2018年6月1日正式发布并实施 全国臭氧气象预报业务规范,往后,每年510月,全国气象部门相关业务单位将据此开展臭氧气象预报业务,为臭氧污染治理提供必要科学决策依据。国内关于臭氧与气象条件关系的研究较多9-10,而关于臭氧浓度预报的研究较少11,预报方法主要分为数值模式预报和统计模型预报,根据臭氧污染出现特征,利用数据模式与神经网络模型结合的方式,研制臭氧气象预报客观方法,周广强等12利用数值预报释用方法对长江三角洲55个城市进行臭氧浓度预报,取得较好效果。目前,数值天气模式发展热 带 气 象 学 报第39卷较快,各种观测资料如卫星、雷达产品同化进入模式,

6、使得模式初始场更加精准,各种物理过程参数化方案得到进一步优化,预报能力和预报准确率不断提高,如欧洲中心的ECMWF模式13,其预报质量和先进性已得到全球公认,我国具有自主知识 产 权 的 全 球 中 期 数 值 天 气 预 报 系 统GRAPES_GFS14,各项预报指标也达到或接近世界先进水平。与此同时,以数值天气模式输出资料为基础,加入化学模块的大气成分数值预报模式 也 得 到 发 展,国 内 业 务 化 应 用 较 多 如WRF_CHEM15、CUACE、华 东 CMAQ16,华 南GRACEs17-18等,可能是由于输入的气象场质量问题,或者是源排放清单精度、更新问题等原因,目前这些大

7、气成分数值预报模式的产品质量仍不能满足实际工作需要,必须做大量的订正释用改造。近年来,大数据和人工智能技术发展迅速,机器学习等智能算法展现出相对于传统数理统计的优越性,如决策树、支持向量机、朴素贝叶斯、K近邻,集成和神经网络算法等,这些算法具有较强的非线性映射能力、学习能力和容错性19,可以融合不同时空尺度的数据,计算效率高,挖掘数据特征的能力强,为多尺度气象与环境数据融合、实况与预报数据融合、不同数值模式之间的融合,为高精度预 报 臭 氧 浓 度 等 级 提 供 了 可 能。本 文 融 合EC_THIN 全球天气模式产品和我国自主研发的CMA_GFS 全 球 天 气 数 值 预 报 产 品

8、以 及 华 南GRACEs大气成分模式输出产品,融合气象和环境观测数据,使用智能的机器学习分类器20,构建耦合数值预报模式(包括天气模式和大气成分模式)和机器学习的混合模型,旨在充分发挥数值预报与机器学习智能算法的优势和互补协同作用,实现臭氧浓度等级预报准确度的跨越式提升。共设置4个控制试验,选取不同的特征产品,依次使用上述机器学习经典分类算法对长沙市未来4天的臭氧浓度等级进行分类预报,取测试准确度最高的分类器输出结果作为结果统计,得出一些有意义的结论。2 2 资料和方法资料和方法2.1 资料来源本文以长沙市20182020年气象和环境观测数据为基础,以天为单位统计,由于部分资料缺失,筛取资料

9、齐备的样本总计 494个,其中训练样本379个(2018年1月2020年1月),测试样本115个(2020 年 27 月),互不交叉。收集同时期的EC_THIN 数值天气预报产品和华南 GRACEs 区域大气成分模式产品。气象观测资料来源于长沙市气象局莲花观测站;环境观测资料为长沙市各测 站 均 值,来 源 于 长 沙 市 环 境 观 测 中 心 站;EC_THIN 和华南 GRACEs 模式资料来源于湖南省气象科研数据服务器。2.2 方法介绍机器学习分类算法有很多21-22,本文用到以下经典分类算法:决策树、SVM、朴素贝叶斯、KNN、集成、人工神经网络。2.2.1 决策树决策树(Decis

10、ion Tree,DT)是在数据挖掘中常用的分类模型,其基本思想是构造一棵可用于预测样本单元所属类别的树。一棵决策树由根结点、内部结点和叶结点组成。根结点包含样本全集,叶结点对应于决策结果,每个内部结点对应于一个属性测试。从根结点到每个叶结点的路径对应了特定的判定测试序列,达到将样本分类的目的23-24。2.2.2 支持向量机(SVM)支持向量机(Support Vector Machine,SVM)是一类可用于分类和回归的有监督机器学习模型,旨在于多维空间中找到一个能将全部样本单元分成两类的最优平面,即超平面,这一平面使两类中距离最近的点的间距尽可能大,在间距边界上的点被称为支持向量(sup

11、port vector)25。2.2.3 朴素贝叶斯朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法,应用最为广泛。先通过已给定的训练集,以特征词之间独立作为前提假设,学习从输入到输出的联合概率分布,再基于学习到的模型,输入X求出使得后验概率最大的输出Y26。2.2.4 K近邻(KNN)KNN适用于稀有事件的分类问题,是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一454第4期李细生等:基于机器学习分类算法的臭氧浓度等级预报在长沙的应用个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算

12、法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别27。2.2.5 集成集成学习通过将多个学习器进行结合,获得比单一学习器显著优越的泛化性能28,根据个体学习器的生成方式,目前的集成学习方法大致可分为两大类,即以 Boosting为代表的序列化方法和以 Bagging 和随机森林为代表的并行化方法。Boosting 族最著名的是 AdaBoost,其原理是:(1)先从初始训练集训练一个基学习器,对训练样本分布进行调整,使先前基学习器判断错的训练样本在后续受到更多的关注;(2)基于调整后的样本分布再训练下一个基学习器;(3)如

13、此重复进行,直至基学习器的数目达到预先设定的值 T;(4)最终将 T 个基学习器进行加权结合,建立最终的预测模型27。随机森林(Random Forest,RF)以决策树为基础,进一步在决策树的训练过程中引入随机属性,基本思想是:利用 bootstrap 抽样从原始训练集抽取 n 个样本,每个样本的样本容量与原始训练集一样,对 n 个样本分别建立 n 个决策树模型,得到 n 种分类结果,最后根据投票决定最优分类28。2.2.6 人工神经网络人 工 神 经 网 络(Artificial Neural Networks,ANN)源自对生物神经网络的仿真和模拟。它从信息处理角度对人脑神经元网络进行抽

14、象,建立某种简单模型,按不同的连接方式组成不同的网络,原始样本经输入层进入网络,经若干个隐藏层,通过激活函数输出所属类别29-30。3 3 建立模型建立模型预测标的:长沙市未来4天每天8 h滑动最高浓度等级。依据标准6,划分O3的8 h滑动最大浓度为 5 个等级:0100 g/m3为 1 级(优)、100160g/m3为2级(良)、160215 g/m3为3级(轻度)、215265 g/m3为4级(中度)、265800 g/m3为5级(重度),因为是预测,没有考虑标准中单小时超过某一限值的情况。依据进入模型的特征因子类型和数量,建立四个不同的控制试验模型:试验1:特征因子选取环境观测、气象观测

15、、天气模式预报产品(EC_thin、GRAPES_GFS)、大气成分模式预报产品(华南GRACEs);试验2:特征因子为环境观测、气象观测、天气模式预报产品(EC_thin、GRAPES_GFS);试验3:特征因子为环境观测、气象观测;试验4:检验大气成分模式(华南GRACEs)预报产品的臭氧预报准确度。试验目的:设置试验1的目的是检验气象与环境资料融合、实况与预报资料融合、不同数值预报模式的融合效果,最终建立完美融合各种多源资料并耦合数值预报与机器学习的智能模型。试验2的目的是检验大气成分模式预报产品在模型中的作用和重要性。试验3的目的是检验天气模式预报产品以及大气成分模式预报产品在模型中的

16、作用和重要性,评估在只有实况、无预测数据支持下的模型预测性能。试验 4 的目的是检验华南GRACEs模式本身的臭氧预报准确度。3.1 数据预处理机器学习过程中,特征因子的选择是非常重要的步骤,选到合适的特征,模型的训练就会事半功倍。试验前期,准备的因子数共计471个,为提高模型泛化能力,减少训练时间,防止过拟合和维数灾难,必须对因子数量和质量进行控制。本文采取的筛选方法:(1)通过人工手段对一些因子进行组合和计算,依据经验组合出物理意义明晰且对环境气象影响较大的因子如低层逆温、混合层高度等、扩散指数等;(2)模式预报数据中,一天内不同时次的资料只保留相关性最大的那一个时次,或者计算日均值;(3

17、)最后在python环境中,利用随机森林的sklearn包31,对特征重要性进行排序,选取相对重要的因子。这种方法的基本思路是直接测量每种特征对模型预测准确率的影响,然后重新排列这一列特征值的顺序(或加入噪声),观察模型准确率的变化,对于不重要的特征,这种重排或加噪对模型准确率的影响很小,但是对于重要特征却会极大降低模型的准确率。依据此法剔除数据集中影响较小的特征(阈值设为0.005)。最终模型选取的特征因子数共计56个,其中环境观测因子数7个,气象观测因子数14个,455热 带 气 象 学 报第39卷均为预报日当天的观测均值或累积值;天气数值模式产品因子31个;华南GRACEs模式产品3个。

18、此外因为臭氧的季节性变化特征明显,把所处月份单独作为一个因子引入模型。具体因子名单和重要性见表1。由因子重要性的表格中可得出几点定性分析结论:对臭氧影响最大的因子是34号,即第二天白天的降雨(预报)情况,比当日降雨17号因子更重要,说明降雨对臭氧的生成抑制作用明显或清除臭氧的效率较高;预报日当日的臭氧和PM2.5浓度是很重要的环境观测因子,反应排放情况和大气扩散条件,也体现了污染过程的时序性和前后关联性;风速、相对湿度、温度、日照等气象要素都影响臭氧生成,这些要素当日和第二天的重要性基本相当,说明臭氧生成需要一个相对稳定的温、湿、风和光照的气象环境。3.2模型训练与测试将预处理后的数据引入12

19、个模型,依次使用决策树、SVM、朴素贝叶斯、KNN、集成、人工神经网络方法对数据集进行分类训练,并用测试数据进行测试,本文选取的测试数据时间段为2020年表1因子以及因子的重要性类型环境观测气象观测编号12345678910111213141516171819202122232425262728因子月份AQI_0dPM25_0dPm10_0dCO_0dSO2_0dNO2_0dO38h_0d平均气压_0d平均气温_0d高温_0d低温_0d相对湿度_0d最小湿度_0d总云量_0d能见度_0d降水20_20降水08_08平均风速最大风速最高地面温度日照时数TmaxYB_1dFG6YB_14sCAPE

20、yb_14sPBL_yb_20sKszs_yb_20sLCCyb_14s重要性0.010.0270.040.0060.0210.010.0210.0420.010.0070.020.0130.010.0110.0110.0160.0310.0130.0280.0210.0110.0070.0190.010.0180.0220.0180.005重要性标准化21.80%59.60%87.00%14.00%46.60%21.50%45.50%92.60%21.90%16.20%44.20%27.80%22.10%23.60%24.10%36.10%68.70%27.80%61.30%47.00%23

21、.40%16.10%41.60%21.70%38.80%47.30%39.40%11.60%类型天气数值模式产品华南模式产品编号29303132333435363738394041424344454647484950515253545556因子MSLyb_20sTmaxyb_24TCCyb_14sTCWyb_14sTCWVyb_14s降水yb08_20散度1000_14sPV1000_14sR1000_14s低层逆温08_20sW1000_14sW925_14s24h变压_1D对流降雨8_20GP_RH2M_14sfg1_14sMpv1_1000_14sMpv2_1000_14sPlcl_92

22、5_14sRhcl_925_14sTdpl_1000_14sthse_1000_14sFS_925_14sShear_14sSweat_14sCMAQ_O3_8h_1dCMAQ_O3_max_1dCMAQ_O3_min_1d重要性0.0150.0170.010.010.0170.0460.0210.0250.0290.0160.0150.0080.0120.0280.0140.0220.0140.0310.0070.0310.0180.0070.020.0080.0240.0210.0120.024重要性标准化32.80%38.20%21.30%22.10%36.70%100.00%46.30

23、%55.00%64.50%34.80%32.40%17.40%26.50%62.40%30.50%48.00%29.90%67.50%16.00%67.40%39.30%15.10%43.30%18.00%51.50%45.00%26.40%52.70%456第4期李细生等:基于机器学习分类算法的臭氧浓度等级预报在长沙的应用27月,共计115个测试样本,因为此时间段为上半年长沙臭氧污染较集中的时段,样本涵盖污染等级较多,便于评估模式预测性能。选取测试准确度最高的模型作为最优模型,记录测试结果(见表2)。3.2.1 训练集数据散点图模型训练过程中,发现因变量臭氧浓度与预测因子有一些规律与预报员的

24、一些经验概念不符,比如一般认为平均风速越低,出现臭氧污染的可能性越大,事实上,只有当风速大于1 时,平均风速越低,出现臭氧污染的可能性才越大,而臭氧浓度出现极值的平均风速区间为 12 m/s(图1a),当风速接近0时反而不容易出现极端值,原因可能跟第二个因子低层散度(图1b)有关。臭氧的浓度峰值未出现在低层散度为 0的附近,而是上方,即轻微辐散的环境场更加有利于臭氧的形成,因为轻辐散结构常伴随有下沉气流,利于形成下沉逆温,增加层结稳定性,不利于大气垂直方向的扩散,也即是说,当风速较小时,垂直方向的扩散比水平方向的扩散对臭氧浓度影响更大。此外,臭氧浓度与相对湿度呈负相关(图1c),越干燥的大气环

25、境越易出现臭氧污染,峰值浓度易出现在20%40%的相对湿度区间;臭氧浓度与日最高气温呈正相关(图1d),温度越高越有利于臭氧生成,峰值出现在35 左右。图1实况臭氧浓度与风速(a)、低层散度(b)、相对湿度(c)最高气温(d)散点图3.2.2 测试集数据混淆矩阵实验1是融合多种特征资料的宽神经网络模型,测试准确度81.7%,与试验2相同,高于试验3和试验4分别有12.1%、21.7%,超过同期预报员准确度有 10%左右,基本达到预期目标。从实验 1(1D)的测试混淆矩阵(图 2)来看,对于第 1、2、3类,预 测 查 准 率(PPV)分 别 为 82.9%、82.1%、66.7%,实况和预测均

26、未出现第 4类,说明模型对预测:模型1.2276543210风速/(m/s)100500-50-100低层散度/s-1预测:模型1.22预测:模型1.22预测:模型1.22050100150200臭氧浓度实况/(ug/m3)0501001502001009080706050403020相对湿度/%05010015020005010015020035302520151050最高气温/%臭氧浓度实况/(ug/m3)臭氧浓度实况/(ug/m3)臭氧浓度实况/(ug/m3)457热 带 气 象 学 报第39卷于低等级(1 或 2)的臭氧浓度预报可信度高于80%,对于高等级的预测也基本可用,相信随着今后

27、样本库中高等级训练样本数量的增加,对于这一类样本的识别能力也会随之增强。3.2.3 试验1与试验2测试结果比较试验1和试验2测试准确度相当,同为81.7%,为了进一步分析二者的优劣,绘制预测与实况数据曲线(图3),发现在低等级的预报中,二者性能较好,均超过80%,但试验2对高等级的样本更为敏感,第三类预测查准率75%,高于试验1,不过出现两次第四类空报,因此可以简单的总结为二者对于高等级事件的预测性能一般。解决办法:1、增加高等级样本数量,增强模型识别性能;2、加强高等级臭氧污染的机理分析,组合出更精炼的因子供模型使用。图2试验1测试混淆矩阵(1D)图3试验1与试验2臭氧预测与实况对比3.3

28、试验结果与讨论经统计,总共4个试验4天预测的训练与测试结果见表2,据此可得出以下分析结论。(1)最优模型1D测试准确度为81.7%,高于试验4达21.7%,高于同期预报员准确度10%,第24天的测试准确度分别有81.7%、78.3%、60.9%,基本达到预期设计目标。1234真实类1234真实类PPVFDR1234预测类1234预测类臭氧预测与实况(1D)等级543210浓度/(ug/m3)2502001501005001 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97101105109113实况等级试

29、验1_1D试验2_1D实况浓度458第4期李细生等:基于机器学习分类算法的臭氧浓度等级预报在长沙的应用表2四个控制试验的训练准确度和测试准确度(2)高质量的天气模式产品预测数据对模型贡献大。在只有实况观测,没有高质量的预测数据支持时,模型(试验3)的预报性能下降明显,其前 3天测试准确度与试验 1和试验 2相比相差较大,也说明要做好臭氧浓度预测,准确的天气预测是前提和基础。(3)环境模式对模型的正贡献总体有限。其作用主要体现在第一天和第四天的预测,第一天训练准确度试验1较试验2提高3.6%,测试准确度相同;第四天训练准确度相同,而测试准确度提高8.7%。第二天和第三天的预测,环境模式资料的引入

30、反而导致模型测试准确度降低(分别降低3.4%和2.6%),原因可能是环境模式所使用的天气背景场(GRAPES)与优秀模式 EC_thin 相比准确性稍差,第一天的预测基本可用,而第二、第三天的预测质量下降严重。(4)所有试验模型只有 3天内的预测性能较好。不论是训练准确度还是测试准确度,四个实验中二者都呈逐日下降的趋势(图4),前三天下降较慢,但第4天的测试准确度明显降低,其原因可能是天气过程一般以35天为一周期,3天后天气的不确定性明显增大,臭氧浓度的预报难度陡升,因此第4 d的预测结果只能作为参考。(5)环境模式的准确率有待提高。环境模式(试验4)全年准确度70%左右,测试时段内为60%左

31、右,这个准确度与预报员经验预报基本相当,还有较大提升空间。(6)SVM分类算法表现相对高效和稳定。试验中用到六种经典分类算法,最优模型有神经网络、决策树和SVM等,其中SVM出现7次,神经网络2次,决策树3次;就本次试验而言,可能是样本数量较少的原因,SVM分类算法表现得相对高效和稳定。特征选择1D2D3D4D试验1环境观测 气象观测气象模式 环境模式训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型核函数训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型83.80%不适用81.70%不适用宽神经网络82.10%6878.30%25二次SVM二次79

32、.70%7775.70%28高斯SVM71.80%10760.90%45粗略树试验2环境观测 气象观测气象模式训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型80.20%7581.70%22双层神经网络81.30%7181.70%21高斯SVM高斯79.40%7878.30%25二次SVM71.80%10752.20%55粗略树试验3环境观测气象观测训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型训练准确度总代价测试准确度总代价模型75.5

33、0%9369.60%35粗略树73.40%10167%38二次SVM二次72.60%10461.70%44二次SVM67.00%12551.30%56高斯SVM试验4环境模式全部准确度测试准确度全部准确度测试准确度全部准确度测试准确度全部准确度测试准确度69.02%60%71.05%62.60%67%61.70%65.40%56.50%459热 带 气 象 学 报第39卷4 4 结结论论最优模型1D测试准确度为81.7%,高于试验4达21.7%,高于同期预报员准确度10%,第24天的测试准确度分别有 81.7%、78.3%、60.9%,基本达到预期设计目标。模型三天以内的测试准确度较高,第4天

34、下降较快,其原因可能是天气过程一般以35天为一周期,3天后天气的不确定性明显增大,臭氧浓度的预报难度陡升,因此第4天的预测结果只能作为参考。高质量的天气模式产品预测数据对模型贡献大,环境模式对模型的正贡献总体有限;低等级预测性能较好,高等级预测性能一般。提出解决方案供讨论:增加高等级样本数量,增强模型对此类事件的识别能力;加强高等级臭氧污染的机理分析,组合出更精炼的因子供模型使用。图4四个控制试验的训练准确度(a)和测试准确度(b)参考文献:1 唐文苑,赵春生,耿福海,等.上海地区臭氧周末效应研究J.中国科学:地球科学,2009,39(1):99-105.2 殷永泉,单文坡,纪霞,等.济南大气

35、臭氧浓度变化规律J.环境科学,2006,27(11):2 299-2 302.3 严文莲,刘端阳,康志明,等.江苏臭氧污染特征及其与气象因子的关系J.气象科学,2019,39(4):477-487.4 吴锴,康平,于雷,等.20152016年中国城市臭氧浓度时空变化规律研究J.环境科学学报,2018,38(6):2 179-2 190.5 孙银川,严晓瑜,缑晓辉,等中国典型城市O3与前体物变化特征及相关性研究J环境科学研究,2020,33(1):44-536 环境保护部,GB3095-2012 环境空气质量标准 S.2012.GB3095-2012 Ambient air quality st

36、andards.7 毛敏娟,刘厚通,杜荣光.不同时间尺度下杭州市O3污染特征及控制因素J.环境科学研究,2019,32(11):1 844-1 8518LI Q,GABA M,RUBIN Y,et al.Investigation of ozone deposition to vegetation under warm and dry conditions near the EasternMediterranean coastJ.Science of The Total Environment,2019,658:1 316-1 333.9MONKS P S,ARCHIBALD A T,COLE

37、TTE A,et al.Tropospheric ozone and its precursors from the urban to the global scale from airquality to short-lived climate forcerJ.Atmospheric Chemistry and Physics,2015,15(15):8 889-8 97310 潘文琪,肖国杰,孟林夕,等.杭州市臭氧污染特征及其气象成因分析J.成都信息工程大学学报,2019,34(6):664-670.11 谈建国,陆国良,耿福海,等.上海夏季近地面臭氧浓度及其相关气象因子的分析和预报J.热

38、带气象学报,2007,23(5):515-520.12 周广强,瞿元昊,余钟奇.长江三角洲城市臭氧数值预报与释用J.中国环境科学,2021,41(1):28-36.13 HAN W,BORMANN N.Constrained adaptive bias correction for satellite radiance assimilation in the ECMWF 4D-Var systemR./ECMWF Technical Memorandum.Reading:ECMWF,2016.14 沈学顺,陈起英,孙健,等.中央气象台全球中期数值预报业务系统的发展J.气象,2021,47(6)

39、:645-654.15 李江涛,安兴琴,李清勇,等.基于XGBoost算法的WRF-Chem模式优化模拟J.中国环境科学,2021,41(12):5 457-5 466.16 王茜,吴剑斌,林燕芬 CMAQ 模式及其修正技术在上海市 PM2.5预报中的应用检验J.环境科学学报,2015,35(6):1 651-1 656.17 邓雪娇,邓涛,麦博儒,等.华南区域大气成分业务数值预报GRACEs模式系统J.热带气象学报,2016,32(6):900-907.18 李婷苑,吴乃庚,邓雪娇,等.华南区域大气成分数值模式GRACEs预报性能评估J.热带气象学报,2021,37(2):207-217.1

40、9 谢建新,宿彦京,薛德桢,等.机器学习在材料研发中的应用J.金属学报,2021,57(11):1 343-1 361.20 李雪清,郑航,刘悦忆,等.基于多源数据机器学习的区域水质预测方法研究J.水利水电技术(中英文),2021,52(11):152-163.21 周志华.机器学习M.北京:清华大学出版社,2016.22 周志华.集成学习:基础与算法M.李楠译.北京:电子工业出版社,2020.23 GAO W,TIE X,XU J,et al.Long-term trend of O3in a mega City(Shanghai),China:Characteristics,causes,

41、and interactions withprecursors J.Science of the Total Environment,2017,603-604:425-433.1D2D3D4D1D2D3D4D试验1试验2试验3试验4试验1试验2试验3试验4训练准确度测试准确度(a)(a)1.00.80.60.40.20.01.00.80.60.40.20.0460第4期李细生等:基于机器学习分类算法的臭氧浓度等级预报在长沙的应用24 GU Y,LI K,XU J,et al.Observed dependence of surface ozone on increasing temperatu

42、re in Shanghai,China J.Atmos Environ,2020,221:117108.25 苏筱倩,安俊琳,张玉欣,等.支持向量机回归在臭氧预报中的应用J.环境科学,2019,40(4):1 697-1 704.26 HARRINGTON P.机器学习实战M.北京:人民邮电出版社,2013.27 李航.统计学习方法(第2版)M.北京:清华大学出版社,2019.28 MOHAMMADI S,AMIRI F.An efficient hybrid self-learning intrusion detection system based on neural networksJ

43、.Inter-national Journalof Computational Intelligence and Applications,2019,18:1950001.29 唐科,秦敏,赵星,等.基于 Stacking 集成学习模型的气态亚硝酸预测J.中国环境科学,2020,40(2):582-590.30 KABACOFFR I.R 语言实战M.王小宁,刘撷芯,黄俊文,等,译.北京:人民邮电出版社,2016.31 吕红燕,冯倩.随机森林算法研究综述J.河北省科学院学报,2019,36(3):37-41.PREDICTION PRACTICE OF OZONE CONCENTRATION

44、LEVEL BASED ONMACHINE LEARNING CLASSIFICATION ALGORITHMLI Xisheng1,ZHANG Hua2,YU Yuzhi3,DENG Xinlin2,XIE Qianwen2,SHU Lei2(1.Hunan Province Key Laboratory for Meteorological Disaster Prevention and Mitigation,Changsha 410118,China;2.Zhuzhou Meteorological Bureau,Zhuzhou,Hunan 412003,China;3.Changsha

45、 Meteorological Bureau,Changsha 410017,China)Abstract:In order to accurately predict the ozone concentration level,this paper used the EC_ Thin globalweather model products,global numerical weather prediction products from GRAPES_GFS,which are thegraphs independently developed in China,and South Chi

46、na GRACEs atmospheric composition modeloutput products to integrate meteorological and environmental observation data,and used six machinelearning intelligent algorithms to build a hybrid model that coupled numerical prediction models withmachine learning,in order to give full play to the advantages

47、,complementarity and synergy of numericalprediction and machine learning intelligent algorithms,and improve the accuracy of ozone concentrationlevel prediction by leaps and bounds.Four control experiments were set up for which differentcharacteristic products were selected and the classical classifi

48、cation algorithm of machine learning wasused to classify and predict the ozone concentration level in Changsha for any four days to come.Themodel output with the highest test accuracy was taken as the result statistics.It is found that the testaccuracy of the optimal model in 1 to 4 days is 81.7%,81

49、.7%,78.3%and 60.9%respectively,which ismuch higher than the atmospheric composition model prediction and forecaster experience,and achievesthe expected design goal.The contribution of high-quality weather model products to product quality islarge while that of atmospheric composition model products

50、is limited.The prediction performance of themodel within 3 days is good,and low-level prediction performance is good,and high-level predictionperformance is general.The following solutions for discussion are proposed:the number of high-levelsamples is to be increased;the recognition ability of the m

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服