收藏 分销(赏)

基于大数据技术的雾霾天气预测模型研究.pdf

上传人:自信****多点 文档编号:305122 上传时间:2023-07-31 格式:PDF 页数:7 大小:2.75MB
下载 相关 举报
基于大数据技术的雾霾天气预测模型研究.pdf_第1页
第1页 / 共7页
基于大数据技术的雾霾天气预测模型研究.pdf_第2页
第2页 / 共7页
基于大数据技术的雾霾天气预测模型研究.pdf_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、安徽职业技术学院学报JOURNAL OF ANHUI VOCATIONAL AND TECHNICAL COLLEGE第22卷第1期2023年3月Vol.22 No.1Mar.2023基于大数据技术的雾霾天气预测模型研究张平华1,贾万祥2(1.合肥职业技术学院信息工程与传媒学院,安徽合肥230000;2.万博科技职业学院智能信息学院,安徽合肥230000)摘要:雾霾天气成因复杂,预测较为困难。经深入分析相关技术和文献资料,在大数据技术支持下,将时空维度中已知空气质量数据与气象数据动态集成,构建了一种基于深度神经网络技术在时间维度和空间维度相融合的空气质量预测模型基于深度神经网络的空气质量预测模

2、型。经实验证实,此模型可预测目标站点未来的空气质量状况,且预测结果更加准确,可为环境治理提供理论参考。关键词:大数据;雾霾;空气质量;预测模型;神经网络中图分类号:TP39;TP18;X51文献标识码:A文章编号:16729536(2023)01000706Abstract:The causes of haze weather are complex and difficult to predict.Through in-depth analyses ofrelevant technologies and literature,under the support of big data tec

3、hnology,the known air quality data inthe space-time dimension and meteorological data are dynamically integrated.An air quality prediction model based on the deep neural network technology,which combines the time dimension and the space dimension,is constructed.The experimental results show that the

4、 model can predict the future air quality of the target station,and the prediction results are more accurate,which can provide a theoretical reference for environmental governance.Key words:big data;haze;air quality;prediction model;neural network空气质量的好坏关系人类前途命运,工业的快速发展导致大气中可吸入颗粒物含量大幅上升。据生态环境部发布的 关于

5、深入打好污染防治攻坚战的意见 2021年环境监测行业发展评述和2022年发展展望 及2021年 中国生态环境状况公报1-3显示,2021年全国218个地级及以上城市环境空气质量达标,同比上升 3.5个百分点,121 个 城 市 环 境 空 气 质 量 超 标。PM2.5、PM10、O3、SO2、NO2和CO六项指标年均浓度同比首次全部下降,其中,PM2.5同比下降9.1%,已实收稿日期:20230102基金项目:安徽省高等学校2020年拔尖学科(专业)人才学术资助项目(gxbjZD2020116);合肥职业技术学院人才引进自然科学重点项目“现代网络安全技术及其在校园网络中的研究与应用”(202

6、1KYQDZ009);2022年度安徽省高校自然科学研究项目“基于人工蜂群算法的城市生活垃圾回收物流网络优化设计研究”(2022AH052236);2020年度安徽省高校自然科学研究项目“现代网络安全技术及其在校园网中的研究与应用”(KJ2020A1172)作者简介:张平华(1981),男,汉族,安徽东至人,教授,硕士,研究方向:信息系统与智能计算,网络安全。第22卷安徽职业技术学院学报现六连降;PM2.5和O3浓度连续两年双下降。1 雾霾危害研究世界卫生组织(World Health Organization,WHO)在 2021 年发布的 2021 世界卫生统计报告(World Healt

7、h Statistics 2021)中指出:“空气污染已成人类健康最大环境威胁之一,每分钟有13人死于空气污染”。在气候变化愈发严重的同时,人们对石油、煤等传统能源的严重依赖也在一定程度上加重了环境污染,进一步加剧了气候恶化。研究表明,雾霾主要由火力发电厂、钢铁锻造厂、橡胶(轮胎制造等)厂等高耗能企业在生产过程中产生的粉尘及超细颗粒物的直接排放导致。同时,由于汽车保有量的大幅增加和国家的城镇化的推进,对引发雾霾天气也有一定的影响。为尽快找到以PM2.5和PM10为主要污染物雾霾天气的形成机理和时空变化规律,国内外学者通过大量的研究调查和实验,探索了雾霾的成因与雾霾天气预测技术。任阵海(2008

8、)等4通过技术手段持续对监测到的大气环境监测数据进行深入分析,得出我国大气污染程度呈北高南低之势,首要污染物也由有害气体S02变为可吸入颗粒物 PM10,并画出了全国范围 API 年日均值分布图。崔菲(2016)等5持续多年对山东省泰安市的7个环境监测点进行数据采集,采用插值法分析了污染物在该市的全年时空变化特征。李柞泳(2000)6等建立了基于遗传算法和BP神经网络的大气污染物浓度预测模型,对空气质量进行预测,取得了一定的成果。Peter(2003)等采用粗糙集方法分析了气象雷达数据,提高了数据分析的精准性。Davis(2002)7等研究发现,电力行业和重工业的发展是主导雾霾天气的主要因素。

9、Kavouras(2018)8等研究认为,汽车生产、石油炼治等重型生产制造业和汽车尾气排放等是导致空气污染物中的PM2.5和PM10浓度增加的主因。2 雾霾预测模型2.1 空气质量指数及计算空气质量指数(Air Quality Index,AQI)主要依据SO2、NO2、CO、O3、PM10、PM2.5等六种污染物的实测浓度值,分别按式(1)计算出空气质量分指数(Individual Air Quality Index,IAQI),从各项污染物的 IAQI中选择最大值确定为 AQI(如式(2)所示)。IAQIi=Ci-Ci,jCi,j+1-Ci,j(IAQIi,j+1-IAQIi,j)+IAQ

10、Ii,j(1)其中,IAQIi是第i种污染物的污染分指数;Ci是第i种污染物的浓度值;IAQIi,j是第i种污染物j转折点的污染分项指数值;Ci,j是第j转折点上i种污染物(对应于IAQIi,j)浓度值;Ci,j+1是第j+1转折点上i种污染物(对应于IAQIi,j+1)浓度值。AQI=maxIAQIso2,IAQINo2,IAQIo3,IAQIco,IAQIPM2.5,IAQIPM10(2)2.2 建模原理传统的前馈神经网络认为所有的输入都是相互独立的,输出只与当前的输入有关,没有时间序列的概念,而目前通用的空气质量数据均由监测站点实时采集,属于时序数据,空气污染物浓度在气象因素(如风向、风

11、速、晴、雨等)作用下,目标站点或目标城市的空气质量均会受前一段时间的污染物浓度的影响,为了解决该问题,同时也能更加精确地预测空气质量,必须设计一种可以基于之前的序列来进行预测的方法。循环神经网络(Recurrent Neural Network,RNN)中所利用的数据有时间先后顺序,其输出结果不仅能依赖当前的输入,也依赖历史数据的记忆,当前样本受前序样本的影响较大,但不适用于处理时空跨度较长的历史数据。2.2.1 长短期记忆网络模型Hochreiter 和 Schmidhuber 于 1997 年首次提出一种改进后的循环神经网络模型长短期记忆网络9(LSTM,Long Short-Term M

12、emory),可以完美地解决循环神经网络存在的长期时间依赖问题。LSTM适合用于处理和预测与时间序列相关的非确定性多项式(Non-deterministic Polynomial,NP)问题。长短期记忆网络是一种典型的含有智能网络单元10(也称记忆单元、LSTM区块)的时间循环神经网络,其单元可以有选择的记忆不定时间长度的数值。LSTM网络的循环体结构由8输入门(记忆门)、输出门和遗忘门组成11。LSTM模型结构如图1所示,三个控制门之间的关系如图2所示。图2控制门关系图LSTM通过输入门(记忆门)对输入的数据进行学习和记忆,以达到对信息的预测。遗忘门通过读取前置神经元的输出信息(ht-1)和

13、当前时刻的输入信息(xt)来决定记忆多少前置神经元的单元状态到当前神经元的单元状态中12,遗忘门的计算过程如式(3)所示。输入门用于控制数据输入到当前状态,输出门控制当前时刻的输出13。输出门根据式(7)和式(8)计算并输出结果ht,同时将t时刻的结果ht作为 t+1时刻的输入信号。ot=(wo ht-1,xt+bo)(3)其中,=11=e-x输出(0,1);ht-1表示上一时刻的输出信息。LSTM的工作流程:首先,遗忘门选取一部分前置单元状态保留到当前单元状态中;然后,输入门通过式(4)和式(5)计算将Ct,并将结果作为新的候选值,以决定有多少输入信息可以保存在单元状态Ct中;最后,将前置单

14、元状态通过权值ft、it和新的候选值Ct,利用式(6)更新当前单元状态(依据遗忘门和记忆输出值更新细胞状态)。Ct=tanh(Wc ht-1,xt+bc)(4)it=(Wi ht-1,xt+bi)(5)Ct=ftCt-1+it Ct(6)Ot=(Wo ht-1,xt+bo)(7)ht=Ottanh(Ct)(8)2.2.2 空气质量预测模型框架空气质量受多种气象因素影响,在时间上,空气污染物是动态的,存在一定的延续性;在空间上,城市间的空气污染物的浓度相互影响,具有扩散性。在多因素的干扰下,传统空气质量预测模型很难建立空气质量污染物大数据间的时空关联,不易通过大数据技术对历史数据进行学习,难以寻

15、找出影响空气污染的规律和污染发生的概率。鉴于以上原因,通过对分析大量的文献研究,提出了一种建立在时间和空间两个维度上的空气质量预测模型基于深度神经网络的空气质量预测模型(Air Quality Prediction Model based onDeep Neural Network,AQP-DNN 模型)。AQP-DNN模型主要利用LSTM这种特殊的CNN技术,通过对上一阶段的空气污染物在时空上的历史数据进行深度学习与处理,模型动态集成时空预测值,构建时空预测聚合器等来解决传统方法对空气质量预测不足的问题。AQP-DNN预测模型的系统总体架构如图3所示。张平华,等:基于大数据技术的雾霾天气预测

16、模型研究图1长短期记忆网络结构图9第22卷安徽职业技术学院学报图3空气质量预测模型架构图在模型中分别构造时间预测模块和空间预测模块。时间预测模块用于收集并处理监测站点依时间顺序监测到的数据,提取气象数据特征、空气质量污染物特征 AQI值和时间数据特征进行拼合,采用LSTM模型构建出时间预测器模型对拼合数据进行回归预测训练,以预测未来时间段的空气污染物AQI值。在风向、风速、降水等气象因素的影响下,监测站的空气污染物会向周边其它城市或监测站扩散,从而影响周边城市、站点。在此采用DNN来构造空间预测模块,将本地监测站的空气质量数据和周边站点采集到的历史空气污染物数据作为空间预测模块的输入数据对目标

17、站点空气质量进行预测。2.2.3 预测结果集成原理为进一步提高预测精度,在预测模型中利用LSTM时间预测器和DNN空间预测器重新构造一个预测聚合器。首先,将LSTM构造的时间预测器预测的结果与通过DNN空间预测器预测的结果进行深度融合组合成一个新的预测聚合器向量,利用新的特征向量创建一棵分类回归决策树。然后,依据目标站点的各项空气质量数据和风向、风速、降水等气象数据14,对时间预测器和空间预测器赋予不同的权重,预测聚合器通过对输入的时间预测器和空间预测器的结果数据进行聚合操作生成新的特征向量。最后,模型通过学习前序的样本数据对决策树进行优化和分支修剪,选择误差最小的优化子树,预测出相对准确的A

18、QI值。3 预测模型构建研究3.1 基于大数据技术的空气质量预测模型依据图3所示的预测模型架构图和神经网络相关理论,为了保证预测的准确性和有效性,利用被预测对象的特征数据作为输入值,建立了一种基于DNN和LSTM的空气质量预测模型。在模型中,具有时间序列的AQI历史特征数据和气象特征数据作为LSTM神经网络输入的数据对空气质量的预测,将目标站点的周边站点收集的AQI特征数据和气象数据作为DNN网络的输入进行目标站点的空气质量的预测。为了保证预测结果更加真实有效,将DNN与LSTM预测后的数据使用分类回归树创建的预测聚合器对数据进行加权平均聚合,输出预测的最终结果,达到预测的目标。3.2 构建时

19、间预测器模型目前空气质量监测站收集的数据均以小时为单位进行收集整理,故模型中的时间预测器的特征数据选取以当前预测时间点为起点T,选取当前T时间前6小时作为历史时序数据分别记为:T,T-1,T-2,T-3,T-4,T-5,构造一个 6 维的 AQI历史数据子特征,AQI特征数据集记作A,时间序列特征记作 T。将时间序列 AQI 数据集作为LSTM 模型时间预测器的输入(如图 4 所示),LSTM 模型输出未来 6 小时内的预测空气质量AQI值。图4LSTM时间预测器模型10LSTM模型选取由Python编写的支持序列化模型的开源人工神经网络库 Keras 工具来构建LSTM 时间预测器,LSTM

20、 包含输入层、隐藏层和输出层。构建LSTM基本步骤:(1)顺序初始化神经网络;(2)添加一个紧密连接的神经网络层;(3)添加长短时记忆层(LSTM);(4)为了防止过拟合,在添加dropout层时选择参数为0.2,即dropout(0.2)。LSTM 模 型 优 化15参 数 设 置 及 关 键 代 码如下:仿真实验中选取可增加稀疏性和可以更快、更有效克服梯度消失问题的ReLU函数来替代收敛速度较低的 sigmoid 和 tanh函数;选择 adam 优化器编译模型来更新神经网络的权重,并使用均方误差MSE(mean_squarred_error)来计算误差;训练数据集(Training se

21、t)选择数据总集的 60%,验证集(Validation Set)选取数据总集的 20%,测试集(Test Set)选取数据总集的20%,以评价模型的效果;模型训练一次的样本数目(批处理尺寸,Batchsize)大小设置为300;模型训练次数(Epoch)为100;输入和输出均为6维的空气质量AQI值。相关参数设置如下:regressor=Sequential()regressor.add(LSTM(units=6,return_sequences=True,input_shape=(X_train.shape 1,1)regressor.add(Dropout(0.2)regressor.a

22、dd(LSTM(units=6,return_sequences=True)regressor.add(Dropout(0.2)regressor.add(Dense(units=1)pile(optimizer=adam,loss=mean_squared_error)regressor.fit(X_train,y_train,epochs=100,batch_size=300)3.3 构建空间预测器模型以目标站点(站点分布统计如表1所示)为中心16,将距离目标站点方圆120km之内的范围由近及远等距分划3个区域,按东南西北4个方向划分4个方位区域(如图5所示),分别收集所有区域内监测站的空

23、气质量数据的AQI值(每个方向上3个连续的扇区内的 AQI值的平均值)。由于时空和气象对不同区域内的空气质量的影响可能有较大的区别,为有效减少影响,利用人工神经网络对目标站点周边的指定范围内4个区域的AQI数据进行学习,并为此4个不同方位的区域赋予不同的权值,对目标站点周边的监测站收集的空气质量空间特征数据进行拟合,并将拟合后的数据与气象特征数据和时间特征数据作为整体输入数据,再传入空间预测器中,具体构造如式(9)。周边空气质量AQI数据(A)、气象特征数据(M)、天气预报特征数据(F)和时间特征数据(T)均选取当前时间前6小时监测,输出结果为6小时内每个小时的空气质量数据。fAT-5AT-4

24、ATMT-5MT-4MTTT-5TT-4ATFT-5FT-4FT=()AT+1AT+2AT+3AT+4AT+5AT+6(9)张平华,等:基于大数据技术的雾霾天气预测模型研究表1空间预测模型合肥市站点示例表监测点编码1270A1271A1272A1273A1274A1275A1276A1277A1278A1279A3464A监测点名称明珠广场三里街琥珀山庄董铺水库(对照点)长江中路庐阳区瑶海区包河区滨湖新区高新区高教基地城市合肥合肥合肥合肥合肥合肥合肥合肥合肥合肥合肥经度117.1959117.3072117.2588117.1604117.25117.266117.336117.3027117

25、.2776117.1318117.3803纬度31.784831.876431.870731.905231.857131.943631.858631.796431.738531.840331.9147对照点NNNYNNNNNNN11第22卷安徽职业技术学院学报图5目标站点周边空间区域划分4 模型训练分析根据以上模型的建立与分析,对预测模型经多次模拟训练后,优化模型的各项参数设置,将目标站点周边站点AQI数据集(采用SO2、NO2、CO、O3、PM10、PM2.5等6种污染物浓度计算所得AQI数据)、时间数据集和气象数据集(包含ID、时间、天气、风速、风向等8个属性)按参数设置要求分别代入模型中

26、训练,基于深度学习算法 Keras得到未来6小时的AQI预测值。为更好地评判和预测模型的准确度,验证模型的正确性和有效性,模型训练中采用ACC(Accuracy)对预测结果和实际监测数据进行比较,以衡量模型预测的准确率;采用平均绝对误差(Mean Absolute Error,MAE)来评价模型的预测精确度。表2对比了LSTM模型、空间预测器模型和AQP-DNN 模型对空气质量预测结果的 ACC 和MAE值的关系,从中可以明确地看出 AQP-DNN模型最终的输出结果比单一的时间预测模型和空间预测模型更加接近于真实的AQI值,即预测的精准度更高。表2模型预测精准度对比精准度ACCMAELSTM模

27、型78.95%75.2%空间预测器模型21.2632.12AQP-DNN模型81.46%19.585 结语AQP-DNN模型虽然在一定程度上可以较为准确地预测雾霾天气,具有一定有参考价值,但在收敛时间等方面也存在不足。在随后的研究中,将重点研讨引起雾霾天气的其他成因与规律,构建更加高效的预测模型,提升模型的收敛速度和精确度,对雾霾天气做出客观高效的评估与预测。参考文献:1 中国共产党第十八届中央委员会.中国共产党第十八届中央委员会第五次全体会议公报 EB/OL.北京:国务院新闻办公室网站(2015-10-30)2022-12-29.http:/ 国务院研究室编写组.十二届全国人大三次会议 政府

28、工作报告 辅导读本 M.北京:中国言实出版社,2015:10-31.3 生态环境部.2021年中国生态环境状况公报(摘录)R.环境保护,2022,50(12):61-74.4 任阵海,苏福庆,陈朝晖,等.夏秋季节天气系统对边界层内大气中PM_(10)浓度分布和演变过程的影响J.大气科学,2008(4):741-751.5 崔菲.泰安市建成区大气污染物时空变化特征及其相关性分析研究 D.泰安:山东农业大学,2016:15-59.6 李祚泳,彭荔红.基于遗传算法优化的大气质量评价的污染危害指数公式 J.中国环境科学,2000(4):313-317.7 Davis Devra L and Bell

29、Michelle L and Fletcher Tony.A look back at the London smog of 1952 and the halfcentury since.J.Environmental health perspectives,2002,110(12):A734-5.8 Wang Q,Wang J,He M Z,et al.A county-level estimate of PM2.5 related chronic mortality risk in Chinabased on multi-model exposure dataJ.Environmentin

30、ternational,2018,110(Jan.):105-112.9 Hochreiter S,Schmidhuber J.Long Short-Term MemoryJ.Neural Computation,1997,9(8):1735-1780.10杨斌清,刘文福.ARIMA时间序列模型在铝价格预测中的研究 J.轻金属,2018,475(5):4-8.11贾潍佳.近岸海域叶绿素a浓度时空分布预测方法研究 D.威海:山东大学,2020:39-44.12蔡韬.基于城市大数据的细粒度空气质量预测与推测模型研究及应用 D.南京:南京邮电大学,2020:12-15.(下转第20页)12第22卷安

31、徽职业技术学院学报山东省菏泽市牡丹区人民法院(2021)鲁 1702刑初410号刑事判决书。贵州省玉屏侗族自治县人民法院(2021)黔 0622刑初48号刑事判决书。j云南省维西傈僳族自治县人民法院(2021)云 3423刑初30号刑事判决书。k“侵入”的含义可参照非法侵入住宅罪的相关解释。“软暴力”意见 第七项规定:以“软暴力”手段非法进入或者滞留他人住宅的,应当认定为 刑法 第二百四十五条规定的“非法侵入他人住宅”,同时符合其他犯罪构成要件的,应当以非法侵入住宅罪定罪处罚。l江苏省泰兴市人民法院(2021)苏1283刑初180号刑事判决书。m辽宁省朝阳市中级人民法院(2020)辽13刑终3

32、27号刑事裁决书。n甘肃省秦安县人民法院(2019)甘0522刑初104号刑事判决书。o关于办理寻衅滋事刑事案件适用法律若干问题的解释 第一条第三款:行为人因婚恋、家庭、邻里、债务等纠纷,实施殴打、辱骂、恐吓他人或者损毁、占用他人财物等行为的,一般不认定“寻衅滋事”,但经有关部门批评制止或者处理处罚后,继续实施前列行为,破坏社会秩序的除外。p安徽省阜阳市中级人民法院(2021)皖12刑终271号刑事判决书。参考文献:1 刘艳红.积极预防性刑法观的中国实践发展以刑法修正案(十一)为视角的分析 J.比较法研究,2021(1):68.2 周光权.论立法活跃时代刑法教义学的应变 J.法治现代化研究,2

33、021(5):5.3 张婧.2018年犯罪学研究进展、热点与前沿 J.犯罪与改造研究,2019(3):15-20.4 张明楷.妥善对待维权行为,避免助长违法犯罪 J.中国刑事法杂志,2020,1(5):6-7.5 张 明 楷.实 质 解 释 论 的 再 提 倡J.中 国 法 学,2010(4):49.6 周光权.刑法各论(第四版)M.北京:中国人民大学出版社,2021:425-426.7 王红举.非法催收贷款行为的刑法规制 J.法学杂志,2019(3):65.8 劳东燕.刑法修正案(十一)条文要义:修正提示、适用指南与案例解读 M.北京:中国法制出版社,2021:252.9 张明楷.催收非法债

34、务罪的另类解释 J.政法论坛,2022,40(2):4-6.10张明楷.寻衅滋事罪探究 J.政治与法律,2008(1):86-87.11何荣功.刑法适用方法论 M.北京:北京大学出版社,2022:113.12张平寿.催收非法债务罪的限缩适用与路径选择 J.中国刑事法杂志,2022,10(2):12.13张明楷.刑法学(第六版)M.北京:法律出版社,2021:43.14周光权.论通过增设轻罪实现妥当的处罚积极刑法立法观的再阐释 J.比较法研究,2020(6):44-45.15马克昌,莫洪宪.刑法(第四版)M.北京:高等教育出版社,2017:403.16陈山.非法拘禁罪研究 M.北京:中国社会科学

35、出版社,2009:42-44.17刘宪权.最新刑法修正案司法适用疑难问题研究 J.法学杂志,2021(9):7-8.(责任编辑:袁铁琪)13孙宇航.基于 GRU 神经网络的横波速度预测方法A.中国石油学会石油物探专业委员会、中国地球物理学会勘探地球物理委员会.中国石油学会2019年物探技术研讨会论文集 C/中国石油学会石油物探专业委员会、中国地球物理学会勘探地球物理委员会:石油地球物理勘探编辑部,2019:4.14葛难难.城市空气污染物的时空相关性研究 D.桂林:广西师范大学,2019:15-52.15张利军.时空混合模型在空气质量预测中的应用研究 D.徐州:中国矿业大学,2021:28-46.16卢露.哈尔滨淘汰锅炉排放清单编制及基于数值模型减排效果评估 D.哈尔滨:哈尔滨工业大学,2021:15-17.(责任编辑:杨阳)(上接第12页)20

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服