收藏 分销(赏)

基于小样本数据的空气质量指数适应性建模研究.pdf

上传人:自信****多点 文档编号:2356826 上传时间:2024-05-28 格式:PDF 页数:5 大小:1.42MB
下载 相关 举报
基于小样本数据的空气质量指数适应性建模研究.pdf_第1页
第1页 / 共5页
基于小样本数据的空气质量指数适应性建模研究.pdf_第2页
第2页 / 共5页
基于小样本数据的空气质量指数适应性建模研究.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 年月J o u r n a l o fG r e e nS c i e n c ea n dT e c h n o l o g y第 卷第 期收稿日期:基金项目:四川 省 电 化 教 育 馆 年 度 科 研 项 目(编 号:川 教 馆 );泸 州 职 业 教 育 研 究 中 心 年 度 研 究 课 题(编 号:L Z J F B );泸州职业技术学院 年度院级科研项目(编号:K B );泸州职业技术学院 年度教改项目(编号:J G )作者简介:张延利(),男,副教授,主要从事应用概率统计及数据建模研究.基基于于小小样样本本数数据据的的空空气气质质量量指指数数适适应应性性建建模模研研究究张延利

2、(泸州职业技术学院 四川 泸州 )摘要:空气质量指数具有数据波动大、样本数量相对较少、统计特征并非十分明显的特点.基于灰色建模理论,对传统的GM(,)模型建模过程进行改进,得到小样本数据的振荡序列新陈代谢GM(,)模型.该模型既能克服传统GM(,)建模过程数据不能实现更新的弊端,又能对原始数据进行针对性平滑处理,使处理后的数据更加符合GM(,)建模需求.实证得出,GM(,)模型、无偏GM(,)模型、新陈 代谢GM(,)模型、振荡 序列GM(,)模型 的均 方误 差 分别 为:、.结果说明:当数据相对较少时,振荡序列GM(,)模型能有效提升空气质量指数预测精度,其方法是可行的.关键词:空气质量指

3、数;小样本数据;振荡序列;GM(,)模型中图分类号:T V 文献标识码:A文章编号:()A d a p t i v eM o d e l i n go fA i rQ u a l i t yI n d e xB a s e do nS m a l l S a m p l eD a t aZ h a n gY a n l i(L u z h o uV o c a t i o n a la n dT e c h n i c a lC o l l e g e,L u z h o u,S i c h u a n ,C h i n a)A b s t r a c t:T h eAQ Ih a s t h

4、 ec h a r a c t e r i s t i c so f l a r g ed a t a f l u c t u a t i o n,r e l a t i v e l ys m a l l s a m p l es i z e,a n dn o tv e r yo b v i o u ss t a t i s t i c a lc h a r a c t e r i s t i c s B a s e do nt h eg r e y m o d e l i n gt h e o r y,t h et r a d i t i o n a lm o d e l i n gp r

5、o c e s so fGM(,)m o d e l i s i m p r o v e d,a n dt h eo s c i l l a t i n gs e q u e n c em e t a b o l i s m GM(,)m o d e lw i t hs m a l l s a m p l ed a t a i so b t a i n e d T h i sm o d e l c a nn o t o n l yo v e r c o m e t h ed i s a d v a n t a g e so f t h e t r a d i t i o n a lGM(,)m

6、 o d e l i n gp r o c e s sd a t a t h a t c a nn o t b eu p d a t e d,b u t a l s o c a r r yo u t t a r g e t e ds m o o t hp r o c e s s i n go f t h eo r i g i n a ld a t a,s o t h a t t h ep r o c e s s e dd a t a c a nb e t t e rm e e t t h e r e q u i r e m e n t so fGM(,)m o d e l i n g E m

7、p i r i c a l r e s u l t s s h o wt h a t t h em e a ns q u a r e e r r o r o fGM(,)m o d e l,u n b i a s e dGM(,)m o d e l,m e t a b o l i cGM(,)m o d e l a n do s c i l l a t o r ys e q u e n c eGM(,)m o d e l a r e ,a n d r e s p e c t i v e l y I nc o n c l u s i o n,w h e nt h ed a t a i s r e

8、 l a t i v e l ys m a l l,t h eo s c i l l a t i o ns e r i e sGM(,)m o d e l c a ne f f e c t i v e l y i m p r o v e t h eAQ Ip r e d i c t i o na c c u r a c y,a n dt h em e t h o d i s f e a s i b l e K e yw o r d s:a i rq u a l i t y i n d e x;s m a l l s a m p l ed a t a;o s c i l l a t o r ys

9、 e q u e n c e;GM(,)m o d e l 引言空气质量的好坏不仅能反映空气污染程度,也关系到人们的生活质量.大气污染物浓度增高会增加呼吸系统、心血管等的患病风险率,威胁人的身体健康 .近年来,空气污染事件时有发生,公众对空气质量的关注度逐步提升.空气污染的成因来自于不同的影响因素,是环境保护中的一个复杂问题,也是环境治理过程中的棘手问题.空气质量指数(a i rq u a l i t y i n d e x,AQ I)描述了空气清洁或者污染的程度,其研究的重要作用是了解空气质量数据变化,以便评估呼吸几小时或者几天的空气质量 .同时,研究空气质量数据的变化,能为制定环境保护措施

10、和应对重大空气污染问题提供依据.此外,空气质量指数对外发布有利于提高公众对环张延利:基于小样本数据的空气质量指数适应性建模研究环境与安全境质量问题的重视,提升全民保护环境的意识.研究现状目前,许多学者对空气质量影响因素与数据进行分析,空气质量指数建模和预测等方面进行了研究.空气质量影响因素与数据分析方面,王璐对 年兰州地区的AQ I指数、温度、湿度、能见度、风速等气象要素数据利用S P S S软件统计分析.得出甘肃省兰州地区AQ I指数受季节影响波动较大,尤其是冬季时段数值高于其他三季,该结果与冬季兰州地区大规模供暖等原因有关,建议对兰州市燃煤炉进行技术升级与改造.龙晓 琴等对湖南省 个市级城

11、市空气质量指数的分布特征及其与气象因素的关系研究,发现 年湖南省西部和南部地市普遍低于该省东部地市的AQ I值.其中,张家界市和湘西州的AQ I值基本最低,长株潭一带的AQ I值较高.从季节角度对 个城市的AQ I值分析,得出春季和夏季AQ I值最低,冬季AQ I值最低,AQ I值呈现出季节性变化特征.金仁浩等对北京市 年月至 年月每日空气质量和气象指标进行研究,利用相关性分析和回归分析得出PM、S O、NO、C O对PM 浓度有着显著正影响.J e o n g等将季节性变化因素作为考虑因素,对气溶胶浓度贡献因素使用简单拟合方法进行预测,其预测结果有较好的准确性.L i等则使用气溶胶光学厚度和

12、气象分析资料对地表PM 浓度作多元线性回归分析,预测结果大多数的百分比误差均在 内.在空气质量指建模预测方面,研究方法有数据模 拟、人 工 智 能 神 经 网 络 方 法、统 计 学 方 法等.数据模拟方法 是利用化学和大气物理等相关知识,模拟空气污染的形成和扩散过程进行预测空气质量,该方法计算速度快,但是准确性相对较低.随着大数据应用的到来,基于空气质量数据的智能化算法也应运而生.路凯丽等 基于卷积神经网络和门控循环单元理论集成建立深度学习模型,该模型中卷积神经网络能提取污染气体浓度和AQ I的时空特征,门控循环单元对时序关系进行建模并完成计算.通过该模型与广义回归神经网络模型、遗传算法优化

13、的B P神经网络模型对AQ I的预测对比分析,得出该模型对AQ I的预测误差最小.为提高神经网络模型对空气质量指数预测精度,胡青等 采用改进粒子群算法来优化B P神经网络,较好地解决了传统B P神经网络在预测AQ I中收敛速 度慢,容 易 出 现 局 部 最 优 的 问题 .同时将混沌映射和优化策略引入到神经网络模型,建立I P S OB P模型来提升算法的收敛速度和全局搜索能力.目前,使用统计学方法对空气质量指数的建模预测分析较为普遍.统计学建模是基于数理统计原理,通过分析数据的特征选择相对合适的模型进行建模分析,其模型建立方式有单一模型和组合模型种.单一模型常用多元线性回归模型、时间序列模

14、型、灰色模型等.黄俊杰等 利用A R I MA模型对黄山空气质量指数进行预测,并对黄山市AQ I随时间变化的规律进行了分析.为提升模型预测精度,组合模型方法使也应用于AQ I预测.孙朝云等为克服单一模型预测过程中出现模型不稳定和泛化能力弱的问题 ,采用逆方差权重分配法对门控循环单元(G RU)模型、双向长短期记忆网 络(B iL S TM)模 型 和 长 短 期 记 忆 网 络(L S TM)模型建立组合模型对空气质量指数预测.结果表明:基于逆方差融合的组合模型,综合了各单一预测模型的优点,有效提高了AQ I预测精度.崔上书等 以湖南省长沙市为研究对象,首先利用主成分分析法提取出影响本地区空气

15、质量的大指标,再利用多元线性回归方法建立空气质量指数与这大指标的多元线性回归模型.该方法把主成分分析与多元线性回归模型结合,提高了预测模型的有效性.另外,就组合方法而言,还可以利用灰色神经网络进行组合.小样本数据建模方法从建模数据量来看,统计学模型主要有大样本数据建模和小样本数据建模.大数据建模中常采用回归模型、B P神经网络模型等,这类建模预测方法存在点不足:大数据建模需要数据量较大,足够多的数据量不容易得到,有时也会出现原始数据中个别或部分数据不够准确,使得建模过程较为困难;因空气质量指数数据变化受外界环境的影响较大,具有一定的随机性,数据统计规律不太明显,模型选择难度变大;在样本数据数量

16、较少的情况下,建立大样本数据模型得到的预测精度难以保障.例如,线性模型主要是对具有线性关系的变量进行建模,数据特征要求较强的线性关系.神经网络模型网络训练时间长,计算量大.灰色GM(,)模型早在 年,邓聚龙教授就提出灰色系统理 年月绿 色 科 技(J o u r n a l o fG r e e nS c i e n c ea n dT e c h n o l o g y)第 期论,该理论经过 多年的发展其预测方法日益完善.其中灰色GM(,)模型是该理论中使用最为广泛的模型之一.该模型对具有单调特征的时间序列数据有良好的模拟能力.为克服大样本数据建模的不足,本文基于小样本振荡序列数据,采用灰色

17、建模方法和数据新陈代谢原理建立空气质量指数模型,用以提高空气质量指数预测精度.设原始数据序列为严格的指数序列,即:x()(k)A ea(k),k,N()相应一次累加生成序列为:x()(k)Aea kea,k,N()得到GM(,)模型参数:BAeaeaeaAeaeaeaAe(N)aeN aea,YnA eaA eaA e(N)a()经过推导可得:auT(BTB)BTYn(ea)eaAea()最终拟合结果为:x()()Ax()(k)A ea(ea)(ea)ea(k),k,n()灰色GM(,)新陈代谢模型 数据新陈代谢过程基于数据新陈代谢原理的灰色GM(,)模型建模过程分为个过程:第一个过程是利用初

18、始数据建立灰色GM(,)模型,得到拟合值序列.将拟合值数据与原始数据比较分析,判定该模型选择是否合适.第二个过程是利用数据新陈代谢方法在数据容量不变的情况下,删除一个最旧的数据同时增加一个最新数据形成数据序列.此过程的数据更新见表.表数据新陈代谢过程m个输入数据个输出数据x,x,xmxmx,x,xm,xmxmxk,xk,xkmxkm 小样本数据的振荡序列适应性建模定义设数据序列为Xx(),x(),x(n)不是严格单调递增或者单调递减则称X为振荡序列.因空气质量指数数据变化受外界环境的影响较大,具有一定的随机性,建模过程中需对原始数据进行预处理.建模步骤()数据加速平移变换.令Mm a xx(k

19、)|k,n,mm i nx(k)|k,n 称TMm为序列X的振幅,x(k)dx(k)(k)T,k,n为加速平移变换,记为D.性质数据序列Xx(),x(),x(n),经加速平移变换后变为一单调递增序列,即XDx()d,x()d,x(n)d 为单调递增序列.()数据p次根式生成变换.设数据XDx()d,x()d,x(n)d,p,则称变换x(k)dpx(k)d,k,n为p次根式生成变换,记为D.()数据新陈代谢建模.设原始序列X()x()(),x()(),x()(n)用X()x()(),x()(),x()(n)建立GM(,)模型.模型效果分析.利用GM(,)建模方法对D进行建模,并拟合数据判定模型效

20、果.对D进行建立GM(,),得到预测值y(n),将x()(n)加入到X()中,删除最久的信息x()(),这个过程称为新陈代谢.再利用X()x()(),x()(n),x()(n)建立的GM(,)模型称为新信息GM(,).利用新陈代谢理论不断更新建模数据X(),再对新数据建立GM(,)模型称基于小样本数据的振荡序列适应性模型.利用该模型计算,最终得到型得到预测值Y(yn,yn,ynm).数据还原.将得到的预测值数据作步骤()与()的逆变换.这里为避免在逆变换过程中造成的数据损失,采用取相应数值直接做方的计算方法.利用第一个预测值与真实值的次方数最为后张延利:基于小样本数据的空气质量指数适应性建模研

21、究环境与安全面每一个数据还原时的次方数,即可依次得到预测值X(xn,xn,xnm).模型实证及方法比较从四川省生态环境厅选取泸州市 年月 日空气质量指数的 个数据作为样本数据,其中前 个数据用于建模,后个数据用于预测分析,具体数据见表.为便于分析各模型的预测效果,分别建立GM(,)模型、无偏GM(,)模型、小样本振荡序列GM(,)模型,进行各模型之间的优势比较.模型选择 灰色GM(,)模型x()()x()()x()(k)e (k),k,()无偏GM(,)模型x()()x()()x()(k)e (k),k,()利用新陈代谢方法,建立第一次数据更新后的GM(,)模型x()()x()()x()(k)

22、e (k),k,()小样本振荡序列GM(,)模型利用光滑比分析得出采用的根式变换为开 次方时,建立的拟合数据效果最好(图).图振荡序列平滑效果 预测比较用均方误差和平均绝对百分比误差,来分析模型预测效果,预测结果及比较见表.MS Ei(yiyi)/n,MA P Ei|(yiyi)/yi|()式()中,yi为真实值,yi为预测值,i,.表各模型预测结果日期(月日)真值GM(,)模型无偏GM(,)模型新陈代谢GM(,)模型振荡序列GM(,)模型 预测精度MS E MA P E 结论从表看出,GM(,)未对原始数据进行预处理而直接建模,预测精度最低;无偏GM(,)对GM(,)模型进行修正,预测精度有

23、所提高;基于新陈代谢原理的GM(,)模型,实现了数据更新,其预测精度优于GM(,)模型;基于小样本数据的振荡序列GM(,)模型实现对数据变换处理,采用新陈代谢方法逐步预测,有效提升了模型预测效果.该模型优势主要表现在:采用的建模样本数量较少,数据容易得到;模型构建简单,避免了繁琐的建模过程,计算速度快;利用新陈代谢原理进行动态预测,保证了数据的及时更新,建模精度较高.参考文献:秦耀辰,谢志祥,李阳大气污染对居民健康影响研究进展J环境科学,():曲玥,曾芳婷,陈风格,等石家庄市儿童呼吸系统疾病空气质量健康指数的构建J环境卫生学杂志,():李梦梅,朱家明,杨光,等西安市环境空气质量评价与预测J贵州

24、师范学院学报,():(下转第 页)张林,等:无定河流域城镇污水处理厂进水水质分析及运行对策建议环境与安全参考文献:M o n t o s s lL,M i l a n iM,V e n t u r e l l iM E c o n m i ca s s e s s m e n to fa ni n t e g r a t e dw a s t et oe n e r g ys y s t e mf o ra nu r b a ns e w a g et r e a t m e n tp l a n t:an u m e r i c a la p p r o a c hJE n e r g y,

25、:B e r t a n z aG,S o r l i n i S,V a c c a r iM I n t e g r a t e dA s s e s s m e n tC h a l l e n g e si nt h e w a t e r,W a s t e w a t e ra n d W a s t e D o m a i n s:C a s eS t u d i e sJ I F A CP a p e r s O n l i n e,():宋连朋,魏连雨,赵乐军,等我国城镇污水处理厂建设运行现状及存在问题分析J给水排水,():刘茜,李佟,于斓,等城镇污水处理厂进水污染物负荷调研

26、分析J给水排水,():孙艳,张逢,胡洪营,等天津市污水处理厂进水水质特征的统计学分析J环境工程学报,():时玉龙,鲍海鹏,李伟,等城镇污水处理厂进水污染物负荷变化规律系统性分析J给水排水,():郭泓利,李鑫玮,任钦毅,等全国典型城市污水处理厂进水水质特征分析J给水排水,():冯叶,杨立中,陈进斌,等废水生物脱氮低温硝化研究进展J水处理技术,():邹吕熙,李怀波,郑凯凯,等太湖流域城镇污水处理厂进水水质特征分析J给水排水,():杨长明,杨阳,王育来,等城镇污水处理厂尾水中氮磷形态及光谱特征分析J中国给水排水,():李激,罗国兵,李冰冰,等城镇污水处理厂一级A标准运行评估与 再 提 标 重 难 点

27、 分 析 J环 境 工 程,():黄天寅,王烽圣,许晓毅,等城镇污水处理厂改良厌氧/缺氧/好氧工艺的两种碳源补充途径脱氮效能比较J环境污染与防治,():韦启信,郑兴灿影响污水生物脱氮能力的关键水质参数及空间分布特征研究J给水排水,():城镇污水处理厂总氮超标逻辑分析方法及应用J环境工程学报,():支丽玲,郑凯凯,王艳,等全流程分析AA O工艺碳源投加减量控制研究J水处理技术,():徐巧,张国生,谭阳,等悬浮填料缺氧成膜过程及其强化TN去除能力J环境工程学报,():商佳吉,洪超,吕劲蘅,等反硝化滤池用于城镇污水处理厂提标改造J中国给水排水,():王刚,李魁晓,许骐,等城镇污水处理厂种除磷方式耦合

28、除磷效果研究J环境污染与防治,():黄筹,王艳,郑凯凯,等城镇污水处理厂除磷影响因素及优化运行研究J环境工程,():黄筹,王艳,郑凯凯,等高排放标准下城镇污水处理厂的提标改造探讨J中国给水排水,():(上接第 页)邹旺,刘军,柳福祥基于灰关联的G OM(p,q)(,)B P神经网络模型及AQ I预 测 J数 学 的 实 践 与 认 识,():王璐兰州市AQ I指数与气象要素相关性研究J化学工程与装备,():龙晓琴,曹珮湖南省 个市级城市空气质量指数的分布特征及其与气象因素的关系研究J农业灾害研究,():金仁浩,曾国静,李盈新,等基于相关分析的北京空气质量影响因素研究J资源节约与环保,():J

29、e o n gJ i,P a r kR,W o oJH,e ta l S o u r c ec o n t r i b u t i o n st oc a r b o n a c e o u sa e r o s o lc o n c e n t r a t i o n si n K o r e aJA t m o s p h e r i cE n v i r o n m e n t,():L iC,H s uNC,T s a ySCAs t u d yo nt h ep o t e n t i a la p p l i c a t i o n so fs a t e l l i t ed a

30、 t ai na i rq u a l i t ym o n i t o r i n ga n df o r e c a s t i n gJA t m o s p h e r i cE n v i r o n m e n t,():杨思琪,赵丽华随机森林算法在城市空气质量预测中的应用J统计与决策,():郑红,程云辉,胡阳生,等基于ML P&S T模型的空气质量预测J应用科学学报,():周飞燕,金林鹏,董军卷积神经网络研究综述J计算机学报,():罗建豪,吴建鑫基于深度卷积特征的细粒度图像分类研究综述J自动化学报,():路凯丽,杨露,李涛基于集成深度学习模型的空气质量指数预测J/O L南京信息工

31、程大学学报(自然科学版)h t t p s:/k n s c n k i n e t/k c m s/d e t a i l/N h t m l 胡青,胡珍,曲润,等基于I P S O B P的空气质量指数预测J西安文理学院学报(自然科学版),():廖庆陵,窦震海,孙锴,等基于自适应粒子群算法优化支持向量机的负荷预测J现代电子技术,():杨小明,崔雪,周斌,等基于粒子群优化支持向量机的短期负荷预测J武汉大学学报(工学版),():陈峰基于C A R T算法的空气质量指数回归预测模型的学习J上饶师范学院学报,():黄俊杰,赵楚波基于A R I MA模型预测黄山空气质量指数J科技视界,():孙朝云,杜耀辉,裴莉莉,等基于逆方差多模型融合的空气质量指数预测方法J环境工程,():崔上书,杨炼,李婷基于主成分分析及多元线性回归的空气质量预测算法研究J科技与创新,():司志娟基于灰色神经网络组合模型的空气质量预测D天津:天津大学,邓 聚 龙灰 色 理 论 基 础 M武 汉:华 中 科 技 大 学 出 版社,张延利,张德生,井霞霞,等基于无偏灰色马尔科夫模型的人民币/美元汇率短期预测模型J陕西科技大学学报(自然科学版),():

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服