收藏 分销(赏)

基于支持向量机改进的克里金插值法——以汾渭平原PM(2.5)数据为例.pdf

上传人:自信****多点 文档编号:649499 上传时间:2024-01-23 格式:PDF 页数:10 大小:2.98MB
下载 相关 举报
基于支持向量机改进的克里金插值法——以汾渭平原PM(2.5)数据为例.pdf_第1页
第1页 / 共10页
基于支持向量机改进的克里金插值法——以汾渭平原PM(2.5)数据为例.pdf_第2页
第2页 / 共10页
基于支持向量机改进的克里金插值法——以汾渭平原PM(2.5)数据为例.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、克里金插值法根据待测点与已知点的空间位置关系以及研究区域内变量的空间相关性为已知点赋予不同权重,再通过加权求和的方式得到待测点的估计值,为待测点提供最佳的线性无偏估计。变异函数描述了区域化变量的空间变化信息,常用的理论变异函数包括球状模型、指数模型和高斯模型,然而以上模型形式较为固定且选择较为主观,可能无法准确反映数据波动趋势。基于此,提出引入支持向量机作为新的变异函数对克里金方法进行改进。使用汾渭平原 PM2.5浓度数据对改进前后的克里金插值法进行效果对比。结果表明:支持向量机能够拟合出变异函数的变化趋势,改进后的克里金插值精度优于改进前的克里金插值精度,因此支持向量机改进的克里金插值法是一

2、种可选的克里金方法。关键词 克里金插值;支持向量机(SVM);PM2.5;汾渭平原中图法分类号 X513;文献标志码 AImproved Kriging Interpolation Based on Support Vector Machine:A Case Study on the PM2.5Data of Fenwei PlainZHOU Ying-ying,ZHANG Hui-guo,HU Xi-jian(School of Mathematics and Systems Sciences,Xinjiang University,Urumqi 830017,China)Abstract

3、The Kriging interpolation method assigns different weights to the known points according to the spatial position relation-ship between the points to be measured and the spatial correlation of the variables in the study area,and then obtains the estimatedvalue of the points to be measured by weighted

4、 summation,so as to provide the best linear unbiased estimation of the points to be meas-ured.Variogram describes the spatial variation information of regionalized variables,and commonly used theoretical variograms includespherical models,exponential models,and Gaussian models,but the above model fo

5、rms are more fixed and the selection is more sub-jective,which may not accurately reflect the data fluctuation trend.Based on this,it was proposed to introduce a support vector ma-chine as a new variogram to improve the kriging method.The PM2.5concentration data of the Fenwei Plain was used to compa

6、red theeffects of Kriging interpolation before and after improvement.The results show that the support vector machine can fit the variation trendof the variogram,the improved Kriging interpolation accuracy is better than the Kriging interpolation accuracy before the improvement,so the improved Krigi

7、ng interpolation method of the support vector machine is an optional Kriging method.Keywords Kriging interpolation;support vector machine(SVM);PM2.5;Fenwei Plain 空间插值方法是利用已知点间属性变量的相关信息对待测点的变量值进行有效估计的方法。现有的空间插值方法种类较多,包括泰森多边形法、反距离插值法、样条函数法、趋势分析法、克里金插值法等。与其他插值方法相比,克里金插值法既考虑了各点间的空间位置关系,又考虑了已知点间属性变量的空间自相

8、关关系1,插值结果更符合研究区域内属性变量的变化规律2。克里金方法已广泛应用于多个领域。张浙等3、郭晗等4使用克里金插值技术探究土壤重金属污染分布规律,并对其进行污染来源分析,为后续土壤重金属防控和修复提供科学依据。曹凯鑫等5采用多种插值法对北京市 PM2.5缺失数据进行插值补充,结果表明,与其他插值方法相比,克里金方法能够降低预测误差,为北京市 PM2.5的相关研究工作提供可靠信息。陈夏威等6使用克里金插值法对珠三投稿网址:角大米含铅量进行空间分布研究和预测,并将结论推广到其他食品污染领域,为卫生监管提供科学依据。张智璇等7使用克里金方法探究城市规划布局对 PM2.5的影响程度,为城市合理规

9、划提供有效建议。柴炳阳等8使用多种插值方法对冲击矿压进行空间预警,结果表明,克里金方法生成的空间预警云图在内容丰富度和区域特征体现方面均优于其他插值方法。在使用克里金方法进行插值计算的过程中,理论变异函数的选择决定了后续插值效果,常用的理论变异函数包括球状模型、指数模型和高斯模型,但在实际应用时,理论变异函数模型的选择往往取决于研究者对研究对象背景的了解程度。随着克里金方法在各领域的广泛应用,学者们根据研究问题的实际状况,从不同角度对克里金方法提出改进措施。在传统数学方面,针对多项式回归方法在变异函数参数计算过程中可能出现负值的情况,王仁铎等9提出了加权多项式拟合法。李玲等10提出了线性规划法

10、。赵英文等11提出使用非线性加权总体最小二乘法估计参数,然而以上方法计算过程较为烦琐,且只强调前几个点的重要性,可能会导致对后面点的拟合出现大的偏差。在进化计算法的方面,人工蜂群法12、粒子群算法13-14、遗传算法15-16等被广泛应用于变异函数参数寻优过程,以上方法虽然提高了克里金方法的拟合精度,但在计算过程中可能陷入局部最优解。王金鑫等17利用八叉树修正待插值点的邻域搜索范围。于广婷等18对克里金方法进行空间变异修正,但这两种方法多应用于矿区等复杂地形中。以上众多方法均是对已有的理论变异函数进行参数估计方法改进,未对变异函数自身结构进行优化,然而现实数据复杂多样,已有的理论变异函数模型形

11、式较为固定,无法根据实际数据进行灵活变换。传统克里金方法的插值效果会因理论变异函数模型和参数估计方法的不同而有较大的差异,这意味着研究者对研究对象和克里金理论方法的了解程度会对插值结果造成主观性的影响。因此可尝试引入新模型拟合实验变异函数波动状况,实现变异函数模型种类上的创新,增加克里金方法在插值方面的灵活性和适用性。支持向量机(supportvector machine,SVM)是一种典型的机器学习方法,可用于对小样本数据,对数据分布无特殊要求,且结果稳健性较好19。基于此,可使用 SVM 改进传统的克里金方法,将 SVM 视为一种新的理论变异函数模型,将该新模型应用到汾渭平原 2020 年

12、地面监测站点的 PM2.5 浓度数据,分析该地区 PM2.5 浓度时空变化特征,并结合汾渭平原特殊的地貌特征为当地环境保护工作提出建议。1 模型与方法1.1 反距离权重插值法原理概述反距离权重插值法是一种简单插值技术,该方法根据已知点与待插值点间距离的远近程度,对各已知点赋予不同的权重,通过加权求和的方式得到待插值点属性变量的估计值,其表达式为Z(m0)=ni=1aiZ(mi)(1)式(1)中:Z(m0)为反距离权重插值法对待插值点m0处属性变量 Z(m0)的估计值;Z(mi)为属性变量Z(m)在空间位置 mi处的样本点的真实值;n 为已知点的个数;ai为反距离权重插值法下 Z(mi)的权重系

13、数,反映已知点 mi处的属性变量对待插值点 m0处的属性变量预测值的影响程度,ai的计算公式为ai=1dini=11di(2)式(2)中:di为已知点 mi到待插值点 m0之间的距离,一般通过欧式距离公式进行计算。1.2 普通克里金插值法原理概述普通克里金插值法是一种有效的插值技术,其不仅考虑待插值点与样本点位置关系,还引入半变异函数来衡量变量间的空间相关性。Z(m0)=ni=1iZ(mi)(3)式(3)中:i为权重系数。式(3)和式(1)的区别在于,二者的权重系数计算方式不同,式(1)中的权重系数 ai是通过距离计算出的,而式(2)中的权重系数 i则与半变异函数有关。所谓半变异函数,其定义是

14、空间位置 mi和 mi+h 处的样本点所对应的属性变量 Z(m)之差的方差的 1/2,因此又称为半方差函数。对于离散的样本点,其实验半变异函数(h)的计算公式为(h)=12N(h)N(h)i=1Z(mi)-Z(mi+h)2(4)式(4)中:h 为两样本点间的距离;N(h)为与样本点 mi相距 h 的点的个数;Z(mi)和 Z(mi+h)分别为在位置 mi和 mi+h 处的样本点对应的属性变量Z(m)的观测值。克里金插值法认为空间距离 h 和其所对的实验变异函数(h)之间存在着函数关系。克里金方法67501科 学 技 术 与 工 程Science Technology and Engineeri

15、ng2023,23(24)投稿网址:中常用来拟合二者关系的模型及其具体函数表达形式如下。(1)球状模型:(h)=0,h=0C0+C3h2a-h32a3(),0 a(5)(2)指数模型:(h)=0,h=0C0+C(1-e-ha),h 0(6)(3)高斯模型:(h)=0,h=0C0+C(1-e-h2a2),h 0(7)式中:C0、C 和 a 为待估参数。克里金方法的假设条件为属性变量 Z(m)满足二阶平稳假设,即EZ(m)=AVarZ(m)=2CovZ(m),Z(m+h)=Cov(h)(8)式(8)中:EZ(m)和 Var Z(m)分别为属性变量 Z(m)的 期 望 和 方 差,A 和 2均 为

16、常 数。Cov Z(m),Z(m+h)为相距为 h 的两个属性变量之间的协方差,其数值只与两变量的距离有关,与具体位置无关。在利用克里金方法插值时,插值结果需满足无偏性和方差最小两个条件。首先,对于无偏性的要求,结合二阶平稳假设条件可得EZ(m0)-Z(m0)=Eni=1iZ(mi)-Z(m0)=Ani=1i-A=0(9)ni=1i=1(10)根据半变异函数定义,用(mi,mj)表示位于点 mi和 mj处的属性变量的半变异函数,其公式可表示为(mi,mj)=12EZ(mi)-Z(mj)2=VarZ(m)-12Cov(mi,mj)(11)对于方差最小问题,其对应的表达式为minVarZ(m0)-

17、Z(m0)(12)为保证式(12)的求解结果满足无偏性要求,需将式(10)作为约束条件,即s.t.ni=1i-1=0(13)采用拉格朗日乘子法对式(12)求解得minVarZ(m0)-Z(m0)+2(ni=1i-1)(14)式(14)中:为拉格朗日乘子。结合式(11)对式(14)求解,可得nj=1j(mi,mj)+=(mi,m0)(15)式中:(mi,mj)为位于已知点 mi和已知点 mj处的属性变量的半变异函数;(mi,m0)为已知点 mi和待插值点 m0处的属性变量的半变异函数。通过以上推导结果,可以计算出空间权重系数 1,2,n,并 将 其 代 入 式(3)中 求 解 出Z(m0)。1.

18、3 支持向量机回归算法原理构造样本集(x1,y1),(x2,y2),(xn,yn),xi Rd,yi R,i=1,2,n,构造支持向量机回归函数 f(x)=T(x)+b,其中,为权值系数列向量,(x)为将输入数据从低维空间向高维空间的映射的函数20,b 为偏移常量。引入合适的间距、惩罚参数 C1和损失函数(z),此时,SVM 对应的优化问题可表示为min122+C1ni=1(zi)(16)式(16)中:(z)为 不敏感损失函数,其表达式为(z)=0,|z|z|-,其他(17)式(17)中:z=f(x)-y。引入松弛变量 i和 i,则式(16)可表示为min,b,i,i122+C1ni=1(i+

19、i)s.t.f(xi)-yi+iyi-f(xi)+i,i0,i0;i=1,2,n(18)对优化问题式(18)采用拉格朗日乘子法进行求解,得min122+C1ni=1(i+i)-ni=1(ii+ii)+ni=1if(xi)-yi-i+ni=1iyi-f(xi)-i(19)式(19)中:i、i、i、i为拉格朗日乘子。775012023,23(24)周莹莹,等:基于支持向量机改进的克里金插值法 以汾渭平原 PM2.5数据为例投稿网址:对式(19)进行求解并对其对偶变换得到min12ni=1nj=1(i-i)(j-j)(xi)T(xj)-ni=1yi(i-i)+ni=1(i+i)(20)s.t.ni=

20、1(i-i)=0,0 i,i C1(21)引入核函数 K(xi,xj)=(xi)T(xj)表示高维空间的内积值,则式(20)可表示为min12ni=1nj=1(i-i)(j-j)K(xi,xj)-ni=1yi(i-i)+ni=1(i+i)(22)s.t.ni=1(i-i)=0,0 i,i C1(23)对式(22)求解得到最终的支持向量机回归函数为f(x)=ni=1(i-i)K(xi,x)+b(24)支持向量机中的核函数有多种,其中高斯径向基(RBF)核应用广泛,因此本研究将选择 rbf 核作为核函数。高斯径向基(RBF)核的表达式为K(xi,xj)=exp(-xi-xj2),0(25)式(25

21、)中:为核参数。1.4 基于支持向量机改进的克里金插值方法原理使用 SVM 拟合样本点间的距离 h 与实验半变异函数(h)的函数关系时,将距离 h 看作输入变量,(h)看作输出变量,此时的数据集可表示为 h1,(h1),h2,(h2),hm,(hm),其中 m为将所有样本点分组后要拟合的实验半变异函数的个数。根据1.2 节中支持向量机原理,将数据集输入后,通过输入的数据确定支持向量机中的未知参数 C1、和 的具体数值,采用网格搜索算法寻找各未知参数的解,根据求得的结果构造决策函数为(h)=ni=1(i-i)K(hi,h)+b(26)然后根据式(15)求解出空间权重系数并将其代入式(3)中求得待

22、插值点的估计值。克里金插值法的流程图如图 1 所示。具体操作步骤如下。步骤 1 计算各点之间距离。根据两点间距离公式计算出所有样本点两两之间的距离。步骤 2 对距离分组。将距离按照从小到大的图 1 克里金插值法的流程图Fig.1 Flow chart of Kriging interpolation method顺序进行排序,并选取合理的组距 h 将距离分成m 组。步骤 3 计算各组实验变异函数值。计算分组后各组的空间距离 hi,可选择每组左、右组距的均值来表示,(hi)为根据式(4)计算出的第 i 组的实验 变 异 函 数 值,最 终 得 到 m 组 点 对 h1,(h1),h2,(h2),

23、hm,(hm)。步骤 4拟合理论变异函数模型。使用 SVM对步骤 3 中 得 到 的 点 对 h1,(h1),h2,(h2),hm,(hm)进行参数拟合,得到SVM 拟合出的理论变异函数模型。步骤 5 计算各样本点理论变异函数值。将空间距离 hi代入步骤 4 得到的理论半变异函数模型中求出在该模型下其对应的理论变异函数值(hi),基于式(10)和式(15),求出权重系数 1,2,n。步骤 6 计算待插值点的属性变量值。根据步骤 5 中得到的各点权重值,利用式(3)可计算出待插值点 m0的估计值 Z(m0)。1.5 拟合效果检验为检验不同插值方法的拟合效果,选用均方根误差(root mean s

24、quared error,RMSE)和平均绝对误差(mean absolute error,MAE)作为衡量模型插值效果的精度指标,其中,RMSE 衡量了估计值与真实值之间的偏差,MAE 衡量了估计值的总体误差情况,二者计算结果值越接近于 0,说明模型插值估计结果越接近于真实值,模型插值效果越好,反之说明模型插值效果差。RMSE=1nni=1Z(mi)-Z(mi)2(27)87501科 学 技 术 与 工 程Science Technology and Engineering2023,23(24)投稿网址:MAE=1nni=1Z(mi)-Z(mi)(28)式中:n 为待估点的总个数;Z(mi)

25、为通过插值方法得到的点 mi处属性变量的估计值;Z(mi)点 mi处属性变量的真实值。2 实验结果与分析2.1 研究区域状况汾渭平原是中国第四大平原,也是黄河中游地区最大的冲积平原21,由陕西、山西和河南三省相邻的11 个城市所构成。汾渭平原 PM2.5污染问题比较严重,被列为空气污染重点防控区域22。因此,正确探索出汾渭平原 PM2.5的时空变化特征将对后期环境保护进度安排及相关预警工作提供极大帮助。2.2 数据获取使用的高程数据来自中国国科学院地理科学与资源研究所(https:/),原始数据分辨率为 250 m,城市 PM2.5监测站点数据为从汾渭平原 11 个城市(吕梁市、晋中市、运城市

26、、临汾市、洛阳市、三门峡市、铜川市、渭南市、西安市、宝鸡市、咸阳市)所有站点中筛选出的 59 个有效站点测得的 PM2.5浓度逐时数据,数据来源为中国环境监测总站(http:/ Python 编程,计算出每个监测站点的日均值数据,然后整合成各站点月平均数据、各城市月平均数据和汾渭平原的月度数据,这些数据将在后续研究中用到。所用地图来源为标准地图服务系统(http:/,审图号:GS(2019)1822 号)。首先利用 Arc-gis10.7 根据汾渭平原地图来掩膜选取其对用的高程数据范围,绘制出汾渭平原地势图如图 2 所示。各监测站点分布如图 3 所示。图 2 汾渭平原地形图Fig.2 Topo

27、graphic map of Fenwei Plain图 3 汾渭平原各城市空气监测站点分布图Fig.3 Distribution diagram of air monitoringstations in cities of Fenwei Plain2.3 汾渭平原 PM2.5浓度时间变化特征根据整合得到的汾渭平原月度数据,描绘出汾渭平原在不同月份对应的 PM2.5浓度波动状况,结果如图 4 所示。可以看出,汾渭平原 PM2.5浓度随着月份的变化呈现出先下降后上升的 U 型趋势,其中39 月 PM2.5浓度波动幅度较小,其余月份波动幅度较大,出现这种情况的原因主要在于当气温较低,汾渭平原自身产

28、业结构偏重,能源结构偏煤,当该地区气候比较寒冷时,低温会造成机动车发动机燃料不完全燃烧,机动车尾气排放增加,观察图 1 中汾渭平原地形条件发现,其内部山地、盆地多,不利于空气流通,污染物不易扩散,这些都会造成空气中 PM2.5浓度较高,而当 39 月气温升高时,居民停止使用取暖设备,同时期汾渭平原沙尘天气较多,降水相对频繁,植物相较于冬季茂盛,有利于 PM2.5的扩散和清除,这些因素均会使得同期汾渭平原整体 PM2.5浓度有所下降。由于汾渭平原月度 PM2.5浓度值在不同月份波动状况有明显的差别,因此为保证对汾渭平原 PM2.5图 4 汾渭平原 PM2.5浓度波动图Fig.4 Fluctuat

29、ion of PM2.5concentration in Fenwei Plain975012023,23(24)周莹莹,等:基于支持向量机改进的克里金插值法 以汾渭平原 PM2.5数据为例投稿网址:浓度波动状况研究结果的可靠性,选择 1 月、4 月、8月和 11 月为例作为研究的时间范围。根据汾渭平原各城市月度 PM2.5浓度值平均数据,统计出各城市的 PM2.5在以上 4 个月的变化状况,结果如图 5 所示。可以看出,1 月时,除了吕梁和铜川外,其余城市月平均 PM2.5浓度均超过100 g/m3,其中该月遭受污染最严重的城市是临汾市,浓度达到 158.321 0g/m3,浓度最低的城市为

30、吕梁市,浓度为 78.109 8g/m3,汾渭平原整体污染严重。4 月各城市 PM2.5浓度相较于 1 月有了显著地降低,浓度值均低于 50g/m3,运城市作为该月 PM2.5浓度最高的城市,其浓度值为46.519 7 g/m3,PM2.5浓度最低的城市为吕梁,浓度为 27.671 3 g/m3。8 月时各城市 PM2.5浓度 达 到 4 个 月 的 最 低 值 状 态,浓 度 均 低 于30 g/m3。11 月各城市 PM2.5浓度再次上升,主要波动范围为 60 80 g/m3,该月洛阳市 PM2.5浓度较高,达到 76.639 2 g/m3。图 5 不同月份各城市 PM2.5波动状况Fig

31、.5 PM2.5fluctuations in various cities in different months2.4 结果分析由于各月 PM2.5浓度插值分析流程大致相似,因此,主要以 1 月 PM2.5浓度数据为例展示改进后的克里金插值方法与普通克里金插值方法的效果。从收集到的汾渭平原各监测站点 2020 年PM2.5浓度数据中提取出 1 月份对应的数据。为检验该数据是否适用于克里金方法,首先需要对数据进行检验。克里金方法要求数据正态分布,常见的判断数据是否服从正态性的方法有很多,包括正态 QQ(Quantile-Quantile)图法、K-S(Kolmogor-ov-Smirnov)

32、检验和 S-W(Shapiro-Wilk)检验。由于所收集到的数据点为 59 个,而 S-W 检验适用于小样本数据的正态性检验,因此选择S-W的结果作为数据是否服从正态性的判断指标。通过检验发现,S-W 检 验 的 显 著 性 P 值 为 0.982,远 大 于0.05,说明数据满足正态分布,可以做克里金方法进行插值操作。为得到该月份更精确的实验半变异函数值,按照克里金方法的计算步骤,首先利用欧式距离式分别计算出样本点两两之间的距离,然后按照从小到大的方式对距离排序,并将这些数据分为 8 组,通过式(4)计算出这 8 组数据对应的实验变异函数值,绘制出实验变异函数点的波动情况,其散点分布状况如

33、图 6 所示。为了比较改进后的克里金方法和普通克里金方法在变异函数拟合方面的效果,分别使用不同的变异函数模型对以上散点图进行曲线拟合,其中改进后的克里金方法的变异函数模型为 SVM,为保证结果的客观性,普通克里金的变异函数模型选择球状模型、指数模型和高斯模型,其表达式分别为式(5)、式(6)和式(7)所示。SVM 的核参数、惩罚参数和松弛变量的是通过网格搜索算法寻找出合适的数值,最终 SVM 的核参数 为0.051,惩罚参数C1为 95,间距 为 0.01,普通变异函数模型参数值如表 1 所示,各模型对实验变异函数的拟合效果如图 7 所示。通过观察图 7 中各模型曲线的波动趋势发现,SVM 模

34、型的曲线波动状况更加贴近半变异函数点的分布特点,尤其是随着滞后距离的增大,SVM 模型所拟合出的半变异函数值与实验半方差函数值更加接近,这主要是因为 SVM 模型可通过调整相关参数使得所构造的曲线更加符合数据本身的特点,而普通克里金的变异函数模型形式较为固定,且根据相关理论可知,其拟合时只是确定了几个固定的图 6 实验变异函数散点分布Fig.6 Scatter distribution of the experimentalvariation function表 1 传统克里金方法变异函数参数值Table 1 Variation function parameter values oftrad

35、itional Kriging method变异函数类型C0Ca指数模型0713.165 4113 918.3高斯模型58.694 98501.315 1472 385.18球状模型0520.802 6136 020.208501科 学 技 术 与 工 程Science Technology and Engineering2023,23(24)投稿网址:参数,未考虑到数据在细节上的波动情况,而变异函数的拟合状况会通过影响权重系数值影响最终的空间插值效果。利用选取的参数,根据交叉验证的方法分别计算出各样本点的拟合值并根据式(27)和式(28)计图 7 不同模型的变异函数曲线拟合图Fig.7 Fi

36、ts of semi-variant function curves for different models算出各模型相应的误差估计值,结果如表 2 所示。从表2 的结果中发现,普通克里金方法和改进克里金方法均优于反距离权重插值法,在普通克里金方法中,指数模型的拟合效果最好,而用 SVM 改进后克里金方法的精确度相较于普通克里金方法(指数模型),在 RMSE 和 MAE 分别降低了0.152 44 和0.252 529,模型的插值结果精度有了一定程度的提高。为进一步探究改进不同插值方法的预测结果与实际值数据的相关关系,绘制出各方法下插值结果与实际值之间的关系图,如图 8 所示。可以看出,表

37、2 1 月份模型插值结果精度Table 2 Accuracy of model interpolationresults in January插值方法变异函数类型RMSEMAE反距离权重插值法8.179 2446.209 021指数模型7.744 9246.038 781普通克里金高斯模型9.012 8937.423 558球状模型7.846 0016.080 281改进克里金SVM 模型7.592 4845.786 252k 为斜率图 8 各站点实际值与预测值关系图Fig.8 Plot of the actual values and predicted values of each sit

38、e185012023,23(24)周莹莹,等:基于支持向量机改进的克里金插值法 以汾渭平原 PM2.5数据为例投稿网址:所提出的改进方法能够改善传统的克里金方法中的削弱效应,改进方法预测的数值更接近实际数据,这说明本研究提出的新方法相较于传统的方法有一定程度的改进。综合来看,相较于传统的克里金插值法,所提出的改进方法在半变异函数拟合情况和模型插值结果精度方面均有一定程度的提高,另外该方法能够改善普通克里金的削弱效应,使预测结果更加符合实际数据分布情况,因此,所提出的方法具有一定的可靠性和优越性。同样的方法对 4 月、8 月和 11 月汾渭平原PM2.5浓度数据进行空间插值精度预测。表 3 反映

39、了不同方法对汾渭平原 4 月、8 月和 11 月样本点的插值结果精度,通过比较各表中 RMSE 和 MAE的结果值发现,用 SVM 改进的克里金模型得到的RMSE 和 MAE 都比普通克里金方法和反距离权重插值法小,说明通过该方法得到的预测值更接近实际值。3 讨论3.1 汾渭平原 PM2.5时空分布特征为便于探究汾渭平原 PM2.5时空分布状况,将该地区按照地理位置划分为 4 个区域,分别为北部地区(吕梁、晋中)、中部地区(临汾、运城)、西部地区(宝鸡、咸阳、西安、铜川、渭南)和南部地区(三门峡、洛阳),各地区 PM2.5时空分布状况如表 4 和表 5所示。观察两表发现,在整体空间波动状况上,

40、汾渭平原中部、西部和南部地区污染情况严重,北部地区污染较轻;在时间变化上,1 月汾渭平原污染情况最严重,主要污染区域集中在中部和西部两个地区,其中属于中部地区的临汾市和运城市的 PM2.5浓度高于当月 75%的城市,西部地区中渭南市、西安市和咸阳市三市的 PM2.5浓度也高于 1 月汾渭平原平均值(117.051 3 g/m3),以上两个高污染区域也会影响周边城市的环境。4 月和 8 月汾渭表 3 各模型不同月份插值结果精度Table 3 Accuracy of different models interpolation results in different months插值方法变异函数

41、类型4 月RMSEMAE8 月RMSEMAE11 月RMSEMAE反距离权重插值法6.929 7125.231 5333.070 3732.387 83811.452 2108.598 272指数模型3.979 3183.322 9572.146 7501.613 4735.181 2694.132 353普通克里金高斯模型3.894 9683.236 7602.275 3561.727 8965.357 2604.362 960球状模型3.974 9033.321 7822.281 3271.723 8225.148 3374.114 452改进克里金SVM 模型3.873 4363.232

42、 6702.110 0441.575 6655.118 1824.047 161表 4 汾渭平原各城市不同月份 PM2.5浓度Table 4 PM2.5concentration in different months in various cities of Fenwei Plain地理位置城市PM2.5浓度/(g m-3)1 月4 月8 月11 月北部地区吕梁78.109 827.671 320.466 540.835 1晋中101.467 231.142 923.816 254.928 3中部地区临汾158.321 034.998 925.008 553.330 2运城130.800 1

43、46.519 726.280 461.521 5西部地区宝鸡113.757 436.349 119.183 469.827 8咸阳139.229 436.311 122.805 669.316 0西安130.527 439.085 721.980 170.879 5铜川91.400 032.888 119.816 863.175 4渭南123.596 538.768 921.240 275.880 2南部地区三门峡115.865 041.423 221.924 362.750 5洛阳112.442 940.536 621.957 176.639 2表 5 汾渭平原各区域不同月份 PM2.5浓度

44、Table 5 PM2.5concentration in different months in different regions of the Fenwei Plain地理位置PM2.5浓度/(g m-3)1 月4 月8 月11 月均值北部地区89.788 529.407 122.141 347.881 747.304 7中部地区144.560 540.759 325.644 557.425 867.097 5西部地区119.702 236.680 621.005 269.815 861.800 9南部地区114.154 040.979 921.940 769.694 861.692 3

45、均值117.051 336.956 722.682 961.204 528501科 学 技 术 与 工 程Science Technology and Engineering2023,23(24)投稿网址:平原各城市 PM2.5浓度相较于 1 月有了显著降低,中部地区和南部地区为当月 PM2.5浓度偏高的地区。11 月汾渭平原 PM2.5浓度再次上升,西部和南部地区各城市的 PM2.5浓度均高于当月均值。3.2 汾渭平原地理特征对 PM2.5的影响汾渭平原不同地区受污染程度不同,中部和西部城市为同时期所有城市中污染比较严重的区域,而各地地形条件对污染物的扩散有着重要影响23。通过图 2 发现,

46、汾渭平原内部地形复杂,包括平原、盆地和山地等,四周均有高山环绕,这导致汾渭平原内部风速、降水量相对降低,加速产生逆温层效应,PM2.5难以扩散。关中盆地和临汾盆地四周环山,中间平川24,盆地内空气流动性弱,污染物扩散效果较差,加之这些地区工业和交通污染物排放严重,导致当地 PM2.5浓度处于高水平,运城处于运城盆地,虽然地势比较平坦,但由于运城处于汾渭平原进风口端,因此该地区容易受到外来污染物的影响,晋中、吕梁和铜川的地形以山区为主,地形比较闭塞,人口聚集密度较小,污染物排放强度低,PM2.5浓度相较于同时期其他区域小,三门峡地势西南高、东北低,与渭南通过秦岭和中条山夹成的峡谷相连,在大气传输

47、的作用下该地区 PM2.5浓度在一定程度上受到渭南 PM2.5的影响,洛阳总体地势平坦,当地空气污染物容易扩散,PM2.5浓度相对较低。因 此 以 上 分 析 对 决 策 者 根 据 各 地 区PM2.5时空分布特征以及地形特点进行环境治理工作有参考意义。4 结论提出利用支持向量机对克里金方法进行改进,该方法不仅保留了克里金插值法在插值过程综合考虑了空间中各研究点的位置关系和相关关系,同时,通过引入支持向量机作为新的理论变异函数,克服了传统克里金插值法在插值过程中理论变异函数及参数估计方法上的主观性,提高模型的插值效果。将新方法应用到汾渭平原 PM2.5数据的实际研究中,通过具体分析得出以下结论。(1)使用不同的理论变异函数模型拟合实验变异函数点,结果显示,支持向量机模型对实验变异函数点的拟合效果最好,更能体现出实验变异函数的波动趋势。(2)采用反距离权重插值法、传统的克里金插值方法和支持向量机改进后的克里金方法对汾渭平原各监测点 PM2.5浓度进行插值估计,并分别与实际数据进行对比,结果显示支持向量机改进后的克里金方法估计效果更优,体现了新方法的有效性。(3)通过交叉验证,改进后的克

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服