资源描述
计量地理学电子教案3-8
第八节 趋势面预测方法
趋势面分析(trend-surface analysis),是利用数学趋势面模拟和地理系统要素在空间上的分布及变化趋势的一种数学方法。它实质上是通过回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。 趋势面分析方法常常被用来模拟资源、环境、人口及经济要素在空间上的分布规律,它在空间分析方面具有重要的应用价值。本节将简要介绍趋势面分析的一般原理及应用实例。
一、趋势面分析的一般原理
趋势面是一种抽象的数学曲面,它抽象并过滤掉了一些局域随机因素的影响,使地理要素的空间分布规律明显化。可见,所谓空间趋势面并不是地理要素的实际分布面,而是一个模拟地理要素空间分布的近似曲面。因此,通常把实际的地理曲面分解为趋势面和剩余面两部分,前者反映地理要素的宏观分布规律,属于确定性因素作用的结果;而后者则对应于微观局域,是随机因素影响的结果。趋势面分析的一个基本要求,就是所选择的趋势面模型应该使其剩余值最小,而趋势值最大,这样拟合度精度才能达到足够的准确性。空间趋势面分析,正是从地理要素分布的实际数据中分解出趋势值和剩余值,从而揭示地理要素空间分布的趋势与规律。
地理要素的空间分布曲面大多都是非线性的,寻找这些非线性曲面的数学方程式比较困难,通常可采取用多项式的形式进行拟合。
1.趋势面模型的建立。设某地理要素的实际观测数据为zi (xi,yi)(i=1,2,…,n),
趋势值拟合值为(xi,yi),则有
zi (xi,yi) = (xi,yi) +єi (1)
式中:єi 为剩余值(残差值)。
显然,当(xi,yi) 在空间上变动时,公式(1)就刻画了地理要素的实际分布曲面、趋势面和剩余面之间的互动关系。
趋势面分析的核心就是从实际观测值出发推算趋势面,一般采用回归分析方法,使得残差平方和
Q =
估计趋势面参数。这就是在最小二乘法意义下的趋势曲面拟合。
用来计算趋势面的数学方程式有多项式函数和傅立叶级数,其中最常用的是多项式函数形式。因为任何一个函数都可以在一个适当的范围内用多项式来逼近,而且调整多项式的次数,可使所求的回归方程适合实际问题的需要。
多项式趋势面的形式为
一次趋势面模型:
z = a0 +a1x+a2y (2)
二次趋势面模型:
z = a0 +a1x+a2y+a3x2+a4xy+a5y2 (3)
三次趋势面模型:
z=a0+a1x+a2y+a3x2+a4xy+a5y2 +a6x3+a7x2y+a6xy2+a9y3 (4)
……
a0 +a1x+a2y
a0 +a1x+a2y+a3x2+a4xy+a5y2
a0+a1x+a2y+a3x2+a4xy+a5y2 +a6x3+a7x2y+a6xy2+a9y3
a0+a1x+a2y+a3x2+a4xy+a5y2 +a6x3+a7x2y+a8xy2+a9y3+
a10x4+a11x3y+a12x2y2+a13xy3+ a14+ y4
在实际的空间趋势面模拟中,按照对事物认识由易到难的规律,应首先考虑用公式(2)表达的倾斜面去拟合,然后再用公式(3)描述的二次抛物趋势面去模拟,如果还不能满足研究要求,则需选用三次趋势面、四次趋势面甚至更高层次趋势面进行拟合。
2.趋势面模型的参数估计。
趋势面模型参数的估计实际上就是对非线性回归模型回归系数的估计。根据高斯—马尔可夫定理,最小二乘法给出了多项式系数的最佳线性无偏估计值,这些估计值能使残差平方和达到最小。趋势面参数的估计就是根据观测值zi, xi ,yi (i=1,2,…,n)确定多项式的系数a0,a1,… ,ap,使残差平方和最小。
若令
x1=x, x2 = y,
x3 = x2, x4 = xy, x5 = y2 ,…则
= a0+a1 x1+… +ap xp
这样就将多项式回归(非线性模型)模型转化为多元线性回归模型,其残差平方和为
Q==(3.8.5)
根据最小二乘法的原理,求Q对a0,a1,… ,ap的偏导数,并令其等于0,则得正规方程组
经化简,可得
(6)
式中:a0,a1,… ,ap为p+1个未知量。
用矩阵形式表示
X =
A = Z =
则方程组(3.8.6)式变为
XTXA = XTZ (7)
对于二元二次多项式有
z = a0 +a1x+a2y+a3x2+a4xy+a5y2
其正规方程组为(XTXA = XTZ)
··
=·
由公式(7)求解,可以得到
A=(XTX)-1XTZ (8)
注意:在多元线性回归中,Ab=B A=XTX B=XTY b=A-1B 而在趋势面分析中,A=[a0,a1,a2,…ap]T是待估参数。
A=(XTX)-1XTZ
2.趋势面模型的适度检验
趋势面分析拟合程度与回归模型的效果直接相关。因此,对趋势面分析进行适度性检验是一个关系到趋势面能否在实际研究中加以应用的关键问题,也是趋势面分析中不可缺少的重要环节。这可以通过趋势面适度的拟合度R2检验、F检验以及逐次检验来完成。
1.趋势面拟合度的R2检验。在趋势面模型的回归参数解出以后,就需要比较一下趋势面与实际面的拟合程度。拟合度系数R2是测定回归模型拟合优度的重要指标。一般用变量z的总离差平方和中的回归平方和所占的比重表示回归模型的拟合优度。
总离差平方和等于回归平方和与剩余平方和之和。即
SST=
=
式中SSD=为剩余平方和:Q,它表示随机因素对z的离差的影响;
SSR=为回归平方和,它表示p个自变量对因变量z的离差的总影响。
SSR越大(或SSD越小)就表示因变量z与自变量x,y的关系越密切,回归的规律性就越强、效果就越好。记
R2 =
显然,R2越大,趋势面的拟合度就越高。
2.趋势面拟合适度的显著性F检验。趋势面适度的F检验,是对趋势面回归模型整体的显著性检验。检验的方法是利用变量z的总离差平方和中剩余平方和与回归平方和的比值,确定变量z与自变量x、y之间的回归关系是否显著。即
F = (F =)
检验的办法是在显著性水平α下,查F分布表得Fα,若计算的F值大于临界值Fα,则认为趋势面方程显著;否则,不显著。
3.趋势面适度的逐次检验。在多项式趋势面分析和检验中,有时需要对相继两个阶次趋势面模型的适度性进行比较,为此需要求出较高次多项式方程的回归平方和与较低次多项式方程的回归平方和之差,将此差除以回归平方和的自由度之差,得出由于多项式次数增高所产生的回归均
表3.7.1多项式趋势面的适度的逐次检验
离差来源
平方和
自由度
均方差
F检验
(K+1)次回归
(K+1)次剩余
K次回归
K次剩余
由K次增高至(K+1)次回归
总离差
SSR(K+1)
SSD(K+1)
SSRK
SSDK
SSR(1)= SSD(K+1)- SSDK
SS T
p
n-p-1
q
n-q-1
p-q
MS R(K+1)= SSR(K+1)/p
MS D(K+1)= SSD(K+1)/( n-p-1)
MS R(K)=SS R(K)/q
MS D(K)=SS D(K)/(n-q-1)
MS R(I)=SS R(I)/(p-q)
MS R(K+1)/MS D(K+1)
MS R(K)/ MS D(K)
MSR(I)/MS D(K+1)
方差,然后将此均方差除以较高次多项式的剩余均方差,得出相继两个阶次趋势面模型的适度性比较检验值F。若所得的F值是显著的,则较高次多项式对回归作出了新贡献,若F值不显著,则较高次多项式对于回归并无新贡献。相应的方差分析表见表3.8.1。
需要注意的是,在实际应用中,往往用次数低的趋势面逼近变化较小的地理要素数据,用次数高的趋势面逼近起伏变化比较复杂的地理要素数据。此数低的趋势面使用起来比较方便,但具体到某点拟合较差;次数较高的趋势面只在观测地点附近较好,而在外推和内插时则效果较差。
三、趋势面分析应用实例
某流域1月份降水量与各观测点的坐标位置数据如表3.8.2所示。下面,我们以降水量为因变量z,地理位置的横坐标和纵坐标分别为自变量x、y进行趋势面分析,并对趋势面方程进行适度F检验。
表3.7 某流域1月份降水量及占观测点的地理位置
序号
降水量Z/mm
横坐标x/104m
纵坐标y/104m
1
2
3
4
5
6
7
8
9
10
11
12
27.6
38.4
24
24.7
32
55.5
40.4
37.5
31
31.7
53
44.9
0
1.1
1.8
2.95
3.4
1.8
0.7
0.2
0.85
1.65
2.65
3.65
1
0.6
0
0
0.2
1.7
1.3
2
3.35
3.15
3.1
2.58
1.建立趋势模型。运用上述介绍的趋势面分析原理,首先采用二次多项式进行趋势面拟合,用最小二乘法求:
A=(XTX)-1XTZ
=()-1
得拟合方程为:
z=27.38525+1.805636x+3.937204y (一次)
z=5.998+17.438x+29.787y-3.558x2+0.357xy-8.070y2 (二次)
( R2 = 0.839, F = 6.236)
再采用三次趋势面进行拟合,用最小二乘法求得拟合方程为
z=-48.810+37.557x+130.130y+8.389x2-33.166xy-62.740y2-4.133x3+6.138x2y+2.566xy2+9.785y3
(R2 = 0.965, F = 6.054)
2.模型检验。包括拟合适度R2检验,显著性F检验和逐次检验。
(1)趋势面适度的R2检验。
根据R2 检验方法计算,结果表明,二次趋势面的判定系数为 R22 = 0.839,三次趋势面的判定系数为R3 2 =0.965,可见二次趋势面回归模型和三次趋势面回归模型的显著性都较高,而且三次趋势面较二次趋势面具有更高的拟合程度。
(2)趋势面适度的F检验。 根据F检验法计算,结果表明,二次趋势面和三次趋势面的F 值分别为 F2 = 6.236和 F3 = 6.054。
在置信水平α =0.05下,查分布表得:
F2α =(5,6)= 4.53; F2 = 6.236
F3α= F0.05(9,4)= 19.4。F3 = 6.054。
显然, F2 >F2α,而F3< F3α,故二次趋势面的回归方程显著而三次趋势面不显著。因此,F检验的结果表明,用二次趋势面进行拟合比较合理。
(3)趋势面适度的逐次检验。在二次和三次趋势面检验中,对两个阶次趋势面模型的适度进行比较,相应的方差分析计算,结果见表3.8.3。
表3.8.3 二次和三次趋势面回归模型的逐次检验方差分析表
离差来源
平方和
自由度
均方差
F检验
3次回归
3次剩余
2次回归
2次剩余
由2次增高至3次回归
总离差
1129.789
41.474
982.244
189.018
147.545
9
12-9-1
5
12-5-1
4
125.532
20.737
196.449
31.503
36.886
6.054
6.23
1.779
125.532=1129/9
20.737=41.474/2
196.449=982.244/5
31.503.=189.018/6
147.55=189.018-41.474
36.886=147.545/4
1.799=36.886/20.737
从二次趋势面增加到三次趋势面,F3→2 = 1.779。在置信水平α = 0.05下,查F分布表得F0.05=6.94, F3→2<F0.05(1.779<6.94),故将趋势面拟合数由二次增加到三次,对于回归方程并无贡献,因而选取二次趋势面比较合适。这也进一步验证了趋势面拟合适度显著性F检验的结论。
(F =)
需要注意的是,在实际应用中,往往用次数低的趋势面逼近变化较小的地理要素数据,用次数高的趋势面逼近起伏变化比较复杂的地理要素数据。次数低的趋势面使用起来比较方便,但具体到某点拟合较差;次数较高的趋势面只在观测地点附近较好,而在外推和内插时则效果较差。
17
展开阅读全文