资源描述
《计量地理学》
实 验 指 导 书
杨 永 国 编
中国矿业大学资源学院
二零一五年三月
说 明
一、 该指导书所属课程
《计量地理学》
二、 适用专业
人文地理与城乡规划专业。
三、 实验总学时
课内上机实习12学时,可根据需要增开适当的课外机时。
四、 各实验项目名称及学时数
该门课程课内上机总学时12, 具体分配如下:
实验1:地理数据的统计处理 2学时 必做
实验2:回归分析 2学时 必做
实验3:时间序列分析 2学时 必做
实验4:主成分分析 2学时 必做
实验5:空间统计分析 2学时 必做
实验6:线性规划单纯形求解方法 2学时 必做
五、 先修课程
1. 高等数学
2. 线性代数
3. 概率论与数理统计
4. 计算机程序设计语言
实验1:地理数据的统计处理
一、实习目的
通过实验,学生学会使用 EXCEL、SPSS、Matlab 软件对数据作简单的统计处理。掌握这些软件进行统计分析的原理,并进行上机操作。
二、实习内容
地理数据统计整理的基本步骤如下:
①统计分组,就是根据研究目的,按照一定的分组标志将地理数据分成若干组。
②计算各组数据的频数、频率,编制统计分组表。
③作分布图。
实验数据如下:对于黄土高原西部地区某山区县的人工造林地调查数据进行统计整理,步骤如下:
(1)以地块面积作为统计分组标志进行分组;
(2)计算各组数据的频数、频率,编制成如下的统计分组表;
表2.4.1 某县人工造林地面积的统计分组数据
分组
序号
1
2
3
4
5
6
7
8
9
10
11
分组
标志
(0,1]
(1,2]
(2,3]
(3,4]
(4,5]
(5,6]
(6,7]
(7,8]
(8,9]
(9,10]
(10,11)
组 中值
0.5
1.5
2.5
3.5
4.5
5.5
6.5
7.5
8.5
9.5
10. 5
频 数
25
96
136
214
253
286
260
203
154
85
24
频 率
1.44
5.53
7.83
12.33
14.57
16.47
14.98
11.69
8.87
4.90
1.38
向上累计频数
25
121
257
471
724
1 010
1 270
1 473
1 627
1 712
1 736
向下累计频数
1 736
1 711
1 615
1 479
1 265
1 012
726
466
263
109
24
(3)做出频数分布的直方图 :
图2.4.1 频数分布柱状图
(4)将上图各组的频数分布从组中值位置用折线连接起来,得到频数分布的曲线图:
注:上述过程可分别在Excel、SPSS中实现,请自行练习。
三、实习要求
1. 预习实习内容,复习有关讲课内容,事先熟悉实验过程。
2. 自主学习相关统计软件,分别使用这些软件对数据进行处理,观察并分析实验结果。
3. 实习结束,将计算结果存盘,并书写上机实习报告。
实验2:回归分析(2学时)
一、实习目的
通过实验,学生需要了解回归分析方法的原理,掌握回归分析的方法和步骤,能够利用SPSS或Matlab软件实现建立一元线性回归模型、多元线性回归模型以及非线性回归模型。
二、 实习内容
某省降水量(p)看做因变量,维度(y)看做自变量,建立一元线性回归模型描述两变量之间的数量关系。
台站
纬度(y)
降雨量(p)
A1
40.5
48.25
A2
36.6
193.72
A3
35.53
413.94
A4
37.48
358.6
A5
35.43
615.04
A6
33.82
752.42
A7
35.63
435.43
A8
36.57
238.55
A9
39.77
87.85
A10
36.05
316
A11
34.2
503.73
A12
35.38
554.04
A13
35.62
502.07
A14
34
611.78
A15
34.38
603.66
回归分析的步骤如下:
(1)明确变量。明确预测的具体目标,确定了因变量与自变量。
(2)建立回归模型。依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析模型。
(3)进行相关分析。求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。
(4)显著性检验。回归模型建立之后,需要对模型的可信度进行检验,以鉴定模型的质量。线性回归方程的显著性检验借助F检验完成。
实验结果:
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.895a
.800
.785
95.87713
a. 预测变量: (常量), 纬度。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
3838.885
475.118
8.080
.000
纬度
-94.920
13.156
-.895
-7.215
.000
a. 因变量: 降雨量
三. 实验要求
1. 预习实习内容,复习有关讲课内容,事先了解SPSS和Matlab软件的使用。
2. 独立使用相关数据利用软件进行实际操作。
3. 实习结束,将计算结果存盘,并书写上机实习报告。
实验3:时间序列分析
一、实习目的
1、掌握进行时间序列分析的基本原理和应用要点,掌握应用SPSS软件进行时间序列分析的基本方法和步骤;
2、应用SPSS针对具体目标进行时间序列分析;
3、应用Excel进行季节预测。
二、实习内容
(一)时间序列分析的基本原理以及主要方法有:
1.平滑法
时间序列分析的平滑法主要有三类 :
(1)移动平均法
设某一时间序列为 y1,y2,…,yt,则t+1时刻的预测值为
(4.3.13)
式中: 为t点的移动平均值; n称为移动时距。
(2)滑动平均法
其计算公式为
(4.3.14)
式中: 为t点的滑动平均值;l为单侧平滑时距;若l=1,则(4.3.14)式称为三点滑动平均。
(3)指数平滑法
①一次指数平滑
(4.3.17)
α为平滑系数。一般时间序列较平稳,α取值可小一些,一般取α∈(0.05,0.3);若时间序列数据起伏波动比较大,则α应取较大的值,一般取α∈(0.7,0.95)。
②高次指数平滑法
二次指数平滑法的预测公式为
(4.3.18)
三次指数平滑法的预测公式 为
(4.3.19)
(二)利用平滑法进行时间序列分析的实验步骤
(1)移动平均与滑动平均的计算
1、打开SPSS,输入某地区1990-2004年间粮食产量,如下表所示。
年份
粮食产量
三点移动
五点移动
三点滑动
五点滑动
1990
3149.44
1991
3303.66
3154.47
1992
3010.30
3141.19
3242.44
1993
3109.61
3154.47
3253.04
3263.32
1994
3639.21
3141.19
3334.21
3295.88
1995
3253.80
3253.04
3242.44
3453.17
3461.80
1996
3466.50
3334.21
3263.32
3520.07
3618.81
1997
3839.90
3453.17
3295.88
3733.69
3692.89
1998
3894.66
3520.07
3461.80
3914.72
3892.78
1999
4009.61
3733.69
3618.81
4052.51
4019.78
2000
4253.25
3914.72
3692.89
4121.45
4075.78
2001
4101.50
4052.51
3892.78
4158.21
4148.58
2002
4119.88
4121.45
4019.78
4160.01
4227.01
2003
4258.65
4158.21
4075.78
4260.11
2004
4401.79
4160.01
4148.58
2、选择【转换—创建时间序列】,在弹出的对话框中单击【函数】下面的下拉条,选择【prior moving average】方法,在【跨度】中输入3、5,分别求算3点、5点移动平均,选择【centered moving average】,在【跨度】中输入3、5,分别求算3点、5点滑动平均,求得结果如上表所示,对话框如图4-1所示。
图4-1 时间序列对话框设置
(2)应用Excel进行季节预测
1、在Excel中输入如下表所示旅游人数数据。
年份
季度
t
游客人数
1998
1
1
260.00
2
2
375.00
3
3
340.00
4
4
223.00
1999
1
5
275.00
2
6
412.00
3
7
352.00
4
8
231.00
2000
1
9
287.00
2
10
428.00
3
11
364.00
4
12
243.00
2、计算每季度游客人数的3点滑动平均,并使用命令“F3=D3/E3”求出1998年2季度季节性指标,将其复制,求得其他季度的季节性指标。
年份
季度
t
游客人数
三次滑动平均
1998
1
1
260.00
2
2
375.00
325.00
1.1538
3
3
340.00
312.67
1.0874
4
4
223.00
279.33
0.7983
1999
1
5
275.00
303.33
0.9066
2
6
412.00
346.33
1.1896
3
7
352.00
331.67
1.0613
4
8
231.00
290.00
0.7966
2000
1
9
287.00
315.33
0.9101
2
10
428.00
359.67
1.1900
3
11
364.00
345.00
1.0551
4
12
243.00
3、4个季节的季节性指标之和为3.9515,因此其校正系数为4/3.9515=1.01227,据此计算出校正后季节性指标,如下表所示。
季度
1
2
3
4
年份
1998
1.1538
1.0874
0.7983
1999
0.9066
1.1896
1.0613
0.7966
2000
0.9101
1.1900
1.0551
季节性指标
0.9084
1.1778
1.0679
0.7975
3.9515
0.9195
1.1923
1.0810
0.8072
1.01227
4、分别求得游客人数的1次平滑值和2次平滑值,结果如下表所示,其中H3(283)==D3*0.2+0.8*H2=375*0.2+260*0.8=283,I3(264.6)=0.2*H3+0.8*I2=283*0.2+260*0.8,同理可以获得不同季节的1次、2次平滑值,据此求得不同季节的at、bt值。
5、据此,可以算得每1季度的预测游客数。
S1
S2
at
bt
260.00
260.00
260.0000
0.0000
283.00
264.60
301.4000
4.6000
294.40
270.56
318.2400
5.9600
280.12
272.47
287.7680
1.9120
279.10
273.80
284.3952
1.3248
305.68
280.17
331.1808
6.3760
314.94
287.13
342.7564
6.9537
298.15
289.33
306.9745
2.2053
295.92
290.65
301.1951
1.3181
322.34
296.99
347.6884
6.3376
330.67
303.72
357.6167
6.7366
313.14
305.61
320.6661
1.8824
322.5485
296.5819
324.4309
386.80
326.3134
352.76
328.1958
264.93
三、实习要求
1. 预习实习内容,复习有关讲课内容,事先熟悉实验过程。
2. 理解时间序列分析的原理,了解进行时间序列分析的各种方法和步骤,使用统计软件对数据进行序列分析,观察并分析实验结果。
3. 实习结束,将计算结果存盘,并书写上机实习报告。
实验4:主成分分析(2学时)
一、实习目的
通过实验,学生需要了解主成分分析方法的原理,掌握主成分分析的方法和步骤,能够利用SPSS或Matlab软件进行确定主成分并对结果进行分析。
二、 实验内容
某农业生态经济系统各区域单元的有关数据如下表:
样本序号
人口密度x1/(人·.km-2)
人均耕地面积x 2/hm2)
森林覆盖率x3/%
农民人均纯收入x4/(元·人-1)
人均粮食产量x5 (kg·人-1)
经济作物占农作物播面比例x6/%
耕地占土地面积比x7/%
果园与林地面积之比x8/%
灌溉田占耕地面积之比x9/%
1
363.912
0.352
16.101
192.110
295.340
26.724
18.492
2.231
26.262
2
141.503
1.684
24.301
1752.350
452.260
32.314
14.464
1.455
27.066
3
100.695
1.067
65.601
1181.540
270.120
18.266
0.162
7.474
12.489
4
143.739
1.336
33.205
1436.120
354.260
17.486
11.805
1.892
17.534
5
131.412
1.623
16.607
1405.090
586.590
40.683
14.401
0.303
22.932
6
68.337
2.032
76.204
1540.290
216.390
8.128
4.065
0.011
4.861
7
95.416
0.801
71.106
926.350
291.520
8.135
4.063
0.012
4.862
8
62.901
1.652
73.307
1501.240
225.250
18.352
2.645
0.034
3.201
9
86.624
0.841
68.904
897.360
196.370
16.861
5.176
0.055
6.167
10
91.394
0.812
66.502
911.240
226.510
18.279
5.643
0.076
4.477
11
76.912
0.858
50.302
103.520
217.090
19.793
4.881
0.001
6.165
12
51.274
1.041
64.609
968.330
181.380
4.005
4.066
0.015
5.402
13
68.831
0.836
62.804
957.140
194.040
9.110
4.484
0.002
5.790
14
77.301
0.623
60.102
824.370
188.090
19.409
5.721
5.055
8.413
15
76.948
1.022
68.001
1255.420
211.550
11.102
3.133
0.010
3.425
16
99.265
0.654
60.702
1251.030
220.910
4.383
4.615
0.011
5.593
17
118.505
0.661
63.304
1246.470
242.160
10.706
6.053
0.154
8.701
18
141.473
0.737
54.206
814.210
193.460
11.419
6.442
0.012
12.945
19
137.761
0.598
55.901
1124.050
228.440
9.521
7.881
0.069
12.654
20
117.612
1.245
54.503
805.670
175.230
18.106
5.789
0.048
8.461
21
122.781
0.731
49.102
1313.110
236.290
26.724
7.162
0.092
10.078
主成分分析的步骤和过程如下:
(1)计算相关系数矩阵。
相关系数矩阵表示为:
其中:rij(i,j=1,…,p)是原始数据xi和xj之间的相关系数,其计算公式为:
(2)计算特征值和特征向量。
求解特征方程|λi-R|=0的特征值λi(i=l,…P),将其按大小排序,并求出其相应的特征向量。
(3)计算主成分贡献率及累计贡献率。
贡献率:
累计贡献率:
取累计贡献率达85%~95%的特征值所对应的第1、第2、…、第m(m≤p)个主成分。
(4)计算主成分载荷
(5)确定各主成分得分
SPSS软件的计算结果:
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
4.661
51.790
51.790
4.661
51.790
51.790
2
2.089
23.217
75.007
2.089
23.217
75.007
3
1.043
11.589
86.596
1.043
11.589
86.596
4
.507
5.638
92.234
5
.315
3.502
95.736
6
.193
2.140
97.876
7
.114
1.271
99.147
8
.045
.504
99.650
9
.031
.350
100.000
提取方法:主成份分析。
成份矩阵a
成份
1
2
3
Zscore: 人口密度x1/(人·.km-2)
.739
-.532
-.061
Zscore: 人均耕地面积x 2/hm2)
.123
.887
-.028
Zscore: 森林覆盖率x3/%
-.964
.096
.095
Zscore: 农民人均纯收入x4/(元·人-1)
.042
.868
.037
Zscore: 人均粮食产量x5 (kg·人-1)
.813
.444
-.011
Zscore: 经济作物占农作物播面比例x6/%
.819
.179
.125
Zscore: 耕地占土地面积比x7/%
.933
-.133
-.251
Zscore: 果园与林地面积之比x8/%
.197
-.100
.970
Zscore: 灌溉田占耕地面积之比x9/%
.964
-.025
.092
提取方法 :主成份。
a. 已提取了 3 个成份。
成份得分系数矩阵
成份
1
2
3
Zscore: 人口密度x1/(人·.km-2)
.158
-.255
-.059
Zscore: 人均耕地面积x 2/hm2)
.026
.424
-.027
Zscore: 森林覆盖率x3/%
-.207
.046
.091
Zscore: 农民人均纯收入x4/(元·人-1)
.009
.415
.035
Zscore: 人均粮食产量x5 (kg·人-1)
.174
.212
-.010
Zscore: 经济作物占农作物播面比例x6/%
.176
.086
.120
Zscore: 耕地占土地面积比x7/%
.200
-.064
-.241
Zscore: 果园与林地面积之比x8/%
.042
-.048
.930
Zscore: 灌溉田占耕地面积之比x9/%
.207
-.012
.088
提取方法 :主成份。
构成得分。
三、实验要求
1. 预习实习内容,复习有关讲课内容,事先了解SPSS和Mat lab软件的使用。
2. 独立使用相关数据利用软件进行实际操作。
3. 实习结束,将计算结果存盘,并书写上机实习报告。
实验5:空间统计分析
一、 实习目的
1、理解探索性空间统计分析和地统计分析的基本原理和方法,
2、掌握利用探索性空间统计分析和地统计分析方法解决地学问题的能力。
二、 实习内容
(一) 探索性空间统计分析的基本原理
(1)通常定义一个二元对称空间权重矩阵W,来表达n个位置的空间区域的邻近关系,其形式如下
式中:Wij表示区域i与j的临近关系,它可以根据邻接标准或距离标准来度量。
1.全局空间自相关
Moran指数和Geary系数是两个用来度量空间自相关的全局指标Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。 Geary 系数与Moran指数存在负相关关系。
如果是位置(区域)的观测值,则该变量的全局Moran指数I,用如下公式计算
式中: I 为Moran指数;
Geary 系数C计算公式如下
式中:C为Geary系数;其他变量同上式。
如果引入记号
2.局部空间自相关
局部空间自相关分析方法包括3种:空间联系的局部指标(LISA)、G统计量、M0ran散点图;
①空间联系的局部指标(LISA)
LISA包括局部Moran指数(local Moran)和局部Geary指数(local Geary),下面重点介绍和讨论局部Moran指数。
局部Moran指数被定义为
②G 统计量
全局G统计量的计算公式为
对每一个区域单元的统计量为
③Moran散点图
Moran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式:
例:以书本上的应用实例来说明,图1给出了上海市部分街道(50个样区)的邻居关系,各街道编号、名称、所属区,以及2000年的人口密度数据如表1所示(原始数据为shape格式的矢量数据)。那么,人口分布是否存在空间上的相关关系呢?为了回答这一问题,就需要进行空间统计分析。
图1上海市部分街道(样区)的邻居关系
表1 上海市部分街道(样区)的人口密度及其ESDA计算结果
街道编号
街道名称
所属区
人口密度(单位:人/km)
Gi
Z(Gi)
1
大桥街道
杨浦区
26 089.38
0.072 9
-0.606 4
2
四川北路街道
虹口区
43 155.37
0.144 5
0.885 1
3
江浦路街道
杨浦区
37 526.67
0.104 1
0.043 6
4
新港路街道
虹口区
57 142.64
0.096 4
0.34
5
金杨新村街道
浦东新区
18 434.64
0.036 6
-1.036 7
6
平凉路街道
杨浦区
33 715.29
0.092 5
-0.575 6
7
宝山路街道
闸北区
60 764.3
0.119 4
0.869 7
8
宜川路街道
普陀区
45 052.61
0.053 6
-0.201 6
9
嘉兴路街道
虹口区
45 666.77
0.127 6
0.532 1
10
芷江西路街道
闸北区
51 118.21
0.110 9
0.674 1
11
提篮桥街道
虹口区
35 986.24
0.153
0.181 8
12
天目西路街道
闸北区
27 606.91
0.171
0.507 7
13
洋泾街道
浦东新区
17 597.01
0.083
-1.077 3
14
乍浦路街道
虹口区
51 422.87
0.157 3
0.260 8
15
北站街道
闸北区
63 370.29
0.209 1
0.781 2
16
长寿路街道
普陀区
25 291.35
0.100 4
-0.034 5
17
梅园新村街道
浦东新区
18 287.02
0.143
-0.345 1
18
外滩街道
黄浦区
29 876.99
0.232 8
0.800 3
19
江宁路街道
静安区
43 080.8
0.122 2
-0.004 4
20
南京东路街道
黄浦区
55 084.4
0.053 3
-0.651 2
21
钦洋镇
浦东新区
4 813.09
0.020 7
-0.642 4
22
石门二路街道
静安区
57 311.38
0.118
0.333
23
人民广场街道
黄浦区
32 799.65
0.237
1.256 6
24
曹家渡街道
静安区
42 568.48
0.095 2
-0.142 4
25
金陵东路街道
黄浦区
66 937.74
0.109 1
-0.257 4
26
潍坊新村街道
浦东新区
32 958.37
0.020 7
-0.642 4
27
小东门街道
黄浦区
41 752.64
0.163 5
0.372 1
28
南京西路街道
静安区
35 618.77
0.144 5
0.030 4
29
豫园街道
黄浦区
63 508.91
0.152
1.039 5
30
静安寺街道
静安区
27 676.19
0.117 1
-0.102
31
老西门街道
黄浦区
75 864.04
0.241 8
1.339 4
32
淮海中路街道
卢湾区
71 677.72
0.180 3
1.112 8
33
花木镇
浦东新区
6 453.42
0.034 6
-1.403 5
34
江苏路街道
长宁区
35 509.79
0.074 1
-0.173 1
35
瑞金二路街道
卢湾区
38 087.97
0.154 3
0.205 2
36
湖南路街道
徐汇区
29 796.74
0.107 4
-0.289 8
37
塘桥街道
浦东新区
18 085.24
0.063 6
-0.800 9
38
董家渡街道
黄浦区
36 815.94
0.146 9
0.073 1
39
打浦桥街道
卢湾区
44 442.23
0.195 3
0.546 4
40
天平路街道
徐汇区
29 699.73
0.107
-0.297 9
41
半淞园路街道
黄浦区
41 259.69
0.149 2
0.114 2
42
五里桥街道
卢湾区
27 068.64
0.100 6
-0.421 1
43
南码头路街道
浦东新区
21 973.13
0.088 6
-0.977 1
44
斜土路街道
徐汇区
29 112.08
0.092 7
-0.571 6
45
徐家汇街道
徐汇区
24 479.34
0.058 3
-0.537 8
46
枫林路街道
徐汇区
41 794.51
0.074 2
-0.58
47
周家渡街道
浦东新区
25 452.99
0.078 9
-0.836 9
48
六里镇
浦东新区
12 026.16
0.036
-1.049 7
49
上钢新村街道
浦东新区
16 569.86
0.059 5
-0.886
50
龙华镇
徐汇区
10 603.98
0.067
-0.729 4
1.利用Geodata Analysis Software实现
将GIS数据(譬如*.shp格式),导入到Geodata 中,该软件系统界面如下图(图2)所示:
图2 软件分析界面
菜单命令及主要工具按钮如下:
close all windows,即关闭所有已经打开的窗口;
add centroids,即添加中心点;
……
如果打开数据表,其形式如下:
在做空间统计分析之前,首先需要计算空间邻居关系的权重矩阵。为此,可以在上述图形界面引导下,在“Tools”工具栏中,利用“Weights” 工具栏中的“Create”产生一个权重矩阵文件,譬如,对于以上人口分布的各个街道数据,可以产生一个权重矩阵文件density_weights.GWT。
然后,利用权重矩阵,就可以做一系列的空间统计分析,譬如:
(1)计算全局Moran’s I并做出Moran散点图,如下:
(2)做出LISA显著水平图,如下:
(3)还可以进一步通过回归分析,研究变量之间的相互关系。
…………,在图形界面引导下,按步骤操作,就可以实现该软件提供的一些空间统计分析功能。
2.局部G统计计算的Matlab程序
除了Geodata Analysis Software软件外,还可以利用Matlab编程进行空间统计分析。譬如,局部G统计的Matlab计算程序如下:
function [GI,ZG]=Getis(Wij,Xij)
% 计算G统计值:G值是不包含自己的G统计值
% 输入:Wij—空间权值矩阵
% 输入:Xij—研究区域的空间属性数据
% 输出:GI— 空间局部自相关指标-G统计值
% 输出:ZG— 对于GIJ的检验Z值的计算结果
% GI=Getis(Wij,Xij,N)
[M,N]=size(Wij);
GI=zeros(N,1);
GIn=0;
Xn=0;
for m=1:N
for n=1:N
if n==m
GIn=GIn;
Xn=Xn;
else
GIn=GIn+Wij(m,n)*Xij(n);
Xn=Xn+Xij(n);
end
end
GI(m)=GIn/Xn;
GIn=0;
Xn=0;
end
save GI GI -ascii;
%计算Z值
EG=zeros(N,1);
VarG=zeros(N,1);
ZG=zeros(N,1);
WI=0;
for m=1:N %计算E(Gi(d))
for n=1:N
if n==m
WI=WI;
else
WI=WI+Wij(m,n);
end
end
EG(m)=WI/(N-1);
WI=0;
end
WI=0;
Xj=0;
Xj2=0;
%Yi1=zero(N,1); %计算Yi1
%Yi2=zero(N,1); %计算Yi2
Wi=zeros(N,1); %计算Wi
for m=1:N
for n=1:N
if n==m
WI=WI;
Xj=Xj;
Xj2=Xj2;
else
WI=WI+Wij(m,n);
Xj=Xj+(Xij(n)*Xij(n));
Xj2=Xj2+
展开阅读全文