资源描述
多元统计分析
课
程
论
文
小组成员:
完成时间: 2012年10月20日
全国各地区财政支出差异的聚类分析论文
摘要:聚类分析又称群分析,是多元统计分析中研究样本或指标的一种主要的分类方法。聚类分析方法已越来越多地用于经济分析的各个领域。本论文运用系统聚类方法,借用SPSS软件,根据《中国统计年鉴2010》中《各地区财政支出》的相关指标的数据,对2010年全国各地区的财政支出结构进行分析,从而得出各地区聚类的结果。
关键词:财政支出 聚类分析
一、文献综述
一个国家的财政支出结构随着经济与社会的发展变化而变化,不同发展阶段的财政支出结构也会有明显差异。不同地区政治、经济和文化等各方面的发展是不平衡的,这种差异导致不同地区的财政支出结构存在不同。
衡量一个地区的财政支出情况,不仅仅看经济服务方面的支出,而且应该从政府服务和其他职能去考察,看各项指标的综合效果。通过综合评价分析,研究不同地区财政支出结构,为国家各地区制定不同有益政策提供有效建议。
本文通过运用系统聚类分析方法,对全国31个省市的财政支出结构进行分析,得出分类结果。
二、变量选择
本文选取反映财政支出水平的十四项主要指标:一般预算支出、一般公共服务、国防、公共安全、教育、科学技术、社会保障和就业、医疗卫生、环境保护、交通运输、资源勘探电力信息等事务、商业服务等事务、国土资源气象等事务和其他支出。
三、变量选择理由
(1)一般预算支出反映一个地区的平均支出水平,是财政职能状态和政府政策的体现;
(2)交通运输、资源勘探电力信息等事务和商业服务事务的支出属于经济服务支出类,它能体现政府对商业活动进行管理的有效运营支出;
(3)教育、科学技术、医疗卫生和环境保护属于社会服务支出,它能反映各地区日常生活中的必要支出;
(4)一般公共服务、国防、公共安全、社会保障和就业以及国土资源气象等事务的支出属于一般政府服务支出,它反映的是政府对各地区的具体合理支出情况;
(5)其他支出,包括利息和对其它政府机构的转移支付,包含了支出中的各项深层的财政状况。
四、数据处理
原始数据
地 区
一 般
一般公共服务
国 防
公共安全
教 育
科学技术
社会保障和就业
医疗卫生
交通运输
资源勘探电力信息等事务
商业服务业等事务
其他支出
北 京
2717.32
239.57
4.70
180.94
450.22
178.92
275.90
186.82
154.99
138.95
26.65
208.64
天 津
1376.84
98.07
0.88
84.92
229.56
43.25
137.74
70.07
46.95
79.13
17.77
49.74
河 北
2820.24
358.13
7.08
176.08
514.30
29.65
358.78
235.48
155.72
58.70
44.84
101.62
山 西
1931.36
215.83
3.30
121.84
328.58
20.12
274.46
113.86
131.65
36.07
26.98
34.44
内蒙古
2273.50
254.53
3.88
120.45
322.11
21.39
292.44
120.72
121.05
57.37
21.45
35.03
辽 宁
3195.82
352.40
7.58
191.29
405.39
68.90
579.84
151.36
140.29
208.94
43.23
73.38
吉 林
1787.25
198.04
3.70
109.30
250.20
19.12
253.36
110.91
89.78
53.15
24.75
13.01
黑龙江
2253.27
222.57
4.92
134.85
299.14
27.69
306.06
135.18
147.72
73.34
35.70
40.38
上 海
3302.89
226.02
7.25
187.25
417.28
202.03
362.56
160.07
80.43
357.85
46.85
380.09
江 苏
4914.06
631.24
12.93
326.80
865.36
150.35
364.48
249.69
276.00
262.96
106.18
157.94
浙 江
3207.88
434.29
6.43
260.67
606.54
121.40
206.39
224.53
233.37
125.67
85.58
93.19
安 徽
2587.61
273.72
4.63
119.48
386.31
57.98
334.15
184.22
124.86
124.94
45.84
87.83
福 建
1695.09
211.91
3.27
120.60
327.77
32.31
148.24
117.58
125.21
64.07
40.28
94.34
江 西
1923.26
218.75
4.09
107.49
297.50
18.26
233.02
150.02
107.31
117.53
35.43
74.95
山 东
4145.03
544.31
10.41
244.03
770.45
84.36
416.77
250.77
230.50
161.12
99.49
98.85
河 南
3416.14
478.69
4.16
189.72
609.37
44.67
461.22
270.21
173.84
89.81
73.88
80.97
湖 北
2501.40
314.93
2.00
166.87
366.57
30.09
368.42
179.13
124.03
109.84
60.25
85.75
湖 南
2702.48
367.20
7.49
159.14
403.10
35.04
396.40
180.44
153.03
96.99
46.52
48.36
广 东
5421.54
685.39
11.09
495.80
921.48
214.44
469.58
304.04
318.17
163.98
99.33
331.54
广 西
2007.59
268.76
7.26
125.14
366.84
21.66
217.07
165.49
93.71
69.86
29.48
64.07
海 南
581.34
62.44
1.91
43.94
98.33
7.47
73.80
34.82
26.23
14.60
7.82
21.51
重 庆
1709.04
168.49
6.18
91.84
240.46
17.90
236.98
94.87
81.85
83.28
30.66
20.90
四 川
4257.98
407.31
8.53
218.38
540.65
34.71
513.65
263.34
192.98
153.73
69.29
94.45
贵 州
1631.48
212.69
3.66
101.46
292.06
16.66
140.76
127.68
109.61
48.34
21.52
51.57
云 南
2285.72
246.50
6.53
145.42
374.79
21.43
304.69
183.70
139.88
46.22
35.30
52.93
西 藏
551.04
72.35
3.06
41.33
60.80
2.71
31.91
32.04
64.06
17.24
5.84
66.15
陕 西
2218.83
287.29
2.90
111.50
377.79
25.25
315.61
156.66
129.06
71.63
34.96
30.70
甘 肃
1468.58
145.75
1.77
70.45
228.23
10.89
215.09
100.40
66.58
27.89
17.66
21.10
青 海
743.40
55.20
0.79
35.48
82.47
4.08
189.50
38.94
46.68
23.27
7.85
17.38
宁 夏
557.53
51.77
0.63
31.49
81.59
5.97
35.03
34.02
21.80
21.66
10.33
13.62
新 疆
1698.91
195.57
4.03
128.56
313.84
20.19
166.40
103.56
91.54
38.53
21.64
57.62
基本操作:
1、将数据导入SPSS中,点击analyze→classify→hierarchical cluster,将变量选入variable栏中,地区选入label case by栏中;
2、点击statistic,选择输出agglomeration schedule、proximity matrix两项,聚类个数为5,单击continue;
3、点击plots,选择dengdrogram树状图,单击continue;
4、点击method,数值标准化为Z-scores,聚类方法为within-groups linkage,选择距离测度为squared educlidean distance,返回主对话框;
5、点击save,single of solution个数为5,返回主对话框,点OK。
五、结果及分析
表1 有效样本个数统计
此表显示进行聚类分析的有效样本有31个,且没有确实值的存在。
表2 聚类过程的结果
这张表反映了每一阶段聚类的结果。从表中可看出,聚类进行了30步,Coefficients表示聚合系数,第2列和第3列表示聚合的类。比如第一阶段(Stage=1)将距离最近的21号样品(海南)和30号样品(宁夏)聚为一类,next stage =6,说明进行第6步的聚类,将21号样品(海南)和26号样品西藏又聚类一类,其余类似。另外coefficients值随着聚类的进行逐渐增大,增加速度先慢后快,说明聚类是类间差异小,结束是类间差异大。
表3 类的关系
此表显示了将31个样本分为5类的结果。
图1 树状聚类图
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Within Group)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
海 南 21 ─┐
宁 夏 30 ─┼─┐
西 藏 26 ─┘ │
青 海 29 ───┼───────────────┐
天 津 2 ───┘ │
贵 州 24 ─┐ │
新 疆 31 ─┼─┐ │
福 建 13 ─┘ ├─┐ │
甘 肃 28 ───┘ │ │
广 西 20 ───┐ ├─┐ │
云 南 25 ───┤ │ │ │
山 西 4 ─┐ │ │ │ ├─────┐
内蒙古 5 ─┤ ├─┘ │ │ │
吉 林 7 ─┤ │ │ │ │
黑龙江 8 ─┼─┤ ├───┐ │ │
陕 西 27 ─┘ │ │ │ │ │
江 西 14 ───┤ │ │ │ │
重 庆 22 ───┘ │ │ │ ├───────────────────────┐
河 北 3 ───┬─┐ │ ├─┐ │ │ │
湖 南 18 ───┘ ├─┘ │ │ │ │ │
安 徽 12 ───┬─┘ │ ├─────┘ │ │
湖 北 17 ───┘ │ │ │ │
辽 宁 6 ───────────┘ │ │ │
北 京 1 ─────────────┘ │ │
上 海 9 ─────────────────────────┘ │
河 南 16 ───────┬───┐ │
四 川 23 ───────┘ ├───┐ │
山 东 15 ───────────┘ ├───────┐ │
浙 江 11 ───────────────┘ ├─────────────┐ │
江 苏 10 ───────────────────────┘ ├───────────┘
广 东 19 ─────────────────────────────────────┘
从途中可以由分类个数得到分类情况。我们选择分类数为5,就从距离大概为16的地方往下切,得到分类结果如下:
第一类(1个):广东
第二类(1个):江苏
第三类(4个):浙江、山东、河南、四川
第四类(1个):上海
第五类(24个):北京、天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、安徽、福建、江西、湖 北、 湖南、广西、海南、重庆、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆
六、结论
通过观察聚类分析的最终结果可以看出,我国各地区的财政支出结构存在一定的差异。
第一类的广东,由于广东聚集了很多国内的制造也,还有很多的进出口贸易,情况是比较典型的,其在各方面的支出多。第二类的江苏,它属于沿海城市,经济发达的地区,其在各方面的发展速度较快,在经济服务方面的财政支出较多。第三类的浙江、山东、河南和四川较为相似,属于均衡发展型,这四个地区各支出项目比较突出,处于经济建设型转向社会服务型的过渡时期,期间经济方面支出逐渐减少,而社会服务支出逐步增长。第四类的上海,是中国市场经济改革和经济发展的风向标,推动我国经济和社会的发展,其在经济发展过程中享有国家一定的政策性优惠,因此上海的各项财政支出相对突出。第五类的24个省市的财政支出基本属于社会服务型,这些地区的社会服务支出占总的财政支出的比重较大,地方政府在推动地方经济发展的同时,也注重社会的和谐发展,把大量的财政资金投入到科教文卫方面额建设,在民生方面的财政支出逐渐增加。
七、参考文献
[1]《中国统计年鉴2010》,中国统计出版社
[2]何晓群,《多元统计分析(第三版)》,中国人民大学出版社,2012年版
[3]薛薇,《SPSS统计方法与应用》,电子工业出版社,2009.1
[4]冯伟,聚类分析在金融数据分析中的应用研究,2009
8
展开阅读全文