资源描述
HUNAN UNIVERSITY
课 程 论 文
论文题目: 有关我国居民消费因素的分析
指导老师: 马守荣
学生名字: 姚定坤
学生学号: 201318040128
专业班级: 经济统计1301
学院名称: 金融与统计学院
目 录
概述 ………………………………………………………………………………………………………1
一、引言 ………………………………………………………………………………………………………2
二、数据概述系 ...………………………………………………………………………………………………..…2
三、分析方法 .……………………………………………………………………………………………….……3
四、数据分析 ………………………………………………………………………………………………….....3
(一)相关分析 ……………………..………………………………………………………………………………3
(二)因子分析 ……………………………………………………………………………………….……………10
(三)聚类分析 ………………………………………………………………………………….…………………15
五、分析与建议 …………………………………………………………………………..…………………..……18
六、心得体会 …………………………………………………………………………..…………………..……19
参考文献 ……………………………………………………………………………...……….……………20
有关我国居民消费因素的分析
概 述
生活离不开消费,随着社会发展,生活水平提高,消费也在逐渐变化,并且随着经济发展,各个地区的发展水平的差异,消费也产生了不同的变化,此篇论文主要目的是利用多元统计的方法,借助spss软件,对我国31个地区的居民消费情况进行分析。了解我国31个地区的居民消费情况与统计指标食品烟酒、衣着、居住等8个指标之间的一些联系。并且通过因子得分,计算并排列出消费因素的综合得分,最后通过聚类分析,对我国31个地区的居民消费情况做一个大致分类,进而对各个地区分类后的情况做一个分析和总结并结合文献以及资料提出一些意见和看法。
一.引言
消费在宏观经济学中,指某时期一人或一国用于消费品的总支出。与经济活动有着密不可分的关系,消费作为社会再生产的最终阶段,是生产者生产产品的目的和导向。如果没有了消费,生产的存在也会变得毫无意义,消费促进了生产,给生产带来了源动力。消费者的消费需求,也推动了生产的发展。并且消费促进了货币流通,提供了就业岗位,降低失业率,拉动了经济增长,最终有助于提高人民的生活水平。 消费是国民经济保持增长的动力,只有拉动消费需求的增长,才能促进投资,促进产业结构的调整、宏观经济的增长,满足人民的物质生活的需求,实现生活水平的提高。
故消费和生活水平有着密切的关系,从而,通过对我国居民消费水平的分析,不但可以直观了解到我国总的消费趋向,各地区不同的消费主导因素,还能客观反映我国总的生活水平也就是经济发展的大致情况。统计年鉴中的八项指标:食品烟酒、衣着、居住、生活用及服务、交通通信、教育文化娱乐、医疗保健、其他用品及服务。囊括了居民消费的全部项目,居民日常消费可以清楚地从数据中了解到。再通过分析和整合,最终可以大致分析我国总体的消费倾向以及各个地区的异同点。再结合文献资料了解分析产生异同的原因,进而对我国的总体消费水平做一个最终概括。
二.数据概述
数据来源:2015年《中国统计年鉴》
指标:
变量名称
对应自变量
食品烟酒
X1
衣着
X2
居住
X3
生活用品及服务
X4
交通通信
X5
教育文化娱乐
X6
医疗保健
X7
其他用品及服务
X8
指标均来源于统计年鉴中,分地区居民消费中所统计的数据,对于居民消费分成了8个类别,这8个类别基本概括了我们日常的消费支出项目、
三.分析方法
基于对于消费因素的分析的目的,针对我国31个地区的8项消费支出数据,主要运用因子分析和聚类分析,首先运用因子分析将数据进行降维,提取,将大量繁琐的数据简化,用主要因子来对我国31个地区的消费支出做一个大致了解,然后在对简化的数据进行聚类分析,运用聚类分析的方法研究区域性的消费结构问题,以此来研究我国消费支出的构成情况及地区性差异,并从中发现统计规律与变化特点,以便提出好的政策与建议。
四.数据分析
(一)相关分析
(1)实验结果
1.1.1对应表
地区
食品烟酒
衣着
居住
生活用品及服务
交通通信
教育文化娱乐
医疗保健
其他用品及服务
有效边际
北京
7467.8
2359.8
9497.7
2041.4
3578.6
3268.3
1914.2
975.2
31103
天津
7376.6
1859.3
4873
1295.5
2904.7
1833.8
1584.5
615.5
22342.9
河北
3263.7
971.8
2727.7
773.6
1749.3
1144.5
1027.5
273.5
11931.6
山西
2940.5
1084.8
2198.8
619.4
1214.7
1484.6
1008.6
312.4
10863.8
内蒙古
4746.4
1688
2795.2
1008.9
2405.1
1813.2
1319.7
481.5
16258
辽宁
4554.8
1477.8
3400.5
918.7
1949.7
1834.4
1419.2
512.9
16068
吉林
3531.6
1228.9
2561.3
689.5
1636.3
1550.8
1458
369.6
13026
黑龙江
3537.9
1292.8
2689.6
670.9
1588.4
1406.8
1258.3
324.1
12768.8
上海
9011.6
1613
10789.1
1531.6
3596.5
3311.4
2223.9
987.6
33064.7
江苏
5591.7
1385.2
4126.7
1107.2
2869.3
2238.2
1331.3
514
19163.6
浙江
6569.2
1587.1
5577.2
1117.7
3670.6
2169
1358.2
503.1
22552.1
安徽
4003.1
870.3
2541.8
694.2
1324.9
1157.3
870
265.3
11726.9
福建
6081.9
1097.5
4278.5
1032.3
2067
1667.2
926.8
493.1
17644.3
江西
3785.8
853.4
2576.6
679.3
1164.3
1151.1
635
243.4
11088.9
山东
3932.3
1168.9
2825.8
993.6
1821.9
1303
989.6
293.7
13328.8
河南
3202.4
1111.8
2208.6
875.1
1225.5
1160.8
929
287.1
11000.3
湖北
4139.7
1009.7
2810.2
813.4
1339.8
1479.8
1056.2
279.3
12928.1
湖南
4240.5
914.1
2708.4
796.9
1600.2
1764.9
972.2
291.4
13288.6
广东
6589.8
1014.6
4300.2
1116.5
2795.1
1965
890.5
533.9
19205.6
广西
3680.1
460.5
2341.5
614
1198.3
1115.3
679.3
185.3
10274.3
海南
4915
549.9
2558.2
686
1437.4
1358.4
716.8
248.8
12470.5
重庆
4971.9
1275.9
2554.4
978.8
1476.2
1319.3
966.1
268.1
13810.7
四川
4548.2
974.3
2217.3
879.6
1437
1061
964.5
286.5
12368.4
贵州
3151.9
666.3
1826.9
619.1
1080.4
1222
572
164.7
9303.3
云南
3211.5
567
2018.5
568.4
1513.6
1096.7
739.4
154.4
9869.5
西藏
3370.2
733.7
1311.5
399.7
796
266.7
197.6
241.5
7316.9
陕西
3405.1
944.6
2585.8
796.2
1535.4
1500.4
1178.2
257.9
12203.6
甘肃
3218.2
884.2
2015
652.1
1072.2
1092.4
737.2
203.3
9874.6
青海
3854.4
1153
2374.5
733.5
1790.1
1293
1071.2
335
12604.7
宁夏
3555.6
1170
2214.4
797.9
1763.5
1416.4
1239.9
326.7
12484.4
新疆
3855
1205.6
2226.4
669.2
1624.5
1102.2
978.3
242.4
11903.6
有效边际
140304.4
35173.8
101731.3
27170.2
57226.5
47547.9
33213.2
11471.2
453838.5
表1.1.1可以看出上海、北京、天津,三个地区都是高消费地区,贵州、云南、西藏、甘肃都属于消费水平较低的地区,而其余地区基本属于中间消费段落,由于处于中间段落消费地区的城市也存在差距,之后会通过处理,具体再做说明。比较显而易见的就是,食品烟酒占了消费支出的大部分,其余消费都基本没有太多显著变化。需要说明的是,在北京,上海两地的居住消费支出都超过了食品烟酒的消费支出。这在其他地区是不存在的。
1.1.2
维数
奇异值
惯量
卡方
Sig.
惯量比例
置信奇异值
解释
累积
标准差
相关
2
1
.106
.011
.427
.427
.002
.019
2
.091
.008
.310
.737
.001
3
.051
.003
.099
.837
4
.049
.002
.090
.927
5
.032
.001
.038
.964
6
.025
.001
.024
.989
7
.017
.000
.011
1.000
总计
.027
12040.582
.000
1.000
1.000
表1.1.2中可知,7个维度的奇异值分别为0.106、0.091、0.051、0.049、0.032、0.025、0.017;惯量展示了行列关系的强度,7个维度的惯量分别为0.011、0.008、0.003、0.002、0.001、0.001、0.001,其中第一个惯量的值最大,意味着它解释各别差异的能力最强,地位最重要,其他惯量的重要性依次下降,惯量的总和为0.027;卡方、显著性是对交叉列联表作卡方检验的卡方观测值(12040.582),认为行变量和列变量有显著的相关性关系;惯量比例中的考虑情况展示了各个惯量的方差贡献率,第一个特征根的方差贡献率为0.427,方差贡献率是最高的,惯量累计就是各惯量的累计方差贡献率,由于前两个特征根就已经解释了各类别差异的73.7%,因此最终提取2个因子是可行的,信息丢失少,足够对数据进行描述。
1.1.3概述行点
概述行点a
地区
质量
维中的得分
惯量
贡献
1
2
点对维惯量
维对点惯量
1
2
1
2
总计
北京
.069
-.601
.230
.003
.232
.040
.773
.096
.870
天津
.049
.082
-.142
.000
.003
.011
.098
.248
.346
河北
.026
-.014
.240
.000
.000
.017
.002
.459
.460
山西
.024
.170
.467
.001
.006
.058
.100
.647
.747
内蒙古
.036
.388
.271
.001
.051
.029
.572
.237
.810
辽宁
.035
.099
.298
.000
.003
.035
.090
.696
.786
吉林
.029
.227
.520
.001
.014
.086
.156
.693
.849
黑龙江
.028
.164
.408
.001
.007
.052
.133
.705
.839
上海
.073
-.784
-.011
.005
.421
.000
.956
.000
.956
江苏
.042
-.003
.083
.000
.000
.003
.000
.079
.079
浙江
.050
-.200
-.038
.001
.019
.001
.214
.007
.221
安徽
.026
.080
-.178
.000
.002
.009
.118
.501
.618
福建
.039
-.162
-.378
.001
.010
.061
.171
.792
.963
江西
.024
-.033
-.264
.000
.000
.019
.011
.568
.579
山东
.029
.119
.096
.000
.004
.003
.188
.104
.292
河南
.024
.235
.243
.000
.013
.016
.285
.261
.545
湖北
.028
.075
.015
.000
.001
.000
.083
.003
.086
湖南
.029
.094
-.009
.000
.002
.000
.082
.001
.083
广东
.042
-.100
-.408
.001
.004
.078
.043
.611
.653
广西
.023
-.080
-.398
.001
.001
.039
.027
.568
.595
海南
.027
.070
-.611
.001
.001
.113
.012
.748
.759
重庆
.030
.366
-.228
.001
.038
.017
.564
.187
.751
四川
.027
.372
-.283
.001
.035
.024
.547
.270
.817
贵州
.020
.167
-.169
.000
.005
.006
.154
.135
.289
云南
.022
.088
-.121
.000
.002
.003
.046
.074
.120
西藏
.016
.454
-1.058
.003
.031
.199
.130
.602
.732
陕西
.027
.084
.325
.000
.002
.031
.049
.622
.670
甘肃
.022
.197
-.016
.000
.008
.000
.463
.003
.466
青海
.028
.278
.150
.000
.020
.007
.665
.165
.830
宁夏
.028
.352
.372
.001
.032
.042
.484
.460
.944
新疆
.026
.356
.052
.000
.031
.001
.720
.013
.733
有效总计
1.000
.027
1.000
1.000
由表1.1.3可知,总惯量为0.27,各地区对总惯量的贡献度几乎接近0。从贡献中的点对维惯量中可以看出,第一维度中主要反映了“北京”23.2%、“上海”42.1%,第二维度主要反映了“海南”11.3%,“西藏”19.9%;从维对点惯量中可以看出,第一维度主要反映了“北京”77.3%,“内蒙古”57.2%,“上海”95.6%,“重庆”56.4%,“四川”54.7%,“青海”66.5%,“新疆”72.0%及其他类别,第二维度主要反映了“山西”64.7%,“辽宁”69.6%,“吉林”69.3%,“黑龙江”70.5%,“海南”74.8%,“西藏”60.2%,“陕西”62.2%及其他类别。
1.1.4概述列点
维中的得分
贡献
点对维惯量
维对点惯量
种类
质量
1
2
惯量
1
2
1
2
总计
食品烟酒
0.309
0.19
-0.385
0.005
0.105
0.504
0.218
0.759
0.977
衣着
0.078
0.447
0.381
0.004
0.146
0.124
0.429
0.265
0.694
居住
0.224
-0.566
0.016
0.008
0.674
0.001
0.981
0.001
0.982
生活品及服务
0.06
0.154
0.037
0.001
0.013
0.001
0.17
0.008
0.178
交通通信
0.126
0.076
0.073
0.002
0.007
0.007
0.035
0.027
0.063
教育文化娱乐
0.105
0.008
0.269
0.002
0
0.084
0
0.319
0.319
医疗保健
0.073
0.256
0.582
0.003
0.045
0.273
0.15
0.658
0.808
其他用品及服务
0.025
-0.2
0.14
0.001
0.009
0.005
0.144
0.061
0.205
有效总计
1
0.027
1
1
由表1.1.4可知总惯量为0.27,各地区对总惯量的贡献相近且都接近于0。从贡献中的点对维惯量中可以看出,第一维度主要反映了“衣着”14.6%,“居住”67.4%,以及其他类别,第二维度主要反映了“食品烟酒”52.1%及其他类别;从维对点惯量中可以看出,第一维度主要反映了“衣着”42.9%,“居住”98.1%,“生活用品及服务”17.0%,“医疗保健”15.0%,“其他用品及服务”14.4%,第二维度主要反映了“食品烟酒”75.9%,“教育文化娱乐”31.9%,“医疗保健”65.8%。
上图为“维数1转换的地区类别图”是各个地区在第1个维度上的得分图,由图可知“西藏(26)”与“内蒙古(5)”的得分最高;
上图为“维数2转换的地区类别图”是地区在第2个维度上的得分图,由图可知“吉林”的得分最高;
上图为“维数1转换的种类类别图”是消费种类在第1个维度上的得分图,由图可知“衣着”类的得分最高;
上图为“维数2转换的种类类别图”是消费种类在第2个维度上的得分图,由图可知“医疗保健”类的得分最高;
如上图所示经过对数据的分析和简化,在图中可以清楚地看出来,各个地区的不同消费支出倾向,正如开始对数据简单观察上得出的结论,北京上海这两个地区的消费支出和居住有着密切关系,而其他地区并不是特别明显。大部分地区的主要消费还是偏向于食品烟酒。西藏的消费支出情况与其他地区明显不是一类。
(二)因子分析
1.2.1相关矩阵
食品烟酒
衣着
居住
生活用品及服务
交通通信
教育文化娱乐
医疗保健
其他用品及服务
相关
食品烟酒
1.000
.655
.889
.855
.880
.822
.676
.885
衣着_
.655
1.000
.699
.832
.780
.745
.836
.825
居住
.889
.699
1.000
.893
.859
.920
.797
.943
生活用品及服务
.855
.832
.893
1.000
.862
.886
.782
.912
交通通信
.880
.780
.859
.862
1.000
.880
.791
.881
教育文化娱乐
.822
.745
.920
.886
.880
1.000
.867
.916
医疗保健
.676
.836
.797
.782
.791
.867
1.000
.843
其他用品及服务
.885
.825
.943
.912
.881
.916
.843
1.000
表1.2.1为相关矩阵表,由表可知,8个指标之间存在着高度相关关系,其中居住和其他用品及服务的相关系数最大为0.943,衣着和食品烟酒的相关系数最小为0.655,各指标相关程度都十分高,因此可以进行因子分析。
1.2.2 KMO 和 Bartlett 的检验
KMO 和 Bartlett 的检验
取样足够度的 Kaiser-Meyer-Olkin 度量。
.848
Bartlett 的球形度检验
近似卡方
363.131
df
28
Sig.
.000
由表1.2.2可知,KMO值为0.848>0.6,效度较高,通过了检验,Sig为0.000,因此可以进行因子分析。
1.2.3 公因子方差
初始
提取
食品烟酒
1.000
.936
衣着
1.000
.926
居住
1.000
.938
生活用品及服务
1.000
.901
交通通信
1.000
.884
教育文化娱乐
1.000
.906
医疗保健
1.000
.902
其他用品及服务
1.000
.949
表1.2.3可知,这8个指标对所提取的公因子的依赖程度都大于0.8,可以看出所有指标对提取公因子的依赖程度都很高。
1.2.4解释的总方差
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
6.864
85.800
85.800
6.864
85.800
85.800
4.208
52.598
52.598
2
.478
5.974
91.774
.478
5.974
91.774
3.134
39.175
91.774
3
.250
3.130
94.903
4
.161
2.013
96.916
5
.108
1.354
98.270
6
.067
.833
99.104
7
.047
.582
99.685
8
.025
.315
100.000
表1.2.4可知,第一个因子的特征值大于1,若在提取时选用基于特征值法提取,则只能提取到第一个i,故采用固定因子数量,提取到前两个因子,第一个因子贡献度85.8%,,两因子累计贡献度为91.774%,而其他6个因子所占贡献度不足10%,故两因子足够解释。
1.2.5 成份矩阵
成份矩阵a
成份
1
2
食品烟酒
.901
-.352
衣着
.857
.437
居住
.947
-.201
生活用品及服务
.949
-.021
交通通信
.937
-.081
教育文化娱乐
.951
-.035
医疗保健
.888
.336
其他用品及服务
.974
-.036
表1.2.5,8个指标在第一个公因子上的载荷都很高,说明它们与第一个公因子的相关程度很高,第一个因子很重要;而与第二个因子相关性均很小,它对原有指标的解释不显著。因子的意义含糊不清,不利于对因子进行解释,因此进行旋转。
1.2.6 旋转成份矩阵
旋转成份矩阵a
成份
1
2
食品烟酒
.916
.312
衣着
.373
.887
居住
.854
.457
生活用品及服务
.739
.596
交通通信
.768
.542
教育文化娱乐
.750
.587
医疗保健
.463
.829
其他用品及服务
.768
.600
表1.2.6,经过旋转以后,因子系数有了比较明显的分化,意义明显,第一个因子主要解释了,食品烟酒,居住,生活用品及服务,交通通信,教育文化娱乐,其他用品及服务,这6个指标在第一个因子上均有较大载荷,并且这6个因子与我们的日常消费密切相关,代表了大部分的主要消费支出,也体现了以食品烟酒消费为主的主要消费形态。第二个因子主要解释了衣着和医疗保健,这两个消费是我们对生活需求较为必要的消费。
1.2.7 成份得分系数矩阵
成份得分系数矩阵
成份
1
2
食品烟酒
.576
-.479
衣着
-.494
.780
居住
.377
-.233
生活用品及服务
.134
.056
交通通信
.214
-.042
教育文化娱乐
.153
.033
医疗保健
-.354
.620
其他用品及服务
.158
.033
表1.2.7,成份得分系数,由此可算出各地区在两因子下的得分。
F1=0.576*X1-0.494*X2+0.377*X3+0.134*X4+0.214*X5+0.153*X6-0.354*X7+0.158*X8;
F2=-0.479*X1+0.780*X2-0.233*X3+0.056*X4-0.042*X5+0.033*X6+0.620*X7+0.033*X8。
各地区的因子得分与排名如下表
地区
F1
排名
F2
F2排名
F
F排名
北京
1.88
2
2.35
1
1.91
2
天津
0.76
6
1.19
4
0.79
6
河北
-0.59
22
0.03
18
-0.55
22
山西
-1.02
29
0.41
11
-0.93
29
内蒙古
-0.54
21
1.47
2
-0.41
20
辽宁
-0.46
20
1.22
3
-0.35
18
吉林
-1.1
31
1.16
5
-0.95
31
黑龙江
-1.07
30
0.94
6
-0.94
30
上海
3.15
1
0.68
8
2.99
1
江苏
0.69
8
0.5
9
0.68
7
浙江
1.25
4
0.42
10
1.2
4
安徽
-0.23
13
-0.62
23
-0.25
14
福建
1.2
5
-0.86
24
1.07
5
江西
-0.14
11
-0.95
25
-0.19
11
山东
-0.35
18
0.17
16
-0.32
17
河南
-0.87
27
0.27
13
-0.8
28
湖北
-0.32
16
-0.09
19
-0.3
16
湖南
0.04
10
-0.43
21
0.01
10
广东
1.88
3
-1.24
28
1.67
3
广西
0.14
9
-1.6
29
0.03
9
海南
0.72
7
-1.76
31
0.55
8
重庆
-0.24
14
0.06
17
-0.22
13
四川
-0.19
12
-0.38
20
-0.2
12
贵州
-0.33
17
-1.14
26
-0.38
19
云南
-0.24
15
-1.15
27
-0.3
15
西藏
-0.44
19
-1.67
30
-0.52
21
陕西
-0.63
24
0.21
15
-0.58
24
甘肃
-0.67
25
-0.5
22
-0.66
25
青海
-0.61
23
0.31
12
-0.55
23
宁夏
-0.88
28
0.74
7
-0.77
27
新疆
-0.81
26
0.25
14
-0.74
26
通过对我国城镇居民消费支出情况的因子分析,我们可以将我国31个地区的居民消费结构按照排名顺序可分为三类,第一类为北京、上海、浙江、福建、广东等经济发达地区为一类,因为这些省市的综合得分都在1分以上;第二类为天津、江苏、湖南、广西、海南等经济一般地区为一类,因为这些省份的综合得分都在0分以上,1分以下;第三类为其余的城市,基本属于经济较为落后地区,城市化水平不高,这部分城市大多属于中西部欠发达城市被归为一类,因为这些省份的综合得分均在0分以下。得分越高,居民消费支出的综合水平越高。
我们可以看出,消费支出得分及排名结果显示出与目前我国的经济发展状况相类似,得分较高的地区如北京、上海是我国的政治中心和经济中心,紧随其次的得分较为突出的城市,均属于东南沿海,西南沿海城市,他们的发展速度快,经济实力强,经济结构稳定,导致其消费支出状况也较为良好,而0分以下地区,均属于中和西部欠发达城市,如新疆、陕西、甘肃等较为偏远地区,相对比沿海城市,所欠缺的还有很多。还有如河南、山东、安徽等人口较多的省份,得分均为负值,这说明虽然是人口的大省,但是在消费支出上的得分可以看出,其发展程度,经济实力也都十分薄弱,但是相对于西部欠发达城市还是有一定发展优势。基本位于中部地区,是各个地方的经济流通纽带,从而使这些地区的经济发展要快于西部。
(三)聚类分析
1.3.1 案例处理汇总
案例处理汇总a,b
案例
有效
缺失
总计
N
百分比
N
百分比
N
百分比
31
100.0
0
.0
31
100.0
1.3.1由表可知,数据样本容量为31,没有无效样本。
1.3.2 聚类表
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集 1
群集 2
群集 1
群集 2
北京
24
25
.000
0
0
13
天津
4
11
.000
0
0
14
河北
16
31
.000
0
0
8
山西
3
22
.001
0
0
18
内蒙古
2
6
.001
0
0
9
辽宁
15
27
.002
0
0
16
吉林
18
23
.003
0
0
15
黑龙江
16
29
.005
3
0
16
上海
2
7
.006
5
0
21
江苏
9
30
.008
0
0
20
浙江
20
26
.010
0
0
17
安徽
13
14
.014
0
0
23
福建
19
24
.020
0
1
23
江西
4
10
.026
2
0
22
山东
18
28
.032
7
0
19
河南
15
16
.040
6
8
22
湖北
20
21
.051
11
0
26
湖南
3
17
.063
4
0
24
广东
12
18
.088
0
15
28
广西
8
9
.125
0
10
25
海南
2
5
.182
9
0
25
重庆
4
15
.255
14
16
24
四川
13
19
.344
12
13
26
贵州
3
4
.568
18
22
28
云南
2
8
.960
21
20
27
西藏
13
20
1.660
23
17
30
陕西
1
2
3.132
0
25
29
甘肃
3
12
4.620
24
19
29
青海
1
3
11.854
27
28
30
宁夏
1
13
30.000
29
26
0
1.3.2表可知,这次聚类过程共进行了31步,如1阶的第16个样本和第29个样本聚为一类,此时有30类,聚合以后的下一阶为9阶。
由树状图,把数据分成4个类别进行分析
类别
地区
第一类
北京(1)上海(9)
天津(2)江苏(10)浙江(11)
第二类
海南(21)广东(19)福建(13)
西藏(26)广西(20)江西(14)贵州(24)云南(25)
第三类
内蒙古(5)辽宁(6)吉林(7)黑龙江(8)宁夏(30)
第四类
山东(15)重庆(22)湖北(17)湖南(18)四川(23)安徽(12)甘肃(28)
河南(16)新疆(31)山西(4)青海(29)陕西(27)河北(3)
通过聚类,将我国31个地区,按不同类型分成了四个大的类别。
第一类中,北京、上海都属于高消费城市,政治中心,经济中心,在各方面的
展开阅读全文