资源描述
统计学第二次作业
学 院: 管理与经济学部
专 业: 公共管理
姓 名: 刘玥汐
学 号: 2014209214
2014年 9 月 26日
天津大学
城镇居民生活质量指标因子分析
摘要:本文主要运用SPSS18,采用因子分析的方法,对反映城镇居民生活质量的各项指标进行因子分析,找出主要因子,并建立因子模型量,找出反映生活质量的各项指标背后的主要因子。
关键词:SPSS18 因子分析 居民生活质量
1、研究背景及意义
居民生活质量只要用于反映居民生活需要满足程度。随着当今社会的不断发展和进步,城镇居民的生活质量也有了不同程度的改善,进一步改善城镇居民生活质量是城镇化发展进程的重要依据,也是构建和谐社会的重要保障。
为此,本研究选取不同年份,城镇居民生活的各项指标变量,并利用SPSS因子分析,对各个指标变量进行降维,进而找出对多个城镇居民生活指标的的主要推动因子,探究影响居民生活质量的主要因子。
2、问题的提出
下表为我国城镇居民2002—2012年有关城镇居民生活水平的一些指标数据,通过SPSS因子分析,构建相关模型,从中多个指标中找出背后真正影响城镇居民生活质量的因子。
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
X13
X14
7702
6030
27
16
1
78
67
5
23
71
95
21
134
5
8472
6511
27
21
1
86
77
7
23
71
95
28
188
5
9421
7182
28
50
2
89
82
7
24
71
95
33
239
5
10493
7943
30
57
3
91
82
8
25
71
96
42
307
5
10453
8697
31
63
4
87
85
8
25
71
96
47
378
5
11459
9997
32
69
6
94
87
9
26
71
97
54
448
5
15781
11243
32
48
9
95
90
10
28
71
97
59
512
5
17175
12265
34
57
11
96
91
11
31
71
97
66
531
5
19109
13471
34
86
13
97
92
11
33
75
98
71
575
6
21810
15161
35
95
19
97
92
12
35
75
98
82
608
6
24565
16674
36
103
22
97
93
12
39
75
98
87
625
6
其中各个指标变量代表:
X1:城镇居民人均可支配收入
X2:城镇居民人均消费支出
X3:城镇居民人均住房面积
X4:每百人移动电话普及数
X5:城镇居民每百户拥有家庭汽车辆
X6:用水普及率
X7:燃气普及率
X8:人均拥有绿地面积
X9:每万人口医院床位数
X10:人均预期寿命
X11:城镇电视节目人口覆盖率
X12:每百户电脑拥有量
X13:普通本专科院校毕业生人数(万人)
X14:人均拥有图书册数
3、因子分析
3.1 变量的相关性分析和共同度分析
(1)相关性分析
表1rrelation Matrixa
城镇居民人均可支配收入X1
城镇居民人均消费支出X2
城镇居民人均住房面积X3
每百人移动电话普及数X4
城镇居民每百户拥有家庭汽车辆X5
用水普及率X6
燃气普及率X7
人均拥有绿地面积X8
每万人口医院床位数X9
人均预期寿命X10
城镇电视节目人口覆盖率X11
每百户电脑拥有量X12
普通本专科院校毕业生人数X13
人均拥有图书册数X14
Correlation
城镇居民人均可支配收入X1
1.00
.991
.951
.844
.992
.825
.829
.961
.992
.845
.950
.968
.925
.889
城镇居民人均消费支出X2
.991
1.00
.978
.883
.990
.851
.868
.979
.985
.827
.976
.989
.958
.837
城镇居民人均住房面积X3
.951
.978
1.00
.894
.944
.896
.930
.991
.932
.741
.997
.996
.992
.727
每百人移动电话普及数X4
.844
.883
.894
1.00
.864
.812
.856
.900
.854
.799
.892
.908
.872
.580
城镇居民每百户拥有家庭汽车辆X5
.992
.990
.944
.864
1.00
.794
.805
.948
.996
.862
.937
.965
.911
.892
用水普及率X6
.825
.851
.896
.812
.794
1.00
.959
.924
.777
.580
.914
.895
.916
.516
燃气普及率X7
.829
.868
.930
.856
.805
.959
1.00
.946
.787
.575
.946
.923
.952
.499
人均拥有绿地面积X8
.961
.979
.991
.900
.948
.924
.946
1.00
.939
.761
.995
.994
.985
.732
每万人口医院床位数X9
.992
.985
.932
.854
.996
.777
.787
.939
1.00
.874
.927
.953
.896
.899
人均预期寿命X10
.845
.827
.741
.799
.862
.580
.575
.761
.874
1.00
.734
.778
.697
.822
城镇电视节目人口覆盖率X11
.950
.976
.997
.892
.937
.914
.946
.995
.927
.734
1.00
.994
.996
.714
每百户电脑拥有量X12
.968
.989
.996
.908
.965
.895
.923
.994
.953
.778
.994
1.00
.984
.761
普通本专科院校毕业生人数X13
.925
.958
.992
.872
.911
.916
.952
.985
.896
.697
.996
.984
1.00
.677
人均拥有图书册数X14
.889
.837
.727
.580
.892
.516
.499
.732
.899
.822
.714
.761
.677
1.00
a. This matrix is not positive definite.
由表1,可以看出这14个变量中,大部分指标间的相关系数较大,相关性非常强,因此可以进行因子分析。
(2)共同度分析
表2 Communalities
Initial
Extraction
城镇居民人均可支配收入X1
1.000
.989
城镇居民人均消费支出X2
1.000
.995
城镇居民人均住房面积X3
1.000
.985
每百人移动电话普及数X4
1.000
.836
城镇居民每百户拥有家庭汽车辆X5
1.000
.992
用水普及率X6
1.000
.929
燃气普及率X7
1.000
.984
人均拥有绿地面积X8
1.000
.997
每万人口医院床位数X9
1.000
.991
人均预期寿命X10
1.000
.858
城镇电视节目人口覆盖率X11
1.000
.991
每百户电脑拥有量X12
1.000
.995
普通本专科院校毕业生人数X13
1.000
.978
人均拥有图书册数X14
1.000
.946
Extraction Method: Principal Component Analysis.
由共同度分析,可以看出:这14个变量指标的共同度都达到了0.858以上。说明,这些变量指标都能很好地用公共因子来解释,因子分析可以继续进行。
3.2 解释总方差分析
表3 Total Variance Explained
Component
Initial Eigenvalues
Extraction Sums of Squared Loadings
Rotation Sums of Squared Loadings
Total
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
dimension0
1
12.456
88.968
88.968
12.456
88.968
88.968
7.681
54.863
54.863
2
1.011
7.224
96.192
1.011
7.224
96.192
5.786
41.329
96.192
3
.323
2.308
98.499
4
.115
.819
99.318
5
.054
.386
99.705
6
.021
.152
99.856
7
.010
.075
99.931
8
.005
.035
99.967
9
.003
.024
99.991
10
.001
.009
100.000
11
6.116E-16
4.369E-15
100.000
12
1.061E-16
7.580E-16
100.000
13
-9.188E-17
-6.563E-16
100.000
14
-1.523E-16
-1.088E-15
100.000
Extraction Method: Principal Component Analysis.
由表3可以看出:第一个特征值为12.456,累计贡献率为88.968%;第二个特征值为1.011,累计贡献率达到96.192%。因此,基于过程内定取特征值大于1的原则,因子分析提取了前两个因子,将其降职二维问题。
3.3 碎石图分析
由碎石图可以看出:前两个主成分特征值大于1,从第三个主成分开始特征根开始减小,因此说明用前两个因子可以概括大部分信息。
3.4 因子载荷分析
表4 Component Matrixa
Component
1
2
城镇居民人均可支配收入X1
.983
.153
城镇居民人均消费支出X2
.995
.068
城镇居民人均住房面积X3
.986
-.113
每百人移动电话普及数X4
.908
-.110
城镇居民每百户拥有家庭汽车辆X5
.978
.189
用水普及率X6
.887
-.377
燃气普及率X7
.904
-.408
人均拥有绿地面积X8
.992
-.113
每万人口医院床位数X9
.971
.220
人均预期寿命X10
.822
.426
城镇电视节目人口覆盖率X11
.986
-.140
每百户电脑拥有量X12
.996
-.063
普通本专科院校毕业生人数X13
.970
-.191
人均拥有图书册数X14
.797
.558
Extraction Method: Principal Component Analysis.
a. 2 components extracted.
表4为原始变量的载荷值,但是由表4可以看出:两个因子在原始变量上的载荷值都有些差距,可以进行因子旋转。
表5 Rotated Component Matrixa
Component
1
2
城镇居民人均可支配收入X1
.651
.752
城镇居民人均消费支出X2
.716
.695
城镇居民人均住房面积X3
.826
.550
每百人移动电话普及数X4
.764
.503
城镇居民每百户拥有家庭汽车辆X5
.624
.776
用水普及率X6
.921
.285
燃气普及率X7
.954
.273
人均拥有绿地面积X8
.830
.554
每万人口医院床位数X9
.599
.795
人均预期寿命X10
.352
.857
城镇电视节目人口覆盖率X11
.843
.530
每百户电脑拥有量X12
.801
.595
普通本专科院校毕业生人数X13
.864
.481
人均拥有图书册数X14
.247
.941
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 3 iterations.
旋转后因子对各个变量的解释更加分散了能解释能力提高许多。
3.5因子散点图分析
由旋转后的散点图可以形象看出F1、F2与各个指标变量的关系。
4、建立因子模型
以旋转后的因子荷载建立因子模型:
X1=0.651F1+0.752F2
X2=0.716F1+0.695F2
X3=0.826F1+0.550F2
X4=0.764F1+0.503F2
X5=0.624F1+0.776F2
X6=0.921F1+0.285F2
X7=0.954F1+0.273F2
X8=0.830F1+0.554F2
X9=0.599F1+0.795F2
X10=0.352F1+0.857F2
X11=0.843F1+0.530F2
X12=0.801F1+0.595F2
X13=0.864F1+0.481F2
X14=0.247F1+0.941F2
因子F1上X2(城镇居民人均消费支出)、X3(城镇居民人均住房面积)、X4(每百人移动电话普及数)、X6(用水普及率)、X7(燃气普及率)、X8(人均拥有绿地面积)、X11(城镇电视节目人口覆盖率)、X12(每百户拥有电脑量)、X13(普通本专科院校毕业生人数)载荷较大。可见,F1因子在经济、能源设施、文化等方面的载荷都比较强,因此定义F1为综合因子。
因子F2上X1(城镇居民人均可支配收入)、X5(城镇居民每百户拥有家庭汽车辆)、X9(每万人口医院床位数)、X10(人均预期寿命)、X14(人均拥有图书册数)载荷较大,这几个指标变量,主要反映了人们在基本生活指标得到保障之后,可能会追求更高的需求,因此可将F2其定义为改善因子。
展开阅读全文