资源描述
SPSS因子分析实例操作步骤
实验目的:
引入2003~2013年全国的农、林、牧、渔业,采矿业,制造 业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:
以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造 业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:因子分析法
软件:spss19.0
操作过程:
第一步:导入Excel数据文件
1. open data document——open data——open;
2. Opening excel data source——OK.
第二步:
1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).
2. 降维:在最上面菜单里面选中Analyze——Dimension Reduction——Factor ,变量选择标准化后的数据.
3. 点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlett’s text of sphericity,点击Continue.
4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.
5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.
6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.
7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0.60,点击Continue.
8.返回主对话框,单击OK.
输出结果分析:
1.描述性统计量
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
农、林、牧、渔业
11
3.27
9.73
7.6645
1.97515
采 矿 业
11
.6
9.5
5.008
2.7092
制 造 业
11
.44
7.07
2.6900
2.22405
电力、热力、燃气及水生产和供应业
11
3.36
15.05
10.3545
3.22751
建 筑 业
11
1.79
23.51
7.8955
6.18302
批发和零售业
11
2.10
18.52
9.1018
5.50553
交通运输、仓储和邮政业
11
.82
8.39
2.7891
2.20903
Valid N (listwise)
11
该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
2.KMO和球形Bartlett检验
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
.744
Bartlett's Test of Sphericity
Approx. Chi-Square
97.122
df
21
Sig.
.000
该表给出了因子分析的KMO和Bartlett检验结果。从表中可以看出,Bartlett球度检验的概率p值为0.000,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.744,根据KMO度量标准可知,原变量适合进行因子分析。
3.因子分析的共同度
Communalities
Initial
Extraction
Zscore(农、林、牧、渔业)
1.000
.883
Zscore: 采 矿 业
1.000
.741
Zscore: 制 造 业
1.000
.974
Zscore(电力、热力、燃气及水生产和供应业)
1.000
.992
Zscore: 建 筑 业
1.000
.987
Zscore(批发和零售业)
1.000
.965
Zscore(交通运输、仓储和邮政业)
1.000
.935
Extraction Method: Principal Component Analysis.
表格所示是因子分析的共同度。表格第二列显示初始共同度,全部为1.000;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。
4. 因子分析的总方差解释
Total Variance Explained
Component
Initial Eigenvalues
Extraction Sums of Squared Loadings
Rotation Sums of Squared Loadings
Total
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
Total
% of Variance
Cumulative %
1
3.079
43.992
43.992
3.079
43.992
43.992
2.660
37.999
37.999
2
2.353
33.608
77.600
2.353
33.608
77.600
2.346
33.517
71.516
3
1.046
14.941
92.541
1.046
14.941
92.541
1.472
21.025
92.541
4
.413
5.905
98.446
5
.098
1.399
99.845
6
.011
.152
99.997
7
.000
.003
100.000
Extraction Method: Principal Component Analysis.
该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。
Initial Eigenvalues部分描述了初始因子解的状况。第一个因子的特征根为3.079,解释7个原始变量总方差的43.992%;第二个因子的特征根为2.353,解释7个原始变量总方差的33.608%,累计方差贡献率为77.600%;第三个因子的特征根为1.046,解释7个原始变量总方差的14.941%,累计方差贡献率为92.541%,也就是说,三个变量解释了所有7各变量的90%以上,且也只有这三个变量的特征值大于1。
Extraction Sums of Squared Loadings部分和 Rotation Sums of Squared Loadings部分描述了因子提取后和旋转后的因子解。从表中看出,有三个因子提取和旋转,其累计解释总方差百分比和初始解的前三个变量相同,但经旋转后的因子重新分配各个因子的解释原始变量的方差,使得因子的方差更接近,也更易于解释。
5. 碎石图
利用因子分析的碎石图可以更加直观的发现最优因子的数量。在碎石图中,横坐标表示因子数目,纵坐标表示特征根。从图中可以看出,前三个因子的特征跟都很大,从第四个开始,因子的特征根都小于一,且连线变得较平缓,及前三个因子对解释变量的贡献最大,
6. 旋转前的因子载荷矩阵
Component Matrixa
Component
1
2
3
Zscore(电力、热力、燃气及水生产和供应业)
.871
Zscore(交通运输、仓储和邮政业)
-.860
Zscore: 采 矿 业
.857
Zscore(农、林、牧、渔业)
.704
Zscore(批发和零售业)
.726
.569
Zscore: 建 筑 业
.687
.364
Zscore: 制 造 业
.600
.793
Extraction Method: Principal Component Analysis.
a. 3 components extracted.
该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转前的载荷矩阵中所有变量在第一个因子上的载荷都较高,即与第一个因子的相关程度较高,第一个因子解释了大部分变量的信息;而后面两个因子与原始变量的相关程度较小,对原始变量的解释效果不明显,没有旋转的因子的含义很难解释。
7. 旋转后的因子载荷矩阵
Rotated Component Matrixa
Component
1
2
3
Zscore(农、林、牧、渔业)
.899
Zscore(交通运输、仓储和邮政业)
-.716
-.3.41
Zscore: 采 矿 业
.771
.352
Zscore(电力、热力、燃气及水生产和供应业)
.749
.440
.441
Zscore: 建 筑 业
.985
Zscore(批发和零售业)
.961
Zscore: 制 造 业
.873
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。和没旋转相比,因子的含义清楚很多。
8.旋转空间的因子图
该图为可以看做是旋转后的载荷矩阵的图形表示。从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。
8. 因子得分系数
Component Score Coefficient Matrix
Component
1
2
3
Zscore(农、林、牧、渔业)
.445
.075
-.350
Zscore: 采 矿 业
.261
-.054
.093
Zscore: 制 造 业
-.180
.008
.761
Zscore(电力、热力、燃气及水生产和供应业)
.201
.182
.263
Zscore: 建 筑 业
-.074
.429
.156
Zscore(批发和零售业)
.071
.402
-.130
Zscore(交通运输、仓储和邮政业)
-.322
.204
.050
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Component Scores.
列出了采用回归法估算的因子得分系数,根据表中的内容可以写出因子得分函数
F1=0.445*Zscore1+0.261*Zscore2-0.180*Zscore3+0.201*Zscore4-0.074*Zscore5+0.071*Zscore6-0.322*Zscore7
F2=0.075*Zscore1-0.054*Zscore2+0.008*Zscore3+0.182*Zscore4-0.429*Zscore5+0.402*Zscore6-0.204*Zscore7
F3=-0.350*Zscore1+0.093*Zscore2+0.761*Zscore3+0.263*Zscore4+0.156*Zscore5-0.130*Zscore6+0.050*Zscore7
不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。
9.总因子得分及排序
附件:
原始数据:
标准化后的数据:
展开阅读全文