1、SPSS因子分析实例操作步骤 实验目的: 引入2003~2013年全国的农、林、牧、渔业,采矿业,制造 业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。 实验变量: 以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造 业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。 实验方法:因子分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件 1. open data document——open
2、data——open; 2. Opening excel data source——OK. 第二步: 1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量). 2. 降维:在最上面菜单里面选中Analyze——Dimension Reduction——Factor ,变量选择标准化后的数据. 3. 点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlett’s text o
3、f sphericity,点击Continue. 4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue. 5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue. 6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue. 7.点击
4、右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0.60,点击Continue. 8.返回主对话框,单击OK. 输出结果分析: 1.描述性统计量 Descriptive Statistics N Minimum Maximum Mean Std. Deviation 农、林、牧、渔业 11 3.27 9.73 7.6645 1.97515 采 矿 业 11 .6 9.5 5.008 2.7092
5、 制 造 业 11 .44 7.07 2.6900 2.22405 电力、热力、燃气及水生产和供应业 11 3.36 15.05 10.3545 3.22751 建 筑 业 11 1.79 23.51 7.8955 6.18302 批发和零售业 11 2.10 18.52 9.1018 5.50553 交通运输、仓储和邮政业 11 .82 8.39 2.7891 2.20903 Valid N (listwise) 11 该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、
6、标准差。 2.KMO和球形Bartlett检验 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .744 Bartlett's Test of Sphericity Approx. Chi-Square 97.122 df 21 Sig. .000 该表给出了因子分析的KMO和Bartlett检验结果。从表中可以看出,Bartlett球度检验的概率p值为0.000,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.744,根据
7、KMO度量标准可知,原变量适合进行因子分析。 3.因子分析的共同度 Communalities Initial Extraction Zscore(农、林、牧、渔业) 1.000 .883 Zscore: 采 矿 业 1.000 .741 Zscore: 制 造 业 1.000 .974 Zscore(电力、热力、燃气及水生产和供应业) 1.000 .992 Zscore: 建 筑 业 1.000 .987 Zscore(批发和零售业) 1.000 .965 Zscore(交通运输、仓储和邮政业) 1.000 .935
8、Extraction Method: Principal Component Analysis. 表格所示是因子分析的共同度。表格第二列显示初始共同度,全部为1.000;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。 4. 因子分析的总方差解释 Total Variance Explained Component Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Total % of Var
9、iance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % 1 3.079 43.992 43.992 3.079 43.992 43.992 2.660 37.999 37.999 2 2.353 33.608 77.600 2.353 33.608 77.600 2.346 33.517 71.516 3 1.046 14.941 92.541 1.046 14.941 92.541 1.472 21.025
10、 92.541 4 .413 5.905 98.446 5 .098 1.399 99.845 6 .011 .152 99.997 7 .000 .003 100.000 Extraction Method: Principal Component Analysis. 该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。 Initial Eigenvalues部分描述了初始因子解的状况。第一个因子的特征根为3.079,解释
11、7个原始变量总方差的43.992%;第二个因子的特征根为2.353,解释7个原始变量总方差的33.608%,累计方差贡献率为77.600%;第三个因子的特征根为1.046,解释7个原始变量总方差的14.941%,累计方差贡献率为92.541%,也就是说,三个变量解释了所有7各变量的90%以上,且也只有这三个变量的特征值大于1。 Extraction Sums of Squared Loadings部分和 Rotation Sums of Squared Loadings部分描述了因子提取后和旋转后的因子解。从表中看出,有三个因子提取和旋转,其累计解释总方差百分比和初始解的前三个变量相同,但经
12、旋转后的因子重新分配各个因子的解释原始变量的方差,使得因子的方差更接近,也更易于解释。 5. 碎石图 利用因子分析的碎石图可以更加直观的发现最优因子的数量。在碎石图中,横坐标表示因子数目,纵坐标表示特征根。从图中可以看出,前三个因子的特征跟都很大,从第四个开始,因子的特征根都小于一,且连线变得较平缓,及前三个因子对解释变量的贡献最大, 6. 旋转前的因子载荷矩阵 Component Matrixa Component 1 2 3 Zscore(电力、热力、燃气及水生产和供应业) .871 Zscore(交通运输、仓储和邮政业) -.860
13、 Zscore: 采 矿 业 .857 Zscore(农、林、牧、渔业) .704 Zscore(批发和零售业) .726 .569 Zscore: 建 筑 业 .687 .364 Zscore: 制 造 业 .600 .793 Extraction Method: Principal Component Analysis. a. 3 components extracted. 该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。 在旋
14、转前的载荷矩阵中所有变量在第一个因子上的载荷都较高,即与第一个因子的相关程度较高,第一个因子解释了大部分变量的信息;而后面两个因子与原始变量的相关程度较小,对原始变量的解释效果不明显,没有旋转的因子的含义很难解释。 7. 旋转后的因子载荷矩阵 Rotated Component Matrixa Component 1 2 3 Zscore(农、林、牧、渔业) .899 Zscore(交通运输、仓储和邮政业) -.716 -.3.41 Zscore: 采 矿 业 .771 .352 Zscore(电力、热力、燃气及水生产和供应业
15、) .749 .440 .441 Zscore: 建 筑 业 .985 Zscore(批发和零售业) .961 Zscore: 制 造 业 .873 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. 该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。 在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的
16、产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。和没旋转相比,因子的含义清楚很多。 8.旋转空间的因子图 该图为可以看做是旋转后的载荷矩阵的图形表示。从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。 8. 因子得分系数 Component Score Coefficient Matrix Component 1 2 3 Zscore(农、林、牧、渔业) .445 .075 -.350 Zscore: 采 矿 业 .261 -.054 .093 Zscore: 制 造 业 -.180 .
17、008 .761 Zscore(电力、热力、燃气及水生产和供应业) .201 .182 .263 Zscore: 建 筑 业 -.074 .429 .156 Zscore(批发和零售业) .071 .402 -.130 Zscore(交通运输、仓储和邮政业) -.322 .204 .050 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores. 列出了采用回归
18、法估算的因子得分系数,根据表中的内容可以写出因子得分函数 F1=0.445*Zscore1+0.261*Zscore2-0.180*Zscore3+0.201*Zscore4-0.074*Zscore5+0.071*Zscore6-0.322*Zscore7 F2=0.075*Zscore1-0.054*Zscore2+0.008*Zscore3+0.182*Zscore4-0.429*Zscore5+0.402*Zscore6-0.204*Zscore7 F3=-0.350*Zscore1+0.093*Zscore2+0.761*Zscore3+0.263*Zscore4+0.156*Zscore5-0.130*Zscore6+0.050*Zscore7 不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。 9.总因子得分及排序 附件: 原始数据: 标准化后的数据:






