资源描述
SAS/STAT/FACTOR过程使用
SAS/STAT的FACTOR过程可以进行因子分析、分量分析和因子旋转。对因子模型可以使用正交旋转和斜交旋转,可以用回归法计算得分系数,同时把因子得分的估计存贮在输出数据集中;用FACTOR过程计算的所有主要统计量也能存贮在输出数据集中。
FACTOR过程用法很简单,主要使用如下语句:
PROC FACTOR DATA= 数据集 选项;
VAR 原始变量;
RUN;
输出结果包括特征值情况、因子载荷、公因子解释比例,等等。为了计算因子得分,一般在PROC FACTOR语句中加一个SCORE选项和“OUTSTAT=输出数据集”选项,然后用如下的得分过程计算公因子得分:
PROC SCORE DATA=原始数据集 SCORE=FACTOR过程的输出数据集
OUT=得分输出数据集;
VAR 用来计算得分的原始变量集合;
RUN;
PROC FACTOR < options > ;
The following options are available in the PROC FACTOR statement.
ALL
ALPHA=p
CONVERGE=p
CORR
COVARIANCE
COVER <=p>
DATA=SAS-data-set
EIGENVECTORS
GAMMA=p
HEYWOOD
HKPOWER=p
MAXITER=n
METHOD=name
MINEIGEN=p
MSA
NFACTORS=n
NOBS=n
NOCORR
NOINT
NOPRINT
NORM=COV | KAISER | NONE | RAW | WEIGHT
NPLOT=n
OUT=SAS-data-set
OUTSTAT=SAS-data-set
PLOT
POWER=n
PREPLOT
PREROTATE=name
PRINT
PRIORS=name
PROPORTION=p
RANDOM=n
RCONVERGE=p
REORDER
RESIDUALS
RITER=n
ROTATE=name
SCORE
SCREE
SE
SIMPLE
SINGULAR=p
TARGET=SAS-data-set
ULTRAHEYWOOD
VARDEF=DF | N | WDF | WEIGHT | WGT
WEIGHT
三、例子
DATA example8_2;
INPUT diqv$ x1-x6;
Cards;
北京 10265 30.81 6235 3223 65 4955
天津 8164 49.13 4929 2406 21 3182
河北 3376 77.76 3921 1668 47 10266
山西 2819 33.97 3305 1206 26 5922
内蒙 3013 54.51 2863 1208 19 4915
辽宁 6103 124.02 3706 1756 61 6719
吉林 3703 28.65 3174 1609 43 3891
黑龙江 4427 48.51 3375 1766 38 7637
上海 15204 128.93 7191 4245 45 5286
江苏 5785 101.09 4634 2456 67 12039
浙江 6149 41.88 6221 2966 37 8721
安徽 2521 55.74 3795 1302 35 6593
福建 5386 18.35 4506 2048 30 4537
江西 2376 26.28 3376 1537 31 5423
山东 4473 102.54 4264 1715 48 10463
河南 2475 71.36 3299 1231 50 7661
湖北 3341 37.75 4028 1511 56 9744
湖南 2701 43.1 4699 1425 47 9137
广东 6380 51.82 7438 2699 42 8848
广西 2772 32.52 4791 1446 27 5571
海南 4820 5.35 4770 1519 5 1653
四川 2516 80.97 4002 1158 64 18885
贵州 1553 22.07 3931 1086 22 3934
云南 2490 48.48 4085 1010 26 6395
陕西 2344 26.31 3309 962 46 6215
甘肃 1925 14.84 3152 880 17 4131
青海 2910 4.16 3319 1029 7 1176
宁夏 2685 7.94 3382 998 7 1028
新疆 3953 26.65 4163 1136 21 3932
;
proc factor data= example8_2;
var x1-x6;
run;
程序运行的结果:
Initial Factor Method: Principal Components
Prior Communality Estimates: ONE
Eigenvalues of the Correlation Matrix: Total = 6 Average = 1
Eigenvalue Difference Proportion Cumulative
1 3.32465039 1.53397281 0.5541 0.5541
2 1.79067758 1.29809455 0.2984 0.8526
3 0.49258303 0.22859204 0.0821 0.9347
4 0.26399099 0.17552552 0.0440 0.9787
5 0.08846547 0.04883292 0.0147 0.9934
6 0.03963255 0.0066 1.0000
2 factors will be retained by the MINEIGEN criterion.
Factor Pattern
Factor1 Factor2
x1 0.83173 -0.48814
x2 0.73239 0.43062
x3 0.77993 -0.43431
x4 0.89373 -0.40302
x5 0.69159 0.60703
x6 0.45951 0.80462
(默认采用主成分法确定因子载荷矩阵)
前两个主成份解释了85.26%的方差,按照缺省的选择因子个数的准则MINEIGEN,取大于1的特征值,所以取两个因子。
因子模式阵(factor pattern,即因子载荷阵)是最重要的结果。
Variance Explained by Each Factor
Factor1 Factor2
3.3246504 1.7906776
Final Communality Estimates: Total = 5.115328
x1 x2 x3 x4 x5 x6
0.93005305 0.72182667 0.79692502 0.96118012 0.84678120 0.85856190
上述是公因子的方差贡献,和各原始变量的共同度。反映了公因子对各原始变量的解释能力。
第一主成份(因子)在所有五个变量上都有正的载荷,可见这个因子综合反映了发展状况。第二主成份在人均GDP,人均收入,和农村家庭人均纯收入上有负的载荷。但是我们得到的因子解释不够清楚,于是考虑用因子旋转。
proc factor data= example8_2 rotate=varimax;
var x1-x6;
run;
Rotation Method: Varimax
Orthogonal Transformation Matrix
1 2
1 0.81035 0.58595
2 -0.58595 0.81035
Rotated Factor Pattern
Factor1 Factor2
x1 0.96002 0.09178
x2 0.34117 0.77810
x3 0.88650 0.10505
x4 0.96038 0.19709
x5 0.20474 0.89714
x6 -0.09910 0.92127
Variance Explained by Each Factor
Factor1 Factor2
2.7979881 2.3173399
Final Communality Estimates: Total = 5.115328
x1 x2 x3 x4 x5 x6
0.93005305 0.72182667 0.79692502 0.96118012 0.84678120 0.85856190
这时的两个公因子的实际意义要好解释一些。
为了产生因子得分函数,需要在FACTOR过程中使用SCORE选项。为了产生各样品的因子得分值,还要用OUTSTAT=选项输出得分系数数据集并调用SCORE过程。比如,为了计算方差最大正交旋转的主成分得分,可以用如下程序:
PROC FACTOR DATA= example8_2 ROTATE=VARIMAX SCORE OUTSTAT=OUTF;
TITLE2 ′主成分分析及VARIMAX正交旋转′;
RUN;
PROC SCORE DATA= example8_2 SCORE=OUTF OUT=OUTS;
TITLE2 ′ VARIMAX正交旋转后的主成分得分′;
RUN;
Rotation Method: Varimax
Scoring Coefficients Estimated by Regression
Squared Multiple Correlations of the Variables with Each Factor
Factor1 Factor2
1.0000000 1.0000000
Standardized Scoring Coefficients
Factor1 Factor2
x1 0.36246 -0.07432
x2 0.03760 0.32395
x3 0.33222 -0.05909
x4 0.34971 -0.02487
x5 -0.03007 0.39659
x6 -0.15129 0.44511
展开阅读全文