收藏 分销(赏)

SAS因子分析简介.doc

上传人:xrp****65 文档编号:9431446 上传时间:2025-03-26 格式:DOC 页数:5 大小:69KB
下载 相关 举报
SAS因子分析简介.doc_第1页
第1页 / 共5页
SAS因子分析简介.doc_第2页
第2页 / 共5页
点击查看更多>>
资源描述
SAS/STAT/FACTOR过程使用 SAS/STAT的FACTOR过程可以进行因子分析、分量分析和因子旋转。对因子模型可以使用正交旋转和斜交旋转,可以用回归法计算得分系数,同时把因子得分的估计存贮在输出数据集中;用FACTOR过程计算的所有主要统计量也能存贮在输出数据集中。 FACTOR过程用法很简单,主要使用如下语句: PROC FACTOR DATA= 数据集 选项; VAR 原始变量; RUN; 输出结果包括特征值情况、因子载荷、公因子解释比例,等等。为了计算因子得分,一般在PROC FACTOR语句中加一个SCORE选项和“OUTSTAT=输出数据集”选项,然后用如下的得分过程计算公因子得分: PROC SCORE DATA=原始数据集 SCORE=FACTOR过程的输出数据集 OUT=得分输出数据集; VAR 用来计算得分的原始变量集合; RUN; PROC FACTOR < options > ; The following options are available in the PROC FACTOR statement. ALL ALPHA=p CONVERGE=p CORR COVARIANCE COVER <=p> DATA=SAS-data-set EIGENVECTORS GAMMA=p HEYWOOD HKPOWER=p MAXITER=n METHOD=name MINEIGEN=p MSA NFACTORS=n NOBS=n NOCORR NOINT NOPRINT NORM=COV | KAISER | NONE | RAW | WEIGHT NPLOT=n OUT=SAS-data-set OUTSTAT=SAS-data-set PLOT POWER=n PREPLOT PREROTATE=name PRINT PRIORS=name PROPORTION=p RANDOM=n RCONVERGE=p REORDER RESIDUALS RITER=n ROTATE=name SCORE SCREE SE SIMPLE SINGULAR=p TARGET=SAS-data-set ULTRAHEYWOOD VARDEF=DF | N | WDF | WEIGHT | WGT WEIGHT 三、例子 DATA example8_2; INPUT diqv$ x1-x6; Cards; 北京 10265 30.81 6235 3223 65 4955 天津 8164 49.13 4929 2406 21 3182 河北 3376 77.76 3921 1668 47 10266 山西 2819 33.97 3305 1206 26 5922 内蒙 3013 54.51 2863 1208 19 4915 辽宁 6103 124.02 3706 1756 61 6719 吉林 3703 28.65 3174 1609 43 3891 黑龙江 4427 48.51 3375 1766 38 7637 上海 15204 128.93 7191 4245 45 5286 江苏 5785 101.09 4634 2456 67 12039 浙江 6149 41.88 6221 2966 37 8721 安徽 2521 55.74 3795 1302 35 6593 福建 5386 18.35 4506 2048 30 4537 江西 2376 26.28 3376 1537 31 5423 山东 4473 102.54 4264 1715 48 10463 河南 2475 71.36 3299 1231 50 7661 湖北 3341 37.75 4028 1511 56 9744 湖南 2701 43.1 4699 1425 47 9137 广东 6380 51.82 7438 2699 42 8848 广西 2772 32.52 4791 1446 27 5571 海南 4820 5.35 4770 1519 5 1653 四川 2516 80.97 4002 1158 64 18885 贵州 1553 22.07 3931 1086 22 3934 云南 2490 48.48 4085 1010 26 6395 陕西 2344 26.31 3309 962 46 6215 甘肃 1925 14.84 3152 880 17 4131 青海 2910 4.16 3319 1029 7 1176 宁夏 2685 7.94 3382 998 7 1028 新疆 3953 26.65 4163 1136 21 3932 ; proc factor data= example8_2; var x1-x6; run; 程序运行的结果: Initial Factor Method: Principal Components Prior Communality Estimates: ONE Eigenvalues of the Correlation Matrix: Total = 6 Average = 1 Eigenvalue Difference Proportion Cumulative 1 3.32465039 1.53397281 0.5541 0.5541 2 1.79067758 1.29809455 0.2984 0.8526 3 0.49258303 0.22859204 0.0821 0.9347 4 0.26399099 0.17552552 0.0440 0.9787 5 0.08846547 0.04883292 0.0147 0.9934 6 0.03963255 0.0066 1.0000 2 factors will be retained by the MINEIGEN criterion. Factor Pattern Factor1 Factor2 x1 0.83173 -0.48814 x2 0.73239 0.43062 x3 0.77993 -0.43431 x4 0.89373 -0.40302 x5 0.69159 0.60703 x6 0.45951 0.80462 (默认采用主成分法确定因子载荷矩阵) 前两个主成份解释了85.26%的方差,按照缺省的选择因子个数的准则MINEIGEN,取大于1的特征值,所以取两个因子。 因子模式阵(factor pattern,即因子载荷阵)是最重要的结果。 Variance Explained by Each Factor Factor1 Factor2 3.3246504 1.7906776 Final Communality Estimates: Total = 5.115328 x1 x2 x3 x4 x5 x6 0.93005305 0.72182667 0.79692502 0.96118012 0.84678120 0.85856190 上述是公因子的方差贡献,和各原始变量的共同度。反映了公因子对各原始变量的解释能力。 第一主成份(因子)在所有五个变量上都有正的载荷,可见这个因子综合反映了发展状况。第二主成份在人均GDP,人均收入,和农村家庭人均纯收入上有负的载荷。但是我们得到的因子解释不够清楚,于是考虑用因子旋转。 proc factor data= example8_2 rotate=varimax; var x1-x6; run; Rotation Method: Varimax Orthogonal Transformation Matrix 1 2 1 0.81035 0.58595 2 -0.58595 0.81035 Rotated Factor Pattern Factor1 Factor2 x1 0.96002 0.09178 x2 0.34117 0.77810 x3 0.88650 0.10505 x4 0.96038 0.19709 x5 0.20474 0.89714 x6 -0.09910 0.92127 Variance Explained by Each Factor Factor1 Factor2 2.7979881 2.3173399 Final Communality Estimates: Total = 5.115328 x1 x2 x3 x4 x5 x6 0.93005305 0.72182667 0.79692502 0.96118012 0.84678120 0.85856190 这时的两个公因子的实际意义要好解释一些。 为了产生因子得分函数,需要在FACTOR过程中使用SCORE选项。为了产生各样品的因子得分值,还要用OUTSTAT=选项输出得分系数数据集并调用SCORE过程。比如,为了计算方差最大正交旋转的主成分得分,可以用如下程序: PROC FACTOR DATA= example8_2 ROTATE=VARIMAX SCORE OUTSTAT=OUTF; TITLE2 ′主成分分析及VARIMAX正交旋转′; RUN; PROC SCORE DATA= example8_2 SCORE=OUTF OUT=OUTS; TITLE2 ′ VARIMAX正交旋转后的主成分得分′; RUN; Rotation Method: Varimax Scoring Coefficients Estimated by Regression Squared Multiple Correlations of the Variables with Each Factor Factor1 Factor2 1.0000000 1.0000000 Standardized Scoring Coefficients Factor1 Factor2 x1 0.36246 -0.07432 x2 0.03760 0.32395 x3 0.33222 -0.05909 x4 0.34971 -0.02487 x5 -0.03007 0.39659 x6 -0.15129 0.44511
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服