ImageVerifierCode 换一换
格式:PPT , 页数:32 ,大小:239.04KB ,
资源ID:13128063      下载积分:8 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/13128063.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(五讲的多元统计分析.ppt)为本站上传会员【w****g】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

五讲的多元统计分析.ppt

1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第五讲的多元统计分析,优选第五讲

2、的多元统计分析,SAS,多元统计分析概论,现实中的统计对象经常用多个指标来表示,比如人口普查,就可以有姓名、性别、出生年月日、籍贯、婚姻状况、民族、政治面貌、地区等,企业调查,可以有净资产、负债、盈利、职工人数、还贷情况等等。多个指标(变量)可以分别进行分析,但是,我们往往希望综合使用这些指标,这时,有主分量分析、因子分析等方法可以把数据的维数降低,同时又尽量不损失数据中的信息。,SAS,多元统计分析概论,I.,主分量分析,一、理论介绍,主分量分析的目的是从原始的多个变量取若干线性组合,能尽可能多地保留原始变量 中的信息。从原始变量到新变量是一个正交变换(坐标变换)。设有,是一个,维随机变量,

3、有二阶矩,记,,,。考虑它的线性变换,IOWA 2.,HOUSTON 52.,NEW JERSEY 5.,MINNEAPOLIS 12.,SAS的PRINTCOMP过程有如下功能:,MAINE 2.,PROC PRINCOMP COV OUT=PRIN;,OREGON 4.,Eigenvalue 2.,945071(JULY-75.,326866)(JANUARY-32.,POP 0.,MASSACHUSETTS 3.,MISSOURI 9.,2924777 46.,SAS,的,PRINTCOMP,过程有如下功能:,完成主分量分析。,主分量的个数可以由用户自己确定,主分量的名字可以用户自己规定

4、主分量得分是否标准化可自己规定。,输入数据集可以是原始数据集、相关阵、协方差阵或叉积阵。输入为原始数据时,用户还可以规定从协方差阵出发还是从相关阵出发进行分析。由协方差阵出发时方差大的变量在分析中起到更大的作用。,计算结果有:简单统计量,相关阵或协方差阵,从大到小排序的特征值和相应特征向量,每个主分量解释的方差比例,累计比例等。可生成两个输出数据集:一个包含原始数据及主分量得分,另一个包含有关统计量,类型为,TYPE=CORR,或,COV,。,可揭示变量间的共线关系。若某特征值特别接近,0,说明变量线性相关,这时用这些变量作回归自变量可能得到错误的结果。,PRINCOMP,主要使用,PROC

5、 PRINCOMP,语句与,VAR,语句。,PROC PRINCOMP,语句用来规定输入输出和一些运行选项,包括:,DATA=,输入数据集,可以是原始数据集,也可以是,TYPE=CORR,COV,的数据集,OUT=,输出包含原始数据和主分量得分的数据集,OUTSTAT=,统计量输出数据集,COV,要求从协方差阵出发计算主分量。缺省为从相关阵出发计算。,N=,要计算的主分量个数。缺省时全算。,NOINT,要求在模型中不使用截距项。这时统计量输出数据集类型为,TYPE=UCORR,或,UCOV,。,STD,要求在,OUT=,的数据集中把主分量得分标准化为单位方差。不规定时方差为相应特征值。,用,V

6、AR,语句指定原始变量。必须为数值型(区间变量)。,三、应用举例,例1一月和七月平均气温的主分量分析,在数据集TEMPERAT中存放有 一些城市一月和七月的平均气温。我们希望对这两个气温进行主成分分析,希望用一个统一的温度来作为总的可比的温度,所以进行主分量分析。程序如下:,SAS,多元统计分析概论,/*EXAMPLE 1*/,DATA,TEMPERAT;,INPUT CITY$,1,-,15,JANUARY JULY;,CARDS;,MOBILE 51.2 81.6,PHOENIX 51.2 91.2,LITTLE ROCK 39.5 81.4,SACRAMENTO 45.1 75.2,DE

7、NVER 29.9 73.0,HARTFORD 24.8 72.7,WILMINGTON 32.0 75.8,WASHINGTON DC 35.6 78.7,JACKSONVILLE 54.6 81.0,MIAMI 67.2 82.3,ATLANTA 42.4 78.0,BOISE 29.0 74.5,CHICAGO 22.9 71.9,PEORIA 23.8 75.1,INDIANAPOLIS 27.9 75.0,DES MOINES 19.4 75.1,WICHITA 31.3 80.7,LOUISVILLE 33.3 76.9,NEW ORLEANS 52.9 81.9,PORTLAND

8、MAINE 21.5 68.0,BALTIMORE 33.4 76.6,BOSTON 29.2 73.3,DETROIT 25.5 73.3,SAULT STE MARIE 14.2 63.8,DULUTH 8.5 65.6,MINNEAPOLIS 12.2 71.9,JACKSON 47.1 81.7,KANSAS CITY 27.8 78.8,ST LOUIS 31.3 78.6,GREAT FALLS 20.5 69.3,OMAHA 22.6 77.2,RENO 31.9 69.3,CONCORD 20.6 69.7,ATLANTIC CITY 32.7 75.1,ALBUQUERQU

9、E 35.2 78.7,ALBANY 21.5 72.0,BUFFALO 23.7 70.1,NEW YORK 32.2 76.6,CHARLOTTE 42.1 78.5,RALEIGH 40.5 77.5,BISMARCK 8.2 70.8,CINCINNATI 31.1 75.6,CLEVELAND 26.9 71.4,COLUMBUS 28.4 73.6,OKLAHOMA CITY 36.8 81.5,PORTLAND,OREG 38.1 67.1,PHILADELPHIA 32.3 76.8,PITTSBURGH 28.1 71.9,PROVIDENCE 28.4 72.1,COLUM

10、BIA 45.4 81.2,SIOUX FALLS 14.2 73.3,MEMPHIS 40.5 79.6,NASHVILLE 38.3 79.6,DALLAS 44.8 84.8,EL PASO 43.6 82.3,HOUSTON 52.1 83.3,SALT LAKE CITY 28.0 76.7,BURLINGTON 16.8 69.8,NORFOLK 40.5 78.3,RICHMOND 37.5 77.9,SPOKANE 25.4 69.7,CHARLESTON,WV 34.5 75.0,MILWAUKEE 19.4 69.9,CHEYENNE 26.6 69.1,;,PROC,PR

11、INCOMP,COV OUT=PRIN;,VAR JULY JANUARY;,RUN,;,组成分得分输出到了数据集,PRIN,中,在,INSIGHT,中打开,WORK.PRIN,,分别绘制,JULY,对,JANUARY,、,PRIN2,对,PRIN1,的散点图。从图可以看出主分量为原始变量的一个正交旋转。,图,1,一月、七月气温的散点图和主分量散点图,一月、七月气温的散点图和主分量散点图,The SAS System 02:18 Wednesday,October 26,2005 1,The PRINCOMP Procedure,Observations 64,Variables 2,Simp

12、le Statistics,JULY JANUARY,Mean 75.60781250 32.09531250,StD 5.12761910 11.71243309,Covariance Matrix,JULY JANUARY,JULY 26.2924777 46.8282912,JANUARY 46.8282912 137.1810888,Total Variance 163.47356647,Eigenvalues of the Covariance Matrix,Eigenvalue Difference Proportion Cumulative,1 154.310607 145.14

13、7647 0.9439 0.9439,2 9.162960 0.0561 1.0000,Eigenvectors,Prin1 Prin2,JULY 0.343532 0.939141,JANUARY 0.939141 -.343532,显示结果如下:,ALABAMA 14.,SIOUX FALLS 14.,TITLE2 PLOT OF THE FIRST AND THIRD PRINCIPAL COMPONENTS;,PROC PRINT;,COLORADO 6.,第一主分量(因子)在所有五个变量上都有正的载荷,可见这个因子反应了城市规模的影响。,Conceptual Perspectives

14、 on Selecting the Principal Variables in the Purchasing managers index,图 1 一月、七月气温的散点图和主分量散点图,WYOMING 5.,BY PRIN1;,9969 1.,NORFOLK 40.,Eigenvectors,后面用PLOT过程画了主成分的散点图。,8282912 137.,输出中,第一部分为简单统计量(均值和标准差),第二部分为协方差的特征值(注意我们在过程中用了,COV,选项,无此选项用相关阵),从这里可以看到贡献率(,Proportion,)和累计贡献率(,Cumulative,),第三部分为特征向量。

15、按本结果的特征向量值及用,COV,选项规定使用协方差阵,我们可以知道两个主分量如此计算:,PRIN1=0.326866(JULY-75.92)+0.945071(JANUARY-32.55),PRIN2=0.945071(JULY-75.92)+(-0.326866)(JANUARY-32.55),如果没有用,COV,选项,原始变量还需要除以标准差。由系数可见,第一主分量是两个月份的加权平均,代表了一个地方的气温水平,第二主分量系数一正一负,反应了冬季和夏季的气温差别。,例2 各种类型犯罪的主分量分析,在数据集CRIME中有 各个州的各种类型犯罪的犯罪率数据。希望对这些犯罪率数据进行主分量分析

16、以概括犯罪情况。程序如下:,SAS,多元统计分析概论,/*EXAMPLE 2*/,DATA,CRIME;,TITLE,各州每十万人的犯罪率,;,INPUT STATE$,1,-,15,MURDER RAPE ROBBERY ASSAULT BURGLARY LARCENY AUTO;,CARDS;,ALABAMA 14.2 25.2 96.8 278.3 1135.5 1881.9 280.7,ALASKA 10.8 51.6 96.8 284.0 1331.7 3369.8 753.3,ARIZONA 9.5 34.2 138.2 312.3 2346.1 4467.4 439.5,ARKA

17、NSAS 8.8 27.6 83.2 203.4 972.6 1862.1 183.4,CALIFORNIA 11.5 49.4 287.0 358.0 2139.4 3499.8 663.5,COLORADO 6.3 42.0 170.7 292.9 1935.2 3903.2 477.1,CONNECTICUT 4.2 16.8 129.5 131.8 1346.0 2620.7 593.2,DELAWARE 6.0 24.9 157.0 194.2 1682.6 3678.4 467.0,FLORIDA 10.2 39.6 187.9 449.1 1859.9 3840.5 351.4,

18、GEORGIA 11.7 31.1 140.5 256.5 1351.1 2170.2 297.9,HAWAII 7.2 25.5 128.0 64.1 1911.5 3920.4 489.4,IDAHO 5.5 19.4 39.6 172.5 1050.8 2599.6 237.6,ILLINOIS 9.9 21.8 211.3 209.0 1085.0 2828.5 528.6,INDIANA 7.4 26.5 123.2 153.5 1086.2 2498.7 377.4,IOWA 2.3 10.6 41.2 89.8 812.5 2685.1 219.9,KANSAS 6.6 22.0

19、 100.7 180.5 1270.4 2739.3 244.3,KENTUCKY 10.1 19.1 81.1 123.3 872.2 1662.1 245.4,LOUISIANA 15.5 30.9 142.9 335.5 1165.5 2469.9 337.7,MAINE 2.4 13.5 38.7 170.0 1253.1 2350.7 246.9,MARYLAND 8.0 34.8 292.1 358.9 1400.0 3177.7 428.5,MASSACHUSETTS 3.1 20.8 169.1 231.6 1532.2 2311.3 1140.1,MICHIGAN 9.3 3

20、8.9 261.9 274.6 1522.7 3159.0 545.5,MINNESOTA 2.7 19.5 85.9 85.8 1134.7 2559.3 343.1,MISSISSIPPI 14.3 19.6 65.7 189.1 915.6 1239.9 144.4,MISSOURI 9.6 28.3 189.0 233.5 1318.3 2424.2 378.4,MONTANA 5.4 16.7 39.2 156.8 804.9 2773.2 309.2,NEBRASKA 3.9 18.1 64.7 112.7 760.0 2316.1 249.1,NEVADA 15.8 49.1 3

21、23.1 355.0 2453.1 4212.6 559.2,NEW HAMPSHIRE 3.2 10.7 23.2 76.0 1041.7 2343.9 293.4,NEW JERSEY 5.6 21.0 180.4 185.1 1435.8 2774.5 511.5,NEW MEXICO 8.8 39.1 109.6 343.4 1418.7 3008.6 259.5,NEW YORK 10.7 29.4 472.6 319.1 1728.0 2782.0 745.8,NORTH CAROLINA 10.6 17.0 61.3 318.3 1154.1 2037.8 192.1,NORTH

22、 DAKOTA 0.9 9.0 13.3 43.8 446.1 1843.0 144.7,OHIO 7.8 27.3 190.5 181.1 1216.0 2696.8 400.4,OKLAHOMA 8.6 29.2 73.8 205.0 1288.2 2228.1 326.8,OREGON 4.9 39.9 124.1 286.9 1636.4 3506.1 388.9,PENNSYLVANIA 5.6 19.0 130.3 128.0 877.5 1624.1 333.2,RHODE ISLAND 3.6 10.5 86.5 201.0 1489.5 2844.1 791.4,SOUTH

23、CAROLINA 11.9 33.0 105.9 485.3 1613.6 2342.4 245.1,SOUTH DAKOTA 2.0 13.5 17.9 155.7 570.5 1704.4 147.5,TENNESSEE 10.1 29.7 145.8 203.9 1259.7 1776.5 314.0,TEXAS 13.3 33.8 152.4 208.2 1603.1 2988.7 397.6,UTAH 3.5 20.3 68.8 147.3 1171.6 3004.6 334.5,VERMONT 1.4 15.9 30.8 101.2 1348.2 2201.0 265.2,VIRG

24、INIA 9.0 23.3 92.1 165.7 986.2 2521.2 226.7,WASHINGTON 4.3 39.6 106.2 224.8 1605.6 3386.9 360.3,WEST VIRGINIA 6.0 13.2 42.2 90.9 597.4 1341.7 163.3,WISCONSIN 2.8 12.9 52.2 63.7 846.9 2614.2 220.7,WYOMING 5.4 21.9 39.7 173.9 811.6 2772.2 282.0,;,PROC,PRINCOMP,OUT=CRIMCOMP;,RUN,;,PROC,SORT,;,BY PRIN1;

25、PROC,PRINT,;,ID STATE;,VAR PRIN1 PRIN2 MURDER RAPE ROBBERY ASSAULT BURGLARY LARCENY AUTO;,TITLE2,各州按第一主分量作为总犯罪率排列,;,PROC,SORT,;,BY PRIN2;,PROC,PRINT,;,ID STATE;,VAR PRIN1 PRIN2 MURDER RAPE ROBBERY ASSAULT BURGLARY LARCENY AUTO;,TITLE2,各州按第二主分量作为金钱犯罪与暴力犯罪对比的排列,;,PROC,GPLOT,;,PLOT PRIN2*PRIN1=STATE;,

26、TITLE2 PLOT OF THE FIRST TWO PRINCIPAL COMPONENTS;,PROC,GPLOT,;,PLOT PRIN3*PRIN1=STATE;,TITLE2 PLOT OF THE FIRST AND THIRD PRINCIPAL COMPONENTS;,RUN,;,Eigenvalues of the Correlation Matrix,Eigenvalue Difference Proportion Cumulative PRIN1 4.11496 2.87624 0.587851 0.58785 PRIN2 1.23872 0.51291 0.1769

27、60 0.76481 PRIN3 0.72582 0.40938 0.103688 0.86850 PRIN4 0.31643 0.05846 0.045205 0.91370 PRIN5 0.25797 0.03593 0.036853 0.95056 PRIN6 0.22204 0.09798 0.031720 0.98228 PRIN7 0.12406 .0.017722 1.00000,Eigenvectors,PRIN1 PRIN2 PRIN3 PRIN4 PRIN5 PRIN6 PRIN7 MURDER 0.300279 -.629174 0.178245 -.232114 0.5

28、38123 0.259117 0.267593 RAPE 0.431759 -.169435 -.244198 0.062216 0.188471 -.773271 -.296485 ROBBERY 0.396875 0.042247 0.495861 -.557989 -.519977 -.114385 -.003903 ASSAULT 0.396652 -.343528 -.069510 0.629804 -.506651 0.172363 0.191745 BURGLARY 0.440157 0.203341 -.209895 -.057555 0.101033 0.535987 -.6

29、48117 LARCENY 0.357360 0.402319 -.539231 -.234890 0.030099 0.039406 0.601690 AUTO 0.295177 0.502421 0.568384 0.419238 0.369753 -.057298 0.147046,第一主分量贡献率只有,59%,,前两个主分量累计贡献率达到,76%,,可以用前两个主分量。前三个主分量累计贡献率已达到,87%,,所以前三个主分量可以表现犯罪率的大部分信息。第一主分量的计算系数都是正数,所以它是一个州的犯罪率的一个加权平均,代表这个州的总的犯罪情况。第二主分量在入室盗窃(,BURGLARY,

30、盗窃罪(,LARCENY,)、汽车犯罪(,AUTO,)上有较大的正系数,在谋杀(,MURDER,)、强奸(,RAPE,)、攻击(,ASSAULT,)上有较大的负系数,所以代表了暴力犯罪与其它犯罪的一种对比。第三主分量为抢劫、汽车犯罪等与盗窃罪、入室盗窃、强奸的对比,其意义不易解释。,为了看出各州按第一主分量和第二主分量由低到高排列的情况,先用,SORT,过程排了序,然后用,PRINT,过程打印了结果(结果略)。在按第一主分量排序中,,North Dakota,、,South Dakota,、,West Virginia,排列在前,说明其犯罪率最低,,Nevada,、,California,

31、排列在后,说明其犯罪率最高。在按第二主分量排列的结果中,,Mississippi,排在最前,说明其暴力犯罪最高,,Massachusetts,最后,说明其暴力犯罪最低。后面用,PLOT,过程画了主成分的散点图。,输入为原始数据时,用户还可以规定从协方差阵出发还是从相关阵出发进行分析。,7967 0.,05846 0.,ALABAMA 14.,前三个主分量累计贡献率已达到87%,所以前三个主分量可以表现犯罪率的大部分信息。,INPUT CITY$1-15 JANUARY JULY;,MISSOURI 9.,25797 0.,二、FACTOR过程使用,PROC PRINCOMP语句用来规定输入输出

32、和一些运行选项,包括:,ALASKA 10.,DATA SOCECON;,NEW YORK 32.,Eigenvalue Difference Proportion Cumulative PRIN1 4.,0999 0.,四、用,SAS/INSIGHT,进行主分量分析,在,SAS/INSIGHT,中可进行主分量分析。例如,对于上面的,WORK.CRIME,数据集,在,INSIGHT,中打开它后,选“,Analyze|Multivariate(Ys)”,,弹出选择变量的对话框,把各犯罪率变量都选为,Y,变量,然后按,Output,按钮,选中主分量分析(,Principal Component A

33、nalysis,)复选框,,OK,后就得到了多变量分析结果(包括原始变量的简单统计量、相关阵)和主分量分析的结果(特征值、累计贡献率、特征向量)。另外还画了前两个主分量的散点图。,应用组成分分析的论文讨论,1.,The Effect of Financial Ratios on Returns from Initial Public Offerings:An Application of Principal Components Analysis,2.Conceptual Perspectives on Selecting the Principal Variables in the Purc

34、hasing managers index,因子分析,SAS/STAT,的,FACTOR,过程可以进行因子分析、分量分析和因子旋转。对因子模型可以使用正交旋转和斜交旋转,可以用回归法计算得分系数,同时把因子得分的估计存贮在输出数据集中;用,FACTOR,过程计算的所有主要统计量也能存贮在输出数据集中。,二、,FACTOR,过程使用,FACTOR,过程用法很简单,主要使用如下语句:,PROC FACTOR DATA=,数据集,选项,;,VAR,原始变量,;,RUN;,输出结果包括特征值情况、因子载荷、公因子解释比例,等等。为了计算因子得分,一般在,PROC FACTOR,语句中加一个,SCORE

35、选项和“,OUTSTAT=,输出数据集”选项,然后用如下的得分过程计算公因子得分:,PROC SCORE DATA=,原始数据集,SCORE=FACTOR,过程的输出数据集,OUT=,得分输出数据集,;,VAR,用来计算得分的原始变量集合,;,RUN;,三、例子,数据集,SOCECON,为洛杉基,12,个地区统计的五个社会经济指标:人口总数(,POP,),教育程度(,SCHOOL,),就业数(,EMPLOY,),服务业人数(,SERVICES,),中等的房价(,HOUSE,)。用,FACTOR,过程可以进行主分量分析。下例中的,SIMPLE,选项要求计算变量的简单统计量,,CORR,要求输出

36、相关阵。,DATA SOCECON;,TITLE,五个经济指标的分析,;,INPUT POP SCHOOL EMPLOY SERVICES HOUSE;,CARDS;,5700 12.8 2500 270 25000,1000 10.9 600 10 10000,3400 8.8 1000 10 9000,3800 13.6 1700 140 25000,4000 12.8 1600 140 25000,8200 8.3 2600 60 12000,1200 11.4 400 10 16000,9100 11.5 3300 60 14000,9900 12.5 3400 180 18000,9

37、600 13.7 3600 390 25000,9600 9.6 3300 80 12000,9400 11.4 4000 100 13000,;,PROC,FACTOR,DATA=SOCECON SIMPLE CORR;,TITLE2,主分量分析,;,RUN;,1 2 3 4 5,Eigenvalue 2.8733 1.7967 0.2148 0.0999 0.0153,Difference 1.0767 1.5818 0.1149 0.0847,Proportion 0.5747 0.3593 0.0430 0.0200 0.0031,Cumulative 0.5747 0.9340 0.

38、9770 0.9969 1.0000,结果给出了五个变量的简单统计量,相关阵,和相关阵的特征值、累计贡献:,2 factors will be retained by the MINEIGEN criterion.,前两个主分量解释了,93.4%,的方差,按照缺省的选择因子个数的准则,MINEIGEN,,取大于,1,的特征值,所以取两个因子。因子模式阵(,factor pattern,,或称因子载荷阵)为最重要的结果之一:,Factor Pattern,FACTOR1 FACTOR2,POP 0.58096 0.80642,SCHOOL 0.76704 -0.54476,EMPLOY 0.67

39、243 0.72605,SERVICES 0.93239 -0.10431,HOUSE 0.79116 -0.55818,它们是用公因子预报原始变量的回归系数。第一主分量(因子)在所有五个变量上都有正的载荷,可见这个因子反应了城市规模的影响。第二主分量在人口、就业上有大的正载荷,在教育程度和住房价格上有大的负载荷,则第二个因子较大的城市人口多但是教育程度和住房价格低。结果还给出了公因子解释能力的估计:,Final Communality Estimates:Total=4.669974 POP SCHOOL EMPLOY SERVICES HOUSE,0.987826 0.885106 0.979306 0.880236 0.937500,这里给出了公因子对每一个原始变量的解释能力的量度,这是用原始变量对公因子的复相关系数平方(取,0,到,1,间值)来计算的。,Communality Estimate,是这些复相关系数平方的总和。因为每一个复相关系数平方都比较大,所以我们可以认为两个公因子可以很好地解释原始变量中的信息。但是我们得到的因子解释不够清楚,于是考虑用其它的因子分析方法。,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服