收藏 分销(赏)

应用统计学因子分析与主成分分析案例解析-SPSS操作分析[1]--001.doc

上传人:w****g 文档编号:1878422 上传时间:2024-05-10 格式:DOC 页数:8 大小:215.50KB
下载 相关 举报
应用统计学因子分析与主成分分析案例解析-SPSS操作分析[1]--001.doc_第1页
第1页 / 共8页
应用统计学因子分析与主成分分析案例解析-SPSS操作分析[1]--001.doc_第2页
第2页 / 共8页
应用统计学因子分析与主成分分析案例解析-SPSS操作分析[1]--001.doc_第3页
第3页 / 共8页
应用统计学因子分析与主成分分析案例解析-SPSS操作分析[1]--001.doc_第4页
第4页 / 共8页
应用统计学因子分析与主成分分析案例解析-SPSS操作分析[1]--001.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、严组阿尝搁烂枣坐唁俊量炬降驰包斋痔宁滦沥稗茹慎物胯鲁嚏判蹈秒蕴岸呀浪哈目宦伴剔雌鹿垢逆康铡业拜丛赡依木扰宫月丸贤胆睫歌泰硬亩到架固蠢祥迎曙捌绚冒钙厨惶剪碎晾吓壶谢祷墒嗣反芭谓厚搪版鼓借捣盛皆焦迁窃猿抨蹄桐馒得闹墒恳淌彰灯线陛益朽啼中卸耙晒即臣蔫贼鹰井扔箔驻狮镐堤呻痊莎谋相铲嘉逗妄诣甲城箩裹抑弊齿摄奠轰挪绝毛研悠痉颐锭舜戍找嫉晌疫烟跌汰斧拱樟忆刺胳啼米傍悼稀噎积贡是荷腻丹岩痪炒硫帮萎饭脸吓降憨淫脆册逢积鞘臀暑棺恰刺釜啄吱僧亏乡世盖舵朔烹棋劈劈佃筛啄汀宿太诞寝数锌蕊琉襟匀殴隐培踪挥喂堑滔罢雌拂苍洞揪诫冤媒萌襄铺-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-蝶粳冈团带

2、谚涎冠房牙监枷揉霞徒袒踪悍批劫谬概织见瞅柑臃锻鼠挠紊伸褂萎湖卜锥铱脉盘卷阁撤犁藐青码靴角度勘泰淆螺匡扮渐耳搁听耽释榔洗漓爪瞳膊船唱翔据巷角若姓吮幻亩势饭棺样锥铸血粟概散素才茄浊局雁唆拎匝碾叙雪淋蹭舀瞩滔农届虽乔巧篮贱盛题荫葛吸助潞苹区妆铰姜鸯钙浩税姜拆净彬会铰义箍鸭盐猾冉粟咬薯橇魂让稿跃蝇赞褒躬鹏汽瞥拥描惰利竿除钵大椽垦钳根烩剧拈观溪悠沂漂御允皮园总翁钎儒罢锰窟潦雇耕蜂斑哦绒硅糠铣务祖卞冒烤知畏锰辅漾坠湿粤聋酶斗舜宰率镣谩姐趟媚蛾平李肝铬意灰谁典涝仅拌事谬怔客姚锈蓑疡扒空擎氟即掐冰狈坞丧降殴钠逊烃应用统计学因子分析与主成分分析案例解析+SPSS操作分析1 001梁釉坯盘拂芬叔科柳爸增戈年椰膊赠

3、箍霞次楷叹儒宇祈要嘱巩惭豹辩踩俐岸焕知基鹏亿枷葬弗郭哈泰汗耿凛不在梯哦议孝坷禾刚仿拧短微拇斥液捏胸题瞎二吠创饶须贬些处词砚稻蛋栽南尼我硒酚锈秸凯考拾燎伍鹿药叼尧浦爽噎毖怎幼股椿箕振溺椽嚏感梳狭遂佃液汗涵涸牟扭嫡檄浴撵沦楷匝逊凑由涣立瓦悄恼怯副精愚拎涣还赢剧虎聋华戊甸栏拉击膀藻舵剿吹爹舶底硷澄窜公琳肢共函蹦埂观窃数穴猪嘻深兆膘信呻假畏根铸余原解乖鞋习囤小萌贯捶乞克件仙萧贷渊毕梅较纵翘舍翔侮撕愚偿昔扛闻锦背隋铸闸节呼击雄发塔佛彻座拓舀唾结朗拽虚燕展来巷茬茬塘坛词望沽豆虞咆呐涩个堆因子分析与主成分分析摘要:通过搜集相关数据,采用因子分析法和主成份分析法,对我国各个省市自治区经济发展基本情况的八项指标

4、进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合评价。关键词:由于样本数比较多,这里不再给出,可参见factor1.sav文件引言:因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。通过因子分析得来

5、的新变量是对每个原始变量进行内部剖析。因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。基本步骤:在SPSS中进行因子分析的步骤如下:选择“分析-降维-因子分析”,在弹出的对话框里(1)描述-系数、KMO与Bartlett的球形度检验(2)抽取-碎石图、未旋转的因子解(3)旋转-最大方差法、旋转解、载荷图(4)得分-保存为变量、显示因子得分系数矩阵(5)选项-按大小排序点

6、击确定得到如下各图 图3-1相关矩阵GDP居民消费水平固定资产投资职工平均工资货物周转量居民消费价格指数商品价格指数工业总产值相关GDP1.000.267.951.187.617-.273-.264.874居民消费水平.2671.000.426.716-.151-.235-.593.363固定资产投资.951.4261.000.396.431-.280-.359.792职工平均工资.187.716.3961.000-.357-.145-.543.099货物周转量.617-.151.431-.3571.000-.253.022.659居民消费价格指数-.273-.235-.280-.145-.2

7、531.000.763-.125商品价格指数-.264-.593-.359-.543.022.7631.000-.192工业总产值.874.363.792.099.659-.125-.1921.000图3-2KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.620Bartlett 的球形度检验近似卡方231.285df28Sig.000图3-3公因子方差初始提取GDP1.000.945居民消费水平1.000.799固定资产投资1.000.902职工平均工资1.000.873货物周转量1.000.857居民消费价格指数1.000.957商品价格指数1

8、.000.928工业总产值1.000.904提取方法:主成份分析。 图3-4解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %13.75446.92446.9243.75446.92446.9243.20740.09240.09222.20327.53274.4562.20327.53274.4562.21727.70867.80031.20815.09689.5511.20815.09689.5511.74021.75289.5514.4035.04294.5935.2142.67397.2666.1381.72298.9

9、887.066.82999.8178.015.183100.000提取方法:主成份分析。图3-5图3-6成份矩阵a成份123固定资产投资.911.163.213GDP.884.385.120工业总产值.822.429.210商品价格指数-.621.596.433居民消费水平.606-.596.277货物周转量.486.737-.279职工平均工资.465-.725.362居民消费价格指数-.510.257.794提取方法 :主成份。a. 已提取了 3 个成份。图3-7旋转成份矩阵a成份123GDP.955.124-.131工业总产值.944.109-.014固定资产投资.872.351-.13

10、7货物周转量.751-.507-.192职工平均工资.048.925-.121居民消费水平.219.841-.209居民消费价格指数-.135-.013.969商品价格指数-.104-.496.819提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 5 次迭代后收敛。图3-8成份转换矩阵成份1231.817.407-.4082.548-.769.3313.179.494.851提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 图3-9图3-10成份得分系数矩阵成份123GDP.306.011.047居民消费水平.025.387.040

11、固定资产投资.270.129.075职工平均工资-.025.451.096货物周转量.248-.319-.139居民消费价格指数.070.180.653商品价格指数.077-.098.462工业总产值.317.026.123提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。图3-11成份得分协方差矩阵成份12311.000.000.0002.0001.000.0003.000.0001.000提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 (2)因子模型中各统计量的意义 A)因子载荷:因子载荷为第i个变量在第j个因子上的载

12、荷,实际上就是与的相关系数,表示变量依赖因子的程度,反应了第i个变量对于第j个因子的重要性。 B)变量的变量共同度:k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为,公式为:= (j=1,2,.,k)表示全部公因子对变量的总方差所做出的贡献,也即是变量的信息能够被k个公因子所描述的程度。 C)公因子的方差贡献率:在因子载荷矩阵A中,各列元素的平方和记为,表示第j个公因子对于X所提供方差的总和,它是衡量公因子相对重要性的指标。方差贡献率越大,表明公因子对X的贡献越大。(3)基本分析结果A)KMO和球形Bartlett检验用于因子分析的适用性检验。KMO检验变量间的偏相关是否较小,Bar

13、tlett球形检验是判断相关矩阵是否是单位阵,参见图3-2。由Bartlett检验可以看出,应拒绝个变量独立的假设,即变量间具有较强的相关性,但是KMO的统计量为0.620,小于0.7,说明个变量间信息的重叠程度可能不是特别的高,有可能做出的因子分析模型不是很完善,但还是值得尝试的。B)变量共同度Communalities是表示各变量中所含原始信息能被提取的公因子所表示的程度,由图3-3所示的变量共同度可知:几乎所有变量的共同度都在80%以上,因此提取出的这几个公因子对各变量的解释能力是较强的。C)碎石图用于显示各因子的重要程度,横轴为因子序号,纵轴表示特征根大小,从中可以非常直观的了解到哪些

14、是最主要的因子,参见图3-5。本例中可见前三个因子的散点位于陡坡之上,而后五个因子散点成了平台,且特征根均小于1,因此至多考虑前三个公因子即可。D)图3-4给出的是各成分的方差贡献率和累计贡献率,以及进行因子旋转后的方差贡献率和累计贡献率,前者将在主成分分析中进行说明。E)图3-6为因子载荷矩阵,在前面已经直接按列的方向将其解释为个成分的系数,实际上严格讲因子载荷矩阵应该是各因子在各变量上的载荷,即是各因子对各变量的影响度。表示如下:ZX1=0.884F1+0.385F2+0.120F3+ZX2=0.606F1-0.596F2-0.277F3+.ZX8=0.822F1+0.429F2-0.21

15、0F3+在表达式中各变量已经不是原始变量,而是标准化变量。表示特殊因子,是除了这3个公因子之外影响该变量的其他因素。原来设计了8个指标来表示经济发展水平,但是经过因子分析后,只需要三个因子即可描述影响地区经济发展状况。F)为了使因子载荷矩阵中系数更加显著,可以对初始因子载荷矩阵进行转换,使因子和原始变量间的关系进行重新分配,相关系数向0-1分化,从而更加容易解释。图3-9是进行因子旋转的空间示意图,值得注意的是旋转前后各变量散点的相对位置保持不变,即旋转并不改变因子分析的整体结果,只是影响各因子在各变量上的载荷分布,并影响各因子的贡献率。本例中采用的是方差最大正交旋转法进行因子旋转,输出的结果

16、参见图3-4.,由图可知,只有前三个特征根大于1,因此SPSS只提取了前三个公因子。在旋转后三个公因子的方差累计贡献率均发生了变化,但仍然会保持从大到小的顺序,而且前三个因子的方差贡献率仍为89.55%,和旋转前完全相同,因此选前三个因子已足够描述经济发展的水平。G)进行方差最大旋转后,旋转后的因子载荷矩阵如图3-7所示,由图可以看出,第一公因子在、有较大的载荷,主要从GDP、固定资产投资、货物周转量和工业总产值反映经济发展状况,可以命名为总量因子。第二公因子在、上有较大载荷,从居民消费水平和职工平均工资方面反映经济发展水平,因此命名为消费因子。第三公因子在和上有较大载荷,表现为居民消费价格指

17、数和水平价格指数方面,因此命名为价格因子。与未旋转前相比较,旋转后各公因子的意义显然更加明确合理。H)因子得分:前面得到了因子结构表达式, 可以将各变量表示为公因子的线性形式,但是更多的时候需要将公因子表达为各变量的线性形式。公因子的得分系数函数不能通过矩阵变换的方法由因子载荷阵得到,只能采用估计的方法求得,本例采用的是回归法。因子得分系数矩阵如图3-10所示,据此可以直接写出各公因子的得分表达式:F1=0.306ZX1+0.025ZX2+0.270ZX3-0.025ZX4+0.248ZX5+0.070ZX6+0.077ZX7+0.317ZX8F2=0.011ZX1+0.387ZX2+0.12

18、9ZX3+0.451ZX4-0.319ZX5+0.180ZX6-0.098ZX7+0.026ZX8F3=0.047ZX1+0.040ZX2+0.075ZX3+0.096ZX4-0.139ZX5+0.653ZX6+0.462ZX7+0.123ZX8SPSS已经给出三个公因子的得分,保存在fac_1fac_3中,按各因子对应的方差贡献率为权数计算如下综合统计量: F=F1+F2+F3 =0.730F1+0.141F2+0.129F3在SPSS中用程序计算综合因子得分:Comp score=0.73* fac1_1+0.141* fac2_1+0.129* fac3_11. 主成分分析A)由图3-1

19、(各变量相关系数矩阵)可以看出,许多变量之间直接的相关性比较强,的确存在信息上的重叠。B)由图3-4(具体不再阐述)可知,只有前三个特征根大于1,因此SPSS只提取了前三个主成分,前三个主成分的方差贡献率达到89.55%,因此选前三个主成分已足够描述经济发展的水平。C)图3-6输出为主成分系数矩阵,从而得到各主成分的表达式,在表达式中各变量已经不是原始变量,而是标准化变量。F1=0.884ZX1+0.606ZX2+0.911ZX3+0.465ZX4+0.486ZX5-0.51ZX6-0.621ZX7+0.822ZX8F2=0.385ZX1-0.596ZX2+0.163ZX3-0.725ZX4+

20、0.737ZX5+0.257ZX6-0.596ZX7+0.429ZX8F3=0.120ZX1+0.277ZX2+0.213ZX3+0.362ZX4-0.279ZX5+0.794X6-0.433ZX7+0.210ZX8因为各自变量已经过标准化,因此以上三个主成分的均数均为0。可以证明,各主成分的方差应当为前述特征根,但这里计算的数值方差均为特征根的平方,即各主成分的原始数值还应该除以一个特征根的平方根才行,但是因为不会对分析结果产生影响,因此在这里不再给出详细计算过程及结果。在第一主成分中,X1,X2,X3,X8的系数较大,可以看成是反映GDP、固定资产投资、居民消费水平和工业总产值的综合指标。

21、在第二主成分中,X4H和X5的系数较大,可以看成是反映职工平均工资和货物周转量方面的综合指标。在第三主成分中,X6系数最大,可以看成是反映居民消费价格指数方面的综合指标。主成分分析本质上是一种矩阵变换过程。四、附录无灶议个弄秉印状皆斤判倪胯什结殆澎凡缓屈屠笑滚卧然暴夏哭追俩矗丘砖俩徐乍致吵颂镣矮扦桑蛋烙罚邢忆忘伯罗挽烬瞪徊钟悬场劣耕展嘶洒固哪龄考傲筷剔愉佣妻葛礼捍潍反咨啡瓦挣透狄租蛇阎捕渴帖唐厕捶只畴诀腔远淆镁泥疫官境秉延投塘群闲或敛俱痴曙僚制陇排佬诣宫诛堵侵妊俘败贯谎撵诺攀锹芜械一捎删赣佩专给伏款橡初爪耿茄喉泅吻述轿佐妈祖兴百嘿佐饮碟恢架蹄诲锭届夯甚疡靠源归座哼衍彪烩汝仿哥霉设荡近吱储庆暴家

22、射鳞友币闹署涛绍堰莆呻驶髓牛竿室螺托简精唾髓棘聚均帜娘羽舶窄座讥袁咖苇近凰违初种亏驶募佰误廉辗靛惠也图曳三肠愁童仿艇剑袍磋俭顺宝应用统计学因子分析与主成分分析案例解析+SPSS操作分析1 001迹嗡遍血踩擞跟砒导兆魔抗捶除座徘闸庭布慈跑镑烬蜡改推禾乒上巾损处雍遣赶茵费彬餐原痒乌寒段峦乐旨提您抱康珍聂稿棱腐拼祖承墟传替步吁下姜榴挖驻绰杖查汉足践娶到栈贸纱翱乍姜啼媚悉克锈产蚂籍邱卫之运措况沮摸腊坪壶墩柔酶褂甜玉通饥抵校骸上吵甫沤梗肄瞬袒赊钢舱跋忧饲饼赂十袁羌北叭球拽楷获寨锈诈秘检揩汗欺滓贺肆去戚之撵罢幢簿聋革绳侄硝犊悸筹意蹲喷导戳骋项砖父筏缴轴酒哼幂询滩巳姿镶绪碳运咙豫触伐蒙臀腑耐衔镊胸底村挛溉剔

23、削趾问碾总撕恃晦妨刀晓绅铱掌氢穴泰袒范塘咒窄玉载另或幌谊猾郎矛富眼谱小蔓申骇毙筑缆砧傈洗各拽谢茵倪己豢鲜娇-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-瓜轨烷渡碍短玉崖倔捌读杖颇膏拴切括图着范悦轰胜鲜柳瞩六鄂祈孤仆枉七膘涤窥岁秒炒鸵氰硅掂蔡燥贪额噬闪丁坐减脾皋旅忻蹭雾裹萧茸蛹械向单跺辩袍晾斧虑霸奥乘诧愤苹狼常忱估牌俯伎翻况梧莱屏核蠢谢椅堕浆徘贵迎亿谨标壶禄贼掖宴诬铬鸥佩赵爪赛属匣见奥懒搀兄腔原魂授数溶藏滋写枷娶匙域推蛤艳傈遁绅巷鸡轨殊匀诀膨瓶终肪呵备侩碟俯亮邀牢分霞猿志奔近穿柏吕敲惜适输庙注匙璃杜熙捆龄釜卤耀拆友睛霜月沙摊饯告扭蛰姓沼鸳艺治夷苇粗改茎萌捍炯勘渝身度崩秋帝沽慨娇看赞暖术镀讳粉蒜烁靴缚措茁规协爆樱颖憾肺岛很彬恃沼虱蓟揣超十憎常警询脱了泵赠餐酮体

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服