收藏 分销(赏)

多元统计分析课程设计.doc

上传人:可**** 文档编号:688427 上传时间:2024-02-02 格式:DOC 页数:10 大小:246KB 下载积分:11 金币
下载 相关 举报
多元统计分析课程设计.doc_第1页
第1页 / 共10页
多元统计分析课程设计.doc_第2页
第2页 / 共10页


点击查看更多>>
资源描述
. 《多元统计分析》 课程设计指导书 一、 课程设计的目的 掌握用统计软件利用主成分分析的方法对涉及众多变量的某一问题进行分析 二、 设计名称:用统计软件利用主成分分析法对涉及进行众多变量的问题进行分析 三、 设计要求 掌握用统计软件利用主成分分析的方法对涉及进行众多变量的问题进行分析的方法 掌握利用SPSS软件求初始变量的协方差阵或相关阵的特征根与相应标准特征向量判断是否存在明显的多重共线性 掌握利用SPSS软件求得主成分 四、 设计过程 1、收集数据 2、根据研究问题选取初始分析变量 3、求协方差阵或相关阵的特征根与相应标准特征向量 4、判断是否存在明显的多重共线性,若存在,则回到第一步 5、得到主成分的表达式并确定主成分的个数,选取主成分 6、对主成分进行分析得出结果,完成设计报告 五、设计细则 1.注意对数据的采集,不要过于繁杂,不要过少 2.吸取他人的经验,总结自己的教训,有条不紊的进行 3.上机前先作好准备,上机时积极改进方法 六、说明 为了培养自己的上机操作方法,所以我尽量运用SPSS软件上的检验方法 课程设计任务书 姓 名 学 号 班 级 课程名称 多元统计分析 课程性质 专业课 设计时间 2010年6月26日——2009年7月2日 设计名称 用统计软件利用主成分分析的方法对涉及多个指标的问题进行分析 设计要求 掌握用统计软件利用主成分分析的方法对涉及进行众多变量的问题进行分析的方法 掌握利用SPSS软件求初始变量的协方差阵或相关阵的特征根与相应标准特征向量判断是否存在明显的多重共线性 掌握利用SPSS软件求得主成分 设计思路 与 设计过程 1、收集数据 2、根据研究问题选取初始分析变量 3、求协方差阵或相关阵的特征根与相应标准特征向量 4、判断是否存在明显的多重共线性,若存在,则回到第一步 5、得到主成分的表达式并确定主成分的个数,选取主成分 6、对主成分进行分析得出结果,完成设计报告 计划与进度 第一周: 星期一~星期三:查资料选定课程设计数据材料 星期四~星期五:选中研究方法 星期六:1413上机 第二周: 星期一~星期五:针对错误改进 星期六:1413上机 星期天:设计报告 任课教师 意 见 说 明 课程设计报告 课程:多元统计分析 学号: 姓名: 班级: 教师: 设计名称:用统计软件利用主成分分析法对涉及进行众多变量的问题进行分析 设计内容:在企业经济效益的评价中,设计的指标往往很多。为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求主成分。在对我国部分省、市、自治区独立核算的工业企业的经济效益评价中,设计9项指标,原始数据见下表样品数n=28,变量数p=9 100固定资产原值实现值(%) 100元固定资产原值实现利税(%) 100元资金实现利税(%) 100元工业总产值实现利税(%) 100元销售收入实现利税(%) 每吨标准煤实现工业产值(元) 每千瓦时电力实现工业产值(元) 全员劳动生产率(元/人.年) 100元流动资金实现产值(元) 北京(1) 119.29 30.98 29.92 25.97 15.48 2178 3.41 21006 296.7 天津(2) 143.98 31.59 30.21 21.94 12.29 2852 4.29 20254 363.1 河北(3) 94.8 17.2 17.95 18.14 9.37 1167 2.03 12607 322.2 山西(4) 65.8 11.08 11.06 12.15 16.84 8.82 1.65 10166 284.7 内蒙(5) 54.79 9.24 9.54 16.86 6.27 894 1.8 7564 225.4 辽宁(6) 94.51 21.12 22.83 22.35 11.28 1416 2.36 13.386 311.7 吉林(7) 80.49 13.36 13.76 16.6 7.14 1306 2.07 9400 274.1 黑龙江(8) 75.86 15.82 16.67 20.86 10.37 1267 2.26 9830 267 上海(9) 187.79 45.9 39.77 24.44 15.09 4346 4.11 31246 418.6 江苏(10) 205.96 27.65 22.58 13.42 7.81 3202 4.69 23377 407.2 浙江(11) 207.46 33.06 25.78 15.94 9.28 3811 4.19 22054 385.5 安徽(12) 110.78 20.7 20.12 18.69 6.6 1468 2.23 12578 341.1 福建(13) 122.76 22.52 19.93 18.34 8.35 2200 2.63 12164 301.2 江西(14) 94.94 14.7 14.18 15.49 6.69 1669 2.24 10463 274.4 山东(15) 117.58 21.93 20.89 18.65 9.1 1820 2.8 17829 331.1 河南(16) 85.98 17.3 17.18 20.12 7.67 1306 1.89 11247 276.5 湖北(17) 103.96 19.5 18.48 18.77 9.16 1829 2.75 15745 308.9 湖南(18) 104.03 21.47 21.28 20.63 8.72 1272 1.98 13161 309 广东(19) 136.44 23.64 20.83 17.33 7.85 2959 3.71 16259 334 广西(20) 100.72 22.04 20.9 21.88 9.67 1732 2.13 12441 296.4 四川(21) 84.73 14.35 14.17 16.93 7.96 1310 2.34 11703 242.5 贵州(22) 59.05 14.48 14.35 24.53 8.09 1068 1.32 9710 206.7 云南(23) 73.72 21.91 22.7 29.72 9.38 1447 1.94 12517 295.8 陕西(24) 78.02 13.13 12.57 16.83 9.19 1731 2.08 11369 220.3 甘肃(25) 59.62 14.07 16.24 23.59 11.34 926 1.13 13084 246.8 青海(26) 51.66 8.32 8.26 16.11 7.05 1055 1.31 9246 176.49 宁夏(27) 52.95 8.25 8.82 15.57 6.58 834 1.12 10406 245.4 新疆(28) 60.29 11.26 13.14 18.68 8.39 1041 2.9 10983 266 设计目的与要求: 掌握用统计软件利用主成分分析的方法对涉及众多变量的某一问题进行分析 设计环境或器材、原理与说明: 机房spss软件 设是一个维随机向量,有二阶矩存在,记,。考虑它的线性变换: (5.1) 易见 (5.2) 假如我们希望用来代替原来的个变量,这就要求尽可能地反映原来个变量的信息,这里“信息”用什么来表达?最经典的方法是用的方差来表达。越大,表示包含的信息越多。由(5.2)可以看出,对必须有某种限制,否则可使,常用的限制是 (5.3) 故我们希望在约束(5.3)下找,使得达到极大,就称为第一主成分。如果一个主成分不足以代表原个变量,可再考虑采用,为了最有效地代表原变量的信息,已有的信息就不需要出现在中,用数学语言来讲,就是 (5.4) 于是,求就是在约束(5.3)和(5.4)下求,使达到极大,所求的称为第二主成分。类似地,我们可以定义第三主成分、第四主成分、…。一般地讲,的第个主成分是指:在约束 下求,使得达到极大。 令表示的特征根,为相应的单位特征向量。若特征根有重根,对应于这个特征根的特征向量组成一个的子空间,子空间的维数等于重根的次数。在子空间中任取一组正交的坐标系,这个坐标系的单位向量就可用来作为它的特征向量。显然,这时特征向量的取法不唯一,有无穷多种取法,在下面的讨论中,我们总假定已选定的某一种取法。 设计过程(步骤)或程序代码: 1、 将原始数据标准化,标准化的数据见下表 0.423523 1.338405 1.590282 1.687556 2.239634 0.481971 0.954746 1.260371 0.048805 0.995199 1.409649 1.631453 0.667228 1.065873 1.188758 1.855394 1.133844 1.200166 -0.14352 -0.271 -0.10906 -0.29487 -0.00854 -0.57821 -0.45763 -0.15279 0.49097 -0.81499 -0.98577 -1.08721 -1.81143 2.740046 -1.79273 -0.84655 -0.56349 -0.15927 -1.06992 -1.20067 -1.303 -0.61894 -1.14919 -0.86449 -0.69303 -1.00129 -1.18752 -0.15024 0.186827 0.583737 0.771033 0.694243 -0.3171 -0.11989 -2.2717 0.308902 -0.47486 -0.71949 -0.7039 -0.68477 -0.82907 -0.43245 -0.4167 -0.69238 -0.34307 -0.58206 -0.43218 -0.29078 0.39379 0.359408 -0.47334 -0.22224 -0.62003 -0.46619 2.009583 3.080956 2.988656 1.300186 2.096133 2.755433 1.671171 2.983284 2.162524 2.430294 0.949485 0.548246 -1.48989 -0.58254 1.555783 2.26478 1.659299 1.964851 2.465025 1.581335 1.002539 -0.85187 -0.04166 2.194408 1.753048 1.4367 1.588578 0.226481 0.137774 0.199007 -0.15562 -1.02776 -0.26257 -0.25294 -0.15767 0.818691 0.503868 0.350337 0.172033 -0.24423 -0.38385 0.505041 0.156444 -0.22732 0.126834 -0.14028 -0.56298 -0.64428 -0.9658 -0.99465 -0.05179 -0.24271 -0.51352 -0.33787 0.383929 0.281429 0.308322 -0.16574 -0.10789 0.106557 0.330433 0.72583 0.645294 -0.34774 -0.25932 -0.21838 0.206435 -0.63406 -0.43245 -0.60092 -0.38161 -0.30146 0.068569 -0.00238 -0.03382 -0.13536 -0.08581 0.115994 0.27926 0.37519 0.260351 0.07019 0.227705 0.363689 0.335558 -0.24771 -0.4681 -0.50881 -0.05958 0.262085 0.820617 0.481145 0.299804 -0.49995 -0.56783 1.300963 1.261785 0.461673 0.695579 -0.00645 0.294277 0.309741 0.652037 0.101843 0.014276 -0.35529 -0.18072 0.043603 -0.37669 -0.60386 -0.6457 -0.60122 -0.52735 -0.42825 -0.14036 -0.30489 -0.89101 -0.97128 -0.58868 -0.62014 1.322972 -0.47952 -0.68202 -1.18429 -0.64022 -1.51177 -0.63161 0.279093 0.565282 2.636993 -0.00486 -0.28459 -0.54975 -0.16793 0.033199 -0.53205 -0.74635 -0.87284 -0.62654 -0.07477 0.013227 -0.40646 -0.36109 -1.27595 -0.95809 -0.63656 -0.35182 1.08498 0.71632 -0.83093 -1.37875 -0.07253 -0.81645 -1.14239 -1.30812 -1.48472 -0.80883 -0.86219 -0.69566 -1.19453 -0.71829 -2.03561 -1.11252 -1.3163 -1.40522 -0.94555 -1.03512 -0.92741 -1.38899 -0.52311 -0.84073 -0.94257 -0.96475 -0.79192 -0.15815 -0.36913 -0.71034 0.432779 -0.42603 -0.48353 2、将以上数据导入spss软件,依次点击分析—降维—因子分析 点击 按钮,在弹出的对话框中,在 中选择。回到原对话框点击右侧的确定。即可得到以下输出结果 Total Variance Explained Component Initial Eigenvalues Extraction Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % 1 6.150 68.332 68.332 6.150 68.332 68.332 2 1.473 16.365 84.698 1.473 16.365 84.698 3 .697 7.749 92.447 4 .318 3.531 95.978 5 .190 2.112 98.090 6 .116 1.289 99.379 7 .029 .324 99.703 8 .024 .270 99.973 9 .002 .027 100.000 Extraction Method: Principal Component Analysis. 由输出结果看到前面两个主成分y1,y2的方差和占全部方差的比例为84.7%。我们就选取y1为第一主成分,y2为第二主成分。且这两个主成分占全部方差的84.7%,即基本上保留了原来指标的信息,这样由原来的9个指标转化为2个新的指标,起到了降维的作用 2、 spss软件得到主成分系数矩阵如下: Component Matrixa Component 1 2 X1 .931 -.315 X2 .976 .163 X3 .931 .322 X4 .232 .863 X5 .433 .596 X6 .923 -.200 X7 .897 -.274 X8 .871 -.064 X9 .899 -.154 Undefined error #11401 - Cannot open text file "D:\Program Files\SPSSInc\Statistics17\lang\en\spss.e a. 2 components extracted. 3、 由以上结果得到前两个主成分的线性组合为 y1=0.931x1+0.976x2+0.931x30.232x4+0.433x5+0.923x6+0.897x7+0.871x8+0.899x9 y2=-0.315x1+0.163x2+0.322x3+0.863x4+0.596x5-0.2x6-0.274x7-0.064x8-0.154x9 4、 对所选主成分做经济解释:第一主成分的线性组合中除了100元工业总产值实现利税和100元销售收入实现利税外,其余变量的系数相当所以第一主成分可以看成是x1,x2,x3,x6,x7,x8,x9的综合变量。可以解释为第一主成分反映了工业生产中投入的资金、劳动力所产生的效果,他是投入和产出之比。第一主成分所占信息总量为68.3%,在我国目前的工业企业中,经济效益首先反映在投入与产出之比上,其中固定资产所产生的经济效益更大一些。第二主成分是把工业生产中所得产量(即工业总产值和销售收入)与局部量(即利税)进行比较,反映了产出对国家所做的贡献。这样,在抓企业经济效益活动中,就应注重投入与产出之比和产出对国家所做的贡献,抓住了这两个方面,经济效益一定会提高 5、 通常为了分析各样品在主成分所反映的经济意义方面的情况,还将标准化后的原始数据代入主成分表达式计算各样品的主成分得分 6.99 2.94 9.27 0.65 -1.21 -0.12 -5.01 0.47 -7.38 -0.89 -1.04 1.54 -4.00 -0.98 -2.58 0.84 17.45 1.67 9.78 -3.41 10.83 -2.21 0.18 -0.73 1.27 -0.63 -2.95 -1.52 2.44 -0.44 -2.55 0.12 0.88 -0.36 -0.11 0.47 4.51 -1.60 0.34 0.87 -3.50 -0.74 -5.57 1.60 -0.05 2.91 -4.03 -0.49 -4.08 2.12 -8.45 -0.72 -7.61 -1.02 -3.83 -0.35 6、 由各样品的主成分得分就可在二维空间中描述出各样品的分布情况 由上图可知,分布在第一象限的是上海、北京、天津、广西4个省区,这四个省区的经济效益在全国来说比较好的,其中,上海的经济效益最好。分布在第四象限的是江苏、浙江、安徽、福建、山东、湖北、广东7个省区。因为第四象限的主要特征是第一主成分,第一主成分占信息总量的比重最大,所以这7个省区的经济效益也算较好。分布在第二和第三象限的地区可属同一类,经济效益较差 设计结果与分析(可以加页): 设计体会与建议: 经过了两周的课程设计,深有感触啊,从本次课程设计的目的来看,收获也是不少的,它使我们对课本以及以前学过的知识有了一个更好的总结与理解,也让我们知道了,光分开使用是不够的,从书本上学到的知识要自己整理归纳形成自己的想法,然后进行构思设计,这很好的训练对对开发一个项目,应该有怎样的思路和准备更清晰。来学校三年了,从最早的实验报告到现在的课程设计,每一个自己都觉得有一个进步,虽然有时有些方面我自己做不出,但可以从老师和其他同学那里学到更好更多的东西,他们从另一个方面透析了我自己的困难,这是很重要的,它让我学会了怎样学习别人的长处并把它变成自己的长处。有这样的机会和收获,要感谢老师的辅导以及同学的帮助,是他们让我对自己有了一个更好的认识,无论是学习还是生活,生活是实在的,要踏实走路,虽然自己走出来的路要崎岖的多,但觉得踏实、放心。 最后建议软件应该更完善些,有些检验完成不了,希望我们以后能有更多的机会接触此类型的软件,帮助我们更全面的掌握跟统计有关的知识和具体操作。 设计成绩: 教师签名: 年 月 日 精选范本
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服