ImageVerifierCode 换一换
格式:DOC , 页数:13 ,大小:956KB ,
资源ID:6545315      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/6545315.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(多元统计作业.doc)为本站上传会员【xrp****65】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

多元统计作业.doc

1、西南大学 多元统计分析课程论文 学 院 数学与统计学院 年级专业 2009级数学与应用数学 论文写作 唐维彬 学 号 222009314012030 资料收集 李虹霖 学 号 222009314012023 软件操作 刘鹏懿 学

2、 号 222009314012027 数据分析 冉俊峰 学 号 222009314012029 日 期 2012年10月30日 基于主成分分析和因子分析评估大气污染 摘要:近年来大气污染日趋严重,引起了人们的广泛关注。本文采用主成分分析法和因子分析法,为了评估某大型化工厂的污染情况,在厂区及邻近地区挑选有代表性的8个大气取样点,每日4次同时抽取大气样品,测定其中包含的6种气体的浓度,前后共4天

3、每个样品每种气体实测16次。最后通过数据的分析与整理,运用SPSS软件,进行主成分分析和因子分析,对该大型化工厂的污染情况做出评估, 关键字:主成分分析 因子分析 SPSS17.0软件 大气污染 正文 主成分分析法 (一) 主成分分析原理 主成分分析是设法将原来众多具有一定相关性( 比如P 个指标) , 重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合, 作为新的综合指标。最经典的做法就是用 ( 选取的第一个线性组合, 即第一个综合指标) 的方差来表达, 即Var()越大, 表示

4、 包含的信息越多。因此。在所有的线性组合中选取的 应该是方差最大的, 故称为第一主成分。如果第一主成分不足以代表原来P 个指标的信息, 再考虑选取即选第二个线性组合, 为了有效地反映原来信息, 已有的信息就不需要再出现在中, 用数学语言表达就是要求Cov(,)=0, 则称 为第二主成分, 依此类推可以构造出第三、第四, , 第P 个主成分。 (二) 主成分分析数学模型 其中, , , (i=1, ,m)为X 的协方差阵Σ的特征值多对应的特征向量, , , ,是原始变量经过标准化处理的值, 因为在实际应用中, 往往存在指标的量纲不同, 所以在计算之前须先消除量纲的影响,而将

5、原始数据标准化, 本文所采用的数据就存在量纲影响[注: 本文指的数据标准化是指Z 标准化]。,,为相关系数矩阵, ,是相应的特征值和单位特征向量, 。 (三) 主成分分析主要步骤如下: 首先。结合数据,判断是否需要进行主成分分析;其次,进行分析,结合主成分的累计贡献率和特征值来确定提取的主成分或因子的数目;然后,进行主成分分析,将提取的主成分存为新的变量,以便继续分析。主成分分子也是通过菜单栏中的Analyze →Data Reduction →Factor命令来实现的,基本操作与因子分析相同。具体操作如下: 1 利用SPSS进行数据处理 (1)打开数据文件后,在数据编辑窗口一次选择A

6、nalyze →Data Reduction →Factor Analysis, 弹出Factor Analysis 对话框Factor Analysis 对话框。(SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptive 过程进行计算。) (2)在左边的原变量列表框中选择将进行因子分析的变量作为因子分析变量进入variables列表框,具体符号说明如下:

7、 图1 变量选择图 氯—————代表 硫化氢———代表 SO2————代表 Z碳————代表 环氧氯丙烷—代表 环已烷———代表 (3)单击Extraction按钮,即可打开Factor Analysis:Extraction对话框,在Eigenvalues over文本框中输入0.6作为因子提取的阀值,即提取特征值大于0.6的因子,并且选择Display选项组的两个复选框。 图 2 因子提取 (4)单击OK按

8、钮,执行因子分析得到如下所示的特征值和方差贡献表以及因子负荷矩阵。 下表为各因子对应的特征值,% of Variance列为各因子的方差贡献率;Cumulative %列为累计方差贡献率。从表中可以看出,前4个变量已经可以解释89.264%的方差。 表 1 特征值与方差贡献表 下表为旋转前的因子负荷矩阵,与因子分析得到的结果是一致的。 表2 旋转前的因子负荷矩阵 2 利用因子分析的结果进行主成分分析 (1)将旋转前的因子负荷矩阵中的数据输入到SPSS数据编辑窗口,将4个变

9、量分别命名为A1 A2 A3 和A4。 图 3 新变量A1 A2 A3 A4 (2)然后,依次计算特征向量矩阵。在主菜单栏中选择Transform→Compute Variable命令,打开如图所示的Compute Variable对话框,“T1=A1/SQR(2.183)”,单击OK按钮,即可在数据编辑窗口中得到变量名为T1的第一特征变量。依次类推,计算T2 T3 和T4 ,注SQRT后的括号内的数值为相应的特征值。 图4 特征向量的计算 表 3 特征向量矩阵 设变量氯,硫化氢,SO2,碳4,环氧氯丙烷,环已

10、烷依次为,,,,,,则根据上面的特征向量表可以得到主成分的表达式如下: 由于是以相关系数矩阵为出发点进行因子分析,所以主成分分析表达式中的应该是经过标准化变换后的标准变量。所以计算主成份之前首先需要对原始变量进行标准化处理,得到变量名为,,,,,。标准化处理变量通过Descriptive Statistics 菜单中的Descriptive命令实现,该命令不仅可以用于描述分析,还可以用来标准化数据变量。将变量标准化后,再次调用Compute Variable命令,分别在对话框中输入等式 就可以计算得到主成分表如下: 表4

11、 8个取样点的主成分表 3 结果分析 从上面的主成分表达式可以看出,在式中第一主成分上有较高的载荷(为0.56),说明第一主成分是由变量氯()决定的,气体中氯作为主要污染气体是可信的。在第二主成分上有较高的载荷(为0.74),说明主要依赖,说明SO2作为主要污染气体是可信的。依次类推,主要依赖碳4,主要依赖环氧氯丙烷。综上所诉,在对这8个取样点的空气质量进行评估时,可以认为氯,SO2,碳4,环氧氯丙烷是空气污染的主要气体 因子分析 (一) 因子分析原理 因子分析法是从研究变量内

12、部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。 (二) 因子分析数学模型 因子分析模型中,假定每个原始变量由两部分组成:共同因子(common factors)和唯一因子(unique factors)。共同因子是各个原始变量所共有的因子,解释变量之间的相关关系。唯一因子顾

13、名思义是每个原始变量所特有的因子,表示该变量不能被共同因子解释的部分。原始变量与因子分析时抽出的共同因子的相关关系用因子负荷(factor loadings)表示。 因子分析最常用的理论模式如下: (,n为原始变量总数) 可以用矩阵的形式表示为。其中F称为因子,由于它们出现在每个原始变量的线性表达式中(原始变量可以用表示,这里模型中实际上是以F线性表示各个原始变量的标准化分数),因此又称为公共因子。因子可理解为高维空间中互相垂直的m个坐标轴,A称为因子载荷矩阵,称为因子载荷,是第个原始变量在第个因子上的负荷。如果把变量看成m维因子空间中的一个向量,则表示在坐标轴上的投影,相当于多元线性回

14、归模型中的标准化回归系数;称为特殊因子,表示了原有变量不能被因子解释的部分,其均值为0,相当于多元线性回归模型中的残差。 其中, (1)为第个变量的标准化分数; (2)(i=1,2,…,m)为共同因素; (3)为所有变量共同因素的数目; (4)为变量的唯一因素; (5)为因素负荷量。 ( 三) 因子分析主要步骤如下: 为了测量某大型化工厂的污染情况,在厂区及邻近地区挑选有代表性的8个大气取样点,每日4次同时抽取大气样品,测定其中包含的6种气体的浓度,前后共4天,每个样品每种气体实测16次,计算每个取样点每种气体的平均浓度如下表,并建立数据文件如下: 图5 数据文件建立

15、 1. SPSS具体操作步骤 (1)打开数据文件后,在数据编辑窗口一次选择Analyze →Data Reduction →Factor Analysis, 弹出Factor Analysis 对话框 (2)在左边的原变量列表框中选择将进行因子分析的变量作为因子分析变量进入variables列表框,具体符号说明如下: 图6 因子分析变量 氯—————代表 硫化氢———代表 SO2————代表 碳4———代表 环氧氯丙烷—代表 环已烷———代表 (3)单击De

16、scriptives按钮,打开Factor Analysis:Descriptives对话框。选择Coefficients,Significant level 和Deteterminant选项,然后单击Continue, 返回Factor Analysis 对话框 图 7 因子分析描述 (4)单击Extraction按钮,即可打开Factor Analysis:Extraction对话框,在Eigenvalues over文本框中输入0.6作为因子提取的阀值,即提取特征值大于0.6的因子,并且选择Display选项组的两个复选框。

17、 图8 因子提取 (5)单击Rotation按钮,打开Factor Analysis:Rotation对话框。在Method选项组中选择Varimax单选按钮,使用正交旋转方法,并选中Display选项组的两个复选框。设置结束后,单击Continue按钮确认并返回主对话框。 图 9 因子旋转 (6)单机OK按钮确认,并执行因子分析。 2 结果分析 表5 共同度表(communalities) Communalities Initial Extraction 氯 1.000 .927 硫化氢 1.000 .741 SO2 1.

18、000 .937 碳4 1.000 .961 环氧氯丙烷 1.000 .981 环已烷 1.000 .808 Extraction Method: Principal Component Analysis. 在表中给出了采用主成分法提取因子后的各变量共同度,包括各变量对应的初始共同度(Initial)和提取因子后的再生共同度(Extraction) 表6 相关矩阵表(correlation Matrix) Correlation Matrixa 氯 硫化氢 SO2 碳4 环氧氯丙烷 环已烷

19、 Correlation 氯 1.000 -.557 -.443 .249 -.519 .214 硫化氢 -.557 1.000 -.067 -.092 .377 -.214 SO2 -.443 -.067 1.000 .123 -.082 .517 碳4 .249 -.092 .123 1.000 -.145 .203 环氧氯丙烷 -.519 .377 -.082 -.145 1.000 -.183 环已烷 .214 -.214 .517 .203 -.183 1.000 Sig. (1-tailed)

20、 氯 .076 .136 .276 .094 .306 硫化氢 .076 .437 .414 .179 .306 SO2 .136 .437 .386 .424 .095 碳4 .276 .414 .386 .366 .315 环氧氯丙烷 .094 .179 .424 .366 .333 环已烷 .306 .306 .095 .315 .333 a. Determinant = .089 表的第一行为相关系数矩阵,第二部分为零假设相关系数为零的单侧显著性检验概率矩阵。从表中可以看出,各概率均

21、大于0.05,因此可以认为各变量两两之间是不相关的。 表7 总方差解释表(total) 在表中,Component表示因子序号:Total为特征值,特征值的大小反映公因子的贡献;% of Variance 为特征值占方差的百分数;Cumulative %为特征值在方差百分数的累加值。Extraction Sums of Squared Loadings列为根据特征值大于0.6的原则提取的4个因子的特征值,占方差百分数以及其累加值。这4个因子解释的方差占总方差的89.264%,能够比较全面的

22、反映所有信息。Rotation Sums of Squared Loadings列为旋转因子矩阵后的4个因子的特征值,占方差百分数及其累加值。 图 10 碎石图 如图所示,横坐标表示因子序号,纵坐标表示各因子所对应的特征值。从碎石图中可以比较清楚看出因子的重要程度。比较陡的直线说明直线断点所对应的因子的特征值差值较大,比较缓的直线则对应较小特征值差值。因子1,2,3,4间连线的坡度较陡,说明前4个因子是主要因子,这和前面结论吻合。 下表为所提取因子的因子负荷矩阵,所采取的方法是主成分分析法。 表8 因子负荷矩阵 下表为使用Varimax法进行因子旋转后得到的因子负荷矩阵

23、与上表相比,该表跟好地对主因子进行解释。旋转后的因子负荷矩阵两端集中,能更好地解释主因子。从表中可以看出,第一个因子与氯和硫化氢关系紧密,第二个因子与SO2和环己烷关系紧密,第三个因子与碳4关系紧密,第四个因子与环氧氯丙烷关系紧密。 表 9 旋转后的因子负荷矩阵 用因子分析方法得到的结论:取前4个公共因子可反映原始变量的89.264%的信息。由方差最大正交旋转后的载荷矩阵可以得出,第一公共因子主要代表(氯为-0.849)和(硫化氢为0.813);第二公共因子主要代表(SO2为0.918)和(环己烷为0.793);第三公共因子主要代表(碳4为0.970);第四公共因子主要代表(环氧氯丙烷为0.937)。 参考文献: 1.刘德林,刘贤赵,2006.主成分分析在河流水质综合评价中的应用[J].水土保持研究,13(3):124—126. 2.伊元荣,王涛,2008.主成分分析法在城市河流水质评价中的应用[J].干旱区研究,25(4):497-501. 3.薛 薇. 统计分析与SPSS的应用[M].北京: 中国人民大学出版社,2001:250—259. 4.李波.洪泽湖水质的因子分析.中国环境科学,2003,23(1):69~73. 5.陈东景、马安青等.因子分析在水质评价中的应用.水文.2002.06:29—31.

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服