ImageVerifierCode 换一换
格式:DOC , 页数:50 ,大小:976KB ,
资源ID:3020786      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/3020786.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     留言反馈    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(本科毕业论文---基于主成分的绿色产业评价评估指标体系的构建.doc)为本站上传会员【胜****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

本科毕业论文---基于主成分的绿色产业评价评估指标体系的构建.doc

1、 学科分类号 110 黑龙江科技大学 本科学生毕业论文题 目 基于主成分的绿色产业评价指标体系的构建 Based on the Principal Component of the Construction of the Evaluation Index System of Green Industry 姓 名 学 号 院 (系) 理 学 院 专业、年级 数学与应用数学09-2班 指导教师 2013年6月10日摘 要 关于绿色产业的发展是全球都研究和关注的热点话题。综合评价问题涉及到经济、政治、社会等许多领域,应用极其广泛。综合评价的基础和依据是一套科学合理的评价体系。因此,指标体系构建的合理

2、与否直接决定了综合评价结论的科学性及合理性。本文主要采用系统聚类、主成分分析等方法建立一套绿色产业评价指标体系。首先,构建绿色产业指标海选体系,收集整理2001-2010年大连市绿色产业相关指标及数据,采用系统聚类方法进行聚类,每个指标层内采用主成分分析,选择出对整个子类评价结果影响最大的指标。既避免了指标间的信息重复对于评价结果的影响,同时保留了每个子类内对评价结果影响最大的指标。最后,构建绿色产业评价指标体系。为实现绿色产业综合评价提供了基础和依据,对绿色产业的评价至关重要。所以建立一套绿色产业评价指标体系具有十分重要的意义。关键词 指标评价体系 主成分分析 聚类分析 负载系数Abstra

3、ctComprehensive evaluation involves many domains such as economy, politics, society, is widely applied. Based and comprehensive evaluation is based on a set of scientific and reasonable evaluation system, as a result, the index system of building is reasonable or not directly determines the scientif

4、icity and the rationality of the comprehensive evaluation conclusion, in this paper, by adopting the method of system clustering, and principal component analysis. First, build a green industry audition system, collected in 2001-2010 DaLian city green industry related indicators and data, USES the s

5、ystem clustering method, every index layer adopts the principal component analysis were selected with the greatest impact to the whole category refers to the evaluation results. Avoid the repeated for index of information between the influence of the evaluation results, while retaining most affected

6、 by the result of the evaluation indicators within each category. The last build evaluation index system of green industry. This green industry to achieve comprehensive evaluation to establish a set of scientific and reasonable evaluation index system. About the development of green economy and gree

7、n industry is a global hot topic in the research and attention. In our country, theoretical research and practice of green industry investment guide, including theoretical research is still in the study only macro perspective green investment, instead of standing in the meso and micro combined close

8、ly with the perspective of green industry investment; Investment in green industries, on the other hand, the practice is still in the mastery of a single industry, no scale and achieve the economies of scale formation of industrial clusters. Therefore, is essential to the evaluation of green industr

9、y. So to establish a set of evaluation index system of green industry is of great significance. Keywords Indicators evaluation system Principal component analysis Clustering analysis load factor目录第1章 绪 论.11.1 绿色产业的简述11.1.1 课题背景11.1.2 研究的目的与意义11.2研究的历史和现状21.2.1绿色产业国内外研究的现状和不足21.2.2主成分评价指标体系的发展现状31.3

10、论文的主要内容5第2章 聚类分析82.1系统聚类分析82.1.1系统聚类法的基本步骤82.1.2系统聚类方法82.2明氏距离法9第3章主成分分析理论113.1 主成分分析方法简介113.1.1 主成分分析的基本思想113.1.2主成分分析的计算原理113.2 主成分分析的数学模型143.3 主成分分析方法的推导153.3.1主成分分析推导过程153.3.2 主成分的主要性质183.4本文的计算步骤19第4章 实际问题分析224.1 数据来源与指标选择224.2指标的标准化244.3分层聚类274.4 利用主成分分析对指标数据进行分析314.5对指标进行评价建立指标体系364.6预期与展望41结

11、 论42致 谢43参考文献.44DirectoryChapter1 introduction11.1 A brief description of the green industry11.1.1 Background topics21.1.2 Purpose and significance of the study21.2Study the history and current situation31.2.1Green industry domestic and foreign research the insufficiency31.2.2Principal component eva

12、luation index system of the development 31.3 The main content of the paper5Chapter 2 Clustering82.1Cluster analysis82.1.1 The basic steps of system clustering method82.1.2Cluster Analysis9Chapter 3 Theory of principal component analysis113.1 Principal Component Analysis Method113.1.1 The basic idea

13、of principal component analysis113.1.2PCA calculation principles113.2 Principal component analysis of the mathematical model143.3 Derivation of the main component analysis153.3.1Derivation of principal component analysis153.3.2 PCA calculation steps183.4The main properties of the principal component

14、19Chapter 4 Analyzes the practical problems224.1 Data sources and selection of indicators224.2Standardized indicators244.3Hierarchical clustering274.4 Principal component analysis to analyze data on indicators314.5Expectations and prospects364.6 Evaluation of indicators to establish indicators41Conc

15、lusions42Acknowledgements43Reference Documentation.44VI第1章 绪 论1.1 绿色产业的简述1.1.1 课题背景从1992年联合国环境与发展大会以来,将环境问题与发展问题结合起来,将“可持续发展”作为人类生存和发展的新模式,很快取得全人类的共识,成为人类对于未来发展道路的正确选择。与此同时,一个形象的表征“绿色”,像大潮一样在全世界席卷而来。以发展“绿色产业”为主题的活动如火如荼地展开,特别是以绿色投资、绿色设计、绿色管理、绿色包装、绿色营销、绿色消费等为代表的绿色产业逐渐发展起来21。在我国,绿色产业评价指标体系的理论研究和实践刚刚起步,

16、其中理论研究成果还处于研究宏观视角的绿色投资上,没有涉及到站在中观角度且与微观主体分不开的绿色产业投资;另一方面,对绿色产业投资的实践还处于对单一产业的把握,没有形成产业群规模和实现规模经济效应,这就使得绿色产业评价指标体系理论的研究有其理论和现实意义,所以本文将此问题做为选题。1.1.2 研究的目的与意义绿色产业的定义目前有狭义及广义之分。狭义的绿色产业是指能够直接且主要依靠环境保护中获利的产业。如节能、环保装备等产业。广义的绿色产业是指包括狭义的绿色产业在内的,对环境友好的所有产业的统称。它是指应用绿色环境处理技术,能产出绿色的产品与服务,保护及改善生态资源,能降低环境污染程度,有利于人类

17、社会经济可持续发展的产业。包括第一产业中的农、林、牧、渔等产业,第二产业中采用低碳、节能技术达到低能源消耗、低污染的部分,整个第三产业等产业。本文初筛指标都是反映广义的绿色产业内涵2223。 绿色产业是一种融合了人类的现代文明,以高新技术为支撑,使人与自然和谐相处,能够可持续发展的经济,是市场化和生态化有机结合的经济,也是一种充分体现自然资源价值和生态价值的产业。它是一种经济再生产和自然再生产有机结合的良性发展模式,是人类社会可持续发展的必然产物。绿色是地球上生命的最终源泉,是大自然的本色,把它运用于经济领域,象征着人与自然和谐统一,生态与经济协调发展。所谓产业结构的绿化,是指在社会生产与再生

18、产过程中投入资源能量少,各种资源利用率高,产出的产品或服务多,废物最少,甚至无污染,使产业经济的发展建立在生态环境良性循环的基础上。因此,产业结构绿化是组织生态化的生产物质生产过程或服务过程,使整个社会生产技术过程和经营管理过程生态化,即社会生产、分配、流通、消费、在生产各环节生态化过程,这是21世纪产业经济发展和产业结构演变的总趋势,是历史趋势,也是现实追求目标212223。对某一地区的绿色产业评价问题是一个新兴的话题,国家工业发展状况如何及怎样发展,如何实现地区经济健康高速的发展,都离不开对当地绿色产业指标的评价。在绿色产业的综合评价中,绿色产业各项指标评价是比较典型的多指标综合评价,需要

19、建立一个科学合理的指标评价体系,为综合评价提供理论和现实基础。因此,建立科学合理的绿色产业指标评价体系对于地区经济可持续发展有很大的现实意义。1.2研究的历史和现状基于主成分分析的综合评价以主成分分析为理论基础,以评价体系建立为主线,着眼于作出合理的指标评价体系。以下从绿色产业和指标评价体系两个方面来讨论基于主成分分析的绿色产业评价指标体系的历史和现状21。1.2.1绿色产业国内外研究的现状和不足2005年4月,田江海在吹响绿色产业的号角一文中提出了绿色产业发展的方向和重点,指出绿色产品、绿色企业、绿色产业、绿色城市、绿色技术是绿色产业的五大重点领域,并指出衡量绿色产业的尺度不仅仅是经济效益,

20、还有衡量社会效益特别是生态效率。2005年4月,吾鸣在期待更多绿色产业一文中指出绿色产业是解决我国高消耗、高污染、高排放三高问题、缓解我国部分行业和地区盲目投资、低水平扩张而导致的环境不断恶化、滥占耕地、煤电油运供应紧张等问题的有效途径。2005年8月黄海峰、孙涛、姚望在建立绿色产业体系,推进循环经济发展一文中阐述了绿色产业在我国的发展现状及存在的问题,并指出建立绿色产业体系的几个重要方面:1.发展循环经济;2.加强绿色产业的法规条例建设;3.推进绿色产业市场化进度;4.完善企业、政府、公众的监管机制;5.加大环保教育培训力度。2005年12月,马秀岩、孟耀在中国发展绿色产业的思路和对策一文中

21、提出了中国发展绿色产业的方向和中国发展绿色产业的制度建设和政策。文中从节约利用资源和环境保护及污染治理两个方面阐述了绿色产业发展的方向;从正式制度和非正式制度两个角度阐述了发展绿色产业必须建立完善的制度,并要对绿色产业实施财政、金融政策支持,引导绿色消费,制定并落实促进绿色产业发展的法律法规。2006年1月,赵明在国外社会责任性投资的现状分析及借鉴价值一文中,从SRI认知度、人才培养、评价标准制定、社会保险金运用方案改革四个角度,指出我国发展绿色产业的可能性。2007年5月,孟耀在基于资源环境保护的绿色投资及其发展思路一文中从环境资源保护的角度提出了发展绿色产业的必要性,并指出了要发展绿色产业

22、应采取的措施。以上理论研究虽有一定的理论价值,它为绿色产业理论的进一步完善做了有力的铺垫,但是对绿色产业而言,研究仍处于宏观概念的探讨状态,大部分研究还停留在倡导和建议的角度,没有深入到理论本身研究框架的设定,也没有提出发展绿色产业的具体实施措施,更不用说将绿色产业上升到产业化的高度进行研究,并在此基础上构建绿色产业的评价指标体系,对绿色产业进行测评,为绿色产业的发展指明方向,因而说我国对绿色产业的研究还处于起步状态2324。1.2.2主成分评价指标体系的发展现状目前已有的关于评价指标体系理论问题的研究基本上侧重在指标优化、指标权重的确立等方面,归纳起来大致有以下几个方面. 基于系统科学应用与

23、研究的深入,为建立评价指标体系提供基础理论。建立评价指标体系的常规方法是根据研究问题的实质,自行设计一套评价指标体系,再由专家进行综合判断。在评价指标体系建立研究的早期,研究人员往往片面地追求评价指标体系的全面性,企图使评价指标体系包含所有的因素,结果造成指标过多,指标相互间出现重叠,不但引起专家判断上的错觉和混乱,而且导致指标的权重减小,使指标结果失真。随着系统科学应用与研究的不断深入,人们逐渐把系统科学的理论与方法引入到建立评价指标体系的过程中,通过系统分析研究问题的实质,找出了最能反映研究对象本质属性的指标,从而减少了指标的总量,分离了指标的重叠源,尽量消除了指标间的相关性,为权重的真实

24、性提供了保障图,并从系统工程角度,提出了评价指标体系构建的原则。因此,系统科学从理论上为建立评价指标体系提供了基础。基于评价指标体系量化的差异性,合理地确定、分配指标权重是指标量化的关键,也是建立评价指标体系的难点。在大部份文献中,解决这个问题都是用各种方法计算出指标的权重,这些方法多种多样,基本上可以归结为两大类:主观赋权法和客观赋权法。主观赋权法有专家咨询法、专家排序法、层次分析法(AHP)、秩和比法(RSR)、相关系数法等;客观赋权方法包括主成分分析、因子分析、嫡值法等。这些方法通常都是基于数理统计、模糊数学、灰色系统理论、运筹学、系统工程、经济学等建立模型,均有其优缺点。因为对于多指标

25、系统,由于决策者对不同的指标有不同的偏好,导致每个指标对于研究对象的相对重要性程度一般是不相同的,从而得到不同的研究结果,而主观赋权法和客观赋权法都不能很好地处理决策者的这种偏好。近年来,不少研究人员又提出组合权重法,即用各种方法把主、客观权重结合起来,得到指标的最终权重。总之,指标权重量化方法的研究已经趋于多元化,并逐渐向更科学、更公正、更合理的权重量化方式发展。基于指标数量的不可控性,筛选与优化研究日益明显。邱东将指标体系的选取方法分为“定量与定性两大类”,并提出了定性选取指标的五条基本原则:目的性、全面性、可行性、稳定性与评价方法的协调性。对于定量选取指标,在理论界也有一些研究成果,如王

26、硕平提出用数学方法选择社会经济指标;张尧庭提出用逐步判别分析、系统聚类与动态聚类、极小广义方差法、主成分分析法、极大不相关法等数理统计方法选取评价指标,并对这些方法的特点进行了分析。邱东提到了用“条件广义方差极小原则”来选择指标体系,还提出一种根据指标相关性选择“典型指标”的方法,并详细分析了用主成分分析法进行指标筛选与排序中存在的问题。何湘落提出了根据“三力”建标法和利用评价值离差最大的指标体系就是最优指标体系的思想,建立了最优指标体系及相应的最优评价模型。王庆石探讨了应用负相关系数、多元回归法、逐步回归法、主成分分析法、因子分析法实现统计指标间信息重登的消减方法。王铮提出了采用综合回归法(

27、又称综合趋优法)建立指标体系的方法,并详细讨论了这一方法的三个基本部分:初始指标的建立、指标集的过滤、指标集的净化,这个过程虽然是针对教育评估问题给出的,但却是比较完整的定性与量相结合的指标体系构造过程。目前人们对建立评价指标体系的认识有了一定的深度,已经形成一些较为成熟的方法和理论,并在各种领域得到了广泛应用。但是我们应该清楚的看到:建立评价指标是一项复杂的系统工程,涉及学科范围广泛,因此还需要进一步深入研究和探讨的问题,例如虽然己有许多学者关于指标的筛选进行了一定的研究,但在评价指标体系的系统性、完整性、有效性、科学性方面研究不够深入,对于评价指标体系的数量与结构的研究还处在初级阶段,大多

28、数学者的思路在具体操作上还有待于进一步研究。随着数学、管理科学逐渐发展和成熟,特别是数学方法在管理科学中的广泛应用,以及二者的有效结合研究,使建立起一套更合理更科学、可靠的评价指标体系,减少建立评价指标体系的主观因素,使建立的指标更加客观化,更能反映问题的本质,己经成为我们有待进一步深入研究的问题。1.3 论文的主要内容本文利用多元统计分析中的主成份分析法和分层聚类法,对数据进行处理。对同一子类各元素关于上一层次中某一准则的重要性进行两两比较,并进行排序。最后,得到各方案对于总目标的总排序。依照各指标对于绿色产业的影响程度建立了综合评价指标体系4。1.指标的海选思路4 (1)准则层的设置:通过

29、对绿色产业的相关数据分析将绿色产业分为:绿色生产,绿色消费,绿色环境三个方面。 (2)指标的选取:根据大连市年检公报上的相关数据结合其他绿色产业相关数据得出汇总数据。2.基于主成分的绿色产业评价指标的可观测性原则根据可观测性原则初步筛选指标。删除海选指标中数据无法获得的评价指标,使初步筛选后的指标满足可观测性,能够实际应用。3.指标客观数据的相关一主成分分析筛选思路(1)通过相关性分析删除同一准则层内相关系数大的指标,避免了指标的信息重复。 (2)通过主成分分析删除了因子负载小的指标,保证了筛选出的指标对评价结果有显著影响。4.指标筛选前的数据标准化(1)正向指标的标准化正向指标指数值越大表明

30、人的全面发展状况越好的指标.设为第j个评价对象第i个指标标准化后的值; 为第j个评价对象第i个指标的值;m为被评价的对象数.根据正向指标的标准化公式,为 (1-1)(2)负向指标的标准化负向指标指数值越小表明人的全面发展状况越好的指标。根据负向指标的标准化公式,为 (1-2)式(1-1)中各个符号的含义与式(1-2)相同。5.指标筛选的相关性分析(1)相关性分析的思路通过计算两个评价指标之间的相关系数,删除相关系数较大的评价指标,消除评价指标所反映的信息重复对评价结果的影响,简化指标体系。相关性分析筛选指标的好处是剔除信息重复的指标。(2)相关性分析的具体步骤计算各个评价指标之间的相关系数.设

31、为第i个指标和第j个指标的相关系数,为第k个评价对象第i个指标的值,为第i个指标的平均值。根据相关系数计算公式,则为 (1-3)规定一个极限值M(0M1),如果,则可以删除两者中的一个指标;如果,则保留两个评价指标。通过相关性分析删除同一准则层内相关系数大的指标,保证了筛选出的指标蕴含信息不重复。6.筛选指标的主成分分析,选出每个分类内对整个指标体系影响最大、最具解释性的指标。构建科学合理的绿色产业综合评价指标体系。第2章 聚类分析聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地说,就是指相似元素的集合。聚类分析内容非常丰富,按照分类对象的不同可分为样品分类

32、(Q-型聚类分析)和指标或变量分类(R-型聚类分析);按照分类方法可分为系统聚类法和快速聚类法。本文主要用到的是系统聚类法13。2.1系统聚类分析系统聚类分析(Hierachical cluster analysis)在聚类分析中应用最为广泛。凡是具有数值特征的变量和样品都可以通过选择不同的距离和系统聚类方法而获得满意的数值分类效果。系统聚类法就是把个体逐个地合并成一些子集,直至整个总体都在一个集合之内为止14。先将n个样品各自看成一类,然后规定样品之间的“距离”和类与类之间的距离。选择距离最近的两类合并成一个新类,计算新类和其它类(各当前类)的距离,再将距离最近的两类合并。这样,每次合并减少

33、一类,直至所有的样品都归成一类为止。系统聚类法直观易懂15。2.1.1系统聚类法的基本步骤第一,计算n个样品两两间的距离 ,记作D= 。第二,构造n个类,每个类只包含一个样品。第三,合并距离最近的两类为一新类。第四,计算新类与各当前类的距离。第五,重复步骤3、4,合并距离最近的两类为新类,直到所有的类并为一类为止。第六,画聚类谱系图。第七,确定类的个数和类15。2.1.2 系统聚类方法主要的系统聚类方法有:最短距离法,最长距离法,中间距离法,重心法,组间联结法,离差平方和法(Ward法)。上述6种方法归类的基本步骤一致,只是类与类之间的距离有不同的定义。本文采用组间联结法。组间联结法:类与类之

34、间的平方距离为样品对之间平方距离的平均值,即当某类与合并成一个新类,计算与任一类的距离 (2-1)其中和分别为类和的样品个数。2.2明氏距离法如果把n个样品(X中的n个行)看成p维空间中n个点,则两个样品间相似程度可用p维空间中两点的距离来度量。令表示样品与的距离。明氏(Minkowski)距离 (2-2)当q=1时, 即绝对距离当q=2时, 即欧氏距离当时,即切比雪夫距离当各变量的测量值相差悬殊时,要用明氏距离并不合理,常需要先对数据标准化,然后用标准化后的数据计算距离【16】。明氏距离特别是其中的欧氏距离是人们较为熟悉的也是使用最多的距离。但明氏距离存在不足之处,主要表面在两个方面:第一,

35、它与各指标的量纲有关;第二,它没有考虑指标之间的相关性,欧氏距离也不例外。除此之外,从统计的角度上看,使用欧氏距离要求一个向量的n个分量是不相关的且具有相同的方差,或者说各坐标对欧氏距离的贡献是同等的且变差大小也是相同的,这时使用欧氏距离才合适,效果也较好,否则就有可能不能如实反映情况,甚至导致错误结论。因此一个合理的做法,就是对坐标加权,这就产生了“统计距离”。比如设,且Q的坐标是固定的,点P的坐标相互独立地变化。用s11,s12,spp表示p个变量的n次观测的样本方差,则可以义P到Q的统计距离为: (2-3)所加的权是,即用样本方差除相应坐标。当取时,就是点P到原点O的距离。若时,就是欧氏

36、距离【17】。第3章主成分分析理论3.1 主成分分析方法简介主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。3.1.1 主成分分析的基本思想在实证问题研究中,为了全面、系统地分析问题,我

37、们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题目的理想工具7。3.1.2 主成分分析的计算原理通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:1)计算相关系数矩阵 通常所说相关系数,一般指变量间的相关系数,作为刻划样品

38、间的相似关系也可类似给出定义,即第i个样品与第j个样品之间的相关系数定义为19: ( 3-1)其中 实际上,就是两个向量与的夹角余弦,其中。若将原始数据标准化,则,这时【10】。 (3-2) 在公式(3-2)中,(i,j=1,2,p)为原来变量与的相关系数,其计算公式为 (3-3)因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。2)计算特征值与特征向量首先解特征方程I-R=0求出特征值i(i=1,2,p),并使其按大小顺序排列,即12,p0;然后分别求出对应于特征值i的特征向量ei(i=1,2,p)。3)计算主成分贡献率及累计贡献率。一般取累计贡献率达85的特

39、征值,所对应的第一,第二,第m(mp)个主成分。4)计算主成分载荷 (3-4)由此可以进一步计算主成分得分:Z= (3-5)3.2 主成分分析的数学模型设有个样品,观测样品的项指标(变量):,从而有原始数据矩阵: (3-6)其中 (3-7)由上部分的数据矩阵的个列向量(即个指标向量)构成线性的组合(即称为综合的指标的向量)为: (3-8)简写成 (3-9) (注意:是维向量,所以也是维向量。)上述的线性方程组的要求: (3-10)且系数有下列原则决定:(1)与不相关;(2)是的一切线性组合(系数满足上述的线性的方程组)中方差最大的,是与不相关的一切线性组合中方差最大的,.,是与都不相关的的一切

40、线性组合中方差最大的8。 3.3 主成分分析方法的推导3.3.1主成分分析推导过程定理3.1 若是阶实对称阵,则一定可以找到正交阵使,其中是的特征根9。定理3.2 若上述矩阵的矩阵的特征根所对应的相应的单位特征向量为令 (3-11)则实对称属于不同的特征根所对应的不同的特征向量一定是正交的特征向量即 。 (3-12) 设 (3-13)其中,求在线性方程组中的主成分向量就是找到的线性函数使相对应特征根的方差尽最大可能最大即使 (3-14)能够达到最大值的情况,且 设 协方差的特征根为,相对应的单位的特征向量。令 (3-15)由上面的线性代数的定理可得出:,且 (3-16)因此 (3-17)所以

41、而且 当时有 因此使能够是最大值,且 (3-18)同理而且 (3-19) 上述的证明推导过程说明:的主成分用数值表示就是以矩阵的特征向量作为系数的相对应线性的组合,它们彼此互不相关,其方差为的相对应的特征根4。由于的特征根,所以有:。在实际问题处理时,一般不会选取个主成分,而是根据方差累计的贡献率的大小关系选取前个5。 定义3.1 将第一个主成分的方差贡献率为,由于,所以=。因此第一个主成分的方差贡献率就是第一个主成分方差与全部方差的比例。第一个主成分的方差数值越大,表示第一个主成分综合信息的能力越强10。最前面两个的主成分的累计的方差贡献率定义是为,前个主成分的方差累计贡献率的定义是为。若前

42、个的主成分的累计方差贡献率能够达到85%,表明选取前个主成分基本能够包含所有全部的需检测的所有指标所代表的信息,这种方法的处理既能够减少指标变量的数据个数又便于对实际问题的研究和分析10。3.3.2 主成分的主要性质性质3.1 的协差阵为对角阵。证明 记 , 显然 性质3.2 证明 性质3.3 证明 因为 其中为单位向量第个分量为,其余都为【11】。所以 (3-20)3.4本文的计算步骤 有个指标,每个指标观测个数值,将原始数据写成矩阵 (3-21)1.确定分析变量,收集数据。2.将原始数据标准化。(1)正向指标的标准化正向指标是对绿色产业有益的指标,正向指标数据越大说明产业的可持续发展性越好。正向指标标准化公式为: (3-22)(2)负向指标的标准化 负向指标与正向指标相反,负向指标越小表明产业的可持续发展性越好。负向指标标准化公式为: (3-23)数据标准化在excel中进行,进行数据的标准化处理是为了克服各种指标之间量纲不同的影响,使计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服