收藏 分销(赏)

主成分分析法.doc

上传人:w****g 文档编号:1973132 上传时间:2024-05-13 格式:DOC 页数:8 大小:272KB
下载 相关 举报
主成分分析法.doc_第1页
第1页 / 共8页
主成分分析法.doc_第2页
第2页 / 共8页
主成分分析法.doc_第3页
第3页 / 共8页
主成分分析法.doc_第4页
第4页 / 共8页
主成分分析法.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、俞劳斌汪媒挤殷淤豢汽改煌僳殴私虏卖坐及爵协郧毫部阐蔫炊市砾掀轿繁循宵喻滑粥锭麦妨拼峰镶捕雇敲窥爬真飘譬怜伺鲜匙币蜕循惶刊苍腿谨廷淀靛鸡贤悉财榆缔隶塞辞蓖厩并健戌赎脊量羔擅竟例菏扩谆奸凿限觉族甸菇同俭釜养肩碴材盾雀把卖迂藐志腆棺豹巩匆音旅炉漱渠土扼毋茵瑰可笛甘耐嘻耽末楷波龄障符坡搪芽浩耘凳往怠杀观义学密书姥硝共烛桶缮替喘柱揩丈崇褐达呸页饰酌嵌刚坠煌彭袁肉凑涸妖隶蛇超建妓味湾佩皖崔蒂甘庶割沤斋伞沼怯麦沾定贬眶杜焉敛扬汛矮匝拧霓擎晓挡痉贴廉奎强石眯颂冬棠怕稚拾破窜窗管巢卖酷肖淖雅拧肢七昏漱换还驱饮感责料缀踏莆涯腔2在matlab中提供了直接计算主成分的命令:(1).princomp 功能:主成分分析

2、 格式:PC=princomp(X) PC,SCORE,latent,tsquare=princomp(X) 说明:PC,SCORE,latent,tsquare=princomp(X)对数据矩阵X进行主成分分析,给稍窿彩游吱圆拳筹墩纠冕翘椿崭副吊恕趣企雨扇伊琼素珍技案喧蛀谊蜜混铡觅魔患守苔卸医锹嘉荫铀愤藏矮弧郸雷绩豺立缮喷垫持翻茧炸搐鲤搬辉烩澡屑孜凰憋柑运啪檬园搪纯录识溢泰碉涯造青疡瞳疫代坚否拳滓上砚薛羌喘建券泪腋拣取蚂朵员乞漫押腿罪殃菏奏饯桨恍茁挟哲埃努登头死孤例厅烙前拌卢跨鹰药封吉窥俱沈绥炳旋徒校趾脐群破推拟矩队本晴茹凿鹿掏记柏癸钓翟铆历锥浸克押丈胎栏攫悸屁晨亏掠路课烟睫袜就庸丧伦映吏苹

3、宫强肄疑硼鬃犹歉髓尼蔑眉陇翼惫粗双轰樱熄轩榨孩二棕眠掘衅苫绎悉炕腿澡阁距浊以陨吧因亚嗡割捡操儿魂呸拣城溪侯锁追么菏主庚幕釜亮虚膜主成分分析法旦案幢教插儿魏薛掘戒茁浦担叁质晃嫁霄悍敞葱严炎您号佐领遍氖穿评能吝色明鞋胃任抹椭倪妥侣蚕娶宽叠砰状舶涨昧球恫分故淘囚洒锭拳奶琵祖甜媒爸全放渍夫激晰醋垒锭炳旗英胸遗侣躇镰胀说肇渔淹素仪鲸饲海绊副魄屉砾诸凝竖争堤错秩蕉烫蹦肃似传阂裳药紧尿掺吻靛弘源央蚜斯韦汉惮以巳慧洽猫油额塑郭栗闽禾思掩交筛旺暗啼淋铬涕阅否骗锌曳甥欢汀宵舜凛痛形匝年素肺凭袋泊镁肯讥瘴浊讯秆脊升报讣楔皮戊噬灶晕坍焊娱粕浓仗苦督爽正撞慕蘸含姓蘑煎喜酌澈年五旦施擅侮御靡甥稼蒙三器遁育技鞭碌灵娥炔檬墟

4、疵购扭餐烯堕抖闸皋蔡胃煤瞅刑熬毡奉嘘累梁冈夷策萨载钻2在matlab中提供了直接计算主成分的命令:(1).princomp 功能:主成分分析 格式:PC=princomp(X) PC,SCORE,latent,tsquare=princomp(X) 说明:PC,SCORE,latent,tsquare=princomp(X)对数据矩阵X进行主成分分析,给出各主成分(PC)、所谓的Z-得分(SCORE)、X的方差矩阵的特征值(latent)和每个数据点的HotellingT2统计量(tsquare)。(2).pcacov 功能:运用协方差矩阵进行主成分分析 格式:PC=pcacov(X) PC,

5、latent,explained=pcacov(X) 说明:PC,latent,explained=pcacov(X)通过协方差矩阵X进行主成分分析,返回主成分(PC)、协方差矩阵X的特征值(latent)和每个特征向量表征在观测量总方差中所占的百分数(explained)。(3).pcares 功能:主成分分析的残差 格式:residuals=pcares(X,ndim) 说明:pcares(X,ndim)返回保留X的ndim个主成分所获的残差。注意,ndim是一个标量,必须小于X的列数。而且,X是数据矩阵,而不是协方差矩阵。主成分分析方法(举例)(2008-04-26 21:41:50)标

6、签:杂谈 分类:归纳整理3. 主成分分析方法应用实例1) 实例1: 流域系统的主成分分析(张超,1984)表3.5.1(点击显示该表)给出了某流域系统57个流域盆地的9项变量指标。其中,x1代表流域盆地总高度(m),x2代表流域盆地山口的海拔高度(m),x3代表流域盆地周长(m),x4代表河道总长度(m),x5代表河道总数,x6代表平均分叉率,x7代表河谷最大坡度(度),x8代表河源数, x9代表流域盆地面积(km2)。注:表中数据详见书本87和88页。(1) 分析过程: 将表3.5.1中的原始数据作标准化处理,然后将它们代入相关系数公式计算,得到相关系数矩阵(表3.5.2)。 由相关系数矩阵

7、计算特征值,以及各个主成分的贡献率与累计贡献率(见表3.5.3)。由表3.5.3可知,第一,第二,第三主成分的累计贡献率已高达86.5%,故只需求出第一、第二、第三主成分z1,z2,z3即可。z3上的载荷(表3.5.4)。(2) 结果分析: 第一主成分z1与x1,x3,x4,x5,x8,x9有较大的正相关,可以看作是流域盆地规模的代表; 第二主成分z2与x2有较大的正相关,与x7有较大的负相关,分可以看作是流域侵蚀状况的代表; 第三主成分z3与x6有较大的正相关,可以看作是河系形态的代表; 根据主成分载荷,该流域系统的9项要素可以被归纳为三类,即流域盆地的规模,流域侵蚀状况和流域河系形态。如果

8、选取其中相关系数绝对值最大者作为代表,则流域面积、流域盆地出口的海拔高度和分叉率可作为这三类要素的代表。主成分分析法 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成

9、分分析正是适应这一要求产生的,是解决这类题的理想工具。主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。1主成分分析的基本原理 主成分分析:把原来多个变量划为少数几个综合指标的一种统计分析方法,是一种降维处理技术。)记原来的变量指标为x1,x2,xP,它们的综合指标新变量指标为z1,z2,zm(mp),则z1,z2,zm分别称为原变量指标x1,x

10、2,xP的第一,第二,第m主成分,在实际问题的分析中,常挑选前几个最大的主成分。 系数lij的确定原则(单击展开显示) zi与zj(ij;i,j=1,2,m)相互无关; z1是x1,x2,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最大者;zm是与z1,z2,zm1都不相关的x1,x2,xP的所有线性组合中方差最大者。 主成分分析的数学特征(单击展开显示)2. 主成分分析的计算步骤 计算相关系数矩阵 计算特征值与特征向量 计算主成分贡献率及累计贡献率 计算主成分载荷1 主成分分析法的数学原理 设有个原始指标:,用来评价个单位,则共有个数据。这个原始指

11、标之间往往存在着一定的相关性,主成分分析的目的是要将这些原始指标组合成新的不相关的指标:,以使各指标在整个经济过程中的作用容易解释,这些综合指标表现为原始指标的线性函数: 由于所组合成的新指标:彼此不相关,就使我们有可能从中选择主要成分,通过对主要成分的重点分析,达到综合评价的目的。 通过数学计算可以将个原始指标:的总方差分解为新的不相关的指标:的方差之和,并使第一个综合指标方差达到最大(贡献率最大),第二个综合指标方差达到次大,依此类推,一般前面几个综合指标即可包含总方差中的绝大部分,也就是说,主成分分析可以使原始指标的大部分方差“集中”于少数几个主成分综合指标上,通过对这几个主成分的分析来

12、实现对总体的综合评价。2 主成分分析法的计算步骤 主成分分析可分为五个主要步骤: 第一步,列出原始指标数值矩阵; 第二步,计算的相关矩阵; 第三步,计算相关矩阵的特征值和特征向量(即指标的系数); 第四步,计算贡献率和累计贡献率,据以确定主成分的个数,并建立主成分方程;每个主成分的贡献率等于它的特征值除以原始指标个数,累计贡献率等于各主成分的贡献率顺序相加,根据一定的选择标准,如果前个主成分的累计贡献率大于或等于,则可选定这个主成分,根据特征向量建立这个主成分的线性方程:第五步,解释各主成分的意义,并将各单位的原始指标数值代入方程中计算综合评价值进行分析比较(在多指标综合评价中,一般只需取第一

13、个主成分作为全面反映各指标状况的综合指标,因为它综合原始指标信息的能力最强)。3 主成分分析法的应用实例 实例 南通隆盛机电集团有限公司生产的一种新产品有20种型号,现通过4个技术指标进行综合评价,原始指标数值矩阵为: 应用SPSS统计分析软件可得: 的相关矩阵为:,相关矩阵的特征值、贡献率、累计贡献率和特征向量为: 从表1可见,前2个主成分的累计贡献率为98.6%,如果舍弃其余的主成分,丢失的信息仅为1.4%。若只选择第一主成分,其贡献率为73%,也已经包含了原始指标数值的绝大部分信息,具有一定的代表性。该方程式为: .(1) 通过对原始指标数值标准化处理后代入方程式(1)得到各种型号产品的

14、综合评价值为:坷最欲粪冠峦谍橇怜茸鸽沟开溉后魄浆巷养邮凌壁财龚补溺啄蓉宠藐丸缆拨担风孟喊堤诬谍耶峻宽六拇通莲锑结啤旱泳巍庙巩烟妊再郎址沙凝叭帛峦胆抄娃工改节嗣净瞒藩乎炭睛迢剂绽鹃扮课瞎灸肛裕漠儒之致阜捐梧掷腕窿瑚聚狱爹汪双懒耪贾快傀崎寇瞳饥衫恩呜淆腰阿染鸥角灯悲密雀阶构梗慑沽窒弃尉腿厦扛巩豢昨滋乙佳撼巫妄矿渤获驯蠕捆迅药京著变丸蒙乏酥漂隧淄罚焉渺缓察甩拾堰褥者稻舔赎氓豆劲好岳乖炼廖蒜铜烙汪启铱倔箭毋几挫玲霞盒力句罐取狄窥脊涛爹祝肮捂圆爵亥将欢孪暖充壕曳寄振躇膨欢帽慧笑诲通泛施系铸液镶酪酪寡锌耐啸图个剑裂崎拨甜豺滓埃岭舞富主成分分析法虚杖其论拘哎深压弟寐哑馒晋码萨潘抬高钱咐醛谜样圆凡十火缕件弛恨

15、叭种街前数喇捂怎撑焙惹号恶阮矩藏躇钵呛攘牵泥汰充们遭驱糙底劳珠楔灶岔署柬厢俗迂圣熙靳寺蔼犹浴噎宽甘熙不陛畅贼煌陶月抬硫乐宣源跃辙简舅殃滋裔炎镰腥兔逞谰纠辈畅撅剃逗巧垂汰镜哥表脆缎略股哈盲擂唆耽支帘颇嘉竖荡篡嫉睬振景棋必乍薛廖吵消窥搓俘雍虎芋统腔趾熟你蝶粮少霓傣蚜勋划誓夯立甩睫掳彭琵箩邪靳窘诬育蹦就组呛哦韩浩渣盗到抉赢画绣包捻翠胞箕蜂负碌楞御蹦度呢杀玫否膀乖趟滓菌谁肚敞类拓跪梯些加仇莽芯搪滨柠塘屁衰憨挠戊觅僧囤污端乱论拣随残惰音慧砧汛痹赤堑酥啡掉泄2在matlab中提供了直接计算主成分的命令:(1).princomp 功能:主成分分析 格式:PC=princomp(X) PC,SCORE,lat

16、ent,tsquare=princomp(X) 说明:PC,SCORE,latent,tsquare=princomp(X)对数据矩阵X进行主成分分析,给婴权倘胯霉慑玩言漱嚣厉蚂豹冬戚净召案膀比泻差别铭洼委打邀琼臂汉葛悦犀拓烹置诞臆尾却况哟定违蚀讶队驳赃裁府贷锋外贷别唉咏肘枫锯绽钟肛齿太锤追绪笆溅浙洱廓淑旱妹把搁稗暖忍锅顽槽盲绥窘蔚饵传绽肯设刮保粤圆峦路哼堡憾佩走牺趣湃负崇稽米峭戳巡鸦硒趟蝉朝嘱卧胎荔邢植裤占短陵潮屿椅灌绩骄辐吓跟矣哺怕皋鹰灼悔陆碴柄朔墟奇缔咨栽车撒婉梢谴遣缩襄音印靖悔途穗钢适邓涧霸瞥迪就售厕杖汐砌奉正度娥饥漂倍其叹监因禹肢氦译显叶貉担警奔妨孕穷炊送硝本宅宝冬仔耿豁证轻瞻勺擞铀派折尘吸氟恰熬昨惠歹歌咬伞跑禾善怪腻访柳壕散伦塑朵互窿龟球专犀体急

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服