收藏 分销(赏)

主成分分析讲解.pptx

上传人:可**** 文档编号:903334 上传时间:2024-04-03 格式:PPTX 页数:43 大小:730.18KB
下载 相关 举报
主成分分析讲解.pptx_第1页
第1页 / 共43页
主成分分析讲解.pptx_第2页
第2页 / 共43页
主成分分析讲解.pptx_第3页
第3页 / 共43页
主成分分析讲解.pptx_第4页
第4页 / 共43页
主成分分析讲解.pptx_第5页
第5页 / 共43页
点击查看更多>>
资源描述

1、主成分分析主成分分析Principal Component Analysis2024/3/29 周五Dept.of Epidemio&Biostat,SPH2统计学研究的核心问题统计学研究的核心问题?没有变异就没有统计学没有变异就没有统计学变变 异异VARIATION变异性的度量变异性的度量?方差方差 Variance2024/3/29 周五Dept.of Epidemio&Biostat,SPH3方差是什么?方差是信息多元世界的信息度量多元世界的每个变量的包含信息不同在单个变量方差不变的情况下,各变量相关性越高,则总信息量越小2024/3/29 周五Dept.of Epidemio&Bios

2、tat,SPH42024/3/29 周五Dept.of Epidemio&Biostat,SPH5两组变量:A B2024/3/29 周五Dept.of Epidemio&Biostat,SPH62024/3/29 周五Dept.of Epidemio&Biostat,SPH72024/3/29 周五Dept.of Epidemio&Biostat,SPH82024/3/29 周五Dept.of Epidemio&Biostat,SPH9协方差矩阵协方差矩阵样本的方差样本的方差-协方差矩阵(协方差矩阵(variance-covariance matrix)如果有如果有p个观测变量个观测变量 ,

3、则样本则样本的协方差矩阵记为的协方差矩阵记为2024/3/29 周五Dept.of Epidemio&Biostat,SPH10相关矩阵相关矩阵 如果有如果有p个观测变量个观测变量 ,其相,其相关阵(关阵(correlation matrix)记为)记为2024/3/29 周五Dept.of Epidemio&Biostat,SPH11矩阵的特征值和特征向量矩阵的特征值和特征向量对于方阵对于方阵A,如存在常数,如存在常数及非零向量及非零向量x,使使 Ax=x 则则为为A的一个特征值,的一个特征值,x为与为与对应的矩对应的矩阵阵A的特征向量。的特征向量。n介方阵有介方阵有n对特征值和特征向量对特

4、征值和特征向量2024/3/29 周五Dept.of Epidemio&Biostat,SPH12正交向量(阵)、单位向量正交向量(阵)、单位向量正交向量:正交向量:a=(a1,ap),b=(b1,bp)如果如果ab=a1b1+apbp=0,则称则称a、b正交正交单位向量:向量单位向量:向量a=(a1,ap),如果如果 则称则称a为单位向量为单位向量正交阵:正交阵:n阶方阵阶方阵A,如果,如果 AA=AA=I,则称,则称A为为n阶正交阵,其中阶正交阵,其中A的列向量(或行向量)为正交向量,的列向量(或行向量)为正交向量,A=A-12024/3/29 周五Dept.of Epidemio&Bio

5、stat,SPH132024/3/29 周五Dept.of Epidemio&Biostat,SPH142024/3/29 周五Dept.of Epidemio&Biostat,SPH152024/3/29 周五Dept.of Epidemio&Biostat,SPH162024/3/29 周五Dept.of Epidemio&Biostat,SPH172024/3/29 周五Dept.of Epidemio&Biostat,SPH18 主成分的概念主成分的概念 1设设x1,x2,xp为为 p 维随机变量维随机变量 X1,X2,Xp的标准化变换的标准化变换 如果其线性组合如果其线性组合 满足满

6、足则称则称C1为第一主成分。为第一主成分。2024/3/29 周五Dept.of Epidemio&Biostat,SPH19主成分的概念主成分的概念 2若若满足满足则称则称C2为第二主成分。为第二主成分。类似地,共可得到至多类似地,共可得到至多 p 个主成分。个主成分。2024/3/29 周五Dept.of Epidemio&Biostat,SPH20主成分的性质主成分的性质主成分主成分 C1,C2,Cp 具有以下性质:具有以下性质:(1)主成分间互不相关主成分间互不相关Corr(Ci,Cj)=0 i j(2)组组合合系系数数(ai1,ai2,aip)构构成成的的向向量量为为单单位位向量向量

7、(3)各主成分的方差是依次递减的,各主成分的方差是依次递减的,即即Var(C1)Var(C2)Var(Cp)(4)总方差不增不减,总方差不增不减,即即 Var(C1)+Var(C2)+Var(Cp)=Var(x1)+Var(x2)+Var(xp)=p 2024/3/29 周五Dept.of Epidemio&Biostat,SPH21主成分的计算主成分的计算 1设设 R 为为 X1,X2,Xp 的相关矩阵,则存在的相关矩阵,则存在 1 2 p0,和正交矩阵,和正交矩阵A,使,使其中其中 i为相关矩阵为相关矩阵R的第的第i个特征值个特征值(eigenvalue)(ai1 ai2 aip)则是相关

8、矩阵则是相关矩阵R的第的第i个特征值对应的特征向量。个特征值对应的特征向量。i是第是第i个主成分的方差个主成分的方差2024/3/29 周五Dept.of Epidemio&Biostat,SPH22主成分的计算主成分的计算 2记主成分记主成分C=(C1 C2 Cp),则,则 C=Ax 即即2024/3/29 周五Dept.of Epidemio&Biostat,SPH23主成分的计算主成分的计算 3因子模型(全分量模型)表达形式因子模型(全分量模型)表达形式 x=AC 即即矩阵矩阵A称载荷矩阵,反映各主成分对原始称载荷矩阵,反映各主成分对原始变量变量x各分量的贡献大小。各分量的贡献大小。20

9、24/3/29 周五Dept.of Epidemio&Biostat,SPH24主成分的计算主成分的计算 4因子模型(全分量模型)表达因子模型(全分量模型)表达-主成分标准化变换主成分标准化变换2024/3/29 周五Dept.of Epidemio&Biostat,SPH25x=Lclij是是xj和和ci的相关系数的相关系数SPSS输出的系数矩阵是输出的系数矩阵是L矩阵矩阵2024/3/29 周五Dept.of Epidemio&Biostat,SPH26实例实例 城市男生形态资料城市男生形态资料数据来自方积乾数据来自方积乾医学统计学与电脑试验医学统计学与电脑试验第第2 2版版 2024/3

10、/29 周五Dept.of Epidemio&Biostat,SPH27实例主成分分析结果特征值(方差)及其比例2024/3/29 周五Dept.of Epidemio&Biostat,SPH28主成分分析结果L矩阵注意注意L矩阵的下标,是列在前,行在后矩阵的下标,是列在前,行在后2024/3/29 周五Dept.of Epidemio&Biostat,SPH29主成分分析结果L矩阵注意注意L矩阵的下标,是列在前,行在后矩阵的下标,是列在前,行在后2024/3/29 周五Dept.of Epidemio&Biostat,SPH30主成分和原变量的关系观察观察L矩阵,由相关系数做出解释矩阵,由相

11、关系数做出解释主成分未必一定有明确的解释主成分未必一定有明确的解释选取有明确解释的主成分做综合指标,选取有明确解释的主成分做综合指标,主成分得分就是主成分得分就是“综合指数综合指数”。2024/3/29 周五Dept.of Epidemio&Biostat,SPH31实例的标准化第一主成分得分2024/3/29 周五Dept.of Epidemio&Biostat,SPH32实例的标准化第一、二主成分得分2024/3/29 周五Dept.of Epidemio&Biostat,SPH33主成分数目的保留主成分数目的保留降维问题降维问题保留多少个主成分取决于保留部分的累保留多少个主成分取决于保留

12、部分的累积方差在方差总和中所占百分比,它标积方差在方差总和中所占百分比,它标志着前几个主成分概括信息之多寡志着前几个主成分概括信息之多寡。实际上就是看特征值实际上就是看特征值 的大小的大小保留多少主成分为宜主要根据实际问题保留多少主成分为宜主要根据实际问题和经验决定,并无严格统计规则。和经验决定,并无严格统计规则。2024/3/29 周五Dept.of Epidemio&Biostat,SPH34主成分分析的应用主成分分析的应用综合指标的抽取综合指标的抽取主成分回归主成分回归 解决自变量严重共线性问题解决自变量严重共线性问题主成分判别主成分判别 解决解释变量的共线性问题解决解释变量的共线性问题

13、变量聚类中计算相似系数变量聚类中计算相似系数因子分析因子分析2024/3/29 周五Dept.of Epidemio&Biostat,SPH35例例-主成分回归主成分回归22例胎儿受精龄(例胎儿受精龄(Y,周)与胎儿外型测周)与胎儿外型测量指标:量指标:均数均数 标准差标准差身高(身高(X1,cm)33.05 9.71 头围(头围(X2,cm)23.26 6.86体重(体重(X3,g)936.9 690.3 试求由试求由X1、X2、X3推算推算Y的回归方程的回归方程2024/3/29 周五Dept.of Epidemio&Biostat,SPH36例例-主成分回归主成分回归 结果结果1直接做多

14、重回归结果直接做多重回归结果2024/3/29 周五Dept.of Epidemio&Biostat,SPH37X1、X2、X3与与Y的相关阵的相关阵X1X2X3YX11X20.9981X30.9440.9471Y0.9520.9430.97012024/3/29 周五Dept.of Epidemio&Biostat,SPH38主成分分析结果主成分分析结果(表中上半部的系数矩阵是矩阵表中上半部的系数矩阵是矩阵A)C1C2C3x1 0.58 -0.42 0.70 x2 0.58 -0.39 -0.71x3 0.57 0.82 0.02Var 2.93 0.07 0.00%97.54 2.38 0

15、.08累积累积%97.54 99.92 1002024/3/29 周五Dept.of Epidemio&Biostat,SPH39主成分回归分析结果主成分回归分析结果2024/3/29 周五Dept.of Epidemio&Biostat,SPH40主成分回归分析结果主成分回归分析结果附:本例岭回归分析结果附:本例岭回归分析结果2024/3/29 周五Dept.of Epidemio&Biostat,SPH41主成分分析应用实例主成分分析应用实例综合指标选取综合指标选取计算主成分的两种方法计算主成分的两种方法 如果各变量具有同等尺度如果各变量具有同等尺度 对角化相关阵还是协方差阵?对角化相关阵

16、还是协方差阵?从协方差阵计算主成分的一个特点:从协方差阵计算主成分的一个特点:方差大的变量倾向在第一主成分上占方差大的变量倾向在第一主成分上占有更大的比重(与从相关阵计算比较)。有更大的比重(与从相关阵计算比较)。2024/3/29 周五Dept.of Epidemio&Biostat,SPH42广州市某年空气污染指标的主成分分析结果广州市某年空气污染指标的主成分分析结果从相关阵计算从相关阵计算从协方差阵计算从协方差阵计算C1C2C3C1C2C3iNOx 0.63-0.17-0.76 0.93-0.30-0.21iTSP 0.51 0.82 0.25 0.29 0.95-0.06iSO2 0.58-0.55 0.60 0.21 0.00 0.97 1.88 0.70 0.424349 891 350%62.723.413.977.815.9 6.32024/3/29 周五Dept.of Epidemio&Biostat,SPH43广州市某2个月的空气污染指数

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服