资源描述
4 主成分分析
1)原理
假设实际问题中有p个指标,我们把这p个指标看作p个随机变量,记为x1,x2,…,xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标y1,y2,…,yk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互无关。这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。
主成分分析通常的做法,是寻求原指标的线性组合yi:
满足如下条件:
(1) 每个主成分的系数平方和为1(否则其方差可能为无穷大),即
(2) 主成分之间相互无关,即无重叠的信息。即
(3) 主成分的方差依次递减,重要性依次递减,即
2)数据
为确定人参的品级,选取了5个指标来评价人参,而我们希望用更少的指标来评价,试用主成分分析法进行分析。(结果保留两个主成分)
有机酸(%)
维生素(%)
糖类(%)
无机盐(%)
人参多苷(%)
0.056
0.084
0.031
0.038
0.056
0.049
0.055
0.100
0.110
0.049
0.038
0.130
0.079
0.170
0.038
0.034
0.095
0.058
0.160
0.034
0.084
0.066
0.029
0.320
0.084
0.064
0.072
0.100
0.210
0.064
0.048
0.089
0.062
0.260
0.048
0.069
0.087
0.027
0.250
0.069
3)实验步骤
采用SPSS,操作步骤如下:
Step1 输入数据,形成源数据表;
Step2 在菜单栏中依次单击“分析”|“降维”|“因子分析”选项卡;
Step3 将“有机酸”、“维生素”、“糖类”、“无机盐”、“人参多苷”选入“变量”的列表;
Step4 单击“确定”按钮,在SPSS Statistics查看器中输出成分矩阵(见实验结果表一);
Step5 重新建立一个表,定义两个新变量“V1”和“V2”,输入数据;
Step6 在数据编辑器窗口选择“转换”|“计算变量”|,打开“计算变量”的对话框,在“目标变量”文本框中输入“F1”,然后在数字表达式中输入“V1/SQRT”,单击“确定”按钮;
Step7 按step6中的操作,依次完成变量“F2”和“F3”的计算,就会得到特征向量矩阵。
4)实验结果
成份矩阵a
成份
1
2
有机酸
.979
-.054
维生素
-.577
.750
糖类
-.508
-.662
无机盐
.630
.321
人参多苷
.979
-.054
提取方法 :主成份。
a. 已提取了 2 个成份。
公因子方差
初始
提取
有机酸
1.000
.960
维生素
1.000
.896
糖类
1.000
.696
无机盐
1.000
.500
人参多苷
1.000
.960
提取方法:主成份分析。
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
2.903
58.057
58.057
2.903
58.057
58.057
2
1.110
22.202
80.260
1.110
22.202
80.260
3
.757
15.148
95.408
4
.230
4.592
100.000
5
-7.233E-17
-1.447E-15
100.000
提取方法:主成份分析。
计算的特征向量矩阵如下:
因此,F1=0.54x1-0.32x2-0.28x3+0.35x4+0.54x5
F2=-0.3x1+0.42x2-0.36x3+0.18x4+0.03x5
5因子分析
1)原理
因子分析(factor analysis)是一种用来分析隐藏在表象背后的因子作用的一类统计模型和方法。它通过研究众多变量之间的内部依赖关系,探求观测数据的基本结构,并用少数几个不可观测的所谓公共因子的线性组合与特殊因子之和来描述原来观测的每一分量
其数学模型如下:
矩阵形式:
公共因子:y1,…,ym;
特殊因子:
aij:(公共)因子载荷(量),表明xi与yj的相依程度。
A:公共因子载荷阵。
所谓因子分析,就是从可以观测的变量x1,…,xp给出的样本数据中,求出载荷矩阵A,预测出公共因子y1,…,ym。
2)数据
为确定人参的品级,选取了5个指标来评价人参,而我们希望用更少的指标来评价,试用因子分析法进行分析。
有机酸(%)
维生素(%)
糖类(%)
元机盐(%)
人参多苷(%)
0.056
0.084
0.031
0.038
0.056
0.049
0.055
0.100
0.110
0.049
0.038
0.130
0.079
0.170
0.038
0.034
0.095
0.058
0.160
0.034
0.084
0.066
0.029
0.320
0.084
0.064
0.072
0.100
0.210
0.064
0.048
0.089
0.062
0.260
0.048
0.069
0.087
0.027
0.250
0.069
3)实验步骤
采用SPSS,操作步骤如下:
Step1 输入数据,形成源数据表;
Step2 在菜单栏中依次单击“分析”|“降维”|“因子分析”选项卡,将“有机酸”、“维生素”、“糖类”、“无机盐”、“人参多苷”选入“变量”的列表;
Step3 单击“描述”按钮,勾选“原始分析结果”复选框和“KMO与Bartlett球形度检验”复选框,单击“继续”,保存设置结果;
Step4 单击“抽取”按钮,勾选“碎石图”复选框,其他为系统默认选择,单击“继续”,按钮,保存设置结果;
Step5 单击“旋转”按钮,勾选“最大方差法”复选框,其他为系统默认选择,单击“继续”按钮,保存设置结果;
Step6 单击“得分”按钮,勾选“保存为变量”和“因子得分系数”复选框,单击“继续”按钮,保存设置结果。
4)实验结果
公因子方差
初始
提取
VAR00001
1.000
.960
VAR00002
1.000
.896
VAR00003
1.000
.696
VAR00004
1.000
.500
VAR00005
1.000
.960
提取方法:主成份分析。
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
2.903
58.057
58.057
2.903
58.057
58.057
2.018
40.358
40.358
2
1.110
22.202
80.260
1.110
22.202
80.260
1.995
39.902
80.260
3
.757
15.148
95.408
4
.230
4.592
100.000
5
-7.233E-17
-1.447E-15
100.000
提取方法:主成份分析。
成份矩阵a
成份
1
2
VAR00001
.979
-.054
VAR00002
-.577
.750
VAR00003
-.508
-.662
VAR00004
.630
.321
VAR00005
.979
-.054
提取方法 :主成份。
a. 已提取了 2 个成份。
旋转成份矩阵a
成份
1
2
VAR00001
.658
.726
VAR00002
.116
-.939
VAR00003
-.827
.114
VAR00004
.674
.214
VAR00005
.658
.726
提取方法 :主成份。
旋转法 :具有 Kaiser 标准化的正交旋转法。
a. 旋转在 3 次迭代后收敛。
成份得分系数矩阵
成份
1
2
VAR00001
.206
.271
VAR00002
.333
-.621
VAR00003
-.544
.301
VAR00004
.358
-.054
VAR00005
.206
.271
提取方法 :主成份。
旋转法 :具有 Kaiser 标准化的正交旋转法。
构成得分。
因子得分矩阵
展开阅读全文