1、一、判断题 ( 对 )1的协差阵一定是对称的半正定阵 ( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。 ( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。 ( 错)5,分别是样本均值和样本离差阵,则分别是的无偏估计。 ( 对)6,作为样本均值的估计,是无偏的、有效的、一致的。 ( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 (
2、对)8因子载荷阵中的表示第i个变量在第j个公因子上的相对重要性。 ( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。 (对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设是总体的协方差阵,的特征根与相应的单位正交化特征向量,则第一主成分的表达式是,方差为。 3设是总体的协方差阵,的特征根和标准正交特征向量分别为: ,则其第二个主成分的表达式是,方差为1.024 4. 若,()且相互独立
3、则样本均值向量服从的分布是. 5.设,和分别是正态总体的样本均值和样本离差阵,则服从 6设,则服从 7.设随机向量,且协差阵,则其相关矩阵= 8. 设,其中,则0 9设X,Y是来自均值向量为,协差阵为的总体的两个样品,则X,Y间的马氏平方距离 10设X,Y是来自均值向量为,协差阵为的总体G的两个样品,则X与总体G的马氏平方距离= 11设随机向量的相关系数矩阵通过因子分析分解为 则的共性方差 0.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量X1的共同度,反映了公共因子对变量X1的影响程度。 标准化变量
4、X1的方差为1,公因子f1对X的贡献0.9342+0.4172+0.8352=1.743 12. 对应分析是将 Q型因子分析 和 R型因子分析 结合起来进行的统计分析方法 13 典型相关分析是研究两组变量间 相关关系 的一种多元统计方法 14. 聚类分析中,Q型聚类是指对 样本 进行聚类,R型聚类是指对 指标 进行聚类。 15 Spss for windows中主成分分析由Data Reduction->Factor Analysis 过程实现。 16 设是第k对典型变量则 17. 在多维标度分析中,当D是
5、欧几里得距离阵时,X是D的一个构图 三、简答题(答案见平时习题) 1 简述多元统计的主要内容与方法(10分) 可对比一元统计列出多元统计的主要内容与方法 (从随机变量及其分布、数字特征、四大分布(正态分布密度(1分)、与威沙特分布(1分)、t分布与Hoteling分布(1分)、F分布与威尔克斯分布(1分))、抽样分布定理、参数估计和假设检验、统计方法(2分) 2. 请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同 3请阐述系统聚类法、K均值聚类法、有序样品聚类法的基本思想和方法,比较其异同 4请阐述主成分分析和因子分析的基本思想、方法步骤和应用
6、比较其异同 5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应用 四、计算题 1设三维随机向量,已知,求的分布 解:正态分布的线性组合仍为正态,故只需求 所以 另解: 故 2. 设三维随机向量,已知,求的分布 解:正态分布的任意线性组合仍正态,故Y的分布是一维正态分布,只需求 故 3设有两个二元总体和 ,从中分别抽取样本计算得到 ,, 假设,试用距离判别法建立判别函数和判别规则。 样品X=(6,0)’应属于哪个总体? 解:= ,= , == 即样品X属于总体 4设已知有两个正态总体,且,而其先验概
7、率分别为误判的代价,试用贝叶斯判别法确定样本属于哪个总体? 解:由Bayes判别知, 其中 故属于G2总体 5表1是根据某超市对不同品牌同类产品按畅销(1)、平销(2)和滞销(3)的数据,利用SPSS得到的Bayes判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判断新样品(x1,x2,x3)属于哪类? Classification Function Coefficients group 1 2 3 x1 -11.689 -10.707 -2.194 x2 12.297 13.361 4.960 x3 16.761 17.086 6
8、447 (Constant) -81.843 -94.536 -17.449 Fisher's linear discriminant functions 表1 Bayes判别函数系数 解:根据判别分析的结果建立Bayes判别函数: Bayes判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下: Group1: Group2: Group3: 将新样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一
9、类。 6. 对某数据资料进行因子分析,因子分析是从相关系数阵出发进行的,前两个特征根和对应的标准正交特征向量为, (1) 取公因子个数为2,求因子载荷阵 (2) 用F1F2表示选取的公因子,为特殊因子,写出因子模型,说明因子载荷阵中元素的统计意义 7在一项对杨树的形状研究中,测定了20株杨树树叶,每个叶片测定了四个变量分别代表叶长,叶子2/3处宽,1/3处宽,1/2处宽,这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为: 若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡献率 解:选取主成分的一般原则是特征值大于1或累积贡献率达到80
10、以上。据题选取两个主成分,其表达式和贡献率分别是: 8下表是进行因子分析的结果,试根据表中信息写出每个原始变量的因子表达式,并分析是否需要对因子载荷旋转。 Component Matrix Component 1 2 3 X1 .969 -1.084E-02 .205 X2 .911 .321 -.102 X3 .847 -.120 .323 X4 .941 .281 -2.693E-02 X5 .899 .21
11、5 -1.963E-02 X6 -.313 .839 .305 X7 -.666 6.280E-02 .679 X8 .575 -.580 .367 Extraction Method: Principal Component Analysis. a 3 components extracted. 解:由表 F1 F2 F3 X1 .969 -1.084E-02 .205 X2 .911 .321 -.102 X3 .847 -.120 .323 X4 .941 .281 -2.693E-02 X5 .899 .215 -1.963E-02 X6 -.313 .839 .305 X7 -.666 6.280E-02 .679 X8 .575 -.580 .367 知 X1= .969F1 -1.084E-02F2+ .205 F3 可以不做因子旋转,因为载荷系数基本处于两极分化状态,第一个公因子在指标X1 ,X2,X3,X4,X5,X7,X8有较大载荷,F2只在X6和X8上有较大载荷,F3只在X7上有较大载荷。 - 7 -






