收藏 分销(赏)

多元统计分析期末试题及答案.pdf

上传人:精*** 文档编号:2018526 上传时间:2024-05-13 格式:PDF 页数:8 大小:192.65KB 下载积分:6 金币
下载 相关 举报
多元统计分析期末试题及答案.pdf_第1页
第1页 / 共8页
多元统计分析期末试题及答案.pdf_第2页
第2页 / 共8页


点击查看更多>>
资源描述
22121212121(,),(,),(,),1XNXx xxxxx 1、设其中则C ov(,)=_.10312(,),1,10,()()_iiiiXNiWXX、设则=服从。1234433,492,3216_XxxxR、设随机向量且协方差矩阵则它的相关矩阵4、_,_,_。215,1,16(,),(,)154()4()_ippX iNXANTXAX、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。12332313116421(,)(,),(1,0,2),441,2142Xx x xNxxxxx 、设其中试判断与是否独立?,123设X=xxx的相关系数矩阵通过因子分析分解为211Xh 的共性方差111X的方差21Xg 1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R 11262(90,58,16),82.04.310714.62108.946460.2,(5)(115.6924)14.62103.17237.14.5XS0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。其中0.010.010.0137608.946437.376035.5936(0.01,(3,2)99.2,(3,3)29.5,(3,4)16.7)FFF12124122411362190.5,(21),(12)35qqCe CeBayesX 12、设已知有两正态总体G与G,且,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?1234411(,)(0,),0111TXXXXXN 4、设,协方差阵(1)试从 出发求 X 的第一总体主成分;(2)试问当 取多大时才能使第一主成分的贡献率达 95以上。1212111221225(,),(,),100000010.950()00.9510000100TTXXXXYY XZYZ 、设为标准化向量,令且其协方差阵V,求其第一对典型相关变量和它们的典型相关系数?1,()XE XX、设随机向量的均值向量、协方差矩阵分别为、试证:。2(,),(,)PrXNNAb A Ar pr 1、设随机向量又设Y=A X+b试证:Y。1 1、0 0 2 2、W W3 3(1010,)3 3、211342113611146R 4 4、0.8720.872 1 1 1.7431.7435 5、T T2 2(1515,p p)或()或(15p/(16-p)15p/(16-p))F F(p p,n-pn-p)2312131231112213312121,2,10021021210001102231642100102xxyyxxxxxxyxxyxxxyEyyVy 、令则01-101-101-11234411002141021061661620162040210616(1,61620)3162040yyN 01-1故,的联合分布为故不独立。01001121000.02:8.02.2,1.54.310714.62108.9464(23.13848)14.62103.17237.37608.946437.376035.5936()()6 70.0741420.445HHXSTn XSXF0、假设检验问题:,经计算可得:构造检验统计量:由题目已知10 010.01(3,3)29.53 5(3,3)147.530.012TFH2.0,由是所以在显著性水平下,拒绝原设即认为农村和城市的周岁男婴上述三个指标的均值有显著性差异1112122112123321()()exp()()exp(424)()39124211(),()411624283(1|2),()exp(2)5(2|1)35TBayesf xW xxxxfxq Cde W xdeqCX 3、由判别知其中,2G12134112311401 3,1111101111112222111222xxxxZXXX 1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分411121 395%40.95 4 10.9333X234(2)第一个主成分的贡献率为得1122112211122111222211122120.1010,0100.10.10001000.950.1000010.95000.01000100.9025000.902500.90250.9025,TTTTTT 5、由题得求的特征值,得211112111111112221112111100.95000.9025,00.90250.100001111000.9501100.100100.95,0.54,0.95TTTeeeVX WYV W 的单位正交化特征向量为第一典型相关变量,且()为一对典型相关系数。1()()()()()()()()V XE XEXXEXE XXEXEXE XXE XX、证明:=故2()()()()()()(,)rYE YE AXbAE XbAbV YV AXbAV X AA AYNAb A A、证明:由题可知服从正态分布,故。一、填空题:1 1、多元统计分析是运用、多元统计分析是运用 数理统计数理统计 方法来研究解决方法来研究解决 多指标多指标 问题的理论问题的理论和方法和方法.2 2、回归参数显著性检验是检验回归参数显著性检验是检验 解释变量解释变量 对对 被解释变量被解释变量 的影响是否著的影响是否著.3 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为析分为 Q Q型型 聚类和聚类和 R R型型 聚类。聚类。4 4、相应分析的主要目的是寻求列联表、相应分析的主要目的是寻求列联表 行因素行因素A A 和和 列因素列因素B B 的基本分析特的基本分析特征和它们的最优联立表示。征和它们的最优联立表示。5 5、因子分析把每个原始变量分解为两部分因素:一部分为、因子分析把每个原始变量分解为两部分因素:一部分为 公共因子公共因子 ,另一,另一部分为部分为 特殊因子特殊因子 。6 6、若、若=1,2,3.n=1,2,3.n且相互独立,则样本均值向量且相互独立,则样本均值向量服从的分布服从的分布()(,),PxN:x为为_ _N(N(,/n)_/n)_。x二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。2、简述相应分析的基本思想。相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素 A A 和和 B B,其中因素其中因素 A A 包含包含 r r 个水平,因素个水平,因素 B B 包含包含 c c 个水平。对这两组因素作随机抽样调个水平。对这两组因素作随机抽样调查,得到一个查,得到一个 rcrc 的二维列联表,记为的二维列联表,记为 。要寻求列联表列因素。要寻求列联表列因素 A A 和行因素和行因素 B B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A A 和因素和因素 B B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素从而得到因素 A A、B B 的联系。的联系。3、简述费希尔判别法的基本思想。从从 k k 个总体中抽取具有个总体中抽取具有 p p 个指标的样品观测数据,借助方差分析的思想构造一个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数个线性判别函数系数:系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的品的 p p 个指标值代入线性判别函数式中求出个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。可以判别新的样品属于哪个总体。5、简述多元统计分析中协差阵检验的步骤第一,提出待检验的假设第一,提出待检验的假设 和和 H1H1;第二,给出检验的统计量及其服从的分布;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)假设做出决策(拒绝或接受)。协差阵的检验检验检验0 0pHI:/2/21exp2npnetrnSS 00pHI:/2/2*1exp2npnetrnSS检验检验 12k012kH:统计量统计量/2/2/2/211iikknnpnnpkiiiinnSS6 6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。设设 d dijij表示样品表示样品Xi与与Xj之间距离,用之间距离,用 D Dijij表示类表示类Gi与Gj之间的距离。之间的距离。(1 1).最短距离法最短距离法,minikjrkrijXGXGDdmin,kpkqDD(2 2)最长距离法)最长距离法,maxipjqpqijXGXGDd,maxikjrkrijXGXGDdmax,kpkqDD(3 3)中间距离法)中间距离法ijGXGXijdDjjii,min 22222121pqkqkpkrDDDD 其中其中(4 4)重心法)重心法 2()()pqpqpqDXXXX)(1qqpprrXnXnnX22222pqpqkrkpkqpqrrrnnn nDDDDnnn(5 5)类平均法)类平均法 221ipjjpqijXGXGpqDdn n 221ikjrkrijXGXGkrDdn n 22pqkpkqrrnnDDnn(6 6)可变类平均法)可变类平均法 其中其中 是可变的且是可变的且 11(7 7)可变法)可变法 其中其中 是可变的且是可变的且 1122221()2krkpkqpqDDDD(8 8)离差平方和法)离差平方和法 1()()tntittitttSXXXX 2222kpkqkkrkpkqpqrkrkrknnnnnDDDDnnnnnn7 7、比较主成分分析与因子分析的异同点。相同点、比较主成分分析与因子分析的异同点。相同点:两种分析方法都是一种降维、简化数据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。主要区别主要区别是是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。9 9、进行相应分析时在对因素、进行相应分析时在对因素A A和因素和因素B B进行相应分析之前没有必要进行独立性检验?为什么?进行相应分析之前没有必要进行独立性检验?为什么?有必要,如果因素A和因素B独立,则没有必要进行相应分析;如果因素A和因素B不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。2222(1)()pqkrkpkqpqrrnnDDDDnn
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服