收藏 分销(赏)

秋季多元统计分析考试答案.docx

上传人:胜**** 文档编号:902556 上传时间:2024-04-03 格式:DOCX 页数:12 大小:203.60KB
下载 相关 举报
秋季多元统计分析考试答案.docx_第1页
第1页 / 共12页
秋季多元统计分析考试答案.docx_第2页
第2页 / 共12页
点击查看更多>>
资源描述
《多元统计分析》课程试卷答案 A卷 2009年秋季学期 订 线 装 开课学院:理 考试方式:√闭卷、开卷、一纸开卷、其它 考试时间:120 分钟 班级 姓名 学号 题 号 一 二 三 四 五 六 七 八 九 十 总 分 得 分 阅卷人 说明:本试卷后附有两张白纸,后一张为草稿纸,可以撕下,但不得将试卷撕散,散卷作废。 一、(15分)设,其中,, 1.求的分布; 2. 求二维向量,使与相互独立。 解:1.,则。(2分)其中:,。(4分) 所以 (1分) 2. =,则。(1分)其中: ,(1分) (2分) 要使与相互独立,必须,即。 因为时。所以使与相互独立,只要 中的满足。 (4分) 二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为,给定显著性水平, 1. 求均值向量和协方差矩阵的无偏估计 2. 试检验 () 解:1、 (3分) (3分) 2、 …(1分) 在原假设成立的条件下,检验统计量为: (3分) 由, …………………………(2分) ……………………………….(1分) 所以接受原假设。 (1分) 三、 (20分)据国家和地区的女子田径纪录数据,数据如下表: 国家和地区的女子田径纪录数据 国家和地区 100米 (秒) 200米 (秒) 400米 (秒) 800米 (分) 1500米 (分) 3000米 (分) 马拉松 (分) 阿根廷 11.61 22.94 54.50 2.15 4.43 9.79 178.52 澳大利亚 11.20 22.35 51.08 1.98 4.13 9.08 152.37 奥地利 11.43 23.09 50.62 1.99 4.22 9.34 159.37 比利时 11.41 23.04 52.00 2.00 4.14 8.88 157.85 …… …… …… …… …… …… …… …… 美国 10.79 21.83 50.62 1.96 3.95 8.50 142.72 苏联 11.06 22.19 49.19 1.89 3.87 8.45 151.22 西萨摩亚 12.74 25.85 58.73 2.33 5.81 13.04 306.00 Descriptive Statistics Mean Std. Deviation Analysis N 100米(秒) 11.6185 .45221 55 200米(秒) 23.6416 1.11106 55 400米(秒) 53.4058 2.67834 55 800米(分) 2.0764 .10822 55 1500米(分) 4.3255 .33243 55 3000米(分) 9.4476 .82434 55 马拉松(分) 173.2533 30.42954 55 表3.3 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .838 Bartlett's Test of Sphericity Approx. Chi-Square 605.335 df 21 Sig. .000 表3.4 Component Matrix Component 1 2 100米(秒) .888 .396 200米(秒) .880 .434 400米(秒) .919 .199 800米(分) .927 -.126 1500米(分) .938 -.291 3000米(分) .937 -.281 马拉松(分) .884 -.298 表3.5 Rotated Component Matrix Component 1 2 100米(秒) .400 .886 200米(秒) .370 .909 400米(秒) .555 .760 800米(分) .776 .522 1500米(分) .894 .405 3000米(分) .887 .413 马拉松(分) .859 .364 表3.6 Component Score Coefficient Matrix Component 1 2 100米(秒) -.288 .555 200米(秒) -.328 .597 400米(秒) -.084 .333 800米(分) .247 -.038 1500米(分) .417 -.226 3000米(分) .406 -.214 马拉松(分) .417 -.240 求:1. 写出正交因子模型; 2. 给出表3.3中Bartlett's Test of Sphericity的原假设和备择假设,对 此结果做出解释; 3. 根据上述运算结果,试填写下表 原始变量 旋转因子载荷 共同度 100米(秒) 200米(秒) 400米(秒) 800米(分) 1500米(分) 3000米(分) 马拉松(分) 累积贡献率 并对两个旋转因子的含义做出解释; 4. 解释共同度及累计贡献率的含义; 5. 写出两个旋转因子的因子得分表达式。 解:1. 令: —特殊因子 —因子载荷矩阵 (5分) 2.,由P值,所以拒绝原假设,即相关矩阵不是单位矩阵。(2分) 3.(7分) 原始变量 旋转因子载荷 共同度 100米(秒) .400 .886 0.94536 200米(秒) .370 .909 0.962756 400米(秒) .555 .760 0.884162 800米(分) .776 .522 0.926929 1500米(分) .894 .405 0.964525 3000米(分) .887 .413 0.95693 马拉松(分) .859 .364 0.87026 累积贡献率 0.504427 0.922777 表示长跑耐力因子,表示短跑速度因子。 4. 共同度表示提取的前k个公因子反映第i个原始变量的信息程度。累计贡献率表示提取的前k个公因子对所有原始变量的解释程度。(2分) 5. (4分) 四、(20分)文件Poverty.sav 是美国1960-1970年随机选择的30个城市的人口调查结果,其中Y表示该郡低于贫困线的家庭比例,X1表示1960-1970年间人口变化,X2表示从事农业人口数,X3表示居住与农场税率,X4表示住宅电话拥有率,X5表示农村人口比率,X6表示人口年龄中位数。利用spss进行多元线性回归分析,结果如下: 表4.4 Coefficients Model Unstandardized Coefficients Standardized Coefficients t Sig. Correlations B Std. Error Beta Zero-order Partial 1 (Constant) 58.259 6.226 9.357 .000 X4 -.471 .082 -.733 -5.710 .000 -.733 -.733 2 (Constant) 52.496 5.336 9.837 .000 X4 -.366 .073 -.569 -4.993 .000 -.733 -.693 X1 -.270 .071 -.434 -3.803 .001 -.649 -.591 求:1. 解释表4.2中“R ” ,“R Square” 及“”的含义; 2. 写出表4.3所检验的原假设和备择假设,当显著性水平时,给出检验的结论; 3. 给定检验的显著性水平,多元线性回归方程的回归系数t检验是否显著,解释原因; 4. 当X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时,写出y的预 测值; 5. 解释表4.4 中偏相关系数的含义,并对偏相关系数的结果进行解释。 解:1. R R Square称为判定系数或决定系数,它反映了回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。。 为,与R Square一起反映回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。(4分) 2.令分别表示自变量对应的的回归系数的表4.3所检验的原假设和备择假设为 。 由于检验的,因此,拒绝原假设,即认为回归方程线性显著。 (4分) 3. 对的线性影响显著,因为t检验的; 对的线性影响显著,因为t检验的。(4分) 4. 多元线性回归方程为:,X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时。 (4分) 5.偏相关系数指其它变量都在模型里时,所研究自变量对因变量的影响。 X1在模型时,X4与Y的偏相关系数是-.693,对Y的影响是负影响。X4在模型时,X1与Y的偏相关系数是-.591,对Y的影响是负影响。二者对Y的影响程度大致相当。 (4分) 五、(15分)五个样品间的距离矩阵如下 试用最短距离法对样品进行聚类。画出聚类图,并给出聚为两类时的结果。 解:解:(2)将2和3合并成,重新计算4类之间的距离 (3分) (3分) (5)画聚类图 (2分) (3分) 聚为两类时的结果, (4分) 六、(16分)对破产企业收集他们在破产前两年的年度数据,对财务良好企业也收集同一时期的数据。数据涉及四个变量,现金流量/总债务,净收入/总资产,流动资产/流动债务,流动资产/净销售额。数据列于表6.1 表6.1 企业财务数据 破产企业 非破产企业 序号 序号 1 2 21 -0.45 -0.56 -0.28 -0.41 -0.31 -0.27 1.09 1.51 1.27 0.45 0.16 0.51 1 2 25 0.51 0.08 0.58 0.10 0.02 0.04 2.49 2.01 5.06 0.54 0.53 0.13 利用SPSS软件计算结果如下: 表6.2 Group Statistics GROUP Mean Std. Deviation Valid N (listwise) Unweighted Weighted 1 X1 -6.8095E-02 .2099 21 21.000 X2 -8.1429E-02 .1449 21 21.000 X3 1.3667 .4053 21 21.000 X4 .4381 .2111 21 21.000 2 X1 .2352 .2169 25 25.000 X2 5.560E-02 4.874E-02 25 25.000 X3 2.5936 1.0231 25 25.000 X4 .4272 .1625 25 25.000 Total X1 9.674E-02 .2608 46 46.000 X2 -6.9565E-03 .1240 46 46.000 X3 2.0335 1.0065 46 46.000 X4 .4322 .1842 46 46.000 表6.3 Tests of Equality of Group Means Wilks' Lambda F df1 df2 Sig. X1 .657 22.976 1 44 .000 X2 .690 19.765 1 44 .000 X3 .623 26.610 1 44 .000 X4 .999 .039 1 44 .844 表6.4 Covariance Matrices GROUP X1 X2 X3 X4 1 X1 4.407E-02 2.846E-02 3.452E-02 4.094E-03 X2 2.846E-02 2.100E-02 2.602E-02 3.412E-03 X3 3.452E-02 2.602E-02 .164 3.281E-02 X4 4.094E-03 3.412E-03 3.281E-02 4.458E-02 2 X1 4.705E-02 8.507E-03 7.493E-02 -6.568E-03 X2 8.507E-03 2.376E-03 8.583E-03 2.080E-04 X3 7.493E-02 8.583E-03 1.047 3.334E-02 X4 -6.568E-03 2.080E-04 3.334E-02 2.640E-02 Total X1 6.801E-02 2.773E-02 .150 -2.522E-03 X2 2.773E-02 1.536E-02 5.878E-02 1.249E-03 X3 .150 5.878E-02 1.013 2.897E-02 X4 -2.522E-03 1.249E-03 2.897E-02 3.392E-02 表6.5 Pooled Within-Groups Matrices X1 X2 X3 X4 Covariance X1 4.569E-02 1.758E-02 5.656E-02 -1.722E-03 X2 1.758E-02 1.084E-02 1.651E-02 1.664E-03 X3 5.656E-02 1.651E-02 .646 3.310E-02 X4 -1.722E-03 1.664E-03 3.310E-02 3.466E-02 表6.6 Standardized Canonical 表6.7 Unstandardized Discriminant Function Coefficients Canonical Discriminant Function Coefficients Function 1 X1 .134 X2 .463 X3 .715 X4 -.223 Function 1 X1 .627 X2 4.447 X3 .890 X4 -1.198 (Constant) -1.323 表6.8 Classification Function Coefficients GROUP 1 2 X1 4.063 5.257 X2 -18.414 -9.944 X3 1.607 3.303 X4 12.192 9.910 (Constant) -5.073 -7.435 表6.9 Classification Results GROUP Predicted Group Membership Total 1 2 Original Count 1 18 3 21 2 1 24 25 % 1 85.7 14.3 100.0 2 4.0 96.0 100.0 1. 2. ,,,,那么,该企业是否面临破产?(分别用); 3. 解:1. 表6.3的作用是检验两组的均值是否相等。其结果是:变量对应的检 验的P 值都小于0.05,可以认为这三个变量在两组的均值不相等,变量对应的检验P 值为0.844>0.05,则可以认为变量在两组的均值没有显著差别。因此两组的均值有显 著性差异。 (3分) 2. 。 (2分) 3. 把某企业的财务数据代入分类函数得: 可见, ,说明该企业不面临破产。 (3分) 把某企业的财务数据代入得: 计算临界值为:。由于说明该企业不面临破产。(4分) 4. 由表6.9可知,运用此判别方法有42个观测判别正确,判别正确的百分比为 。中有18个观测判断正确,判对率为85.7%,中有24个观测判断正确,判对率为96%。由此可以认为判别效果较好。(4分)
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 考试专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服