资源描述
《多元统计分析》课程试卷答案
A卷
2009年秋季学期
订
线
装
开课学院:理
考试方式:√闭卷、开卷、一纸开卷、其它
考试时间:120 分钟
班级 姓名 学号
题 号
一
二
三
四
五
六
七
八
九
十
总 分
得 分
阅卷人
说明:本试卷后附有两张白纸,后一张为草稿纸,可以撕下,但不得将试卷撕散,散卷作废。
一、(15分)设,其中,,
1.求的分布;
2. 求二维向量,使与相互独立。
解:1.,则。(2分)其中:,。(4分)
所以 (1分)
2. =,则。(1分)其中:
,(1分)
(2分)
要使与相互独立,必须,即。
因为时。所以使与相互独立,只要
中的满足。 (4分)
二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为,给定显著性水平,
1. 求均值向量和协方差矩阵的无偏估计
2. 试检验
()
解:1、 (3分)
(3分)
2、 …(1分)
在原假设成立的条件下,检验统计量为:
(3分)
由,
…………………………(2分)
……………………………….(1分)
所以接受原假设。 (1分)
三、 (20分)据国家和地区的女子田径纪录数据,数据如下表:
国家和地区的女子田径纪录数据
国家和地区
100米
(秒)
200米
(秒)
400米
(秒)
800米
(分)
1500米
(分)
3000米
(分)
马拉松
(分)
阿根廷
11.61
22.94
54.50
2.15
4.43
9.79
178.52
澳大利亚
11.20
22.35
51.08
1.98
4.13
9.08
152.37
奥地利
11.43
23.09
50.62
1.99
4.22
9.34
159.37
比利时
11.41
23.04
52.00
2.00
4.14
8.88
157.85
……
……
……
……
……
……
……
……
美国
10.79
21.83
50.62
1.96
3.95
8.50
142.72
苏联
11.06
22.19
49.19
1.89
3.87
8.45
151.22
西萨摩亚
12.74
25.85
58.73
2.33
5.81
13.04
306.00
Descriptive Statistics
Mean
Std. Deviation
Analysis N
100米(秒)
11.6185
.45221
55
200米(秒)
23.6416
1.11106
55
400米(秒)
53.4058
2.67834
55
800米(分)
2.0764
.10822
55
1500米(分)
4.3255
.33243
55
3000米(分)
9.4476
.82434
55
马拉松(分)
173.2533
30.42954
55
表3.3 KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure
of Sampling Adequacy.
.838
Bartlett's Test of Sphericity
Approx. Chi-Square
605.335
df
21
Sig.
.000
表3.4 Component Matrix
Component
1
2
100米(秒)
.888
.396
200米(秒)
.880
.434
400米(秒)
.919
.199
800米(分)
.927
-.126
1500米(分)
.938
-.291
3000米(分)
.937
-.281
马拉松(分)
.884
-.298
表3.5 Rotated Component Matrix
Component
1
2
100米(秒)
.400
.886
200米(秒)
.370
.909
400米(秒)
.555
.760
800米(分)
.776
.522
1500米(分)
.894
.405
3000米(分)
.887
.413
马拉松(分)
.859
.364
表3.6 Component Score Coefficient Matrix
Component
1
2
100米(秒)
-.288
.555
200米(秒)
-.328
.597
400米(秒)
-.084
.333
800米(分)
.247
-.038
1500米(分)
.417
-.226
3000米(分)
.406
-.214
马拉松(分)
.417
-.240
求:1. 写出正交因子模型;
2. 给出表3.3中Bartlett's Test of Sphericity的原假设和备择假设,对
此结果做出解释;
3. 根据上述运算结果,试填写下表
原始变量
旋转因子载荷
共同度
100米(秒)
200米(秒)
400米(秒)
800米(分)
1500米(分)
3000米(分)
马拉松(分)
累积贡献率
并对两个旋转因子的含义做出解释;
4. 解释共同度及累计贡献率的含义;
5. 写出两个旋转因子的因子得分表达式。
解:1.
令:
—特殊因子
—因子载荷矩阵
(5分)
2.,由P值,所以拒绝原假设,即相关矩阵不是单位矩阵。(2分)
3.(7分)
原始变量
旋转因子载荷
共同度
100米(秒)
.400
.886
0.94536
200米(秒)
.370
.909
0.962756
400米(秒)
.555
.760
0.884162
800米(分)
.776
.522
0.926929
1500米(分)
.894
.405
0.964525
3000米(分)
.887
.413
0.95693
马拉松(分)
.859
.364
0.87026
累积贡献率
0.504427
0.922777
表示长跑耐力因子,表示短跑速度因子。
4. 共同度表示提取的前k个公因子反映第i个原始变量的信息程度。累计贡献率表示提取的前k个公因子对所有原始变量的解释程度。(2分)
5.
(4分)
四、(20分)文件Poverty.sav 是美国1960-1970年随机选择的30个城市的人口调查结果,其中Y表示该郡低于贫困线的家庭比例,X1表示1960-1970年间人口变化,X2表示从事农业人口数,X3表示居住与农场税率,X4表示住宅电话拥有率,X5表示农村人口比率,X6表示人口年龄中位数。利用spss进行多元线性回归分析,结果如下:
表4.4 Coefficients
Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
Correlations
B
Std. Error
Beta
Zero-order
Partial
1
(Constant)
58.259
6.226
9.357
.000
X4
-.471
.082
-.733
-5.710
.000
-.733
-.733
2
(Constant)
52.496
5.336
9.837
.000
X4
-.366
.073
-.569
-4.993
.000
-.733
-.693
X1
-.270
.071
-.434
-3.803
.001
-.649
-.591
求:1. 解释表4.2中“R ” ,“R Square” 及“”的含义;
2. 写出表4.3所检验的原假设和备择假设,当显著性水平时,给出检验的结论;
3. 给定检验的显著性水平,多元线性回归方程的回归系数t检验是否显著,解释原因;
4. 当X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时,写出y的预
测值;
5. 解释表4.4 中偏相关系数的含义,并对偏相关系数的结果进行解释。
解:1. R
R Square称为判定系数或决定系数,它反映了回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。。
为,与R Square一起反映回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。(4分)
2.令分别表示自变量对应的的回归系数的表4.3所检验的原假设和备择假设为
。
由于检验的,因此,拒绝原假设,即认为回归方程线性显著。
(4分)
3. 对的线性影响显著,因为t检验的;
对的线性影响显著,因为t检验的。(4分)
4. 多元线性回归方程为:,X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时。
(4分)
5.偏相关系数指其它变量都在模型里时,所研究自变量对因变量的影响。
X1在模型时,X4与Y的偏相关系数是-.693,对Y的影响是负影响。X4在模型时,X1与Y的偏相关系数是-.591,对Y的影响是负影响。二者对Y的影响程度大致相当。 (4分)
五、(15分)五个样品间的距离矩阵如下
试用最短距离法对样品进行聚类。画出聚类图,并给出聚为两类时的结果。
解:解:(2)将2和3合并成,重新计算4类之间的距离
(3分)
(3分)
(5)画聚类图
(2分)
(3分)
聚为两类时的结果, (4分)
六、(16分)对破产企业收集他们在破产前两年的年度数据,对财务良好企业也收集同一时期的数据。数据涉及四个变量,现金流量/总债务,净收入/总资产,流动资产/流动债务,流动资产/净销售额。数据列于表6.1
表6.1 企业财务数据
破产企业
非破产企业
序号
序号
1
2
21
-0.45
-0.56
-0.28
-0.41
-0.31
-0.27
1.09
1.51
1.27
0.45
0.16
0.51
1
2
25
0.51
0.08
0.58
0.10
0.02
0.04
2.49
2.01
5.06
0.54
0.53
0.13
利用SPSS软件计算结果如下:
表6.2 Group Statistics
GROUP
Mean
Std. Deviation
Valid N (listwise)
Unweighted
Weighted
1
X1
-6.8095E-02
.2099
21
21.000
X2
-8.1429E-02
.1449
21
21.000
X3
1.3667
.4053
21
21.000
X4
.4381
.2111
21
21.000
2
X1
.2352
.2169
25
25.000
X2
5.560E-02
4.874E-02
25
25.000
X3
2.5936
1.0231
25
25.000
X4
.4272
.1625
25
25.000
Total
X1
9.674E-02
.2608
46
46.000
X2
-6.9565E-03
.1240
46
46.000
X3
2.0335
1.0065
46
46.000
X4
.4322
.1842
46
46.000
表6.3 Tests of Equality of Group Means
Wilks' Lambda
F
df1
df2
Sig.
X1
.657
22.976
1
44
.000
X2
.690
19.765
1
44
.000
X3
.623
26.610
1
44
.000
X4
.999
.039
1
44
.844
表6.4 Covariance Matrices
GROUP
X1
X2
X3
X4
1
X1
4.407E-02
2.846E-02
3.452E-02
4.094E-03
X2
2.846E-02
2.100E-02
2.602E-02
3.412E-03
X3
3.452E-02
2.602E-02
.164
3.281E-02
X4
4.094E-03
3.412E-03
3.281E-02
4.458E-02
2
X1
4.705E-02
8.507E-03
7.493E-02
-6.568E-03
X2
8.507E-03
2.376E-03
8.583E-03
2.080E-04
X3
7.493E-02
8.583E-03
1.047
3.334E-02
X4
-6.568E-03
2.080E-04
3.334E-02
2.640E-02
Total
X1
6.801E-02
2.773E-02
.150
-2.522E-03
X2
2.773E-02
1.536E-02
5.878E-02
1.249E-03
X3
.150
5.878E-02
1.013
2.897E-02
X4
-2.522E-03
1.249E-03
2.897E-02
3.392E-02
表6.5 Pooled Within-Groups Matrices
X1
X2
X3
X4
Covariance
X1
4.569E-02
1.758E-02
5.656E-02
-1.722E-03
X2
1.758E-02
1.084E-02
1.651E-02
1.664E-03
X3
5.656E-02
1.651E-02
.646
3.310E-02
X4
-1.722E-03
1.664E-03
3.310E-02
3.466E-02
表6.6 Standardized Canonical 表6.7 Unstandardized Discriminant Function Coefficients Canonical Discriminant Function
Coefficients
Function
1
X1
.134
X2
.463
X3
.715
X4
-.223
Function
1
X1
.627
X2
4.447
X3
.890
X4
-1.198
(Constant)
-1.323
表6.8 Classification Function Coefficients
GROUP
1
2
X1
4.063
5.257
X2
-18.414
-9.944
X3
1.607
3.303
X4
12.192
9.910
(Constant)
-5.073
-7.435
表6.9 Classification Results
GROUP
Predicted Group Membership
Total
1
2
Original
Count
1
18
3
21
2
1
24
25
%
1
85.7
14.3
100.0
2
4.0
96.0
100.0
1.
2. ,,,,那么,该企业是否面临破产?(分别用);
3.
解:1. 表6.3的作用是检验两组的均值是否相等。其结果是:变量对应的检
验的P 值都小于0.05,可以认为这三个变量在两组的均值不相等,变量对应的检验P
值为0.844>0.05,则可以认为变量在两组的均值没有显著差别。因此两组的均值有显
著性差异。 (3分)
2. 。 (2分)
3. 把某企业的财务数据代入分类函数得:
可见, ,说明该企业不面临破产。 (3分)
把某企业的财务数据代入得:
计算临界值为:。由于说明该企业不面临破产。(4分)
4. 由表6.9可知,运用此判别方法有42个观测判别正确,判别正确的百分比为
。中有18个观测判断正确,判对率为85.7%,中有24个观测判断正确,判对率为96%。由此可以认为判别效果较好。(4分)
展开阅读全文