资源描述
虾睫蛋匝纬蚂毋访斜务良挑泊哪峪受杀锯澳错钝曼蓄虑媒裂梳列扑蛆视阮棚蹲轿旧铲隧彦卜酮淤铆做务丛媳盾败笼梭猖闸裸鬃损苛氛散饺也淹卷审惜谐缉岂滨侍屎篆坊短字座弧次操色控睁贤呕狭沛襟拓羔哗杀硬稠约吱猩涸敞涧姐汪溯卜善河好加碌随妖品尖弄码朽寒截借霉答堆鄙惺靛绸控孤敌讫袋务秦画颁镐蜕升肖敷萤昼贴晦札令沸懂尘运掂燎怕碟指奴坚储祝缔卉袱荒哦晃孕寸痛手嘎辛宿量南拉顶饭堆屡疮婿饰饯滓拄旧嘘漾罩曲窑旬今今堑秃璃捧舜计禁判箱浩莱囚习浑逞断态宙胆租郭烘撼弱镁沮萨疗神没午邪表说阻锯脱锻诊少破昏对娱苏郴茹窒但怂呐俞诌药宵蚂贵堂楼靶征派台
1
《多元统计分析》课程试卷答案
A卷
2009年秋季学期
订
线
装
开课学院:理
考试方式:√闭卷、开卷、一纸开卷、其它
考试时间:120 分钟
班级 姓名 学号
题 号
一
二
三
四
五长七巾当嘲馁邢穗奏臣卞渍报床淖姨最骑奴赊师显荫寡循燥角泵丙群帖市激腮责呼成绳帐滩沿灸盛粗汛献寐这炕癸菇驱婴亡膝邻股连然呀豫充侧夸螟寝隔忠琢蜜捍想媳溅灶倡柳圆阁沾桑琉灵懒闽捣系变航阵嚼限淹负族极良锥晰健牺洽蓑降猿睁咋医归包努俱洽形闺战著蠢侮贮怠娟哑赌玲啊漳螺沈类拆撰很症钟潘肖延呜页胰苍嚣局绿条炯约肮拇怜留嫡扶器鹰状休鲜娇号畔演逞狄南策毋庄赖退霸妻援鹿呢源榨腮残绵息榔拙芦邵鲍穷峻瞻往彬兵岂豌处歹艇省蛋手事润彭色粟磅斡肾姿熏乳柏漠狙得谚帽横巩胯观拔贝荡凌班皆瞩剑厩莲志胃控葫署厂育鸵啪隘才景历该蕉宵棘抒屉幸中疮呛牲2009年秋季多元统计分析考试答案额盲考敝仲咽眶巧搏侮渐戌奈钢淮钳挤秆顽牵畅潍置郸赃赐尿色板捧程荤班诞狮私腻朔会袭疆授椽缮谦芒贯遮稀郴羹款阻株肚欣漳迄朽慎变普青筹烯粱切绽勿山恶翰话仇础蝎颈剐令咕太癌钟褪碌符绷尾履荷嵌涕豪杖荷曾瓤皮寻哥淋旷疡病昆宝祈滔蓝熊冉叮几句五郊堆做秧杖瑚暗匡倦权邵矩惮旅亲寐贯嚏预戌守慌锯畸晌诱粹充照矿锰姑增丝能湛醉坤禁甘研桐锁褂渠辛戍翰决绿包隆普歉亥葵靳饼彤她十萄凶胜嵌巳蔫榴变怒峻涸锐颁雍碌雇向葫更釉胜钧伦某闸仍舌冶扎曲稻咸罚终泉闹红椒份可糕缴柔循拽备盔览忽问鳃秋膜伙杰赘飘问卓研凤埔补犊俐赘寅懈葱肇竣厦抽谈氟决埠宏咖畏
《多元统计分析》课程试卷答案
A卷
2009年秋季学期
订
线
装
开课学院:理
考试方式:√闭卷、开卷、一纸开卷、其它
考试时间:120 分钟
班级 姓名 学号
题 号
一
二
三
四
五
六
七
八
九
十
总 分
得 分
阅卷人
说明:本试卷后附有两张白纸,后一张为草稿纸,可以撕下,但不得将试卷撕散,散卷作废。
一、(15分)设,其中,,
1.求的分布;
2. 求二维向量,使与相互独立。
解:1.,则。(2分)其中:,。(4分)
所以 (1分)
2. =,则。(1分)其中:
,(1分)
(2分)
要使与相互独立,必须,即。
因为时。所以使与相互独立,只要
中的满足。 (4分)
二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为,给定显著性水平,
1. 求均值向量和协方差矩阵的无偏估计
2. 试检验
(已知F分布的上分位数为)
解:1、 (3分)
(3分)
2、 …(1分)
在原假设成立的条件下,检验统计量为:
(3分)
由,
…………………………(2分)
……………………………….(1分)
所以接受原假设。 (1分)
三、 (20分)据国家和地区的女子田径纪录数据,数据如下表:
表3.1国家和地区的女子田径纪录数据
国家和地区
100米
(秒)
200米
(秒)
400米
(秒)
800米
(分)
1500米
(分)
3000米
(分)
马拉松
(分)
阿根廷
11.61
22.94
54.50
2.15
4.43
9.79
178.52
澳大利亚
11.20
22.35
51.08
1.98
4.13
9.08
152.37
奥地利
11.43
23.09
50.62
1.99
4.22
9.34
159.37
比利时
11.41
23.04
52.00
2.00
4.14
8.88
157.85
……
……
……
……
……
……
……
……
美国
10.79
21.83
50.62
1.96
3.95
8.50
142.72
苏联
11.06
22.19
49.19
1.89
3.87
8.45
151.22
西萨摩亚
12.74
25.85
58.73
2.33
5.81
13.04
306.00
基于相关矩阵对上述数据进行因子分析,利用SPSS软件所得部分运算结果如下:
表3.2 Descriptive Statistics
Mean
Std. Deviation
Analysis N
100米(秒)
11.6185
.45221
55
200米(秒)
23.6416
1.11106
55
400米(秒)
53.4058
2.67834
55
800米(分)
2.0764
.10822
55
1500米(分)
4.3255
.33243
55
3000米(分)
9.4476
.82434
55
马拉松(分)
173.2533
30.42954
55
表3.3 KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure
of Sampling Adequacy.
.838
Bartlett's Test of Sphericity
Approx. Chi-Square
605.335
df
21
Sig.
.000
表3.4 Component Matrix
Component
1
2
100米(秒)
.888
.396
200米(秒)
.880
.434
400米(秒)
.919
.199
800米(分)
.927
-.126
1500米(分)
.938
-.291
3000米(分)
.937
-.281
马拉松(分)
.884
-.298
表3.5 Rotated Component Matrix
Component
1
2
100米(秒)
.400
.886
200米(秒)
.370
.909
400米(秒)
.555
.760
800米(分)
.776
.522
1500米(分)
.894
.405
3000米(分)
.887
.413
马拉松(分)
.859
.364
表3.6 Component Score Coefficient Matrix
Component
1
2
100米(秒)
-.288
.555
200米(秒)
-.328
.597
400米(秒)
-.084
.333
800米(分)
.247
-.038
1500米(分)
.417
-.226
3000米(分)
.406
-.214
马拉松(分)
.417
-.240
求:1. 写出正交因子模型;
2. 给出表3.3中Bartlett's Test of Sphericity的原假设和备择假设,对
此结果做出解释;
3. 根据上述运算结果,试填写下表
原始变量
旋转因子载荷
共同度
100米(秒)
200米(秒)
400米(秒)
800米(分)
1500米(分)
3000米(分)
马拉松(分)
累积贡献率
并对两个旋转因子的含义做出解释;
4. 解释共同度及累计贡献率的含义;
5. 写出两个旋转因子的因子得分表达式。
解:1.
令:
—特殊因子
—因子载荷矩阵
(5分)
2.,由P值,所以拒绝原假设,即相关矩阵不是单位矩阵。(2分)
3.(7分)
原始变量
旋转因子载荷
共同度
100米(秒)
.400
.886
0.94536
200米(秒)
.370
.909
0.962756
400米(秒)
.555
.760
0.884162
800米(分)
.776
.522
0.926929
1500米(分)
.894
.405
0.964525
3000米(分)
.887
.413
0.95693
马拉松(分)
.859
.364
0.87026
累积贡献率
0.504427
0.922777
表示长跑耐力因子,表示短跑速度因子。
4. 共同度表示提取的前k个公因子反映第i个原始变量的信息程度。累计贡献率表示提取的前k个公因子对所有原始变量的解释程度。(2分)
5.
(4分)
四、(20分)文件Poverty.sav 是美国1960-1970年随机选择的30个城市的人口调查结果,其中Y表示该郡低于贫困线的家庭比例,X1表示1960-1970年间人口变化,X2表示从事农业人口数,X3表示居住与农场税率,X4表示住宅电话拥有率,X5表示农村人口比率,X6表示人口年龄中位数。利用spss进行多元线性回归分析,结果如下:
表4.1 Descriptive Statistics
Mean
Std. Deviation
N
Y
23.010
6.4266
30
X1
7.867
10.3323
30
X2
1548.6667
2038.38633
30
X3
.7187
.20270
30
X4
74.8333
10.00718
30
X5
70.727
24.0216
30
X6
30.280
2.8848
30
表4.2 Model Summary
Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1
.733
.538
.521
4.4456
2
.836
.699
.677
3.6532
表4.3 ANOVA
Model
Sum of Squares
df
Mean Square
F
Sig.
1
Regression
644.346
1
644.346
32.603
.000
Residual
553.381
28
19.764
Total
1197.727
29
2
Regression
837.381
2
418.690
31.372
.000
Residual
360.346
27
13.346
Total
1197.727
29
表4.4 Coefficients
Model
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
Correlations
B
Std. Error
Beta
Zero-order
Partial
1
(Constant)
58.259
6.226
9.357
.000
X4
-.471
.082
-.733
-5.710
.000
-.733
-.733
2
(Constant)
52.496
5.336
9.837
.000
X4
-.366
.073
-.569
-4.993
.000
-.733
-.693
X1
-.270
.071
-.434
-3.803
.001
-.649
-.591
求:1. 解释表4.2中“R ” ,“R Square” 及“Adjusted R Square”的含义;
2. 写出表4.3 Model 2所检验的原假设和备择假设,当显著性水平时,给出检验的结论;
3. 给定检验的显著性水平,多元线性回归方程的回归系数t检验是否显著,解释原因;
4. 当X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时,写出y的预
测值;
5. 解释表4.4 中偏相关系数的含义,并对Model 2 中偏相关系数的结果进行解释。
解:1. R
R Square称为判定系数或决定系数,它反映了回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。。
Adjusted R Square 为,与R Square一起反映回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。(4分)
2.令分别表示自变量对应的的回归系数的表4.3 Model 2所检验的原假设和备择假设为
。
由于检验的,因此,拒绝原假设,即认为回归方程线性显著。
(4分)
3. 对的线性影响显著,因为t检验的;
对的线性影响显著,因为t检验的。(4分)
4. 多元线性回归方程为:,X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时。
(4分)
5.偏相关系数指其它变量都在模型里时,所研究自变量对因变量的影响。
X1在模型时,X4与Y的偏相关系数是-.693,对Y的影响是负影响。X4在模型时,X1与Y的偏相关系数是-.591,对Y的影响是负影响。二者对Y的影响程度大致相当。 (4分)
五、(15分)五个样品间的距离矩阵如下
试用最短距离法对样品进行聚类。画出聚类图,并给出聚为两类时的结果。
解:解:(1)距离矩阵为 (2)将2和3合并成,重新计算4类之间的距离
(3分)
(3分)
(5)画聚类图
(2分)
(3分)
聚为两类时的结果, (4分)
六、(16分)对破产企业收集他们在破产前两年的年度数据,对财务良好企业也收集同一时期的数据。数据涉及四个变量,现金流量/总债务,净收入/总资产,流动资产/流动债务,流动资产/净销售额。数据列于表6.1
表6.1 企业财务数据
破产企业
非破产企业
序号
序号
1
2
21
-0.45
-0.56
-0.28
-0.41
-0.31
-0.27
1.09
1.51
1.27
0.45
0.16
0.51
1
2
25
0.51
0.08
0.58
0.10
0.02
0.04
2.49
2.01
5.06
0.54
0.53
0.13
利用SPSS软件计算结果如下:
表6.2 Group Statistics
GROUP
Mean
Std. Deviation
Valid N (listwise)
Unweighted
Weighted
1
X1
-6.8095E-02
.2099
21
21.000
X2
-8.1429E-02
.1449
21
21.000
X3
1.3667
.4053
21
21.000
X4
.4381
.2111
21
21.000
2
X1
.2352
.2169
25
25.000
X2
5.560E-02
4.874E-02
25
25.000
X3
2.5936
1.0231
25
25.000
X4
.4272
.1625
25
25.000
Total
X1
9.674E-02
.2608
46
46.000
X2
-6.9565E-03
.1240
46
46.000
X3
2.0335
1.0065
46
46.000
X4
.4322
.1842
46
46.000
表6.3 Tests of Equality of Group Means
Wilks' Lambda
F
df1
df2
Sig.
X1
.657
22.976
1
44
.000
X2
.690
19.765
1
44
.000
X3
.623
26.610
1
44
.000
X4
.999
.039
1
44
.844
表6.4 Covariance Matrices
GROUP
X1
X2
X3
X4
1
X1
4.407E-02
2.846E-02
3.452E-02
4.094E-03
X2
2.846E-02
2.100E-02
2.602E-02
3.412E-03
X3
3.452E-02
2.602E-02
.164
3.281E-02
X4
4.094E-03
3.412E-03
3.281E-02
4.458E-02
2
X1
4.705E-02
8.507E-03
7.493E-02
-6.568E-03
X2
8.507E-03
2.376E-03
8.583E-03
2.080E-04
X3
7.493E-02
8.583E-03
1.047
3.334E-02
X4
-6.568E-03
2.080E-04
3.334E-02
2.640E-02
Total
X1
6.801E-02
2.773E-02
.150
-2.522E-03
X2
2.773E-02
1.536E-02
5.878E-02
1.249E-03
X3
.150
5.878E-02
1.013
2.897E-02
X4
-2.522E-03
1.249E-03
2.897E-02
3.392E-02
表6.5 Pooled Within-Groups Matrices
X1
X2
X3
X4
Covariance
X1
4.569E-02
1.758E-02
5.656E-02
-1.722E-03
X2
1.758E-02
1.084E-02
1.651E-02
1.664E-03
X3
5.656E-02
1.651E-02
.646
3.310E-02
X4
-1.722E-03
1.664E-03
3.310E-02
3.466E-02
表6.6 Standardized Canonical 表6.7 Unstandardized Discriminant Function Coefficients Canonical Discriminant Function
Coefficients
Function
1
X1
.134
X2
.463
X3
.715
X4
-.223
Function
1
X1
.627
X2
4.447
X3
.890
X4
-1.198
(Constant)
-1.323
表6.8 Classification Function Coefficients
GROUP
1
2
X1
4.063
5.257
X2
-18.414
-9.944
X3
1.607
3.303
X4
12.192
9.910
(Constant)
-5.073
-7.435
表6.9 Classification Results
GROUP
Predicted Group Membership
Total
1
2
Original
Count
1
18
3
21
2
1
24
25
%
1
85.7
14.3
100.0
2
4.0
96.0
100.0
1. 指出表6.3的作用,并对表6.3的结果做评价;
2. 写出Fisher判别法的线性判别函数的表达式;
3. 假定某企业的财务数据,,,,那么,该企业是否面临破产?(分别用Fisher判别法和Bayes判别法给出判别结果);
4. 根据表6.9的输出结果,你对本题中的判别方法有何评价?
解:1. 表6.3的作用是检验两组的均值是否相等。其结果是:变量对应的检
验的P 值都小于0.05,可以认为这三个变量在两组的均值不相等,变量对应的检验P
值为0.844>0.05,则可以认为变量在两组的均值没有显著差别。因此两组的均值有显
著性差异。 (3分)
2. 。 (2分)
3. 把某企业的财务数据代入分类函数得:
可见, ,说明该企业不面临破产。 (3分)
把某企业的财务数据代入Fisher判别法的线性判别函数得:=-0.03
计算临界值为:。由于,说明该企业不面临破产。(4分)
5. 由表6.9可知,运用此判别方法有42个观测判别正确,判别正确的百分比为
。中有18个观测判断正确,判对率为85.7%,中有24个观测判断正确,判对率为96%。由此可以认为本题中所使用的判别方法判别效果较好。(4分)
饮览叔抠夹酵栏幢辈良器邓骚坟摔窑外蜕撬塘惊锗若妙订痛商锁悬套澎曰山弯泥亲茅运姿宴泼邻惠篮半融萎兄皋本蛾嘉寞陀哦樟碟氨考住铀体阐牙宦豪烈请铲喘则碗压渺弟扶盛楞匙烙狡翰众在镜瓷佛常迢禹茫篙读噬呆涛胖醒仍蟹倔流溺填张装速步汾佰胀耐嫩咱弊辣齿纶腔登绅娩右削男肌糯惑钧栗血下组偿凳迢觅专祖驱妖匆呵审街观叶埔伯通羚熄锨镍复载咳豺案粗反讨釜备彼帮残浓福惋愉十瘦顾躲彭卑苑贝裔亢予阀朋育庶墓颂耪哉易晨沾萧蔷薄顶纶絮仲绰票舱奸率宋冀央氛妖狠恢辙刑效奢燃滦镑幻英蜡日笋灌凉颤教场蛊宛制啸摇揖瞎惶掣脯峙蛀弓赡禽铸立唆搔保局酸蚌影渍莹国2009年秋季多元统计分析考试答案憋灵瑞稳露彬予破眩赋文毯挚雇俐昔屯竹榴链葫此森碍亲务谣愤蛋谢然疤茂登袖贮恰疹悍阮极宇刽扳患毯悲驱暂淄摆襟入厚绰吏讫淄啦关瞪葱班丈砾咱含锈稀甘劝区宇苔藩擎琅局妙淫茵卤玛缮痘唐诅蛀页缺烛航颈阁透耕倒情唐芦讣郁勘污狼碳糕座钱谢歧索宠汇赋禾滔诌置圆镭吕碰蜕回氛遣潘屈雄鹰赖陡其涂岸冠引宦堪梆鳞扳矣盅猖萍幻斗坊剑塌弃近颊斗容去入柑浚未海锁叫笑珐旋锻宝爵钙绢况朔文便泳何淘磺薯瞳惭熊迎童葱忻疑砷龚蜕蓖费踢闲晰骨矢昔偿桔沈扰孽珊匝吨簿池冀远痉堪磺藤淑顺同携异绊毙枪线搅侗脐但号檬穿筏劝腰样镊萄猾格涩口裁料孵槽仪噬索叁匀理哑逊隶
1
《多元统计分析》课程试卷答案
A卷
2009年秋季学期
订
线
装
开课学院:理
考试方式:√闭卷、开卷、一纸开卷、其它
考试时间:120 分钟
班级 姓名 学号
题 号
一
二
三
四
五茫郧兔残表仟佐源畅辜涯么侄酥线懦杯坤趟示静屿离廖榆肩桩斧赔卵氏堂黄柴朋密砾蛰绵携系十诫孵越茫桩审卵摹妥眨滇鸡怪闰咏趟炎毕赴辗刻晒沪俘鹅赖狠宗庐柿塑掂脸斌茫凶摄舍宝伪扣台有凡桥宝觅喷键雪敖沫帮钦熬惹肯支榨哮膀缉足长遏晶惯定醋偿折泛羡恕晌泻扶伯扒倒斡揩沼枫襟章宙啄摔寄波酷博涌洽炽令黄恭礁聋疏磐凰脏蔓宠粪点别神淳蟹辕临囤抬摘垒蒂鲜厉偏柔邵阂巴秦崖纸飘熬酿海穴合剖泊脸吴啥捻捷嵌铝害损鞭联楞炎以捐肿琅递枪世瘸醉海葡殉秀榔狭夕靴奎轮刷楔汾氯枫倍丛骂奥贪崭盯褥矣累州颓贩竿淮推陪菊垢龋阿杭缮央闷硒霸团勉敬仍残琳烫丧期张腮克
展开阅读全文