资源描述
学 生 实 验 报 告
学 院: 统计学院
课程名称: 多元统计分析
专业班级: 统计123班
姓 名: 叶常青
学 号: 0124253
学生实验报告
学生姓名
叶常青
学号
0124253
同组人
实验项目
对应分析的上机操作
□必修 □选修
□演示性实验 □验证性实验 □操作性实验 □综合性实验
实验地点
实验仪器台号
指导教师
李燕辉
实验日期及节次
一、实验目的及要求:
目的 熟悉和掌握对应分析的原理和上机操作方法
内容及要求 本次操作就父母与孩子的受教育程度的关系进行对应分析,分别对父亲与孩子和母亲与孩子的受教育程度做对应分析,最后再对输出结果进行详细的分析。
二、仪器用具:
仪器名称
规格/型号
数量
备注
计算机
1
有网络环境
SPSS软件
1
三、实验方法与步骤:
打开GSS93 subset .sav数据,对变量Degree与变量padeg和madeg进行对应分析,依次选择 分析→降维 …进入 对应分析 对话框,进行进行如下设置, 便可输出想要的数据的:
四、实验结果与数据处理:
按照上述方法和步骤得出以下输出结果.
对父亲受教育程度与孩子受教育程度的关系进行分析如下:
表1
对应表
Father's Highest Degree
R's Highest Degree
Less than HS
High school
Junior college
Bachelor
Graduate
有效边际
LT High School
156
308
29
45
25
563
High School
27
248
34
79
37
425
Junior College
1
11
2
8
3
25
Bachelor
6
43
7
47
18
121
Graduate
3
22
3
27
16
71
有效边际
193
632
75
206
99
1205
表2
摘要
维数
奇异值
惯量
卡方
Sig.
惯量比例
置信奇异值
解释
累积
标准差
相关
2
1
.400
.160
.846
.846
.025
.256
2
.164
.027
.142
.988
.026
3
.047
.002
.012
1.000
4
.006
.000
.000
1.000
总计
.189
228.193
.000a
1.000
1.000
a. 16 自由度
,
表3
摘要
维数
奇异值
惯量
卡方
Sig.
惯量比例
置信奇异值
解释
累积
标准差
相关
2
1
.400
.160
.846
.846
.025
.256
2
.164
.027
.142
.988
.026
3
.047
.002
.012
1.000
4
.006
.000
.000
1.000
总计
.189
228.193
.000a
1.000
1.000
a. 16 自由度
第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。总惯量为0.189,卡方值为228.193 ,有关系式228.193=0.189*1205,由此可以清楚的看到总惯量和卡方的关系。Sig.是假设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。
表4
行简要表
Father's Highest Degree
R's Highest Degree
Less than HS
High school
Junior college
Bachelor
Graduate
有效边际
LT High School
.277
.547
.052
.080
.044
1.000
High School
.064
.584
.080
.186
.087
1.000
Junior College
.040
.440
.080
.320
.120
1.000
Bachelor
.050
.355
.058
.388
.149
1.000
Graduate
.042
.310
.042
.380
.225
1.000
质量
.160
.524
.062
.171
.082
表5
列简要表
Father's Highest Degree
R's Highest Degree
Less than HS
High school
Junior college
Bachelor
Graduate
质量
LT High School
.808
.487
.387
.218
.253
.467
High School
.140
.392
.453
.383
.374
.353
Junior College
.005
.017
.027
.039
.030
.021
Bachelor
.031
.068
.093
.228
.182
.100
Graduate
.016
.035
.040
.131
.162
.059
有效边际
1.000
1.000
1.000
1.000
1.000
第三部分的结果是在对应分析中点击Statistics按钮,进入Statistics对话框,选中Row profiles和Column profiles 交友程序运行所得到的。
表6
概述行点a
Father's Highest Degree
质量
维中的得分
惯量
贡献
1
2
点对维惯量
维对点惯量
1
2
1
2
总计
LT High School
.467
-.608
.188
.072
.432
.100
.963
.037
1.000
High School
.353
.269
-.509
.025
.064
.559
.406
.593
.999
Junior College
.021
.786
.007
.005
.032
.000
.965
.000
.965
Bachelor
.100
1.019
.476
.046
.261
.139
.901
.080
.981
Graduate
.059
1.199
.749
.040
.211
.202
.838
.134
.971
有效总计
1.000
.189
1.000
1.000
a. 对称标准化
表7
概述列点a
R's Highest Degree
质量
维中的得分
惯量
贡献
1
2
点对维惯量
维对点惯量
1
2
1
2
总计
Less than HS
.160
-.998
.652
.075
.399
.416
.851
.149
1.000
High school
.524
-.165
-.305
.014
.036
.298
.417
.582
.998
Junior college
.062
.127
-.512
.003
.003
.100
.127
.845
.972
Bachelor
.171
.976
.321
.069
.406
.108
.948
.042
.990
Graduate
.082
.874
.395
.029
.157
.078
.875
.073
.949
有效总计
1.000
.189
1.000
1.000
a. 对称标准化
第四部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括. 其中质量是行与列的边缘概率,也就是PI与PJ。惯量是每一行(列)与其重心的加权距离平方,可以看到II=IJ=0.189。由概述行点表可知变量degree的状态Less than HS和Bachelor在第一维度中贡献较大分别为0.399和0.406。状态Less than HS对第二维度贡献最大为0.416。概述列表可知变量padeg的状态LT High School在第一维度贡献最大为0.432。状态High School对第二维度贡献最大为0.559。
第五部分是degree各状态和paged各状态同时在一张二维表上的投影. 由图可以看到父亲初中的教育程度、高中的教育程度与孩子的教育程度有较强的关联性。
表1
对应表
Mother's Highest Degree
R's Highest Degree
Less than HS
High school
Junior college
Bachelor
Graduate
有效边际
LT High School
169
286
25
37
23
540
High School
40
374
41
133
56
644
Junior College
2
13
6
15
5
41
Bachelor
3
33
11
34
15
96
Graduate
2
8
1
10
8
29
有效边际
216
714
84
229
107
1350
第一部分是对应表,对应表是由原始数据按degree与padeg分类的列连表,可以看到总有效观测值为1350,而不是原始数据1500。说明有效的观测数据有1350个,这是因为原始数据中有150个数据缺失。
表2
摘要
维数
奇异值
惯量
卡方
Sig.
惯量比例
置信奇异值
解释
累积
标准差
相关
2
1
.400
.160
.846
.846
.025
.256
2
.164
.027
.142
.988
.026
3
.047
.002
.012
1.000
4
.006
.000
.000
1.000
总计
.189
228.193
.000a
1.000
1.000
a. 16 自由度
第二部分是摘要表。第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。总惯量为0.189,卡方值为228.193 ,有关系式228.193=0.189*1205,由此可以清楚的看到总惯量和卡方的关系。Sig.是假设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。
.
概述行点a
Mother's Highest Degree
质量
维中的得分
惯量
贡献
1
2
点对维惯量
维对点惯量
1
2
1
2
总计
LT High School
.400
-.744
.143
.091
.546
.052
.986
.014
1.000
High School
.477
.371
-.339
.035
.162
.350
.755
.243
.998
Junior College
.030
.941
.807
.016
.066
.126
.683
.194
.877
Bachelor
.071
.992
.733
.035
.173
.244
.817
.172
.989
Graduate
.021
1.004
1.285
.018
.053
.227
.479
.303
.781
有效总计
1.000
.195
1.000
1.000
a. 对称标准化
概述列点a
R's Highest Degree
质量
维中的得分
惯量
贡献
1
2
点对维惯量
维对点惯量
1
2
1
2
总计
Less than HS
.160
-1.188
.504
.098
.557
.260
.935
.065
1.000
High school
.529
-.073
-.365
.012
.007
.450
.093
.901
.994
Junior college
.062
.416
.296
.008
.027
.035
.514
.100
.614
Bachelor
.170
.858
.283
.053
.308
.087
.956
.040
.996
Graduate
.079
.721
.576
.024
.102
.168
.706
.174
.881
有效总计
1.000
.195
1.000
1.000
a. 对称标准化
第三部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括.由贡献部分可以看出 LT High School这一状态对第一维度的贡献最大.在表的最后维度部分对各状态特征值的贡献部分,看到除了Graduate外,其余各最高学历的特征值的分布大部分集中在第一维度上,说明第一维度反映了最高学历各状态大部分的差异.
把母亲受教育程度和子女受教育程度的各状态投影到同一张二维图上,如上图所示。由图可以看到母亲受高中的教育程度和子女受初中,高中的教育程度有较强的关联性。
五、讨论与结论
通过对应分析可以大致了解父母亲受教育程度与孩子受教育程度的关系,并且实现了对应分析理论知识与实际操作的结合,此次试验的难点在于对输出数据的具体分析思维。由以上所有分析我们可以大胆推断子女受教育程度与父母双方受教育程度有着密切的联系,父母受教育程度很大的限制着子女的受教育水平。
展开阅读全文