1、学 生 实 验 报 告 学 院: 统计学院 课程名称: 多元统计分析 专业班级: 统计123班 姓 名: 叶常青 学 号: 0124253 学生实验报告学生姓名叶常青学号0124253同组人实验项目对应分析的上机操作必修 选修 演示性实验 验证性实验 操作性实验 综合性实验实验地点实验仪器台号指导教师李燕辉实验日期及节次一、实验目的及要求:目的 熟悉和掌握对应分析的原理和上机操作方法内容及要求 本次操作就父母与孩子的受教育程度的关系进行对应分析,分别对父亲与孩子和母亲与孩子的受教育程度做对应分析,最后再对输出结果进行详细的分析。二、仪器用具:仪器名称规格/型号数量备注计算机1有网络环境SPSS
2、软件1三、实验方法与步骤:打开GSS93 subset .sav数据,对变量Degree与变量padeg和madeg进行对应分析,依次选择 分析降维 进入 对应分析 对话框,进行进行如下设置, 便可输出想要的数据的:四、实验结果与数据处理:按照上述方法和步骤得出以下输出结果.对父亲受教育程度与孩子受教育程度的关系进行分析如下:表1对应表Fathers Highest DegreeRs Highest DegreeLess than HSHigh schoolJunior collegeBachelorGraduate有效边际LT High School156308294525563High S
3、chool27248347937425Junior College11128325Bachelor64374718121Graduate3223271671有效边际19363275206991205表2摘要维数奇异值惯量卡方Sig.惯量比例置信奇异值解释累积标准差相关21.400.160.846.846.025.2562.164.027.142.988.0263.047.002.0121.0004.006.000.0001.000总计.189228.193.000a1.0001.000a. 16 自由度,表3摘要维数奇异值惯量卡方Sig.惯量比例置信奇异值解释累积标准差相关21.400.160
4、.846.846.025.2562.164.027.142.988.0263.047.002.0121.0004.006.000.0001.000总计.189228.193.000a1.0001.000a. 16 自由度第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。总惯量为0.189,卡方值为228.193 ,有关系式228.193=0.189*1205,由此可以清楚的看到总惯量和卡方的关系。Sig.是假设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。表4行
5、简要表Fathers Highest DegreeRs Highest DegreeLess than HSHigh schoolJunior collegeBachelorGraduate有效边际LT High School.277.547.052.080.0441.000High School.064.584.080.186.0871.000Junior College.040.440.080.320.1201.000Bachelor.050.355.058.388.1491.000Graduate.042.310.042.380.2251.000质量.160.524.062.171.08
6、2表5列简要表Fathers Highest DegreeRs Highest DegreeLess than HSHigh schoolJunior collegeBachelorGraduate质量LT High School.808.487.387.218.253.467High School.140.392.453.383.374.353Junior College.005.017.027.039.030.021Bachelor.031.068.093.228.182.100Graduate.016.035.040.131.162.059有效边际1.0001.0001.0001.000
7、1.000第三部分的结果是在对应分析中点击Statistics按钮,进入Statistics对话框,选中Row profiles和Column profiles 交友程序运行所得到的。表6概述行点aFathers Highest Degree质量维中的得分惯量贡献12点对维惯量维对点惯量1212总计LT High School.467-.608.188.072.432.100.963.0371.000High School.353.269-.509.025.064.559.406.593.999Junior College.021.786.007.005.032.000.965.000.965
8、Bachelor.1001.019.476.046.261.139.901.080.981Graduate.0591.199.749.040.211.202.838.134.971有效总计1.000.1891.0001.000a. 对称标准化表7概述列点aRs Highest Degree质量维中的得分惯量贡献12点对维惯量维对点惯量1212总计Less than HS.160-.998.652.075.399.416.851.1491.000High school.524-.165-.305.014.036.298.417.582.998Junior college.062.127-.512
9、.003.003.100.127.845.972Bachelor.171.976.321.069.406.108.948.042.990Graduate.082.874.395.029.157.078.875.073.949有效总计1.000.1891.0001.000a. 对称标准化第四部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括. 其中质量是行与列的边缘概率,也就是PI与PJ。惯量是每一行(列)与其重心的加权距离平方,可以看到II=IJ=0.189。由概述行点表可知变量degree的状态Less than HS和Bachelor在第一维度中贡献较大分别为0.399和0.4
10、06。状态Less than HS对第二维度贡献最大为0.416。概述列表可知变量padeg的状态LT High School在第一维度贡献最大为0.432。状态High School对第二维度贡献最大为0.559。第五部分是degree各状态和paged各状态同时在一张二维表上的投影. 由图可以看到父亲初中的教育程度、高中的教育程度与孩子的教育程度有较强的关联性。表1对应表Mothers Highest DegreeRs Highest DegreeLess than HSHigh schoolJunior collegeBachelorGraduate有效边际LT High School1
11、69286253723540High School403744113356644Junior College213615541Bachelor33311341596Graduate28110829有效边际216714842291071350第一部分是对应表,对应表是由原始数据按degree与padeg分类的列连表,可以看到总有效观测值为1350,而不是原始数据1500。说明有效的观测数据有1350个,这是因为原始数据中有150个数据缺失。表2摘要维数奇异值惯量卡方Sig.惯量比例置信奇异值解释累积标准差相关21.400.160.846.846.025.2562.164.027.142.988.
12、0263.047.002.0121.0004.006.000.0001.000总计.189228.193.000a1.0001.000a. 16 自由度第二部分是摘要表。第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。总惯量为0.189,卡方值为228.193 ,有关系式228.193=0.189*1205,由此可以清楚的看到总惯量和卡方的关系。Sig.是假设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。.概述行点aMothers Highest Degree
13、质量维中的得分惯量贡献12点对维惯量维对点惯量1212总计LT High School.400-.744.143.091.546.052.986.0141.000High School.477.371-.339.035.162.350.755.243.998Junior College.030.941.807.016.066.126.683.194.877Bachelor.071.992.733.035.173.244.817.172.989Graduate.0211.0041.285.018.053.227.479.303.781有效总计1.000.1951.0001.000a. 对称标准化
14、概述列点aRs Highest Degree质量维中的得分惯量贡献12点对维惯量维对点惯量1212总计Less than HS.160-1.188.504.098.557.260.935.0651.000High school.529-.073-.365.012.007.450.093.901.994Junior college.062.416.296.008.027.035.514.100.614Bachelor.170.858.283.053.308.087.956.040.996Graduate.079.721.576.024.102.168.706.174.881有效总计1.000.1
15、951.0001.000a. 对称标准化第三部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括.由贡献部分可以看出 LT High School这一状态对第一维度的贡献最大.在表的最后维度部分对各状态特征值的贡献部分,看到除了Graduate外,其余各最高学历的特征值的分布大部分集中在第一维度上,说明第一维度反映了最高学历各状态大部分的差异.把母亲受教育程度和子女受教育程度的各状态投影到同一张二维图上,如上图所示。由图可以看到母亲受高中的教育程度和子女受初中,高中的教育程度有较强的关联性。 五、讨论与结论通过对应分析可以大致了解父母亲受教育程度与孩子受教育程度的关系,并且实现了对应分析理论知识与实际操作的结合,此次试验的难点在于对输出数据的具体分析思维。由以上所有分析我们可以大胆推断子女受教育程度与父母双方受教育程度有着密切的联系,父母受教育程度很大的限制着子女的受教育水平。