1、社会经济统计软件应用社会经济统计软件应用SPSSSPSS应用应用第第5 5章章 方差分析方差分析 u1.1.方差分析概述及基本原理方差分析概述及基本原理u2.2.单因素方差分析(单因素方差分析(OneOneWay ANOVA)Way ANOVA)u3.3.多因素方差分析多因素方差分析u4.4.协方差分析协方差分析1.1.方差分析概述及基本原理方差分析概述及基本原理u在第在第4 4章中讨论了如何检验两总体均值是否相等章中讨论了如何检验两总体均值是否相等的问题,但是在实际工作中常常需要对多个总体的问题,但是在实际工作中常常需要对多个总体的均值进行比较,并分析它们之间的差异,于是的均值进行比较,并分
2、析它们之间的差异,于是引入了方差分析(引入了方差分析(analysis of varianceanalysis of variance,ANOVAANOVA)的方法。方差分析也是统计学的一个重)的方法。方差分析也是统计学的一个重要范畴,是对观察结果的数据做分析的一种常用要范畴,是对观察结果的数据做分析的一种常用的统计方法,目的是检验两个或多个样本均数间的统计方法,目的是检验两个或多个样本均数间差异的显著性意义。差异的显著性意义。u方差分析的概念:是分析各个自变量对因变量影方差分析的概念:是分析各个自变量对因变量影响的一种方法。响的一种方法。n这里的自变量就是定性变量的因子及可能出现的称为协变量
3、这里的自变量就是定性变量的因子及可能出现的称为协变量(covariatecovariate)的定量变量。)的定量变量。u几个重要的基本概念:几个重要的基本概念:n观测变量(因变量)与观测值:观测变量指观测对象,观测值指观测变量(因变量)与观测值:观测变量指观测对象,观测值指观测变量的取值,即样本数据。观测变量的取值,即样本数据。n因素(因子):因素是影响因变量变化的客观条件。用分类变量因素(因子):因素是影响因变量变化的客观条件。用分类变量表示,取有限的离散值。表示,取有限的离散值。n水平:因素的不同类别或不同取值称为水平。水平值取有限的离水平:因素的不同类别或不同取值称为水平。水平值取有限的
4、离散值。因素的每一个水平可以看作一个总体。散值。因素的每一个水平可以看作一个总体。u方差分析的基本原理方差分析的基本原理n方差分析是把观测值总变异的离差平方和分解为相应于方差分析是把观测值总变异的离差平方和分解为相应于不同变异来源的离差平方和,进而获得不同变异来源的不同变异来源的离差平方和,进而获得不同变异来源的总体方差估计值;由总体方差估计值构造总体方差估计值;由总体方差估计值构造F F统计量,计算统计量,计算F F值,检验各样本所属总体平均数是否相等。值,检验各样本所属总体平均数是否相等。n方差分析实质上是关于观测值变异原因的数量分析。方差分析实质上是关于观测值变异原因的数量分析。2.2.
5、单因素方差分析(单因素方差分析(OneOneWay ANOVA)Way ANOVA)u单因素方差分析即一维方差分析,用来研究一个单因素方差分析即一维方差分析,用来研究一个控制变量的不同水平是否对观测量产生了显著影控制变量的不同水平是否对观测量产生了显著影响。响。u【例例】某企业在制定某商品的广告策略时,收集某企业在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的了该商品在不同地区采用不同广告形式促销后的销售额数据,希望对广告形式是否对商品销售额销售额数据,希望对广告形式是否对商品销售额产生影响进行分析。该例数据在数据文件产生影响进行分析。该例数据在数据文件district
6、 and sale.savdistrict and sale.sav中。中。u原假设原假设H H0 0:1 12 2k ku方差分析的前提条件:方差分析的前提条件:n各个总体应服从正态分布各个总体应服从正态分布n各个总体的方差应相同各个总体的方差应相同n各个总体观测值是独立的各个总体观测值是独立的uSPSSSPSS的操作的操作n在打开数据文件后,在菜单栏中选择在打开数据文件后,在菜单栏中选择Analyze|Compare Analyze|Compare Means|OneMeans|OneWay ANOVAWay ANOVA命令命令 选入因变量,选入因变量,可有多个变量可有多个变量选入分组变选
7、入分组变量,必须满量,必须满足只取有限足只取有限个水平的条个水平的条件。件。输出描述统计量输出描述统计量用用Levene统计量进行方统计量进行方差一致性检验差一致性检验不能把握方差齐性假设时,比不能把握方差齐性假设时,比F统计量更具稳健的统计量统计量更具稳健的统计量输出输出均数分布图均数分布图在此对话框中选在此对话框中选择进行多重比较择进行多重比较的方法的方法规定多重规定多重比较时显比较时显著性水平著性水平3.3.多因素方差分析多因素方差分析u多因素方差分析用来研究两个或两个以上的控制多因素方差分析用来研究两个或两个以上的控制变量是否对观测变量产生显著性影响。多因素方变量是否对观测变量产生显著
8、性影响。多因素方差分析不仅能够分析多个因素对观测变量的影响,差分析不仅能够分析多个因素对观测变量的影响,还能够分析多个控制变量的交互作用能否对观测还能够分析多个控制变量的交互作用能否对观测变量的分布产生影响,进而能够找到有利于观测变量的分布产生影响,进而能够找到有利于观测变量的最优组合。变量的最优组合。SPSSSPSS通过通过General Liner General Liner ModelModel(一般线性模型)过程中的(一般线性模型)过程中的UnivariateUnivariate命令命令来实现多因素方差分析。来实现多因素方差分析。u【例例】某教学实验中,采用不同的教学方法和不同某教学实
9、验中,采用不同的教学方法和不同的教材进行教学实验,获得一系列数据,现在分析的教材进行教学实验,获得一系列数据,现在分析不同教学方法和不同教材对教改成绩的影响。该例不同教学方法和不同教材对教改成绩的影响。该例数据在数据文件数据在数据文件“教改成绩教改成绩.sav.sav”中。中。u两因素方差分析模型两因素方差分析模型u主效应(主效应(main effectmain effect)就是每个自变量对因变量)就是每个自变量对因变量的单独影响,而交互效应(的单独影响,而交互效应(interactioninteraction)是当两)是当两个或更多的自变量的某些水平同时出现时除了主效个或更多的自变量的某些
10、水平同时出现时除了主效应之外的附加影响。应之外的附加影响。uSPSSSPSS的操作的操作n在打开数据文件后,在菜单栏中选择在打开数据文件后,在菜单栏中选择Analyze|General Analyze|General Liner Model|UnivariateLiner Model|Univariate命令命令固定因素变量(固定因素变量(Fixed Factor)是反应处理的因素。)是反应处理的因素。随机因素是随机设置的因素,随机因素是随机设置的因素,是在确定模型时需要考虑会是在确定模型时需要考虑会对实验有影响的因素。对实验有影响的因素。4.4.协方差分析协方差分析u协方差分析是利用线性回归
11、的方法消除混杂因素协方差分析是利用线性回归的方法消除混杂因素的影响后进行的方差分析。的影响后进行的方差分析。u协方差分析仍然沿承方差分析的基本思想,并在协方差分析仍然沿承方差分析的基本思想,并在分析观测变量变差时,考虑了协变量的影响,认分析观测变量变差时,考虑了协变量的影响,认为观测变量的变动受为观测变量的变动受4 4个方面的影响,即控制变量个方面的影响,即控制变量的独立作用、控制变量的交互作用、协变量的作的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量对观测变量的影响。再分析控制变量对观测变量的影
12、响。u【例例】打开数据文件打开数据文件“饲料效果饲料效果SavSav”,为研究,为研究3 3种不同饲料对生猪体重增加种不同饲料对生猪体重增加(wyh)(wyh)的影响,将生猪的影响,将生猪随机分成随机分成3 3组各喂养不同的饲料组各喂养不同的饲料(sl)(sl),得到体重增,得到体重增加的数据。由于生猪体重的增加理论上会受到猪自加的数据。由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前的体重身身体条件的影响,于是收集生猪喂养前的体重(wyq)(wyq)的数据,作为自身身体条件的测量指标。的数据,作为自身身体条件的测量指标。uSPSSSPSS的操作的操作n在打开数据文件后,
13、在菜单栏中选择在打开数据文件后,在菜单栏中选择Analyze|General Analyze|General Liner Model|UnivariateLiner Model|Univariate命令命令uSPSSSPSS的操作的操作n在打开数据文件后,在菜单栏中选择在打开数据文件后,在菜单栏中选择Analyze|Analyze|General Liner Model|UnivariateGeneral Liner Model|Univariate命令命令固定因素变量(固定因素变量(Fixed Factor)是反应处理的)是反应处理的因素。因素。随机因素是随机设置随机因素是随机设置的因素,是在确定模的因素,是在确定模型时需要考虑会对实型时需要考虑会对实验有影响的因素。验有影响的因素。协变量:对因变协变量:对因变量有影响的连续量有影响的连续性变量性变量