1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,-,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,-,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,-,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,-,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,-,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击
2、此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,6,章,SPSS,的方差分析,方差分析概述,单因素方差分析,多因素方差分析,协方差分析,1,-,第一节 方差分析概述,在科学实验中常常要探讨,不同实验条件或处理方法对实验结果的影响,。通常是比较不同实验条件下,总体均值,间的差异,举例,医学界研究几种药物对某种疾病的疗效;,农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响,不同饲料对牲畜体重增长的效果等,不同广告形式、地区规模等因素对广告效果的影响等,都可以使用方差分析方法去解决,2,-,方差分析,是检验多个总体均值是否相等的一种方法,。本质上是,研究分类型自变量对数值型因变
3、量的影响。,方差分析概念,控制因素,(,控制变量,),:在方差分析中,所要检验的对象称为因素。其常为一个或多个离散型的分类变量。,水平:,因素的不同类别或不同取值为因素的不同水平。因素的每一个水平可以看作一个整体。,观测因素(观测变量,):在进行方差分析时,每个控制因素水平下得到的样本数据。,几个基本概念,3,-,方差分析中,判断总体均值是否相等,一般是通过对数据变异来源的分析判断得到。,变异来源有两种情况:,控制因素,和,随机因素,。,控制因素:控制变量不同而造成的变异。,随机误差:在同一因素下的观察值由于抽样的随机性造成的误差(抽样误差)。,方差分析基本原理,4,-,数据变异用,离均差平方
4、和,表示。,组内误差,(,随机误差,),数据误差,随机误差,组间误差,系统误差,衡量同一水平下样本数据的误差,衡量控制变量不同造成的变差,5,-,方差分析的核心是,方差可分解,。这里的方差是指通过计算各观测值偏离均值的平方和再除以,n-1,得到。这样,在给定,n,的情况下,方差就是离差平方和,简称,SST,。,观察量的总平方和(,SST,)分解为组间离差平方和(,SSA,)和组内误差平方和(,SSE,),即:,SST=SSA+SSE,6,-,由误差来源的分析得知,判断分类型自变量对数值型因变量受否有影响,就是检验数值型变量存在差异的原因。如果这种差异主要是系统误差,则分类型变量对该数值存在显著
5、影响,否则差异不显著。,根据统计学原理,组间均方和组内均方的比值构成,F,分布。,给定显著性水平,通过和,F,分布统计量的概率,P,的比较,推出总体均值是否存在显著差异。,7,-,方差分析一般应满足,3,个基本假设,即要求,:,各个总体应服从,正态分布,各个总体的,方差相同,观测值是独立的,。,8,-,第二节 单因素方差分析,单因素方差分析的基本思想,单因素方差分析的数学模型,单因素方差分析的基本步骤,单因素方差分析的基本操作,单因素方差分析的应用举例,单因素方差分析的进一步分析及应用,9,-,单因素方差分析的基本思想,单因素方差分析研究的是,一个分类型自变量,对,一个数值型因变量,的影响。,
6、例如:学历是对工资收入的影响。,概念,10,-,明确观测变量和控制变量,eg,.,前面例子中,观测变量是收入;控制变量是学历,剖析观测变量的方差,比较观测变量总离差平方和各部分的比例,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,,否则,则不是。,基本思想,11,单因素方差分析的数学模型,在水平,A,i,下的第,j,次试验的样本值 可以定义为:,单因素方差分析的数学模型为,12,-,单因素方差分析的基本步骤,(,1,)建立原假设和备择假设,(,2,)构造统计量,其中,,n,为总体数目,13,(,3,)计算统计量的观测值和概率,P,值,(,4,)给定显著性水平,得出
7、结论。,当 时,拒绝原假设,即认为控制变量不同水平下观测变量各总体的均值存在显著差异,;,当 时,则不能拒绝原假设,即认为控制变量不同水平下观测变量各总体的均值没有显著差异,14,单因素方差分析的基本操作及应用举例,以广告城市与销售额,.sav,为例,分析,比较均值,单因素,AVOVA,广告形式对销售额的单因素方差分析,方法一,15,-,16,-,17,-,因为,F,值对应的概率,P,值小于,0.05,,所以拒绝原假设,即认为不同广告形式对销售额有显著差异。,18,-,方法二,比较均值,分析,均值,19,-,20,-,21,-,单因素方差分析一定要选上,22,-,23,-,6.2.5,单因素方
8、差进一步分析,一、方差齐性检验,对控制变量不同水平下各观测变量总体方差是否相等进行分析,(,方差分析前提条件,),二、多重比较检验,如果控制变量确实对观测变量产生了显著影响,,进一步应确定控制变量的不同水平对观测变量的影响程度如何,,其中哪个水平的作用显著区别其它水平。其构造检验统计量的方法有,LSD,方法、,bonferroni,方法、,tukey,方法、,scheffe,方法、,s-n-k,方法等。,三、其它检验,先验对比检验、趋势检验,24,-,单因素方差分析的进一步分析,进一步分析,25,-,26,-,方差相等时的一些多重比较方法,最小显著性差异法。,用,T,检验完成组间,成对,均值的
9、比较。检验的敏感度较高,即使是各个水平间的均值存在细微差别也有可能被检验出来,但此方法对第一类弃真错误不进行控制和调整。,LSD,方法,27,-,修正最小显著性差异法,。用,T,检验完成组间成对均值的比较,但通过设置每个检验的误差率来控制整个误差率。因此采用此方法看到的显著值是多重比较完成后的调整值。,用,q,检验完成各水平下,观测值个数相等,时组间成对均值的比较。一定程度可以保证犯一类错误的概率总体上不增大。,Bonferroni,方法,Tukey,方法,28,-,当各水平下观测值个数不相等,或者想进行复杂的比较时,或对所有可能的组合进行同步比较时,可选用此方法,。这种检验被用来检验组间均值
10、的所有可能的线性组合,而不只是成对组合,并控制整体显著性水平为,0.05,。这种方法相对比较保守,有时候方差分析,F,值有显著性,用该方法进行两两比较却找不出差异。,Scheffe,方法,29,-,目的是,寻找同质子集,,简单地说,各组均值首先按从小到大的顺序排列,然后根据多重比较结果将所有的组分为若干个子集,子集之间的各组间有差别(,P,值小于,0.05,),子集之内的各组间无差别。,S-N-K,方法,30,-,其他检验,31,-,趋势检验,问题:分析不同,地区,的销售额总体上是否会随着地区人口密度的减少(地区编号大人口密度低)而呈现某种变化趋势,32,-,先验对比检验,所有系数之和为,0,
11、在多重比较分析后得知宣传品广告效果最差,其余略有差异(先验的结论)。这里可以对报纸、广播和体验的整体效果进行进一步的对比分析。,33,-,单因素方差分析应用举例的进一步分析,不同广告形式下销售额,总体方差齐性检验,34,-,因为,P,值大于,0.05,,所以不能拒绝原假设,即认为方差齐性,35,-,36,-,多重比较检验,(分析哪种广告形式作用明显),37,-,38,-,广告形式多重比较检验的相似性子集,此方法在相似性子集划分中用得最多,39,-,趋势检验,(分析销售额是否会随着地区,人口密度减少而呈现出某种趋势),40,-,41,-,因为,F,值对应的概率,P,值小于,0.05,,所以拒绝原
12、假设,即认为地区和销售额之间不是零线性相关,42,-,先验对比检验,43,-,因为,T,值对应的概率,P,值大于,0.05,,所以不能拒绝原假设,即认为报纸广告的效果与广播、体验的总体效果没有显著差异,44,-,练习,对四个服务行业的服务质量进行评价,较高得分表示较高的服务质量。对航空公司、零售业、旅馆业和汽车制造业进行的评定数据见四种不同行业评价得分,.sav,。在显著性水平,=0.05,下,检验四种行业质量等级的总体均值是否差异显著?你的结论如何?,45,-,第三节 多因素方差分析,在上一节课,我们已经研究了不同,广告形式,对产品销售有显著影响,,不同地区,的产品销售额也存在显著差异,然而
13、不同广告形式和不同地区的搭配,是否会对销售额产生影响呢?而,哪种搭配方式,又可以获得,最理想的销售业绩,呢?,问题引出,46,-,本节主要内容,多因素方差分析的基本思想,多因素方差分析的数学模型,多因素方差分析的基本步骤,多因素方差分析的基本操作,多因素方差分析的应用举例,多因素方差分析的进一步分析及应用,47,-,多因素方差分析的基本思想,多因素方差分析用来研究,两个及两个以上控制变量,是否,对观测变量,产生显著影响。它不仅能分析多个因素对观测变量的,独立影响,,更能够分析多个控制因素的,交互作用,能否对观测变量的分布产生显著影响,进而找到有利于观测变量的最优组合。,概念,48,-,确定
14、观测变量和若干个控制变量,剖析观测变量的方差,比较观测变量总离差平方和和各部分所占的比例,基本思想,49,-,剖析观测变量的方差,第一,控制变量独立作用的影响,第二,控制变量交互作用的影响,第三,,随机因素的影响,50,多因素方差分析的数学模型,设控制变量,A,有,k,个水平,,B,有,r,个水平,每个交叉水平下均有,l,个样本,则在控制变量,A,的水平,A,i,和控制变量,B,的水平,B,j,下的第,k,个样本值 定义为:,多因素方差分析的饱和模型,51,多因素方差分析的基本步骤,提出零假设,选择检验统计量,固定效应模型,随机效应模型,52,计算检验统计量观测值和概率,P,值,给出显著性水平
15、 ,并作出统计决策,(,1,),若,F,A,的概率,p,,则拒绝原假设,,,即认为控制变量,A,的不同水平对观测变量产生了显著影响,。,(,2,),F,B,的概率,p,,则拒绝原假设,即认为控制变量,B,的不同水平对观测变量产生了显著影响。,(,3,),F,AB,的概率,p ,则拒绝原假设,即认为控制变量,A,、,B,的交互作用对观测变量产生了显著影响,然后再依此对,A,、,B,的效应进行检验,53,多因素方差分析的基本操作,分析,一般线性模型,单变量,54,-,55,-,56,-,因为概率,P,小于,0.05,,所以拒绝原假设,即认为线性模型对观测变量有一定的解释作用,后面的几个概率中,除了
16、交互作用中概率大于,0.05,外,其余的全小于,0.05,,说明除了交互作用差异不显著外,其它的都显著,57,-,多因素方差分析的进一步分析,两因素的非饱和模型:,SST=SSA+SSB+SSE,三因素的非饱和模型:,SST=SSA+SSB+SSC+SSABC+SSE,多因素方差分析的非饱和模型,多因素方差分析的其他功能,均值检验,模型分析,58,-,多因素方差分析的进一步分析的操作,建立,非饱和模型,59,-,60,-,均值比较的操作,61,-,62,-,63,-,64,-,65,-,66,-,67,-,练习,某教学实验中,采用不同的教学方法和不同的教材进行教学实验,获得一系列数据,现在分析
17、不同教学方法和不同教材对教改成绩的影响,数据附在文件夹教改成绩,.sav,。要求:进行均值的多重比较,方法选用,LSD,法,得出教改成绩多因素方差分析的饱和模型表和非饱和模型表,并得出教学方法和教材的交互作用图。,68,-,第四节 协方差分析,问题引出:,在分析不同的饲料对生猪增重是否产生显著差异时,如果仅仅是分析饲料的作用,即用单因素方差分析来进行,而不考虑生猪自身各自不同的身体条件(比如猪最初时的体重)时,得出的结论很可能是片面的,不准确的。这时,如何才能准确地反映不同饲料对生猪体重的影响呢?,69,-,协方差分析的基本思路,协方差分析的数学模型,协方差分析的基本操作,协方差分析的应用举例
18、本节主要内容,70,-,协方差分析的基本思路,基本概念,协方差分析是指将那些,很难人为控制的控制因素作为协变量,,,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的作用,从而更加准确地对控制变量进行评价,。,71,-,基本同方差分析的基本思想,,除此之外,考虑了,协变量,的影响,认为观察变量的变化受四个方面的影响:,即控制变量的独立作用,控制变量的交互作用,协变量的作用和随机因素的作用,,并在扣除协变量的影响后,再分析控制变量对观测变量的影响。,协方差分析的基本思想,72,-,方差分析中的零假设是:,协变量对观测变量的线性影响不显著,;在协变量影响扣除的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零,。用,F,统计量进行检验。,73,-,协方差分析的数学模型,单因素协方差分析的数学模型是:,74,协方差分析的基本操作,75,-,76,-,77,-,78,-,79,-,80,-,81,-,82,-,83,-,






