1、统计学统计学课件课件作者:云南财经大学统计与数学作者:云南财经大学统计与数学作者:云南财经大学统计与数学作者:云南财经大学统计与数学学院学院学院学院 杨文雪杨文雪杨文雪杨文雪统计学统计学统计学统计学第第6 6章章 方差分析方差分析v6.1 6.1 方差分析引论方差分析引论v6.2 6.2 单因素方差分析单因素方差分析v6.3 6.3 方差分析中的多重比较方差分析中的多重比较v6.4 6.4 双因素方差分析双因素方差分析6.1 6.1 方差分析引论方差分析引论v6.1.1 6.1.1 引言引言v6.1.2 6.1.2 方差分析及其有关术语方差分析及其有关术语v6.1.3 6.1.3 方差分析的基
2、本思想和原方差分析的基本思想和原理理v6.1.4 6.1.4 方差分析中的基本假定方差分析中的基本假定v6.1.5 6.1.5 方差分析中的方差分析中的F F统计量统计量6.1.1 6.1.1 引言引言vv方差分析方差分析方差分析方差分析和第和第和第和第七七七七章将要介绍的章将要介绍的章将要介绍的章将要介绍的回归分析回归分析回归分析回归分析都是都是都是都是数理统数理统数理统数理统计计计计中中中中最古典、最常用、应用最广泛的方法最古典、最常用、应用最广泛的方法最古典、最常用、应用最广泛的方法最古典、最常用、应用最广泛的方法。vv方差分析方差分析方差分析方差分析是由是由是由是由英国统计学家费歇英国
3、统计学家费歇英国统计学家费歇英国统计学家费歇(R.FisherR.FisherR.FisherR.Fisher)在)在)在)在1918191819181918年的著作年的著作年的著作年的著作试验之设计试验之设计试验之设计试验之设计中中中中首先提出来首先提出来首先提出来首先提出来的,它的,它的,它的,它最初应用于农业方面的试验设计及试验结果的分析最初应用于农业方面的试验设计及试验结果的分析最初应用于农业方面的试验设计及试验结果的分析最初应用于农业方面的试验设计及试验结果的分析,后来逐渐推广,现已后来逐渐推广,现已后来逐渐推广,现已后来逐渐推广,现已广泛应用于工业、农业、生物、广泛应用于工业、农业
4、、生物、广泛应用于工业、农业、生物、广泛应用于工业、农业、生物、医学等领域,成为最常用的一种统计推断方法医学等领域,成为最常用的一种统计推断方法医学等领域,成为最常用的一种统计推断方法医学等领域,成为最常用的一种统计推断方法。vv方差分析(方差分析(方差分析(方差分析(Analysis of VarianceAnalysis of VarianceAnalysis of VarianceAnalysis of Variance):):):):是对是对是对是对实验实验实验实验(观测)数据(观测)数据(观测)数据(观测)数据进行分析,以进行分析,以进行分析,以进行分析,以推断、鉴别各因素(即:推断
5、、鉴别各因素(即:推断、鉴别各因素(即:推断、鉴别各因素(即:影响试验结果的各种条件影响试验结果的各种条件影响试验结果的各种条件影响试验结果的各种条件)的效应大小程度)的效应大小程度)的效应大小程度)的效应大小程度的一种的一种的一种的一种统计方法。统计方法。统计方法。统计方法。vv在工农业生产和科学实验中在工农业生产和科学实验中在工农业生产和科学实验中在工农业生产和科学实验中,常常需要利用,常常需要利用,常常需要利用,常常需要利用方差分方差分方差分方差分析方法析方法析方法析方法来考察来考察来考察来考察各种因素对特定指标各种因素对特定指标各种因素对特定指标各种因素对特定指标的影响,的影响,的影响
6、,的影响,如如如如考察考察考察考察农作物品种、施肥方法对农作物单产的影响。农作物品种、施肥方法对农作物单产的影响。农作物品种、施肥方法对农作物单产的影响。农作物品种、施肥方法对农作物单产的影响。(续前)(续前)vv方差分析的优点之一:方差分析的优点之一:节省时间节省时间vv对于对于对于对于多个总体均值是否相等多个总体均值是否相等多个总体均值是否相等多个总体均值是否相等的假设检验问题,固然的假设检验问题,固然的假设检验问题,固然的假设检验问题,固然可以采用可以采用可以采用可以采用假设检验假设检验假设检验假设检验一章中介绍的一章中介绍的一章中介绍的一章中介绍的两个总体均值是否两个总体均值是否两个总
7、体均值是否两个总体均值是否相等的检验方法相等的检验方法相等的检验方法相等的检验方法。但是利用。但是利用。但是利用。但是利用两个总体均值是否相等两个总体均值是否相等两个总体均值是否相等两个总体均值是否相等的检验方法的检验方法的检验方法的检验方法来检验来检验来检验来检验多个总体均值是否相等多个总体均值是否相等多个总体均值是否相等多个总体均值是否相等的问题,的问题,的问题,的问题,是十分麻烦的。是十分麻烦的。是十分麻烦的。是十分麻烦的。vv例如:例如:例如:例如:有有有有30303030个样本容量个样本容量个样本容量个样本容量n=10n=10n=10n=10的样本的样本的样本的样本,进行,进行,进行
8、,进行总体均值总体均值总体均值总体均值1 1 1 1=2 2 2 2=30303030的检验,若采用的检验,若采用的检验,若采用的检验,若采用两均值是否相等两均值是否相等两均值是否相等两均值是否相等的检验方法,则要的检验方法,则要的检验方法,则要的检验方法,则要依次计算出依次计算出依次计算出依次计算出30303030个样本个样本个样本个样本各自的各自的各自的各自的均值均值均值均值和标准差和标准差和标准差和标准差,然后再进行,然后再进行,然后再进行,然后再进行两两配对检验两两配对检验两两配对检验两两配对检验,这样的,这样的,这样的,这样的配对配对配对配对检验检验检验检验共有共有共有共有 个,检验
9、的工作量之个,检验的工作量之个,检验的工作量之个,检验的工作量之大,可想而知。大,可想而知。大,可想而知。大,可想而知。vv方差分析方差分析方差分析方差分析,可以大大减少,可以大大减少,可以大大减少,可以大大减少两两检验两两检验两两检验两两检验带来的巨大的工带来的巨大的工带来的巨大的工带来的巨大的工作量,从而大大节约了时间。作量,从而大大节约了时间。作量,从而大大节约了时间。作量,从而大大节约了时间。(续前)(续前)vv方差分析的优点之二:方差分析的优点之二:增加了稳定性增加了稳定性vv由于由于方差分析方差分析将将所有的样本资料所有的样本资料结合在一起,结合在一起,故而故而增加了分析结论的稳定
10、性增加了分析结论的稳定性。vv例如:例如:3030个样本,每一个样本中包括个样本,每一个样本中包括1010个观个观察单位(察单位(n=10n=10)。如果采用。如果采用t t检验法检验法,则在,则在两两两检验两检验中,中,一次只能研究一次只能研究2 2个样本个样本和和2020个观察个观察单位单位,而在,而在方差分析方差分析中,则可以把中,则可以把3030个样本个样本和和300300个样本观察单位个样本观察单位同时放在一起同时放在一起、结合进、结合进行研究。行研究。vv所以,所以,方差分析方差分析是一种是一种实用、有效实用、有效的分析方的分析方法。法。6.1.2 6.1.2 方差分析及其有关术语
11、方差分析及其有关术语v1.1.方差分析的概念方差分析的概念v2.2.方差分析的有关术语方差分析的有关术语v3.3.方差分析的种类方差分析的种类1.1.方差分析的概念方差分析的概念vv方差分析方差分析是是检验多个总体均值是否相等检验多个总体均值是否相等的一的一种统计分析方法,它是种统计分析方法,它是通过检验通过检验各总体的均各总体的均值是否相等值是否相等来判断来判断分类型自变量分类型自变量对对数值型因数值型因变量变量是否有显著影响。是否有显著影响。vv表面上方差分析表面上方差分析是检验是检验多个总体的均值是否多个总体的均值是否相等相等,但本质上它但本质上它所研究的是所研究的是分类型自变量分类型自
12、变量(品质变量品质变量)对)对数值型因变量数值型因变量的影响,的影响,如:如:它们之间它们之间有没有关系有没有关系,关系的密切程度关系的密切程度等。等。vv为了更好地方差分析的含义为了更好地方差分析的含义,我们通过下面,我们通过下面的的例子例子来进行说明。来进行说明。例:例:欲考察欲考察欲考察欲考察包装颜色包装颜色包装颜色包装颜色对对对对产品销量产品销量产品销量产品销量的影响。现将的影响。现将的影响。现将的影响。现将不同不同不同不同包装颜色的同种产品包装颜色的同种产品包装颜色的同种产品包装颜色的同种产品放到放到放到放到四家销售条件基本相同四家销售条件基本相同四家销售条件基本相同四家销售条件基本
13、相同的商的商的商的商店销售,进行对比试验,其结果如下表:店销售,进行对比试验,其结果如下表:店销售,进行对比试验,其结果如下表:店销售,进行对比试验,其结果如下表:销销 售售 量量 (万件)(万件)商商 店店 序序 号号行和行和行平均行平均行平均行平均1 2 3 41 2 3 4包装包装包装包装颜色颜色颜色颜色红色红色蓝色蓝色黄色黄色14 10 11 914 10 11 9 8 14 3 7 8 14 3 7 8 6 5 1 8 6 5 144443232202011118 85 5例题分析:例题分析:vv1.1.1.1.从试验结果看,不同包装颜色的同一种商品,销从试验结果看,不同包装颜色的同
14、一种商品,销从试验结果看,不同包装颜色的同一种商品,销从试验结果看,不同包装颜色的同一种商品,销售量有所不同售量有所不同售量有所不同售量有所不同。但是即使是。但是即使是。但是即使是。但是即使是同一包装颜色的同种商同一包装颜色的同种商同一包装颜色的同种商同一包装颜色的同种商品品品品,在,在,在,在四家商店的销售量也有所不同四家商店的销售量也有所不同四家商店的销售量也有所不同四家商店的销售量也有所不同。vv这里关键的问题是:这里关键的问题是:这里关键的问题是:这里关键的问题是:不同颜色的同种商品销售量不不同颜色的同种商品销售量不不同颜色的同种商品销售量不不同颜色的同种商品销售量不同同同同和和和和同
15、一种颜色的同种商品销售量不同同一种颜色的同种商品销售量不同同一种颜色的同种商品销售量不同同一种颜色的同种商品销售量不同。这两种。这两种。这两种。这两种差差差差异有没有本质上的差别?异有没有本质上的差别?异有没有本质上的差别?异有没有本质上的差别?vv2.2.2.2.从直观上分析从直观上分析从直观上分析从直观上分析,A A A A:同一包装颜色的同种商品同一包装颜色的同种商品同一包装颜色的同种商品同一包装颜色的同种商品在在在在不不不不同商店销售量同商店销售量同商店销售量同商店销售量之间的差异。是由种种之间的差异。是由种种之间的差异。是由种种之间的差异。是由种种不可控制的偶不可控制的偶不可控制的偶
16、不可控制的偶然因素然因素然因素然因素引起的,可称为引起的,可称为引起的,可称为引起的,可称为随机因素随机因素随机因素随机因素(试验因素试验因素试验因素试验因素),),),),如:如:如:如:商店的商店的商店的商店的区位环境区位环境区位环境区位环境、服务态度服务态度服务态度服务态度、居民结构居民结构居民结构居民结构等。等。等。等。B B B B、不同不同不同不同包装颜色的商品包装颜色的商品包装颜色的商品包装颜色的商品在在在在同一家商店销售量同一家商店销售量同一家商店销售量同一家商店销售量之间的差异。之间的差异。之间的差异。之间的差异。除了除了除了除了不可避免地不可避免地不可避免地不可避免地夹杂着
17、夹杂着夹杂着夹杂着随机误差随机误差随机误差随机误差外,还同时反映了外,还同时反映了外,还同时反映了外,还同时反映了不同包装颜色不同包装颜色不同包装颜色不同包装颜色对对对对销售量销售量销售量销售量的影响。这种由的影响。这种由的影响。这种由的影响。这种由包装颜色不包装颜色不包装颜色不包装颜色不同同同同引起的引起的引起的引起的销售量销售量销售量销售量之间的差异,称为之间的差异,称为之间的差异,称为之间的差异,称为条件误差条件误差条件误差条件误差或或或或系统系统系统系统误差误差误差误差。例题分析(续前):例题分析(续前):vv上述问题可以归结为一个假设检验问题上述问题可以归结为一个假设检验问题上述问题
18、可以归结为一个假设检验问题上述问题可以归结为一个假设检验问题,即检验,即检验,即检验,即检验产产产产品包装颜色品包装颜色品包装颜色品包装颜色对对对对产品销售量产品销售量产品销售量产品销售量是否有影响?是否有影响?是否有影响?是否有影响?vv令:令:令:令:1 1 1 1、2 2 2 2、3 3 3 3分别为分别为分别为分别为红、蓝、黄红、蓝、黄红、蓝、黄红、蓝、黄三种颜色的三种颜色的三种颜色的三种颜色的产品产品产品产品销售量的均值销售量的均值销售量的均值销售量的均值vv若若若若 1 1 1 1、2 2 2 2、3 3 3 3不完全相等不完全相等不完全相等不完全相等(存在显著差异存在显著差异存在
19、显著差异存在显著差异)则说明)则说明)则说明)则说明 1 1 1 1、2 2 2 2、3 3 3 3来自来自来自来自三个不同的总体三个不同的总体三个不同的总体三个不同的总体,表明,表明,表明,表明包装颜色包装颜色包装颜色包装颜色对对对对产品销售量产品销售量产品销售量产品销售量有影响。有影响。有影响。有影响。vv若:若:若:若:1 1 1 1=2 2 2 2=3 3 3 3(不存在显著差异不存在显著差异不存在显著差异不存在显著差异),则表明三者来),则表明三者来),则表明三者来),则表明三者来自自自自同一总体同一总体同一总体同一总体,包装颜色包装颜色包装颜色包装颜色对对对对产品销售量产品销售量产
20、品销售量产品销售量没有影响。没有影响。没有影响。没有影响。0 0 0 0红红红红蓝蓝蓝蓝黄黄黄黄2.2.方差分析的有关术语方差分析的有关术语vv(1 1 1 1)因素()因素()因素()因素(factor)factor)factor)factor):又称之为又称之为又称之为又称之为因子因子因子因子,是指,是指,是指,是指方差分方差分方差分方差分析析析析所要所要所要所要考察和研究的对象考察和研究的对象考察和研究的对象考察和研究的对象,它是一个,它是一个,它是一个,它是一个独立的变量独立的变量独立的变量独立的变量。如:如:如:如:引例中的引例中的引例中的引例中的产品包装颜色产品包装颜色产品包装颜色
21、产品包装颜色,记作:因素,记作:因素,记作:因素,记作:因素A A A A。vv(2 2 2 2)水平()水平()水平()水平(levellevellevellevel):):):):它是指它是指它是指它是指因素因素因素因素中的中的中的中的内容内容内容内容,是,是,是,是因因因因素的具体表现素的具体表现素的具体表现素的具体表现。vv如:如:如:如:红色、蓝色、黄色红色、蓝色、黄色红色、蓝色、黄色红色、蓝色、黄色,就是,就是,就是,就是产品包装颜色产品包装颜色产品包装颜色产品包装颜色这个这个这个这个变变变变量量量量(因素因素因素因素A A A A)的)的)的)的变量值变量值变量值变量值或或或或具
22、体表现具体表现具体表现具体表现。vv(3 3 3 3)因变量(因变量(dependent variable):也称为响:也称为响应变量(应变量(response variable)或指标值,它是指)或指标值,它是指在我们在研究问题中最感兴趣的测量指标。在我们在研究问题中最感兴趣的测量指标。vv(4 4 4 4)观测值:)观测值:)观测值:)观测值:是指是指是指是指每个因子每个因子每个因子每个因子下得到的下得到的下得到的下得到的样本数据样本数据样本数据样本数据。3.3.方差分析的种类方差分析的种类vv(1 1)单因素方差分析)单因素方差分析vv即仅针对即仅针对一个因素一个因素进行的进行的方差分析
23、方差分析。vv如:如:引例中的引例中的产品包装颜色产品包装颜色对对产品销售量产品销售量的的影响。影响。vv(2 2)多因素方差分析:)多因素方差分析:vv即同时针对即同时针对多个因素多个因素进行的进行的方差分析方差分析。vv如:如:农作物品种农作物品种、施肥方法施肥方法、气候气候、土壤土壤等等因素对因素对农作物产量农作物产量的影响。的影响。vv多因素方差分析多因素方差分析中的中的双因素方差分析双因素方差分析是最常是最常见的。见的。6.1.3 6.1.3 方差分析的基本思想和原理方差分析的基本思想和原理v1.1.数据差异的来源及其度量数据差异的来源及其度量v2.2.方差的比较方差的比较1.1.数
24、据差异的来源及其度量数据差异的来源及其度量vv方差分析的目的方差分析的目的方差分析的目的方差分析的目的是要验证是要验证是要验证是要验证r r r r个正态总体个正态总体个正态总体个正态总体(水平水平水平水平)的)的)的)的均值均值均值均值 1 1 1 1、2 2 2 2、r r r r是否相等是否相等是否相等是否相等。而为了达到这个目。而为了达到这个目。而为了达到这个目。而为了达到这个目的,必须进行方差比较。样本观察值的,必须进行方差比较。样本观察值的,必须进行方差比较。样本观察值的,必须进行方差比较。样本观察值x x x xi i i i1 1 1 1、x x x xi2i2i2i2、x x
25、 x xinininin之之之之间存在着差异。差异的产生来源于以下两个方面:间存在着差异。差异的产生来源于以下两个方面:间存在着差异。差异的产生来源于以下两个方面:间存在着差异。差异的产生来源于以下两个方面:vv(1 1)由因素中的不同水平造成的系统性差异。)由因素中的不同水平造成的系统性差异。如:如:如:如:包装颜色不同包装颜色不同包装颜色不同包装颜色不同造成的造成的造成的造成的产品销售量不同产品销售量不同产品销售量不同产品销售量不同。用。用。用。用组间组间组间组间方差方差方差方差(即(即(即(即水平之间的差异水平之间的差异水平之间的差异水平之间的差异)来度量这种)来度量这种)来度量这种)来
26、度量这种系统性差异系统性差异系统性差异系统性差异。vv即:即:即:即:组间方差(水平间方差)组间方差(水平间方差)组间方差(水平间方差)组间方差(水平间方差)=系统性偏差系统性偏差系统性偏差系统性偏差+随机误差随机误差随机误差随机误差 vv(2 2)由抽选样本的随机性而产生的随机性误)由抽选样本的随机性而产生的随机性误差。差。如:如:如:如:包装颜色相同的同种产品包装颜色相同的同种产品包装颜色相同的同种产品包装颜色相同的同种产品,在,在,在,在不同的商店不同的商店不同的商店不同的商店销售量也不同销售量也不同销售量也不同销售量也不同。用。用。用。用组内方差组内方差组内方差组内方差(即:(即:(即
27、:(即:水平内部的差异水平内部的差异水平内部的差异水平内部的差异)来度量这种来度量这种来度量这种来度量这种随机性误差随机性误差随机性误差随机性误差。vv即:即:即:即:组内方差(水平内部的方差)组内方差(水平内部的方差)组内方差(水平内部的方差)组内方差(水平内部的方差)=随机性误差随机性误差随机性误差随机性误差2.2.方差的比较方差的比较vv(1 1 1 1)若不同的水平对试验结果没有影响)若不同的水平对试验结果没有影响)若不同的水平对试验结果没有影响)若不同的水平对试验结果没有影响,即,即,即,即系统系统系统系统性偏差性偏差性偏差性偏差=0=0=0=0,则在,则在,则在,则在水平之间的方差
28、水平之间的方差水平之间的方差水平之间的方差(组间方差组间方差组间方差组间方差),就),就),就),就仅仅有仅仅有仅仅有仅仅有随机性误差随机性误差随机性误差随机性误差,即:,即:,即:,即:组间方差组间方差组间方差组间方差=随机性误差随机性误差随机性误差随机性误差。此时,此时,此时,此时,组间方差组间方差组间方差组间方差组内方差组内方差组内方差组内方差=随机性误差随机性误差随机性误差随机性误差。于是。于是。于是。于是组组组组间方差间方差间方差间方差组内方差组内方差组内方差组内方差1 1 1 1。vv(2 2 2 2)若不同的水平对试验结果有影响)若不同的水平对试验结果有影响)若不同的水平对试验结
29、果有影响)若不同的水平对试验结果有影响,即,即,即,即系统性系统性系统性系统性偏差偏差偏差偏差0 0 0 0,既存在,既存在,既存在,既存在系统性偏差系统性偏差系统性偏差系统性偏差,又存在,又存在,又存在,又存在随机性误差随机性误差随机性误差随机性误差,则则则则组间方差组间方差组间方差组间方差=系统性偏差系统性偏差系统性偏差系统性偏差+随机性误差随机性误差随机性误差随机性误差就大于就大于就大于就大于组内方组内方组内方组内方差差差差=随机性误差随机性误差随机性误差随机性误差。此时。此时。此时。此时组间方差组间方差组间方差组间方差组内方差组内方差组内方差组内方差就会就会就会就会显显显显著地大于著地
30、大于著地大于著地大于1 1 1 1。vv(3 3 3 3)当组间方差)当组间方差)当组间方差)当组间方差组内方差的比值达到临界点时组内方差的比值达到临界点时组内方差的比值达到临界点时组内方差的比值达到临界点时,就可以做出判断:就可以做出判断:就可以做出判断:就可以做出判断:不同的水平之间存在显著性差异。不同的水平之间存在显著性差异。不同的水平之间存在显著性差异。不同的水平之间存在显著性差异。vv因此,因此,因此,因此,方差分析方差分析方差分析方差分析就是通过就是通过就是通过就是通过不同方差的比较不同方差的比较不同方差的比较不同方差的比较,作出,作出,作出,作出不不不不拒绝拒绝拒绝拒绝或或或或拒
31、绝原假设拒绝原假设拒绝原假设拒绝原假设的判断。的判断。的判断。的判断。6.1.4 6.1.4 方差分析中的基本假定方差分析中的基本假定(基本前提:基本前提:独立、同分布、同方差独立、同分布、同方差)vv一、因素中的一、因素中的k k个水平相当于个水平相当于k k个正态总体。个正态总体。每个水平下的每个水平下的n n个观察数据个观察数据(试验结果试验结果)相当)相当于从于从正态总体正态总体中抽取的中抽取的容量为容量为n n的随机样本。的随机样本。(同分布同分布)vv二、二、r r个正态总体的方差是相同。个正态总体的方差是相同。vv即:即:1 12 2=2 22 2.=k k2 2=2 2 (同方
32、差同方差)vv三、从不同的正态总体中抽取的各个随机样三、从不同的正态总体中抽取的各个随机样本是相互独立的。本是相互独立的。(独立独立)6.1.5 6.1.5 方差分析中的方差分析中的F F统计量统计量vv式中:式中:式中:式中:第一自由度第一自由度第一自由度第一自由度n n n n1 1 1 1是是是是组间方差的自由度组间方差的自由度组间方差的自由度组间方差的自由度;第二自第二自第二自第二自由度由度由度由度n n n n2 2 2 2是是是是组内方差的自由度组内方差的自由度组内方差的自由度组内方差的自由度。vvF F F F分布的特征:分布的特征:分布的特征:分布的特征:A A A A、统计量
33、统计量统计量统计量F0F0F0F0;B B B B、F F F F分布是一个正分布是一个正分布是一个正分布是一个正偏(右偏)分布偏(右偏)分布偏(右偏)分布偏(右偏)分布,F F F F分布的曲线分布的曲线分布的曲线分布的曲线以以以以横轴横轴横轴横轴作为作为作为作为渐进线渐进线渐进线渐进线,并并并并趋于无穷大趋于无穷大趋于无穷大趋于无穷大;C C C C、F F F F分布是一种连续的概率分布分布是一种连续的概率分布分布是一种连续的概率分布分布是一种连续的概率分布。不同的自由度组合,会有不同的不同的自由度组合,会有不同的不同的自由度组合,会有不同的不同的自由度组合,会有不同的F F F F分布
34、曲线。分布曲线。分布曲线。分布曲线。vv数理统计可以证明:数理统计可以证明:统计量统计量6.2 6.2 单因素方差分析单因素方差分析v6.2.1 6.2.1 单因素方差分析的步骤单因素方差分析的步骤v6.2.2 6.2.2 关系强度的测度关系强度的测度6.2.1 6.2.1 单因素方差分析的步骤单因素方差分析的步骤v1.1.提出假设提出假设v2.2.构造检验统计量构造检验统计量F Fv3.3.对于给定的显著性水平,查对于给定的显著性水平,查F F分分布表得出布表得出F F临界值临界值v4.4.列出方差分析表列出方差分析表v5.5.作出接受或拒绝原假设的决策作出接受或拒绝原假设的决策1.1.提出
35、假设提出假设vv原假设:原假设:原假设:原假设:备择假设:备择假设:备择假设:备择假设:vv如果不拒绝原假设如果不拒绝原假设如果不拒绝原假设如果不拒绝原假设H H H H0 0 0 0,则,则,则,则不能认为水平之间存在显著不能认为水平之间存在显著不能认为水平之间存在显著不能认为水平之间存在显著差异差异差异差异(即(即(即(即不能认为自变量对因变量有显著影响不能认为自变量对因变量有显著影响不能认为自变量对因变量有显著影响不能认为自变量对因变量有显著影响)。)。)。)。如果拒绝原假设如果拒绝原假设如果拒绝原假设如果拒绝原假设H H H H0 0 0 0,则意味着,则意味着,则意味着,则意味着水平
36、之间存在显著差异水平之间存在显著差异水平之间存在显著差异水平之间存在显著差异(即(即(即(即自变量对因变量有显著影响自变量对因变量有显著影响自变量对因变量有显著影响自变量对因变量有显著影响)。)。)。)。vv需要指出的是:需要指出的是:需要指出的是:需要指出的是:拒绝原假设拒绝原假设拒绝原假设拒绝原假设H H H H0 0 0 0时,仅仅时,仅仅时,仅仅时,仅仅只能表明至少只能表明至少只能表明至少只能表明至少有两个总体的均值不等有两个总体的均值不等有两个总体的均值不等有两个总体的均值不等,并不意味着所有总体的均并不意味着所有总体的均并不意味着所有总体的均并不意味着所有总体的均值都不相等值都不相
37、等值都不相等值都不相等。2.2.构造检验统计量构造检验统计量F Fvv因为因为:vv所以所以:构造检验统计量构造检验统计量F F的过程的过程,实际,实际上就是计算上就是计算组间方差组间方差和和组内方差组内方差的过程。的过程。单因素方差分析的数据结构如下单因素方差分析的数据结构如下(见后见后面的附表面的附表)附:单因素方差分析的数据结构附:单因素方差分析的数据结构总均值总均值总均值总均值 水平均值水平均值水平均值水平均值总和总和总和总和xxxxijijijij x x x xi1 i1 i1 i1 xxxxi2 i2 i2 i2 x x x xikikikik 水平水平水平水平xxxxijiji
38、jij x x x x11111111 x x x x 12121212 x x x x1k1k1k1k x x x x21212121 x x x x 22222222 x x x x2k2k2k2k x x x xnj1nj1nj1nj1 x x x xnj2nj2nj2nj2 x x x xnjknjknjknjk 1 1 1 1 2 2 2 2 .n n n nj j j j试试试试验验验验次次次次数数数数水平水平水平水平1 1 1 1 水平水平水平水平2 2 2 2 水平水平水平水平k k k k全部数据的总全部数据的总全部数据的总全部数据的总和及总均值和及总均值和及总均值和及总均值
39、 因因因因 素素素素 A A A A试验试验试验试验 结果结果结果结果、构造检验统计量构造检验统计量F的具体步骤的具体步骤vv(1)计算水平均值和总均值)计算水平均值和总均值vv(2)计算离差(误差)平方和)计算离差(误差)平方和,包括,包括总离差总离差平方和平方和(SSA)、误差项离差平方和误差项离差平方和(SSE)和和水平项离差平方和水平项离差平方和(SSA)。)。vv(3)确定)确定SST、SSE和和SSA的自由度的自由度。vv(4)平均平方)平均平方组间方差组间方差(MSA)和和组内组内方差方差(MSE)vv(5)计算检验统计量)计算检验统计量F(1 1)计算水平均值和总均值)计算水平
40、均值和总均值(j=1(j=1(j=1(j=1、2.k2.k2.k2.k)水平均值(列均值)水平均值(列均值)水平均值(列均值)水平均值(列均值)的计算公式的计算公式的计算公式的计算公式 全部数据的总均值为全部数据的总均值为全部数据的总均值为全部数据的总均值为 (2)计算离差(误差)平方和)计算离差(误差)平方和vvA.A.总离差平方和(总离差平方和(SST)SST)的计算的计算vvB.B.随机误差项离差平方和(随机误差项离差平方和(SSE)SSE)的计算的计算vvC.C.水平项离差平方和(水平项离差平方和(SSA)SSA)的计算的计算离差平方和离差平方和离差平方和离差平方和SSTSSTSSTS
41、ST SSESSESSESSE SSASSASSASSAA.A.总离差平方和(总离差平方和(SST)SST)的计算的计算vvSSTSST是指全部数据是指全部数据 与总均值与总均值 的离差平的离差平方和,反映全部数据的离散状况。方和,反映全部数据的离散状况。B.B.随机误差项离差平方和(随机误差项离差平方和(SSE)SSE)的计算的计算vvSSESSE反映的是反映的是水平内部水平内部或或组内观察值组内观察值的离散状的离散状况。它实质上反映了况。它实质上反映了除所考察因素以外的其除所考察因素以外的其他随机因素他随机因素的影响,反映的影响,反映样本数据样本数据()()与与水平均值水平均值 ()()之
42、间的差异,故而称之之间的差异,故而称之为为随机误差项离差平方和随机误差项离差平方和或或组内误差组内误差。计算。计算公式如下:公式如下:C.C.水平项离差平方和(水平项离差平方和(SSA)SSA)的计算的计算vv为了叙述方便为了叙述方便,我们把,我们把单因素方差分析单因素方差分析中的中的因素因素称为称为A A,于是,于是水平项离差平方和水平项离差平方和用用SSASSA表表示。示。vvSSASSA所反映的是所反映的是水平之间的差异水平之间的差异(组间差异组间差异),),即:即:水平均值水平均值与与总均值总均值之间的差异,故之间的差异,故SSASSA又又可称为可称为组间误差组间误差,它既包括,它既包
43、括随机误差随机误差,也包,也包括括系统性误差系统性误差。计算公式为:。计算公式为:(3 3)确定)确定SSTSST、SSESSE和和SSASSA的自由度的自由度vvA.A.总离差平方和总离差平方和SSTSST的自由度的确定的自由度的确定vvB.B.随机误差项离差平方和随机误差项离差平方和SSESSE的自由度的确的自由度的确定定vvC.C.水平项离差平方和水平项离差平方和SSASSA的自由度的确定的自由度的确定SST=SSE+SSASST=SSE+SSASST=SSE+SSASST=SSE+SSAn-1=(n-k)+(k-1)n-1=(n-k)+(k-1)n-1=(n-k)+(k-1)n-1=(
44、n-k)+(k-1)A.A.总离差平方和总离差平方和SSTSST的自由度的确定的自由度的确定B.B.随机误差项离差平方和随机误差项离差平方和SSESSE的的自由度的确定自由度的确定C.C.水平项离差平方和水平项离差平方和SSASSA的自由度的确定的自由度的确定SSTSST、SSESSE和和SSASSA自由度之间的关系自由度之间的关系(4 4)平均平方:)平均平方:组间方差(组间方差(MSA)MSA)和组内和组内方差(方差(MSE)MSE)vv平均平方平均平方,就是指第,就是指第2 2章讲的章讲的方差方差,故,故vvSSASSA的平均平方的平均平方就是指就是指组间方差组间方差,用,用MSAMSA
45、表示表示vvSSESSE的平均平方的平均平方是指是指组内方差组内方差,用,用MSEMSE表表示。示。(5 5)计算检验统计量)计算检验统计量F F3.3.对于给定的显著性水平,查对于给定的显著性水平,查F F分分布表得出布表得出F F临界值临界值v对于给定的显著性水平对于给定的显著性水平,查,查F F分布表分布表得出得出F F临界值临界值。4.4.列出方差分析表列出方差分析表方差来源方差来源方差来源方差来源离差平离差平离差平离差平方和方和方和方和SSSSSSSS自由自由自由自由度度度度dfdfdfdf平均平平均平平均平平均平方方方方 MSMSMSMS统计量统计量统计量统计量 F F F F值值
46、值值P P P P值值值值 F F F F临界值临界值临界值临界值组间差异组间差异组间差异组间差异组内差异组内差异组内差异组内差异总差异总差异总差异总差异 SSA SSA SSA SSA SSE SSE SSE SSE SST SST SST SSTr-1r-1r-1r-1n-rn-rn-rn-rn-1n-1n-1n-1 MSA MSA MSA MSA MSE MSE MSE MSE MSA/MSEMSA/MSEMSA/MSEMSA/MSE 实际上是前面计算结果的总结,如果实际上是前面计算结果的总结,如果是利用是利用统计软件统计软件SPSSSPSS或或ExcelExcel运算,则运算,则该表该
47、表表现为计算机的最终输出结果表现为计算机的最终输出结果5.5.作出接受或拒绝原假设的决策作出接受或拒绝原假设的决策vv若:若:若:若:F FF FF FF F(k-1,n-k)F F(k-1,n-k)F F(k-1,n-k)F F(k-1,n-k)vv则:则:则:则:拒绝原假设拒绝原假设拒绝原假设拒绝原假设,表明,表明,表明,表明各个水平(组)之间存在显各个水平(组)之间存在显各个水平(组)之间存在显各个水平(组)之间存在显著性差异。著性差异。著性差异。著性差异。不拒绝不拒绝不拒绝不拒绝不拒绝不拒绝H H H H H H0 00 00 0拒绝拒绝拒绝拒绝拒绝拒绝H HH HH H0 00 00
48、 0F F F F(k-1,n-k)(k-1,n-k)(k-1,n-k)(k-1,n-k)单因素方差分析举例单因素方差分析举例vv欲考察欲考察欲考察欲考察包装颜色包装颜色包装颜色包装颜色对对对对产品销量产品销量产品销量产品销量的影响。现将的影响。现将的影响。现将的影响。现将不同包装颜色的同不同包装颜色的同不同包装颜色的同不同包装颜色的同种产品种产品种产品种产品放到放到放到放到四家销售条件基本相同四家销售条件基本相同四家销售条件基本相同四家销售条件基本相同的商店销售,进行对比试的商店销售,进行对比试的商店销售,进行对比试的商店销售,进行对比试验,其结果及水平均值和总均值的计算如下表:验,其结果及
49、水平均值和总均值的计算如下表:验,其结果及水平均值和总均值的计算如下表:验,其结果及水平均值和总均值的计算如下表:全部数据的总和全部数据的总和全部数据的总和全部数据的总和及总均值及总均值及总均值及总均值32323232黄色黄色黄色黄色蓝色蓝色蓝色蓝色红色红色红色红色总均值总均值总均值总均值5 5 5 58 8 8 811111111水平均值水平均值水平均值水平均值2020202044444444水平和水平和水平和水平和8 8 8 86 6 6 65 5 5 51 1 1 18 8 8 8141414143 3 3 37 7 7 71414141410101010111111119 9 9 91
50、 1 1 12 2 2 23 3 3 34 4 4 4商商商商店店店店序序序序号号号号 产品包装颜色产品包装颜色产品包装颜色产品包装颜色 销售量销售量销售量销售量 (万件)(万件)(万件)(万件)试分析试分析试分析试分析包装颜色包装颜色包装颜色包装颜色对对对对产品销量产品销量产品销量产品销量有无显著影响?有无显著影响?有无显著影响?有无显著影响?()例解:例解:提出假设提出假设 v原假设原假设v备择假设备择假设例解(续前)例解(续前)计算水平均值和总均值计算水平均值和总均值例解(续前)例解(续前)计算离差平方和:计算离差平方和:SSTSST的计算的计算例解(续前)例解(续前)SSESSE的计算