1、标题方差分析的基本问题,文本,*,第八章方差分析,方差分析,表,8,1,对,6,种型号生产线维修时数的调查结果,序号,型号,1,2,3,4,A,型,9.5,8.8,11.4,7.8,B,型,4.3,7.8,3.2,6.5,C,型,6.5,8.3,8.6,8.2,D,型,6.1,7.3,4.2,4.1,E,型,10.0,4.8,5.4,9.6,F,型,9.3,8.7,7.2,10.1,8.1,方差分析的基本问题,研究的指标,:,维修时间记作,Y,控制因素是生产线的型号,分为,6,个水平即,A,B,C,D,E,F,,每个水平对应一个总体,Y,i,(i=1,2,6),。,6.1,方差分析的基本问题,
2、现在的试验就是进行调查,每种型号调查,4,台,相当于每个总体中抽取一个容量为,4,的样本,得到的数据记作,y,ij,(i=1,2,6;j=1,2,3,4),即为下表数据。,计算各样本平均数 如下,:,型号,A,B,C,D,E,F,9.4,5.5,7.9,5.4,7.5,8.8,表,8,2,6.1,方差分析的基本问题,两个总体平均值比较的检验法,把样本平均数两两组成对,:,与,与,与,与,与,共有,(15),对。,6.1,方差分析的基本问题,即使每对都进行了比较,并且都以,0.95,的置信度得出每对均值都相等的结论,但是由此要得出这,6,个型号的维修时间的均值都相等。这一结论的置信度仅是,上述方
3、法存在的问题,工作量大,置信度低,将这,15,对平均数一一进行比较检验,6.1,方差分析的基本问题,方差分析的基本原理,:,(1),将数据总的偏差平方和按照产生的原因分解成:,(,总的偏差平方和,)=,(,由因素水平引起的偏差平方和,)+(,试验误差平方和,),(2),上式右边两个平方和的相对大小可以说明因素的不同水平是否使得各型号的平均维修时间产生显著性差异,为此需要进行适当的统计假设检验,.,6.1,方差分析的基本问题,数学模型和数据结构,参数点估计,分解定理 自由度,显著性检验,多重分布与区间估计,6.2,单因素方差分析,在单因素试验中,为了考察因素,A,的,k,个水平,A,1,A,2,
4、A,k,对,Y,的影响,(,如,k,种型号对维修时间的影响,),设想在固定的条件,A,i,下作试验,.,所有可能的试验结果组成一个总体,Y,i,它是一个随机变量,.,可以把它分解为两部分,(,8-1,),6.2.1,数学模型和数据结构,其中:,纯属,A,i,作用的结果,称为在,A,i,条件下,Y,i,的真值,(,也称为在,A,i,条件下,Y,i,的理论平均,).,是实验误差,(,也称为随机误差,),。,(,8-2,),其中,和 都是未知参数,(i=1,2,k).,6.2.1,数学模型和数据结构,假定在水平,A,i,下重复做,m,次试验,得到观测值,1,2,j,M,合计,平均,A,1,Y,11,
5、Y,12,Y,1j,Y,1m,T,1,A,2,Y,21,Y,22,Y,2j,Y,2m,T,2,A,i,Y,i1,Y,i2,Y,ij,Y,im,T,i,A,k,Y,k1,Y,k2,Y,kj,Y,km,T,k,表,8,3,6.2.1,数学模型和数据结构,表中:,(i=1,2,k)(8-3),Y,ij,表,示在,A,i,条件下第,j,次试验的结果,用式子表示就是,(i=1,2,k j=1,2,m)(8-4),注意,:,每次试验结果只能得到,Y,ij,而,(8-4),式中的 和 都不能直接观测到。,6.2.1,数学模型和数据结构,为了便于比较和分析因素,A,的水平,A,i,对指标影响的大小,通常把 再
6、分解为,(i=1,2,k)(8-5),其中,称为一般平均,(Grand Mean),它是比,较作用大小的一个基点;,6.2.1,数学模型和数据结构,并且称,为第,i,个水平,A,i,的效应,.,它表示水平的真值比一般水平差多少。满足约束条件,(8-6),可得,i=1,2,k;j=1,2,m,6.2.1,数学模型和数据结构,要解决的问题,找出参数,和 的估计量,分析观测值的偏差,检验各水平效应,有无显著差异,6.2.1,数学模型和数据结构,用最小二乘法求参数 的估计量,然后寻求 的无偏估计量,.,须使参数 的估计值能使在水平,A,i,下求得的观测值,Y,ij,与真值 之间的偏差尽可能小。,为满足
7、此要求,一般考虑用最小偏差平方和原则,也就是使观测值与真值的偏差平方和达到最小,.,6.2.2,参数点估计,由,(8-4),可知,上述偏差平方和,令下列各偏导数为零,(i=1,2,k),6.2.2,参数点估计,由,解得,(8-7),由,解得,(8-8),6.2.2,参数点估计,并由此得 的估计量,至此,求得参数 的估计量,(8-9),6.2.2,参数点估计,按照上述原则求参数估计量的方法称为最小二乘法,称为最小二乘估计量,.,我们还可以证明 分别是参数 的无偏估计量。,将 和 分别用它们的估计量代替,可以得到试验误差 的估计量,(8-10),6.2.2,参数点估计,为了由观测值的偏差中分析出各
8、水平的效应,我们研究三种偏差,:,和,.,根据前面参数估计的讨论,它们分别表示,定理,(8-11),的估计,.,和,6.2.3,分解定理 自由度,证明:,6.2.3,分解定理 自由度,令,则分解定理,(8-11),可写成,(8-12),6.2.3,分解定理 自由度,上式中,称为总偏差平方和,.,称为误差平方和,(,或组内平方和,);,称为因素,A,的效应平方和,(,或组间平方和,),S,T,的自由度,f,T,=km-1,S,A,的自由度,f,A,=k-1,S,E,的自由度,f,E,=k(m-1),容易看出,自由度之间也有类似于分解定理的关系,(8-13),6.2.3,分解定理 自由度,参数假设
9、检验的假设条件,观测值,(i=1,2,k;j=1,2,m),相互独立,在水平,A,i,条件下,Y,ij,(j=1,2,m),服从正态分布,N,6.2.4,显著性检验,要判断在因素,A,的,k,个水平条件下真值之间是否有显著性差异,即检验假设,H,0,:,H,1,:,不全相等,相当于检验假设,H,0,:(i=1,2,k),H,1,:,i,不全为零,6.2.4,显著性检验,可以证明当,H,0,为真时,(8-16),并且 与 相互独立,.,得,(8-17),其中 和 称为均方,(Mean Square).,6.2.4,显著性检验,利用,(8-17),式来检验原假设,H,0,是否成立,.,对于给定的显
10、著水平,可以从,F,分布表查出临界值 再根据样本观测值算出,F,A,的值,.,当 时,拒绝,H,0,当 时,接受,H,0,。,6.2.4,显著性检验,方差来源,平方和,自由度,均方,F,比,组间,(,因素,A),S,A,K-1,S,A,/(k-1),组内,(,实验误差,),S,E,K(m-1),S,E,k(m-1),总和,S,T,=,S,A,+,S,E,Km-1,-,表,8,4,方差分析表,6.2.4,显著性检验,下面继续讨论前面,6,种型号的生产线的例子。根据调查结果,在,=0.05,的显著水平时,检验这,6,种型号的生产线在平均维修时间方面有无显著差异?,根据实践经验,认为各种型号生产线的
11、维修时间是近似服从正态分布的。,作统计假设:,6,种型号的生产线平均维修时数无显著差异,即,H,0,:,i,=0,(,i=1,2,6,),H,1,:,i,不全为零,6.2.4,显著性检验,计算,S,A,及,S,E,6.2.4,显著性检验,表,8,5,计算列表,台号,型号,1,2,3,4,T,i,T,i,2,A,型,9.5,8.8,11.4,7.8,37.5,1406.25,358.49,B,型,4.3,7.8,3.2,6.5,21.8,475.24,131.82,C,型,6.5,8.3,8.6,8.2,31.6,998.56,252.34,D,型,6.1,7.3,4.2,4.1,21.7,47
12、0.89,124.95,E,型,10.0,4.8,5.4,9.6,29.8,888.04,244.36,F,型,9.3,8.7,7.2,10.1,35.3,1246.09,316.03,6.2.4,显著性检验,再将计算结果分别代入,S,A,与,S,E,两式中,得到,第一自由度,第二自由度,6.2.4,显著性检验,查,F,分布表得,由于 ,故拒绝,H,0,。,该结论说明,至少有一种生产线型号的效应不为零,这等价于至少有两种型号的生产线的平均维修时数是有显著差异的。,方差来源,平方和,自由度,均方,F,比,组间,S,A,55.55,5,11.11,组内,S,E,56.72,18,3.15,总和,S
13、T,112.27,23,-,表,8,6,方差分析表,6.2.4,显著性检验,q,检验法:,计算任意两水平的差值 ,,当 时,判断 与 差异显著;,当 时,判断 与 差异显著。,查多重比较的,q,表得,(8-18),6.2.5,多重分布与区间估计,区间估计,在置信度为 的情况下,的置信区间为,(,8-19,),6.2.5,多重分布与区间估计,双因素方差分析的类型,数据结构,离差平方和的分解,应用实例,6.3,双因素方差分析,在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。,例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,
14、就需要分析原因。采用不同的销售策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位;在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解、接受该生产线。,6.3.1,双因素方差分析的类型,若把饮料的颜色看作影响销售量的因素,A,,饮料的销售地区则是影响因素,B,。对因素,A,和因素,B,同时进行分析,就属于双因素方差分析。,双因素方差分析的内容,是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。,6.3.1,双因素方差分析的类型,双因素方差分析的类型,无交互作用的,双因素方差分析,有交互作用的,双因素方差分析,假定因素,A,和因素,
15、B,的效应之间是相互独立的,不存在相互关系,假定因素,A,和因素,B,的结合会产生出一种新的效应,6.3.1,双因素方差分析的类型,例如,,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;,否则,就是无交互作用的背景。有交互作用的双因素方差分析已超出本书的范围,这里介绍无交互作用的双因素方差分析。,6.3.1,双因素方差分析的类型,双因素方差分析的数据结构如表所示:,双因素方差分析数据结构,因素,A,A,1,A,2,A,r,因,素,B,B,1,X,11,X,12,X,1r,B,2,X,21,X,22,X,2r,B,k,X
16、k1,X,k2,X,kr,表,8,7,6.3.2,数据结构,表中,因素,A,位于列的位置,共有,r,个水平,代表第,j,种水平的样本平均数;因素,B,位于行的位置,共有,k,个水平,代表第,i,种水平的样本平均数。为样本总平均数,样本容量,n=rk,。,每一个观察值,X,ij,看作由,A,因素的,r,个水平和,B,因素的,k,个水平所组合成的,rk,个总体中抽取样本容量为,1,的独立随机样本。这,rk,个总体的每一个总体均服从正态分布,且有相同的方差。这是进行双因素方差分析的假定条件。,6.3.2,数据结构,6.3.3,离差平方和的分解,各离差平方和对应的自由度:,总离差平方和,SST,的自
17、由度为,rk-1=n-1,;,因素,A,的离差平方和,SSA,的自由度为,r-1,;,因素,B,的离差平方和的自由度为,k-1,;,随机误差,SSE,的自由度为(,r-1,),(,k-1,),8.3.3,离差平方和的分解,由离差平方和与自由度可以计算均方差:,对因素,A,而言:,对因素,B,而言:,对随机变量而言:,6.3.3,离差平方和的分解,表,8,8,双因素方差分析表,误差来源,离差平方和,自由度,均方差,F,值,A,因素,SSA,r-1,MSA=SSA/(r-1),F,A,=MSA/MSE,因素,SSB,k-1,MSB=SSB/(k-1),F,B,=MSB/MSE,误差,SSE,(r-
18、1)(k-1),MSE=SSE/(r-1)(k-1),-,合计,SST,n-1,-,-,6.3.3,离差平方和的分解,某商品有五种不同的包装方式(因素,A,),在五个不同地区销售(因素,B,),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表,.,表,8,9,现欲检验包装方式和销售地区对该商品销售是否有显著性影响。(,=0.05,),包装方式,(A),A,1,A,2,A,3,A,4,A,5,销,售,地,区,(B),B,1,20,12,20,10,14,B,2,22,10,20,12,6,B,3,24,14,18,18,10,B,4,16,4,8,6,18,B,5,
19、26,22,16,20,10,6.3.4,应用实例,解:,若五种包装方式的销售的均值相等,则表明不同的包装方式在销售上没有差别。,建立假设,对因素,A,:,H,0,:,包装方式之间无差别,H,1,:不全相等,包装方式之间有差别,对因素,B,:,H,0,:地区之间无差别,H,1,:不全相等 地区之间有差别,6.3.4,应用实例,计算,F,值,因素,A,的列均值分别为:,因素,B,的行均值分别为:,总均值,=15.04,故:,SST=,(,20-15.04,),2+(10-15.04)2=880.96,SSA=5(21.6-15.04)2+5(11.6-15.04)2=335.36,SSB=5(1
20、5.2-15.04)2+5(18.8-15.04)2=199.36,SSE=880.96-335.36-199.36=346.24,6.3.4,应用实例,接下来:,因此,6.3.4,应用实例,统计决策,对于因素,A,,因为,F,A,=3.87F,crit,=3.01,故拒绝,H,0,,接受,H,1,,,说明不同的包装方式对该商品的销售产生影响。,对于因素,B,,因为,F,B,=2.30F,0.05,F,A,F,0.01,故,A,因子非常显著;,F,0.10,F,B,F,0.05,,故,B,因子比较显著;,F,0.10,F,C,F,0.05,,故,C,因子也比较显著,但比,A,、,B,二因子的影响作用差。,6.4.3,方差分析法,本例方差分析的结论与直观分析法的结论是一致的,即:,反应温度对产率影响最大,搅拌速度影响最小;好的生产工艺条件仍然是,A,2,B,2,C,1,。,6.4.3,方差分析法,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,






