资源描述
第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/65,第,7,章,方差分析,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第,7,章,方差分析,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第,7,章,方差分析,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第,7,章,方差分析,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第,7,章,方差分析,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/65,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/65,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/65,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/65,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,第,7,章,方差分析,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/65,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/65,第几章,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,2012.2,*,/54,第,6,章,假设检验,第七章 方 差 分 析,统计学原理,(第,3,版),第七章,方差分析,第一节 方差分析的基本问题,第二节 单因素方差分析,学 习 目 标,第三节,双因素方差分析,学习要点,第一节,方差分析的基本问题,1.方差分析的产生背景与基本概念,2,.,方差分析的基本原理,1.方差分析的产生背景与基本概念,方差分析是通过检验多个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响的一种统计分析方法。,(,1,)方差分析的产生背景,从形式上来看,方差分析是检验多个总体均值是否存在显著差异,但本质上它是从数据间的差异入手研究变量之间关系的重要方法。,基于方差分析与假设检验的相关性,尤其是与两独立总体均值之差假设检验的密切关系,因此可将其视为两独立总体均值之差假设检验的深化或延续。,方差分析与两独立总体均值分析的假设检验的优点,采取了对所有总体均值综合考量的思想;,效率更高;,也排除了错误概率累计的后果;,提高了分析的可靠性。,1.方差分析的产生背景与基本概念,观测变量,(,2,)方差分析基本概念,观测变量为数值型变量,可以计算均值与方差,指待检验其均值的变量,也称为因变量或者目标变量,该变量的样本数据称为观测值,因素与处理,因素也被称为因子,是指可能对观测变量产生影响的自变量,因素一般为定性变量或分类型变量,取有限个离散值。因素的各个取值(类别)称为处理或水平,1.方差分析的产生背景与基本概念,单元,单元也被称为水平组合,或者单元格,指各因素各个水平的组合,因素与处理,因素也被称为因子,指可能对观测变量产生影响的自变量;,因素一般为定性变量或分类型变量,取有限个离散值;,因素的各个取值(类别)称为处理或水平,均衡,如果在试验中任一因素各水平在所有单元格中出现的次数相同,且每个单元格内的元素数均相同,则该试验是均衡的;否则,就是不均衡的。,1.方差分析的产生背景与基本概念,如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用,因为影响因变量的各因素是同时其作用的,各因素的作用交织在一起,单纯研究某个因素的作用是没有意义的,针对其他因素的各个水平来研究该因素的作用大小才有意义。,交互作用,1.方差分析的产生背景与基本概念,2,.,方差分析的基本原理,方差分析的概念,方差分析就是通过检验多个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响的统计方法。,方差分析的基本假定,每个水平下总体均服从正态分布;,每个总体的方差都相同;,各水平下的观测值相互独立。,目标因素,该因素取不同水平值会影响观测变量的取值,其他因素,其他因素又可以分为两部分,一部分是除目标因素之外其他因素,这些因素可称为控制因素或控制变量,另一部分是随机因素,影响观测变量的因素,要检测目标因素对观测变量的影响显著性,首先需要将控制因素固定下来,即将这些因素对观测变量的影响剔除,.,如果其他因素中已经不存在对观测变量影响特别明显的因素变量,则影响因素只分为目标因素和随机因素,2,.,方差分析的基本原理,控制因素的剔除,一是确定总体时直接将各个单位在这些因素上的取值固定,,二是目标因素各个水平值确定的子总体中,控制因素的的取值力求随机化,最大限度降低这些因素对观测变量的影响。,剔除了控制因素的影响之后,观测变量的方差,目标因素,随机因素,系统性方差,随机方差,SSA,SSE,SSE,2,.,方差分析的基本原理,总离差平方和=组间离差平方和+组内离差平方和,方差:,总方差=系统方差+随机方差,总离差平方和SST用来度量观测变量的总变异程度,;,组间离差平方和SSA用来度量目标因素不同水平各子总体观测变量均值的差异程度;,组内离差平方和SSE是度量目标因素取同一水平值时观测变量取值的差异,2,.,方差分析的基本原理,目标因素对观测变量影响的显著性,(,组间均方与组内均方比值统计量的分布理论,),当SSA和SSE经过平均后的数值(称为均方)很接近时,其比值应该会很接近1,则目标因素对观测变量的影响不大,;,当SSA和SSE经过平均后的数值(称为均方)差异明显时,其比值应该明显大于1,则目标因素对观测变量的影响较大。,因此,可以通过对比一次抽样得到的检验统计量的取值与给定显著性水平下的临界值或者P值规则,来对目标因素不同水平下观测变量的均值是否存在显著性差异这一问题进行决策。,2,.,方差分析的基本原理,第二节,单因素方差分析,学习要点,1,.,单因素方差分析的数据结构,2.单因素方差分析的步骤,3,.,单因素方差分析中的多重比较,4,.,Excel操作,1,.,单因素方差分析的数据结构,单因素方差分析的数据结构,观测值总个数n可表示为:,列均 值表示第i个总体的样本均值:,不同水平下观测变量的观测次数相同则称为均衡数据,否则称为非均衡数据,是全部观测值的总均值,它等于全部观测值之和除以观测值的总数,计算公式为:,1,.,单因素方差分析的数据结构,2.单因素方差分析的步骤,提出假设:原假设和备择假设;,确定并计算检验统计量;,给定显著性水平,进行统计决策,从样本数据出发来对总体进行决策本质上还是一个假设检验问题,因此,进行方差分析的三个步骤为,(,1,),提出假设,(自变量对因变量没有显著影响),(自变量对因变量有显著影响),2.单因素方差分析的步骤,(,2,)确定并计算检验统计量,离差平方和,组内离差平方和SSE是每个水平的各观测值与其组均值的离差平方和,其计算公式为:,组间离差平方和SSA是各组均值(i=1,2,.,m)与总均值 之间的离差平方和,其计算公式为:,2.单因素方差分析的步骤,总离差平方和SST是所有观测值,x,ij,与总均值 的离差平方和,其计算公式为:,三则之间:,2.单因素方差分析的步骤,三个离差平方和之间存在以下等式关系:,在总离差平方和SST中,如果组间离差平方和SSA所占比例较大,则说明观测变量的变差是由目标因素引起的,目标因素对观测变量的影响显著;,如果组间离差平方和SSA所占比例较小,则说明观测变量的差异不是由目标因素引起的,目标因素对观测变量的影响不显著。,2.单因素方差分析的步骤,自由度与均方,离差平方和的大小除了与影响因素的影响程度有关,还与各自的自由度(变量可以自由取值的数量)有关,SST:,SSA:,SSE;,自由度:,2.单因素方差分析的步骤,均方也(均方差),:消除自由度对各离差平方和的影响,组间均方MSA,:,组内均方MSE,:,检验统计量,当H,0,为真时,:,2.单因素方差分析的步骤,(,3,)给定显著性水平,进行统计决策,在给定著性水平下,通过查表可以得到F(m-1,n-m)的临界值,给出拒绝域(小概率原理),:,当落入拒绝域说明小概率事件一次抽样发生了,则有理由拒绝原假设H,0,当没有落入拒绝域说明小概率事件没有发生,则不拒绝原假设H,0,P值检验规则,对于给定的显著性水平,当P时,不拒绝原假设H,0,。,2.单因素方差分析的步骤,第七章,方差分析,单因素方差分析表:,方差来源,离差平方和,SS,自由度,df,均方,MS,检验统计量,F,P,值,F,临界值,组间,SSA,m-1,组内,SSE,n-m,合计,SST,n-1,2.单因素方差分析的步骤,第七章,方差分析,例,7-2,(,1,)提出假设:,(,2,)计算均值:,(,3,)计算SSA和SSE:,2.单因素方差分析的步骤,第七章,方差分析,(,4,)计算检验统计量:,即可得到单因素方差分析表:,方差来源,离差平方和,SS,自由度,df,均方,MS,检验统计量,F,P,值,F,临界值,组间,29.61,2,14.80,11.756,0.000849,3.682,组内,18.89,15,1.259,合计,48.5,17,2.单因素方差分析的步骤,第七章,方差分析,(,5,)统计决策,:,临界值规则,由显著性水平=,0.05,,通过F分布表可以查到 ,,所以应该拒绝原假设,即认为不同层次的管理者满意度评分之间是存在显著差异的。P值规则,由于P=0.000849,同样拒绝不同层次的管理者满意度评分都相等的原假设。,2.单因素方差分析的步骤,第七章,方差分析,3,.,单因素方差分析中的多重比较,统计上把通过对总体均值之间的配对比较来进一步检验哪些均值间存在差异的方法称为多重比较,多重比较的方法有许多种,它们的核心问题是如何控制犯类错误的大小,我们这里介绍由费尔希提出的最小显著差异方法LSD,统计决策中拒绝原假设时,只能得出各总体均值之间不完全相等的结论,但这并不意味着所有总体的均值均不相等,接下来往往还需要对各总体的均值进行两两比较,回答多个总体均值中究竟哪些存在显著差异。,第七章,方差分析,LSD法操作的步骤:,第1步:提出假设:,第2步:计算检验统计量:,第3步:计算最小显著差数LSD,计算公式为:,式中为 分布的临界值,可以由t分布表得到,其自由度为组内平方和的自由度n-m;MSE为组内方差;,、分别是第i个和第j个水平观测值的数量。,3,.,单因素方差分析中的多重比较,第七章,方差分析,第4步:根据显著性水平做出统计决策:,如果 ,则拒绝,H,0,;,如果 ,则不拒绝,H,0,。,由以上可知,LSD法实质上只是检验的一个简单变形,它是将t检验中所求得的t的绝对值与临界值值 的比较转为将各对均数差值的绝对值 与最小显著差数LSD的比较做出统计推断的,但是它用了全部观测值,而非仅使用某两组的数据。,3,.,单因素方差分析中的多重比较,第七章,方差分析,例,7-4,(,1,)提出假设,:,检验1:,检验2:,检验3:,检验4:,检验5:,检验6:,3,.,单因素方差分析中的多重比较,第七章,方差分析,(,2,)计算检验统计量,:,3,.,单因素方差分析中的多重比较,第七章,方差分析,(,3,)计算LSD:,根据单因素方差分析表,MSE=0.0667。四种储存方法的样本量相同,则6个检验的LSD相等。根据自由度n-m=20,查t分布表得 。所以可得:,4.,统计决策:,此时应拒绝原假设,认为第一种储存方法和第二种储存方法的含水率有显著差异。,3,.,单因素方差分析中的多重比较,第七章,方差分析,此时应拒绝原假设,认为第一种储存方法和第三种储存方法的含水率有显著差异。,此时不能拒绝原假设,认为第一种储存方法和第四种储存方法的含水率没有显著差异。,此时不能拒绝原假设,认为第二种储存方法和第三种储存方法的含水率没有显著差异。,此时应拒绝原假设,认为第二种储存方法和第四种储存方法的含水率有显著差异。,此时应拒绝原假设,认为第三种储存方法和第四种储存方法的含水率有显著差异。,3,.,单因素方差分析中的多重比较,第七章,方差分析,4,.,Excel操作,Excel,操作,在Excel中进行单因素方差分析的方法,第七章,方差分析,第三节,双因素方差分析,学习要点,1,.,双因素方差分析应用,的,背景及类型,2,.,无交互作用的双因素方差分析,3.,Excel操作,第七章,方差分析,如果两个目标因素对观测变量的影响是独立的,此类的双因素方差分析称为无交互作用的双因素方差分析,或无重复因素的方差分析;,如果两个目标因素不同水平的搭配对观测变量的影响显著不同,则说明两目标因素是不独立的,两者会彼此影响从而对观测变量产生交互作用,此类双因素方差分析称为有交互作用的双因素方差分析,或可重复双因素方差分析,.,1,.,双因素方差分析应用,的,背景及类型,38/65,第七章,方差分析,2,.,无交互作用的双因素方差分析,(,1,)数据结构,双因素方差分析有两个目标因素,数据结构需要将一个因素安排在行的位置,称为行因素,;,另一个安排在列的位置,称为列因素。,第七章,方差分析,无交互作用双因素方差分析的数据结构,这,n,个总体中的每一个总体均服从正态分布,且具有相同的方差,这是进行双因素方差分析的,基本假定,样本容量,n=mk,行平均值 表示行因素的第i个水平下各观测值的平均值:,列平均值 表示列因素的第j个水平下各观测值的平均值:,是全部样本数据的总均值:,2,.,无交互作用的双因素方差分析,(,2,)分析步骤,提出假设,对行因素提出假设:,对列因素提出假设:,第,7,章,方差检验,2,.,无交互作用的双因素方差分析,第七章,方差分析,计算检验统计量,离差平方和,列因素A产生的:,行因素B产生的:,自由度,均方,2,.,无交互作用的双因素方差分析,随机因数产生的:,总离差平方和SST:,2,.,无交互作用的双因素方差分析,检验统计量,无交互作用双因素方差分析对应两个F检验统计量。,A因素对观测变量影响显著性的检验统计量为:,B因素对观测变量影响显著性的检验统计量为:,2,.,无交互作用的双因素方差分析,统计决策,当 落入拒绝域,拒绝原假设H,0,说明A因素对观变量有显著影响。否则,不拒绝原假设,认为A因素对观测变量没有显著影响。,当 落入拒绝域,拒绝原假设H,0,说明A因素对观变量有显著影响。否则,不拒绝原假设,认为A因素对观测变量没有显著影响。,利用P值进行决策时,如果F,A,的概率P值小于显著性水平,则拒绝原假设,认为A因素对观测变量具有显著影响,反之拒绝。,B,因数同理。,第,7,章,方差分析,2,.,无交互作用的双因素方差分析,第七章,方差分析,第,7,章,方差分析,误差来源,离差平方和,SS,自由度,df,均方,MS,F,P,值,F,临界值,因素,A,SSA,m-1,因素,B,SSB,k-1,随机因素,SSE,n-m-k-1,合计,SST,n-1,无交互作用的双因素方差分析表,2,.,无交互作用的双因素方差分析,第七章,方差分析,例,7-6,提出假设,因素,A,:,因素,B,:,计算检验统计量,因素A:,第,7,章,方差分析,2,.,无交互作用的双因素方差分析,第七章,方差分析,因素B:,总离差平方和SST:,随机因数:,2,.,无交互作用的双因素方差分析,第七章,方差分析,检验统计量,误差来源,离差平方和,SS,自由度,df,均方,MS,F,P,值,F,临界值,因素,A,298.8,4,74.4,3.83070,0.031324,3.259167,因素,B,111,3,37,1.897426,0.183889,3.490295,随机因素,236,12,19.5,合计,643.8,19,不同包装方式和地区销售量的双因素方差分析表,:,第,7,章,方差分析,2,.,无交互作用的双因素方差分析,第七章,方差分析,对于因素A,因为 ,所以应拒绝H,0,,即认为不同包装方式对销售量有显著影响;如果用P值决策,检验的P=0.0313240.05,同样不拒绝原假设。,统计决策:,显著性水平,=0.05,时,查F分布表可得:,第,7,章,方差分析,2,.,无交互作用的双因素方差分析,第七章,方差分析,3.,Excel操作,Excel,操作,Excel中进行无交互作用的双因素方差分析的方法。,第七章,方差分析,第七章,要点回顾,
展开阅读全文