《试验统计学》第7章方差分析⑵.ppt

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,试验统计学,第四章概率论与数理统计的基础知识,本课程使用区靖祥编,著的,试验统计学,一书作为课本。全程,为,50,学时，占,2.5,学分。,第二章常用的试验设计,第三章试验数据的整理,第五章参数区间估计,第八章常用试验设计的资料分析,第六章统计假设测验,第七章方差分析,第九章直线相关与回归,第一章绪论,第十章协方差分析,第二节处理平均数间的多重比较,第一节方差分析的基本原理,第三节方差分量的估计,第七章方差分析,第四节单向分类资料的方差分析,第五节两向分类资料的方差分析,第六节系统分组资料的方差分析,第七节方差分析的基本假设和数据转换,方差分析的思路,试验数据的总变异,:,SS,T,和,df,T,可控因素,1,引起的变异,:,SS,1,和,df,1,剩余的变异,(,残差或误差,):,SS,e,和,df,e,+,分解,可控因素,2,引起的变异,:,SS,2,和,df,2,+,+,如果处理效应是,固定模型,并且处理间差异显著，可采,用多重比较来了解到底是哪两个品种之间有显著差异。,我们只拟介绍多重比较的三种方法：,一、,最小显著差数法（,LSD,法或,t,测验法）,三、,最小显著极差法之二（新复极差法或,Duncan,法）,二、,最小显著极差法之一（复极差法或,q,测验法）,第二节,处理平均数间的多重比较,选择多重比较方法的原则,其它多重比较结果的表示方法,(,L,east,S,ignificant,D,ifference),一、,最小显著差数法（,LSD,法或,t,测验法）,第二节,处理平均数间的多重比较,把第六章中的,t,测验法稍微改一改。例如，如果共有,A、B、C、D,四组处理，则有,k,（,k,1）/24(4,1)/26,对比较，它们分别是：,H,0,:,A,B,vs H,A,:,A,B,用与,t,0.05,比较,H,0,:,A,C,vs H,A,:,A,C,用与,t,0.05,比较,H,0,:,A,D,vs H,A,:,A,D,用与,t,0.05,比较,H,0,:,B,C,vs H,A,:,B,C,用与,t,0.05,比较,H,0,:,B,D,vs H,A,:,B,D,用与,t,0.05,比较,H,0,:,C,D,vs H,A,:,C,D,用与,t,0.05,比较,在上一章的两两比较中，各自的,t,用各自的计算。,黄成达编制,由于所有这些都是相应的总体方差的估计值。而在方差分析中，我们曾假定过所有亚总体的都相等，并且都等于,2,，因此，在多处理的试验中，将所有组的组内差异合并平均将是更好的误差估计。,即用代替各个进行计算。,当,n,i,n,j,n,时,，,用计算，称标准误差，记为,SE,。,其中的,MS,e,为方差分析表中的误差均方，,n,为计算每个,平均数所用到的观察值个数。,于是，这六对比较便成为：,黄成达编制,黄成达编制,判别规则变成：当时差异显著。,为方便，将上式改写为当时差异显著。,记，。,将所有处理按平均数从大到小排列，计算出各对比较的平均数之差，将所有这些比较列成一个梯形表，如,表7.5,所示。再与,LSD,0.05,、,LSD,0.01,比较，就可以很方便地知道那一对差异显著了。,表,7.5,例,7.1,的多重比较梯形表（,LSD,法）,处理名称,平均数,D,9.5,6.5,*,4.5,*,1.5,B,8.0,5.0,*,3.0,*,C,5.0,2.0,A,3.0,本例中，,MS,e,2.5，,n,3，,，,df,e,8,时，,t,0.05,2.306，,t,0.01,3.355，,于是：,，,也许你,会认为，既然最后还是要做,t,测验，开始的时候何必做方差分析,F,测验呢？理由是：,在有多个处理时，由合并的组内均方估计误差，比只用两个样本的信息对误差进行估计要准确些；,如果,6,个,t,测验都要求有95%的可靠性，即,0.05。那么整个试验中，出现判错的概率就变成了,10.95,6,0.2649。即尽管对各个测验的显著水准为,0.05，但整个试验总的可靠性降低了(10.26490.7351)，或者说犯第类错误的可能性（概率）增加了。,因此，要在,F,测验显著后才进行,多重比较，以保证不会出现太大的,第类错误。这一规则称为费雪氏,保护(,Fisher,s protection)。,为了减少第,I,类错误，,人们便去寻找其它多重,比较的方法,。,Student,、,Newman,和,Keul,发现当只有两个平均数进行比较的,时候，,t,测验法的结果还是比较理想的，只是当这两个平均,数之间插入了另一些平均数的时候，就容易犯第,I,类错误，,因此，他们提出对于间隔不同的平均数采用不同的比较标,准，那就是,最小显著极差法,的基本思路。,第二节,处理平均数间的多重比较,q,测验法,（或称,SNK,测验或,NK,测验）是最小显著极差,法之一，其具体做法是：,利用方差分析表中的误差均方计算试验的标准误差,SE,，,注意,方根号内的分子部分只有,MS,e,！,分母则与,LSD,法一,样，,n,为计算各个平均数时用到的观察值数目；,从附表8查出,g,等于2,k,的,q,0.05,和,q,0.01,值。乘上,SE,计算出,判别标准：,LSR,0.05,q,0.05,SE,和,LSR,0.01,q,0.01,SE,。,做一个样本平均数差数的梯形表，将样本间的平均数,差数与,相应,g,值,的,LSR,0.05,和,LSR,0.05,值比较。,本例中，,MS,e,2.5，,n,3，,黄成达编制,5.66,5.14,4.33,LSR,0.01,6.2,5.63,4.74,q,0.01,4.14,3.69,2.97,LSR,0.05,4.53,4.04,3.26,q,0.05,4,3,2,g,4,3,2,g,作比较的判别标准,用,df,8,查得的,q,值,减少了第,I,类错误，,又可能增加了犯第,II,类错误的概率。,黄成达编制,3.0,A,2.0,5.0,C,3.0,*,5.0,*,8.0,B,1.5,4.5,*,6.5,*,9.5,D,平均数,处理名称,表,7.5,例,7.1,的多重比较梯形表（,q,测验,法）,第二节,处理平均数间的多重比较,Duncan,提出了一种新的比较标准，用它进行多重比较，犯,两类统计错误的可能性均居于前述两种方法之间。它的具,体做法与,q,测验法一模一样，只是用一张,Duncan,氏的,SSR,表,代替,q,表。,本例中，,MS,e,2.5，,n,3，,黄成达编制,4.69,4.56,4.33,LSR,0.01,5.14,5.00,4.74,SSR,0.01,3.16,3.09,2.97,LSR,0.05,3.47,3.39,3.26,SSR,0.05,4,3,2,g,4,3,2,g,作比较的判别标准,用,df,8,查得的,SSR,值,黄成达编制,3.0,A,2.0,5.0,C,3.0,*,5.0,*,8.0,B,1.5,4.5,*,6.5,*,9.5,D,平均数,处理名称,表,7.5,例,7.1,的多重比较梯形表（,Duncan,测验,法）,黄成达编制,4.69,4.56,4.33,LSR,0.01,3.16,3.09,2.97,LSR,0.05,4,3,2,g,作比较的判别标准,黄成达编制,5.66,5.14,4.33,LSR,0.01,4.14,3.69,2.97,LSR,0.05,4,3,2,g,作比较的判别标准,第二节,处理平均数间的多重比较,现在把三种多重比较的判别标准列出来比较一下：,LSD,法：,LSD,0.05,2.97,，,LSD,0.01,4.33,q,测验法：,Duncan,法：,可以看到：当,g,2,时三种判别是一样的；但,g,2,时,LSD,的判别标准最小；,Duncan,法的判别标准居中；,Q,测验的判别标准最高，即最难推翻,H,0,。,现在把三种多重比较的比较结果列出来比较一下：,第二节,处理平均数间的多重比较,3.0,A,2.0,5.0,C,3.0,*,5.0,*,8.0,B,1.5,4.5,*,6.5,*,9.5,D,平均数,处理名称,表,7.5,例,7.1,的多重比较梯形表（,LSD,法）,黄成达编制,3.0,A,2.0,5.0,C,3.0,*,5.0,*,8.0,B,1.5,4.5,*,6.5,*,9.5,D,平均数,处理名称,表,7.5,例,7.1,的多重比较梯形表（,q,测验,法）,黄成达编制,3.0,A,2.0,5.0,C,3.0,*,5.0,*,8.0,B,1.5,4.5,*,6.5,*,9.5,D,平均数,处理名称,表,7.5,例,7.1,的多重比较梯形表（,Duncan,测验,法）,事实上，对于一个具体的试验资料，选用那种方法进行多重比较，是完全根据试验的目的而定的。,第二节,处理平均数间的多重比较,比方:,发展少先队员时，应采用,LSD,法；,发展,共青团员,时,，可以采用,Duncan,测验法；,发展,共产党员时，应采用,q,测验法。,一般地说:,如果只要求把某些处理与试验中的对照处理进行,比较时，可采用,LSD,法；,进行高级筛选时，可考虑使用,q,测验法；,一般情况下，常采用,Duncan,法。,当处理数比较多时，用梯形表来表示多重比较的结果就可能要列出一个很宽的表格,k,个平均数的表为,(,k,+1)(,k,+1),。因此在一些特别的场合，如要从计算机的屏幕输出或从打印机输出分析结果时就会比较困难。这时就比较喜欢用另外的方法来表示多重比较的结果了。,第二节,处理平均数间的多重比较,这里介绍两种其它表示法，它们分别是：,标记字母法,划线,法,一、,标记字母法,第二节,处理平均数间的多重比较,具体做法是：将处理按平均数从大到小顺序排列，在最大的平均数以及与它没有显著差异的平均数上标上字母,a；,再在第一个与最大的平均数有显著差异的平均数以及与它没有显著差异的平均数上标上字母,b；,又在第一个与,b,组第一个平均数有显著差异的平均数以及与它没有显著差异的平均数上标上字母,c；,如此直到把全部平均数标记完毕为止。,例7.1用,Duncan,法的比较结果,黄成达编制,3.0,A,2.0,5.0,C,3.0,*,5.0,*,8.0,B,1.5,4.5,*,6.5,*,9.5,D,平均数,处理名称,表,7.5,例,7.1,的多重比较梯形表（,Duncan,测验,法）,黄成达编制,4.69,4.56,4.33,LSR,0.01,3.16,3.09,2.97,LSR,0.05,4,3,2,g,作比较的判别标准,标记字母法,（,Duncan,测验,）,处理,平均数,差异显著性,=0.05,=0.01,D,9.5,B,8.0,C,5.0,A,3.0,a,a,b,b,A,A,A,B,B,再举一个标记字母法的例子。,处理代号,处理平均数,差异显著性,=0.05,=0.0,1,E,14.2,B,12.4,G,11.9,H,11.6,C,11.4,F,9.8,A,9.1,D,8.3,a,a,a,b,将平均数从大到小排列,b,b,b,c,c,c,c,d,d,d,e,e,e,A,A,A,A,A,B,B,B,B,B,B,C,C,C,C,C,Duncan,法：,作比较的判别标准,g,2,3,4,5,6,7,8,LSR,0.05,2.24,2.35,2.42,2.46,2.49,2.51,2.52,LSR,0.01,3.12,3.27,3.37,3.43,3.48,3.54,3.57,标示结果的理解：凡是两个平均数之间标记有,相同的字母,，则表示它们之间,差异不显著,；如果是标记的字母,全部不相同,，则表示它们之间,差异显著,。,处理代号,处理平均数,差异显著性,=0.05,=0.01,A,9.1,de,BC,B,12.4,ab,AB,C,11.4,bcd,ABC,D,8.3,e,C,E,14.2,a,A,F,9.8,cde,BC,G,11.9,abc,AB,H,11.6,bc,ABC,处理代号,A,B,C,D,E,F,G,H,处理平均数,9.1,de,12.4,ab,11.4,bcd,8.3,e,14.2,a,9.8,cde,11.9,abc,11.6,bc,二、,划线法,第二节,处理平均数间的多重比较,具体做法是：将处理按平均数从大到小顺序排列，以第一个平均数为标准与以后各平均数比较，凡差异不显著的平均数用横线联起来；依次以第2,3,，,k,1,个平均数为标准作同样表示。,例7.1用,Duncan,法的比较结果,0.05,时,9.5(,D)8(B)5(C)3(A),0.01,时,9.5(,D)8(B)5(C)3(A),将平均数从大到小排列,黄成达编制,4.69,4.56,4.33,LSR,0.01,3.16,3.09,2.97,LSR,0.05,4,3,2,g,作比较的判别标准,黄成达编制,3.0,A,2.0,5.0,C,3.0,*,5.0,*,8.0,B,1.5,4.5,*,6.5,*,9.5,D,平均数,处理名称,表,7.5,例,7.1,的多重比较梯形表（,Duncan,测验,法）,处理代号,E,B,G,H,C,F,A,D,处理平均数,14.2,12.4,11.9,11.6,11.4,9.8,9.1,8.3,将平均数从大到小排列,再举一例。,Duncan,法：,作比较的判别标准,g,2,3,4,5,6,7,8,LSR,0.05,2.24,2.35,2.42,2.46,2.49,2.51,2.52,LSR,0.01,3.12,3.27,3.37,3.43,3.48,3.54,3.57,标示结果的理解：凡是两个平均数之间有,相同水平的线连在一起,，则表示它们之间,差异不显著,；如果是,没有相同水平的线连在一起,，则表示它们之间,差异显著,。,二、,组内观察值数目不等的单向分类资料,单向分类资料,(,one-way classifications),是指那些只含有一个可控因素的资料。通常这个可控因素也就是考察因素。,根据具体的数据结构又分为两种情况：,第四节单向分类资料的方差分析,一、,组内观察值数目相等的单向分类资料,二、,每处理组合内有多于一个观察值的两向分类资料,两向分类资料,(,two-way classifications),是指那些含有两个可控因素的资料。根据具体的数据结构又分为两种情况：,第五节两向分类资料的方差分析,一、,每处理组合内只有一个观察值的两向分类资料,在动物学的试验中，由于每一个母本不可能同时与若干个父本交配，所以不能采用交叉式设计的杂交方式，转而使用另一种被称为,巢式设计,（,nested design）,的杂交方案。巢式设计的杂交方案以及相类似的试验设计所取得到数据资料称为,系统分组的资料,(,hierarchal classification),。,第六节系统分类资料的方差分析,本节介绍对最简单的系统分组的资料的统计分析,方法，这类资料为,组内又分亚组的单向分类资料,方差分析的三个基本假定：,第七节基本假设和数据转换,在结束本章之前，再稍微详细地讨论一下这些假定。,数据中的各种效应应该具有“,可加性,”；,所有处理应该具有相同的,误差方差,，即具有“,同质,性,”。,误差应该是“,随机、独立,”的，并且具有“,平均数为,0,、,方差为的正态分布,”；,方差分析的三个基本假定：,第七节基本假设和数据转换,那么，怎么样的数据是可加性的呢？,数据中的各种效应应该具有“,可加性,”；,线性可加模型是方差分析的基础，,只有当数据具有可加性时，总平方和才能分解为各项平方和之和,；并且,，,由于数据具有可加性，又必然导致各项效应之和为0，所有误差之和为0。,以单向分类资料为例，因为数学模型为：，,因此才有：和，即,SS,T,SS,t,SS,e,。,也因此有。此式左边为0，因此右边自然也应该等于0。于是有和。,表,7.63,可加性资料与非可加性资料的比较,(,a,),可加性资料,(,b,),倍加性资料,(,c,),对倍加性资料取对数后,处理,分组,处理,分组,处理,分组,1,2,1,2,1,2,A,10,20,A,10,20,A,1.00,1.30,B,30,40,B,30,60,B,1.48,1.78,方差分析的三个基本假定：,第七节基本假设和数据转换,误差应该是“,随机、独立,”的，并且具有“,平均数为,0,、,方差为的,正态分布,”；,首先,，,在数学模型中的误差效应必须是随机的,，因为数据中的,k,个处理仅仅是从所研究的,k,个总体中随机抽取出来的,k,个样本，而,F,测验正是通过样本统计量对总体参数进行判断的手段。,其次,，在观察这个个体时的,误差,与观察另一个个体时的,误差应该是无关,的，即误差彼此之间是相互独立的。,前面已讨论过，计算,F,值的,两个方差，所来自的（亚）总体应该是,正态,分布的,。,方差分析的三个基本假定：,第七节基本假设和数据转换,因为在方差分布中将,k,个样本的“组内平方和”和“组内自由度”合并为整个试验的“组内平方和”和“组内自由度”，并利用它们算出的“组内均方”来估计试验误差，其前提必须是各处理的方差是相等的，,不相等怎么能合并呢？,资料中各组的方差是否相等可以通过,Bartlett,卡方测验,来检验。,所有处理应该具有相同的误差方差，即具有“,同质性,”。,当,试验资料不符合上述假定时要先对数据进行一些适当的处理，然后用经过处理的数据进行方差分析。,第七节基本假设和数据转换,常用的数据变换方法有四种，分别适用下述的四种情况：,剔除一些表现“特殊”的观察值、处理或重复。,用同一个体或小区的重复观察值的平均数进行方差,分析。,对需要分析的资料进行研究，了解它们不符合哪个,基本假定，然后针对性地采用下述数据转换方法中,的一种，先对数据进行某种尺度变换，用经变换的,数据进行方差分析(及多重比较)，而在对分析结果,进行解释时，再反代换为原来的尺度。,第七节基本假设和数据转换,当数据的时，各观察值的方差近似与其平,均数成比例关系：即平均数越大，方差越大。这时,宜采用平方根转换,，,即,当有部分观察值小于,10,时，采用公式：,或,服从,泊松分布,的计数资料宜采用这种转换。通常认为计数资料，如每一个显微镜视野中的细菌数、每土方中的昆虫幼蛹数等，都服从泊松分布。,第七节基本假设和数据转换,服从,二项分布的百分数,资料宜采用这种变换。例如昆虫死亡率、产品合格率、种子发芽率等都属于这种资料。请注意上式方根号内,x,ijk,是百分数，例如当,x,ijk,75.5%,时，,x,ijk,60.33。,当数据的时，宜采用反正弦转换,，,即。,有些百分率不是用计数数据换算得到的，而是用度量数据换算得到的，如玉米种子中的蛋白质含量、花生油中的不饱和脂肪酸含量等，不应当作离散性随机变量看待。不必要采用反正弦代换。,第七节基本假设和数据转换,当资料,不近似服从正态分布,或资料,不接近于加性,模型时，宜采用这种转换。,当数据的时，各观察值的方差近似与其,平均数的平方成比例关系。这种资料宜采用对数转,换。即,当有部分数据小于,10,时，采用公式：,第七节基本假设和数据转换,当数据的时，各观察值的标准差近似与其,平均数的平方成比例关系。这种资料宜采用倒数转,换,，,即，,当有部分数据小于,10,时，采用公,式,。,第七节基本假设和数据转换,如果能事先把您的离散型数据的各处理平均数和方差计算出来，看看它们之间的关系，就可以很容易地决定采用何种尺度变换方法。如果无法决定那种变换更加合适时，可以只变换少数几种处理的数据（这种处理的原数据最好能包括有大、中、小的数字），然后再看看经变换的数据的平均数与方差间有没有上述的关联性，这些关联性最小的那一种变换往往就是最好的变换方法。,例7.14,五个病人在三种不同室温下淋巴细胞,玫瑰花簇,形成率（按200个淋巴细胞计算）如,表7.64,所示。试测验不同室温下这种形成率之间是否有显著差异。,黄成达编制,黄成达编制,31.2,55.2,35.4,15.0,55.5,34.5,5,16.0,65.5,34.5,4,40.0,49.0,34.0,3,36.0,58.0,34.0,2,49.0,48.0,40.0,1,3037,o,C,2025,o,C,46,o,C,室温,病人编号,表,7.64,不同室温下淋巴细胞玫瑰花簇形成率（,%,）,黄成达编制,黄成达编制,黄成达编制,黄成达编制,46,o,C,5,4,3,2,1,病人编号,表,7.65,经反正弦代换后的数据,(,),33.3786,48.0143,36.5019,35.6382,22.7865,48.1577,35.9704,37.8594,23.5782,54.0296,35.9704,39.7757,39.2315,44.4270,35.6685,40.7140,36.8699,49.6034,35.6685,42.5041,44.4270,43.8538,39.2315,3037,o,C,2025,o,C,室温,黄成达编制,黄成达编制,黄成达编制,黄成达编制,1049.2238,14,总变异,46.3924,371.1391,8,误差,0.4523,20.9821,83.9283,4,病号间,8.6491,4.4590,6.4036,*,297.0782,594.1564,2,室温间,F,0.01,F,0.05,F,MS,SS,df,变异,表,7.6,6,例,7.14,的方差分析表,黄成达编制,15.2303,14.4383,5.00,4.74,3,10.3261,9.9302,3.39,3.26,2,LSR,0.01,LSR,0.05,SSR,0.01,SSR,0.05,g,表,7.67,查得的,SSR,值及各种,LSR,值的计算,表7.68,对不同室温的进行比较的梯形表,室温,33.3786,3037,o,C,3.1233,36.5019,46,o,C,11.5124,*,14.6357,*,48.0143,2025,o,C,平均数,黄成达编制,人类,T,淋巴细胞表面具有绵羊红细胞,(SRBC),的受体，故能与,SRBC,结合形成花环，目前常用,E,花环；目前常用,E,花环形成试验来检测,T,淋巴细胞数量，作为了解人体细胞免疫功能状态的指标之一，总,E,花环（,Et,）试验应用最广，反映,T,细胞活性的是活性花环试验,(Ea),。,E-,花环试验作为体外测定细胞免疫方法之一，其形成百分率下降是细胞免疫功能降低的反映，临床上已用于恶性肿瘤、白血病、自身免疫性疾病、免疫缺陷病、器官移植排斥反应等方面的研究，作为了解这些疾病患者机体细胞免疫状态、预后及疗效观察的指标。,T,淋巴细胞玫瑰花环：,左,.,（甲紫染色，,800),：可见,2,个被羊红细胞包围而形成玫瑰环的,T,淋巴细胞；,右,.,（吖啶橙染色）：图中可见,3,个染成橙黄色荧光的,T,淋巴细胞被羊红细胞所包围。,淋巴细胞玫瑰花环电镜照片,Class is Over,Thank You,一、组内观察值数目相等的单向分类资料,如果资料中含有,k,组数据，每组含,n,个观察值，全部共有,nk,个观察值。那么，此类资料观察值的数学模型为：,（,i,1,，,2,，,，,k,，,j,1,，,2,，,，,n,）,因此总变异分解为两大部分：,组间变异,和,组内变异,。方差分析表如表,7.14,所示。,黄成达编制,黄成达编制,df,T,nk,1,总变异,MS,e,df,e,k,(,n,1),误差,F,MS,t,/,MS,e,MS,t,df,t,k,1,组间,随机模型,固定模型,期望均方,(,EMS,),F,值,均方,平方和,自由度,变异,来源,表,7.14,组内观察值数目相等的单向分类资料的方差分析表,事实上，在前几节中所举的例子都是这种资料。这里，我们另举一个例子，并且把整个计算过程系统地陈述一遍。以后在各种不同试验设计的分析方法中，也都将按这样的方式进行陈述。,例,7.7,在一个塑料大棚内进行番茄无土栽培试验，全部采用同一品种，,5,种不同的培养液，每种培养液观察,4,株。试验指标为单株产量，结果如表,7.15,所示，如果培养液的效应为固定模型，试对,5,种培养液的效应进行显著性测验,。,数据整理：,黄成达编制,黄成达编制,黄成达编制,26,55200,13898,520,总和,20,6400,1622,80,21,16,22,21,E,31,15376,3868,124,27,33,33,31,D,28,12544,3154,112,30,25,27,30,C,24,9216,2318,96,26,21,24,25,B,27,11664,2936,108,26,28,30,24,A,观察值,培养液,表,7.15,番茄无土栽培试验的产量数据,平方和及自由度的分解：,总自由度,df,T,观察值总数,1,20,1,19,处理间自由度,df,t,处理数,1,5,1,4,误差自由度,df,e,df,T,df,t,19,4,15,矫正数,C.T.,总和平方观察值总数,52,0,2,/20,13520,总平方和,=,13898,-13520=378,总平方和,=,各观察值的平方之和,C.T.,处理间平方和,=55200/4-13520=280,误差平方和 ,378,280,98,误差平方和,=,总平方和,各项已知因素的平方和,将各项自由度和平方和填入方差分析表。,黄成达编制,378,19,总变异,6.533,98,15,误差,4.89,3.06,10.72,*,70,280,4,处理间,F,0.01,F,0.05,F,均方,平方和,自由度,变异来源,表,7.16,例,7.7,的方差分析表,多重比较（以,Duncan,法为例）：,计算标准误：,其中,MSe,为方差分析表中的误差均方；,n,是计算所比较的平均数时用到的观察值数目。,查表并计算各种,LSR,值（误差自由度,df,e,=15,）：,黄成达编制,5.85,4.23,4.58,3.31,5,5.75,4.15,4.50,3.25,4,5.58,4.04,4.37,3.16,3,5.32,3.85,4.17,3.01,2,LSR,0.01,LSR,0.05,SSR,0.01,SSR,0.05,g,表,7.17,查得的,SSR,值及各种,LSR,值的计算,3.,列梯形表进行比较：,黄成达编制,5.85,4.23,4.58,3.31,5,5.75,4.15,4.50,3.25,4,5.58,4.04,4.37,3.16,3,5.32,3.85,4.17,3.01,2,LSR,0.01,LSR,0.05,SSR,0.01,SSR,0.05,g,表,7.17,查得的,SSR,值及计算得到的,LSR,值,黄成达编制,黄成达编制,20,E,4,*,24,B,3,7,*,27,A,1,4,8,*,28,C,3,4,7,*,11,*,31,D,平均数,处理,表,7.18,多重比较的梯形表,作统计推断：,黄成达编制,黄成达编制,20,E,4,*,24,B,3,7,*,27,A,1,4,8,*,28,C,3,4,7,*,11,*,31,D,平均数,处理,表,7.18,多重比较的梯形表,培养液,D,与培养液,E,、,B,之间有显著差异,(,=0.01),；,培养液,C,、,A,与培养液,E,之间有显著差异,(,=0.01),；,培养液,B,与培养液,E,之间有显著差异,(,=0.05),；,。,其余各处理平均数之间没有显著差异。,二、组内观察值数目不等的单向分类资料,如果资料中含有,k,组数据，其中第,i,组含,n,i,个观察值，全部共有个观察值。此类资料观察值的数学模型为：,（,i,1,，,2,，,，,k,，,j,1,，,2,，,，,n,i,）,因此总变异分解为两大部分：,组间变异,和,组内变异,。方差分析表如表,7.19,所示,df,t,k,-1,黄成达编制,黄成达编制,黄成达编制,SS,T,df,T,总变异,MS,e,SS,e,df,e,误差,F,MS,t,/,MS,e,MS,t,SS,t,df,t,组间,随机模型,固定模型,期望均方,(,EMS,),F,值,MS,SS,df,变异,来源,表,7.19,组内观察值数目不等的单向分类资料的方差分析表,其中为各组样本含量的调和平均数，即,但是如果利用随机模型对进行估计，即,时，可能会出现方差估计值为负的奇怪现象。这时可以使用,代替进行计算。,各组内观察值数目相等的试验资料称为,平衡资料,；各组内观察值数目不等的试验资料称为,不平衡资料,。利用平衡资料所得到的参数估计值是无偏的，利用不平衡资料所得到的参数估计值不是无偏的。一般地说，如果是经过精心设计来安排试验的话，应尽可能安排平衡试验，避免采用不平衡试验设计。如果是进行一些野外调查，由于特殊条件的要求或限制，不得不采用不平衡设计时，仍应特别注意估计结果的有偏性。,例,7.8,调查四个水库中的氯离子浓度，按水库的水面面积大小取不同数目的样本。数据如表,7.20,所示，如果各水库的效应为固定模型，试测验各水库间氯离子的浓度之间是否有显著差异。,表,7.20,四个水库氯离子浓度的数据资料,水库,观察值,12,13,14,15,14,16,14,9,10,8,8,9,10,9,9,2,10,11,12,13,12,11,14,10,11,12,13,12,黄成达编制,黄成达编制,3603,3711,313,28,总和,12,864,874,72,6,10,800,884,80,8,9,567,571,63,7,14,1372,1382,98,7,n,i,水库,表,7.20,四个水库氯离子浓度的数据资料的整理,数据处理：,平方和及自由度的分解：,总自由度,df,T,=,观察值总数,1=28 1=27,处理间自由度,df,t,=,处理数,1=4 1=3,误差自由度,df,e,=,df,T,df,t,=27 3=24,矫正数,C.T.,=,总和平方,/,观察值总数,=313,2,/28=3498.8929,总平方和,=3711,3498.8929=212.1071,处理间平方和,3603,3498.8929,104.1071,误差平方和,=212.1071,104.1071=108,列方差分析表：,表,7.21,例,7.8,的方差分析表,变因,自由度,平方和,均方,F,F,0.05,F,0.01,处理间,3,104.1071,34.7024,7.712,*,3.01,4.72,误差,24,108.0000,4.5000,总变异,27,212.1071,多重比较（以,Duncan,法为例）：,先计算样本容量的调和平均数或：,计算标准误：,表,7.22,查得的,SSR,值及各种,LSR,值的计算,g,SSR,0.05,SSR,0.01,LSR,0.05,LSR,0.01,2,2.92,3.96,2.353,3.192,3,3.07,4.11,2.474,3.337,4,3.15,4.24,2.539,3.417,查表并计算各种,LSR,值（误差自由度,df,e,=24,）如表,7.22,所示：,a.,第,号水库与第,、,号水库的氯离子浓度有极显著差异；,b.,第,号水库与第,号水库的氯离子浓度有显著差异；,c.,其余各水库的氯离子浓度之间没有显著差异。,列梯形表进行比较：,黄成达编制,黄成达编制,黄成达编制,9,1,10,2,3,*,12,2,4,*,5,*,14,平均数,处理,表,7.23,例,7.8,的多重比较梯形表,作统计推断：,一、每处理组合内只有一个观察值的两向分类资料,如果资料中有两个可控因素,A,和,B,，其中,A,有,a,个水平，,B,有,b,个水平，于是共有,ab,个处理组合。每个处理组合含,1,个观察值，全部共有,ab,个观察值。为了陈述上的方便，将数据结构列出如表,7.24,所示。,其中处理组合,A,i,B,j,的观察值记为,x,ij,；第,i,个,A,水平的观察值之和及平均数分别记为，第,j,个,B,水平的观察值之和及平均数分别记为，全部观察值的总和及平均数分别记为,黄成达编制,黄成达编制,黄成达编制,黄成达编制,黄成达编制,x,ab,x,aj,x,a,2,x,a,1,A,a,x,ib,x,ij,x,i,2,x,i,1,A,i,x,2,b,x,2,j,x,22,x,21,A,2,x,1,b,x,1,j,x,12,x,11,A,1,B,b,B,j,B,2,B,1,B,因素,(,j,),A,因素,(,i,),表,7.24,每处理组合只含一个观察值的两向分类资料,此类资料观察值的数学模型为：,(,i,1,，,2,，,，,a,；,j,1,，,2,，,，,b,),因此总变异分解为三大部分：,A,因素各水平间的变异,B,因素各水平间的变异,剩余的变异,(,即误差变异,),。,方差分析表如表,7.25,所示。,表,7.25,每处理组合内只有一个观察值的,两向分类资料的方差分析表,变异,来源,自由度,平方和,均方,期望均方,(,EMS,),固定模型,随机模型,混合模型,A,间,df,A,SS,A,MS,A,B,间,df,B,SS,B,MS,B,误差,Df,e,SS,e,MS,e,总变异,df,T,SS,T,df,A,a,1,df,B,b,1,df,e,(,a,1)(,b,1),df,T,ab,1,表中列出了固定模型和随机模型的期望均方，如果两个处理效应中有一个,(,如,A),为固定，另一个,(,如,B),为随机，则其模型称为,(A,固定,B,随机的,),混合模型,(mixed model),。对各效应进行,F,测验时采用的,F,值计算公式应视各项均方的期望值而定，例如在固定模型中，测验,A,间差异时，,F,MS,A,/,MS,e,，测验,A,间差异时，,F,MS,B,/,MS,e,。,例,7.9,六个水稻品种,(A,1,、,A,2,、,A,3,、,A,4,、,A,5,和,A,6,),栽植在四种不同的土壤类型,(B,1,、,B,2,、,B,3,和,B,4,),中，产量数据如表,7.26,所示，如果品种和土壤类型都是固定效应，试对资料进行适当的分析。,黄成达编制,黄成达编制,黄成达编制,63,61.5,63.0,65.0,62.5,1512,369,378,390,375,62.50,63.25,63.50,61.75,66.25,60.75,250,253,254,247,265,243,表,7.26,例,7.9,的产量资料及数据整理,59,62,65,64,A,6,64,62,65,62,A,5,61,62,67,64,A,4,60,63,64,60,A,3,65,68,67,65,A,2,60,61,62,60,A,1,B,4,B,3,B,2,B,1,土壤类型（,B,）,品种,（,A,）,数据处理：如表,7.26,所示,平方和及自由度的分解：,总自由度,df,T,=,观察值总数,1=24 1=23,品种间自由度,df,A,=,品种数,1=6 1=5,土壤类型间自由度,df,B,=,土壤类型数,1,=4 1=3,误差自由度,df,e,=,df,T,df,A,df,B,=23 5 3=15,误差平方和,=1427139=32,列方差分析表：,变异来源,自由度,平方和,均方,F,F,0.05,F,0.01,品种间,5,71,14.200,6.656,*,2.901,4.556,土壤类型间,3,39,13.000,6.094,*,3.287,5.417,误差,15,32,2.133,总变异,23,142,表,7.27,例,7.9,的方差分析表,统计推断：,品种间差异极显著；土壤类型间差异也极显著。,多重比较,在本例中，品种和土

展开阅读全文