资源描述
方差分析原理
精品资料
第六章 方差分析
第一节 方差分析的基本原理
上章介绍了1个或两个样本平均数的假设测验方法。本章将介绍k(k≥3)个样本平均数的假设测验方法,即方差分析(analysis of variance)。方差分析就是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。其中,扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计,作为假设测验的依据。因而,方差分析象上章的t测验一样也是通过将试验处理的表面效应与其误差的比较来进行统计推断的,只不过这里采用均方来度量试验处理产生的变异和误差引起的变异而已。方差分析是科学的试验设计和分析中的一个十分重要的工具。本章将在介绍方差分析基本原理和方法的基础上进一步介绍数学模型和基本假定。
一、自由度和平方和的分解
方差是平方和除以自由度的商。要将一个试验资料的总变异分解为各个变异来源的相应变异,首先必须将总自由度和总平方和分解为各个变异来源的相应部分。因此,自由度和平方和的分解是方差分析的第一步。下面先从简单的类型说起。设有k组数据,每组皆具n个观察值,则该资料共有nk个观察值,其数据分组如表6.1。
表6.1 每组具n个观察值的k组数据的符号表
组别
观察值(,i=1,2,…,k;j=1,2,…,n)
总和
平均
均方
1
…
…
2
…
…
…
…
i
…
…
…
…
k
…
…
在表6.1中,总变异是nk个观察值的变异,故其自由度,而其平方和则为:
(6·1)
(6·1)中的C称为矫正数:
(6·2)
这里,可通过总变异的恒等变换来阐明总变异的构成。对于第i组的变异,有
总变异为第1,2,…,k组的变异相加,利用上式总变异(6·1)可以剖分为:
(6·3)
即 总平方和=组内(误差)平方和+处理平方和
组间变异由k个的变异引起,故其自由度,组间平方和为:
(6·4)
组内变异为各组内观察值与组平均数的变异,故每组具有自由度和平方和;而资料共有组,故组内自由度,组内平方和为:
(6·5)
因此,得到表6.1类型资料的自由度分解式为:
(6·6)
总自由度DFT=组间自由度DFt+组内自由度DFe
求得各变异来源的自由度和平方和后,进而可得:
(6·7)
若假定组间平均数差异不显著(或处理无效)时,(6·7)中与是的两个独立估值,均方用表示,也用表示,两者可以互换。其中组内均方也称误差均方,它是由多个总体或处理所提供的组内变异(或误差)的平均值。
[例6.1] 以A、B、C、D 4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),其结果如表6.2,试分解其自由度和平方和。
表6.2 水稻不同药剂处理的苗高(cm)
药 剂
苗高观察值
总和
平均
A
18 21 20 13
72
18
B
20 24 26 22
92
23
C
10 15 17 14
56
14
D
28 27 29 32
116
29
T=336
21
根据(6·6)进行总自由度的剖分:
总变异自由度DFT=(nk-1)=(4´4)-1=15
药剂间自由度DFt=(k-1)=4-1=3
药剂内自由度DFe=k(n-1)=4´(4-1)=12
根据(6·3)进行总平方和的剖分:
或
或 药剂A内:
药剂B内:
药剂C内:
药剂D内:
所以
误差平方和也可直接计算。
进而可得均方:
以上药剂内均方系4种药剂内变异的合并均方值,它是表6.2资料的试验误差估计;药剂间均方,则是不同药剂对苗高效应的变异。
二、F分布与F测验
在一个平均数为、方差为的正态总体中,随机抽取两个独立样本,分别求得其均方和,将和的比值定义为F:
(6·8)
此F值具有的自由度和的自由度。如果在给定的和下按上述方法从正态总体中进行一系列抽样,就可得到一系列的F值而作成一个F分布。统计理论的研究证明,F分布乃具有平均数=1和取值区间为[0,∞]的一组曲线;而某一特定曲线的形状则仅决定于参数和。在=1或=2时,F分布曲线是严重倾斜成反向J型;当≥3时,曲线转为偏态(图6.1)。
图6.1 F分布曲线(随和的不同而不同)
F分布下一定区间的概率可从已制成的统计表查出。附表5系各种和下右尾概率=0.05和=0.01时的临界F值(一尾概率表)。如查附表5,=3,=12时,F0.05=3.49,F0.01=5.95,即表示如以=3(n1=4)、=12(n2=13)在一正态总体中进行连续抽样,则所得F值大于3.49的概率仅有5%,而大于5.95的仅有1%。附表5的数值设计是专供测验的总体方差是否显著大于的总体方差而设计的(H0:≤对HA:>)。这时,。若所得F≥F0.05或≥F0.01,则H0发生的概率小于等于0.05或0.01,应该在=0.05或=0.01水平上否定H0,接受HA;若所得F<F0.05或F<F0.01,则H0发生的概率大于0.05或0.01,应接受H0。
在方差分析的体系中,F测验可用于检测某项变异因素的效应或方差是否真实存在。所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异(例如试验误差项)的均方作分母。这个问题与方差分析的模型和各项变异来源的期望均方有关,详情见后。在此测验中,如果作分子的均方小于作分母的均方,则F<1;此时不必查F表即可确定P>0.05,应接受H0。
F测验需具备:(1)变数y遵循正态分布N(,),(2)和彼此独立两个条件。当资料不符合这些条件时,需作适当转换,参见本章第六节。
[例6.2] 测定东方红3号小麦的蛋白质含量10次,得均方=1.621;测定农大139小麦的蛋白质含量5次,得均方=0.135。试测验东方红3号小麦蛋白质含量的变异是否比农大139为大。
假设H0:东方红小麦总体蛋白质含量的变异和农大139一样,即H0:=,对HA:>。显著水平取=0.05,=9,=4时,F0.05=6.00。
测验计算:
此F>F0.05,即P<0.05。
推断:否定H0,接受HA,即东方红3号小麦蛋白质含量的变异大于农大139。
以上这种比较两个事物变异大小的例子,在农业研究中是常常遇到的。例如比较杂种F2代和F1代的变异大小,比较两种处理的草坪冻害程度等等,这些比较皆可应用F测验,但都必须以大均方作分子而计算F值。
[例6.3] 在例6.1算得药剂间均方=168.00,药剂内均方=8.17,具自由度=3,=12。试测验药剂间变异是否显著大于药剂内变异?
假设H0:=对HA:>,显著水平取=0.05,F0.05=3.49。
测验计算:
计算得F=20.56表示处理项的均方为误差项均方的20.56倍。查附表5 =3,=12时F0.05=3.49,F0.01=5.95,实得F>F0.01>F0.05。
推断:否定H0:=,接受HA:>;即药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不同效应的。
以上通过例6.1说明了对一组处理的重复试验数据经对总平方和与总自由度的分解估计出处理间均方和处理内均方(误差均方),并通过测验处理间所表示出的差异是否真实(比误差大),这一方法即为方差分析法。这里所测验的统计假设是H0:=或对HA:>或、、和间存在差异(不一定、、和间均不等,可能部分不等)。例6.1和例6.3的分析结果可以归纳在一起,列出方差分析表,如表6.3所示。
表6.3 水稻药剂处理苗高方差分析表
变异来源
DF
SS
MS
F
显著F值
药剂处理间
3
504
168.00
20.56**
3.49
药剂处理内(误差)
12
98
8.17
5.95
总
15
602
第二节 多重比较
上节对一组试验数据通过平方和与自由度的分解,将所估计的处理均方与误差均方作比较,由F测验推论处理间有显著差异,对有些试验来说方差分析已算告一段落,但对有些试验来说,其目的不仅在于了解一组处理间总体上有无实质性差异,更在于了解哪些处理间存在真实差异,故需进一步做处理平均数间的比较。一个试验中k个处理平均数间可能有k(k-1)/2个比较,因而这种比较是复式比较亦称为多重比较(multiple comparisons)。通过方差分析后进行平均数间的多重比较,不同于处理间两两单独比较。因为(1)误差由多个处理内的变异合并估计,自由度增大了,因而比较的精确度也增大了;(2)由于F测验显著,证实处理间总体上有真实差异后再做两两平均数的比较,不大会像单独比较时那样将个别偶然性的差异误判为真实差异。这种在F测验基础上再做的平均数间多重比较称为Fisher氏保护下的多重比较(Fisher’s protected multiple comparisons)。显然在无F测验保护时,4个处理做两两比较,每一比较的显著水平,4个处理间有6个比较,若处理间总体上无差异,每一比较误判为有差异的概率为0.05,则6个比较中至少有1个被误判的概率为=。若处理数k=10,则=,因而尽管单个比较的显著水平为0.05,但从试验总体上(至少有1个误判的概率)是很大的,这说明通过F测验作保护是非常必要的。
多重比较有多种方法,本节将介绍常用的三种:最小显著差数法、复极差法( q法)和Duncan氏新复极差法。
一、最小显著差数法
最小显著差数法(least significant difference,简称LSD法),LSD法实质上是第五章的t测验。其程序是:在处理间的F测验为显著的前提下,计算出显著水平为的最小显著差数;任何两个平均数的差数(),如其绝对值≥,即为在水平上差异显著;反之,则为在水平上差异不显著。这种方法又称为F测验保护下的最小显著差数法(Fisher’s Protected LSD,或FPLSD)。
已知:
若|t|≥,即为在水平上显著。因此,最小显著差数为:
(6·9)
当两样本的容量n相等时,
在方差分析中,上式的有了更精确的数值MSe(因为此自由度增大),因此(6·9)中的为:
(6·10)
[例6.4] 试以LSD法测验表6.2资料各种药剂处理的苗高平均数间的差异显著性。
由(例6.3)计算得F=20.56为显著,MSe=8.17,DFe=12,
故
由附表4,12时,t0.05=2.179,t0.01=3.055
故 LSD0.05=2.179×2.02=4.40(cm);LSD0.01=3.055×2.02=6.17(cm)
然后将各种药剂处理的苗高与对照苗高相比,差数大于4.40cm为差异显著;大于6.17cm为差异极显著。由表6.2可知:药剂D与A、D与C、以及B与C处理平均数差数分别为11、15和9,大于6.17,说明在0.01水平上差异显著;药剂D与B、B与A处理平均数差数分别为6和5,大于4.40,说明在0.05水平上差异显著;药剂A与C处理平均数差数为4,小于4.40,差异不显著。
二、q法
LSD 法的 t 测验是根据两个样本平均数差数( k=2 )的抽样分布提出的,但是一组处理(k>2)是同时抽取k个样本的结果。抽样理论指出k=2时与k>2,例如k=10时其随机极差是不同的,随着k的增大而增大,因而用k=2时的t测验有可能夸大了k=10时最大与最小两个样本平均数差数的显著性。基于极差的抽样分布理论Student-Newman-Keul提出了q测验或称复极差测验,有时又称SNK测验或NK测验。
q测验方法是将一组k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差值的。q测验因是根据极差抽样分布原理的,其各个比较都可保证同一个显著水平。其尺度值构成为:
(6·11)
(6·12)
式中2≤p≤k,p是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数(称为秩次距),SE为平均数的标准误,可见在每一显著水平下该法有k-1个尺度值。平均数比较时,尺度值随秩次距的不同而异。
[例6.5] 试对表6.2资料的各平均数作q测验。
由6.1资料得:
查附表7 q值表,当DF=12时,p=2,3,4的值,并由(6·11)计算出尺度值,列于表6.4。
表6.4 表6.2资料值的计算(q测验)
p
2
3.08
4.32
4.40
6.18
3
3.77
5.04
5.39
7.21
4
4.20
5.50
6.01
7.87
由表6.2可知,=29cm,=23cm,=18cm,=14cm。由此可得到:
当p=2时,
-=6(cm)
5%水平上显著;
-=5(cm)
5%水平上显著;
-=4(cm)
不显著。
当p=3时,
-=11(cm)
1%水平上显著;
-=9(cm)
1%水平上显著。
当p=4时,
-=15(cm)
1%水平上显著。
三、新复极差法
从表6.4可以发现,不同秩次距p下的最小显著极差变幅比较大,为此,D.B. Duncan(1955)提出了新复极差法,又称最短显著极差法(shortest significant ranges,SSR)。该法与q法相似,其区别在于计算最小显著极差时不是查q表而是查SSR表,所得最小显著极差值随着k增大通常比q测验时的减小。查得后,有
(6·13)
此时,在不同秩次距p下,平均数间比较的显著水平按两两比较是,但按p个秩次距则为保护水平。
[例6.6] 试对表6.2资料的各平均数作新复极差测验。
已知=29cm,=23cm,=18cm,=14cm,MSe=8.17,
查附表8,得值,由(6·13)算得在p=2,3,4时的值(表6.5),即为测验不同p时的平均数间极差显著性的尺度值。
表6.5 表6.2资料LSR值的计算(新复极差测验)
p
2
3.08
4.32
4.40
6.18
3
3.23
4.55
4.62
6.51
4
3.33
4.68
4.76
6.69
当p=2时,
-=6(cm)
5%水平显著;
-=5(cm)
5%水平显著;
-=4(cm)
不显著。
当p=3时,
-=11(cm)
1%水平上显著;
-=9(cm)
1%水平上显著。
当p=4时,
-=15(cm)
1%水平上显著。
结论:表6.2资料的4个处理的苗高,除处理A与C差异不显著外,其余处理间均达显著差异,本例结果与上面介绍的q测验法相同,但q法的要比新复极差法的大。
四、多重比较结果的表示方法
各平均数经多重比较后,应以简洁明了的形式将结果表示出来。常用的表示方法有:
(一) 列梯形表法
将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡达到=0.05水平的差数在右上角标一个“*”号,凡达到=0.01水平的差数在右上角标两个“*”号,凡未达到=0.05水平的差数则不予标记。若以列梯形表法表示,则成表6.6。
表6.6 表6.2资料的差异显著性(新复极差测验)
处理
平均数
()
差 异
-14
-18
-23
D
29
15**
11**
6*
B
23
9**
5*
A
18
4
C
14
该法十分直观,但占篇幅较大,特别是处理平均数较多时。因此,在科技论文中少见。
(二) 划线法
将平均数按大小顺序排列,以第1个平均数为标准与以后各平均数比较,在平均数下方把差异不显著的平均数用横线连接起来,依次以第2,…,k-1个平均数为标准按上述方法进行。这种方法称划线法。下面就是表6.2资料用划线法标出0.01水平下平均数差异显著性结果(q法)。
29cm(D)
23cm(B)
18cm(A)
14cm(C)
该法直观、简单方便,所占篇幅也较少。
(三) 标记字母法:
首先将全部平均数从大到小依次排列。然后在最大的平均数上标上字母a;并将该平均数与以下各平均数相比,凡相差不显著的,都标上字母a,直至某一个与之相差显著的平均数则标以字母b(向下过程),再以该标有b的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母b(向上过程);再以该标有b的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母b,直至某一个与之相差显著的平均数则标以字母c。…… 如此重复进行下去,直至最小的一个平均数有了标记字母且与以上平均数进行了比较为止。这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。
在实际应用时,往往还需区分=0.05水平上显著和=0.01水平上显著。这时可以小写字母表示=0.05显著水平,大写字母表示=0.01显著水平。该法在科技论文中常常出现。
[例6.7] 试对例6.6测验结果作出字母标记。
在表6.7上先将各平均数按大小顺序排列,并在行上标a。由于与呈显著差异,故上标b。然后以为标准与相比呈显著差异,故标c。以为标准与比,无显著差异,仍标c。同理,可进行4个在1%水平上的显著性测验,结果列于表6.7。
表6.7 表6.2资料的差异显著性(新复极差测验)
处 理
苗 高
平均数(cm)
差异显著性
0.05
0.01
D
29
a
A
B
23
b
AB
A
18
c
BC
C
14
c
C
由表6.7就可清楚地看出,该试验除A与C处理无显著差异外,D与B及A、C处理间差异显著性达到=0.05水平。处理B与A、D与B、A与C无极显著差异;D与A、C,B与C呈极显著差异。
多重比较方法很多,可阅读其它参考书籍,以上列举的是常用的方法。
五、多重比较方法的选择
以上介绍三种多重比较方法。方法越多便存在选用何种更好的问题。根据统计学家的意见每种方法都有依据,也都有不足。这里提供几点原则供选用时参考:(1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法;(2)
根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。按上述同一资料(表6.2资料)的测验计算,可以看到当k=2时,LSD法,SSR和q测验的显著尺度都完全相同,并且而,又由于=1,,所以q与F的关系是。k≥3时,三种方法的显著尺度不相同,LSD法最低,SSR法次之,q法最高。故LSD测验在统计推断时犯第一类错误的概率最大,q测验最小,而SSR测验介于两者之间,因此,对于试验结论事关重大或有严格要求的,宜用q测验,q测验可以不经过F测验;一般试验可采用SSR测验;也有统计学家近期认为最小显著差数法已由F测验保护,可以采用FPLSD法进行多重比较,不必采用复杂的极差法测验。
综上所述,方差分析的基本步骤是:(1)将资料总变异的自由度和平方和分解为各变异原因的自由度和平方和,并进而算得其均方;(2)计算均方比,作出F测验,以明了各变异因素的重要程度;(3)对各平均数进行多重比较。
第三节 方差分析的线性模型与期望均方
一、方差分析的线性数学模型
方差分析是建立在一定的线性可加模型基础上的。所谓线性可加模型是指总体每一个变量可以按其变异的原因分解成若干个线性组成部分,它是方差分析的理论依据。
表6.1数据的线性模型可表示为:
yij=++ (6·14)
上式中,为总体平均数,为试验处理效应,为随机误差具有分布N(0,)。(6·14)说明,象表6.1类型的资料,其每一观测值都由总体平均数、处理效应和随机误差三个部分相加而成。
在以样本符号表示时,样本的线性组成为:
yij=++ (6·15)
其中,是的无偏估计量,是的无偏估计量,为其所属亚总体误差方差的无偏估计量。当测验H0:时,假定和,可看作是总体的无偏估计量。因而各亚总体合并的也是的无偏估计量。
对于部分,每一样本的平方和是,故k个样本的平方和是,而处理间方差为:
(6·16)
因为,故估计了,或。或写为:
→ (6·17)
这一部分,因试验模型的不同而有所区别。
二、期望均方
在线性可加模型中,关于部分的假定,由于对有不同的解释产生了固定模型(Ⅰ)和随机模型(Ⅱ)。
从理论上讲,固定模型是指各个处理的平均效应是固定的一个常量,且满足(或),但常数未知;随机模型是指各个处理效应不是一个常量,而是从平均数为零、方差为的正态总体中得到的一个随机变量,即~N(0,)。研究中,前者主要是研究并估计处理效应;后者主要是研究并估计总体变异即方差。例如,若要了解几个水稻新品种产量或几种密度、几种肥料、几种农药的效应等,那么研究对象是处理本身,处理效应为固定的处理效应,就是固定模型。换言之,固定模型仅在于供试处理范围内了解处理间的不同效应。如果目的是要对这些处理所属的总体作出推论,例如研究江淮地区大豆地方品种的遗传变异,从该地区大量地方品种中随机抽取一部分品种作为代表进行试验,以便通过这部分供试品种的试验结果推论该地区大豆地方品种的总体情况,这种处理效应便是随机模型的处理效应。在随机模型中,因为各处理仅是所属总体的随机变量,故总体方差是重要的研究对象。
由上可知,固定模型和随机模型,在试验设计思想和统计推断上是有明显不同的。固定模型中所得的结论仅在于推断关于特定的处理;而随机模型中试验结论则将用于推断处理的总体。此外,在期望均方和F测验方面,固定模型和随机模型也是有明显不同的,后面的内容将予以说明。
(一) 固定模型(fixed model)
[例6.8] 以5个水稻品种作大区比较试验,每品种作3次取样,测定其产量,所得数据为单向分组资料。本试验需明确各品种的效应,故为固定模型,其方差分析和期望均方的参数估计列于表6.8。
表6.8 5个水稻品种产量的方差分析和期望均方表
变异来源
DF
SS
MS
期望均方(EMS):固定模型
品 种 间
4
87.6
21.90
品种内(试验误差)
10
24.0
2.40
固定模型中属于固定效应,其限制条件为,(6·17)中为固定效应的方差,用表示之,因而表6.8的品种间均方估计了。
本例中品种内MS估计了,因而;品种间MS估计了因而=21.9,。
固定模型的F测验
若0,则F值等于1。所以固定模型是测验假设H0:0(i=1,2,…,k)对HA:0,即测验H0:。因而,一般比较处理效应的试验都应当采用固定模型。
(二) 随机模型(random model)
[例6.9] 研究籼粳稻杂交F5代系间单株干草重的遗传变异,随机抽取76个系进行试验,每系随机取2个样品测定干草重(g/株)。因这76个系是随机抽取的样本,要从这些样本来估计F5代系间单株干草重的遗传变异,故这是随机模型。其单向分组分析结果见表6.9。
表6.9 籼粳杂种F5代干草重的方差分析和期望均方
变 异 来 源
DF
MS
期望均方(EMS):随机模型
系 统 间
75
72.79
系统内(试验误差)
76
17.77
随机模型中是从总体随机抽出的,服从N(0,),(6·17)中为随机效应的方差,因而表6.9的系统间均方估计了。本例中系统内MS估计了,因而;系统间MS估计了因而=72.79, 。
随机模型的F测验
若假设,则F=1。因而,随机模型的假设为H0:对HA:。显然,这是测验处理效应的变异度(方差),而不是测验处理效应本身。如果F测验显著则表示处理间的变异是显著的。本例>F0.05,说明是存在的。=25.71测度了系统间变异。本例中,(或记为)代表了系间遗传型的变异;代表了环境条件所致的变异(记作)。+代表了系间的表型变异,因而可求出遗传型变异占表型变异的份量,这就是数量遗传中常用的遗传率,即:
(6·18)
这是随机模型方差分析在数量遗传学中的应用。
在本例可求得:
=或60.76%
即籼粳杂种F5家系间的表型变异中有60.76%归属于遗传原因的变异。
当试验因素在2个或2个以上时,可以在固定模型和随机模型的基础上产生第三种模型:混合模型(记作模型Ⅲ)。混合模型乃既包括有固定模型的试验因素,又包括有随机模型的试验因素的模型。这类模型凡随机因素仍用表示,固定模型用表示。混合模型中的期望均方组成因包括有不同的成份,应选择恰当的均方进行F测验,第13章将作介绍。
第四节 单向分组资料的方差分析
单向分组资料是指观察值仅按一个方向分组的资料,如表6.1及6.2所示。所用的试验设计为完全随机试验设计。
一、组内观察值数目相等的单向分组资料的方差分析
这是在k组处理中,每处理皆含有n个供试单位的资料如表6.1。在作方差分析时,其任一观察值的线性模型皆由(6·14)表示,方差分析如表6.10。
表6.10 组内观察值数目相等的单向分组资料的方差分析
变 异
来 源
自由度
DF
平方和
SS
均 方
MS
F
期望均方EMS
固定模型
随机模型
处理间
k-1
误 差
k(n-1)
总变异
nk-1
[例6.10] 作一水稻施肥的盆栽试验,设5个处理,A和B系分别施用两种不同工艺流程的氨水,C施碳酸氢铵,D施尿素,E不施氮肥。每处理4盆(施肥处理的施肥量每盆皆为折合纯氮1.2克),共5×4=20盆,随机放置于同一网室中,其稻谷产量(克/盆)列于表6.11,试测验各处理平均数的差异显著性。
表6.11 水稻施肥盆栽试验的产量结果
处 理
观察值(yij)(克/盆)
A (氨水1)
24 30 28 26
108
27.0
B (氨水2)
27 24 21 26
98
24.5
C (碳酸氢铵)
31 28 25 30
114
28.5
D (尿素)
32 33 33 28
126
31.5
E (不施)
21 22 16 21
80
20.0
526
26.3
分析步骤:
(1) 自由度和平方和的分解
总变异自由度DFT=nk-1=5×4-1=19
处理间自由度DFt=k-1=5-1=4
误差(处理内)自由度DFe=k(n-1)=5×(4-1)=15
矫正数
(2) F测验
将上述结果录入表6.12,假设H0:,HA:不全相等。为了测验H0,计算处理间均方对误差均方的比率,算得,查F表当=4,=15时,F0.01=4.89,现实得F=11.19>F0.01,故否定H0,推断这个试验的处理平均数间是有极显著差异的。
表6.12 表6.11资料的方差分析
变异来源
DF
SS
MS
F
F0.01
F0.01
处 理 间
4
301.2
75.30
11.19**
3.06
4.89
处理内(试验误差)
15
101.0
6.73
总 变 异
19
402.2
(3) 各处理平均数的比较
算得单个平均数的标准误
根据=15,查SSR表得p=2,3,4,5时的与值,将值分别乘以SE值,即得值,列于表6.13。进而进行多重比较(表6.14)。
表6.13 多重比较时的值计算
p
2
3.01
4.17
3.90
5.41
3
3.16
4.37
4.10
5.67
4
3.25
4.50
4.22
5.84
5
3.31
4.58
4.29
5.94
表6.14 施肥效果的显著性(SSR测验)
处 理
平均产量
(克/盆)
差异显著性
5%
1%
尿 素
31.5
a
A
碳酸氢铵
28.5
ab
AB
氨水1
27.0
bc
AB
氨水2
24.0
c
BC
不 施
20.0
d
C
推断:根据表6.14多重比较结果可知,施用氮肥(A、B、C和D)与不施氮肥有显著差异,且施用尿素、碳酸氢铵、氨水1与不施氮肥均有极显著差异;尿素与碳酸氢铵、碳酸氢铵与氨水1、氨水1与氨水2处理间均无显著差异。
二、组内观察值数目不等的单向分组资料的方差分析
若k个处理中的观察值数目不等,分别为n1,n2,…,nk,在方差分析时有关公式因ni不相同而需作相应改变。主要区别点如下:
(1) 自由度和平方和的分解
(6·19)
(6·20)
(2) 多重比较
平均数的标准误为:
(6·21)
上式的和系两个相比较的平均数的样本容量。但亦可先算得各的平均数。
(6·22)
然后有:
(6·23)
或 (6·24)
[例6.11] 某病虫测报站,调查四种不同类型的水稻田28块,每块田所得稻纵卷叶螟的百丛虫口密度列于表6.15,试问不同类型稻田的虫口密度有否显著差异?
表6.15 不同类型稻田纵卷叶螟的虫口密度
稻田类型
编 号
1
2
3
4
5
6
7
8
Ⅰ
12
13
14
15
15
16
17
102
14.57
7
Ⅱ
14
10
11
13
14
11
73
12.17
6
Ⅲ
9
2
10
11
12
13
12
11
80
10.00
8
Ⅳ
12
11
10
9
8
10
12
72
10.29
7
T=327
11.68
28
该资料=7+6+8+7=28 故
总变异自由度DFT=Σni-1=28-1=27
稻田类型间自由度DFt=k-1=4-1=3
误差自由度DFe=Σni-k=28-4=24
求得:
列入方差分析表6.16。
表6.16 表6.15资料的方差分析
变异来源
DF
SS
MS
F
F0.01
稻田类型间
3
96.13
32.04
5.91**
4.72
误 差
24
129.98
5.42
总 变 异
27
226.11
表6.16所得F=5.91>F0.01,因而应否定H0:,即4块麦田的虫口密度间有极显著差异。
F测验显著,再作平均数间的比较。需进一步计算n0,并求得SE(LSR测验)或(LSD测验)。如在此可有:
≈10
(头)
(头)
三、组内又分亚组的单向分组资料的方差分析
单向分组资料,如果每组又分若干个亚组,而每个亚组内又有若干个观察值,则为组内分亚组的单向分组资料,或称系统分组资料。系统分组并不限于组内仅分亚组,亚组内还可分小组,小组内还可分小亚组,……,如此一环套一环地分下去。这种试验称为巢式试验 (ne
展开阅读全文