资源描述
生物统计学教案
第九章 两因素及多因素方差分析
教学时间:5学时
教学方法:课堂板书讲授
教学目的:重点掌握固定模型、随机模型两因素方差分析的方法步骤,掌握混合模型的方差分析,了解多因素的方差分析方法。。
讲授难点:固定模型、随机模型两因素方差分析的方法步骤
9。1 两因素方差分析中的一些基本概念
9.1.1 模型类型
交叉分组设计:A因素的a个水平和B因素的b个水平交叉配合,共构成ab个组合,每一组合重复n次,全部实验共有abn次。
固定模型:A、B两因素均为固定因素。
随机模型:A、B两因素均为随机因素。
混合模型:A、B两因素中,一个是固定因素,一个是随机因素。
9。1。2 主效应和交互作用
主效应:由于因素水平的改变所造成的因素效应的改变。
A1 A2 A1 A2
B1 18 24 B1 18 28
B2 38 44 B2 30 22
先看左边的表。A因素的主效应应为A2水平的平均效应减A1水平的平均效应,B的主效应类似。
当A1B1+A2B2=A1B2+A2B1时,A、B间不存在交互作用。这里A1B1+A2B2=62,A1B2+A2B1=62,因此A、B间不存在交互作用。
交互作用:若一个因素在另一因素的不同水平上所产生的效应不同,则它们之间存在交互作用。
现在看右边的表。
A(在B1水平上)=A2B1-A1B1=28-18=10
A(在B2水平上)=A2B2-A1B2=22-30=-8
显然A的效应依B的水平不同而不同,故A、B间存在交互作用.交互作用的大小为
AB=(A1B1+A2B2)-(A1B2+A2B1)
9.1。3 两因素交叉分组实验设计的一般格式
假设A因素有a水平,B因素有b水平,则每一次重复包含ab次实验,实验重复n次,总的实验次数为abn次。以xilk表示A因素第i水平,B因素第j水平和第k次重复的观测值。一般格式见下表。
因 素 B j=1,2,…,b
B1 B2 … Bb 总计
A1 x111 x121 x1b1
x112 x122 x1b2
x11n x12n x1bn x1. .
因
素 A2 x211 x221 x2b1
A x212 x222 x2b2
x21n x22n x2bn x2. 。
Aa xa11 xa21 xab1
xa12 xa22 xab2
xa1n xa2n xabn xa. 。
总计 x.1. x。2。 x.b. x。 . .
上表中的各种符号说明如下:
A 因素第i水平的所有观察值的和,其平均数为
B因素第j水平所有观察值的和, 其平均数为
A因素第i水平和B因素的第j水平和所有观察值的和,
其平均数为
所有观察值的总和, 其平均数为
关于实验重复的正确理解:这里的“重复"是指重复实验,而不是重复观测。
9。2 固定模型
9.2。1 线性统计模型
对于固定模型,处理效应是各处理平均数距总平均数的离差,因此
交互作用的效应也是固定的
εijk是相互独立且服从N(0 , σ2)的随机变量.
固定模型方差分析的零假设为:
9。2.2 平方和与自由度的分解
与单因素方差分析的基本思想一样,把总平方和分解为构成总平方和各个分量平方和之和,将总自由度做相应的分解,由此得到各分量的均方.根据均方的数学期望,得出各个分量的检验统计量,从而确定各因素的显著性.
上述各项分别为A因素、B因素、AB交互作用和误差平方和,即:
自由度可做相应的分解:
由此得出各因素的均方:
9。2。3 均方期望与统计量F的确定
对上式E(MSA)、E(MSB)和E(MSe)中的第二项,分别记为:
于是:
这时,零假设还可以写为:
用F作为检验统计量,以对A因素的检验为例:
当F 〉Fα时拒绝H01。对B因素和AB交互作用的推断类似.
变差来源 平方和 自由度 均方 F 均方期望
A因素 SSA a—1 MSA MSA/MSe σ2+bn ηα2
B因素 SSB b-1 MSB MSB/MSe σ2+an ηβ2
AB交互作用 SSAB (a-1)(b—1) MSAB MSAB/MSe σ2+n ηαβ2
误差 SSe ab(n—1) MSe σ2
总和 SST abn—1
两因素固定模型的方差分析表如下:
9。2。4 平方和的简易计算法
为了简化计算过程,实际计算时各平方和是按以下各式计算的
其中称为校正项,用C表示。
不论从上式还是前面给出的误差平方和的公式,都可以看出,平方和是通过重复间平方和得到的.为了得到误差平方和,必须设置重复。由总平方和减去A因素、B因素和误差平方和之后,所得残余项即交互作用平方和。如果不设置重复,无法得到误差平方和,其误差平方和是用残余项估计的。即使实验存在交互作用也无法独立获得,这时的交互作用与误差混杂。这一点在设计实验时一定要特别注意。交互平方和:
原 料 种 类
1 2 3
温 30℃
35℃
度 40℃
41 49 23 25 47 59 50 40 43 35 53 50
11 13 25 24 43 38 33 36 55 38 47 44
6 22 26 18 8 22 18 14 30 33 26 19
例 为了从三种不同原料和三种不同发酵温度中,选出最适宜的条件,设计了一个两因素试验,并得到以下结果。
在这个实验中,温度和原料都是固定因素,每一处理都有4次重复。将每一数据都减去30,列成表9-1。
原料(A) 温度(B) xij1 xij2 xij3 xij4 xij. xij。2
30 11 19 —7 -5 18 324 556
1 35 —19 -17 —5 -6 —47 2209 711
40 -24 -8 -4 —12 -48 2304 800
30 17 29 20 10 76 5776 1630
2 35 13 8 3 6 30 900 278
40 —22 -8 -12 -16 —58 3364 948
30 13 5 23 20 61 3721 1123
3 35 25 8 17 14 64 4096 1174
40 0 3 -4 —11 —12 144 146
和 84 22838 7366
利用xij。列,列成表9-2
温 度 (B)
30 35 40 xi 。 . xi 。 。2
原 1 18 -47 -48 -77 5929
料 2 76 30 -58 48 2304
(A) 3 61 54 -12 113 12769
x。j. 155 47 -118 84 21022
x。j。2 24025 2209 13924 40158
从表9-1中可以计算出:
及由表9-2中可以计算出:
列成方差分析表
变差来源
平方和
自由度
均方
F
原料 A
1554。17
2
777。09
12。67**
温度 B
3150.58
2
1575.29
25。68**
AB
808。75
4
202.19
3.30*
误 差
1656.50
27
61。35
总 和
7170.00
35
9.2.5 无重复实验时的两因素方差分析
如果根据一定的理由,可以判断两因素间确实不存在交互作用,这时也可以不设重复(n = 1)。无重复实验的方差分析,只需将前一节公式中所有的n都改为1,即可完成计算。不同点只是计算更容易一些。这里不再详述。
9。3 随机模型
9.3。1 线性统计模型
对于随机模型:
因此,任何观察值的方差
零假设为:
9。3.2 均方期望与统计量F的确定
随机模型中各平方和的计算与固定模型一样,这里不再重复。但均方期望不同,因此检验统计量也不同.
从均方期望中可以看出,交互作用均方是用误差均方检验的,若MSAB不显著,表明它也是误差的估计,应与MSe合并,用合并后的均方对主效应做检验。合并的方法是若交互作用显著,则可以直接用它检验主效应。随机模型的方差分析表如下:
随机模型的方差分析表如下:
变差来源
平方和
自由度
均方
F
均方期望
A因素
SSA
a-1
MSA
MSA/MSAB
B因素
SSB
b—1
MSB
MSB/MSAB
A×B
SSAB
(a—1)(b—1)
MSAB
MSAB/MSe
误 差
SSe
ab(n-1)
MSe
总 和
SST
abn—1
例 为了研究不同地块中,施用不同数量的农家肥对作物产量的影响,设计一个两因素实验,实验结果如下:
地 块 B
一号地
二号地
三号地
施
肥
量
A
100Kg
8.69
8。47
8.80
8。74
9。49
9。37
200Kg
8。88
8。72
9。68
9。54
9.39
9。59
300Kg
10.82
10.86
11。00
10.92
11。07
11.01
400Kg
11。16
11。42
10.97
11.13
11.00
10.90
解:xijk-9.5 , 列成表9.1:
施肥量
地 块
一
-0。81
—1。03
—1。84
3。3856
1.7170
100
二
-0。70
-0.76
—1.46
2.1316
1。0676
三
-0。10
—0.13
—0。04
0。0196
0.0170
一
-0.62
-0.78
—1.40
1.9600
0.9928
200
二
0。18
0。04
0。22
0。0484
0。0340
三
—0.11
0。09
—0。02
0。0004
0。0202
一
1.32
1。36
2。68
7.1824
3。5920
300
二
1.50
1。42
2.92
8。5204
4.2664
三
1.57
1。51
3.08
9。4864
4。7450
一
1。66
1。92
3.58
12。8164
6。4420
400
二
1.47
1。63
3.10
9.6100
4.8178
三
1.50
1.40
2。90
8.4100
4.2100
13。62
63。5772
32.9218
利用xij列,列成表9。2
地 块
一
二
三
施
肥
量
100
-1.84
—1。46
—0。14
—3.44
11。8336
200
—1。40
0.22
—0.02
—1。20
1。4400
300
2.68
2.92
3.08
8.68
75.3424
400
3。58
3.10
2。90
9.58
91.7764
3。02
4.78
5.82
13.62
180。3924
9。1204
22。8484
33.8724
65.8412
由表9.1计算出
由表9。2计算出
方差分析表
变差来源
平方和
自由度
均方
F
施肥量 A
22.3360
3
7.4453
36.63**
地 块 B
0.5008
2
0。2504
1.23
AB
1。2224
6
0.2037
2.16
误 差
1。1332
12
0.0944
总 和
25。1924
23
** α = 0。01
9。4 混合模型
9.4.1 线性统计模型
一个因素是固定的(如A),另一因素是随机的(如B),该模型称为混合模型。
其中αi是固定效应,βj是随机效应,(αβ)ij是随机效应。
, βj: NID(0,σβ2) , (αβ)ij: NID(0,σαβ2)
9.4。2 均方期望与统计量F的确定
各均方期望如下:
相应的检验统计量为:
混合模型的方差分析表为:
变差来源
平方和
自由度
均 方
F
均方期望
A因素
SSA
a-1
MSA
B因素
SSB
b-1
MSB
AB
SSAB
(a-1)(b-1)
MSAB
误 差
SSe
ab(n-1)
MSe
总 和
SST
abn—1
9。5 两个以上因素的方差分析
9.5.1 平方和与自由度分解的一般规律
平方和的分解,可根据两因素方差分析平方和分解方法,推展出来。如一个三因素固定模型实验,线性统计模型为:
各因素的平方和如下:
残余项为三因素交互作用
SSABC=SST-SSA-SSB-SSC-SSAB-SSAC-SSBC-SSE
自由度的分解:
主效应自由度是其水平数减1
交互作用自由度是相关因素自由度的乘积
误差自由度各因素水平数乘以重复数减1.
由三因素平方和与自由度的分解的规律,可以很容易得到更多因素时的平方和与自由度.不过,在实际应用时,三个因素实验基本上可以满足需要了。
9.5。2 均方期望的表格化推演方法
平方和与自由度的分解并不很困难,困难的是需要得到可靠的检验统计量,也就是说需要得到各个分量的均方期望。表格法推演是简单可靠的,下面以两因素为例,说明其方法。
几个规定:
①误差εijk写成ε(ij)k,括号内的下标称为死下标,没有括号的下标都是活下标。
②固定模型中各因素的效应分量,分别用表示。
③随机模型中各因素的方差分量,分别用表示.
④混合模型中,交互作用的两个因素中只要有一个是随机因素,则交互作用即被认为是随机的.
⑤误差方差记为σ2。
以固定模型为例,说明其推演步骤:
①首先列出右表,线性统计模型中的每个分量占据一行,每个下标占一列。表头上写上因素的类型,固定型记为F,随机型记为R,重复属于随机的,记为R。写上各因素的水平数a、b、n以及每一分量的下标i、j、k。
F
F
R
因素
a
b
n
i
j
k
αi
0
βj
0
(αβ)ij
0
0
ε(ij)k
1
1
1
F
F
R
因素
a
b
n
i
j
k
αi
βj
(αβ)ij
ε(ij)k
1
1
②在行分量中,若某个死下标与列中的该下标一致,则写上“1”。
③若每一行分量上的一个活下标与列上的下标一致,且列是以固定因素为表头的,则写上“0",列是以随机因素为表头的,则写上“1”。
F
F
R
因素
a
b
n
i
j
k
αi
0
b
n
βj
a
0
n
(αβ)ij
0
0
n
ε(ij)k
1
1
1
④在其余空白行位置上写上各列表头所标明的水平数.
⑤为了求某一模型分量(因素)的的均方期望,用纸条盖上以其活下标为表头的那一列,然后找出包含该下标的那些行。把未盖上的字母和数字相乘,再乘上相应的固定因素的效应分量或随机模型的方差分量.这些乘积的和,即为该因素的均方期望。
例如求E(MSA),盖上列i,剩下的列是列j和列k,包含i的行是4、3、1。这三行中未盖上的数字和(或)字母的乘积为1、0、和bn,由此得出因素A的均方期望:
同理可以推出:
一个完整的两因素混合模型(A固定,B随机)的例子如下:
F
R
R
因 素
a
b
n
均方期望
i
j
k
αi
0
b
n
βj
a
1
n
(αβ)ij
0
1
n
ε(ij)k
1
1
1
9.5。3 统计量F的确定
一个混合模型A、C固定,B随机,均方期望的推演如下:
F
R
F
R
因 素
a
b
c
n
均方期望
i
j
k
l
αi
0
b
c
n
βj
a
1
c
n
γk
a
b
0
n
(αβ)ij
0
1
c
n
(αγ)ik
0
b
0
n
(βγ)jk
a
1
0
n
(αβγ)ijk
0
1
0
n
ε(ijk)l
1
1
1
1
根据均方期望可以得出各因素的检验统计量:
9。7 变换
有些实验数据不能满足方差分析的三个条件,这时需要进行坐标变换,使变换后的数据满足上述条件,用变换后的数据进行方差分析。
9。7。1 平方根变换
属于泊松分布的数据,它们的平均数与方差等值,满足方差齐性要求,各处理平均数间的差异必然不显著;反之,当处理平均数之间差异显著时,方差齐性条件必不能满足。这时可以使用平方根变换,即将每一数据取其平方根,用平方根作方差分析。
9.7。2 反正弦变换
对于以百分数表示的二项分布数据,需要作这种变换.方法是:取每个观测值平方根的反正弦值,使之变成一个角度,用该角度作方差分析.
9。7。3 对数变换
当方差与平均数的平方成正比时需作对数变换,变换后的方差具齐性.
87 / 10
展开阅读全文