资源描述
生物统计学教案
第八章 单因素方差分析
教学时间:5学时
教学方法:课堂板书讲授
教学目的:重点掌握方差分析的方法步骤,掌握单因素和两因素的方差分析 ,了解多重比较的一些常用方法
讲授难点:掌握单因素和两因素的方差分析
8。1 方差分析的基本原理
8.1。1 方差分析的一般概念
第五章讲过两个平均数差异性的比较可用t检验,在多组数据之间作比较便需要通过方差分析来完成。在多组数据之间作比较可以在两两平均数之间比较,但会提高犯I型错误的概率.最简单的方差分析是单因素方差分析.下面举例说明。
例1 调查5个不同小麦品系株高,结果见下表:
品 系
I II III IV V
1 64。6 64.5 67.8 71.8 69。2
2 65.3 65.3 66.3 72.1 68.2
3 64。8 64.6 67。1 70。0 69.8
4 66。0 63。7 66。8 69。1 68.3
5 65.8 63。9 68.5 71。0 67.5
和 326。5 322.0 336。5 354.0 343。0
平均数 65。3 64。4 67。3 70.8 68.6
例2 从每窝均有4只幼仔的初生动物中,随机选择4窝,称量每只动物的出生重,结果如下:
窝 别
I II III IV
1 34.7 33.2 27.1 32.9
2 33.3 26.0 23。3 31.4
3 26.2 28。6 27。8 25.7
4 31。6 32。3 26.7 28.0
和 125。8 120.1 104.9 118。0
平均数 31.450 30。025 26.225 29.500
这两个例子都只有一个因素,例1是“品系”,例2是“窝别”.在每个因素下,又有a个水平(或称为处理),例1有5个品系,例2
有4个窝别。a个水平可以认为是a个总体,表中的数据是从a个总体中抽出的a个样本。方差分析的目的就是由这a个样本推断a个总体。因为上述实验都只有一个因素,对这样的数据所进行的方差分析称为“单因素方差分析”。单因素方差分析的典型数据见下表。
X1 X2 X3 … Xi … Xa
1 x11 x21 x31 xi1 xa1
2 x12 x22 x32 xi2 xa2
3 x13 x23 x33 xi3 xa3
┇
j x1j x2j x3j xij xaj
┇
n x1n x2n x3n xin xan
平均数 x1。 x2。 x3. xi. xa。
表中的xij表示第i次处理下的第j次观测值,下标中的“.”表示求和,具体说明如下:
8.1。2 不同处理效应与不同模型
线性统计模型:
模型中的xij是在i水平下的第j次观测值。μ是对所有观测值的一个参数,称为总平均数.αi是仅对第i次处理的一个参数,称为第i次处理效应。εij是随机误差成分,要求误差是服从N(0,σ2)的独立随机变量.
固定因素:①因素的水平确定后,因素的效应即被确定。②因素的a个水平是人为特意选择的。③方差分析所得结论只适用于所
选定的a个水平。
固定效应模型:处理固定因素所使用的模型.
随机因素:①因素的水平确定之后,其效应并不固定。②因素的a个水平是从水平总体中随机抽取的。③从随机因素的a个水平所得到的结论,可推广到该因素的所有水平上.
随机效应模型:处理随机因素所使用的模型。
8.2 固定效应模型
8。2.1 线性统计模型
其中αi是处理平均数与总平均数的离差,因这些离差的正负值相当,因此
如果不存在处理效应,各αi都应当等于0,否则至少有一个αi≠0。因此,零假设为:
H0:α1=α2= … =αa=0
备择假设为:
HA:αi ≠ 0(至少有一个i)
8。2。2 平方和与自由度的分解
对于每个固定的xi .,
因此,
以SST表示总平方和,SSA表示处理平方和,SSe表示误差平方和,
三者关系为: SST=SSA=SSe
自由度可做同样的分割: dfT=dfA + dfe
dfT=an-1 dfA=a-1 dfe=an-a
为了得出检验统计量,以处理平方和与误差平方和除以相应的自由度,得出相应的均方。
MSe=SSe/dfe MSA=SSA/dfA。
8.2.3 均方期望与统计量F
MSe是σ2的无偏估计量,证明如下:
用同样的方法可以得出MSA的均方期望.
因为E(εij)=0, 故所有包含εij乘积项的数学期望都等于0
于是:
由以上结果可以看出,误差均方MSe是σ2的无偏估计量.对处理项来说,只有当αi=0时,MSA才是σ2的无偏估计量.用MSA和MSe比较,便可以反映出αi的大小.为此,使用统计量F作为检验统计量,做上尾单侧检验。F=MSA / MSe,具dfA,dfe自由度,当F〈Fα时,接受零假设,处理平均数间不显著;当F〉Fα时拒绝零假设,处理平均数间差异显著。在
中,令
则处理均方可表示为
这时的零假设可以记为H0:ηα2 = 0.备择假设记为HA:ηα2 > 0。
将上述结果列在方差分析表中
变差来源 平方和 自由度 均方 F 均方期望
处理间 SSA a-1 MSA MSA/MSe σ2+nηα2
误 差 SSe na-a MSe σ2
总 和 SST na-1
8。2.4 平方和的简易计算
令
C称为校正项.误差平方和
SSe = SST-SSA
将例1中的每个数据都减去65,编码后列成下表。
品 系
I II III IV V
1 -0.4 -0。5 2。8 6.8 4.2
2 0。3 0。3 1.3 7。1 3。2
3 -0。2 -0。4 2.1 5.0 4。8
4 1。0 -1.3 1。8 4.1 3.3
5 0.8 -1.1 3.5 6。0 2。5 总和
xi . 1.5 -3。0 11.5 29。0 18。0 57。0
xi .2 2.25 9。00 132.25 841。00 324.00 1308.50
Σxij2 1。93 3。40 29。43 174。46 68.06 277。28
将以上结果列成方差分析表:
变差来源 平方和 自由度 均方 F
品系间 131.74 4 32。94 42。23**
误 差 15。58 20 0。78
总 和 147.32 24
** α=0。01
F4,20,0.05=2.87,F4,20,0。01=4。43。F 〉 F0.01。P<0。01因此,上述5个不同小麦品系株高差异极显著。习惯上以“ * ”表示在α=0。05水平上差异显著,以“ ** ”表示在α=0。01水平上差异显著。
8.3 随机效应模型
8.3.1 线性统计模型
其中μ为总平均数,αi为服从N(0,σα2)的独立随机变量,εij为服从N(0,σ2)的独立随机变量。
在随机模型中,不是检验单个处理效应的有无,而是检验αi是否存在变异性。因此
接受H0表示处理间没有差异,拒绝H0意味着处理间存在差异。
8.3.2 均方期望及统计量F
在随机模型中,因为αi是独立随机变量,因此MSA的数学期望与固定模型不同。MSA的数学期望:
同理可证
用检验统计量F做上尾单侧检验:F=MSA/MSe.当F〉Fa-1,an—a,α时拒绝H0。MSA的期望组成除包含误差方差外,还包含处理项方差,表明不同处理间存在差异。
方差分析的程序与固定模型相同,但由于获得样本的方式不同,使之所得结果也不同.随机模型适用于水平总体,而固定模型仅适用于所选定的a个水平。以下是例2的计算结果,将每一数据均减去30。
4.7 3。2 -2。9 2。9
3.3 -4。0 -6.7 1。4
-3.8 -1。4 -2。2 -4.3
1。6 2。3 -3。3 -2.0 总和
xi . 5.8 0.1 -15.1 -2。0 -11.2
xi 。2 33.64 0。01 228。01 4.00 265。66
Σxij2 49。98 33.49 69。03 32.86 185.36
将上述结果列成方差分析表
变差来源 平方和 自由度 均方 F
窝间 58.575 3 19.525 1.97
误差 118。945 12 9.912
总和 177.620 15
F3,12,0。05=3。49,F<F0.05,P>0。05,接受H0。结论是不同窝别动物出生重没有显著差异。
8。4 多重比较
8.4.1 最小显著差数法(LSD)
平均数差数的显著性检验公式为:
当n1=n2时,
当差异显著时
后边式子,大于号的右侧称为最小显著差数,记为LSD。
8.4。2 Duncan检验
检验程序:
①将需要比较的a个平均数依次排列好,使之:
并将每一对平均数的差列成下表:
②算出不同对平均数的差的临界值Rk。
其中
上式中的k是要比较的两个平均数之间所包含的平均数的个数。当两个平均数相邻时k=2,中间隔一个时k=3等。平均数共有a个,所以需从附表9中查出a-1个rα,得到a-1个临界值Rk.
③每两个平均数的差与相应的临界值比较,显著的打上一个星花“*”,极显著的打上两个星花“**”.
下面对5个小麦品系株高平均数做duncan多重比较。
首先将平均数按从高到低顺序排列好。
品系号 IV V III I II
平均数 70.8 68.6 67。3 65.3 64。4
顺序号 1 2 3 4 5
根据MSe=0。78,n=5,df=a(n-1)=20,k=2,3,4,5.将临界值列成表。
k 2 3 4 5 k 2 3 4 5
r0。05 2。95 3.10 3。18 3.25 r0.01 4。02 4。22 4.33 4。40
Rk 1。165 1.225 1.256 1.284 Rk 1。588 1。667 1。710 1。738
再以α=0。05和α=0。01水平上的临界值与下表中的平均数的差做比较,差异显著的打上“*”,差异极显著的打上“**”.
8.5。1 方差分析应具备的条件
1、可加性:各处理效应与误差效应是可加的。
2、正态性:ε:NID(0,σ2)
3、方差齐性:各处理的误差方差应具备齐性。
72
展开阅读全文