资源描述
第九章 两因素及多因素方差分析
9.1 双菊饮具有很好的治疗上呼吸道感染的功效,为便于饮用,制成泡袋剂。研究不同浸泡时间和不同的浸泡温度对浸泡效果的影响,设计了一个两因素交叉分组实验,实验结果(浸出率)见下表[52]:
浸泡温度
/℃
浸泡时间/min
10
15
20
60
23.72
25.42
23.58
80
24.84
28.32
29.55
95
30.64
31.58
32.21
对以上结果做方差分析及Duncan检验。该设计已经能充分说明问题了吗?是否还有更能说明问题的设计方案?
答:无重复二因素方差分析程序及结果如下:
options linesize=76 nodate;
data hermed;
do temp=1 to 3;
do time=1 to 3;
input effect @@;
output;
end;
end;
cards;
23.72 25.42 23.58
24.84 28.32 29.55
30.64 31.58 32.21
;
run;
proc anova;
class temp time;
model effect=temp time;
means temp time/duncan alpha=0.05;
run;
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
TEMP 3 1 2 3
TIME 3 1 2 3
Number of observations in data set = 9
The SAS System
Analysis of Variance Procedure
Dependent Variable: EFFECT
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 4 87.0707778 21.7676944 12.56 0.0155
Error 4 6.9321778 1.7330444
Corrected Total 8 94.0029556
R-Square C.V. Root MSE EFFECT Mean
0.926256 4.741881 1.31645 27.7622
Source DF Anova SS Mean Square F Value Pr > F
TEMP 2 78.7202889 39.3601444 22.71 0.0066
TIME 2 8.3504889 4.1752444 2.41 0.2058
The SAS System
Analysis of Variance Procedure
Duncan's Multiple Range Test for variable: EFFECT
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Alpha= 0.05 df= 4 MSE= 1.733044
Number of Means 2 3
Critical Range 2.984 3.050
Means with the same letter are not significantly different.
Duncan Grouping Mean N TEMP
A 31.477 3 3
B 27.570 3 2
C 24.240 3 1
The SAS System
Analysis of Variance Procedure
Duncan's Multiple Range Test for variable: EFFECT
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Alpha= 0.05 df= 4 MSE= 1.733044
Number of Means 2 3
Critical Range 2.984 3.050
Means with the same letter are not significantly different.
Duncan Grouping Mean N TIME
A 28.447 3 3
A
A 28.440 3 2
A
A 26.400 3 1
从方差分析结果可以得知,温度是极显著的影响因素,时间是不显著因素。在Duncan检验中,温度的三个水平之间差异是显著的。时间的三个水平间差异不显著。
本实验是二因素固定模型设计,如果设置重复,会得到两个因素之间的交互作用(如果存在的话),其结果能更好地说明问题。
以上方差分析的结果可以归纳成下表:
变差来源
平方和
自由度
均方
F
P
温度(temp)
78.720 288 9
2
39.360 144 4
22.71
0.006 6
时间(time)
8.350 488 9
2
4.175 244 4
2.41
0.205 8
误差
6.932 177 8
4
1.733 044 4
总和
94.002 955 6
8
9.2 研究浙江蜡梅大苗移栽技术,处理方式包括移栽后的不同覆盖方式和做床方法,统计每100株移栽苗的成活率,结果见下表[53]:
做床方法
精细作床
仅挖穴
覆盖方法
遮 阴
93%
85%
未遮阴
90%
81%
根据以往经验在覆盖方法与作床方法之间不存在交互作用,对上述结果做方差分析。请注意,这里的结果是百分数。
答:本例需对数据做反正弦变换,程序和结果如下:
options linesize=76 nodate;
data plum;
do cover=1 to 2;
do seedbed=1 to 2;
input y @@;
surrate=arsin(sqrt(y/100))*180/3.14159265;
output;
end;
end;
cards;
93 85
90 81
;
run;
proc anova;
class cover seedbed;
model surrate=cover seedbed;
run;
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
COVER 2 1 2
SEEDBED 2 1 2
Number of observations in data set = 4
The SAS System
Analysis of Variance Procedure
Dependent Variable: SURRATE
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 64.5953445 32.2976722 90390.15 0.0024
Error 1 0.0003573 0.0003573
Corrected Total 3 64.5957018
R-Square C.V. Root MSE SURRATE Mean
0.999994 0.027238 0.01890 69.3987
Source DF Anova SS Mean Square F Value Pr > F
COVER 1 9.4515512 9.4515512 26451.66 0.0039
SEEDBED 1 55.1437933 55.1437933 99999.99 0.0001
从结果可以看出,覆盖方式和做床方式都是极显著因素。以上结果可以归纳成下表:
变差来源
平方和
自由度
均方
F
P
覆盖方法(cover)
9.451 551 2
1
9.451 551 2
26 451.66
0.003 9
做床方法(seedbed)
55.143 793 3
1
55.143 793 3
99 999.99
0.000 1
误 差
0.000 357 3
1
0.000 357 3
总 和
64.595 701 8
3
9.3 为了研究不同NaCl质量浓度对小麦愈伤组织生长的影响。 配制质量浓度分别为0、0.1%、0.3%和0.5%的NaCl MS培养基,接种15天后,测定每块愈伤组织平均增重百分率,结果见下表[54]:
材料名称
NaCl质量浓度 /%/
H8706-34/%
G8901/%
极早熟/%
中国春/%
0
103.80
63.70
67.32
67.10
0.1
99.31
56.27
52.24
52.30
0.3
52.26
45.01
24.17
34.30
0.5
18.38
15.37
20.40
13.22
对上述结果进行方差分析。作者已经给出四种实验材料都是盐敏感型小麦,但是不同的小麦品种必定对盐的抗性不同。也就是说,品种与盐浓度之间存在交互作用,更完善的实验应当怎样设计?
答:这是一个固定模型设计,程序不再给出,结果如下。
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
CONCEN 4 1 2 3 4
MATERIAL 4 1 2 3 4
Number of observations in data set = 16
The SAS System
Analysis of Variance Procedure
Dependent Variable: INCREASE
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 6 10411.9081 1735.3180 14.18 0.0004
Error 9 1101.6046 122.4005
Corrected Total 15 11513.5126
R-Square C.V. Root MSE INCREASE Mean
0.904321 22.54545 11.0635 49.0719
Source DF Anova SS Mean Square F Value Pr > F
CONCEN 3 8374.15867 2791.38622 22.81 0.0002
MATERIAL 3 2037.74942 679.24981 5.55 0.0196
方差分析结果指出,盐浓度是极显著的影响因素,不同基因型的愈伤组织是显著影响因素。根据以往的研究工作的经验,盐浓度与基因型之间可能存在交互作用,最理想的设计应当设置重复,从总平方和中分离出交互作用平方和,问题可以说明得更确切。以上结果可以归纳成下表。
变差来源
平方和
自由度
均方
F
P
浓度间
8 374.158 7
3
2 791.386 2
22.81
0.000 2
品系间
2 037.749 4
3
679.249 8
5.55
0.019 6
误 差
1 101.604 6
9
122.400 5
总 和
11 513.512 7
15
9.4 为了研究植物的光合作用,设计了一个实验。将烟草的两个变种种植在田间,利用CO2-depletion技术检测单位叶面积捕获CO2的比率。实验共涉及两个因素:一个是变种,选用了两个变种;另一个是抽样时期,在整个生长季共进行40次田间抽样。这是一个无重复两因素实验设计,方差分析表如下[55]:
变差来源
平方和
自由度
均方
F
抽样时期
3.356
39
0.060 4
33.25*
变 种
0.015 7
1
0.015 7
8.66*
误 差
0.071 1
39
0.001 82
总 和
2.443
79
注:*P <0.01。
根据实验设计,该设计是一种什么模型?实验所涉及的两个因素属于哪一种类型的因素?为什么?
答:这是一个混合模型实验。变种是固定因素,抽样时期是随机因素。因为实验没有设置重复,在无重复的情况下,三种模型的检验统计量是一样的,不知作者为什么不考虑设置重复。两个变种是人为选定的,是固定因素。田间抽样是随机抽取的,是随机因素。
9.5 野生型C57BL/6及STAT-1-/-型小鼠胰岛,在移入四氧嘧啶糖尿病的BALB/c小鼠中之后的存活天数见下表[56]:
实验材料
养 生 处 理
未 处 理
IL-1ra*
IL-1ra+CsA
野生型C57BL/6
6 11 11 11 12 12
13 13 13 14 14 14
15 15 17
10 14
12 14 14 15
15 16 21
STAT-1–/–型
11 12 13 13 13
10 14
10 12 14 17
17 23
注:*IL-1ra:interleukin-1 receptor antagonist(白介素-1受体拮抗物)。
**CsA:cyclosporine A(环孢菌素A)。
对上述结果进行方差分析,判断两种类型小鼠的胰岛存活天数差异是否显著?不同养生处理对移植的胰岛存活天数的影响是否显著?不同养生处理与不同型小鼠之间是否存在交互作用?
答:这是一个重复数不等的两因素固定模型实验,所用程序及计算结果如下。
options linesize=76 nodate;
data mouse;
infile 'e:\data\exr9-5e.dat';
do treat=1 to 3;
do type=1 to 2;
input n @@;
do repetit=1 to n;
input days @@;
output;
end;
end;
end;
run;
proc glm;
class treat type;
model days=treat type treat*type ;
run;
The SAS System
General Linear Models Procedure
Class Level Information
Class Levels Values
TREAT 3 1 2 3
TYPE 2 1 2
Number of observations in data set = 37
The SAS System
General Linear Models Procedure
Dependent Variable: DAYS
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 5 70.1272844 14.0254569 1.67 0.1724
Error 31 261.0619048 8.4213518
Corrected Total 36 331.1891892
R-Square C.V. Root MSE DAYS Mean
0.211744 21.43162 2.90196 13.5405
Source DF Type I SS Mean Square F Value Pr > F
TREAT 2 26.5151696 13.2575848 1.57 0.2233
TYPE 1 3.2191227 3.2191227 0.38 0.5409
TREAT*TYPE 2 40.3929921 20.1964961 2.40 0.1075
Source DF Type III SS Mean Square F Value Pr > F
TREAT 2 10.5603197 5.2801598 0.63 0.5408
TYPE 1 0.0089915 0.0089915 0.00 0.9741
TREAT*TYPE 2 40.3929921 20.1964961 2.40 0.1075
在方差分析表中我们选用I型可估函数,从F的显著性概率可以得出,不论是养生处理、小鼠类型还是两者的交互作用都是不显著因素。上述结果可以归纳成下表:
变差来源
平方和
自由度
均方
F
P
处理间
26.515 169 6
2
13.257 584 8
1.57
0.223 3
类型间
3.219 122 7
1
3.219 122 7
0.38
0.540 9
处理×类型
40.392 992 1
2
20.196 496 1
2.40
0.107 5
误 差
261.061 904 8
31
8.421 351 8
总 和
331.189 189 2
36
9.6 野生型C57BL/6及STAT-1-/-型小鼠胰岛,在移入自发糖尿病的NOD#小鼠中之后的存活天数见下表[56]:
实验材料
养生处理
未处理
IL-1ra*
CsA**
IL-1ra+CsA
野生型C57BL/6
0 0 2 5 5
11 11 12 13
13 15 17
0 5 8
12 12 15
8 8 8
10 10 11
18
5 10 11 11
12 16 20
STAT-1–/–型
6 10 10 13
10 12
5 13 14
10 11 11 12
12 13
注:# NOD:nonobese diabetic(非肥胖糖尿病)。
* IL-1ra:interleukin-1 receptor antagonist(白介素-1受体拮抗物)。
** CsA:cyclosporine A(环孢菌素 A)。
对上述结果进行方差分析,判断两种类型小鼠的胰岛存活天数差异是否显著?不同养生处理对移植的胰岛存活天数的影响是否显著?不同养生处理与不同型小鼠之间是否存在交互作用?
答:本题与第5题的程序基本一样,下面只给出计算的结果。
The SAS System
General Linear Models Procedure
Dependent Variable: DAYS
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 7 81.7459473 11.6779925 0.55 0.7939
Error 39 833.4880952 21.3714896
Corrected Total 46 915.2340426
R-Square C.V. Root MSE DAYS Mean
0.089317 45.64659 4.62293 10.1277
Source DF Type I SS Mean Square F Value Pr > F
TREAT 3 67.9880108 22.6626703 1.06 0.3770
TYPE 1 8.0410256 8.0410256 0.38 0.5432
TREAT*TYPE 3 5.7169109 1.9056370 0.09 0.9656
Source DF Type III SS Mean Square F Value Pr > F
TREAT 3 60.4851648 20.1617216 0.94 0.4290
TYPE 1 8.0762698 8.0762698 0.38 0.5423
TREAT*TYPE 3 5.7169109 1.9056370 0.09 0.9656
本题的两个主效应和它们的交互作用都是不显著因素。以上结果可以归纳成下表:
变差来源
平方和
自由度
均方
F
P
处理间
67.988 010 8
3
22.662 670 3
1.06
0.337 0
类型间
8.041 025 6
1
8.041 025 6
0.38
0.543 2
处理×类型
5.716 910 9
3
1.905 637 0
0.09
0.965 6
误 差
833.488 095 2
39
21.371 489 6
总 和
915.234 042 6
46
9.7 一项音乐心理学研究,实验是这样设计的:为了避免熟悉的音乐环境,实验安排在两种非典型的音乐练习和演出环境中进行。一种环境是在剧场底层敞开的大厅中(环境A),另一种是在办公室中(环境B)。要求实验参与者学习并回忆所学习的练习曲。学习和回忆包括在相同环境中(AA,BB)和不同环境中(AB,BA),评判学习和回忆的得分,从而判断得分与环境之间的关系[57]。该实验是一个典型的两因素交叉分组实验设计,方差分析表如下:
变差来源
平方和
自由度
均方
F
P
学习环境
180.267
1
180.267
1.441
0.275
回忆环境
640.267
1
640.267
5.120
0.064
学习环境×回忆环境
1 008.600
1
1 008.600
8.065
0.030
误差
750.333
6
125.056
总和
2 579.467
9
问:(1)本实验共有几次重复?为什么?
(2)本实验属于哪一种模型?为什么?
(3)本实验的两个因素中哪些因素是显著因素?在本实验中显著因素的意义是什么?你可以得到什么结论?
答:(1) 因为本实验共有4种条件组合,df误差=(组合1重复数-1)+(组合2重复数-1)+( 组合3重复数-1)+( 组合4重复数-1)=重复数-4=6。因此,重复数=6+4=10。
(2) 属固定模型。因为:①根据作者所用的检验统计量,②由①推断,环境的水平是人为选定的。
(3) 只有交互作用是显著的。说明音乐的学习是与环境的两种特定水平有关的。结论:音乐的学习属本例的两种特定环境依赖型记忆。
作者的结论是:音乐的学习属环境依赖型记忆。这样的叙述不够严格,只有随机模型才能够得到这样的结论,固定模型只能说“音乐的学习属本例的两种特定环境依赖型记忆”。
9.8 与上一实验类似,这次是记忆一段16小节的钢琴曲。在同一房间中放置两台钢琴,一台是平台式大钢琴(环境A),一台是播音室钢琴(环境B)。参与者在一台钢琴上学习这段曲谱之后,在同一台钢琴上(AA,BB)或不同钢琴上(AB,BA),回忆这段曲子。根据回忆的正确性获得评分[57]。
变差来源
平方和
自由度
均方
F
P
学习环境
22.791
1
22.798
0.652
0.426
回忆环境
0.283
1
0.283
0.008
0.929
学习环境×回忆环境
1 188.159
1
1 188.159
33.968
0.000
误差
979.396
28
34.978
总和
2 190.637
31
问:(1)本实验共有几次重复?为什么?
(2)本实验与上一实验比较有什么不同,可以改变结论的性质吗?
答:(1) 总的重复数为32次。
(2) 结论与上一实验结果类似,只能说不同钢琴的这一环境所产生的交互作用更显著。同样不能把这一结论推广到水平总体。
9.9 研究3~18岁健康个体尿中Adrenarche标记物的值。其中两性24小时尿样中DHEA*的平均含量**如下[58]:
年龄/a
性 别
男孩/(mg ·d-1)
女孩/(mg ·d-1)
3~4
0.91
0.90
5~6
0.90
0.99
7~8
1.08
1.02
9~10
1.53
1.47
11~12
1.90
1.57
13~14
2.27
1.86
15~16
2.09
2.16
17~18
2.55
2.31
注:* DHEA:Dehydroepiandrosterone(脱氢表雄酮),是合成人体雌激素,雄激素,以及其他一些人体激素的最基本物质。
**该值已经过对数变换。
用两因素方差分析判断不同年龄组和不同性别的DHEA差异是否显著?
答:结果如下表:
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
AGE 8 1 2 3 4 5 6 7 8
SEX 2 1 2
Number of observations in data set = 16
The SAS System
Analysis of Variance Procedure
Dependent Variable: DHEA
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 4.90295000 0.61286875 35.44 0.0001
Error 7 0.12104375 0.01729196
Corrected Total 15 5.02399375
R-Square C.V. Root MSE DHEA Mean
0.975907 8.247678 0.13150 1.59438
Source DF Anova SS Mean Square F Value Pr > F
AGE 7 4.84654375 0.69236339 40.04 0.0001
SEX 1 0.05640625 0.05640625 3.26 0.1139
从计算结果可以得知,年龄是极显著因素,性别是不显著因素。以上结果可以归纳成下表。
变差来源
平方和
自由度
均方
F
P
年龄间
4.846 543 75
7
0.692 363 39
40.04
0.000 1
性别间
0.056 406 25
1
0.056 406 25
3.26
0.113 9
误 差
0.121 043 75
7
0.017 291 96
总 和
5.023 993 75
15
9.10 嗜乳酸杆菌在体内处于一种酸性环境,一项关于嗜乳酸杆菌(Lactobacillus acidophilus) Ind-I在体外模拟环境中,在不同pH和不同时间的活菌数(活菌数/mL)变化情况如下表[59]:
时间/ h
pH
4.5
3.5
2.5
1.5
2
2.40×109
1.34×109
1.68×108
1.08×108
1.18×108
1.02×108
4.58×104
3.24×104
4
7.00×109
4.14×108
2.24×109
1.48×109
4.60×107
3.98×107
5.96×103
2.36×103
6
2.10×1010
2.38×109
6.80×108
4.88×109
1.32×107
1.30×107
2.10×103
1.92×103
对表中的数据进行方差分析,数据是服从泊松分布的。
答:对于服从泊松分布的数据,应进行平方根变换。程序与结果如下:
options linesize=76 nodate;
data lacto;
infile 'E:\data\exr9-10e.dat';
do time=1 to 3;
do pH=1 to 4;
do n=1 to 2;
input y @@;
number=sqrt(y);
output;
end;
end;
end;
run;
proc anova;
class time pH;
model number=time pH time*pH;
run;
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
TIME 3 1 2 3
PH 4 1 2 3 4
Number of observations in data set = 24
The SAS System
Analysis of Variance Procedure
Dependent Variable: NUMBER
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 11 2.0166E+10 1.8333E+09 2.86 0.0424
Error 12 7.7030E+09 6.4191E+08
Corrected Total 23 2.7869E+10
R-Square C.V. Root MSE NUMBER Mean
0.723601 96.47277 25336.0 26262.3
Source DF Anova SS Mean Square F Value Pr > F
TIME 2 1.7452E+09 8.7262E+08 1.36 0.2937
PH 3 1.5229E+10 5.0763E+09 7.91 0.0036
TIME*PH 6 3.1921E+09 5.3201E+08 0.83 0.5696
只有“pH”是极显著因素,“时间”和“时间×pH”都是不显著因素。以上结果可以归纳成下表。
变差来源
平方和
自由度
均方
F
P
时 间
1.7452X109
2
8.7262X108
1.36
0.2937
pH
1.5229X109
3
5.0763X109
7.91
0.0036
时间×pH
3.1921X109
6
5.3201X108
0.83
0.5696
误 差
7.7030X109
12
6.4191X108
总 和
2.7869X1010
23
9.11 布氏轮藻(Chara braunii Gm.)的托叶长度与生态环境的状况有密切关系。实验选择4种药物(A:Cd2+,B:Hg2+,C:Cr6+,D:敌枯双 ),每种药物(因素)选择4个水平,两次重复。加药培养5个月后,托叶的长度(mm)如下[60]:
因 素
水 平
1
2
3
4
A
624
260
300
1 207
637
702
1 300
722
B
190
400
780
1 092
250
500
858
2 210
C
650
600
410
1 040
1 040
480
910
1 300
D
780
947
650
300
832
1 248
1 820
1 300
这是一个有重复的两因素交叉分组实验设计,对上述数据进行分析,并解释为什么会得到这样的结果?
答:结果如下:
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
DRUG 4 1 2 3 4
LEVEL 4 1 2 3 4
Number of observations in data set = 32
The SAS System
Analysis of Variance Procedure
Dependent Variable: LENGTH
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 15 3672745.22 244849.68 1.39 0.2613
Error 16 2823335.50 176458.47
Corrected Total 31 6496080.72
R-Square C.V. Root MSE LENGTH Mean
0.565379 51.03545 420.070 823.094
Source DF Anova SS Mean Square F Value Pr > F
DRUG 3 310025.34 103341.78 0.59 0.6331
LEVEL 3 1435384.09 478461.36 2.71 0.0796
DRUG*LEVEL 9 1927335.78 214148.42 1.21 0.3519
根据以往的经验,重金属和农药对植物的生长应当有影响。然而,实验结果却是药物、水平及药物×水平三个因素都是不显著因素。造成这种结果的原因是实验的误差平方和过大。我们知道,误差平方和是重复间的平方和。在原始数据中,有些重复的数据相差甚大,例如,A3和D4的两次重复间竟然相差4倍有余,相差2~3倍的也有不少。重复间存在如此之大的偏差,说明实验材料、实验环境(条件)或实验操作存在不一致性。重复间过大的偏差,造成过大的误差均方,使本来存在的效应被误差掩盖,而不能被检验出来。在设计实验时,除所研究的因素外,一定要保证各方面的均一性。这一点在设计实验和完成实验的过程中是至关重要的,一定要特别注意。人们在接受误差很大的背景下所得到的结论时,会持保留态度的。以上数据可以归纳成下表:
变差来源
平方和
自由度
均方
F
展开阅读全文