资源描述
第九章 两因素及多因素方差分析
双菊饮具有很好的治疗上呼吸道感染的成效,为便于饮用,制成泡袋剂。研究不同浸泡时间与不同的浸泡温度对浸泡效果的影响,设计了一个两因素穿插分组实验,实验结果(浸出率)见下表[52]:
浸泡温度
/℃
浸泡时间/min
10
15
20
60
80
95
对以上结果做方差分析及Duncan检验。该设计已经能充分说明问题了吗?是否还有更能说明问题的设计方案?
答:无重复二因素方差分析程序及结果如下:
options linesize=76 nodate;
data hermed;
do temp=1 to 3;
do time=1 to 3;
input effect @@;
output;
end;
end;
cards;
run;
proc anova;
class temp time;
model effect=temp time;
means temp time/duncan alpha=0.05;
run;
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
TEMP 3 1 2 3
TIME 3 1 2 3
Number of observations in data set = 9
The SAS System
Analysis of Variance Procedure
Dependent Variable: EFFECT
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE EFFECT Mean
Source DF Anova SS Mean Square F Value Pr > F
The SAS System
Analysis of Variance Procedure
Duncan's Multiple Range Test for variable: EFFECT
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2 3
Means with the same letter are not significantly different.
Duncan Grouping Mean N TEMP
A 31.477 3 3
B 27.570 3 2
C 24.240 3 1
The SAS System
Analysis of Variance Procedure
Duncan's Multiple Range Test for variable: EFFECT
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2 3
Means with the same letter are not significantly different.
Duncan Grouping Mean N TIME
A 28.447 3 3
A
A 28.440 3 2
A
A 26.400 3 1
从方差分析结果可以得知,温度是极显著的影响因素,时间是不显著因素。在Duncan检验中,温度的三个水平之间差异是显著的。时间的三个水平间差异不显著。
本实验是二因素固定模型设计,如果设置重复,会得到两个因素之间的交互作用〔如果存在的话〕,其结果能更好地说明问题。
以上方差分析的结果可以归纳成下表:
变差来源
平方与
自由度
均方
F
P
温度(temp)
78.720 288 9
2
39.360 144 4
0.006 6
时间(time)
8.350 488 9
2
4.175 244 4
0.205 8
误差
6.932 177 8
4
1.733 044 4
总与
94.002 955 6
8
研究浙江蜡梅大苗移栽技术,处理方式包括移栽后的不同覆盖方式与做床方法,统计每100株移栽苗的成活率,结果见下表[53]:
做床方法
精细作床
仅挖穴
覆盖方法
遮 阴
93%
85%
未遮阴
90%
81%
根据以往经历在覆盖方法及作床方法之间不存在交互作用,对上述结果做方差分析。请注意,这里的结果是百分数。
答:本例需对数据做反正弦变换,程序与结果如下:
options linesize=76 nodate;
data plum;
do cover=1 to 2;
do seedbed=1 to 2;
input y @@;
surrate=arsin(sqrt(y/100))*180/3.14159265;
output;
end;
end;
cards;
93 85
90 81
run;
proc anova;
class cover seedbed;
model surrate=cover seedbed;
run;
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
COVER 2 1 2
SEEDBED 2 1 2
Number of observations in data set = 4
The SAS System
Analysis of Variance Procedure
Dependent Variable: SURRATE
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE SURRATE Mean
Source DF Anova SS Mean Square F Value Pr > F
从结果可以看出,覆盖方式与做床方式都是极显著因素。以上结果可以归纳成下表:
变差来源
平方与
自由度
均方
F
P
覆盖方法(cover)
9.451 551 2
1
9.451 551 2
0.003 9
做床方法(seedbed)
55.143 793 3
1
55.143 793 3
0.000 1
误 差
0.000 357 3
1
0.000 357 3
总 与
64.595 701 8
3
为了研究不同NaCl质量浓度对小麦愈伤组织生长的影响。 配制质量浓度分别为0、%、%与%的NaCl MS培养基,接种15天后,测定每块愈伤组织平均增重百分率,结果见下表[54]:
材料名称
NaCl质量浓度 /%/
H8706-34/%
G8901/%
极早熟/%
中国春/%
0
对上述结果进展方差分析。作者已经给出四种实验材料都是盐敏感型小麦,但是不同的小麦品种必定对盐的抗性不同。也就是说,品种及盐浓度之间存在交互作用,更完善的实验应当怎样设计?
答:这是一个固定模型设计,程序不再给出,结果如下。
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
CONCEN 4 1 2 3 4
MATERIAL 4 1 2 3 4
Number of observations in data set = 16
The SAS System
Analysis of Variance Procedure
Dependent Variable: INCREASE
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE INCREASE Mean
Source DF Anova SS Mean Square F Value Pr > F
方差分析结果指出,盐浓度是极显著的影响因素,不同基因型的愈伤组织是显著影响因素。根据以往的研究工作的经历,盐浓度及基因型之间可能存在交互作用,最理想的设计应当设置重复,从总平方与中别离出交互作用平方与,问题可以说明得更确切。以上结果可以归纳成下表。
变差来源
平方与
自由度
均方
F
P
浓度间
8 374.158 7
3
2 791.386 2
0.000 2
品系间
2 037.749 4
3
679.249 8
0.019 6
误 差
1 101.604 6
9
122.400 5
总 与
11 513.512 7
15
为了研究植物的光合作用,设计了一个实验。将烟草的两个变种种植在田间,利用CO2-depletion技术检测单位叶面积捕获CO2的比率。实验共涉及两个因素:一个是变种,选用了两个变种;另一个是抽样时期,在整个生长季共进展40次田间抽样。这是一个无重复两因素实验设计,方差分析表如下[55]:
变差来源
平方与
自由度
均方
F
抽样时期
39
0.060 4
*
变 种
0.015 7
1
0.015 7
*
误 差
0.071 1
39
0.001 82
总 与
79
注:*P。
根据实验设计,该设计是一种什么模型?实验所涉及的两个因素属于哪一种类型的因素?为什么?
答:这是一个混合模型实验。变种是固定因素,抽样时期是随机因素。因为实验没有设置重复,在无重复的情况下,三种模型的检验统计量是一样的,不知作者为什么不考虑设置重复。两个变种是人为选定的,是固定因素。田间抽样是随机抽取的,是随机因素。
野生型C57BL/6及STAT-1-/-型小鼠胰岛,在移入四氧嘧啶糖尿病的BALB/c小鼠中之后的存活天数见下表[56]:
实验材料
养 生 处 理
未 处 理
IL-1ra*
IL-1ra+CsA
野生型C57BL/6
6 11 11 11 12 12
13 13 13 14 14 14
15 15 17
10 14
12 14 14 15
15 16 21
STAT-1–/–型
11 12 13 13 13
10 14
10 12 14 17
17 23
注:*IL-1ra:interleukin-1 receptor antagonist〔白介素-1受体拮抗物〕。
**CsA:cyclosporine A〔环孢菌素A〕。
对上述结果进展方差分析,判断两种类型小鼠的胰岛存活天数差异是否显著?不同养生处理对移植的胰岛存活天数的影响是否显著?不同养生处理及不同型小鼠之间是否存在交互作用?
答:这是一个重复数不等的两因素固定模型实验,所用程序及计算结果如下。
options linesize=76 nodate;
data mouse;
infile 'e:\data\exr9-5e.dat';
do treat=1 to 3;
do type=1 to 2;
input n @@;
do repetit=1 to n;
input days @@;
output;
end;
end;
end;
run;
proc glm;
class treat type;
model days=treat type treat*type ;
run;
The SAS System
General Linear Models Procedure
Class Level Information
Class Levels Values
TREAT 3 1 2 3
TYPE 2 1 2
Number of observations in data set = 37
The SAS System
General Linear Models Procedure
Dependent Variable: DAYS
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE DAYS Mean
Source DF Type I SS Mean Square F Value Pr > F
Source DF Type III SS Mean Square F Value Pr > F
在方差分析表中我们选用I型可估函数,从F的显著性概率可以得出,不管是养生处理、小鼠类型还是两者的交互作用都是不显著因素。上述结果可以归纳成下表:
变差来源
平方与
自由度
均方
F
P
处理间
26.515 169 6
2
13.257 584 8
0.223 3
类型间
3.219 122 7
1
3.219 122 7
0.540 9
处理×类型
40.392 992 1
2
20.196 496 1
0.107 5
误 差
261.061 904 8
31
8.421 351 8
总 与
331.189 189 2
36
野生型C57BL/6及STAT-1-/-型小鼠胰岛,在移入自发糖尿病的NOD#小鼠中之后的存活天数见下表[56]:
实验材料
养生处理
未处理
IL-1ra*
CsA**
IL-1ra+CsA
野生型C57BL/6
0 0 2 5 5
11 11 12 13
13 15 17
0 5 8
12 12 15
8 8 8
10 10 11
18
5 10 11 11
12 16 20
STAT-1–/–型
6 10 10 13
10 12
5 13 14
10 11 11 12
12 13
注:# NOD:nonobese diabetic〔非肥胖糖尿病〕。
* IL-1ra:interleukin-1 receptor antagonist〔白介素-1受体拮抗物〕。
** CsA:cyclosporine A〔环孢菌素 A〕。
对上述结果进展方差分析,判断两种类型小鼠的胰岛存活天数差异是否显著?不同养生处理对移植的胰岛存活天数的影响是否显著?不同养生处理及不同型小鼠之间是否存在交互作用?
答:此题及第5题的程序根本一样,下面只给出计算的结果。
The SAS System
General Linear Models Procedure
Dependent Variable: DAYS
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE DAYS Mean
Source DF Type I SS Mean Square F Value Pr > F
Source DF Type III SS Mean Square F Value Pr > F
此题的两个主效应与它们的交互作用都是不显著因素。以上结果可以归纳成下表:
变差来源
平方与
自由度
均方
F
P
处理间
67.988 010 8
3
22.662 670 3
0.337 0
类型间
8.041 025 6
1
8.041 025 6
0.543 2
处理×类型
5.716 910 9
3
1.905 637 0
0.965 6
误 差
833.488 095 2
39
21.371 489 6
总 与
915.234 042 6
46
一项音乐心理学研究,实验是这样设计的:为了防止熟悉的音乐环境,实验安排在两种非典型的音乐练习与演出环境中进展。一种环境是在剧场底层敞开的大厅中〔环境A〕,另一种是在办公室中〔环境B〕。要求实验参及者学习并回忆所学习的练习曲。学习与回忆包括在一样环境中〔AA,BB〕与不同环境中〔AB,BA〕,评判学习与回忆的得分,从而判断得分及环境之间的关系[57]。该实验是一个典型的两因素穿插分组实验设计,方差分析表如下:
变差来源
平方与
自由度
均方
F
P
学习环境
1
回忆环境
1
学习环境×回忆环境
1
误差
6
总与
9
问:〔1〕本实验共有几次重复?为什么?
〔2〕本实验属于哪一种模型?为什么?
〔3〕本实验的两个因素中哪些因素是显著因素?在本实验中显著因素的意义是什么?你可以得到什么结论?
答:(1) 因为本实验共有4种条件组合,df误差=(组合1重复数-1)+(组合2重复数-1)+( 组合3重复数-1)+( 组合4重复数-1)=重复数-4=6。因此,重复数=6+4=10。
(2) 属固定模型。因为:①根据作者所用的检验统计量,②由①推断,环境的水平是人为选定的。
(3) 只有交互作用是显著的。说明音乐的学习是及环境的两种特定水平有关的。结论:音乐的学习属本例的两种特定环境依赖型记忆。
作者的结论是:音乐的学习属环境依赖型记忆。这样的表达不够严格,只有随机模型才能够得到这样的结论,固定模型只能说“音乐的学习属本例的两种特定环境依赖型记忆〞。
及上一实验类似,这次是记忆一段16小节的钢琴曲。在同一房间中放置两台钢琴,一台是平台式大钢琴〔环境A〕,一台是播音室钢琴〔环境B〕。参及者在一台钢琴上学习这段曲谱之后,在同一台钢琴上〔AA,BB〕或不同钢琴上〔AB,BA〕,回忆这段曲子。根据回忆的正确性获得评分[57]。
变差来源
平方与
自由度
均方
F
P
学习环境
1
回忆环境
1
学习环境×回忆环境
1
误差
28
总与
31
问:〔1〕本实验共有几次重复?为什么?
〔2〕本实验及上一实验比拟有什么不同,可以改变结论的性质吗?
答:(1) 总的重复数为32次。
(2) 结论及上一实验结果类似,只能说不同钢琴的这一环境所产生的交互作用更显著。同样不能把这一结论推广到水平总体。
研究3~18岁安康个体尿中Adrenarche标记物的值。其中两性24小时尿样中DHEA*的平均含量**如下[58]:
年龄/a
性 别
男孩/〔mg ·d-1〕
女孩/〔mg ·d-1〕
3~4
5~6
7~8
9~10
11~12
13~14
15~16
17~18
注:* DHEA:Dehydroepiandrosterone〔脱氢表雄酮〕,是合成人体雌激素,雄激素,以及其他一些人体激素的最根本物质。
**该值已经过对数变换。
用两因素方差分析判断不同年龄组与不同性别的DHEA差异是否显著?
答:结果如下表:
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
AGE 8 1 2 3 4 5 6 7 8
SEX 2 1 2
Number of observations in data set = 16
The SAS System
Analysis of Variance Procedure
Dependent Variable: DHEA
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE DHEA Mean
Source DF Anova SS Mean Square F Value Pr > F
从计算结果可以得知,年龄是极显著因素,性别是不显著因素。以上结果可以归纳成下表。
变差来源
平方与
自由度
均方
F
P
年龄间
4.846 543 75
7
0.692 363 39
0.000 1
性别间
0.056 406 25
1
0.056 406 25
0.113 9
误 差
0.121 043 75
7
0.017 291 96
总 与
5.023 993 75
15
嗜乳酸杆菌在体内处于一种酸性环境,一项关于嗜乳酸杆菌(Lactobacillus acidophilus) Ind-I在体外模拟环境中,在不同pH与不同时间的活菌数〔活菌数/mL〕变化情况如下表[59]:
时间/ h
pH
2
×109
×109
×108
×108
×108
×108
×104
×104
4
×109
×108
×109
×109
×107
×107
×103
×103
6
×1010
×109
×108
×109
×107
×107
×103
×103
对表中的数据进展方差分析,数据是服从泊松分布的。
答:对于服从泊松分布的数据,应进展平方根变换。程序及结果如下:
options linesize=76 nodate;
data lacto;
infile 'E:\data\exr9-10e.dat';
do time=1 to 3;
do pH=1 to 4;
do n=1 to 2;
input y @@;
number=sqrt(y);
output;
end;
end;
end;
run;
proc anova;
class time pH;
model number=time pH time*pH;
run;
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
TIME 3 1 2 3
PH 4 1 2 3 4
Number of observations in data set = 24
The SAS System
Analysis of Variance Procedure
Dependent Variable: NUMBER
Sum of Mean
Source DF Squares Square F Value Pr > F
Error 12 7.7030E+09 6.4191E+08
Corrected Total 23 2.7869E+10
R-Square C.V. Root MSE NUMBER Mean
Source DF Anova SS Mean Square F Value Pr > F
只有“pH〞是极显著因素,“时间〞与“时间×pH〞都是不显著因素。以上结果可以归纳成下表。
变差来源
平方与
自由度
均方
F
P
时 间
9
2
8
pH
9
3
9
时间×pH
9
6
8
误 差
9
12
8
总 与
10
23
布氏轮藻〔Chara braunii Gm.〕的托叶长度及生态环境的状况有密切关系。实验选择4种药物〔A:Cd2+,B:Hg2+,C:Cr6+,D:敌枯双 〕,每种药物〔因素〕选择4个水平,两次重复。加药培养5个月后,托叶的长度〔mm〕如下[60]:
因 素
水 平
1
2
3
4
A
624
260
300
1 207
637
702
1 300
722
B
190
400
780
1 092
250
500
858
2 210
C
650
600
410
1 040
1 040
480
910
1 300
D
780
947
650
300
832
1 248
1 820
1 300
这是一个有重复的两因素穿插分组实验设计,对上述数据进展分析,并解释为什么会得到这样的结果?
答:结果如下:
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
DRUG 4 1 2 3 4
LEVEL 4 1 2 3 4
Number of observations in data set = 32
The SAS System
Analysis of Variance Procedure
Dependent Variable: LENGTH
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE LENGTH Mean
Source DF Anova SS Mean Square F Value Pr > F
根据以往的经历,重金属与农药对植物的生长应当有影响。然而,实验结果却是药物、水平及药物×水平三个因素都是不显著因素。造成这种结果的原因是实验的误差平方与过大。我们知道,误差平方与是重复间的平方与。在原始数据中,有些重复的数据相差甚大,例如,A3与D4的两次重复间竟然相差4倍有余,相差2~3倍的也有不少。重复间存在如此之大的偏差,说明实验材料、实验环境〔条件〕或实验操作存在不一致性。重复间过大的偏差,造成过大的误差均方,使本来存在的效应被误差掩盖,而不能被检验出来。在设计实验时,除所研究的因素外,一定要保证各方面的均一性。这一点在设计实验与完成实验的过程中是至关重要的,一定要特别注意。人们在承受误差很大的背景下所得到的结论时,会持保存态度的。以上数据可以归纳成下表:
变差来源
平方与
自由度
均方
F
P
药 物
3
0.633 1
水 平
3
0.079 6
药物×水平
9
0.351 9
误 差
16
总 与
31
六味木香袋泡剂是一种中药新剂型。药物的浸出率及粒度的大小、浸泡时间、浸泡水温等因素有关。以下数据是不同粒度及不同水量的浸出率〔%〕[61],对这些数据进展分析,推断因素的显著性。
粒 度/目
10
20
30
40
加水量
/ mL
100
150
200
答:这里的因变量是浸出率,它不是二项分布数据,不需做变换。结果如下:
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
WATER 3 1 2 3
GRANULE 4 1 2 3 4
Number of observations in data set = 24
The SAS System
Analysis of Variance Procedure
Dependent Variable: PERCENT
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE PERCENT Mean
Source DF Anova SS Mean Square F Value Pr > F
结果指出,加水量与粒度都是极显著因素,但两者的交互作用是不显著的。交互作用不显著的含义是,不是只有在特定的加水量与特定的粒度下才有最正确的浸出率。以上结果可以归纳成下表:
变差来源
平方与
自由度
均方
F
P
加水量
126.373 908
2
63.186 954
0.000 1
粒 度
118.520 600
3
39.506 867
0.000 2
加水量×粒度
34.007 425
6
5.667 904
0.103 7
误 差
29.604 000
12
2.467 000
总 与
308.505 933
23
长沙市2005年7月份不同地点、不同日期与每一天三个时间的空气温度测量结果列在下表中[62]:
地点
日期/日
温度/℃
8:00
14:00
20:00
长沙汽车西站
4
6
16
18
27
29
岳麓金峰小区
4
6
16
18
27
29
五一中路袁家岭
4
6
16
18
27
29
解放中路浏城桥
4
6
16
18
27
29
马坡岭
4
6
16
18
27
29
首先判断这是一个什么模型,然后对上述记录结果,做无重复三因素穿插分组方差分析。
答:程序与结果如下:
options linesize=76 nodate;
data changsha;
infile 'e:\data\exr9-13e.dat';
do place=1 to 5;
do date=1 to 6;
do time=1 to 3;
input temp @@;
output;
end;
end;
end;
run;
proc anova;
class place date time;
model temp=place date time;
run;
The SAS System
Analysis of Variance Procedure
Class Level Information
Class Levels Values
PLACE 5 1 2 3 4 5
DATE 6 1 2 3 4 5 6
TIME 3 1 2 3
Number of observations in data set = 90
The SAS System
Analysis of Variance Procedure
Dependent Variable: TEMP
Sum of Mean
Source DF Squares Square F Value Pr > F
R-Square C.V. Root MSE TEMP Mean
Source DF Anova SS Mean Square F Value Pr > F
从结果来看,地点、日期与时间都是极显著因素。以上结果可以归纳成下表:
变差来源
平方与
自由度
均方
F
P
地 点
15.761 556
4
3.940 389
0.000 1
日 期
22.024 000
5
4.404 800
0.000 1
时 间
703.466 000
2
351.733 000
0.000 1
误 差
35.424 444
78
0.454 160
总 与
776.676 000
89
一个有重复二因素固定模型方差分析表如下:
变差来源
平方与
自由度
均方
F
A因素
114
3
38
4.75*
B因素
108
3
36
4.50*
A×B
378
9
42
5.25**
误 差
128
16
8
总 与
728
31
注:*α=。**α=。
假设由于实验者缺乏足够的生物统计学知识,错误地使用了重复平均数做无重复的方差分析,上述方差分析表中的各项值有何变化?说明什么问题?
答:如果用重复的平均数计算,将得到以下方差分析表:
变差来源
平方与
自由度
均方
F
A因素
57
3
19
B因素
54
3
18
误 差
189
9
21
总 与
300
15
这样计算会产生以下后果:
展开阅读全文