资源描述
第九章 方差分析
第九章 方差分析
【思考与练习】
一、思考题
1. 方差分析的基本思想及其应用条件是什么?
2. 在完全随机设计方差分析中各表示什么含义?
3. 什么是交互效应?请举例说明。
4. 重复测量资料具有何种特点?
5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较?
二、最佳选择题
1. 方差分析的基本思想为
A. 组间均方大于组内均方
B. 误差均方必然小于组间均方
C. 总变异及其自由度按设计可以分解成几种不同来源
D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著
E. 组间方差显著大于组内方差时,该因素对所考察指标的影响显著
3. 完全随机设计的方差分析中,下列式子正确的是
4. 总的方差分析结果有P<0.05,则结论应为
A. 各样本均数全相等
B. 各总体均数全相等
C. 各样本均数不全相等
D. 各总体均数全不相等
E. 至少有两个总体均数不等
5. 对有k个处理组,b个随机区组的资料进行双因素方差分析,其误差的自由度为
A.
B.
C.
D.
E.
6. 2×2析因设计资料的方差分析中,总变异可分解为
A.
B.
C.
D.
E.
7. 观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是
A. 析因设计的方差分析
B. 随机区组设计的方差分析
C. 完全随机设计的方差分析
D. 重复测量设计的方差分析
E. 两阶段交叉设计的方差分析
8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标的数据40个,若采用完全随机设计方差分析进行统计处理,其组间自由度是
A. 39
B. 36
C. 26
D. 9
E. 3
9. 采用单因素方差分析比较五个总体均数得,若需进一步了解其中一个对照组和其它四个试验组总体均数有无差异,可选用的检验方法是
A. Z检验
B. t检验
C. Dunnett–t检验
D. SNK–q检验
E. Levene检验
三、综合分析题
1. 某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A高剂量三种处理,测量一个月后患者红细胞的升高数(102/L),结果如表9-1所示。问三种治疗方案有无差异?
表9-1 三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102/L)
编号
一般疗法
一般疗法+A1
一般疗法+A2
1
0.81
1.32
2.35
2
0.75
1.41
2.50
3
0.74
1.35
2.43
4
0.86
1.38
2.36
5
0.82
1.40
2.44
6
0.87
1.33
2.46
7
0.75
1.43
2.40
8
0.74
1.38
2.43
9
0.72
1.40
2.21
10
0.82
1.40
2.45
11
0.80
1.34
2.38
12
0.75
1.46
2.40
2. 在药物敏感试验中,欲比较三种弥散法的抑菌效果,每种方法均采用三种药物,观察其抑菌效果,以抑菌环的直径为观察指标,结果如表9-2所示,试比较三种方法的抑菌效果。
表9-2 三种药物在不同弥散法下的抑菌效果(mm)
药物
弥散法
纸片
挖洞
钢圈
黄芪
27.5
24.3
20.0
27.6
24.6
21.0
26.9
25.0
20.6
27.3
27.7
20.8
大黄
20.9
24.6
19.1
21.2
24.7
19.3
20.5
23.9
18.7
21.3
24.8
18.5
青霉素
27.4
22.0
29.6
27.6
21.7
30.2
26.9
21.8
29.5
26.7
22.3
30.4
3. 某试验研究饮食疗法和药物疗法降低高胆固醇血症患者胆固醇的效果有无差别,随机选取名高胆固醇血症患者,随机等分为两组,分别采用饮食疗法和药物疗法治疗一个疗程,测量试验前后患者血胆固醇含量,结果如表9-3所示,请问两种疗法降胆固醇效果有无差异。
表9-3 不同治疗方法下胆固醇变化情况(mmol/L)
编号
饮食治疗
药物治疗
试验前
试验后
试验前
试验后
1
6.11
6.00
6.40
6.35
2
7.59
7.28
7.00
7.10
3
6.42
6.30
6.53
6.41
4
6.94
6.64
7.31
6.83
5
9.17
8.42
6.81
6.73
6
7.61
7.22
8.16
7.65
7
6.60
6.65
6.98
6.52
4. 为研究某中学初一年级、初二年级和初三年级学生周日锻炼时间情况,从这三个年级中各随机抽取20名学生,调查得到学生周日锻炼时间如下表9-4所示。问这三个年级学生周日锻炼时间是否不同?
表9-4 初中不同年级学生的锻炼时间(分)
一年级
二年级
三年级
37.856
59.164
48.778
70.793
36.650
51.057
86.928
38.511
47.609
58.785
48.945
48.428
73.923
29.367
42.814
61.435
41.988
52.303
64.130
69.419
54.327
67.169
33.109
35.591
49.099
38.872
55.013
62.728
53.401
36.084
52.534
62.814
21.307
45.230
38.454
46.419
40.400
32.802
41.836
44.399
37.683
37.481
33.091
48.944
35.781
63.469
48.869
31.354
41.704
41.920
45.190
62.268
46.859
40.924
58.209
65.067
38.877
63.319
38.403
27.259
经数据分析结果见下表:
表9-5 三个年级之间的t检验结果
组别
t
P
一年级和二年级
2.85
0.0071
一年级和三年级
4.09
0.0002
二年级和三年级
1.12
0.2710
问:(1) 该资料采用的是何种统计分析方法?
(2) 所使用的统计分析方法是否正确?为什么?
(3) 若不正确,可以采用何种正确的统计分析方法。请作分析?
【习题解析】
一、思考题
1. 方差分析的基本思想是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,来判断总体均数间的差别是否具有统计学意义。应用条件:各样本是相互独立的随机样本,且服从正态分布,各样本方差齐性。
2. 是各观测值与总均值之差的平方和,即总离均差平方和,表示总变异的大小;表示组间变异,指各处理组均值大小的不同,是由处理因素和随机误差造成的;表示组内变异,指同一处理组内部各观察值之间的变异,是由随机误差造成的。
3. 交互效应是指某一因素的效应随另一因素不同水平的变化而变化,称这两个因素之间存在交互效应。例如:某实验研究A、B两种药物在不同剂量情况下对某病的治疗效果,药物A在不同剂量时,B药的效应不同,或者药物B在不同剂量时,A药的效应不同,则A、B两药间存在交互效应。
4. 重复测量资料中的处理因素在受试者间是随机分配的,受试者内的因素即时间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响,而且时间点离得越近的数据相关性越高。
5. 方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。因此,若希望进一步了解两两间的差别,需进行多重比较。
二、最佳选择题
1. C 2. C 3. A 4. E 5. D 6. E 7. D 8. E 9. C
三、综合分析题
1. 解:本题采用完全随机设计的方差分析。
表9-6 三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102/L)
一般疗法
一般疗法+A1
一般疗法+A2
合计
0.81
1.32
2.35
0.75
1.41
2.50
0.74
1.35
2.43
0.86
1.38
2.36
0.82
1.40
2.44
0.87
1.33
2.46
0.75
1.43
2.40
0.74
1.38
2.43
0.72
1.40
2.21
0.82
1.40
2.45
0.80
1.34
2.38
0.75
1.46
2.40
12
12
12
36 ()
9.43
16.60
28.81
54.84()
0.7858
1.3833
2.4008
7.4385
22.9828
69.2281
99.6494()
(1) 方差分析
1) 建立检验假设,确定检验水准
:,即三种方案治疗后缺铁性贫血患者红细胞升高数相同
:不全相同,即三种方案治疗后缺铁性贫血患者红细胞升高数不全相同
=0.05
2) 计算检验统计量
方差分析结果见表9-7。
表9-7 完全随机资料的方差分析表
变异来源
总变异
16.1098
35
组间变异
16.0022
2
8.0011
2452.7216
<0.01
组内变异
0.1076
33
0.0033
3) 确定值,作出统计推断
查界值表(附表4)得P<0.01,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为三种不同方案治疗后患者红细胞升高数的总体均数不全相同。
(2) 用Dunnett-法进行多重比较。
1) 建立检验假设,确定检验水准
:任一实验组与对照组的总体均数相同
:任一实验组与对照组的总体均数不同
2) 计算检验统计量
表9-8 多个样本均数的Dunnett-检验计算表
对比组
(1)
均数差值
(2)
标准误
(3)
(4)
Dunnett-界值
一般疗法与一般疗法+A1
0.60
0.02
30
2.32
<0.05
一般疗法与一般疗法+A2
1.62
0.02
81
2.32
<0.05
3) 确定值,作出统计推断
将表9-8中取绝对值,并以计算时的自由度和实验组数a=k−1=2(不含对照组)查Dunnett-界值表得值,列于表中。按=0.05水准,一般疗法+A1与一般疗法相比,疗效差别有统计学意义,可以认为一般疗法+A1与一般疗法治疗缺铁性贫血疗效不同。同理,可以认为一般疗法+A2与一般疗法治疗缺铁性贫血疗效不同
SPSS操作
数据录入:
打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,group表示组别 (1为一般疗法,2为一般疗法+药物A低剂量,3为一般疗法+药物A高剂量),x表示患者红细胞的升高数(102/L);再点击Data View标签,录入数据(见图9-1,图9-2)。
图9-1 Variable View窗口内定义要输入的变量group和x
图9-2 Data View窗口内录入数据
分析:
Analyze → Compare Means → one-Way ANOVA
Dependent List框:x
Factor框:group
Post Hoc…→ Equal Variances Assumed: Dunnett:Control Category:first
Continue
Option... → Statistics: Homogeneity of Variances test
Continue
OK
输出结果
Test of Homogeneity of Variances
红细胞升高数(102/L)
Levene Statistic
df1
df2
Sig.
.774
2
33
.469
ANOVA
红细胞升高数(102/L)
Sum of Squares
df
Mean Square
F
Sig.
Between Groups
16.002
2
8.001
2452.722
.000
Within Groups
.108
33
.003
Total
16.110
35
Multiple Comparisons
Dependent Variable: 红细胞升高数(102/L)
Dunnett t (2-sided) a
(I) G
(J) G
Mean Difference (I-J)
Std. Error
Sig.
95% Confidence Interval
Lower Bound
Upper Bound
2
1
.59750(*)
.02332
.000
.5436
.6514
3
1
1.61500(*)
.02332
.000
1.5611
1.6689
* The mean difference is significant at the .05 level.
a Dunnett t-tests treat one group as a control, and compare all other groups against it.
2. 解:本题采用析因设计的方差分析。
表9-9 九种不同处理情况下抑菌环的直径(mm)
纸片弥散法
挖洞弥散法
钢圈弥散法
黄芪
大黄
青霉素
黄芪
大黄
青霉素
黄芪
大黄
青霉素
合 计
27.5
20.9
27.4
24.3
24.6
22.0
20.0
19.1
29.6
27.6
21.2
27.6
24.6
24.7
21.7
21.0
19.3
30.2
26.9
20.5
26.9
25.0
23.9
21.8
20.6
18.7
29.5
27.3
21.3
26.7
27.7
24.8
22.3
20.8
18.5
30.4
4
4
4
4
4
4
4
4
4
36
109.3
83.9
108.6
101.6
98.0
87.8
82.4
75.6
119.7
866.9
12
12
12
12
12
12
301.8
287.4
277.7
293.3
257.5
316.1
(1) 建立检验假设,确定检验水准
因素A
:三种弥散方法抑菌环直径的总体均数相等
:三种弥散方法抑菌环直径的总体均数不全相等
因素B
:三种药物抑菌环直径的总体均数相等
:三种药物抑菌环直径的总体均数不全相等
AB交互作用
:不同药物对三种弥散方法的抑菌效果无影响
:不同药物对三种弥散方法的抑菌效果有影响
=0.05
(2) 计算检验统计量
方差分析结果见表9-10
表9-10 析因设计资料的方差分析表
变异来源
总变异
447.3964
35
处 理
436.6339
8
A
24.5072
2
12.2536
30.7416
<0.05
B
145.4289
2
72.7145
182.4247
<0.05
AB
266.6978
4
66.6745
167.2717
<0.05
误 差
10.7625
27
0.3986
(3) 确定P值,作出统计推断
根据,查界值表(附表4)得相应值。交互作用的F=167.2717,P<0.05,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为弥散方法和药物抑菌效果两者之间存在交互作用。这时,如要分析A因素或B因素的单独效应,应固定在A因素的基线水平来分析B因素的作用,或者固定在B因素的基线水平来分析A因素的作用。
SPSS操作
数据录入:
打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,g1表示三种弥散方法(1为纸片,2为挖洞,3为钢圈),g2表示三种药物(1为黄芪,2为大黄,3为青霉素),x表示抑菌效果(mm);点击Data View标签,录入数据(见图9-3,图9-4)。
图9-3 Variable View窗口内定义要输入的变量g1、g2和x
图9-4 Data View窗口内录入数据
分析:
Analyze → General Linear Model → Univariate
Dependent List框:x
Fixed Factor框:g1、g2
OK
输出结果
3. 解:本题可采用t检验分析,但最好采用重复测量资料的方差分析。因重复测量资料的方差分析计算量较大,故本题不给出笔算结果,仅提供SPSS软件分析结果。
(1) 建立检验假设,确定检验水准
处理因素K
:饮食疗法和药物疗法降低胆固醇值的总体均数相同
:饮食疗法和药物疗法降低胆固醇值的总体均数不相同
时间因素I
:试验前后患者胆固醇值的总体均数相同
:试验前后患者胆固醇值的总体均数不相同
交互作用KI
:时间对两种方法降低胆固醇的效果无影响
:时间对两种方法降低胆固醇的效果有影响
=0.05
(2) 计算检验统计量
本例是最简单的重复测量设计,时间因素只有两个水平,可以用重复测量的方差分析进行计算,由于时间点只有两个水平,可以不考虑球形对称问题。列出方差分析表见表9-11:
表9-11 重复测量资料的方差分析表
变异来源
P
总变异
14.197
27
处理
0.168
1
0.168
0.153
0.703
个体间误差
13.196
12
1.100
时间
0.445
1
0.445
13.921
0.003
处理×时间
0.004
1
0.004
0.122
0.733
个体内误差
0.384
12
0.032
(3) 确定P值,作出统计推断
时间因素和治疗方法之间的交互作用,F值为0.122, P值为0.733,按=0.05水准,不拒绝,差异无统计学意义,尚不能认为时间和疗法之间存在交互作用;对于时间因素,F值为13.921,P值为0.003,P<0.001,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为试验前后患者胆固醇的值不同;两种治疗方法的F值为0.153,P值为0.703,P>0.05,按=0.05水准,不拒绝,差异无统计学意义,尚不能认为饮食疗法和药物疗法之间具有差别。
SPSS操作
数据录入:
打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,no表示编号,g表示分组(1为饮食疗法,2为药物疗法),t1表示实验前患者胆固醇的值(mmol/L),t2表示实验后患者胆固醇的值(mmol/L);击Data View标签,录入数据(见图9-5,图9-6)。
图9-5 Variable View窗口内定义要输入的变量no、g、t1和t2
图9-6 Data View窗口内录入数据
分析:
Analyze → General Linear Model → Repeated Measures
Within-Subject Factor name:改为t
Number of Levels:键入2 → Add
Define:
Within-Subjects Variables [t]:t1~t2
Between- Subjects Factor [s]:g
Model:→ Custom
→ Within-Subjects Model:t
→ Between-Subjects Model:g
Continue
OK
输出结果
Mauchly's Test of Sphericity(b)
Measure: MEASURE_1
Within Subjects Effect
Mauchly's W
Approx. Chi-Square
df
Sig.
Epsilon(a)
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
time
1.000
.000
0
.
1.000
1.000
1.000
4. (1) 该资料采用的是两独立样本t检验作两两比较。
(2) 所使用的统计分析方法错误。欲比较三组均数是否两两不同,用两独立样本t检验作多次比较,会增大犯I型错误的概率。
(3) 应当先采用完全随机设计方差分析,若分析结果拒绝H0,则进一步采用SNK法作三组间的两两比较。
完全随机设计方差分析
1) 建立检验假设,确定检验水准
:三个年级锻炼时间的总体均数相等
:三个年级锻炼时间的总体均数不全相等,即至少有两个总体均数不等
=0.05
2) 计算检验统计量
方差分析结果见表9-12。
表9-12 方差分析表
变异来源
总变异
9988.5164
59
组间
2431.7231
2
1215.8615
9.17
<0.01
组内
7556.7933
57
132.5753
多个样本均数间比较见表9-13。
表9-13 SNK检验计算表
对比组
与
(1)
两均数之差
(2)
两均数之差
标准误
(3)
对比组内包含组数
(5)
界值
(8)
0.05
(6)
0.01
(7)
1与3
14.9519
2.5746
5.8075
3
3.44
4.37
<0.01
1与2
11.3114
2.5746
4.3935
2
2.86
3.82
<0.01
2与3
3.6405
2.5746
1.4140
2
2.86
3.82
>0.05
3) 确定P值,作出统计推断
方差分析结果P<0.01,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为三个年级锻炼时间的总体均数不全相等;多个均数间的两两比较的SNK检验结果提示:可以认为一年级和二年级、一年级和三年级的锻炼时间不同;尚不能认为二年级和三年级的锻炼时间不同。
SPSS操作
数据录入:
打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量,group表示组别 (1为一年级,2为二年级,3为三年级),x表示锻炼时间(分);再点击Data View标签,录入数据(见图9-7,图9-8)。
图9-7 Variable View窗口内定义要输入的变量x、g
图9-6 Data View窗口内录入数据
分析:
Analyze → Compare Means → ONEWAY-ANOVA
Dependent List框:锻炼时间(x)
Factor框:g
Post Hoc…→ Equal Variances Assumed: S-N-K
Continue
Option... → Statistics: Homogeneity of Variances test
Continue
OK
输出结果
9-20
展开阅读全文