资源描述
第十三章 非参数检验
第一节 非参数检验概述 1
第二节 相关样本的非参数检验 2
第三节 独立样本的非参数检验 8
第四节 等级的方差分析 12
第五节 SPSS实验——非参数检验 17
本章小结 20
练习题与思考题 21
综合练习四 22
问题
有一位老师想研究电视节目对提高学生数学学习兴趣的问题,于是他要求9名学生在电视播放前后,用0到10 的数字范围来评定他们对数学的学习兴趣,结果如下表。试问电视播放前后对学生数学学习兴趣的提高有无显著影响?
表13-1 电视节目与数学学习兴趣研究结果
节 目
1
2
3
4
5
6
7
8
9
播放前()
2
5
5
2
3
2
7
7
4
播放后()
4
8
4
8
7
9
4
7
9
学习目标
1.理解参数与非参数检验法的含义与特点
2.掌握相关样本和独立样本的非参数检验方法
3.初步学会操作SPSS分析非参数的样本资料
第一节 非参数检验概述
一、非参数检验法的意义
从第9至11章所介绍的大多数检验都需要关于总体的假定。譬如,。在许多情况下,我们必须假定总体粗略地服从正态分布,且总体方差已知或齐性.事实上,许多时候要满足所有这些必要的假定条件是困难的。为此,统计学家发展了基于更少假设的替代方法,即非参数检验法.
(一)参数检验与非参数检验
像Z检验、t检验、F检验等均称为参数检验法,因为它们在检验时都要求样本所属的总体量呈正态分布或样本容量足够大(n>30),对两个或多个总体进行比较时,则要求它们的总体相同(即方差齐性).这是一种以总体的某种具体分布类型为基础,或利用这些总体参数假设所进行的检验。
本章我们所要介绍的一些检验方法却不需要假设样本是否为正态分布或方差是否为齐性,这样的分布称作“自由分布”(distribution—free)或“非参数统计检验”(nonparametric)。“自由分布统计检验”不需要我们对所抽取样本的总体分布做特别假设,因为没有假设,因此也没有参数来描述这一分布(如平均数、方差),所以叫做非参数检验(non-parameter test).我们喜欢用非参数检验是因为它们可以在t检验中不考虑假设而直接进行统计分析。
(二)非参数检验的适用范围
由于非参数法不但没有总体分布或总体参数的要求,而且在许多非参数检验中其计算负担又很小的,以致被人们称为“捷径”,因而应用面较广,且非常流行,有关文献也相当多。一般来说,凡是能按大小顺序排列或按出现先后排列的资料都可以进行非参数检验,也称为“顺序统计学"。
非参数检验法归纳起来主要适用于下列六种情况.一是分布类型未知。即不知总体分布形态,又不便于假设;或是样本容量太小,分布情况表现不出来。二是分布极度偏态。三是名称变量和顺序变量及计数资料.即样本资料不以分数表示,而以程度、等级、大小、先后来表示.各种等距和比率变量的资料都可转化为名称变量和顺序变量的资料而选用非参数检验法。四是在一组资料中,个别数偏离过大。五是相互比较的几个组或样本的变异程度太大。六是用于初步筛选,只想大致了解某种差异情况。
二、非参数法的优缺点及应用选择
非参数检验法有其优势,也有其不足。优势主要表现在三个方面。一是应用广。由于非参数检验法在应用上没有严格的条件限制,因此比参数法的应用面更广,而且能用参数检验的材料,一般也能用非参数法,只是结果的准确性差一些。二是资料搜集便捷。非参数法只考虑变量的属性、符号或顺序,便于搜集资料。三是计算简便。非参数检验的方法一般都比较简单,而且计算迅速。不足也有三个方面,一是当样本资料来自正态总体只是暂时不知道,或者经过数据转换后可以变成正态分布,用非参数法的结果不如参数法准确。二是当样本容量极小时,非参数法的灵敏度也欠佳。例如,在符号检验法中,当样本容量小于6时,显著性检验结果不准确;小于8时则检验不出非常显著的数据资料.三是当检验结果在显著性水平附近时,还不能做结论,需要重新实验或是用参数法再检验一下。
在实际应用中,如何选择参数检验和非参数检验需了解两种方法各自的优势与劣势.一般而言,对于相同的资料,两种检验方法得出结论相差不太大,即用参数法或非参数法其结果是相符的,不过也有不相符的情况,需视具体情况而定。若数据资料适用于非参数法,则用其法结果也会准确。若数据资料适用于参数法,则用参数法其结果更准确。因此应根据资料情况选择相应的方法,检验结果才会更准确可信。
显然非参数法的应用范围比参数法广,但是非参数法检验的统计精度和分析效率往往不如参数检验。
非参数检验的具体方法有相关样本的符号检验法和符号秩次(等级)检验法,独立样本的秩和检验法和中位数检验,秩次方差分析的单向方差分析和双向方差分析以及柯尔莫哥洛夫一斯米尔诺夫检验的柯氏检验和斯氏检验。
第二节 相关样本的非参数检验
一、符号检验法
(一)符号检验的定义与思想
符号检验(sign test)是指利用正负为资料检验两个相关样本差异显著的统计方法。这是一种非常简单的非参数检验方法,它通过对两个相关样本成对数据差数的符号(正号)的比较来检验其差异显著性。符号检验的基本思想是:若两样个本无差异的话,理论上正负号应各占一半或不相上下。相反,若正负个数相关较大,则可能存在差异,由此表明两个样本不是来自同一总体,并可推论两样本的总体存在差异。
符号检验法因总体个数及样本容量大小不同而有不同。
(二)双总体的符号检验
1.小样本符号检验法(<15)
例13—1:有一位老师想研究电视节目对提高学生数学学习兴趣的问题,于是他要求9名学生在电视播放前后,用0到10 的数字范围来评定他们对数学的学习兴趣,结果如表13—1所示。
表13—1 电视节目与数学学习兴趣研究结果
节 目
1
2
3
4
5
6
7
8
9
播放前()
2
5
5
2
3
2
7
7
4
播放后()
4
8
4
8
7
9
4
7
9
符号()
+
+
-
+
+
+
-
0
+
1)建立假设
①单侧检验.如果有足够的理由能推测出第二次结果(>)大于第一次结果,或第二次结果小于第一次结果(<)则可做单侧检验,即>或<
:<
:>
②双侧检验。若不能确定方向则用双侧检验,假设基正负出现的比例相等.
:
:≠
2)标记对数据之差的符号。如>0记为“+”,<0记为“-”,记为“0”。例13—1的符号见上表。
3)统计符号总数N。符号总数中不包含0,只包括正号和负号个数和,即
4)将,中的较小者记为r,即
5)比较与决策
根据符号总和及显著水平值查符号检验临界值表,见附表13。表中列出了符号总和与显著性水平所对应的临界值,其判断规则如下表。
表13—2 单侧符号检验法的方法的统计判断规则表
r与临界值(CR)比较
P值
差异显著性
r>r0.05
r0。01<r≤r0。05
r≤r0.01
P>0.05
0.01<P≤0。05
P≤0.01
不显著
显 著
极显著
如例13-1,当时,。因为>,所以差异不显著,接受虚无假设,拒绝研究假设,说明电视节目播放前后对学生学习兴趣的提高没有明显影响,做出这种结论的可靠性为95,犯错误的概率为5%。
符号检验表中只有单侧检验的结果,若用双侧检验则应将显著性水平乘以2。如单侧检验,双侧检验,其判断规则如下表。如例13-1,用双侧检验时,所做结论犯错误的概率增加10,可靠性降至90%。
表13-3 双侧符号检验的判断规则
r与临界值(CR)比较
P值
差异显著性
r>r0.10
r0。02<r≤r0。10
r≤r0。2
P>0.10
0.02<P≤0.10
P≤0。02
不显著
显 著
极显著
2.大样本符号检验(≥15)
大样本的符号检验可用两种方法,一是近似正态法,二是检验法。
1)近似正态法。正、负号的分布是一种二项分布。在二项分布中,当样本含量增大时会趋向于正态分布。一般来说,当和都大于5时,可以使用标准正态分布来估计二项分布.根据二项分布的原理,有
,,
所以,符号检验法为
为了更接近正态分布也可以采用较正法,即
例13—2:某班班主任和一任课教师对班上26名学生的行为表现进行了百分评定,结果如表13—4。试问两教师的评定有无显著差异?
表13—4 两位教师对学生行为表现的评定结果
教师
1
2
3
4
5
6
7
8
9
10
11
12
13
A
88
77
69
86
97
90
60
78
82
85
90
74
65
B
73
80
67
81
81
88
73
80
82
76
82
77
62
符号
+
—
+
+
+
+
-
—
0
+
+
—
+
教师
14
15
16
17
18
19
20
21
22
23
24
25
26
A
79
76
95
88
89
68
77
87
83
91
85
65
74
B
79
66
82
84
90
66
76
70
85
93
78
77
74
符号
0
+
+
+
-
+
+
+
—
-
+
-
0
①建立假设
:
:≠
②确定正、负号数目,正负号总数的值
,
③计算统计量
④比较与决策
<,>0。05,接受虚无假设,拒绝研究假设,差异不显著.说明两位教师对学生行为表现的评定是一致的。
2)检验法
式中,表示正号数目,表示负号数目。如例13-2,检验过程如下。
①建立假设
:
:≠
②确定正、负号数目
,
③计算值
④比较与决策
当时,因为<,>0.05,接受虚无假设,拒绝研究假设,差异不显著。说明两位教师对学生行为表现的评定是一致的。
(三)单总体的符号检验
例13-3:随机抽取某校四年级期中数学测验成绩为98,95,97,96,97,100,97,95,93,99,96,98,98,99,95,某教师估计其平均分数为96分。能否根据这些数据推翻该教师的说法?
1)建立假设
:
:
2)确定正、负号。用正号替换比96大的数值,用负号替换比96小的数值,本身为96的数值舍弃。则有13个不等于96的样本值,其符号为:+ - + + + + - - + + + + -。
3)确定r值。
4)比较与决策
查二项分布表,当时,根据,(二项分布的理论概率)查得,≤4的概率是
即。因为>,所以接受虚无假设,拒绝研究假设,差异不显著。结果表明根据该列数据不能推翻教师的说法
二、符号等级检验法(Wilcoxon检验法)
(一)基本思想
符号检验只记成对数据的正负号而不问其数值大小,检验中利用的数据信息极少,检验结果的精确性较差.符号等级检验(signed rank order test)不仅考虑成对数据的正负号,而且还利用每对差值的大小,其方法是先把差数的绝对值从小到大按次序排列,以序号作为它们的秩(即等级),然后再按差数的正、负在其相应的秩前添上正、负号.所以说符号等级(秩次)检验法是利用成对数据的符号及差值大小顺序检验两个相关样本差异显著性的统计方法,这种方法利用的信息较符号检验法多,其结果精度也优于符号检验法,是对符号检验的一大改进。
符号等级检验法是由威尔卡逊(Wilcoxon)提出的,也称Wilcoxon检验法。
(二)双总体的符号等级检验法
1.小样本(<15)检验
例13—4:某幼儿园对10名儿童在刚入园时和入园一年后进行了血色素检验,结果如下,试问两次检查结果之间是否有明显变化?
表13—6 儿童入园前后血色素检验结果
1
2
3
4
5
6
7
8
9
10
刚入园
12。3
11。3
13。0
15。0
12。0
15.0
13。5
12.8
10.0
11.0
入园一年
12。0
14。0
13。8
11。4
14。0
14。0
13.5
13.5
12.0
14.7
-0。3
2。7
0.8
-1。2
—0.6
—1.0
0
0.7
2。0
3。7
等 级
1
8
4
6
2
5
—
3
7
9
符号等级
—1
8
4
-6
—2
—5
—
3
7
9
1)建立假设
:正负号等级和无显著差异.如例13—6,两次检查结果无显著差异,。
:正负号等级和有显著关系。如例13-6,两次检查结果有显著差异,
2)求成对数据的差数值,见表13-6。
3)按排列顺序(不包括0)并添加符号。并将原来差值的正负号添加在等级前.
4)计算正号等级和()与负号等级和(),并取较小者为值,即
5)根据符号总数,查符号秩序临界值表,进行比较与决策
表13-7 单侧符号秩序检验法统计判断规则
T与临界值(CR)比较
P值
差异显著性
T>T0。05
T0。01<T≤T0。05
T≤T0.01
P>0。05
0.01<P≤0。05
P≤0.01
不显著
显 著
极显著
当N时,.因为,>,>0。05,接受虚无假设,拒绝研究假设,差异不显著。说明入园时与入园一年幼儿的血色素没有明显变化。
2.大样本(N≥15)的非参数检验
当N≥15时,和的分布近似正态分布,可以用近似正态法进行检验。
例13-5:心理治疗家对16个睡眠有问题的人进行了放松技巧训练,并让其持续3个月有规律地在睡前使用这种技巧。对16名被试,实验者收集了他们睡眠质量主观等级的两个测量值,一个是训练之前,一个是练习放松技巧90天之后,结果见有13-8。实验者想了解放松技巧是否能改善被试的睡眠质量。
表13-8 放松技巧训练前后被试睡眠质量主观等级评定结果
被试
前
后
前-后差
绝对差等级排序
绝对差的符号秩
1
67
74
7
4
4
2
65
72
7
4
4
3
48
70
22
14
14
4
58
65
7
4
4
5
52
64
12
9
9
6
65
62
-3
1
-1
7
68
60
-8
6。5
—6.5
8
47
57
10
8
8
9
40
56
16
11
11
10
29
53
24
15
15
11
38
51
13
10
10
12
28
49
21
13
13
13
55
47
-8
6。5
-6.5
14
27
45
18
12
12
15
45
39
-6
2
-2
16
38
38
0
1)建立假设
: 。
:
2)确定值
2)计算统计量
① 求均数
2)求标准差
3)求Z值
或
>,<0。05,拒绝虚无假设,接受研究假设,差异显著。说明经过放松技巧训练,被试的睡眠质量得到了明显改善。
(三)单总体符号等级检验法
以例13—3为例,其检验过程如下。
1)求每一数据与96的差值,根据差的绝对值排列等级并添号,结果见表13—9。
表13-9 单总体符号等级检验范例
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
98
95
97
96
97
100
97
95
93
99
96
98
98
99
95
2
-1
1
0
1
4
1
-1
—3
3
0
2
2
3
-1
8
-3.5
3。5
—
3.5
13
3.5
—3。5
-11
11
—
8
8
11
—3。5
2)确定正、负等级和的数目.本例,
3)求正、负等级和并确定值。
4)比较与决策
查的临界值表,当时,。因为>,>0.05。所以接受虚无假设,拒绝研究假设,差异不显著。说明不能推翻该教师的说法.
第三节 独立样本的非参数检验
一、秩和检验法
秩和检验(rank sum test)是两样本检验的非参数替代物,最早由Wilcoxon(1945)提出而称Wilcoxon秩和检验,但后来又因Mann(曼)和Whitney(惠特尼)对它的发展都做出了贡献而称M-W检验或检验。
(一)原理
从两个集中趋势(指中数)相同,但是分布未知的总体中独立地分别抽取容量为和的两个样本(假定≤),我们把和两个样本的数据混和,按取值大小由小到大的顺序排列,并依次给以秩次(即等级),然后将容量较小样本的秩次(等级)之和记为(故名为检验),(,)。如果=,则将平均数较小的样本秩次之和记为。秩次之和简称为秩和(sum of rank)。
利用检验能检验出两个独立样本是否来自同一总体。尤其是能够检验虚无假设而不需要假定抽取的样本大概成标准正态分布.假设从总体中反复抽取样本,就能得到一个对应于样本容量和的秩和的分布。这是一个间断而对称的分布,当和都大于10时,秩和的分布近期近似正态分布,其平均数和标准差分别为
其检验值为
或
(二)小样本(≤10,≤10)的检验
例13-6:假设在甲、乙两班随机抽取了下列学生的单元测验成绩,试问两班成绩有无显著差异?
表13—9 甲、乙两班学生的单元测验成绩
成绩
成绩排列
等级
等级和
甲班
(9人)
37
16
1
70
30
3
75
33
4
30
37
5
45
45
7
16
62
10
62
70
12
73
73
13
33
75
14
乙班
86
24
2
(10人)
55
42
6
80
51
8
42
55
9
97
69
11
84
80
15
24
84
16
51
86
17
92
92
18
69
97
19
检验过程:
1.建立假设
:,即两样本无显著差异
:,即两样本有显著差异
2.计算统计量
1)将数据从小到大排列,见上表.
2)混合排列等级,即将两组数据视为一组进行等级排列,见上表.
3)计算各组的秩和,并确定值,即
(,)(58,121)=58
3.比较与决策
若<<,则接受虚无假设,拒绝研究假设。
若≤,或≥,拒绝虚无假设,接受研究假设。
查秩和检验表,当9,10时,,.因为<<,所以接受虚无假设,拒绝研究假设,差异不显著。说明甲、乙两的成绩无显著差异。
(三)大样本(>10,>10)秩和检验
例13—7:研究教师年薪总额(万元)是否有性别差异,随机抽取了以下教师年薪数据,试问教师年薪是否存在性别差异?
表13-10 教师年薪数据表
1
2
3
4
5
6
7
8
9
10
11
12
教师
男
1。60
1。65
1.73
1。77
1.85
1.93
2.01
2。09
2。30
2.35
2.42
—
女
1.36
1。43
1.50
1.57
1.60
1.71
1.78
1.85
1.92
1。99
2.06
2。08
等级
男
5.5
7
9
10
12.5
15
17
20
21
22
23
—
160
女
1
2
3
4
5。5
8
11
12。5
14
16
18
19
114
检验过程:
1.建立假设
:
:
2.计算统计量
1)求秩和。先混合排列等级,再计算和,最后确定,见表13—10。
2)求值
3.比较与决策
<,>0。05,接受虚无假设,拒绝研究假设,差异不显著。说明男女教师的年薪没有明显差别。
二、中位数检验法
(一)检验思想
中位数检验(median test)是检验两个或两个以上独立样本差数之间有无显著差异的方法。中位数检验的思想是检验不同的样本是否来自中位数相同的总体,即检验它们的集中趋势是否相同。如果各样本的分布相同,那么在合并后算出的中位数上下,各样本的分布数目应当是相同的。根据中位数检验的这一基本思想,其检验的关键步骤是把各样本组的数据视为一个大组,找出各样本共有的中位数,然后再分别统计每个样本在这一共有中数上下各有多少次数。
(二)检验过程
例题13-8:为了研究核糖核酸是否可以作为记忆的促进剂,研究者以老鼠为对象分成实验组与控制组。实验组注射RNA,控制组注射生理盐水,然后在同样的条件下学习走迷津,如果如下(单位:时间)。试问两组的学习成绩有无显著差异?
实验组:16。7,16。8,17。0,17.2,17.4,16.8,17。1,17。0,17。2,17.1,17.2,17.5,17。2,
16。8,16。3,16。9
控制组:76。6,17。2,16.0,16.2,16.8,17。1,17。0,16.0,16。2,16.5,17.1,16。2,17.1,
16.8,16.5
1.提出假设
:,即两组中位数相等,或两组成绩无显著差异
:,即两组中位数不等,或两组成绩有显著差异
2.计算统计量
1)求混合中数。将数据按大小排列,确定中数。
表13-11 中数计算表
16
16.2
16.3
16.5
16.6
16.7
16。8
16.9
17
17.1
17.2
17。4
17。5
2
3
1
2
1
1
5
1
4
4
5
1
1
2
5
6
8
9
10
15
16
20
24
29
30
31
2)统计多个样本在中数上下的次数,列出列联表。
表13—12 计数表
实验组
控制组
>的次数
10
5
15
<的次数
5
10
15
15
15
30
3)求值
3.比较与决策
<,>0.05,差异不显著,接受虚无假设,拒绝研究假设。说明实验组与控制组在迷津学习中差异不显著,即RNA对记忆无明显的促进作用。
第四节 等级的方差分析
进行方差分析时,若前提假设不符合,也要运用非参数的方法,其方法有两种:一是用于独立样本的克-瓦氏单向方差分析,与参数法中完全随机设计的方差分析相对应;另一种是用于相关样本的弗里德曼两因素等级方差分析,适合于配对组设计的多个样本比较.
一、检验
(一)检验的思想
检验或Kruskal-Waillis检验是检验K个独立的随机样本是否来自同一总体,尤其是对μ1=μ2=……=μk的虚无假设和其对立假设的等级总和检验。当实验是按完全随机方式设计时,且所得数据又不符合参数法中的方差分析所需假设条件时,可进行克—瓦氏单向方差分析。检验是代替参数检验中单因素完全随机设计的方差分析,无需假定被样本的近似正态性,又称单因素等级变异数分析(one—factor analysis of rank variance).一般认为,若虚无假设为真,且每个样本至少有5名被试,则用个自由度的分布来估计H抽样分布是合理的。
检验与检验相同,首先将数据混在一起从低到高排列等级,然后分别统计每一样本所得到的等级和,再进行统计量的计算,即值
例13—9:一研究者认为,在工作面试中,不同的性格类型会影响人们工作竞聘的成功率。为此,他选择了外向型、内向型和中间型各5名应聘者,请面试专家在0到50内进行等级评定,等级越高具有竞争性。评定结果见表13-13。试问能否可以判定不同性格类型的人其竞聘的成功率会不同?
表13—13 面试官对不同性格类型的评定结果
编号
外向型
内向型
中间型
评定
等级
评定
等级
评定
等级
1
9
3
5
1
23
10
2
16
6
6
2
28
12
3
19
8
10
4
35
13
4
25
11
15
5
44
14
5
20
9
17
7
47
15
等级和
37
19
64
1.建立假设
:
:至少有两类的等级和不等。
2.计算统计量
1)混合排列等级,并分别统计各组的等级和,见表13—13.
2)求值
3.比较与决策
当时,。因为>,<0.05,拒绝虚无假设,接受研究假设,差异极显著。说明不同性格类型在面试中的成功率不一样.
(二)多重比较
与计量数据的方差分析一样,当总体上出现显著差异时,还需进一步分析成对样本之间的差异状况,即做多重比较.根据样本容量分为相等与不相等有Nemnenyi检验和Dunn检验。
1.Nemnenyi检验.适用于各样本容量相等的多重比较,其标准误为
其检验过程如下。
1)求成对样本等级和()的差值,即
见表13-14。
表13-14 等级方差分析的多重比较
性格
等级和
中间型
64
45*
27
外向型
37
18
内向型
19
2)查值表。选择显著性水平(一般用0。05),在参数检验中,为等级相差数;在非参数检验中,等于表示处理数或样本个数,其误差自由度取无限大,则有。
3)求临界差值
本例,
3)比较与决策
将实际的等级和之差与两个水平的临界值比较,结果表明中间型与内向型存在显著的差异,而中间型和外向型、外向型和内向型之间则无明显差异.
2.Dunn检验。Nemnenyi检验要求各样本容量相等,对于样本容量不相等时则可用Dunn检验,其标准误为
式中,为等级和总个数,为样本容量。
例13-10:将18位社交困难的学生,随机分为三组,分别接受一种心理训练方法(A、B、C),一个月让他们在0到50的范围为自己的训练效果评分,结果见表13-15.试问各种训练方法有无显著不同。
表13-15 社交困难的心理训练结果
训 练 结 果 评 分
等 级
A
B
C
A
B
C
14
29
44
2。5
11
18
10
38
30
1
15
12
18
27
40
4
9
16
22
25
28
6
7
10
14
26
33
2.5
8
13
20
35
5
14
42
17
6
5
7
21
50
100
1)检验
① 建立假设
:
:至少有两类的等级和不等
② 计算统计量
③ 比较与决策
查值表,当时, 。因为>,<0。01。所以,拒绝虚无假设,接受研究假设,差异极显著,说明不同的训练方法效果是不同的。
2)多重比较
因总体上有差异,还需要进行多重比较,了解究竟哪两种方法之间存在显著。
① 求等级和的平均数,即
本例:,,
② 求等级和均数之差,即
结果见表13—17。
③ 查值表。Dunn检验值表见表13—16
表13—16 分布的临界值
组数k
P=0.05
P=0.01
2
1。960
2.576
3
2.394
2。936
4
2.639
3。144
5
2。807
3。291
6
2。936
3。403
7
3。038
3.494
8
3.124
3.570
9
3.196
3.635
10
3.261
3。692
本例,,,
④ 求标准误及临界差值(),即
⑤ 比较与决策。根据上述差值临界值得知,三种训练方法中只有C方法与A方法之间存在极显著差异,而B方法和A方法、C方法与B方法之间则无明显差,显著A方法的训练效果是最佳的,比较结果见表13-17。
表13-17 等级方差分析的多重比较
方法
C
7
14。29
10。79**
4.29
B
5
10
6.5
A
6
3.5
二、弗里德曼双向等级方差分析
(一)检验思想与方法
弗里德曼(Friedman)双向等级方差分析用于解决随机区组实验设计的非参数检验方法。当类别和被试足够大时,其等级和的分布符合卡方分布,记为。若如果=3且<10或者=4,且<5时,拟合程度不太好。这时可查附表8弗里德曼值表进行比较。例如,在弗里德曼(Friedman)双向等级方差分析中,其等级排列方法与上不同,不是各组混合排列,而是同一被试内在不同处理的等级排列。在参数检验中,我们计算值。在非参数检验中,我们计算值,其公式为
自由度为。
例13-11:让6位被试在0到10内对棕,黑,绿三种颜色喜好程度的评定,结果见表13—14.试问6名被试的喜好有无显著差异?
1)建立假设
:被对三种颜色的喜好程度无显著差异
:被对三种颜色的喜好程度有显著差异
2)计算统计量
表13—18 6名被试对三种颜色的喜好评定
被试
棕色
黑色
绿色
评定
等级
评定
等级
评定
等级
1
5
1
8
2
9
3
2
4
1
6
3
5
2
3
3
1
4
2
9
3
4
5
2
4
1
8
3
5
4
1
5
2
6
3
6
5
2
3
1
7
3
等级和
8
11
17
3)比较与决策
① 查值表。当时,。因为>,<0.05。所以,拒绝虚无假设,接受研究假设,差异显著.说明6名被试的三种颜色的喜好程度有明显不同。
② 因本例,,可直接查弗里德曼表。查表为,而=,<0。05.所以,拒绝虚无假设,接受研究假设,差异显著。说明6名被试的三种颜色的喜好程度有明显不同。
(二)多重比较
1)求成对样本等级和的差值,见表13-19。
表13-19 等级方差分析的多重比较
组别
绿
17
9*
6
黑
11
3
棕
8
2)查值表。选择显著性水平(一般用0。05),在参数检验中,为等级相差数;在非参数检验中,等于表示处理数或样本个数,其误差自由度取无限大,则有。
3)求临界差值,即
4)比较与决策
多重比较结果表明,被试只在绿色和棕色的喜好上存在显著差异,而在绿色和黑色、黑色和棕色之间的喜好上则无显著差异,说明被试比较喜欢绿色。
第五节 SPSS实验--非参数检验
一、两个独立样本检验
例13-7: 教师年薪数据表
1
2
3
4
5
6
7
8
9
10
11
12
教师
男
1。60
1。65
1.73
1.77
1.85
1。93
2.01
2.09
2。30
2。35
2.42
—
女
1.36
1.43
1。50
1。57
1。60
1。71
1.78
1。85
1.92
1.99
2。06
2.08
第1步:录入(或读取)数据.定义变量:年薪(nx),性别(sex,其中男为1,女为2),见图13—1。
图13—1 数据文件
第2步:选择“analyze”,单击“Nonparaametric Tests”中的“2 independent samples”,进入“two independent samples Test”,见图13—2。将nx 选入“Test Variable List”,将sex放入“grouping Variable”,“Define Groups”字体变黑.
图13-2 two independent samples Test对话框
第3步:单击“Define Groups”进入“two independent samples:Define Groups”,见图13—3。在sex1中输入1,sex2中输入2,单击“continue”返回,单击“OK”即可.
图13-3 two independent samples:Define Groups对话框
输出结果与解释:
Ranks
SEX
N
Mean Rank
Sum of Ranks
NX
1
11
14.73
162。00
2
12
9.50
114.00
Total
23
上表为秩和检验中用到的编秩情况列表,可见,男教师组的秩次要高一些(默认是从小到大的编秩)
Test Statistics(b)
NX
Mann—Whitney U
36.000
Wilcoxon W
114。000
Z
-1.847
Asymp. Sig。 (2—tailed)
.065
Exact Sig. [2*(1—tailed Sig.)]
。069(a)
a Not corrected for ties。
b Grouping Variable: SEX
上表即为检验结果,一共给出了Mann-Whitney U统计量、Wilcoxon W统计量和Z值,下方则分别给出了近似法计算出的P值和确切概率法计算出的P值,可见两种算法得出的结论一致,都是男教师和女教师的年薪的分布无显著的统计学意义,结合实际数据,可以认为男女教师年薪水平相差不大.
二、两个相关样本检验
例13—4: 表13—6 儿童入园前后血色素检验结果
1
2
3
4
5
6
7
8
9
10
刚入园
12。3
11。3
13.0
15。0
12。0
15。0
13.5
12.8
10。0
11。0
入园一年
12。0
14。0
13.8
11。4
14。0
14.0
13。5
13.5
12。0
14。7
第1步:录入(或读取)数据.定义变量:前测血色素xss1,后测血色素xss2,见图13-4.
.
图13-4 数据文件
第2步:选择“analyze”,单击“Nonparaametric Tests”中的“2 related samples",进入“two-related samples tests”,见图13-5。分别单击“xss1”和“xss2”,进入“current selection”中的“ variable1:”和“variable2:”,再单击向右箭头进入“Test
展开阅读全文