资源描述
评分
大理大学实验报告
课程名称 生物医学统计分析
实验名称 非参数检验(卡方检验)
专业班级
姓 名
学 号
实验日期
实验地点
2015—2016学年度第 2 学期
一、 实验目的
对分类资料进行卡方检验。
二、实验环境
1、硬件配置:处理器:Intel(R) Core(TM) i5-4210U CPU @1.7GHz 1.7GHz 安装内存(RAM):4.00GB 系统类型:64位操作系统
2、软件环境:IBM SPSS Statistics 19.0软件
三、实验内容
(包括本实验要完成的实验问题及需要的相关知识简单概述)
(1) 课本第六章的例6.1-6.5运行一遍,注意理解结果;
(2) 然后将实验指导书的例1-4运行一遍,注意理解结果。
四、实验结果与分析
(包括实验原理、数据的准备、运行过程分析、源程序(代码)、图形图象界面等)
例6.1
表1 灭螨A和灭螨B杀灭大蜂螨效果的交叉制表
效果
合计
杀灭
未杀灭
组别
灭螨A
32
12
44
灭螨B
14
22
36
合计
46
34
80
分析:表1是灭螨A和灭螨B杀灭大蜂螨效果的样本分类的频数分析表,即交叉列联表。
表2 卡方检验
X2值
df
渐进 Sig. (双侧)
精确 Sig.(双侧)
精确 Sig.(单侧)
Pearson 卡方
9.277a
1
.002
连续校正b
7.944
1
.005
似然比
9.419
1
.002
Fisher 的精确检验
.003
.002
有效案例中的 N
80
a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 15.30。
b. 仅对 2x2 表计算
分析:表2是卡方检验的结果。因为两组各自的结果互不影响,即相互独立。对于这种频数表格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。
Pearson 卡方:皮尔逊卡方检验计算的卡方值(用于样本数n≥40且所有理论数E≥5);
连续校正b:连续性校正卡方值(df=1,只用于2*2列联表);
似然比:对数似然比法计算的卡方值(类似皮尔逊卡方检验);
Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。
不同的资料应选用不同的卡方计算方法。
例6.1为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。
X2=7.944,P(Sig)=0.005<0.01,表明灭螨剂A组的杀螨率极显著高于灭螨剂B组。
例6.2
表3 治疗方法* 治疗效果 交叉制表
计数
治疗效果
合计
1
2
3
治疗方法
1
19
16
5
40
2
16
12
8
36
3
15
13
7
35
合计
50
41
20
111
分析:表3是治疗方法* 治疗效果资料分析的列联表。
表4 卡方检验
X2值
df
渐进 Sig. (双侧)
Pearson 卡方
1.428a
4
.839
似然比
1.484
4
.830
线性和线性组合
.514
1
.474
有效案例中的 N
111
a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 6.31。
分析:表4是卡方检验的结果。自由度df=4,表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为6.13。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)的检验结果,即X2=1.428,P=0.839>0.05,差异不显著,可以认为不同的治疗方法与治疗效果无关,即三种治疗方法对治疗效果的影响差异不显著。
例6.3
表5 灌溉方式* 稻叶情况 交叉制表
计数
稻叶情况
合计
1
2
3
灌溉方式
1
146
7
7
160
2
183
9
13
205
3
152
14
16
182
合计
481
30
36
547
分析:表5是灌溉方式* 稻叶情况资料分析的列联表。
表6 卡方检验
X2值
df
渐进 Sig. (双侧)
Pearson 卡方
5.622a
4
.229
似然比
5.535
4
.237
线性和线性组合
4.510
1
.034
有效案例中的 N
547
a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 8.78。
分析:表6是卡方检验的结果。自由度df=4,样本数n=547。表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为8.78。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)的检验结果,即X2=5.622,P=0.229>0.05,差异不显著,即不同灌溉方式对稻叶情况的影响差异不显著。
例6.4
表7 场地* 奶牛类型 交叉制表
计数
奶牛类型
合计
1
2
3
场地
1
15
24
12
51
2
4
2
7
13
3
20
13
11
44
合计
39
39
30
108
分析:表5是场地* 奶牛类型资料分析的列联表。
表8 卡方检验
X2值
df
渐进 Sig. (双侧)
精确 Sig.(双侧)
精确 Sig.(单侧)
点概率
Pearson 卡方
9.199a
4
.056
.056
似然比
8.813
4
.066
.079
Fisher 的精确检验
8.463
.072
线性和线性组合
.719b
1
.397
.404
.217
.036
有效案例中的 N
108
a. 3 单元格(33.3%) 的期望计数少于 5。最小期望计数为 3.61。
b. 标准化统计量是 -.848。
分析:表8是卡方检验的结果。自由度df=4,样本数n=108。表格下方的注解表明理论次数小于5的格子数为3,最小的理论次数为3.61。需采用精确概率法计算,即用第三行(Fisher 的精确检验)的检验结果,即X2=8.463,P=0.072>0.05,差异不显著,即3种奶牛牛场不同类型奶牛的构成比对差异不显著。
例6.5
表9 LPA* FA 交叉制表
FA
合计
1
2
LPA
1
17
0
17
2
4
7
11
合计
21
7
28
分析:表9是LPA* FA资料分析的列联表。
表10 配对卡方检验
值
精确 Sig.(双侧)
McNemar 检验
.125a
有效案例中的 N
28
a. 使用的二项式分布。
分析: 表10是LPA和FA两种检测方法的配对卡方检验。由于b+c<40,SPSS选用二项分布的直接计算概率法(相当于进行了精确校正),计算该配对资料的检验的精确双侧概率,并且不能给出卡方值。本例P=0.125>0.05,差异不显著,即LPA法和FA法对番鸭细小病毒抗原的检出率差异不显著。
表11 对称度量
值
渐进标准误差a
近似值 Tb
近似值 Sig.
一致性度量
Kappa
.680
.140
3.798
.000
有效案例中的 N
28
a. 不假定零假设。
b. 使用渐进标准误差假定零假设。
分析:表11为LPA和FA两种检测结果的的一致性检验。Kappa值是内部一致性系数,除数据P值判断一致性有无统计学意义外,根据经验,Kappa≥0.75,表明两者一致性较好0.7>Kappa≥0.4,表明一致性一般,Kappa<0.4,则表明一致性较差。
本例Kappa值为0.680,P=0.000<0.01,拒绝无效假设,即认为两种检测方法结果存在一致性,Kappa值=0.680,0.7>Kappa≥0.4,表明一致性一般。
例1
表12 周内日频数表
观察数
期望数
残差
1
11
16.0
-5.0
2
19
16.0
3.0
3
17
16.0
1.0
4
15
16.0
-1.0
5
15
16.0
-1.0
6
16
16.0
.0
7
19
16.0
3.0
总数
112
分析:表12结果显示一周内各日死亡的理论数(Expected)为16.0,即一周内各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual)。
表13 检验统计量
周日
卡方
2.875a
df
6
渐近显著性
.824
a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 16.0。
分析:Chi-Square过程,调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验,主要用于分析实际频数与某理论频数是否相符。卡方值X2=2.875,自由度数(df)=6,P=0.824>0.05,差异不显著,即可认为一周内各日的死亡危险性是相同的。
例2
表14 二项式检验
类别
N
观察比例
检验比例
精确显著性(双侧)
性别
组 1
0
12
.30
.50
.017
组 2
1
28
.70
总数
40
1.00
分析:调用Binomial过程可对样本资料进行二项分布分析。表14的二项分布检验表明,女婴12名,男婴28名,观察概率为0.70(即男婴占70%),检验概率为0.50,二项分布检验的结果是双侧概率为0.017,可认为男女比例的差异有高度显著性,即与通常0.5的性比例相比,该地男婴比女婴明显为多。
例3
表15 两组工人的血铅值及秩
group
N
秩均值
秩和
血铅值
1
10
5.95
59.50
2
7
13.36
93.50
总数
17
分析:Independent Samples过程:调用此过程可对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。有四种检验方法:Mann-Whitney U:主要用于判别两个独立样本所属的总体是否有相同的分布;Kolmogorov-Smirnov Z:推测两个样本是否来自具有相同分布的总体;Moses extreme reactions:检验两个独立样本之观察值的散布范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体;Wald-Wolfowitz runs:考察两个独立样本是否来自具有相同分布的总体。
表16 检验统计量b
血铅值
Mann-Whitney U
4.500
Wilcoxon W
59.500
Z
-2.980
渐近显著性(双侧)
.003
精确显著性[2*(单侧显著性)]
.001a
a. 没有对结进行修正。
b. 分组变量: group
分析:本例选Mann-Whitney U检验方法,表15结果表明,第1组的平均秩次(Mean Rank)为5.95,第2组的平均秩次为13.36,U = 4.5,W = 93.5,精确双侧概率P = 0.001,可认为铅作业组工人的血铅值高于非铅作业组。
例4
表17 group* effect 交叉制表
计数
effect
合计
无效
有效
group
对照组
21
75
96
实验组
5
99
104
合计
26
174
200
分析:表17是group* effect资料分析的列联表。
表18 卡方检验
X2值
df
渐进 Sig. (双侧)
精确 Sig.(双侧)
精确 Sig.(单侧)
Pearson 卡方
12.857a
1
.000
连续校正b
11.392
1
.001
似然比
13.588
1
.000
Fisher 的精确检验
.001
.000
有效案例中的 N
200
a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 12.48。
b. 仅对 2x2 表计算
分析:表18卡方检验资料n=200>40 , 表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为12.48。,可取Pearson卡方值和似然比(Likelihood ratio)值 ,二者值分别为12.857和13.588,P<0.01,试验组和对照组的疗效差别有统计学意义,可认为异梨醇口服液降低颅内压的疗效优于氢氯噻嗪 + 地塞米松。
五、实验小结:
(包括主要实验问题的最终结果描述、详细的收获体会,待解决的问题等)
在此次实验中,由于实验内容更贴近生活应用,因此比起上学期,我们更容易领悟该程序的表达,只是在细节方面还是很容易出错,甚至不容易拐过弯来。但经过此次实验,我们懂得要学着从复杂的程序中剥茧抽丝,把程序尽可能的简单化。
在实验中应注意的点:
1.因为两组各自的结果互不影响,即相互独立。对于这种频数表格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。
2. Pearson 卡方:皮尔逊卡方检验计算的卡方值(用于样本数n≥40且所有理论数E≥5);
连续校正b:连续性校正卡方值(df=1,只用于2*2列联表);
似然比:对数似然比法计算的卡方值(类似皮尔逊卡方检验);
Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。
不同的资料应选用不同的卡方计算方法。
3.有列联表用于描述分析的卡方检验,而其它用于非参数检验是对拟合优度的检验。
4.有计数用加权个数,是具体数值,如例3,则不用加权,因为两组数据长度不同,用独立
性检验,不知道总体分布情况,所有用非参数检验,要是假设它为正态分布,也可以用
卡方检验。
5.描述统计里的交叉表的行、列选择可以互换,互换只是转置,不影响最后的结果。
手写签名:
展开阅读全文