1、第七讲 四格表的优比检验与边缘齐性检验
一、四格表的优比检验
1、频数四格表
合计
合计
表示既有属性A,又有属性B的个体数;
表示有属性A,但没有属性B的个体数;
表示没有属性A,但有属性B的个体数;
表示既没有属性A,又没有属性B的个体数;
表示具有属性A的个体数;
表示不具有属性A的个体数;
表示具有属性B的个体数;
表示不具有属性B的个体数;
表示总的个体数。
2、概率四格表
合计
合计
表示既有属性A,又有属性B的概率;
表示有属性A,但
2、没有属性B的概率;
表示没有属性A,但有属性B的概率;
表示既没有属性A,又没有属性B的概率;
表示具有属性A的概率;
表示不具有属性A的概率;
表示具有属性B的概率;
表示不具有属性B的概率;
。
3、一些记号
:有属性A的个体中有属性B的条件概率;
:有属性A的个体中没有属性B的条件概率;
:没有属性A的个体中有属性B的条件概率;
:没有属性A的个体中没有属性B的条件概率;
:个体有属性A时,“有属性B”比“没有属性B”的优势(odds);
:个体没有属性A时,“有属性B”比“没有属性B”的优势(odds);
:优比(odds ratio)。
4、基本结
3、论
(1);
(2);
(3)属性A和B相互独立;
(4)的估计为,;
的估计为;
(5);
(6);
(7);
(8)属性A和B相互独立时,即时,也即时,也即时有,
;
(9)属性A和B相互独立时,即时,也即时,也即时有,
;
5、四格表优比检验问题及其解(给定检验水平)
原假设
备择假设
检验统计量
渐进分布
水平拒绝域
p值
有方向检验
无方向检验
6、例(续)
选择63个肺癌病例,选择43个与肺癌患者年龄、性别和其它属性相类似的健康人作为对照组。然
4、后分别调查肺癌患者和对照组中的人的吸烟情况。调查结果如下表。
调查结果
吸烟
不吸烟
合计
肺癌患者
60
3
63
对照组
32
11
43
合计
92
14
106
用优比检验方法检验总体中肺癌患者吸烟的比例是否比健康人吸烟的比例高?
解:
原假设
备择假设
检验统计量
p值
有方向检验
无方向检验
优比检验结果表明肺癌患者吸烟的比例显著高于对照组的吸烟比例。
二、边缘齐性检验
1、引例
某校某年级有441个学生。
5、期中、期末考试情况如下表:
期末考试
合计
及格
不及格
期中考试
及格
329
52
381
不及格
38
22
60
合计
367
74
441
一般情况下,期中考试的成绩和期末考试的成绩相依,期中考试考得好的同学,期末考试往往也考得比较好。因此需要检验的问题为:期中成绩的分布与期末考试成绩的分布是否相同?对四格表而言即要检验期中考试及格和不及格的比例是否分别与期末考试及格与不及格的比例相同?
一般地,如果四格表的边际分布相同,则称四格表具有边缘齐性。
2、频数四格表
合计
合计
6、表示既有属性A,又有属性B的个体数;
表示有属性A,但没有属性B的个体数;
表示没有属性A,但有属性B的个体数;
表示既没有属性A,又没有属性B的个体数;
表示具有属性A的个体数;
表示不具有属性A的个体数;
表示具有属性B的个体数;
表示不具有属性B的个体数;
表示总的个体数。
3、概率四格表
合计
合计
表示既有属性A,又有属性B的概率;
表示有属性A,但没有属性B的概率;
表示没有属性A,但有属性B的概率;
表示既没有属性A,又没有属性B的概率;
表示具有属性A的概率;
表示不具有属性A的概率;
7、
表示具有属性B的概率;
表示不具有属性B的概率;
。
4、基本结论
(1);
(2);
(3)若,则称该四格表具有对称性;因此对四格表而言“具有边缘齐性”和“具有对称性”等价;
5、四格表边缘齐性的检验问题及其解(给定检验水平)
原假设
备择假设
检验方法
检验统计量
渐进分布
水平拒绝域
p值
McNemar
似然比检验
6、引例分析
原假设
备择假设
检验方法
检验统计量值
p值
似然比检验
检验结果表明,不能拒绝原假设,认为期中考试及格和不及格的比例分别与期末考试及格与不及格的比例相同。
8