1、学术讨论单侧检验辨释南通医学院(226001)陆守曾在假设检验中选用单侧检验,主要是为了提高检验效率,即提高(1-?)。本文就单侧检验的意义,单、双侧检验的假设与分布中的单、双尾面积,以及单侧检验之应用价值等问题进行探讨;此外,亦述及只有单侧检验的方法。单侧检验的一般意义当所设 H0为总体参数等于某一定值,而 H1为仅从一个方向上偏离此定值者,为单侧检验。以下是几种常见的单侧检验,注意与相应的双侧检验分辨。1.检验两组的差异显著性时,只考虑 A B 之意义,不考虑 A B 和 A C,T2 C,T3 C(出现其中 1 个或 2 个或全部)双侧检验T1C,T2C,T3C(出现其中 1 个或 2
2、个或全部)上述单侧检验的 H1也可以是 T1 C,T2 C,T3”和“”。对于大多数假设检验方法,实际应用时都要依据资料之性质及样本之特征注意辨识是否适宜采用单侧检验;如不适宜,则采用双侧检验。单、双侧检验与单、双尾面积假设检验的单侧、双侧与检验中涉及的单尾、双尾,它们既有密切的联系,又有不同的涵义,尤其要注意它们之间在各方法中固有的对应关系。1.一个误解:单侧检验就是“单尾检验”(双侧检验就是“双尾检验”)。为易于解释,单侧检验常通过 t检验法举例说明。在 t-分布图形上,单侧检验的 P 值与单 尾面积相符,于 是,“ONE-SIDED”与“ONE-TA ILED”亦被混用;由此导致将假设检
3、验中单侧的意义与特定分布曲线下的单尾面积视同一体,甚至说成“单尾检验”,这是对单侧检验的错误理解。其实,单侧检验与单尾面积符合一致的情况只存在于某些方法:如 u 检验法、t 检验法(分布对称)、两组秩和检验法、四格表确切概率检验法(分布不对称,唯当 n1=n2时对称),并非广泛存在。2.另一种相符:双侧检验与单尾面积。在 F-分布中,用于检验均数间差异的方差分析,由于被检验的各个均数是无序排列的,故必然是双侧检验;其 P 值对应于 F-分布曲线下界值右端的尾部,故必然是单尾面积。设两个样本的含量为 n1=12和 n2=10,在 F-分布界值表上和 t-分布界值表上可分别查出以下的双侧检验界值,
4、两者并有如下关系:118中国卫生统计 1999年 4 月第 16 卷第 2 期F0.05(1,20)=4.351t0.05(20)=2.0864.351=2.086再设两样本含量相当大时,亦可在 F-分布界值表上和正态分布界值表上分别查出以下的双侧检验界值,两者同样有如下关系:F0.05(1,)=3.841u0.05=1.9603.841=1.960上列两组界值均明确表达了属于双侧检验的对应关系,而其中方差分析的 P 值(0.05)却与F-分布曲线下界值右端面积相符,即双侧检验在此恰与单尾面积相符。此外,?2检验属双侧检验(无序排列),其 P 值对应于?2分布曲线下界值右端的面积,亦是双侧检验
5、与单尾面积的相符。3.一个被忽视的问题:方差齐性检验与特殊的“双尾”面积。设两个样本方差如下,并按相反的两种顺序分别计算 F 值(取?=0.05):其一n1=16,v1=15,V1=8.012n2=11,v2=10,V2=2.231F=8.0122.231=3.591右尾界值F0.025(15,10)=3.522其二n1=11,v1=10,V1=2.231n2=16,v2=15,V2=8.012F=2.2318.012=0.278左尾界值F0.025(10,15)=0.284这里的 P 值是 F(15,10)分布曲线下界值的右尾面积与F(10,15)分布曲线下界值的左尾面积之和,即右尾面积:P
6、 0.025左尾面积:P 0.025P v2,左面积 右面积,方差齐性检验界值近似;当 v1 右面积,方差齐性检验界值近似。图 1方差齐性检验中与F值对应的“双尾”面积4.单侧检验的辨识:备择假设。单侧检验的备择假设,是仅限于从某一确定的方向上偏离无效假设。如:单侧H0?=0H1?0双侧H0?=0H1?0(含?0 和?,不拒绝 H0。至于此处?值究竟是某分布的单尾面积或双尾面积或其他形式的组合,却与结论无直接关系。有的书刊上将ONE-SIDED 与 ONE-T AILED 混淆,应注意纠正。119Chinese Journal of Health Statistics,April1999,V
7、ol.16,No.2只有单侧检验的方法一组按时间顺序,空间顺序或其他顺序收集的数据,当然是有序的。为检验其序列是否具有某种方向上的趋势;如升、降、曲线等,只要散点图分布的“轴”明显偏离其 x-轴者,可通过均方递差检验(Mean squaresuccessive diff erence test)1进行分析。计算公式如下:C=1-s2Ds2H0C=0s2D=(xi+1-xi)22(n-1)H1C 0s2=(x-x-)2n-1?=0.05C 为均方递差检验的统计量;s2D为递差均方;s2为均方。如数据序列是随机的,即无任何方向上的趋势时,s2D为 s2的估计值,总体 C=0;如数据序列具有某方向上
8、的趋势时,则相邻变量值之间的变异程度将小于各变量值与均数之间的变异程度,故将出现 s2D0。当达到 CC0.05时,P?,可作拒绝 H0而接受 H1之结论。此法用于检验数据序列是否存在某种方向趋势时,其统计量 C 值在 01,若 C=0,必然 s2D=s2,表示总体数列只有随机变异,而无任何方向上的趋势。至于另一侧 C 0。当 n 超出工具表 1所列范围时,C 分布将近似正态,可由下式转换为 u 值,而 u?亦必须取单尾面积作为单侧检验的界值。u=Cn-2n2-1u0.05=1.645u0.01=2.326u0.001=3.090此外,某些非参数检验亦属只有单侧检验的方法。单侧检验的应用价值1
9、正确采用单侧检验,理论上将获得高于双侧检验的效率。要对假设检验的不同方法或同一方法的不同应用方式作出评价,最终应以检验效率的高低为准。这个“效率”就是探察出真实 H1之能力,亦称功效或把握度,其概率为(1-?)2。从图 2 可见,在设定的 H0和 H1条件下,用单侧检验时的(1-?)值明显大于双侧检验,亦即前者的把握度大于后者。把握度的值(1-?)随 H0和 H1两个总体的参数之间距而变动:间距越大,(1-?)亦越大,反之越小,并形成把握度曲线,称 OC 曲线(Operating character-istic curve)。从图 3 可见,在设定的总体参数条件下,采用单侧检验时的 OC 曲
10、线始终位于双侧检验时的OC 曲线之上,即前者的(1-?)值始终高于后者,至于高出的幅度,则以(1-?)=?=0.5 为上限。若越过这个极限,原来的(1-?)将与?“对换”,因为显然不应该出现(1-?)?(P=0.06);用 单 侧检验:?=0.05,u?=1.64,P?;用单侧检验是错误的,不应得 Pu(1.88)u?(1)(1.64)因此,必须审慎地根据资料性质并考察样本数据特征,对照所设备择假设 H1的具体内容,确定是否采用单侧检验。若应该用双侧检验而误用单侧检验,将可能导致假阳性结果;若本可以用单侧检验却仍采取双侧检验,则可能导致假阴性结果,亦即失去了做出正确分辨的机会。后者无疑也是一种
11、失误,且往往不易被识破!笔者认为:对于单侧检验的选用既要从严掌握,又要在条件已具备时毅然运用,两者皆不可偏废。(本文承陈峰博士、陈佩珍副教授协助完成,特此致谢!)参考文献1.杨树勤主编.中国医学百科全书医学统计学.第 1 版.上海:上海科学技术出版社,1985,1152.郭祖超主编.医用数理统计方法.第 3 版.北京:人民卫生出版社,1988,108120 急救病人疾病分类统计珲春市卫生防疫站(133300)珲春市医院崔哲根王宏朴成子金海善金信爱本文调查了珲春市 120 急救中心 1997 年 7月1998 年 6月间急救病人的病志,现将结果报告如下。1.有完整记录的病志共 2 017份。其中
12、经抢救无效死亡的29例,占 1.44%。经抢救无效、预后不良,患者自动出院、放弃治疗的 32例,占 1.59%。经急救脱离险情,或转科治疗,治愈出院的共计 1 946 例,占 96.97%。2.以ICD-9 统计分类 2 017例病人(表 1)。在表 1 中可以看出急救中心的主要病人是意外损伤和中毒,各为 683 例和290 例,占急救病人的 33.86%和 14.38%,合计 48.24%。其次病例较多的病种依次为循环系统、消化系统、神经系统和感觉器官及呼吸系统疾病。性别间明显差异的病种有:意外损伤(男女=627162),自杀性药物中毒(男女=48146),上消化道出血(男女=13218),
13、癔病(男女=863)。表 11997年 7月1998 年 6月珲春市 120急救病人疾病分类表疾病名称男例数构成(%)女例数构成(%)计例数构成(%)传染病和寄生虫病151.32121.37271.34肿瘤131.1420.23150.74内分泌、营养和代谢疾病及免疫疾病110.9760.68170.84血液和造血器官疾病20.1710.1130.15神经系统和感觉器官疾病201.768810.011085.35循环系统疾病17115.0317920.3635017.35呼吸系统疾病363.16313.53673.32消化系统疾病15413.5311813.4227213.49泌尿、生殖系统疾病292.55313.53602.98妊娠、分娩和产褥期疾病-10.1110.05皮肤和皮下组织疾病20.17-20.10肌肉、骨骼系统和结缔组织疾病-10.1110.05损伤和中毒62755.1034639.3697348.24体征、症状和不明确情况585.10637.181216.00合计1138100.00879100.002017100.00121Chinese Journal of Health Statistics,April1999,V ol.16,No.2






