收藏 分销(赏)

多个样本均数间的两两比较.pdf

上传人:xrp****65 文档编号:5684899 上传时间:2024-11-15 格式:PDF 页数:6 大小:1.54MB 下载积分:10 金币
下载 相关 举报
多个样本均数间的两两比较.pdf_第1页
第1页 / 共6页
多个样本均数间的两两比较.pdf_第2页
第2页 / 共6页


点击查看更多>>
资源描述
2 0 0 8年6月第8卷第3期循证医学T h e J o u r n a l o f E v i d e n c e-B a s e dM e d i c i n eJ u n.2 0 0 8V o l.8 N o.3 循证医学中的医学统计学问题 对完全随机设计多组平均水平进行比较时,当资料满足正态性和方差齐性,就可以尝试方差分析,若得到P !的结果(一般!=0.0 5),不拒绝零假设,认为各组样本来自均数相等的总体,即不同的处理产生的效应居于同一水平,分析到此结束;若方差分析结果P!,则拒绝零假设,接受备择假设,认为各处理组的总体均数不等或不全相等,即各个处理组中至少有两组的总体均数居于不同水平。这是一个概括性的结论,研究者往往希望进一步了解具体是哪两组的总体均数居于不同水平,哪两组的总体均数相等,这就需要进一步作两两比较来考察各个组别之间的差别。实际工作中,对于不满足方差分析应用条件的资料需要进行数据转换后再选择适合的方法作假设检验,或直接选择非参数统计方法对资料进行分析。本文主要针对那些满足正态性、方差齐性的资料展开讨论。均数间的两两比较根据研究设计的不同分为两种类型:一种常见于探索性研究,在研究设计阶段并不明确哪些组别之间的对比是更为关注的,也不明确哪些组别间的关系已有定论、无需再探究,经方差分析结果提示“概括而言各组均数不相同”后,对每一对样本均数都进行比较,从中寻找有统计学意义的差异;另一种是在设计阶段根据研究目的或专业知识所决定的某些均数间的比较,常见于证实性研究中多个处理组与对照组、施加处理后的不同时间点与处理前比较。最初的设计方案不同,对应选择的检验方法也不同,下面分述两种不同设计均数两两比较的方法选择。1事先计划好的某对或某几对均数间的比较适用于证实性研究。在设计时就设定了要比较多个样本均数间的两两比较张熙,张晋昕(中山大学公共卫生学院,广州5 1 0 0 8 0)摘要 从几种方法的原理,适用范围及条件等角度评述均数间两两比较的方法。文中共提到十二种检验方法,根据用途的不同分为三类,其中包括在方差不齐时进行两两比较的方法。同时提出进行两两比较时方法选择的具体方案。关键词 两两比较;多重比较 中图分类号R 1 9 5.1 文献标识码A 文章编号1 6 7 1-5 1 4 4(2 0 0 8)0 3-0 1 6 7-0 5T h eMe t h o df o rMu l t i p l eC o mp a r i s o n sZ H A N GX i,Z H A N GJ i n-x i n(S c h o o l o f P u b l i cH e a l t h,S u nY a t-s e nU n i v e r s i t y,G u a n g z h o u5 1 0 0 8 0,C h i n a)A b s t r a c t:M a k ear e v i e wa b o u t P o s t H o ct e s t o np r i n c i p l e sa n da p p l i e da r e a so f e v e r ym e t h o d.T h e r ea r e1 2m e t h o d si nt h i sp a p e r t o t a l l y,d i v i d e di n t o3k i n d sb yp u r p o s e s.T h e r ea r ea l s os o m eP o s t H o ct e s t m e t h o d sf o r t h eu n e q u a l v a r i a n c e s.T h e s p e c i f i c w a y a b o u t h o wt o c h o o s e a na p p r o p r i a t e P o s t H o c t e s t f r o mv a r i o u s m e t h o d s i s p r o v i d e d.K e yw o r d s:m u l t i p l ec o m p a r i s o n s;P o s t H o ct e s t 基金项目 中山大学本科教学课程建设项目(编号:中大教务2 0 0 73 4号-2-2 0)作者简介 张熙(1 9 8 2-),女,山西晋中人,医学统计与流行病学在读硕士研究生。通讯作者 张晋昕,T e l:0 2 0-8 7 3 3 2 4 5 3;E-m a i l:z h j i n x m a i l.s y s u.e d u.c n循证医学2 0 0 8年第8卷第3期的组别,其他组别间不必作比较。常用的方法有:D u n n e t t-t检验、L S D-t检验(F i s h e r 2s l e a s t s i g n i f i c a n td i f f e r e n c et t e s t)。这两种方法不管方差分析的结果如何即便对于P稍大于检验水准!,也可进行所关心组别间的比较。1.1 L S D-t检验L S D-t检验即最小显著差法,是F i s h e r 1 9 3 5年提出的,多用于检验某一对或某几对在专业上有特殊探索价值的均数间的两两比较,并且在多组均数的方差分析没有推翻无效假设H0时也可以应用。L S D-t检验统计量的计算公式1为:L S D-t=Xi-XjSXi-Xj,v=v误差式中SXi-Xj=M S误差()!1ni1nj+,Xi,ni和Xj,nj为两个对比组第i组与第j组的样本均数和样本含量。L S D-t检验统计量将两独立样本t检验的均方部分(计算统计量时的分母SXi-Xj)进行适当的调整,SX i-X j和自由度通过方差分析中的误差均方M S误差和v误差来估计,而两独立样本的t检验中SXi-Xj用合并方差SC2,自由度由v=n1+n2-2来计算,然后根据t界值来确定P值,作出统计推断。实例分析1研究单味中药对小鼠细胞免疫机能的影响,把4 0只小鼠随机分为4组,每组1 0只,雌雄各半,用药1 5天后,测定E-玫瑰结形成率(%),数据如表1。经检验,各组方差齐,方差分析的结果为:F=1 0 0.9 7 9,P 0.0 0 1。应用L S D-t检验进行两两比较,结果如表2,三种药物与对照组之间的差别均有统计学意义。该方法实质上就是t检验,检验水准无需作任何修正,只是在标准误的计算上充分利用了样本信息,为所有的均数统一估计出一个更为稳健的标准误,因此它一般用于事先就已经明确所要实施对比的具体组别的多重比较。由于该方法本质思想与t检验相同,所以只适用于两个相互独立的样本均数的比较。L S D法单次比较的检验水准仍为!,因此可以认为该方法是最为灵敏的两两比较方法。另一方面,由于L S D法侧重于减少第类错误,势必导致此法在突出组间差异的同时,有增大类错误的倾向2。1.2 D u n n e t t-t(新复极差法)检验D u n c a n21 9 5 5年在N e w m a n及K e u l s的复极差法(m u l t i p l er a n g em e t h o d)基础上提出,该方法与T u k e y法相类似。适用于n-1个试验组与一个对照组均数差别的多重比较,多用于证实性研究。D u n n e t t-t统计量的计算公式与L S D-t检验完全相同3:D u n n e t t-t=Xi-X0SXi-X0,v=v误差式中M S误差()!1ni1n0+SXi-X0=,Xi,ni和X0,n0分别为实验组和对照组的样本均数和样本含量。需特别指出的是D u n n e t t-t检验有专门的界值表,不同于t检验的界值表3。实例分析2实例分析1的数据也可以应用D u n n e t t-t进行两两比较,结果如表3,三种药物与对照组相比差异均有统计学意义。表1小鼠细胞E-玫瑰结形成率比 较 组对 照 组党 参 组黄 芪 组淫羊藿组1 42 12 43 51 02 42 02 71 21 82 23 31 61 71 83 01 32 21 73 11 41 92 13 31 21 81 83 51 02 32 23 01 32 01 92 891 82 33 6小鼠细胞E-玫瑰结形成率%表2 L S D-t两两比较结果对比组党 参 组 与 对 照 组黄 芪 组 与 对 照 组淫羊藿组与对照组均数差值7.78.11 9.5标准差1.1 31.1 31.1 3统计量6.8 17.1 71 7.2 60.0 52.4 32.4 32.4 30.0 12.7 22.7 22.7 2P 0.0 0 1 0.0 0 1 0.0 0 1界值表3 D u n n e t t-t两两比较结果对比组党 参 组 与 对 照 组黄 芪 组 与 对 照 组淫羊藿组与对照组|Xi-X0|7.78.11 9.5SXi-X01.1 31.1 31.1 3D u n n e t t-t6.8 17.1 71 7.2 60.0 52.1 32.1 32.1 30.0 12.8 22.8 22.8 2P 0.0 0 1 0.0 0 1 0.0 5界值表6各组大鼠接种后生存日数数据大鼠接种后生存日数天组别伤 寒 组百日咳组对 照 组568769871 0981 0981 01 091 11 091 21 11 01 21 11 01 41 21 11 6经检验,各组资料方差齐,方差分析结果为:F=4.7 7 6,P=0.0 1 7。进行T u k e y两两比较,检验结果如表7,小鼠在感染脊髓灰质炎病毒后再接种伤寒、百日咳的生存日数均与对照组不同。张熙,等.多个样本均数间的两两比较1 6 9循证医学2 0 0 8年第8卷第3期2.3 S c h f f e法与一般的多重比较不同,S c h f f e法的实质是对多组均数间的线性组合是否为0进行假设检验4,多用于对比组样本含量不等的资料。在单因素的多重比较问题中,除了要逐对比较因素水平的平均效应之外,有时还有可能要比较因素水平平均效应的线性组合8。例如将有基本相同的因素水平平均效应的几个组,构成一个综合组。因此可能检验这样的假设:!1-!2+!32=0。设c1,c2,cI为一组常数,满足称 参 数 的 线 性 组 合ci!i为 一 个“对 比”(c o n t r a s t)。其检验方法为:当时,就认为:ci!i0,否则就认为ci!i=0。显然,前面讨论的参数的两两比较属于一类特殊的对比。S c h f f e法可以同时检验所有可能的对比,即同时检验任何一组对比。S c h f f e法的优点是可以检验任意的线性对比。在这方面,T u k e y法不如S c h f f e法。但是在单纯作逐对因素效应均值的比较时,S c h f f e法 的 效 率 不 如T u k e y法 高。也 就 是 说,S c h f f e法 更 易 于 将 显 著 的 差 异 判 定 为 不 显 著(T u k e y法认为)。在实际场合,当单纯作逐对均值比较时,建议用T u k e y法;而当要做多个一般的线性对比检验时,就要用S c h f f e法。S c h f f e法检验实质上对F值进行了简单的校正,将比较的组数纳入考虑的范畴:(I-1)F。该方法的检验统计量代表了最大可能的累积类错误的概率。遗憾的是,由于控制类错误时的“矫枉过正”,会最终导致较大的类错误的概率5。3探索性研究和证实性研究均适用的检验方法常见的有:B o n f e r r o n i t检验、Si d kt检验。3.1 B o n f e r r o n i t检验B o n f e r r o n i t检验的基本思想是9:如果三个样本均数经A N O V A检验差 异有统计学 意义(=0.0 5),需对每两个均数进行比较,共需比较的次数为:m=C23=3,由于每进行一次比较犯类错误的概率是=0.0 5,那么比较3次至少有一次犯类错误的概率就是:=1-0.9 530.1 4 26 0.0 5。因此,要使多次比较犯类错误的概率不大于原检验水准,现有的检验水准应该进行调整,用=/m作为检验水准的调整值,两两比较得出的P值与其进行比较。该方法的思想适用于所有的两两比较,并且该方法的适用范围很广,不仅仅限于方差分析,例如相关系数的检验和卡方检验也适用5,9。B o n f e r r o n i t检验的方法和思想容易理解,操作简便,但是严格地控制了类错误的同时增大了类错误的发生概率,在结论的给出方面是一种比较保守的方法1 0。实例分析5这里仍引用表6数据,调整检验水准=0.0 5/3=0.0 1 7为检验水准,结果如表8。只有伤寒与对照组之间的差别被认为有统计学意义。3.2 Si d kt检验该方法通过Si d k校正降低每次两两比较的类错误概率,以达到最终整个比较的类错误发生率不超过的目的。B o n f e r r o n i t检验1 0与Si d kt检验相似,B o n-f e r r o n i t检验是Si d kt检验的近似计算,但是由于B o n f e r r o n i t检验在计算上容易实现,所以应用较广。相比较而言,B o n f e r r o n i t检验在给出推断结论时更为审慎,不容易得到拒绝零假设的结果。两种检验在对比组数增加、比较组不独立时,推断结论更趋保守。以上方法都必须在满足方差齐性的前提条件时才可以应用,另外还有一些方法是在不满足方差齐性时多重比较的方法4:T a m h a n e Ns T2、D u n n e t t Ns T3、G a m e s-H o w e l l、D u n n e t t Ns C。T a m h a n e Ns T2是一种基于t检验原理的两两比较方法,该方法比较保守。D u n n e t t NsT3则 是 以 最 大 的t值(s t u d e n t i z e d表8 B o n f e r r o n i t检验结果对比组伤寒组与百日咳组伤 寒 组 与 对 照 组百日咳组与对照组|Xi-Xj|2.0 02.8 00.8 0t2.1 43.0 00.8 6P0.1 20.0 21.0 01 7 0m a x i m u mm o d u l u s)为基础的。G a m e s-H o w e l l检验方法是比较宽大的一种两两比较方法。G a m e s-H o w e l l方法将方差不齐的组数作为一个影响因素纳入考虑范畴。严重的方差不齐和样本含量过小都会使类错误的概率增加。G a m e s-H o w e l l检验基于We l c h 3s对t检验的自由度进行校正,并使用了学生化极差作为统计量4,5。该检验适用于样本含量小且方差不齐(轻度方差不齐例外)时的情况。该方法是方差不齐时的一种较好的方法。D u n n e t t 3s C是一种基于学生化极差的适用于方差不齐情况时两两比较的方法4。综上所述,对于研究设计阶段并未安排多重比较的应用情形,且在进行多组均数方差分析P 0.0 5时,最好不要进行多重比较4。两两比较方法的选择应从以下几个方面考虑:首先,根据原始数据自身的特点,选择合适的方法;以方法的适用条件作为前提;根据研究的目的选择适合的多重比较方法。多重比较前先对应用条件进行综合考虑,才能得到趋于合理的结果。实践过程中可以参考图1作出抉择。参 考 文 献方积乾.医学统计学与电脑试验M.第3版.上海:上海科学技术出版社,2 0 0 6:1 6 2-1 6 4.陈森.多重比较的应用J.中南林业调查规划,1 9 9 0,(3):3 3-3 7.方积乾.卫生统计学M.第6版.北京:人民卫生出版社,2 0 0 8:1 3 8-1 4 1.张文彤.S P S S统计分析教程M.北京:北京希望电子出版社,2 0 0 2:2 3 3-2 3 4.*N e w s o mU S P5 3 4D a t aA n a l y s i s I S p r i n g2 0 0 6.h t t p:/2 0 3.2 0 8.3 5.1 0 1/s e a r c h?q=c a c h e:1 S i 0 D C w S w q k J:w w w.u p a.p d x.e d u/I O A/n e w s o m/d a 1/h o _ p o s t h o c.图1多组均数间比较时的方法选择流程图12345(下转第1 7 6页)张熙,等.多个样本均数间的两两比较1 7 1循证医学2 0 0 8年第8卷第3期d o c+P o s t+H o c+T e s t s&h l=z h-C N&c t=c l n k&c d=5&g l=c n&s t _ u s g=A L h d y 2 8o i q g 1 G U s p C f p-f I e k m z v s P V N 0 w A*L e s s o n1 6P o s t-h o cT e s t s.h t t p:/f a c u l t y.u n c f s u.e d u/d w a l l a c e/l e s s o n%2 0 1 6.p d f陈长生.卫生统计学M.北京:科学技术文献出版社,2 0 0 4:1 1 1-1 1 3.*多 重 比 较.h t t p:/f a c u l t y.m a t h.t s i n g h u a.e d u.c n/x l u/p d f/c 1 s 2.p d f伍小英,鲁婧婧,张晋昕.两两比较的B o n f e r r o n i法J.循证医学,2 0 0 6,6(6):3 6 1-3 6 3.*H e r v A b d i 1.T h eB o n f e r r o n n ia n dSi d k C o r r e c t i o n sf o rM u l t i p l eC o m p a r i s o n s.h t t p:/w w w.u t d a l l a s.e d u/h e r v e/A b d i-B o n f e r r o n i 2 0 0 7-p r e t t y.p d f.注:带*的文献原文均未提供作者的姓名。收稿日期2 0 0 8-0 3-1 767891 0(上接第1 7 1页)们应根据临床意义合理设定M a r k o v状态。其次,计算量大,实际工作者很难编制通用的计算程序,虽然国外已有这一方面的软件,但购买软件包的费用太高,这在一定程度上限制了其推广。参考文献C h i a n gC L.I n t r o d u c t i o nt os t o c h a s t i cp r o c e s si nb i o s t a t i s t i c sM.N e wY o r k:Wi l e y,1 9 6 8.L e v i n g t o nA,S c h u l m a nJ.K a m m e r m a nL,e t a l.Ap r o b a b i l i t ym o d e l o f h e a d a c h er e c u r r e n c eJ.J C h r o n i cD i s,1 9 8 0,5 3:4 0 7-4 1 2.H i l l i s A,M a g u i r eM,H a w k i n s M S,e t a l.T h eM a r k o vp r o c e s sa s ag e n e r a l m e t h o df o r n o n p a r a m e t r i ca n a l y s i s o f r i g h t-c e n s o r e dm e d i c a l d a t aJ.J C h r o n i cD i s,1 9 8 6,3 9(8):5 9 5-6 0 4.S i l v e r s t e i nM S,A l b e r t D A,H a d l e rN M,e t a l.P r o g n o s i si nS L E:C o m p a r i s o no f M a r k o vm o d e l t ol i f et a b l ea n a l y s i sJ.JC l i nE p i d e m i o l,1 9 8 8,4 1:6 2 3-6 3 3.K a yR.A M a r k o vm o d e lf o ra n a l y z i n gc a n c e rm a r k e r sa n dd i s e a s e s t a t e s i ns u r v i v a l s t u d i e sJ.B i o m e t r i c s,1 9 8 6,4 2:8 5 5-8 6 5.L o n g i n i I M,C l a r kWS,B y e r s R H,e t a l.S t a t i s t i c a l a n a l y s i s o ft h es t a g e so rH I Vi n f e c t i o nu s i n gaM a r k o vm o d e lJ.S t a tM e d,1 9 8 9(8):8 3 1-8 4 3.柳青,方积乾,胡孟玻,等.鼻咽癌疾病自然史的随机模型研究 J.中国卫生统计,1 9 9 7,1 4(4):1 2-1 5.万崇华,方积乾,周文清,等.纵向生命质全资料分析的M a r k o v过程法及其应用 J.中华流行病学杂志,1 9 9 9,2 0(3):1 6 2-1 6 5.林曦敏,丁玎,张普洪,等.干扰素治疗慢性乙型肝炎患者的成本效果分析 J.中华肝病杂志,1 9 9 9,7(2):8 4-8 7.B r i g g s A,S c u l p h e r M.A ni n t r o d u c t i o nt oM a r k o vm o d e l l i n gf o re c o n o m i ce v a l u a t i o nM.P h a r m a c o e c o n o m i c,1 9 9 8,1 3(4):3 9 7-4 0 9.丁元林,孔丹莉,倪宗瓒.多状态M a r k o v模型及其在慢性病流行病学研究中的应用J.中国公共卫生,2 0 0 2,1 8(1 2):1 4 2 0-1 4 2 2.王倩,金丕焕.M a r k o v模型在卫生经济评价的应用J.中国卫生统计,2 0 0 0,1 7(2):8 6-8 8.F u r l o n gW,F e e n yD H,T o r r a n c eG,e t a l.G u i d et od e s i g na n dd e v e l o p m e n t o f h e a l t h-s t a t eu t i l i t yi n s t r u m e n t a t i o n:C e n t e rf o rh e a l t he c o n o m i c sa n dp o l i c ya n a l y s i sw o r k i n gp a p e rM.H a m i l t o n,O n t a r i o,C a n a d a:M cM a s t e r U n i v e r s i t y,1 9 9 0.D e w e yH M,T h r i f t A G,M i h a l o p o u l o s C,e t a l.L i f e t i m ec o s t o fs t r o k es u b t y p e si n A u s t r a l i af i n d i n g sf r o m t h e N o r t h E a s tM e l b o u r n eS t r o k eI n c i d e n c eS t u d y(N E M E S I S)J.S t r o k e,2 0 0 3,3 4(1 0):2 5 0 2-2 5 0 7.G r i e v eR,D u n d a sR,B e e c hR,e t a l.T h ed e v e l o p m e n t a n du s eo fam e t h o dt oc o m p a r et h ec o s t so fa c u t es t r o k ea c r o s sE u r o p eJ.A g eA g e i n g,2 0 0 1,3 0(1):6 7-7 2.v a nd e nB r i n kM,Wi l b e r tB,v a nd e nH o u t,e t a l.C o s t-u t i l i t ya n a l y s i so fp r e o p e r a t i v er a d i o t h e r a p yi np a t i e n t sw i t h r e c t a lc a n c e r u n d e r g o i n gt o t a l e s o r e c t a l e x c i s i o n:As t u d yo f t h ed u t c hc o l o r e c t a l c a n c e r g r o u pJ.JC l i nO n c o l,2 0 0 4,2 2(2):2 4 4-2 5 3.姚光弼,王宝恩.重组干扰素治疗慢性乙型肝炎和慢性丙型肝炎的经济学分析J.中华消化杂志,1 9 9 9,1 9(6):3 6 9-3 7 4.王英秋,阎荣久,李伟.应用M a r k o v模型预测桦甸市肾综合征出血热流行趋势 J.职业与健康,2 0 0 0,1 6(9):7 3-7 4.王倩,金丕焕,林果为.筛查幽门螺杆菌预防胃癌的M a r k o v模型卫生经济学评价 J.中华流行病学杂志,2 0 0 3,2 4(2):1 3 5-1 3 9.B r o o k m e y e r R,D a yN E.T w o-s t a g em o d e l s f o r t h ea n a l y s i s o fc a n c e r s c r e e n i n gd a t aJ.B i o m e t r i c s,1 9 8 7,4 3:6 5 7.K a y R.Am a r k o v m o d e l f o r a n a l y z i n g c a n c e r m a r k e r s a n dd i s e a s es t a t e s i ns u r v i v a l s t u d i e sJ.B i o m e t r i c s,1 9 8 7,4 2:8 5 5.蔡全才,姜庆五,郭强,等.疾病传播动力学研究中的流行模拟方法 J.第二军医大学学报,2 0 0 5,2 6(3):3 1 0-3 1 3.收稿日期2 0 0 6-1 1-0 61234567891 01 11 21 31 41 51 61 71 81 92 02 12 21 7 6
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 行业资料 > 医学/心理学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服