1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,循证医学中的常用统计指标,寇长贵,流行病与卫生统计学教研室,1,主要内容,概述,分类资料的指标,数值资料的指标,本,ppt,主要以四川大学华西医院刘关键教授的课件为参考。,2,数据资料可分为数值资料(计量)和分类资料(计数和等级)两大类。统计指标因而也分为数值资料指标与分类资料指标两类。,统计指标可用于描述性的统计分析,也是反映数据基本特征的统计分析方法。并可使人们准确、全面地了解数据资料所包涵的信息,以便于在此基础上完成资料的进一步统计分析。,概述,可信区间,3,概述,可信区间,可信区间(,confide
2、nce interval,,,CI,)是循证医学中常用的统计指标之一。,可信区间主要用于估计总体参数,从获取的样本数据资料估计某个指标的总体值(参数)。如:率的可信区间估计总体率,均数的可信区间估计总体均数。,4,概述,可信区间,此外,可信区间还可用于假设检验,尤其是试验组与对照组某指标差值或比值的可信区间,在循证医学中更为常用。,通常,试验组与对照组某指标差值或比值的,95%,可信区间与,为,0.05,的假设检验等价,,99%,的,CI,与,为,0.01,的假设检验等价。,5,概述,可信区间,常用的可信区间有:率的可信区间、两率差值的可信区间、均数的可信区间、两均数差值的可信区间、相对危险度
3、可信区间等。,循证医学中常用的是率的可信区间、,RR,或,OR,的可信区间、均数的可信区间、两均数差值的可信区间等。,6,分类资料的指标,在循证医学的研究与实践中,除了有效率、死亡率、患病率、发病率等常用率的指标外,相对危险度(,RR,)、比值比(,OR,)及由此导出的其他指标也是循证医学中富有特色的指标。,目前,在循证医学中分类资料常用的描述指标主要有,EER,、,CER,、,OR,、,RR,、,RRR,、,ARR,、,NNT,等。,7,1,、,ERR,与,CER,循证医学中预防和治疗性试验中,率可细分为,EER,和,CER,两类。,EER,即试验组中某事件的发生率,(experimenta
4、l event rate,,,EER),,如对某病采用某些防治措施后该疾病的发生率。,CER,即对照组中某事件的发生率,(control event rate,,,CER),,如对某病不采取防治措施的发生率。,8,两个发生率的差即为率差,也称危险差(,rate difference,,,risk difference,,,RD,),如,试验组发生率(,EER,)与对照组发生率(,CER,)的差,其大小可反映试验效应的大小。,两率差的可信区间由下式计算:,|p1-p2|u,SE(p1-p2),=(RD,u,SE(p1-p2),,,RD+u,SE(p1-p2),2,RD,(率差)及可信区间,9,两
5、率差为,0,时,两组的某事件发生率没有差别。因而两率差的可信区间不包含,0,(上下限均大于,0,或上下限均小于,0,),则两个率有差别;反之,两率差的可信区间包含,0,,则无统计学意义。,2,RD,(率差)及可信区间,10,阿斯匹林治疗心肌梗死的效果,2,RD,(率差)及可信区间,死亡,未死亡,例数,阿斯匹林治疗组,15,(,a,),110,(,b,),125,(,),对照组,30,(,c,),90,(,d,),120,(,),合计,45,200,245,(),11,阿斯匹林治疗心肌梗死的效果,EER=,15/125,=12%,,,CER,=30/120,=25%,,两率差的标准误:,2,RD
6、,(率差)及可信区间,12,该试验两率差(,RD,)的可信区间为:,RDu,SE(p1-p2),=,(,0.12-0.25,),1.960.049=(-0.23,,,-0.03),该例两率差的可信区间为,(-0.23,,,-0.03),,上下限均小于,0,(不包含,0,),两率有差别。可认为阿斯匹林可降低心肌梗死的病死率。,2,RD,(率差)及可信区间,13,相对危险度,RR,(,relative risk,RR,)是前瞻性研究中较常用的指标,它是试验组某事件发生率,p1,与对照组(或低暴露)的发生率,p0,之比,用于说明前者是后者的多少倍,常用来表示试验因素与疾病联系的强度及其在病因学上的意
7、义大小。其计算方法为:,RR=P1/P0=EER/CER,3,RR,及可信区间,14,当,RR,1,时,可认为试验因素与疾病无关;,当,RR,1,时,可认为试验组发生率大于对照组;,当,RR,1,时,可认为试验组发生率小于对照组。,3,RR,及可信区间,15,3,RR,及可信区间,RR,的可信区间,应采用自然对数进行计算,即应求,RR,的自然对数值,ln(RR),和,ln(RR),的标准误,SE(lnRR),,其计算公式如下:,16,ln(RR),的,1,可信区间为:,ln(RR)u,SE(lnRR),RR,的可信区间为:,exp ln(RR)u,SE(lnRR),由于,RR=1,时为试验因素
8、与疾病无关,故其可信区间不包含,1,时为有统计学意义;反之,其可信区间包含,1,时为无统计学意义。,3,RR,及可信区间,17,3,RR,及可信区间,阿斯匹林治疗组的病死率,p1=15/125,;对照组的病死率,p0=30/120,,其,RR,和可信区间为:,18,3,RR,及可信区间,RR,的,95%,可信区间为:,exp ln(RR)1.96 SE(lnRR),=exp,(,-0.734 1.960.289,),=(0.272,,,0.846),该例,RR,的,95%,可信区间为,0.272,0.846,,使用阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林可降低心肌梗死有效。,19
9、,odds1,是病例组暴露率,p1,和非暴露率,1-p1,的比值,即,odds1=p1/(1-p1),,,odds0,是对照组暴露率,p0,和非暴露率,1-p0,的比值,即,odds0=p0/(1-p0),,,以上两个比值之比即为比值比,(odds ratio,,,OR),,又称机会比、优势比等。公式为:,OR=ad/bc,4,OR,及可信区间,20,当所研究疾病的发病率较低时,即,a,和,c,均较小时,,OR,近似于,RR,,故在回顾性研究中可用,OR,估计,RR,;,由于前瞻性研究中,,RR,的可信区间与,OR,的可信区间很相近,因此,常用,OR,可信区间的计算来代替,RR,的可信区间的计
10、算。,OR,值的解释与,RR,相同。,4,OR,及可信区间,21,4,OR,及可信区间,OR,的可信区间同样需要采用自然对数计算,其,ln(OR),的标准误,SE(lnOR),按下式计算:,22,ln(OR),的可信区间为:,ln(OR)u,SE(lnOR),OR,的可信区间为:,exp ln(OR)u,SE(lnOR),4,OR,及可信区间,23,4,OR,及可信区间,24,4,OR,及可信区间,OR,的,95%,可信区间为:,exp ln(OR)1.96SE(lnOR),=exp(-0.8941.960.347,),=(0.207,,,0.807),该例,OR,的,95%,可信区间为,(0
11、.207,,,0.807),,可以认为阿斯匹林治疗心肌梗死有效。,25,5,RRR,及可信区间,RRR,为相对危险度减少率,(relative risk reduction),,其计算公式为:,RRR=|CER-EER|/CER=1-RR,RRR,的可信区间可由,1-RR,计算得到。,如前例,RR=0.48,,其,95%,的可信区间为,(0.272,,,0.846),,其,RRR=1-0.48=0.52,,,RRR,的,95%,可信区间为,(0.154,,,0.728),。,26,5,RRR,及可信区间,RRR,反映了某试验因素使某结果的发生率增加或减少的相对量,但是,该指标无法衡量发生率增减
12、的绝对量。,如:试验人群中某病的发生率,EER=39%,,而对照组人群的发生率,CER=50%,,,RRR=(CER-EER)/CER,=(50%-39%)/50%=22%,。,但是,若在另一研究中,试验组的疾病发生率为,0.39/10,万,对照组的疾病发生率为,0.50/10,万,其,RRR,仍为,22%,。,27,6,RRI,RRI,,相对危险度增加率,(relative risk increase,,,RRI),,试验组中某不利结果的发生率为,EERb,,对照组某不利结果的发生率为,CERb,,,RRI,可按下式计算:,RRI=|EERb,CERb|/CERb,该指标可反映采用试验因素处
13、理后,患者的不利结果增加的百分比。,28,RBI,,相对获益增加率,(relative benefit increase,,,RBI),,试验组中某有益结果的发生率为,EERg,,对照组某有益结果的发生率为,CERg,,,RBI,可按下式计算:,RBI=|EERg-CERg|/CERg,该指标可反映采用试验因素处理后,患者的有益结果增加的百分比。,7,RBI,29,8,ARR,及可信区间,绝对危险度减少率,(absolute risk reduction,,,ARR),,其计算公式为:,ARR=|CER-EER|,ARR,的可信区间为:,ARRu,SE,=(ARR,u,SE,,,ARR+u,S
14、E),30,8,ARR,及可信区间,31,其,95%,的可信区间为:,ARRu,SE=(ARR,u,SE,,,ARR,u,SE),=(0.13,1.960.049,,,0.13,1.960.049),=(3.4%,,,22.6%),该治愈率的,95%,的可信区间为,(3.4%,,,22.6%),。,8,ARR,及可信区间,32,9,ARI,绝对危险度增加率,(absolute risk increase,,,ARI),,即试验组中某不利结果发生率,EERb,与对照组某不利结果发生率,CERb,的差值,不利结果(,bad outcomes,)如:死亡、复发、无效等,其计算公式为,:,ARI=|E
15、ERb,CERb|,该指标可反映采用试验因素处理后,患者的不利结果增加的绝对值。,33,绝对受益增加率,(absolute benefit increase,,,ABI),,即试验组中某有益结果发生率,EERg,与对照组某有益结果发生率,CERg,的差值,有益结果(,good outcomes,)如:治愈、显效、有效等,其计算公式为:,ABI=|EERg-CERg|,该指标可反映采用试验因素处理后,患者的有益结果增加的绝对值。,10,ABI,34,11,NNT,、,NNH,及可信区间,NNT(the number needed to treat),的临床含义为:对病人采用某种防治措施处理,得到
16、一例有利结果需要防治的病例数(,the number of patients who need to be treated to achieve one additional favorable outcome,,,NNT,)。其计算公式为:,NNT=1/|CER-EER|=1/ARR,从公式可见,,NNT,的值越小,该防治效果就越好,其临床意义也就越大。,35,NNT,的,95%,的可信区间,由于无法计算,NNT,的标准误,但,NNT=1/ARR,,故,NNT,的,95%,的可信区间的计算可利用,ARR,的,95%,的可信区间来计算。,NNT95%,可信区间的下限:,1/ARR,的上限值,N
17、NT95%,可信区间的上限:,1/ARR,的下限值,例如某试验的,ARR,的,95%CI,为,3.4%,22.6%,,其,NNT,的,95%CI,下限为:,1/22.6%=4.4,;上限为:,1/3.4%=29.4,,即,4.4,29.4,。,11,NNT,、,NNH,及可信区间,36,12,NNH,NNH,的临床含义为:对病人采用某种防治措施处理,出现一例副作用需要处理的病例数,(the number needed to harm one more patients from the therapy,,,NNH),。其计算式为:,NNH=1/ARI,从公式可见,,NNH,的值越小,某治疗措施
18、引起的副反应就越大。,37,13,LHH,LHH,,防治性措施受益与危害的似然比(,likelihood of being helped vs.harmed,LHH,),其计算公式为:,LHH=NNH/NNT,该指标反映了防治措施给受试者带来的受益与危害的比例,,LHH1,,利大于敝,反之,,LHH1,时,敝大于利。,38,WMD(,加权均数差,),SMD(,标准化均数差,),数值资料的指标,39,1.WMD,加权均数差,(WMD,Weighted Mean Difference),某个研究的两均数差,d,可按下式计算,:,40,1.WMD,两均数差,d,的方差,Var(d),,可按下式计算:
19、,41,1.WMD,从公式可见,加权均数差,(Weighted Mean Difference,WMD),即为两均数的差值。,该指标以试验原有的测量单位,真实地反映了试验效应,消除了绝对值大小对结果的影响,在实际应用时,该指标容易被理解和解释。,42,2.SMD,标准化均数差,(Standardised Mean Difference,SMD),某个研究的标准化均数差,d,,可按下式计算:,43,2.SMD,标准化均数差,d,的方差,Var(d),,可按下式计算:,44,2.SMD,SMD,可简单地理解为两均数的差值再除以合并标准差的商,它不仅消除了某研究的绝对值大小的影响,还消除了测量单位对结果的影响。因此,该指标尤其适用于单位不同或均数相差较大的数值资料分析。,但是,标准化均数差,(SMD),是一个没有单位的值,因而,对,SMD,分析的结果解释要慎重。,45,46,47,结束语,成功之路在脚下延伸,科学需要铺垫与积累,48,