1、 在医学研究中,针对某一具体问题常有许多学者进行研究,由于研究结果具有偶然性或由于样本含量过小等原因,使得研究结果可能不一致甚至相反,单个研究结果难以下结论,因此需要对所有研究结果进行综合。对研究结果进行对研究结果进行综合综合的的传统方法传统方法是进行是进行分析性综述分析性综述。综合结果依赖于综述者的主观分析;一个一综合结果依赖于综述者的主观分析;一个一个例举方式且为描述性;根据多个定性结果综合个例举方式且为描述性;根据多个定性结果综合定性结论如有效或无效等;所选择的文章仅包括定性结论如有效或无效等;所选择的文章仅包括那些认为研究质量较好且感兴趣的文章;不验证那些认为研究质量较好且感兴趣的文章
2、;不验证研究特征与研究结果之间的一致性或其影响研究特征与研究结果之间的一致性或其影响。综综 述述 因此,传统综述的方法因此,传统综述的方法难以保证研究结果的真实性、难以保证研究结果的真实性、可靠性和科学性可靠性和科学性,尤其是当多个研究的结果不一致时,尤其是当多个研究的结果不一致时,容易产生困惑或误解。容易产生困惑或误解。问题的提出Hackshaw et al.conducted a very comprehensive systematic review in 1997 They identified 37 published studies that reported risk of lu
3、ng cancer among lifelong non-smoking women according to the husbands smoking statusTheir meta-analysis revealed that the overall risk of lung cancer among lifelong non-smoking women was 1.24 times higher when their husbands smoked,as compared to those women whose husbands did not smoke.让我们来看看让我们来看看系
4、统评价的真实面目系统评价的真实面目系统评价的定义 系统评价是一全新的文献综合评价临床研究方法,其基本过程是以某一具体临床问题为基础,系统、全面地收集全世界所有已发表或未发表的临床研究结果,采用临床流行病学严格评价文献的原则和方法,筛选出符合质量标准的文献,进行定性或定量合成,去粗取精,去伪存真,得出综合可靠的结论。同时,随着新的临床研究结果的出现进行及时的更新。Systematic review(SR)Systematic review(SR)“A summary of the medical literature that uses explicit methods to perform a
5、 thorough literature search and critical appraisal of individual studies and that uses appropriate statistical techniques to combine these valid studies.”-David Sackett等等 2000Meta 分析的定义分析的定义Meta分析的前身源于分析的前身源于1920年年Fisher提出的提出的“合并合并P值值”的思的思想,想,1955年由年由Beecher首次提出初步概念。首次提出初步概念。1976年心理学家年心理学家Glass进一步按照
6、其思想发展为进一步按照其思想发展为“合并统计合并统计量量”,即将合并统计量对文献进行综合分析研究的这类方法,即将合并统计量对文献进行综合分析研究的这类方法称之为称之为Meta分析。分析。20世纪世纪80年代中期开始,年代中期开始,Meta分析逐步被引入到临床随机分析逐步被引入到临床随机对照试验以及观察性的流行病学研究中。对照试验以及观察性的流行病学研究中。A systematic review that uses quantitative methods to summarize the result.运用定量的方法汇总多个研究结果的运用定量的方法汇总多个研究结果的系统评价系统评价方法。方法。
7、Evidence-based Mdicine 2000Meta analysis is statistical technique for assembling the results of several studies in a review into a single numerical estimate.Meta分析是将系统评价中的多个不同结果的同类研分析是将系统评价中的多个不同结果的同类研究合并为一个量化指标的究合并为一个量化指标的统计学方法统计学方法。The Cochrane Library三、三、Meta 分析的作用和应用条件分析的作用和应用条件增大样本含量,减少随机误差所致的差
8、异,增大和提高统增大样本含量,减少随机误差所致的差异,增大和提高统计分析效能计分析效能增加效应量的估计精度增加效应量的估计精度探讨多个研究结果间的异质性,实现不一致研究结果间的探讨多个研究结果间的异质性,实现不一致研究结果间的定量综合定量综合,即分析多个同类研究的分歧和原因,即分析多个同类研究的分歧和原因引出新的见解引出新的见解节省研究经费节省研究经费作作 用用应用条件应用条件 纳入研究必须具有足够的相似性纳入研究必须具有足够的相似性。Meta分析并不能提高原始研究的证据强度分析并不能提高原始研究的证据强度。&严格掌握严格掌握Meta分析的使用条件,才能得到较为可靠的结论。分析的使用条
9、件,才能得到较为可靠的结论。Meta analysis的局限性1 没有纳入全部的相关研究没有纳入全部的相关研究2 不能提取全部相关数据不能提取全部相关数据3 发表偏性(发表偏性(Publication bias)only studies with positive findings published/accepted4 用于合并统计的临床终点定义不明确用于合并统计的临床终点定义不明确系统评价与Meta分析的关系系统评价并非必须对纳入研究进行统计学合并(系统评价并非必须对纳入研究进行统计学合并(Meta分析)分析)是否做是否做Meta分析需要视纳入研究是否有足够的相似性分析需要视纳入研究是否有
10、足够的相似性Meta分析也并非一定要做系统评价,因为其本质是一种统计分析也并非一定要做系统评价,因为其本质是一种统计学方法学方法包含有对具同质性的多个研究进行包含有对具同质性的多个研究进行Meta分析的系统评价称为分析的系统评价称为定量系统评价定量系统评价如果纳入研究不具有同质性,则不进行如果纳入研究不具有同质性,则不进行Meta分析,而仅进行分析,而仅进行描述性的系统评价,此类系统评价称为描述性的系统评价,此类系统评价称为定性系统评价定性系统评价系统评价的要点研究设计:需专业知识及研究能力研究设计:需专业知识及研究能力严格评价:需流行病学知识严格评价:需流行病学知识统计分析:需统计学基础统计
11、分析:需统计学基础结果解释:需专业及研究能力,客观,理性结果解释:需专业及研究能力,客观,理性基本原则与原始试验的设计类似基本原则与原始试验的设计类似,原始试验以人为研究对,原始试验以人为研究对象及单位,系统评价以象及单位,系统评价以单个的临床研究论文单个的临床研究论文为研究对象及为研究对象及单位单位系统评价的主要特征系统评价的主要特征全面收集所有有关研究全面收集所有有关研究对所有纳入的研究逐个进行严格评价对所有纳入的研究逐个进行严格评价联合所有研究结果进行综合分析和评价联合所有研究结果进行综合分析和评价必要时进行必要时进行 Meta-Meta-分析分析(定量合成的统计方法定量合成的统计方法)
12、得出综合结论(有效、无效、应进一步研究得出综合结论(有效、无效、应进一步研究)提供尽可能减少偏倚,接近真实的科学证据提供尽可能减少偏倚,接近真实的科学证据Meta analysis的原理和基本思想的原理和基本思想 在用样本信息推断总体参数时,是存在在用样本信息推断总体参数时,是存在抽样误差的,并且抽样误差的大小与样本抽样误差的,并且抽样误差的大小与样本量的大小有关。量的大小有关。统计学用抽样分布的理论来描述样本统统计学用抽样分布的理论来描述样本统计量的变化规律。计量的变化规律。基本原理从一个均数为1.5,标准差为0.7的正态总体中进行随机抽样,样本量分别为20,50,100,200,300,5
13、00,1000,不同的样本量均进行20次抽样,共得到140个样本。分别计算每个样本的均数。基本原理用方差分析的方法对不同的样本所对应的总体均数是否相等进行检验,方差分析的结果为F=0.862,P=0.878。说明140个样本对应的总体均数是相同的。用这140个样本的信息来估计总体的均数和标准差,=1.501,=0.699。这样做的结果是提高了估计的精度。基本原理(理想状态)把不同研究者对相同问题相同问题进行的研究看作是从同一总体中进行抽样得到的一个随机随机样本样本,如果他们都是按照相同的设计按照相同的设计得到的研究结果,并且我们可以获得每一项研究的每一项研究的结果结果,这样就可以根据上面的原理
14、得到一个更为可靠的综合的结果综合的结果。实际情况实际情况不同作者:不同作者:u所使用的设计方案会有一定的差别u选择的实验对象有所不同u研究结果不一定都能发表到专业杂志上u重复发表u人为修改数据 因此实际能够得到的资料可能是不完整可能是不完整的,甚至是有偏性的,如阳性结果的文章,以及和目前大家普遍能够接受的观点一致的文章可能更容易发表在专业杂志上。Meta-analysis is typically a two-stage process(两阶段过程)A summary statistic for each study 单个研究的效应量。(计算单个研究的效应:单个研究的效应量。(计算单个研究的效
15、应:OR/RR/RD/SMD/WMD)A summary(pooled)treatment effect estimate as a weighted average of the treatment effects estimated in the individual studies.每个研究处理效应加权后的平均效应(合并)的估计每个研究处理效应加权后的平均效应(合并)的估计合并效应量的估计和检验合并效应量的估计和检验核心:合并效应量的估计(加权平均值)核心:合并效应量的估计(加权平均值)系统评价的方法和步骤系统评价的方法和步骤拟定研究计划拟定研究计划收集资料收集资料根据入选标准选择合格的
16、研究根据入选标准选择合格的研究复习每个研究并进行质量评估复习每个研究并进行质量评估提取信息,填写过录表,建立数据库提取信息,填写过录表,建立数据库计算各独立研究的效应大小计算各独立研究的效应大小异质性检验异质性检验敏感性分析敏感性分析总结报告总结报告 明确研究目的明确研究目的 提出检验假设提出检验假设注意特殊的亚组注意特殊的亚组 确定和选择研究的方法和标准确定和选择研究的方法和标准 提取和分析资料的方法和标准提取和分析资料的方法和标准一、拟定研究计划一、拟定研究计划中华医生网收集编目中华医生网收集编目http:/www.dr- 多途径、多渠道、最大限度多途径、多渠道、最大限度 途径途径 利用多
17、途径广泛收集资料利用多途径广泛收集资料 多种电子资源数据库多种电子资源数据库 参考文献的追溯参考文献的追溯 注意注意 未正式发表未正式发表“灰色文献灰色文献”(grey literature)这些文献中可能包含阴性研究结果这些文献中可能包含阴性研究结果 会议专题论文会议专题论文 未发表的学位论文未发表的学位论文二、收集资料二、收集资料 专著内的章节专著内的章节 制药工业的报告制药工业的报告 临床试验注册登记系统临床试验注册登记系统 手工检索手工检索检索大量的文献检索大量的文献根据入选和排除标准进行仔细的筛选根据入选和排除标准进行仔细的筛选挑出合格的研究进行系统综述和挑出合格的研究进行系统综述和
18、Meta分析分析三、根据入选标准选择合格的研究三、根据入选标准选择合格的研究中华医生网收集编目中华医生网收集编目http:/www.dr- full textExcludeNot sureIncludeInclude阅读标题和摘要阅读标题和摘要排除排除可能符合纳入标准者可能符合纳入标准者对照纳入标准对照纳入标准排除排除不肯定不肯定合格者纳入合格者纳入补充信息补充信息纳入纳入收集相关文献收集相关文献阅读全文阅读全文绘制筛选文献流程图绘制筛选文献流程图 收集文献数量因不同原因排除文献的数量最终纳入文献数量排除文献的特征 方法学质量研究设计和实施过程中避免或减小方法学质量研究设计和实施过程中避免或减
19、小偏倚的程度偏倚的程度精确度(随机误差的程度)精确度(随机误差的程度)一般用可信限的宽度一般用可信限的宽度来表示来表示外部真实性研究结果外推的程度外部真实性研究结果外推的程度四、复习每个研究并进行质量评估四、复习每个研究并进行质量评估中华医生网收集编目中华医生网收集编目http:/www.dr- 15 5分(分(1 1或或2 2分:低质量,分:低质量,3 35 5分:高质量):分:高质量):随机化方法随机化方法恰当如计算机产生的随机数字或类似的方法恰当如计算机产生的随机数字或类似的方法(2(2分分)不清楚试验描述为随机试验,但没有告知随机分配产生不清楚试验描述为随机试验,但没有告知随机分配产生
20、的方法的方法(1(1分分)不恰当如采用交替分配或类似方法的半随机化不恰当如采用交替分配或类似方法的半随机化(0(0分分)RCT质量评价的质量评价的Jadad 量表量表盲法:盲法:恰当使用完全一致的安慰剂或类似的方法恰当使用完全一致的安慰剂或类似的方法(2(2分分)不详试验称为双盲法,但未交代具体的方法不详试验称为双盲法,但未交代具体的方法(1(1分分)非盲法未采用双盲法或盲的方法不恰当非盲法未采用双盲法或盲的方法不恰当(0(0分分)失访与退出:失访与退出:具体描述了撤除与退出的数量和理由具体描述了撤除与退出的数量和理由(1(1分分)未报告撤除或退出的数目或理由未报告撤除或退出的数目或理由(0(
21、0分分)按事先制定的资料摘录表内容提取相应变量并填表按事先制定的资料摘录表内容提取相应变量并填表用用meta分析软件分析软件Review Manager或或SPSS、SAS、EXCEL等建立数据库等建立数据库注意注意对计量资料必须注明单位对计量资料必须注明单位比较的两组有均数和标准差;计数资料要使用相同比较的两组有均数和标准差;计数资料要使用相同的率来表示的率来表示双重录入双重录入五、提取信息,填写过录表,建立数据库五、提取信息,填写过录表,建立数据库中华医生网收集编目中华医生网收集编目http:/www.dr- SAS WinBUGS NCSS统计量的选择统计量的选择(效应量(效应量/效应指
22、标的选择)效应指标的选择)常用的统计量(效应指标效应指标)及其概率分布10000个样本OR/ln(OR)作为指标的频数图10000个样本RR/ln(RR)作为指标的频数图10000个样本率的差值(RD)作为指标的频数图Effect Size(效应大小效应大小)l在Meta分析中,指两组总体效应指标的差异。l在Meta分析中,通常要求Effect Size的对应样本统计量近似服从正态分布。通常两组间比较时通常两组间比较时 连续变量连续变量 平均差值平均差值(Difference between means,DBM)率差率差(rate difference)二分变量二分变量 比值比比值比(OR)相
23、对危险度相对危险度(RR)六、计算各独立研究的效应大小六、计算各独立研究的效应大小中华医生网收集编目中华医生网收集编目http:/www.dr- intervel,CI)按预先给定的概率()按预先给定的概率(1-a,常取常取95%或或99%)去估计)去估计未知总体参数的可能范围未知总体参数的可能范围。可信区间的计算主要与可信区间的计算主要与标准误标准误有关,标准误愈小,抽样误有关,标准误愈小,抽样误差愈小,可信区间的范围就窄,用样本指标估计总体参数的差愈小,可信区间的范围就窄,用样本指标估计总体参数的可靠性就愈好;可靠性就愈好;关于可信区间关于可信区间可信区间主要用于估计总体参数,从获取的样本
24、数据估可信区间主要用于估计总体参数,从获取的样本数据估计某个指标的总体值,如计某个指标的总体值,如均数的可信区间可用来估计总均数的可信区间可用来估计总体均数,率的可信区间可用来估计总体率体均数,率的可信区间可用来估计总体率。还可以用于还可以用于假设检验假设检验。尤其是试验组与对照组某指标的差值或比值。尤其是试验组与对照组某指标的差值或比值的可信区间,在循证医学中更为常用。的可信区间,在循证医学中更为常用。通常试验组与对照组某指标的差值或比值的通常试验组与对照组某指标的差值或比值的95%可信区可信区间与间与a为为0.05的假设检验等价,的假设检验等价,99%可信区间与可信区间与a为为0.01的的
25、假设检验等价。假设检验等价。常用的可信区间有常用的可信区间有:总体率的可信区间、两总体率差:总体率的可信区间、两总体率差值的可信区间、总体标准化率的可信区间、总体均数的值的可信区间、总体标准化率的可信区间、总体均数的可信区间、两总体均数差值的可信区间和总体相对危险可信区间、两总体均数差值的可信区间和总体相对危险度的可信区间等。度的可信区间等。循证医学中常用的是总体率的可信区间、总体均数的循证医学中常用的是总体率的可信区间、总体均数的可信区间和总体相对危险度(可信区间和总体相对危险度(RR)的可信区间等。)的可信区间等。Continuous dataWeighted mean differenc
26、e(WMD)When the same outcome has been measured in the same way in each trialResult is in natural unitsStandardised mean difference(SMD)When the same outcome has been measured in the different ways in each trialResult needs to be converted into natural units连续变量的指标连续变量的指标.加权均数差(加权均数差(weighted mean dif
27、ference,WMD)Var(d)=.该指标以试验该指标以试验原有的测量单位原有的测量单位,真实地反映了试验效应,真实地反映了试验效应,消除了绝对值大小对结果的影响,在实际应用时,该指标消除了绝对值大小对结果的影响,在实际应用时,该指标容易被理解和解释。容易被理解和解释。(n11)S12(n21)S22n1 n21n1 n2 n1 n2连续变量的指标连续变量的指标.标准化均数差标准化均数差(standardised mean difference,SMD)Sc=d=(X1 X2)Sc1-3/(4N-9)Var(d)=N/n1 n2 d2/2(N-3.94).SMD可以简单的理解为两均数差值再
28、除以合并标可以简单的理解为两均数差值再除以合并标准差的商,它不仅消除了某研究值的绝对大小的影响,准差的商,它不仅消除了某研究值的绝对大小的影响,还消除了测量单位对结果的影响。该指标尤其适合于还消除了测量单位对结果的影响。该指标尤其适合于单单位不同或均数相差较大位不同或均数相差较大的数值资料分析。的数值资料分析。.它是一个它是一个没单位没单位的值,对其分析结果解释要谨慎。的值,对其分析结果解释要谨慎。模型的选择模型的选择资料类型资料类型统计统计指标指标异质性检验异质性检验P0.1异质性检验异质性检验P0.1模型选择计算方法模型选择计算方法分类变量OR固定效应模型M-H法随机效应模型D-L法RR固
29、定效应模型M-H法随机效应模型D-L法RD固定效应模型M-H法随机效应模型D-L法数值变量WMD固定效应模型倒方差法随机效应模型D-L法SMD固定效应模型倒方差法随机效应模型Peto法常用常用Meta分析方法分析方法Meta分析中的倒方差方法举例介绍分析中的倒方差方法举例介绍 EventNo EventTotalInterventionaibin1iControlcidin2i(Sir Richard)Peto Methodvery similar to Mantel-Haenszel method(same 2x2 requirement)对于对于2X2表格数据,结果类似。表格数据,结果类似
30、。computationally somewhat simpler,especially to calculate the confidence interval计算简单,特别是计算可信区间。计算简单,特别是计算可信区间。may provide biased results under some circumstances in which Mantel-Haenszel would not在某些情况下,可能产生有偏倚的结果。在某些情况下,可能产生有偏倚的结果。Best applied to RCTs and not observational studies 最好用于最好用于RCT和非观察性
31、研究。和非观察性研究。Petos method can only be used to pool odds ratios.o仅仅用于合并仅仅用于合并OR值。值。Meta分析的核心:分析的核心:恰当地分配各研究的权重将较多的权重分配给能使我们获得较多信息的研究,这些研究具有:较多的研究对象较多的临床事件较低的变异权重与变异变异呈反变关系Averaging studies(平均的研究)A simple average would give each study equal weightThis is wrongSome studies are more likely to give an answ
32、er closer to the true effect than othersWeighting(加权)The weights are chosen to reflect the amount of information that each trial contains.Give more weight to the more informative studies.Weight by:Size(sample size(n)样本大小样本大小Event rate事件率事件率Homogeneity(inverse of the variance)同质性同质性Quality质量质量Other f
33、actors其他因素其他因素weighted average(加权后的平均值)(加权后的平均值)重要性重要性 Meta分析重要的环节分析重要的环节目目 的的检查各个独立研究的结果是否具有可合并性检查各个独立研究的结果是否具有可合并性 产生异质性的原因产生异质性的原因 研究设计不同研究设计不同 试验条件不同试验条件不同 试验所定义的暴露、结局及其测量方法不同试验所定义的暴露、结局及其测量方法不同 协变量的存在协变量的存在注注 意意 资料的资料的“可合并性可合并性”七、异质性检验七、异质性检验 (heterogeneity)中华医生网收集编目中华医生网收集编目http:/www.dr- 异质性资料
34、的来源异质性资料的来源 临床异质性临床异质性 方法学异质性方法学异质性 统计学异质性统计学异质性纳入研究对象、干预措施等纳入研究对象、干预措施等原始研究的设计类型原始研究的设计类型临床异质性临床异质性(Clinical diversity or clinical heterogeneity)观察对象观察对象年龄,性别,人种,疾病程度,病程长短年龄,性别,人种,疾病程度,病程长短干预措施干预措施剂量,给药途径,疗程剂量,给药途径,疗程结果测量指标结果测量指标量度,测量时间,测量方法量度,测量时间,测量方法统计学异质性统计学异质性(Statistical heterogeneity)不同研究间疗效
35、之间的变异超过了随机误差本身不同研究间疗效之间的变异超过了随机误差本身所致的变异。所致的变异。基于数据计算的结果基于数据计算的结果用用Chi-square(x2)检验)检验Wi为第为第i个研究的权重;个研究的权重;Ti为第为第i个研究的效应量;个研究的效应量;为所有纳入研究的平均效应量。为所有纳入研究的平均效应量。P值值异质性分析异质性分析P0.10肯定没有异质性P0.05肯定有异质性0.10P0.05边缘值2分析,P值为定性分析,只能说有无异质性,不能说异质性大小。异质性分析异质性分析I2:异质性的:异质性的定量分析定量分析Q is the chi-squared statisticdf i
36、s the degrees of freedomI2值从值从0%至至100%,0%时无异质性,时无异质性,I2值越大,值越大,异质性越大;异质性越大;I2描述了去除抽样误差(机遇)后的异质性。描述了去除抽样误差(机遇)后的异质性。How much is too much heterogeneity?一般说来,用一般说来,用I2=25%,或,或50%,或,或75%将将异质性划分为低,中,高;异质性划分为低,中,高;但不宜机械应用;但不宜机械应用;I2大于大于50%可认为有实质性的异质性可认为有实质性的异质性。异质性分析异质性分析何时做异质性分析何时做异质性分析Meta-分析前先做临床异质性分析;
37、一般说来,异质性资料不能合并;如合并分析显示异质性时,仔细分析异质性原因和来源;无异质性资料的合并采用固定效应模型;无异质性资料的合并采用固定效应模型;有异质性的资料合并采用随机效应模型。有异质性的资料合并采用随机效应模型。异质性分析与统计模型异质性分析与统计模型异质性异质性的处理的处理忽略忽略异质性异质性检验检验异质性异质性合并合并解释解释固定效应固定效应模型模型有异质性有异质性不合并不合并随机效应随机效应模型模型亚组分析亚组分析Meta回归回归 Meta分析中异质性资料处理的方法分析中异质性资料处理的方法检查一定假设条件下结果稳定性的方法检查一定假设条件下结果稳定性的方法目的目的 发现影响
38、发现影响meta分析研究结果的主要因素分析研究结果的主要因素解决不同研究结果的矛盾性解决不同研究结果的矛盾性发现产生不同结论的原因发现产生不同结论的原因分层分析分层分析按不同研究特征,将各独立研究分为不同组按不同研究特征,将各独立研究分为不同组按按Mental-Haenszel法进行合并分析法进行合并分析比较各组及其与合并效应间有无显著性差异比较各组及其与合并效应间有无显著性差异八、敏感性分析八、敏感性分析 可以用直观的图示方法表示可以用直观的图示方法表示 九、总结报告九、总结报告研究结果研究结果(线宽线宽表示其表示其95%CI)研究结果点估计值研究结果点估计值,其大小代表该研究在其大小代表该
39、研究在Meta分析中的权重分析中的权重无效应线无效应线各个研究合并各个研究合并后的效应估计后的效应估计)图示结果:常用森林图图示结果:常用森林图 观察性研究的观察性研究的Meta分析分析(Meta-analysis of Observational Studies in Epidemiology,MOOSE)随机对照试验的随机对照试验的Meta分析报告质量分析报告质量(the quality of reporting of Meta-analyses of randomized controlled trials,QUOROM)进行进行总结总结报告报告 系统性综述与Meta-analyses的
40、质量评价标准QUOROM评价标准评价标准(the quality of reporting of Meta-analyses)。适用于随机对照试验性研究性研究Meta分析分析MOOSE评价标准评价标准 适用于观察性研究观察性研究Meta分析分析 QUOROM报告格式1999 年,加拿大渥太华大学David Moher 领导的专家小组,对随机对照试验的Meta分析报告质量进行了方法学的评价,并提出了一套Meta 分析的统一报告格式,也称评价指南.QUOROM声明the quality of reporting of meta-analyses标题二级标题评价依据题目能鉴定出是否为随机对照试验(R
41、CT)的Meta分析或系统评价摘要用结构式摘要目的目的明确描述了临床问题资料来源资料来源列出了资料库和其他信息来源评价方法评价方法描述了选择标准(即对象、干预、结局和研究设计);详细描述了真实性评价的方法、资料提取、研究特征资料定量综合并足以允许重复结果结果纳入与排除的RCT的特征描述,定性、定量的结果(例如点估计值及可信区间)及亚组分析结论结论对主要结果加以描述引言明确地描述了临床问题,干预的生物学合理性和评价的理由方法检索检索详细介绍信息来源(如资料库、注册库、个人档案、专家信息、机构、手工检索),对检索的限制(年代、发表状态、发表语言等)选择选择有纳入、排除标准(定义了对象、干预、主要结
42、局和研究设计)真实性评价真实性评价有评价标准和评价过程(例如设盲的情况、质量评价方法及评价结果)资料提取资料提取提取过程和方法(例如独立完成、或复式进行)研究特征研究特征描述了研究设计的类型、对象特征、干预方案、结局定义、研究来源、临床异质性评估资料定量综合资料定量综合主要效应测量指标(例如相对危险度),合并结果的方法(统计学检验与可信区间),缺失资料的处理、统计学异质性评价,敏感性分析和亚组分析,发表偏倚的评估结果试验流程图试验流程图提供Meta分析流程性的概括图示研究特征研究特征描述每一试验的特征(例如年龄、样本量、干预、剂量、疗程、随访期限)资料定量综合资料定量综合报告入选的研究的有效性
43、评价,给出各试验的每一处理组主要结局的简单概括性结果,提供按意向性分析(ITT)原则计算效应大小和可信区间所需要的数据(例如四格表资料、均数和标准差、比例数)讨论对关键性结果进行概括,根据内外部真实性讨论临床相关性,根据得到的证据总和讨论结果,描述潜在的偏倚(例如发表偏倚),提出将来研究的线索随机对照试验随机对照试验Meta 分析报告分析报告QUOROM声明声明18 项评价标准项评价标准偏倚及其检查偏倚及其检查 偏倚的种类偏倚的种类 偏倚的检查偏倚的检查中华医生网收集编目中华医生网收集编目http:/www.dr- bias)定位偏倚定位偏倚(location biases)引用偏倚引用偏倚(
44、citation bias)多次发表偏倚多次发表偏倚(multiplepublication bias)有偏倚的入选标准有偏倚的入选标准(biased inclusion criteria)一、偏倚的种类一、偏倚的种类定义定义 具有统计学显著性意义的研究结果较无显著具有统计学显著性意义的研究结果较无显著性意义和无效的结果被报告和发表的可能性更大。性意义和无效的结果被报告和发表的可能性更大。产生原因产生原因医学文献中发表偏倚的问题相当严重医学文献中发表偏倚的问题相当严重如果如果meta分析只是基于已经发表的研究结果,分析只是基于已经发表的研究结果,可能会夸大疗效,甚至得到一个虚假的疗效可能会夸大
45、疗效,甚至得到一个虚假的疗效(一)发表偏倚(一)发表偏倚 解决办法解决办法好的好的meta分析应包括所有与课题有关的可获得的资料,但分析应包括所有与课题有关的可获得的资料,但应尽最大可能收集未发表的研究应尽最大可能收集未发表的研究先行将所有的先行将所有的RCT进行登记,通过这一系统随访并获得所进行登记,通过这一系统随访并获得所有研究的结果是解决发表偏倚的根本途径有研究的结果是解决发表偏倚的根本途径应用统计学方法,计算拒绝结论所需的未发表研究数量的应用统计学方法,计算拒绝结论所需的未发表研究数量的大小,评估发表偏倚对研究结果的影响大小,评估发表偏倚对研究结果的影响 定定 义义 在已发表的研究中,
46、阳性结果的文章更容易以在已发表的研究中,阳性结果的文章更容易以英文发表在国际性杂志,被引用的次数可能更多,重英文发表在国际性杂志,被引用的次数可能更多,重复发表的可能性更大,从而带来文献定位中的偏倚。复发表的可能性更大,从而带来文献定位中的偏倚。产生原因产生原因 英语偏倚(英语偏倚(English language bias)文献库偏倚(文献库偏倚(Database bias)(二)定位偏倚(二)定位偏倚 产生原因产生原因支持阳性结果的研究比不支持的研究可能更多地支持阳性结果的研究比不支持的研究可能更多地被作为参考文献加以引用被作为参考文献加以引用杂志的知名度对文章的引用也会产生影响杂志的知名
47、度对文章的引用也会产生影响(三)引用偏倚(三)引用偏倚产生原因产生原因阳性结果的研究更容易多次发表或作为会议报告,阳性结果的研究更容易多次发表或作为会议报告,这就使得这些文章更容易被查到并纳入这就使得这些文章更容易被查到并纳入Meta分析分析中中Meta分析中如果包括重复数据会高估疗效分析中如果包括重复数据会高估疗效(四)多次发表偏倚(四)多次发表偏倚产生原因产生原因通常文献入选标准由熟悉所研究领域的调查者来制通常文献入选标准由熟悉所研究领域的调查者来制定,那么这个标准就可能受调查者知识的影响定,那么这个标准就可能受调查者知识的影响对入选标准的处理可能导致某些阳性结果的研究被对入选标准的处理可
48、能导致某些阳性结果的研究被选择,而阴性结果的研究被排除选择,而阴性结果的研究被排除(五)有偏倚的入选标准(五)有偏倚的入选标准Meta分析检查上述偏倚的最佳途径分析检查上述偏倚的最佳途径 先根据一个基本的入选标准收集全部的研究先根据一个基本的入选标准收集全部的研究再考虑不同的入选标准进行彻底的敏感性分析再考虑不同的入选标准进行彻底的敏感性分析检查偏倚的程度检查偏倚的程度漏斗图分析(漏斗图分析(funnel plots)计算失效安全数(计算失效安全数(fail-safe number,Nfs)二、偏倚的检查二、偏倚的检查漏斗图漏斗图 相对于样本量的效应值,是以研究的效应估计值相对于样本量的效应值
49、,是以研究的效应估计值作为横坐标,样本量作为纵坐标画出的散点图作为横坐标,样本量作为纵坐标画出的散点图漏斗图分析漏斗图分析 1.1.根据图形的不对称程度判断根据图形的不对称程度判断Meta分析中偏倚有无分析中偏倚有无 2.2.基于治疗效应的精确度随样本量增大而增加这一事实基于治疗效应的精确度随样本量增大而增加这一事实(一)漏斗图分析(一)漏斗图分析针灸治疗中风的针灸治疗中风的4949个试验的漏斗图分析个试验的漏斗图分析 (Tang TL,1999,1999)如果如果MetaMeta分析分析中没有偏倚,中没有偏倚,图形构成一个图形构成一个对称的倒置对称的倒置“漏斗漏斗”;如果;如果图形呈现明显图
50、形呈现明显的不对称,表的不对称,表明偏倚可能存明偏倚可能存在在(见右图见右图)样本量小的样本量小的研究结果通研究结果通常分散在图常分散在图形底部很宽形底部很宽的范围内的范围内样本量大的样本量大的研究结果集研究结果集中在图形上中在图形上部一个较窄部一个较窄的范围内的范围内定义定义 Meta分析中计算需多少阴性研究结果的报告才分析中计算需多少阴性研究结果的报告才 能使结论逆转能使结论逆转用途用途 估计发表偏移的程度估计发表偏移的程度P为为0.05和和0.01时计算公式如下时计算公式如下 (二)(二)失安全数失安全数意义意义 失安全数失安全数 ,说明说明Meta分析的结果越稳定分析的结果越稳定,结论被结论被