资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,引言,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,case control study,引言,病例对照研究,Case Control Study,第五章,第一节 基本原理,第二节 研究类型,第三节,研究设计与实施,第四节,资料的整理与分析,第五节 常见偏倚及其控制,第六节 研究实例,第七节 优点与局限性及实施,时应注意的问题,目录,第一节 基本原理,基本原理,研究示意图,研究史,以确诊患某种特定疾病的病人作为病例,以不患该病但具有可比性的个体作为对照,通过询问、实验室检查或复查病史,搜集既往 危险因素暴露史,测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联,基本原理,病例对照研究,特点,回顾性,由,果,因研究,观察法,一般不能验证病因,时间,病例组,对照组,研究开始,暴露,暴露,非暴露,非暴露,调查方向,图,5-1,病例对照研究示意图(,Greenberg,,,2002,),注:阴影区域代表暴露于所研究的危险因素的研究对象,研究示意图,1843,年,Guy,向统计学会报告,-,最早病例对照研究,分析职业暴露与肺结核发生的关系,1844,年,Louis,的著作,最早出现病例对照研究的概念,1926,年,Lane Claypon,报告,生殖因素与乳腺癌关系的研究,研究简史,1947,年,Schreck,和,Lenowitz,包皮环切和性卫生与阴茎癌的关系,1947,年,Hartwell,输血与肝炎关系的研究,1950,年,Doll,和,Hill,吸烟与肺癌的研究,病例与对照不匹配,从设计所规定病例和对照人群中,分别,抽取一定量的研究对象,对照组人数,病例组人数,对照组应能代表产生病例的人群,病例与对照匹配,匹配/配比(,matching,),要求 对照在某些因素或特征上与病例保持一致,目的 对两组进行比较时排除匹配因素的干扰,分类,频数匹配,个体匹配,频数匹配(又称成组匹配),匹配因素所占的比例在对照组与病例组一致,个体匹配,以病例和对照个体为单位进行匹配,匹配法注意事项,慎重选择匹配因素,可疑病因不作为匹配因素,比例一般为,1:1,,最多不超过,1:4,避免,“,匹配过度(,overmatching,),”,匹配的目的,提高研究效率,控制混杂因素的作用,衍生的研究类型,巢式病例对照研究,病例病例研究,病例时间对照设计,病例对照与队列研究作为病因研究的主要方法,有其各自的优势与不足,而且这些优势与不足相互补充,因此,在实践过程中产生了一些新的研究类型,结合使用这两种方法,扬长避短。,病例队列研究,病例交叉设计,巢式病例对照研究,(,nested case-control study,),基本原理,按队列研究方式进行,选择一队列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存备用,随 访,随访到出现能满足病例对照研究样本量的病例数为止,匹配,按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队列选择1个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本,资料处理,按匹配病例对照研究方法处理资料,1992年Ross用巢式病例对照研究:,上海地区肝癌与尿中黄曲霉素生物学标志关系,18244名中年男性队列中发现22例肝癌,每例配5或10个对照,检测研究开始时的尿样:,发现黄曲霉素B1及其代谢产物和DNA加成物的OR值经 调整混杂因素后,为3.8(1.212.2)。,黄曲霉素作为肝癌致病因素最直接的证据,病例队列研究(,case-cohort study,),基本原理,研究开始时,在队列中随机选取一组样本作为对照组,观察结束时,队列中出现被研究疾病所有病例作病例组,与随机对照组进行比较,这种研究模式,可同时研究几种疾病,不同疾病有不同病例组,但对照组都是同一组随机样本,病例队列与巢式病例对照研究的,区别,对照是随机选取,不与病例进行匹配,随机对照组中成员如发生被研究疾病,既为对照,又同时为病例,1个随机对照组可以同时和几个病例组比较分析,病例队列与巢式病例对照研究的,优点,因果关系清楚,资料可靠,论证强度高,省时省力省钱,适合于分子流行病学研究,背 景,1994年,Piegorseh、Begs,等提出,遗传与环境的关系,交互作用,病例对照研究和队列研究的效率费用,病例病例研究(,case-case study,),也称单纯病例研究,应用前提条件,在正常人群中基因型与环境暴露各自独立发生,所研究疾病为罕见病,(,此时可用,OR,来估计,RR,值,),基本原理,研究示意图,单纯病例研究,环境暴露,基因型,病人,+,-,+,-,+,-,OR=ad/bc,当,ORge1,时,有正相乘模型交互作用,当,ORge=1,时,无相乘模型交互作用,当,ORge1,时,有负相乘模型交互作用,E+,E-,G-,G+,b,a,d,c,表,5-1,环境暴露与基因型,解决问题,1991年美国,Maclure,提出病例交叉设计,日常生活中一些突发事件之后,常会伴随某些结果的发生。究竟是这些突发事件导致了结果的发生,还是仅仅由于机会所致?,病例交叉研究,(,case-crossover design,),暴露与某急性事件有关,比较相同研究对象暴露情况,在急性事件发生前一段时间与未发生事件的某段时间,基本原理,如果暴露与少见的事件,(,或疾病,),有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。,研究对象,病例和对照,两部分的信息均来自于同一个体,病例部分,“,危险期,疾病或事件发生前的一段时间,“,对照部分,”,对照期,危险期外特定的一段时间,研究是对个体危险期和对照期内的暴露信息进行比较,例如,据报道某种药物可以引发猝死,如果该报道正确,则应该可以观察到服用此药物后一段时间内猝死增多,或者说在猝死前几天或几周内应有服药增多的报道。,第三节 研究设计与实施,研究步骤,病例与对照的选择,样本含量的估计,资料的来源与收集方法,研究步骤,提出假设,根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假设,明确适宜的研究类型,选择病例与对照比较的方法:用匹配或成组比较法,如用匹配法,需确定病例与对照的比例及匹配条件,如果研究目的是广泛地探索疾病的危险因素,可以采用不匹配或频数匹配的方法,如果所研究的是罕见病,或所能得到的符合规定的病例数很少时,则选择个体匹配方法,因为匹配比不匹配的统计学检验效率高。,以较小的样本量获得较高的检验效率。如1:R(或称1:M)的匹配方法。,匹配可保证对照与病例在某些重要方面的可比性。对于小样本研究以及因为病例的某种构成(例如年龄、性别构成)特殊,随机抽取的对照组很难与病例组均衡可比,此时个体匹配特别有用。,病例与对照的来源与选择,对照的选择是整个研究的关键之一,研究得出的结论是否可靠,首先要看对照的选择是否合理。,病例与对照选择的,基本原则,:,代表性,可比性(往往更重要),选择方法,抽样 匹配,病例的选择,选择病例的要求,诊断可靠 使用金标准,选择确诊的新病例,回忆偏倚小,代表性好,容易合作,被调查因素改变少,来 源,总体人群中全部病例或总体随机样本人群中全部,医院住院或门诊的病例,代表性好,工作开展比较困难,耗费人力物力,病例,比较合作,资料易得到且比较可靠,与对照的可比性好,代表性差,对照的选择,原 则,对照必须来自于产生病例的人群,意味,着对照一旦发生所研究的疾病,就能成为病例组的研究对象。,对照与病例比较的方法,成组比较法,(group comparison),匹配法,(matching),频数匹配,个体匹配,来 源,研究的总体人群或抽样人群,医院中患有其它疾病的病人,亲属、邻居、同事、同学等,样本含量的估计,有关参数,人群中被研究因素的暴露率(,exposure rate,),RR,或,OR,值(,查阅文献或预调查获得,),值,把握度,方 法,查表法,公式法:求病例对照研究样本含量的公式(病例组与对照组人数相等),病例组暴露率,对照组暴露率,例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。,某市普通人群中吸烟率 P,0,=20%,OR=2.0 =0.05,把握度0.90,问需要多少病例与对照?,、值查表,Z,为1.96,Z,为1.282,代入公式得:,病例组与对照组,各需232人。,病例组与对照组例数不等时的公式:,病例数:对照数=1:c,对照组例数为c*n,1:1匹配设计,总对子数,p0和p1分别代表目标人群中对照组与病例组 的估计暴露率,m为暴露状况不一致的对子数,研究因素的选定与测量,根据研究的目的或具体的目标,确定调查变量的数目和每一个变量的具体项目。,每项变量都要有明确的定义。,研究中应尽可能地采用定量或半定量的量度。,资料来源与收集方法,资料的收集在病例对照研究中十分重要,方式方法不恰当,收集的资料就不可靠,统计处理无法纠正的系统误差,资料来源,医院病案记录,疾病登记报告等摘录,致病因素数据需检测病人的标本或环境获得,询问调查获得,第四节 资料的整理与分析,描述性统计,描述一般特征,均衡性检验,统计性推断,成组比较法资料的分析,1:1,配对资料的分析,混杂因素作用的估计与分层分析,检验两组在研究因素以外其它主要特征有否可比性,两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关,均衡性检验,应把两组的这些特征逐一加以比较,必要时作显著性检验,均衡性检验,2,检验,是检验研究因素与疾病之间有否统计学联系?,可用传统的四格表公式,也可用,Mantel-Haenszel(M-H),方法,成组比较法资料的分析,M-H法,两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算,OR,四格表法,OR计算与可信限的估计及意义,病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值,与RR,一样,优势比反映暴露者患某种疾病的危险性是无暴露者的倍数。,前提条件,所研究疾病的发病率(死亡率)很低,病例对照研究中所选择的研究对象代表性好,则,OR值就很接近甚至等于RR值,结果表明,吸烟者患食管癌的危险性是不吸烟者的,2.87,倍,,95%,的可信范围是在,2.18,3.78,之间,匹配资料是由病例与对照结合成,对子,,分析结果时不应把对子拆开分析,先将资料列成表5-4的格式,注意表内的数字a、b、c、d是病例与对照配成对的对子数,1:1,配对资料的分析,食管癌发病因素的研究中发现,吸烟与发病有关,男性的资料归纳成表5-5,2,=11.28,OR=4.33,表明男性吸烟者患食管癌的危险性是不吸烟者的,4.3,倍,OR95%,可信限,混杂因素作用的估计与分层分析,配比法,分层分析,表,5-6,按饮酒与否分层 计算OR值,饮酒者中吸烟的,OR(2.98),稍高于不分层,OR(2.87),不饮酒者中吸烟的,OR(1.67),却低得很多,表明,饮酒,是混杂因素,饮酒似可加强吸烟的作用,按饮酒与食管癌的关系列表计算,2,=31.9,RR=2.29,可见,饮酒与食管癌有联系,进行齐性检验,齐性检验 合并,与OR值,OR值无明显差别,则饮酒是混杂因素 合并OR值,OR值有显著差异,则饮酒是明显,混杂?,合并OR值,本例齐性检验无显著差异,计算合并OR与,2,计算合并OR与,2,值,公式(M-H法):,合并,合并,=,37.74,=2.42,经饮酒分层调整后,吸烟的,2,与,OR,(即合并,2,与合并,OR,)虽较未调整的,2,(55.5),与,OR(2.87),为低,但仍有一定强度与统计学上的显著性。,吸烟与食管癌之间有显著的关联,饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用,2,M,-,H,表,5-8,分层计算结果整理表,病例对照研究中偏倚的种类,对照选择中的偏倚,匹配研究方法的偏倚,收集资料过程中的偏倚,第五节 常见偏倚及其控制,选择偏倚,(selection bias),产生原因 选择的研究对象不能代表总体人群,最常见偏倚 伯克森偏倚,(Berksons bias),选择医院的病人作为病例与对照,这些病人可以因为种种原因造成入院率的差异,例如,高血压、肿瘤、阑尾炎病人的入院率显然各不相同入院率的不同就可造成偏倚。,病例对照研究中常见偏倚的种类,选择偏倚的,控制,尽量合理地选择病例与对照,尽可能地从多家(类)医院选择病例与对照,信息偏倚,(,information bias,),回忆偏倚,病例对照研究的主要弱点,很难完全避免,混杂偏倚,(,confounding bias,),病例对照研究遇到很多混杂因素,不易识别,不易确定,控制,混杂因素作为匹配因素,分层分析,进行多因素分析,(限制),对照选择中的偏倚,选择的对照不能代表产生病例的人群,与所研究的可疑病因有关的其它疾病病人作为对照,匹配研究方法的偏倚,匹配过度,将一些被研究因素或因果链的中间变量,或将一些不必匹配的因素作为匹配因素而造成,匹配过度的影响,可使研究得不出结果,真实的结果被歪曲了,浪费不少工作量,匹配因素,明确的混杂因素,匹配因素不宜过多,不可将研究因素匹配,收集资料过程中的偏倚,资料收集过程容易产生的,信息偏倚,回忆偏倚,病例对照研究是回顾性调查,难避免回忆偏倚,倾向性,被调查者与调查员均可能有倾向性,盲法可以克服,第六节 研究实例,研究背景,研究方法,研究结果,研究背景,美国波士顿Vincent纪念医院妇产科医生Herbst发现,19661969年收治7例阴道腺癌患者,7例在1522岁之间,7例均为腺癌,阴道腺癌应为中老年女性的疾病,阴道癌占女性生殖系统癌的2%,阴道腺癌仅占阴道癌的5%10%,非常罕见,Herbst,对阴道腺癌危险因素进行探索,7,例患者加上另一个医院例患者作为病例组,每个病人配,4,个对照,共,32,个对照,调查员用调查表对病例和对照的母亲进行了,调查,经统计学处理后的主要结果见表,5-9,研究方法,研究结果,病例对照研究的优点,队列研究的优点,病例对照研究的局限性,队列研究的局限性,病例对照研究与队列研究优点与局限性的比较,第七节 优点与局限性及实施时应注意的问题,病例对照研究的,优点,特别适用于少见病、罕见病的研究,省力、省钱、省时间,并易于组织实施,还可用于疫苗免疫学效果考核及暴发调查等,可同时研究多个因素与某种疾病的联系,对研究对象多无损害,队列研究的,优点,研究者亲自观察资料,信息可靠,回忆偏倚小,直接计算,RR,和,AR,等,反映疾病危险关联的指标,可证实病因联系,有助于了解人群疾病的自然史,分析一因与多种疾病的关系,样本量大,结果比较稳定,病例对照研究的,局限性,不适于研究暴露比例很低的因素,选择偏倚难以避免,暴露与疾病时间先后难以判断,信息真实性差,存在回忆偏倚,不能测定暴露和非暴露组疾病的率,队列研究的,局限性,不适于发病率很低的疾病病因研究,依从性差,易出现失访偏倚,耗费人力、物力、财力和时间,组织与,后勤工作亦相当艰巨,研究设计要求更严密,实施病例对照研究应注意的问题,假设目的是否清楚?,疾病与暴露变量的定义明确?,病例与对照的来源,诊断方法?,新发病例还是现患病例?,排除标准是否明确?,抽样的方法与样本大小的估计是否恰当?,调查表是否经过试用?,调查表的真实性与可靠性是否经过评估?,资料整理、统计方法及分析内容是否明确?,如何控制或调整偏倚?,结论的真实性如何?,
展开阅读全文