资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第五章,病例对照研究,Case Control Study,中南大学湘雅公共卫生学院,谭红专 教授,1,第一节 基本原理,第二节 研究类型,第三节,实施步骤,第四节,资料的整理与分析,第五节,常见偏倚及其控制,第六节,研究实例,第七节,优缺点与注意事项,2,目 录,2025/8/2 周六,3,第一节 基本原理,基本原理,研究示意图,发展史,2025/8/2 周六,以确诊患某种特定疾病的病人作为病例,以不患该病但具有可比性的个体作为对照,通过询问、实验室检查或复查病史,搜集既 往危险因素暴露史,测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联,4,一、基本原理,2025/8/2 周六,5,病例对照研究,特点,回顾性,由,果,因研究,观察法,不能验证病因,2025/8/2 周六,6,时间,病例组,对照组,研究开始,暴露,暴露,非暴露,非暴露,调查方向,图,5-1,病例对照研究示意图(,Greenberg 2002,),注:阴影区域代表暴露于所研究的危险因素的研究对象,二、研究示意图,2025/8/2 周六,7,1843,年,Guy(,英国,),向统计学会报告,-,最早病例对照研究,分析职业暴露与肺结核发生的关系,1844,年,Louis,的著作,最早出现病例对照研究的概念,1926,年,Lane Claypon,报告(接近现代概念),生殖因素与乳腺癌关系的研究,三、研究简史,2025/8/2 周六,8,1947,年,Schreck,和,Lenowitz,包皮环切和性卫生与阴茎癌的关系,1947,年,Hartwell,输血与肝炎关系的研究,1950,年,Doll,和,Hill,吸烟与肺癌的研究,2025/8/2 周六,9,20,世纪,60,年代以来,孕妇服用反应停(,thalidomide,)与婴儿短肢畸形,母亲吸烟与先天性畸形,早产儿吸入高浓度氧与晶体后纤维组织增生症,经期使用月经棉与中毒性休克综合征,小剂量电离辐射与白血病,母亲早孕期服用雌激素与少女阴道腺癌等之间的关系(,1971,年,只用了,8,个病例,32,个对照),2025/8/2 周六,10,第二节 研究类型,病例与对照不匹配,病例与对照匹配,衍生类型,2025/8/2 周六,11,一、病例与对照不匹配,从设计所规定病例和对照人群中,分别,抽取一定量的研究对象,对照组人数,病例组人数,选择对照没有特殊规定,2025/8/2 周六,匹 配,/,配 比,(,matching,),要求 对照在某些因素或特征上与病例保持一致,目的 对两组进行比较时排除匹配因素的干扰,分 类,频数匹配,个体匹配,12,二、病例与对照匹配,2025/8/2 周六,频数匹配(又称成组匹配),匹配因素所占的比例在对照组与病例组一致,个体匹配,以病例和对照个体为单位进行匹配,13,2025/8/2 周六,14,匹配法注意事项,慎重选择匹配因素,可疑病因不作为匹配因素,比例一般为,1:1,,最多不超过,1:4,避免,“,匹配过度(,overmatching,),”,注意匹配的范围,匹配的目的,提高研究效率,控制混杂因素,2025/8/2 周六,15,三、衍生的研究类型,巢式病例对照研究,单纯病例研究,病例,-,队列研究,病例交叉研究,病例时间对照设计,2025/8/2 周六,1,、巢式病例对照研究,(,nested case control study,),基本原理,按队列研究方式进行:选择一队列,收集基线资料,采集所研究的生物学标志的组织或体液标本储存备用,随 访:随访到出现能满足病例对照研究样本量的病例数为止,16,2025/8/2 周六,匹配:按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队列选择,1,个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本,资料处理:按匹配病例对照研究方法处理资料,17,2025/8/2 周六,1992,年,Ross,用巢式病例对照研究,:,上海地区肝癌与尿中黄曲霉素生物学标志关系,18244,名中年男性队列中发现,22,例肝癌,每例配,5,或,10,个对照,检测研究开始时的尿样:,发现黄曲霉素,B1,及其代谢产物和,DNA,加成物的,OR,值经调整混杂因素后,为,3.8(1.2,12.2),。,黄曲霉素作为肝癌致病因素最直接的证据,18,实例,2025/8/2 周六,2,、病例,-,队列研究,(,case-cohort study,),基本原理,研究开始时,在队列中随机选取一组样本作为对照组,观察结束时,队列中出现被研究疾病所有病例作病例组,与随机对照组进行比较,这种研究模式,可同时研究几种疾病,不同疾病有不同病例组,但对照组都是同一组随机样本,19,2025/8/2 周六,病例,-,队列与巢式病例对照研究的区别,对照是随机选取,不与病例进行匹配,随机对照组中成员如发生被研究疾病,既为对照,又同时为病例,1,个随机对照组可以同时和几个病例组比较分析,20,2025/8/2 周六,病例,-,队列与巢式病例对照研究的优点,因果关系清楚,资料可靠,论证强度高,省时省力省钱,适合于分子流行病学研究,21,2025/8/2 周六,背 景,1994,年由,Piegorseh,、,Begs,等提出,遗传与环境的关系,交互作用(主要用途),22,3,、病例病例研究(,case case study,),应用前提条件,在正常人群中基因型与环境暴露各自独立发生,所研究疾病为罕见病,(,此时可用,OR,来估计,RR,值,),2025/8/2 周六,23,基本原理,2025/8/2 周六,24,研究示意图,单纯病例研究,环境暴露,基因型,病人,+,-,+,-,+,-,2025/8/2 周六,25,OR=ad/bc,当,ORge1,时,有正相乘模型交互作用,当,ORge=1,时,无相乘模型交互作用,当,ORge1,时,有负相乘模型交互作用,E+,E-,G-,G+,b,a,d,c,环境暴露与基因型,2025/8/2 周六,解决问题,1991,年美国,Maclure,提出病例交叉设计,日常生活中一些突发事件之后,常会伴随某些结果的发生。究竟是这些突发事件导致了结果的发生,还是仅仅由于机会所致,?,26,4,、病例交叉研究,(case-crossover design),2025/8/2 周六,暴露与某急性事件有关,比较相同研究对象暴露情况:在急性事件发生前一段时间与未发生事件的某段时间,27,基本原理,如果暴露与少见的事件,(,或疾病,),有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。,2025/8/2 周六,研究对象,病例和对照,两部分的信息均来自于同一个体,病例部分,“,危险期,疾病或事件发生前的一段时间,“,对照部分,”,对照期,危险期外特定的一段时间,研究是对个体危险期和对照期内的暴露信息进行比较,28,2025/8/2 周六,例如,据报道某种药物可以引发猝死,如果该报道正确,则应该可以观察到服用此药物后一段时间内猝死增多,或者说在猝死前几天或几周内应有服药增多的报道。,29,2025/8/2 周六,5,、病例时间对照设计,Case-time-control design,是在病例交叉研究的基础上发展而来。,病例交叉研究能解决两组本身的可比性问题。,本设计另设一组对照(没有发生某事件),同样调查两个时段的暴露情况,目的是要消除时间的可能影响,2025/8/2 周六,30,31,第三节 实施,步骤,提出假设,明确适宜的研究类型,病例与对照的选择,样本含量的估计,研究因素的选定与测量,资料的来源与收集方法,2025/8/2 周六,一、提出假设,根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假设。,32,2025/8/2 周六,二、明确适宜的研究类型,匹配或成组,,如用匹配法,需确定病例与对照的比例及匹配条件,广泛探索还是重点检验,经典设计还是衍生类型,33,2025/8/2 周六,三,、病例与对照的来源与选择,对照的选择是整个研究的关键之一。研究得出的结论是否可靠,首先要看对照的选择是否合理。,病例与对照选择的,基本原则:代表性和可比性,选择方法,34,随机抽样,匹配,2025/8/2 周六,(一)病例的选择,1,、选择病例的要求,诊断可靠 使用金标准,对病例其他特征的规定,选择确诊的新病例,35,回忆偏倚小,代表性好,容易合作,被调查因素改变少,2025/8/2 周六,2,、来 源,总体人群中全部病例或总体随机样本人群中全部,(,population-based),医院住院或门诊的病例,(hospital-based),36,代表性好,工作开展比较困难,耗费人力物力,病例,比较合作,资料易得到且比较可靠,与对照的可比性好,代表性差,2025/8/2 周六,(二)对照的选择,1,、原 则,候选对象必须来自于产生病例的总体,意味,着对照一旦发生所研究的疾病,就能成为病例组的研究对象。,37,2025/8/2 周六,2,、对照选择的方法,成组法,(,group comparison,),匹配法,(,matching,),38,频数匹配,个体匹配,2025/8/2 周六,3,、来 源,研究的总体人群或抽样人群,医院中患有其它疾病的病人,亲属、邻居、同事、同学等,39,2025/8/2 周六,三、样本含量的估计,1,、影响因素(有关参数),人群中(对照组)被研究因素的暴露率(,exposure rate,),RR,的近似值,OR,值(查阅文献或预调查获得),值,把握度,40,2025/8/2 周六,2,、计算方 法,查表法(表,5-3,),公式法:求病例对照研究样本含量的公式,(,病例组与对照组人数相等),病例组暴露率,对照组暴露率,41,例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。,某市普通人群中吸烟率,P,0,=20%,OR=2.0 =0.05,把握度,0.90,问需要多少病例与对照,?,42,、,值查表,,Z,为,1.96,,,Z,为,1.282,代入公式得:,病例组与对照组,各需,232,人。,43,病例组与对照组例数不等时的公式:,病例数,:,对照数,=1:c,对照组例数为,c*n,44,1:1,匹配设计,总对子数,p0,和,p1,分别代表目标人群中对照组与病例组 的估计暴露率,m,为暴露状况不一致的对子数,45,四、研究因素的选定与测量,变量的选定:根据研究的目的或具体的目标,确定调查变量的数目和每一个变量的具体项目。,变量的定义:每项变量都要有明确的定义。,变量的测量:研究中应尽可能地采用定量或半定量的量度。,2025/8/2 周六,46,五、资料来源与收集方法,1,、资料来源,医院病案记录,疾病登记报告等摘录,致病因素数据需检测病人的标本或环境获得,询问调查获得,47,2025/8/2 周六,2,、调查及其质量控制,询问调查是个十分复杂而又细致的工作,调查是信息传达、接受和反映的过程,是属于行为科学的范畴。被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题,从拟订调查表开始到调查完成,不论哪一步不恰当,都会产生偏倚,48,2025/8/2 周六,49,第四节 资料的整理与分析,整理与描述,成组比较法资料的分析,(,分层与不分层),分级暴露资料的分析,1:1,配对资料的分析,功效,2025/8/2 周六,一、整理与描述,1,、资料整理:,包括检查、修正、补齐、验收,2,、录入:,编码、录入,3,、描述:,包括样本数、应答率、构成及主要人口学特征描述,50,2025/8/2 周六,4,、均衡性检验,检验两组除研究因素外的其它主要特征有否可比性,两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关,均衡性检验,应把两组的这些特征逐一加以比较,必要时作显著性检验,51,2025/8/2 周六,二、成组设计资料的分析(不分层),1,、,2,检验,是检验研究因素与疾病之间有否统计学联系?,可用传统的四格表公式,也可用,antel-Haenszel(M-H),方法,52,2025/8/2 周六,53,结果表明吸烟与食管癌有联系,但联系强度如何,要计算,OR,2025/8/2 周六,2,、效应估计:,OR,及其可信限的计算与意义,病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值,叫比值比(,Odds ratio,OR),,可信区间的计算有基于方差的方法和基于检验(卡方)的方法。,54,2025/8/2 周六,与,RR,一样,比值比反映暴露者患某种疾病的危险性较无暴露者高的程度。,前提条件,所研究疾病的发病率(死亡率)很低,病例对照研究中所选择的研究对象代表性好,则,OR,值就很接近甚至等于,RR,值,55,2025/8/2 周六,56,结果表明,吸烟者患食管癌的危险性是不吸烟者的,2.87,倍,,95%,的可信范围是在,2.18,3.78,之间,2025/8/2 周六,三、,1:1,配对资料的分析,匹配资料是由病例与对照结合成,对子,,分析结果时不应把对子拆开分析,先将资料列成表,5-14,的格式,注意表内的数字,a,、,b,、,c,、,d,是病例与对照配成对的对子数,57,2025/8/2 周六,58,2025/8/2 周六,93,对男性食管癌与对照的吸烟史,59,2,=11.28,OR=4.33,表明男性吸烟者患食管癌的危险性是不吸烟者的,4.3,倍,OR95%,可信限,2025/8/2 周六,60,四、成组分层资料的分析,2025/8/2 周六,1,、按饮酒与否分层 计算,OR,值,61,饮酒者中吸烟的,OR(2.98),,不饮酒者中吸烟的,OR(1.67),,均不同于不分层,OR(2.87),饮酒可能,是混杂因素?,按饮酒分层分析吸烟与食管癌的关系,2025/8/2 周六,2,、齐性检验,如果层间,OR,值无明显差别,则提示饮酒可能是混杂因素,资料分析可进一步计算,合并,与,OR,值,如果层间,OR,值有显著差异,则提示饮酒可能不是,混杂因子,而可能是效应修饰因子(交互作用),此时,资料分析转入效应修饰的描述,本例齐性检验无显著差异,计算合并,OR,与,2,62,2025/8/2 周六,计算合并,OR,与,2,值,公式(,M-H,法):,合并,63,2025/8/2 周六,64,=,37.74,=2.42,2,M,-,H,表,5-9,分层计算结果整理表,2025/8/2 周六,结果判断,经饮酒分层调整后,吸烟的,OR,(,2.42),较未调整的,OR(2.87),为低,吸烟与食饮酒之间有显著的关联,按饮酒与食管癌的关系列表计算,2=31.9,RR=2.29,,,可见,饮酒与食管癌有联系,饮酒不是吸烟与食管癌关系的中间变量,因此,饮酒是一个值得调整的混杂因素。,65,2025/8/2 周六,五、暴露分级资料的分析,将资料归纳成列联表,对列联表数据作卡方检验,计算出各暴露水平的比值比,计算趋势性卡方,66,2025/8/2 周六,实例:吸烟与肺癌关系按性别与吸烟量归纳表,67,4.21,3.20,0.98,1.00,OR,21,29,19,51,合计,6,10,12,32,对照,X,2,=11.28,df=3,P0.001,15,19,7,19,病例,女性,17.93,11.52,8.10,1.00,OR,638,543,88,29,合计,274(b,3,),293(b,2,),55(b,1,),27(d),对照,X,2,=43.15,df=3,P0.001,364(a,3,),250(a,2,),33(a,1,),2(c),病例,男性,15-,5-,1-,0-,每日吸烟数,组别,2025/8/2 周六,六、归因分值与功效,1,、,归因分值(,attributable fraction,,,AF,),也叫病因分值(,etiologic fraction,,,EF,),1,),暴露人群的归因分值记为,AF,e,,,AF,e,指暴露人群内某种疾病的发病中,由该暴露引起的发病占全部发病的比例。,2025/8/2 周六,68,式中,I,p,为总人群发病率,,I,0,为非暴露组发病率,,P,e,为人群的暴露率(或以对照组的暴露代替)。,AF,p,反映暴露对人群发病的影响,表示总人群中某种疾病的发病,由该暴露引起的发病占全部发病的比例。,2025/8/2 周六,69,2,、功效,研究功效(,power,)也叫做把握度,可以解释为拒绝无效假设的能力,即当无效假设不成立时,该假设被拒绝的概率。,2025/8/2 周六,70,结果:,-0.30,时,,=0.62,,功效,P,1-,38%,一、选择偏倚(,selection bias,),产生原因 选择的研究对象不能代表总体人群,发生阶段:主要在设计阶段,控制方法:,尽量合理地选择病例与对照,尽可能地从多家,(,类,),医院选择病例与对照,71,第五节 常见偏倚及其控制,2025/8/2 周六,常见的选择偏倚类型,入院率偏倚(,Berksons bias,),:由于医院和病人的相互选择,导致对象缺乏代表性。,现患病例与新发病例偏倚(,Neyman bias),:难以区分发病与存活的因素。,检出症候偏倚:病人常因与疾病无关的症状而就医,从而提高了早期病例的检出率。如使用雌激素导致阴道出血就诊发现子宫内膜癌,从而发现两者的关系。,时间效应偏倚:即早期(或启动期)的病例可能进入对照。,72,2025/8/2 周六,二、信息偏倚,(,information bias,),回忆偏倚和调查偏倚,以回忆偏倚为主。,病例对照研究的主要弱点,很难完全避免。,回忆偏倚:病例对照研究是回顾性调查,难避免回忆偏倚,倾向性:被调查者与调查员均可能有倾向性,盲法可以克服,73,2025/8/2 周六,三、混杂偏倚,(,confounding bias,),混杂:,在研究某疾病与某因子的关系时,由于一个或多个既与疾病有制约关系,又与暴露因子密切相关的第三变量的影响,掩盖或夸大了所研究的暴露因子与疾病的联系。这种作用就称为混杂,这些第三变量就称为混杂因子。,74,2025/8/2 周六,病例对照研究中会遇到很多混杂因素,不易识别,不易确定,控制,混杂因素作为匹配因素,分层分析,进行多因素分析,(,限制),75,2025/8/2 周六,76,第六节 研究实例,研究背景,研究方法,研究结果,2025/8/2 周六,一、研究背景,美国波士顿,Vincent,纪念医院妇产科医生,Herbst,发现,1966,1969,年收治,7,例阴道腺癌患者,年龄,15,22,岁,过去年龄均大于,25,岁,7,例在,15,22,岁之间,7,例全是腺癌,阴道癌占女性生殖系统癌的,2%,阴道腺癌仅占阴道癌的,5%,10%,,非常罕见,77,2025/8/2 周六,78,Herbst,对阴道腺癌危险因素进行探索,7,例患者加上另一个医院例患者作为病例组,每个病人配,4,个对照,共,32,个对照,调查员用调查表对病例、对照与她们的母亲进行了调查,经统计学处理后的主要结果见表,5-16,二、研究方法,2025/8/2 周六,79,三、研究结果,2025/8/2 周六,80,第七节 优缺点与注意事项,(与队列研究比较),病例对照研究的优点,队列研究的优点,病例对照研究的局限性,队列研究的局限性,研究设计检查提纲,2025/8/2 周六,一、病例对照研究的优点,特别适用于少见病、罕见病的研究,省力、省钱、省时间,并易于组织实施,还可用于疫苗免疫学效果考核及暴发调查等,可同时研究多个因素与某种疾病的联系,对研究对象多无损害,81,2025/8/2 周六,二、队列研究的优点,研究者亲自收集资料,信息可靠,回忆偏倚小,直接计算,RR,和,AR,等反映疾病危险关联的指标,可证实病因联系,有助于了解人群疾病的自然史,分析一因与多种疾病的关系,样本量大,结果比较稳定,82,2025/8/2 周六,三、病例对照研究的局限性,不适于研究暴露比例很低的因素,选择偏倚难以避免,暴露与疾病时间先后难以判断,信息真实性差,存在回忆偏倚,不能测定暴露和非暴露组疾病的率,83,2025/8/2 周六,四、队列研究的局限性,不适于发病率很低的疾病病因研究,依从性差,易出现失访偏倚,样本量大,耗费人力、物力、财力和时 间,组织与后勤工作亦相当艰巨,研究设计要求更严密,84,2025/8/2 周六,85,五、研究设计检查提纲,假设目的是否清楚?,疾病与暴露变量的定义明确?,病例与对照的来源,诊断方法?,新发病例还是现患病例?,排除标准是否明确?,2025/8/2 周六,86,抽样的方法与样本大小的估计是否明确?,病例与对照是否匹配及匹配变量是哪些?,调查表是否完全?是否详尽?,调查表是否能够收集到需要的数据?,调查表是否经过试用?,调查表的真实性与可靠性是否经过评估?,2025/8/2 周六,87,调查员、质控员、编码员等工作手册是否编好?,调查员是否做了专门培训?,组织机构、人员、设备、经费是否已落实?,方法试剂是否符合标准?,结果的真实性与可靠性是否经过考核?,资料整理、统计处理方法及分析内容是否明确?,如何控制或调整混杂及其他偏倚?,结论的真实性如何?,2025/8/2 周六,谢谢!,88,2025/8/2 周六,
展开阅读全文