资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,队列研究,Cohort Study,第,4,章,郑州大学公共卫生学院,本章要点,1.,队列研究的基本原理、概念,2.,队列研究实施,3.,队列研究资料分析,4.,队列研究常见的偏倚及其控制,5.,队列研究的优缺点,分析流行病学,又称:分析性研究,是在选择的人群中检验疾病病因假设或流行因素的一类方法。,包括:队列研究、病例对照研究,第一节 概述,一、概念,二、基本原理,三、研究目的,四、特点,五、分类,(一)队列:,原意是指古罗马军团中的一个分队,指有共同特征或共同经历一群人。,一、概念,出生队列(,birth cohort,):,特定时期内出生的一组人群。,固定队列,Fixed Cohort,(同时进入、无失访和进入),研究开始,研究结束,出现结局,未出现结局,固定队列,和,动态队列,动态队列,Dynamic Cohort,(随时进入或退出),研究开始,研究结束,出现结局,失访,二、基本原理,暴露组,非暴露组,随访,发病,未发病,发病,未发病,随访,a,b,c,d,a/(a+b),c/(c+d),比较,结论,三、队列研究的特点:,1.,属于观察法,2.,设立对照组,3.,观察方向由,“,因,”,及,“,果,”,4.,能确证暴露与疾病的因果联系,四、队列研究的目的,1.,检验病因假设,2.,描述疾病的自然史,3.,评价自发的预防效果,五、队列研究的类型,1.,前瞻性队列研究,2.,历史性队列研究,3.,双向性队列研究,前瞻性队列研究,Prospective Cohort Study,研究队列的确定是现在,(concurrent),根据研究对象现在暴露分组,需要随访,(follow-up),结局在将来某时刻出现,优点,时间顺序增强病因推断可信度,直接获得暴露与结局资料,结果可信,缺点,花费大,时间长,应用条件,明确地检验假设,所研究疾病的发生率较高,一般不低于,5,明确规定暴露因素和结局变量,可靠的测量手段,足够的观察人群和暴露情况,能完成随访的人群,足够的人、财、物力,历史性队列研究,Historical(Retrospective)Cohort Study,根据研究开始时研究者掌握的有关研究对象在过去某时刻的暴露情况的历史材料分组,不需要随访,研究开始时结局已出现,优点,短期内完成资料的收集和分析,时间顺序仍是由因到果,省时、省力、出结果快,缺点,资料积累时未受到研究者的控制,内容上未必符合要求,需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料,第二节 队列研究的设计与实施,一 确定研究因素,二 确定研究结局,三 确定研究现场和研究人群,四 确定队列大小,五 资料收集与随访,六 质量控制,一、确定研究因素,研究因素,:暴露因素、其它影响结局的因素,暴露因素,选择:建立在大量研究基础上。,定义:,测量:定性、定量,敏感、精确、简单、可靠的方法,询问、实验室测定、查阅记录,其它影响结局的因素,二、确定研究结局,结局指研究者预期的结果事件。,发病或死亡,某些血清指标,分子标志的变化,定性或定量,一次研究可有多个结局,吸烟,吸烟,慢性支气管炎,冠心病,肺癌,结局的测量,采用国际或国内通用的标准,三 确定研究现场和人群,(一)研究现场,有足够符合条件的研究对象,领导重视、群众支持,医疗条件较好,交通较便利,发病率较高,(二)研究对象的选择,1.,选择研究对象的两种基本方式,(,1,)按规定的暴露选择一组有暴露的人群,然后另外选择一组非暴露人群;这组非暴露人群称为外对照组。,(,2,)选择一个暴露因素分布不均匀的人群,将其一分为二,即分成暴露组和非暴露组,这个非暴露组叫内对照组。,2.,暴露人群的选择,(,1,)职业人群,(,2,)特殊暴露人群,(,3,)一般人群,(,4,)有组织的人群团体,3.,对照人群的选择:应注意其与暴露人群的,可比性,(对照人群除未暴露于所研究的因素外,其它各种因素或人群特征应尽可能与暴露人群相同)。,(,1,)内对照:在同一研究人群中,无暴露或暴露水平最低的人员。,(,2,)特设对照(外对照):,(,3,)总人口对照:,(,4,)多重对照:,四、确定样本大小,(一)影响样本大小因素,抽样方法,暴露组与非暴露组的比例,失访,(二),决定,影响样本含量参数,:,(,1,)一般人群中所研究疾病的发病率水平,p,0,:,p,0,越接近,0.5,,所需观察的人数越少。,(,2,)暴露人群的发病率,p,1,:,d,p,1,p,0,,,d,值越大,所需观察人数越少。,(,3,)显著性水平:,0.05,或,0.01,(,4,)把握度:,1-,0.9,公式,条件,暴露组和对照组样本含量相等,:两个发病率的平均值,P,1,:暴露组预期发病率,P,0,:对照组预期发病率,已知,p,0,=0.007,,,RR=2.5,,,=0.05,,,=0.1,,计算样本量,根据上述条件,Z,=1.96,,,Z,=1.282,,,q,0,=0.993,p,1,=p,0,RR=0.0175,,,q,1,=0.9825,代入公式得,N=2310,考虑到失访,实际上每组需扩大,10%,,即,2541,人,查表,条件,已知,、,p,0,、,RR,注意事项:,(,1,)暴露组与对照组的比例:通常采用两组等量的方法。,(,2,)通常按,10%,来估计失访率,故计算出来的样本量再加,10%,做为实用样本量。,五、资料的收集随访或追踪,基线资料,随访,资料收集,基线,(base-line),资料,随访研究对象之前,研究人员要获得有关研究对象的多种必要的确实材料做为判断研究终点和分析比较的基础,这称为基线资料。,(,1,)内容:,1),研究对象暴露于研究因素的情况。,2),与判断终点有关的资料:例如观察终点是糖尿病,则全部对象要测尿糖、空腹血糖等以排除糖尿病患者,。,3),有关协变量的资料:即暴露于其它与患病有关的危险因素的情况。,(,2,)获取基础资料的方式:,1),查阅记录或档案:,2),访问研究对象或其它能够提供信息的人,3),对研究对象进行测定或检查,4),有时要对环境作调查与检测 目的是确定一项暴露,如对水质进行化验,。,随访,(follow-up),随访对象、内容和方法,观察终点,观察终止时间,随访间隔,1.,随访的对象、内容、方法,对象,:,暴露组和对照组同等对待。,随访内容,:,1),确定研究对象是否仍处于观察之中。,2),确定研究人群中的结局事件。,3),进一步收集有关暴露和混杂因素的资料,以备分析资料时用。,方法,:,利用记录或档案;特殊随访:定期体检、访问等;对环境做调查或检测,2.,观察终点和终止时间,(,1,)观察终点:指观察对象出现了预期的结局,至此就不再继续观察该对象。,(,2,)观察终止时间:指整个研究工作观察的截至时间。即随访期,可根据潜隐期确定。,3.,随访间隔,观察期长短,结局变化的速度,人力、物力,例如:,1-2,年,调查员选择,调查员培训,制定调查员手册,监督,六 质量控制,第四节 资料分析,一 资料整理表,二 率的计算,三 率的显著性检验,五 效应估计,一 资料整理表,病例,非病例,合计,暴露组,a,b,a+b,非暴露组,c,d,c+d,合计,a+c,b+d,a+b+c+d,暴露组发病率,=a/(a+b),对照组发病率,=c/(c+d),如果二者差异显著,并且无明显偏倚,则暴露因,素与疾病之间有可能存在因果关系,二 率的计算,累积发病率,发病密度,标化死亡比,标化比例死亡比,变化范围,01,适用条件,样本大,人口稳定,整齐的资料,累积发病率,(cumulative incidence),发病密度,(incidence density),变化范围,0,适用条件,观察时间长,人口不稳定,存在失访,资料不很整齐,人时的计算,精确法,近似法,寿命表法,1.,以个体为单位计算暴露人年(精确法),对象,1 67 03 20,66 07 19,08 01,0,8/12,01/30/12=0.67,人年,2.,近似法(大样本或不知道队员精确的进入、退出时间,精确度要求不高时),3.,寿命表法:大样本,精度要求高,Lx=I,x,+1/2(Nx-Dx-Wx),,,I,x+1,=Ix+Nx-Dx-Wx,标化死亡比,(standardized mortality ratio SMR),(,1,),变化范围,0,适用条件,结局事件的发生率比较低,无论观察的时间长或短,都不宜直接计算率时,预期发病(死亡)数的计算,以全人口某病的发病(死亡)率乘以某单位 人口数,标化死亡比,(SMR),(,2,),某厂,30-40,岁组工人有,500,名,某年有,2,人死于肺癌,已知该年全人口,30-40,岁组肺癌的死亡率为,2%,,求,SMR,观察死亡数,2,预期死亡数,5002%,1,SMR,2/1=2,结论:该厂,30-40,岁组工人死于肺癌的危险是一般人群的,2,倍。,标化死亡比,(SMR),(,3,),SMR=1,研究人群某病发病(死亡)危险等于标准人群,SMR1,研究人群某病发病(死亡)危险大于标准人群,,是标准人群的,SMR,倍,SMR1,研究人群某病发病(死亡)危险小于标准人群,意义,被研究人群发生(死于)某病的危险性是标准,人群的多少倍,标化比例死亡比,(,1,),(,standardized proportional mortality ratio,SPMR,),变化范围,0,适用条件,不能得到历年人口资料,仅有死亡人数、原因、日期和年龄,预期死亡数的计算,以全人口中某病因死亡占全部死亡之比例乘以某单位实际全部死亡数,标化比例死亡比,(,2,),某厂,30-40,岁组工人死亡总数为,100,名,某年有,5,人死于肺癌,已知该年全人口,30-40,岁组肺癌的死亡占全部死亡的比例为,2.2%,,求,SPMR,观察死亡数,5,预期死亡数,1002.2%,2.2,SPMR,5/2.2=2.27,结论:该厂,30-40,岁组工人死于肺癌的危险是一般人群的,2.27,倍。,四 率的显著性检验,U,检验,直接概率法,二项分布检验,泊松(,Poisson,)分布检验,卡方检验,计分检验,(,score test,),五 效应估计,相对危险度,归因危险度,归因危险度百分比,人群归因危险度,人群归因危险度百分比,剂量反应关系,相对危险度,RR,(,relative risk,),意义,暴露组发病或死亡的危险是非暴露组的多少倍,Ie,:暴露组率,Io,:非暴露组率,RR,与关联强度,RR,关联强度,0.91.0,1.01.1,无,0.70.8,1.21.4,弱,0.40.6,1.52.9,中,0.10.3,3.09.9,强,0.1,10,很强,lnRR,的,95%CI,RR95%CI,反自然对数,即为,RR,95%CI,Woolf,法,归因危险度,AR,(Attributable risk),意义,暴露与非暴露人群比较,所增加的疾病发生数量,AR,值越大,暴露因素消除后所减少的疾病数量越大,或,意义,RR,吸烟对肺癌的病因学意义较大,AR,戒烟对心血管疾病的预防作用较大,,即公共卫生意义较大,RR,与,AR,的区别,疾病,吸烟者,非吸烟者,RR,AR,肺癌,50.12,4.69,10.7,45.43,心血管疾病,296.75,170.32,1.7,126.43,(,1/10,万人年),归因危险度百分比,AR%,意义,暴露人群中的发病或死亡归因于,暴露的部分占全部发病或死亡百分比,或,(病因分值,EF,),人群归因危险度,population attributable risk,PAR,意义,暴露人群与一般人群比较,所增加的疾病发生率的大小,PAR,值越大,暴露因素消除后所减少的疾病数量越大,PAR=,I,t,I,0,It,:总人群率,Io,:非暴露组率,人群归因危险度百分比,PAR%,意义,PAR,占总人群全部发病(或死亡)的百分比,或,Pe,:总人群的暴露比例,(人群病因分值),分析方法,列出不同暴露水平下的发病率,以最低暴露水平组为对照,计算各暴露水平的,RR,和,AR,趋势性检验,剂量反应关系,表,4-10,4059,岁男子按初始血清胆固醇分组冠心病,6,年,发生情况,结果,随着血清胆固醇水平的升高,其患冠心病的,RR,增大,说明存在,剂量效应关系,例:吸烟者肺癌年死亡率,Ie,0.96,非吸烟者肺癌年死亡率,Io,0.07,全人群肺癌年死亡率,It,0.56,RR=Ie/Io,0.96,/0.07,=13.7,AR=Ie-Io,0.96,0.07,=0.89,AR,(Ie-Io)/Ie100%,=(0.96,0.07,)/0.96,=92.7%,PAR,It-Io=0.56,0.07,0.49,PAR%=(It-Io)/It100%,(0.56,0.07,)/0.56,=87.5%,五、得出结论:,有无联系,危险因素、保护因素,联系强度,剂量反应关系,研究实例,二硫化碳长期低剂量的暴露与冠心病的关系,第四节 实例,二硫化碳,(,CS,2,),神经系统毒物,抑制酶的活性,影响脂蛋白,代谢,造成心血管疾病,长期接触低浓度二硫化碳可引起慢性中毒,,引起精神病、多发性神经炎、动脉粥样硬样等,短时间接触高浓度的二硫化碳蒸气可急性中毒,20,世纪,60,年代芬兰职业卫生研究所,Hernberg,和,Tolonen,教授所做的,5,年前瞻性队列研究确定了二硫化碳长期低剂量暴露与冠心病的因果关系,一 确定研究因素,研究因素,长期低剂量的,CS,2,暴露,定义,有,CS,2,暴露,在不至引起急性中毒的,车间工作至少,5,年以上,二 确定研究结局,结局指标,心肌梗死,血压变化,心电图的改变,心绞痛发作,三 确定研究现场和人群,暴露组,1942,1967,年间某粘纤厂,25,至,64,岁,至少有,5,年,CS,2,暴露史的所有工人,(343,名,全为男性,),对照组,年龄相差不超过,3,岁,出生地区相同,工种的体力消耗相当,在同一城市的造纸厂随机选择的,343,名男性工人,四 资料收集,查阅档案记录,用药情况、既往车间,CS,2,的浓度等,询问,姓名、性别、年龄、工种及工作年限、吸烟、业余时间的体力活动情况,实验室检查,血糖、血脂、血清胆固醇水平、血压、心电图、心脏大小、体重及车间,CS,2,浓度的动态变化,五 质量控制,采用国际通用的标准和规定,事先校准各种仪器和设备,重复测量和分析某些指标,六 资料分析,CS,2,暴露组发生心肌梗死的相对危险度为,3.57,,两组致死性心肌梗死发生率和总的心肌梗死发生率差异有显著性,(表,1,),CS,2,在不同临床类型冠心病的发生中作用程度不同,(表,2,),表,1,暴露组和对照组的心机梗死发生率及相对危险度,表,2 CS,2,与不同临床类型冠心病的,RR,与,AR,比较,临床类型,RR,AR,心肌梗塞,3.57,5.25,致死性心肌梗塞,4.69,3.21,非致死性心肌梗塞,2.74,2.04,心绞痛,1.89,11.6,心电图冠心样改变,1.4,6.1,七 结论,长期低剂量(,2030ppm,),CS,2,暴露与冠心病的发病和死亡存在因果关系,CS,2,所致的冠心病,以致死性心肌梗死表现突出,其他类型也有不同程度的表现,措施,芬兰当局已于,1972,年把,CS,2,的车间最高容许浓度从,20ppm,降至,10ppm,偏倚及其控制,选择偏倚,信息偏倚,混杂偏倚,selection bias,选择偏倚,研究人群在一些重要因素方面与一般人群或待研究的总体人群存在的差异,产生原因,选择对象的方法不当,最初选定参加研究的对象中有人拒绝参加,历史性队列研究中部分档案丢失或记录不全,志愿者队列,研究开始时未能发现早期病人等,预防为主,抽样方法正确,严格按规定标准选择对象,控制,选择偏倚,lost to follow-up,失访偏倚,研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚,控制,设计时,选择便于随访的人群,在计算的研究样本的基础上扩大,10%,实施时,加强对随访员的管理,制定随访计划和监测措施,期中分析,整理资料时,对于有缺项或漏项的对象进行补查,失访率,10%,时分析失访的作用;,失访率,20%,,结果真实性可疑,失访偏倚,information bias,信息偏倚,在获取暴露、结局或其他信息时所出现的系统误差或偏差,疾病、暴露标准不明确,检验仪器不精确、检验技术不熟,询问技巧不佳记录错误,造假等,产生原因,信息偏倚,控制,提高临床诊断技术、明确各项标准,选择精确稳定的测量方法,事前调准仪器,严格实验操作规程,同等对待每个研究对象,培训调查员,提高技巧,统一标准,信息偏倚,confounding bias,与所研究因素和结果均有联系的第三因素在暴露组与对照组的分布不均衡,混淆了研究因素和结果间的真实联系,混杂偏倚,研究设计阶段,限制研究对象,匹配,分析阶段,分层分析、标准化或多因素分析,控制,混杂偏倚,优缺点,优 点,直接获得暴露组和非暴露组的发病率或死亡率,直接估计危险度,符合时间顺序,验证病因的能力较强,获得一种暴露与多种结局的关系,收集的资料完整可靠,不存在回忆偏倚,可研究疾病的自然史,缺 点,不适于发病率很低的疾病的病因研究,易发生失访偏倚,耗时,耗人力、物力、财力,设计要求严密,资料的收集和分析难度较大,随访过程中,已知变量的变化或未知变量的引入增加分析难度,
展开阅读全文