1、第二十章第二十章 队列研究队列研究cohort study第一节第一节 概述(定义)概述(定义)n一、定义:队列研究一、定义:队列研究 是选定是选定暴露暴露和和未暴露未暴露于某种于某种因素的两种人群,追踪其各自的发病结局,比较因素的两种人群,追踪其各自的发病结局,比较两组发病结局的差异,从而判定暴露因子与发病两组发病结局的差异,从而判定暴露因子与发病有无因果关联及关联大小的一种观察性研究方法。有无因果关联及关联大小的一种观察性研究方法。n群组研究、定群研究、前瞻性研究、发病率研究、群组研究、定群研究、前瞻性研究、发病率研究、随访研究。随访研究。现在 将来二、特点二、特点属于观察性属于观察性研究
2、方法研究方法设立对照设立对照观察方向由观察方向由“因因”至至“果果”能确切证实能确切证实暴露与疾病暴露与疾病的因果关系的因果关系u暴露暴露指接触某种因素或具备某种特征,如接指接触某种因素或具备某种特征,如接触过某种特殊物质或具备性别、年龄或职业的某种触过某种特殊物质或具备性别、年龄或职业的某种特征等。特征等。一般应对暴露因素进行定量,除了一般应对暴露因素进行定量,除了暴露水平暴露水平以以外,还应考虑外,还应考虑暴露的时间暴露的时间,以估计累积暴露剂量。,以估计累积暴露剂量。同时还要考虑同时还要考虑暴露方式。暴露方式。u暴露因素暴露因素与危险因素、流行因素一样泛指与危险因素、流行因素一样泛指能影
3、响人群发病率变动、疾病结局的研究因素。能影响人群发病率变动、疾病结局的研究因素。u队列队列其一泛指暴露于某事物或因素、具有共其一泛指暴露于某事物或因素、具有共同特征的一群人,即研究中通常所称的队列。其二同特征的一群人,即研究中通常所称的队列。其二是指特定时间内出生并按此出生时期确定的一组人,是指特定时间内出生并按此出生时期确定的一组人,称为出生队列。称为出生队列。三、队列研究的种类三、队列研究的种类四、队列研究的用途四、队列研究的用途检验病因假设检验病因假设描述疾病的自然史描述疾病的自然史评价自发的预防效果评价自发的预防效果 第二节第二节 设计和实施设计和实施一、研究因素的确定一、研究因素的确
4、定二、结局变量(结果变量)的确定二、结局变量(结果变量)的确定 是指观察人群中出现的预期的结果事件,如发生了是指观察人群中出现的预期的结果事件,如发生了研究疾病或因研究疾病而死亡。研究疾病或因研究疾病而死亡。三、研究对象的选择三、研究对象的选择四、样本量的估计四、样本量的估计五、资料的收集五、资料的收集四、样本含量的估计四、样本含量的估计1、非暴露组中所研究疾病的发病率、非暴露组中所研究疾病的发病率p p0 02、暴露组与非暴露组的发病率之差。、暴露组与非暴露组的发病率之差。3、显著性水平、显著性水平值值4、检验效能、检验效能(powerpower)又称把握度()又称把握度(1-1-)确定样本
5、大小(续)确定样本大小(续)式中:n为暴露组或非暴露组的人数,p1与p0分别代表暴露组与对照组的预期发病率,Z和Z为标准正态分布下面积为和时对应的u值,可查表求得。五、资料的收集五、资料的收集(一)基础资料的收集(一)基础资料的收集1、收集人口学资料、收集人口学资料2、查阅记录和档案、查阅记录和档案3、询问调查研究对象或知情人、询问调查研究对象或知情人4、医学检查或检验以收集客观资料、医学检查或检验以收集客观资料5、收集环境资料、收集环境资料(二)随访(二)随访1、观察终点和终止时间、观察终点和终止时间2、随访追踪的人群团体、随访追踪的人群团体收集基线资料收集基线资料 基线资料一般包括待研究的
6、暴露因素的暴露状况,疾基线资料一般包括待研究的暴露因素的暴露状况,疾病与健康状况,年龄、性别、职业、文化、婚姻等个病与健康状况,年龄、性别、职业、文化、婚姻等个人状况,家庭环境、个人生活习惯及家族疾病史等。人状况,家庭环境、个人生活习惯及家族疾病史等。n获取基线资料的方式一般有下列四种:获取基线资料的方式一般有下列四种:1 1、查阅记录或档案、查阅记录或档案2 2、访问研究对象或其它能够提供信息的人、访问研究对象或其它能够提供信息的人3 3、对研究对象进行体格检查和实验室检查、对研究对象进行体格检查和实验室检查4 4、环境调查与检测、环境调查与检测 n结局变量(结局变量(outcome var
7、iableoutcome variable)也叫结果变量,简称为结局。也叫结果变量,简称为结局。是指随访观察中将出现的预期结果事是指随访观察中将出现的预期结果事 件,也即研究者希望追踪观察的事件。结件,也即研究者希望追踪观察的事件。结局就是研究对象个体出现的结果,它与观局就是研究对象个体出现的结果,它与观察期的终止不是一个概念。察期的终止不是一个概念。随随 访访 随访对象与方法随访对象与方法n随访内容随访内容 一般与获取的基线资料内容一致,但此处收集的重点是结局变量一般与获取的基线资料内容一致,但此处收集的重点是结局变量 对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,对暴露组和对照
8、组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。随访方法应保持不变。n观察终点观察终点 观察终点(观察终点(end-pointend-point)就是指研究对象出现了预期的结局,就是指研究对象出现了预期的结局,达到了这个观察终点,就不再对该研究对象继续随访。达到了这个观察终点,就不再对该研究对象继续随访。n观察的终止时间:观察的终止时间:观察终止时间是指整个研究工作截止的时间。观察终止时间是指整个研究工作截止的时间。第三节第三节 数据资料的整理和分析数据资料的整理和分析(一)率的计算(一)率的计算累计发病率累计发病率(适用于观察期间人群比较稳定,且(适用于观察期间人群比较稳定,
9、且能在较长时间内固定地维持观察时)能在较长时间内固定地维持观察时)发病密度发病密度(将变动的人群转变为(将变动的人群转变为人时数代替人数人时数代替人数来计算,此种发病率称为发病密度,适用于暴露来计算,此种发病率称为发病密度,适用于暴露人口不稳定,人群产生较大的变动时)人口不稳定,人群产生较大的变动时)暴露人年的计算暴露人年的计算常用的人时单位是人年,计算方法有下列两种。常用的人时单位是人年,计算方法有下列两种。n以个人为单位计算暴露人年以个人为单位计算暴露人年 n用寿命表法计算人年用寿命表法计算人年三例观察对象人年的计算(观察终止日期为三例观察对象人年的计算(观察终止日期为1981.01.01
10、1981.01.01)以上累计总人年为以上累计总人年为11.15+12.06+10.92=34.1311.15+12.06+10.92=34.13人年,人年,发病密度(死亡率)为发病密度(死亡率)为1/34.13=29.3 1/34.13=29.3(二)率的差异显著性检验(参阅统计学书)(二)率的差异显著性检验(参阅统计学书)(三)计算暴露欲发病的关联强度(三)计算暴露欲发病的关联强度u相对危险度(Relative Risk,RR)又称危险比暴露组的发病率暴露组的发病率 Ie=a/n1非暴露组的发病率非暴露组的发病率 I0=c/n0相对危险度相对危险度 RR=Ie/I0=(a/n1)/(c/n
11、0)队列研究资料整理表队列研究资料整理表 相对危险度数值范围对暴露与疾病关联的意义相对危险度数值范围对暴露与疾病关联的意义u归因危险度(归因危险度(ARAR)AR=AR=I Ie e-I-I0 0=(a/n=(a/n1 1)-(c/n)-(c/n0 0)人群特异危险度百分比(人群特异危险度百分比(PARPPARP)第四节第四节 队列研究的优缺点队列研究的优缺点 一、优一、优 点点1.1.较适用于常见病。较适用于常见病。2 2、由由“因因”至至“果果”观观察察,资资料料偏偏倚倚少少,论论证证因因果果关关系系能能力力强强。一般不存在回忆偏倚。一般不存在回忆偏倚。3 3、可可以以直直接接获获得得暴暴
12、露露组组和和对对照照组组人人群群的的发发病病或或死死亡亡 率率,可可计计算算出出RRRR和和ARAR等等反反映映疾疾病病危危险险关关联联的的指指标标,可可以以充充分分而而直直接接地地分分析析暴露的病因作用。暴露的病因作用。4 4、检验病因假说的能力较强。检验病因假说的能力较强。5 5、有助于了解人群疾病的自然史。有助于了解人群疾病的自然史。6 6、样本量大,结果比较稳定。样本量大,结果比较稳定。7 7、一次调查可观察多种结局。、一次调查可观察多种结局。8 8、暴露因素的作用可分等级,便于计算、暴露因素的作用可分等级,便于计算“剂量剂量反应关系反应关系”。二、缺二、缺 点点1.1.不适于发病率很
13、低的疾病的病因研究。不适于发病率很低的疾病的病因研究。2.2.对对象象不不易易保保持持依依从从性性,容容易易产产生生各各种种各各样样的的失失访偏倚。访偏倚。3.3.研研究究耗耗费费的的人人力力、物物力力、财财力力和和时时间间较较多多,其其组织与后勤工作亦相当艰巨。组织与后勤工作亦相当艰巨。4.4.由由于于消消耗耗太太大大,故故对对研研究究设设计计的的要要求求更更严严密密,资资料料的的收收集集和和分分析析也也增增加加了了一一定定的的难难度度,特特别别是暴露人年的计算较繁重。是暴露人年的计算较繁重。5.5.在在随随访访过过程程中中,未未知知变变量量引引入入人人群群,或或人人群群中中已已知知变变量量
14、的的变变化化等等,都都可可使使结结局局受受到到影影响响,使使分析复杂化。分析复杂化。前瞻性研究与病例对照研究的比较前瞻性研究与病例对照研究的比较 病例对照研究、队列研究、描述性研究三者比较病例对照研究、队列研究、描述性研究三者比较 比较项目病例对照研究队列研究描述性研究分 组病例组、对照组暴露、非暴露按时间、人间、空间时 间现在 过去过去 现在 将来同时看顺 序向后看向前看患病与因素同时存在对 比构成比发病率、死亡率各组人群罹患率资料分析比较构成比比较发病率不同时间地区人群的分布危险度评价计算OR用于估计RR计算RR、AR因果关系由果推因、检验假设以因追果、验证假设仅提供病因线索偏偏 倚倚 选
15、择偏倚(选择偏倚(selection biasselection bias)n有人拒绝参加;有人拒绝参加;n有些人的档案丢失了或记录不全;有些人的档案丢失了或记录不全;n研究对象由志愿者组成,他们往往或是较健研究对象由志愿者组成,他们往往或是较健康的或是有某种特殊倾向或习惯的;康的或是有某种特殊倾向或习惯的;n早期病人,在研究开始时未能发现等,早期病人,在研究开始时未能发现等,后者又可称为错误分类偏倚。这些都是在抽后者又可称为错误分类偏倚。这些都是在抽样方法正确的基础上仍可能出现的偏倚。样方法正确的基础上仍可能出现的偏倚。偏偏 倚倚失访偏倚(失访偏倚(lost to follow-uplost
16、 to follow-up)这是队列研究中不可避免的偏倚。失访从本质这是队列研究中不可避免的偏倚。失访从本质上是破坏了原有样本的代表性,因而实质上属于上是破坏了原有样本的代表性,因而实质上属于选择偏倚。一项研究的失访率最好不超过选择偏倚。一项研究的失访率最好不超过10%10%。信息偏倚(信息偏倚(information biasinformation bias)在获取暴露、结局或其他信息时所出现的系统在获取暴露、结局或其他信息时所出现的系统误差或偏差叫信息偏倚。信息偏倚又称为错分偏误差或偏差叫信息偏倚。信息偏倚又称为错分偏倚(倚(misclassification biasmisclassification bias)。)。






