资源描述
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
第五章 队列研究«
²第一节 概述
n 队列研究 (cohort study)
也称前瞻性研究 prospective study, 随访研究 follow-up study, 纵向研究 longitudinal study等。
暴露 结局( 疾病)
一、 基本概念
n 队列研究的重要概念
n 队列 cohort
n 暴露 exposure
n 危险因素 risk factor
n 保护因素 protective factor
1、 队列的概念: 拥有同一属性的某一组人。
a) 南京市常住人口
b) 到 南医大注册的所有学生
c) 出生队列 birth cohort: 出生于同一时期的人组成的特殊队列
1) 队列能够是流动( 有人员出入) 的, 也能够是固定的( 相对固定, 没有人员流动, 成员不能够同时是非成员)
2、 暴露的概念: 研究对象接触过的某种待研究的物质, 或具有某种待研究的特征或行为。( 理解) 物质: 病原体、 毒物。。。
特征: 年龄、 性别、 血压、 血糖。。。
行为: 吸烟、 饮酒、 工作类型。。。
二、 基本原理
n 选定一组研究人群, 根据过去或当前的暴露情况进行分组
p 有无暴露因素: 暴露组和非暴露组
p 暴露因素的水平: 低、 中、 高剂量组
n 随访观察各组的观察结局( 发病或死亡)
n 比较各组发病率或死亡率的差异, 从而判定暴露因素与发病有无因果关联及关联大小
队列研究的特点:
1、 研究对象是还没出现研究结局, 但有可能出现研究结局的人群( susceptible population)
需设立纳入及排除标准
n 剔除已生病个体或明确不会生病的个体
n 在进行传染病危险因素的研究时, 需考虑个体被感染的几率
2、 属于观察性研究, 根据暴露的自然存在状态分组, 无人为控制, 也不存在随机分组
3、 时间顺序: 从”因”到”果”, 可确定因果关系( 疾病发生之前已经确定了研究对象的暴露情况)
4、 前瞻性研究, 可计算发病率、 死亡率等率的指标
三、 队列研究的用途
n 检验病因假设 «是主要用途和目的
n 评价预防效果
n 研究疾病的自然史
n 新药的上市后监测
四、 队列研究的类型
1、 前瞻性队列 prospective cohort
也称即时性或同步性 (concurrent) 队列
开始研究时确定对象、 分组, 经随访得到结局
¡ 优点: 资料准确
¡ 缺点: 样本大, 花费大, 时间长
建立队列时要特别考虑能否负担得起, 能否获得想要的结果!
2、 回顾性队列 retrospective cohort
也称历史性 (historical) 或非即时性 (non-concurrent) 队列
研究开始时疾病结局已发生, 研究对象是过去进入队列的, 分组依据的是过去的暴露资料
¡ 优点: 省人、 物、 时
¡ 缺点: 依赖历史资料的完整与可靠, 常缺乏混杂因素的资料
3、 双向性队列 ambispective cohort
历史队列后继续进行前瞻性队列
¡ 最适合于对人体健康同时具有短期和远期效应的暴露因素研究
²第二节 研究设计与实施
一、 确定研究因素
队列研究最主要的目的: 进一步验证现况调查或病例对照研究中已发现的有特异影响、 且在统计学上有联系的危险( 或保护) 因素。
暴露因素分类:
1) 暴露水平: 定量标准化, 累积暴露
2) 暴露方式: 短期/长期、 直接/间接、 持续/间隔
二、 确定研究结局
结局变量 outcome variable
也称结果变量, 是随访中将出现的预期结果事件, 也即研究者希望追踪的事件, 是希望观察的自然终点, 并非观察期的终止。( 结局是队列研究观察的终点, 也就是研究对象已达结局变量就停止对其的观察; 观察期是整个队列研究的时长, 整个队列中研究对象不止一个人)
p 研究结局的确定应全面、 具体、 客观
发病、 死亡、 指标变化。。。
p 结局变量的测定应有明确统一的标准, 并在研究全过程中严格遵守
三、 确定研究现场和研究人群
( 一) 研究现场: 可行性+可靠性+科学性
p 有足量研究对象
p 领导重视
p 群众配合
p 交通方便
p 文化水平、 医疗卫生条件好
( 二) 研究人群: 即队列的建立
p 人口相对稳定, 方便进行随访
p 医疗卫生记录较完整、 容易查询
p 无明显的环境污染
p 被研究的疾病发病率较高
p 被选择人群的合作程度好、 领导支持
1、 暴露人群的选择
p 一般人群: 常见暴露因素研究
p 特殊人群: 对罕见因素暴露的高危人群
如 职业人群: 联苯胺致膀胱癌——染料厂工人
石棉致肺癌——石棉厂工人
特殊暴露人群: 放射线与白血病——原子弹爆炸受害者, 放射治疗者等
有组织的团体: 一般人群的特殊形式
2、 对照人群的选择 «可比性
p 内对照 internal control: 先选择一组研究人群, 然后根据暴露情况进行分组
选择对照容易, 但易受暴露污染( 可比性好)
p 外对照 external control: 选择职业人群或特殊暴露人群为暴露组, 则需在该人群外去寻找平行的对照组
可避免暴露污染, 但难度较大
p 总人口对照 total population control: 以全人口率为对照, 也称一般人群对照
资料较易获得, 但不与暴露组平行, 可比性差, 暴露组也可能包括在内
使用时需进行率的标化
p 多重对照 multiple controls: 同时采用上述多种对照
可减少一种对照带来的偏倚, 但工作量大
四、 确定样本量
决定因素:
1、 一般人群( 非暴露组的) 所研究疾病的发病或死亡率( P0) , P0越接近0.5, 样本越大
2、 暴露组与对照组人群发病率之差d= P1- P0, 暴露组疾病的发病或死亡率( P1) , 或相对危险度( RR) 估算P1, d越大, 样本越小
3、 显著性水平: 第一类错误概率α
4、 把握度( 1-β) : β为第二类错误概率
注意事项:
n 一般对照组样本数≥暴露组的样本数
n 估计失访对数据分析的影响, 一般按估计样本量增加10%作为实际样本量
五、 资料的收集与随访
1、 基线资料收集 baseline data
暴露的资料, 个体的其它信息
来源: 1) 查阅各种常规记录 2) 调查询问3) 医学检查 4) 环境测量
2、 随访 follow up
n 随访的目的
¡ 确定分母的信息
研究对象是否仍处于观察中
¡ 确定分子信息
确定研究人群结局事件的发生
¡ 相关资料的收集
有关暴露和混杂因素的资料
n 随访方法——以调查表为工具
¡ 常规记录或档案
¡ 定期调查, 进行特殊安排的随访
¡ 环境调查与检测
n 观察终点(endpoint)、 随访期限和时间间隔
明确开始时间与终止时间
n 失访(losses to follow-up)的问题
n 观察终点 endpoint
研究对象出现了预期的结果, 可不再随访
n 研究对象未出现预期结果, 但无法继续随访, 则认为失访
n 失访的情况在资料分析时作为结尾数据( censored data)
六、 质量控制
n 调查员的选择
n 调查员培训
n 制定调查员手册
n 监督
每一次随访都是一次现况调查
²第三节 资料的整理与分析
基本步骤
n 描述性分析, 描述研究对象的组成、 随访的经过、 随访时间、 结局的发生情况、 失访情况等, 并对两组的一般情况做均衡性检验
n 两组率的描述、 比较, 进行关联强度的计算
n 根据上述结果和研究中可能存在的偏倚, 作出解释
一.队列发病率的计算
1、 累积发病率 cumulative incidence, CI
p 定义: 某一固定人群在一定时期内某病新发生例数( D) 与时期开始时总人数( N) 之比
p 前提: 研究人群数量比较多, 人口比较稳定, 资料整齐
p 公式:
2、 发病密度 incidence density, ID
n 前提: 队列为一动态人群, 人口不稳定, 观察人数变动较大( 失访、 迁移、 死于它病、 中途加入等)
发病密度( ID) =观察期内的发病人数/观察人年数
人时的概念
p 观察人数乘以随访单位时间的积
p 人时是将人数和时间结合起来考虑的一种度量单位, 它是观察人群中全部个体暴露于研究因素的时间总和
p 时间单位常见年, 故又称人年数(person-years)
意义: 既说明该人群发生的新病例数, 又说明该人群的大小和发生这些例数所经历的时间
3、 标化比standard mortality ratio, SMR
标准死亡率就是全人口的死亡率
q SMR>1, 说明暴露导致或促进了结局的发生
q SMR<1, 说明暴露预防或减少了结局的发生
q SMR=1, 说明暴露与疾病没有关系( 加不加暴露因素对于死亡率没有影响)
EG: SMR=2/1=2
说明该厂30~40岁工人死于肺癌的危险性是一般人群的2倍
二、 两组率差异的显著性检验
三、 暴露和疾病关联强度指标及计算«
n 比较暴露组和对照组的率的差值——绝对值
n 比较暴露组和对照组的率的比值——相对值
p 相对危险度
p 归因危险度
p 归因危险度百分比
p 人群归因危险度
p 人群归因危险度百分比
1、 相对危险度 Relative risk, RR
概念: 暴露组某病发病率( 或死亡率) 与非暴露组该病发病率( 或死亡率) 之比, 是反映暴露因素和疾病关联强度的一个指标
公式:
意义: RR说明暴露组发病( 死亡) 的危险性是非暴露组的多少倍
相对危险度判断标准
RR 95%可信区间( 不包括1, 说明暴露与疾病的关联有统计学意义, 有关联)
Woolf法
RR=1, 两组的发病率和死亡率没有差别
RR>1, 暴露组的发病率或死亡率高于非暴露组, 暴露可增加发病或死亡的危险
RR<1, 暴露组的发病率或死亡率低于非暴露组, 暴露可减少发病或死亡的危险
RR值离1越远, 表明暴露的效应越大, 暴露与结局关联的强度越大。
2、 归因危险度 Attributable risk, AR
概念: 也称率差( rate difference, RD) 、 特异危险度、 超额危险度, 为暴露组的发病( 死亡) 率与非暴露组的发病( 死亡) 率之差
意义: AR表示暴露组中完全由暴露因素所致的发病( 死亡) 率, 说明暴露的生物学效应
公式:
n RR具有病因学的意义
n AR更具有疾病预防和公共卫生学的意义
3.归因危险度百分比Attributable risk percentage, ARP
概念: 又称病因分值, 是指暴露人群中发病归因于暴露的成分占全部病因的百分比
公式:
暴露组的死亡率
4、 人群归因危险度population attributable risk, PAR
概念: 人群中由于暴露于某因素导致的发病率或死亡率, 说明暴露的社会效应
公式:
It 为全人群某病发病( 死亡) 率 ; Io 为非暴露组的某病发病( 死亡) 率
5、 人群归因危险度百分比Population attributable risk percentage , PARP或PAR%
概念: 人群中因暴露于某因素所致的发病( 死亡) 占人群发病( 死亡) 的百分比, 也即说明消除该因素后产生预防该病的效果占多大比重, 具有公共卫生学意义, 说明暴露的社会效应
公式:
«PAR和PAR%既与RR和AR相关, 也与人群中暴露者所占的比例相关
□RR和AR很高, 但PAR和PAR%不高, 说明某因素对全人群影响不大, 但对高危人群影响很大, 可对高危人群重点防制
□RR,AR, PAR和 PAR%都很高, 说明某因素对全人群的影响很大, 宜全民防制
Eg: AR%=(Ie-I0)/Ie=93.30%
说明在感染HBV的男性中, 93.30%的HCC死亡病例是由于感染了HBV造成的
PAR=It-I0=1.38/10万人年
说明在全人群中, 因为HBV感染造成的HCC死亡率为1.38/10万人年
PAR%=(It-I0)/It=66.67%
说明在全人群中, 66.67%的HCC死亡病例是由于感染了HBV造成的
n PAR=1.38/10万人年, 说明如果能够消除HBV感染, 能够减少的HCC死亡率为1.38/10万人年
n PAR%=66.67%, 说明如果能够消除HBV感染, 全人群中66.67%的HCC死亡病例可减少
6、 剂量-反应关系的分析
n 率的趋势性检验
n 有剂量-效应关系, 暴露作为病因的可能性越大
²第四节 队列研究的偏倚及控制«
1、 选择偏倚 selection bias
¡ 有人拒绝参加
¡ 有些人档案丢失或记录不全
¡ 早期病人在开始时未能发现
¡ 研究对象由志愿者组成, 其健康水平或习惯特征与总人群有差异
队列研究特有的选择偏倚«
n 失访偏倚 losses to follow-up
队列研究不可避免的偏倚, 破坏了原有样本的代表性, 一项研究的失访率最好不超过10%
原因: 迁出、 外出、 不再合作、 死亡
影响: 失访率、 失访者特征、 两组失访差异
控制方法: 尽可能提高研究对象的依从性
n 健康工人效应 health-worker effect
在研究职业暴露因素时以一般人群为对照组时产生的偏倚, 暴露组为健康工人, 发病率或死亡率较低
控制方法: 不采用一般人群为对照, 选择除暴露因素外其它因素一致的职业人群为对照;
资料分析时对期望死亡数进行校正。
2、 信息偏倚 information bias
最常见的为错分偏倚 misclassification bias:
暴露错分、 疾病错分、 联合错分
原因: 仪器不准、 检验技术不熟、 定义不明
影响: 无差异错分、 有差异错分
控制方法: 质量控制, ”盲法”测量
3、 混杂偏倚 confounding bias
由于混杂因子造成的偏倚
控制方法: 匹配、 分层分析、 多因素分析
²第五节 队列研究的优缺点
优点
n 随访收集资料 , 一般不存在回忆偏倚
n 可直接计算发病率或死亡率, 得到RR, AR等关联强度指标, 充分分析暴露因素的效应
n 因在前果在后, 检验病因假说的能力强
n 可评价一种暴露因素与多种疾病的关系
n 适于疾病自然史的研究, 适于罕见暴露因素的研究
缺点
n 不适合发病率低的疾病病因研究
n 随访时间长, 失访偏倚对结果的影响较大
n 随访过程中变量的变化对结局影响大, 研究设计要求高, 资料收集和分析困难多
n 研究费时间、 费人力、 费物力, 组织与后勤工作艰巨
展开阅读全文