收藏 分销(赏)

第17章-队列研究-卫生统计学.ppt

上传人:a199****6536 文档编号:1736625 上传时间:2024-05-08 格式:PPT 页数:41 大小:517.01KB
下载 相关 举报
第17章-队列研究-卫生统计学.ppt_第1页
第1页 / 共41页
第17章-队列研究-卫生统计学.ppt_第2页
第2页 / 共41页
第17章-队列研究-卫生统计学.ppt_第3页
第3页 / 共41页
第17章-队列研究-卫生统计学.ppt_第4页
第4页 / 共41页
第17章-队列研究-卫生统计学.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、第十七章第十七章 队列研究的样本含量队列研究的样本含量估算与统计分析估算与统计分析第一节第一节概述概述暴露组和非暴露组,随访观察一定时间后的结局,比暴露组和非暴露组,随访观察一定时间后的结局,比较组间差异。较组间差异。按照开始观察的时间点可分为:按照开始观察的时间点可分为:前瞻性队列研究(前瞻性队列研究(prospective cohort study)回顾性队列研究(回顾性队列研究(retrospective cohort study)双向性队列研究(双向性队列研究(ambispective cohort study):开始:开始观察的时间为过去的一时间点,观察到现在,再到将观察的时间为过去

2、的一时间点,观察到现在,再到将来。来。队列研究的基本特点队列研究的基本特点1)观察性研究观察性研究 2)设有对照设有对照 对照组可与暴露组来自同一人群,也可以来自不同的对照组可与暴露组来自同一人群,也可以来自不同的人群。人群。3)由由“因因”及及“果果”先确知因,再前瞻地观察果先确知因,再前瞻地观察果 l能验证暴露与结局的因果联系能验证暴露与结局的因果联系 l大量个体、较长时间、需要人力和物力、精心设计大量个体、较长时间、需要人力和物力、精心设计设计设计1.暴露人群的选择暴露人群的选择1)在普查基础上,确定暴露人群在普查基础上,确定暴露人群 2)查阅档案资料获得暴露人群及暴露水平的线索查阅档案

3、资料获得暴露人群及暴露水平的线索3)一定地理区域内的居民或种族一定地理区域内的居民或种族例如例如,英国有人研究发电厂附近居民的电离子暴露与疾,英国有人研究发电厂附近居民的电离子暴露与疾病的关系病的关系又如又如,研究青少年期阴茎割包皮风俗与宫颈癌发生的关,研究青少年期阴茎割包皮风俗与宫颈癌发生的关系,选择特殊民族(犹太人)。系,选择特殊民族(犹太人)。足够的数量?比较稳定?随访方便?足够的数量?比较稳定?随访方便?2.对照人群的选择对照人群的选择除暴露因素外,其它非研究因素尽可能相似除暴露因素外,其它非研究因素尽可能相似常用的对照:常用的对照:1)内对照内对照 与暴露队列来自同一人群与暴露队列来

4、自同一人群2)外对照外对照 在特殊暴露人群的队列研究中可以选在特殊暴露人群的队列研究中可以选 择另外一个人群作为对照人群择另外一个人群作为对照人群 例:例:犹太人犹太人-当地阿拉伯人当地阿拉伯人3)总人口对照总人口对照 例:特殊人群例:特殊人群-总人群总人群 3.结局指标的选择结局指标的选择 研究设计时要给结局事件以明确的定义研究设计时要给结局事件以明确的定义 如发病率等如发病率等第二节第二节 队列研究数据的统计描述队列研究数据的统计描述一、疾病发生指标的计算一、疾病发生指标的计算图图17-2 随访过程示意图随访过程示意图时间时间始点始点终点终点0时间时间始点始点终点终点01 1累积发病率累积

5、发病率累积发病率累积发病率(1 1)直接法直接法直接法直接法l若随访人口稳定、随访时间不长、观察期间内无若随访人口稳定、随访时间不长、观察期间内无失访人数时,可直接计算累积发病率失访人数时,可直接计算累积发病率(cumulative incidence,CI)l有删失(有删失(censoring)时,校正公式)时,校正公式:(2)定群寿命表法(定群寿命表法(cohort life table)若随访时间较长、随访人群变动较大、中途失访较多。若随访时间较长、随访人群变动较大、中途失访较多。将整个随访期分为若干个时间区间,将整个随访期分为若干个时间区间,k=1,2,K计算每一区间的发病率,进而计算

6、累积发病率。计算每一区间的发病率,进而计算累积发病率。第第k个区间发病率个区间发病率pkl 第第k个区间内不发病率:个区间内不发病率:1-pkl直到第直到第k个区间末都不发病的频率个区间末都不发病的频率l第第k个区间末前发病的频率个区间末前发病的频率:例例例例17-317-3某市某市某市某市EBEB病毒抗体阴性队列的每年年初病毒抗体阴性队列的每年年初病毒抗体阴性队列的每年年初病毒抗体阴性队列的每年年初随访人群数、年发病数和失访数,试根据这份资随访人群数、年发病数和失访数,试根据这份资随访人群数、年发病数和失访数,试根据这份资随访人群数、年发病数和失访数,试根据这份资料计算随访料计算随访料计算随

7、访料计算随访5 5年的各年的发病率和累积发病率。年的各年的发病率和累积发病率。年的各年的发病率和累积发病率。年的各年的发病率和累积发病率。2 2人时发病率人时发病率人时发病率人时发病率(1 1)人时的计算)人时的计算)人时的计算)人时的计算l队列研究随访时间较长,每个观察对象接受的观察时间长短队列研究随访时间较长,每个观察对象接受的观察时间长短不一不一;采用人时作为量度单位:人年、人月、人天等。采用人时作为量度单位:人年、人月、人天等。l利用计算机软件只要输入每个观察对象开始观察的时间和结利用计算机软件只要输入每个观察对象开始观察的时间和结束观察的时间,就可以计算出人时数。束观察的时间,就可以

8、计算出人时数。(2 2)人时发病率)人时发病率)人时发病率)人时发病率(person-time incidence rate)例例17-4 为探讨为探讨EB病毒与鼻咽癌发病的关系,研究者在某市进行病毒与鼻咽癌发病的关系,研究者在某市进行了了EB病毒抽样调查,共检查病毒抽样调查,共检查25-70岁居民岁居民41471人,其中人,其中38550人人EB病毒抗体阴性,病毒抗体阴性,2921人阳性。以人阳性。以EB病毒抗体阴性和阳性者形病毒抗体阴性和阳性者形成两个组,进行了为期成两个组,进行了为期12年的队列研究,两组分别随访了年的队列研究,两组分别随访了37579人年和人年和20477人年,人年,E

9、B病毒抗体阴性组共发生鼻咽癌病毒抗体阴性组共发生鼻咽癌54例,阳性例,阳性组组57例。试计算两组的人年发病率。例。试计算两组的人年发病率。EB病毒阴性人群病毒阴性人群解释:解释:EB病毒阴性人群中病毒阴性人群中,每每10万人年约发生万人年约发生12.34个鼻咽癌病个鼻咽癌病人人,或或 EB病毒阴性人群中病毒阴性人群中,鼻咽癌平均鼻咽癌平均每年发病频率每年发病频率为为12.34/10万万 EB病毒阳性人群病毒阳性人群二、疾病与暴露关联指标的计算二、疾病与暴露关联指标的计算1.1.相对危险度(相对危险度(相对危险度(相对危险度(relative riskrelative risk,RRRR)设设

10、暴露组的人暴露组的人(时时)数为数为N1,疾病的发病率为,疾病的发病率为P1 非暴露组的人非暴露组的人(时时)数为数为N0,疾病的发病率为,疾病的发病率为P0则则 相对危险度的估计值相对危险度的估计值2.2.归因危险度(归因危险度(归因危险度(归因危险度(attributable riskattributable risk,ARAR)l归因危险度比率(归因危险度比率(attributable risk percent,ARP)3.3.人群归因危险度人群归因危险度人群归因危险度人群归因危险度(population attributable risk,(population attributabl

11、e risk,PAR)PAR)P P:整个人群中该疾病的发病率:整个人群中该疾病的发病率:整个人群中该疾病的发病率:整个人群中该疾病的发病率 P P0 0:非暴露人群发病率:非暴露人群发病率:非暴露人群发病率:非暴露人群发病率l l人群归因危险度比率(人群归因危险度比率(人群归因危险度比率(人群归因危险度比率(population attributable risk population attributable risk percentpercent PARP PARP)例例17-4 第三节第三节 队列研究中暴露组与非暴队列研究中暴露组与非暴露组的比较露组的比较一、相对危险度的假设检验和区间

12、估计一、相对危险度的假设检验和区间估计1.相对危险度的假设检验相对危险度的假设检验(1)人)人-时发病率资料时发病率资料Mantel-Haenszel 统计量统计量例例17-8(2)发病频率资料发病频率资料Mantel-Haenszel 统计量统计量 H0成立时,这个统计量近似地服从自由度为1的 分布 注:它与前面学过的Pearson 统计量的关系是当N很大时,两者几无差别,不很大时,它优于Pearson统计量。2.相对危险度的区间估计相对危险度的区间估计(1)近似正态法近似正态法样本含量较大时,近似服从正态分布,(2)Miettinen法法脑筋急转弯脑筋急转弯l学会了相对危险度学会了相对危险

13、度RR=1的假设检验的假设检验,你会检你会检验归因危险度验归因危险度AR=0吗吗?l学会了相对危险度学会了相对危险度RR的区间估计的区间估计,你会估计归因危险度的置信区间吗你会估计归因危险度的置信区间吗?二、二、Mantel-Haenszel 分层分析分层分析混杂因素(混杂因素(confounder)与暴露因素和疾病均关联的非研究因素。)与暴露因素和疾病均关联的非研究因素。对混杂因素的控制对混杂因素的控制:l设计阶段,按混杂因素的水平分层,使混杂因素在同一层内均设计阶段,按混杂因素的水平分层,使混杂因素在同一层内均衡;衡;l分析阶段,通过分层或建立统计模型的方法进行数据分析,以分析阶段,通过分

14、层或建立统计模型的方法进行数据分析,以消除混杂因素的影响。消除混杂因素的影响。1人时资料人时资料 2频率资料频率资料 (1)校正的相对危险度校正的相对危险度(2)Mantel-Haenszel分层检验分层检验 三、剂量三、剂量-反应关系分析反应关系分析Dose-response relationship:发病率与暴露水平与间关系发病率与暴露水平与间关系例例17-10 研究者收集了某冶炼厂工人砷暴露的年份与呼吸系统肿研究者收集了某冶炼厂工人砷暴露的年份与呼吸系统肿瘤死亡数据,是否呼吸系统肿瘤的死亡率随砷暴露年份增加而增瘤死亡数据,是否呼吸系统肿瘤的死亡率随砷暴露年份增加而增加加?线性趋势的1 1

15、一组资料的情形一组资料的情形一组资料的情形一组资料的情形2 2分层资料的情形分层资料的情形分层资料的情形分层资料的情形二、样本含量估算二、样本含量估算(第一节第一节)1总体相对危险度的估计总体相对危险度的估计例例例例17-1 17-1 在一个队列研究中,相对危险度的真值在一个队列研究中,相对危险度的真值在一个队列研究中,相对危险度的真值在一个队列研究中,相对危险度的真值约为约为约为约为1.851.85,非暴露人群的患病率为,非暴露人群的患病率为,非暴露人群的患病率为,非暴露人群的患病率为0.200.20,置信度,置信度,置信度,置信度为为为为95%95%,要求相对危险度的误差不超过真值的,要求

16、相对危险度的误差不超过真值的,要求相对危险度的误差不超过真值的,要求相对危险度的误差不超过真值的10%10%,问需要多大样本含量?,问需要多大样本含量?,问需要多大样本含量?,问需要多大样本含量?2相对危险度的假设检验相对危险度的假设检验例例例例17-217-2 在临床队列研究中,将人群分为具有某种白细胞抗原与不在临床队列研究中,将人群分为具有某种白细胞抗原与不在临床队列研究中,将人群分为具有某种白细胞抗原与不在临床队列研究中,将人群分为具有某种白细胞抗原与不具有该抗原的两组,计划比较具有该抗原的两组,计划比较具有该抗原的两组,计划比较具有该抗原的两组,计划比较5 5年后两组中患某种疾病的概率

17、。据年后两组中患某种疾病的概率。据年后两组中患某种疾病的概率。据年后两组中患某种疾病的概率。据有关资料有关资料有关资料有关资料,相对危险度约为相对危险度约为相对危险度约为相对危险度约为0.50.5,不具备该白细胞抗原者患该病率约,不具备该白细胞抗原者患该病率约,不具备该白细胞抗原者患该病率约,不具备该白细胞抗原者患该病率约为为为为0.300.30,希望检验效能为,希望检验效能为,希望检验效能为,希望检验效能为90%90%,问欲显现两组差异需多大样本量?,问欲显现两组差异需多大样本量?,问欲显现两组差异需多大样本量?,问欲显现两组差异需多大样本量?注意注意在确定队列研究的样本含量时在确定队列研究

18、的样本含量时(1)暴露队列与非暴露队列的比例暴露队列与非暴露队列的比例 非暴露队列样本含量不应少于暴露队列。非暴露队列样本含量不应少于暴露队列。(2)如果暴露因素是非常罕见的,不宜做队列研究如果暴露因素是非常罕见的,不宜做队列研究(3)队列研究的随访时间队列研究的随访时间 样本含量较少,随访时间要长样本含量较少,随访时间要长;样本含量较大,随访时间可以缩短。样本含量较大,随访时间可以缩短。小结小结1队列研究是一种从因到果的流行病学分析性研究方队列研究是一种从因到果的流行病学分析性研究方法法,通过比较暴露人群和非暴露人群疾病发生的频率,验通过比较暴露人群和非暴露人群疾病发生的频率,验证疾病与暴露

19、因素的关联。证疾病与暴露因素的关联。2由于对象在不同时间进入或退出观察队列,不宜直由于对象在不同时间进入或退出观察队列,不宜直接用发病人数除以观察人数计算发病率接用发病人数除以观察人数计算发病率.如果在一段时间内发病率保持不变如果在一段时间内发病率保持不变,正确的方法是正确的方法是用发病人数除以总的暴露人时,得到人时发病率。用发病人数除以总的暴露人时,得到人时发病率。如果在不同时间段内发病率不同如果在不同时间段内发病率不同,正确的方法是用寿命正确的方法是用寿命表方法整合不同时段的发病概率,得到各时刻的发病率。表方法整合不同时段的发病概率,得到各时刻的发病率。3队列研究描述疾病与暴露因素关联的主

20、要指标是相队列研究描述疾病与暴露因素关联的主要指标是相对危险度、归因危险度和人群归因危险度。这三个指对危险度、归因危险度和人群归因危险度。这三个指标从不同的角度反映疾病与暴露因素之间的关联程度。标从不同的角度反映疾病与暴露因素之间的关联程度。4队列研究数据分析主要包括队列研究数据分析主要包括:(1)各组数据的统计描述各组数据的统计描述 (2)组间指标的比较组间指标的比较 (3)消除混杂因素影响消除混杂因素影响,分层后整合分层后整合 (4)暴露因素多等级的剂量暴露因素多等级的剂量-反应关系反应关系5在进行队列研究数据分析时,需识别你的数据是频在进行队列研究数据分析时,需识别你的数据是频率资料还是

21、人时资料,以选择相应的计算公式。率资料还是人时资料,以选择相应的计算公式。6.为计算相对危险度区间估计所需的样本量为计算相对危险度区间估计所需的样本量,必须已必须已知知3条信息条信息:()非暴露人群和暴露人群的发病概率和()非暴露人群和暴露人群的发病概率和()相对危险度区间估计的相对误差()相对危险度区间估计的相对误差(区间半长(区间半长度除以真值)度除以真值)()置信度()置信度1-.为计算相对危险度假设检验所需的样本量为计算相对危险度假设检验所需的样本量,必须已必须已知条信息知条信息:()非暴露人群和暴露人群的发病概率和()非暴露人群和暴露人群的发病概率和()允许假阳性的概率()允许假阳性的概率(检验水准)(检验水准)()允许假阴性的概率()允许假阴性的概率 Thanks

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服