收藏 分销(赏)

常见偏倚及控制.ppt

上传人:丰**** 文档编号:11203494 上传时间:2025-07-07 格式:PPT 页数:54 大小:1.77MB 下载积分:14 金币
下载 相关 举报
常见偏倚及控制.ppt_第1页
第1页 / 共54页
常见偏倚及控制.ppt_第2页
第2页 / 共54页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,医学科研中常见的偏倚类型及控制方法,(Bias and Control),Department of Health Statistics,,,SMMU,2012.06.09,主要内容,偏倚的类型,混杂因素与交互作用,偏倚的控制,偏倚的类型,误差,(error),定义:,指对事物某一特征的度量值偏离真实值的部分,即测量值与真实值之差。,分类:,随机误差,(random error),系统误差,(systematic error),,即偏倚,(bias),举例:用动脉血压计测量某人血压,(,实际值为,80mmHg),,各次测量的均值为,100mmHg,。下图为系统误差和随机误差的示意图。,随机误差,80,100,舒张压(,mmHg,),系统误差,发生频次,血压计法测量舒张压值的分布,随机误差,定义:,指由于个体差异和在研究过程中许多微小的不可控制因素造成的误差(测量误差和个体差异),特点:,不可避免,具有规律性,一般呈正态分布,重复是控制和缩小随机误差的主要方法,偏倚(系统误差),定义:,指由于对实验因素或条件控制不严而发生的一种误差,特点:,研究结果系统的偏离真实情况,研究结果具有一定倾向性和周期性,研究过程中应加以控制甚至消除,分类:,选择偏倚、信息偏倚、混杂偏倚,一、选择偏倚,(selection bias),研究者在挑选研究对象时由于选择条件受限制或设计失误所致的系统误差。,常见种类:,就诊机会偏倚,现患病例,-,新发病例偏倚,诊断信息偏倚,就诊机会偏倚,又称伯克森偏倚,(Berkson rate bias),,或入院率偏倚,指利用医院门诊或住院病人作为研究对象时,由于患者就医机会不同导致研究结果的偏差,患者是否就医取决于就医条件和对某医疗单位的信任等多种因素,而患者就医机会不同将造成研究的结果不同,用住院病例进行研究时可能没有包括:,抢救不及时而死亡的病例,距离医院远的病例,无钱住院的病例,病情轻的病例,表,1,呼吸道疾病与骨骼运动器官疾病的关系(一般人群),呼吸道,疾病,骨骼运动器官疾病,OR,有,无,合计,发生率,(,),有,17,207,224,7.59,1.06,无,184,2376,2560,7.19,合计,201,2583,2784,7.22,表,1,呼吸道疾病与骨骼运动器官疾病的关系(住院,6,个月以上病人),呼吸道,疾病,骨骼运动器官疾病,OR,有,无,合计,发生率,(,),有,5,15,20,25.00,4.06,无,18,219,237,7.59,合计,23,234,257,8.95,现患病例新发病例偏倚,又称奈曼氏偏倚,(Neymans bias),,主要是由于研究中所用的病例类型不同所产生的差别,病例对照研究结果与队列研究的结果会有差异,表,2,冠心病与高胆固醇血症的关系(病例对照研究),冠心病,血胆固醇水平,OR,2,P,高,低,合计,发生率,(,),有,38,113,151,25.17,1.16,0.29,0.589,无,34,117,151,22.52,合计,72,230,302,23.84,表,2,冠心病与高胆固醇血症的关系(队列研究),血胆固醇水平,冠心病,RR,2,P,有,无,合计,发病率,(,),高,85,462,547,15.54,2.18,35.50,0.001,低,116,1511,1627,7.13,合计,201,1973,2174,9.25,诊断信息偏倚,(detection signal bias),指某疾病与暴露因素之外存在另外一个临床症状或体征,这种症状或体征不是该疾病的危险因素,但人们往往因为这种症状或体征就诊,从而间接提高了该疾病早期病例的检出率,但过高估计了暴露因素的程度,造成暴露因素和该疾病关系的偏倚,表,3a,妇女绝经期服用雌激素与子宫内膜癌的关系(以阴道出血就诊的病例),子宫,内膜癌,服用雌激素,OR,有,无,合计,发生率,(,),有,45,72,117,38.46,9.82,无,7,110,117,5.98,合计,52,182,234,22.22,表,3b,妇女绝经期服用雌激素与子宫内膜癌的关系(以刮宫和子宫切除的病例),子宫,内膜癌,服用雌激素,OR,有,无,合计,发生率,(,),有,59,89,148,39.86,1.67,无,42,106,148,28.38,合计,101,195,296,34.12,选择偏倚的控制,对研究过程中可能出现的偏倚有充分的了解,在设计时考虑周全,严格掌握研究对象的纳入和排除标准,保障较好的代表性,病例对照研究中首选新病例,对照组不应为慢性病病例,队列研究中增大样本量,降低失访,必要时将失访人群特征与未失访人群对照,采用多重对照,二、信息偏倚,(information bias),在对研究对象的信息收集、测量时出现的系统误差,可以来自被研究对象,也可以来自研究者本身,非盲法研究较易发生,信息偏倚常见的种类,无应答偏倚,回忆偏倚,说谎偏倚,诊断怀疑偏倚,沾染偏倚,测量偏倚,来自被调查对象,来自调查者本身,来自研究对象的偏倚之,无应答偏倚,无应答偏倚:研究对象拒绝回答或因研究对象失访而缺失答案所造成的偏倚,是否有无应答偏倚取决于无应答者在疾病暴露因素方面的特征是否与应答者有差异,美国曾采用邮寄问卷形式,调查美国退伍军人吸烟习惯。,30,天后总结收集的回复,结果发现,不吸烟者有,85%,回复了问卷,而吸烟者仅,67%,对于一些敏感问题的调查,容易引起不应答偏倚,例如我国南方调查农村婴儿死亡原因,有,28%,的人拒绝提供婴儿死亡原因,来自研究对象的偏倚之,回忆偏倚,回忆偏倚:因研究对象的记忆失真或记忆不完整所造成的研究结果偏倚,病例对照研究和回顾性队列研究最容易出现回忆偏倚,回忆偏倚的产生与调查时间至事件发生时间、以及与事件的重要性有关,同时也与调查员的调查过程和询问技术有关,Wilcox,等在调查流产回忆准确性时发现,调查,10,年前流产的有,82%,回忆完整,调查,20,年前流产的有,73%,回忆完整。在受孕前,6,周流产者能回忆起来的有,54%,,而在受孕,13,周流产者能回忆起来的有,93%,病例组和对照组的回忆误差也可能不一致,病例组往往比对照组记忆准确。原因是调查事件的重要性对两组人是不一样的,选择不易忘记的指标做调查,并重视问卷和询问技术,有助于减少的回忆偏倚,来自研究对象的偏倚之,说谎偏倚,说谎偏倚:研究对象故意造成的,容易发生在敏感问题上,如吸毒史、性行为和中、小学生吸烟等,与研究对象个人目的有关,来自研究者的偏倚之,诊断怀疑偏倚,诊断怀疑偏倚:研究者已知研究对象的某些情况,因而在诊断过程中刻意寻求某种结果而造成的偏倚,非盲法研究和队列研究中容易发生,在研究口服避孕药与下肢血栓性静脉炎关系的队列研究中,观察者会对口服避孕药的妇女更加频繁、仔细的收寻静脉炎证据,尤其是对病情较轻,需仔细检查才能确诊的病例。而对未口服避孕药的妇女检查较马虎,造成暴露与疾病结果的偏倚,在开放性的药物临床试验中,也容易发生诊断怀疑偏倚,来自研究者的偏倚之,沾染偏倚,沾染偏倚:研究对象有意或无意地接受了研究内容不允许接受的措施而造成的研究结果偏倚,对照组接受试验组的措施,导致组间差异缩小,试验组接受更好的支持治疗,研究结果偏向试验因素,称为干扰偏倚,来自研究者的偏倚之,测量偏倚,测量偏倚:研究者对研究的指标和数据进行测量时产生的系统误差,常见的情况有:使用的仪器未校正、测定方法的标准和操作规范不统一、操作人员技术不熟练等,信息偏倚的控制,严格的调查设计和研究人员的科学态度,严格的质量控制措施,尽量采用“盲法”收集资料,尽量收集客观指标的资料,采用调查技巧避免无应答、回忆和说谎偏倚,收集资料的范围可以适当广泛些,借以分散调查人员和研究对象对某项因素的注意力,减少某些偏见带来的偏倚,三、混杂偏倚,(confounder bias),暴露因素与疾病发生的关联程度受到其他因素的歪曲或干扰而造成的系统误差,在研究设计阶段和资料分析阶段未能对混杂因素加以控制或未进行校正,使得研究结果与真实情况不符,混杂偏倚会影响病因研究的因果关系、疾病治疗的效果和预后因素的评价,混杂因素存在的条件,混杂因素对研究结果有影响,混杂因素与暴露因素伴随存在,混杂因素在比较人群中的分布不均衡,表,4,心梗与维生素,E,的关系的队列研究,维生素,E,心梗,RR,有,无,服,400,600,0.67,不服,600,400,表,5,维生素,E,与吸烟的关系,维生素,E,吸烟,有,无,服,270,(,27,),730,(,73,),不服,880,(,88,),120,(,12,),表,7,控制吸烟因素后心梗与维生素,E,的关系,维生素,E,吸烟,不吸烟,心梗,RR,心梗,RR,有,无,有,无,服,240,30,1.35,160,570,1.32,不服,580,300,20,100,表,6,控制维生素,E,因素后心梗与吸烟的关系,吸烟,用维生素,E,不用维生素,E,心梗,RR,心梗,RR,有,无,有,无,吸烟,240,30,4.06,580,300,3.95,不吸,160,570,20,100,混杂因素与交互作用,交互作用,暴露因素按第三个因素分层后,暴露因素和疾病的关联强度在层间明显不同,此时称第三个因素有交互作用,称为效应修正因子,(effect-modification factor),表,8,暴露与疾病的关系,暴露,疾病,RR,有,无,有,200,800,4.00,无,50,950,表,9a,暴露与疾病的关系(,F,因素不存在),暴露,疾病,RR,有,无,有,194,706,1.03,无,21,79,表,9b,暴露与疾病的关系(,F,因素存在),暴露,疾病,RR,有,无,有,6,94,1.86,无,29,871,表,10,某疾病与暴露因素的关系,暴露,疾病,RR,有,无,有,200,1800,1.00,无,400,3600,表,11a,疾病与暴露的关系(,F,因素不存在),暴露,疾病,RR,有,无,有,95,155,3.00,无,380,2620,表,11b,疾病与暴露的关系(,F,因素存在),暴露,疾病,RR,有,无,有,105,1645,3.00,无,20,980,混杂因子和交互因子的区别,概念区别:混杂因子歪曲了暴露因素与疾病的关系,应防止和控制;交互因子揭示了某种效应,应加以挖掘,识别方法:分层分析,下结论前应进行统计学检验,偏倚的控制,偏倚可出现在整个研究过程,应当在各个阶段进行控制,将偏倚的影响减少到最低程度,力求研究结论的真实可靠,偏倚的控制,设计阶段控制:限制、随机分组和配对,测量和结果判断的控制:盲法,资料分析阶段的控制:分层分析、标准化分析、多因素分析,设计阶段的控制,限制,(restrict),:指在设计阶段对研究对象的纳入标准加以限制,使研究对象选取限制在一定范围内,范围越窄,研究对象彼此的差别越小,越利于观察因素作出结论,由于对混杂因素进行限制,研究的结果使得研究者不可能对暴露与混杂因素的交互作用加以分析和度量,只能对暴露和疾病之间的关系进行研究,限制的缺点还在于,在限制混杂因素的同时,对暴露和疾病发生的范围也进行了限制,不能观察到疾病影响的全貌,设计阶段的控制,随机分配,(randomized allocation),:主要适用实验研究,即将研究对象随机分配到试验组和对照组,随机分配的目的:使研究对象的非处理因素和混杂因素在各组间趋于均衡,组间基线情况有良好的可比性,而使得处理因素的真实差别得以显示,设计阶段的控制,配对或匹配,(matching),:,配对是控制混杂因素常用的方法,特别在病例,-,对照研究中较常用,匹配病例组和对照组的研究对象,匹配的特征一般包括年龄、性别、病情等因素,配对的缺点:,配对因素较多会使部分病例找不到对照,致,使信息的浪费,过度配对会掩盖暴露的真实作用,不能对配对掉的混杂因子及交互作用做分析,测量和结果判断的偏倚控制,盲法,(blinding),:是指病人、医生或研究者不知道病人接受的是治疗药或对照药的前提下,观察或测量研究对象结果的方法,盲法是避免观察者和被观察对象发生信息偏倚最有效的方法。特别是判断结果是主观的评价指标,(,头痛、腹痛、乏力,),尤为重要,资料分析混杂因素的控制,分层分析,:是资料分析阶段控制混杂因素常用的方法。即将观察对象按照相似性的特点,分成亚组后再进行试验组和对照组的比较,分层因素主要为与比较指标有关的因素,如年龄、性别、病情等。按某混杂因素分层后,再用相应的统计方法进行处理,资料分析混杂因素的控制,标准化法,:是分层分析法的补充。主要用于当比较组间存在混杂因素,且该因素在组间分布不均衡时。,资料分析混杂因素的控制,当样本例数不大,或混杂因素较多,不宜采用分层方法,最好采用,多因素分析方法,常用的多因素分析方法有多元线性回归、多元方差分析、协方差分析、,logistic,回归模型、对数线性模型、,COX,模型等,谢谢!,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服