偏倚(修改版).ppt_咨信网zixin.com.cn

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,真实性,偏倚,机遇,（一）真实性概述,研究的真实性是指一项观察或研究所作推论的正确及可靠程度，即所得结果与客观实际的符合程度。,如果研究结果与客观实际存在不符合的地方，这就是研究误差，它是研究真实性的反面。,研究真实性的反面就是研究误差。,研究误差可以分为随机误差和系统误差两部分,随机误差没有固定方向和固定大小，一般呈正态分布，来自于随机抽样变异和测量随机变异等,系统误差是指有固定方向和固定大小的误差，来自于对象选取、测量和统计分析等的方法学缺陷,机遇与偏倚,机遇与偏倚反映了一项研究或测量结果的两方面：,精确性(随机误差)（precise）,准确度(系统误差)（accurate）,Accurate and precise,True Value,Precise only,True Value,Accurate only,True Value,Neither Accurate nor Precise,True Value,偏倚(bias)和机遇(chance),准确度（真实度）与可靠性(精确性）之间的关系,频,不可靠,数,不准确（不真实）,测量值,真实值测量偏倚值,A,C,B,D,A 既真实又可靠（精确）,B 真实但不可靠,（精确）,C 可靠,（精确）,但不真实,D 不真实不可靠,（精确）,机遇与偏倚的关系,统计方法,扩大样本,设计、测量、分析,控制方法,不能,能,能否避免,无,有,方向性,不同点,重复性,影响真实性,任何研究阶段,任何类型研究,共性,机遇,偏倚,（二）内部真实性,内部真实性（internal validity）是指研究结果与实际研究对象真实情况的符合程度。,它回答一个研究本身是否真实或有效。如果一个研究针对实际研究对象提供了真实的描述频率或效应估计值，即随机误差和系统误差较小，则该研究是真实或有效的。如果一个研究本身是不真实或无效的，则很难再应用到其他人群。,（三）外部真实性,外部真实性（external validity）是指研究结果与推论对象真实情况的符合程度，外部真实性又称为普遍性（generalizability）。,它回答一个研究能否推广应用到研究对象以外的人群。如果研究对象对于推论对象的代表性不好，尽管它的内部真实性可能好，但它的外部真实性则肯定差。,内部真实性和外部真实性,样本,样本,偏倚,机遇,研究结论,内部真实性,外部真实性：外推到样本所属总体或其他人群,病人总体,影响科研质量的因素,选题起点,研究设计,研究实施,结果分析及解释,结论终点,偏倚,研究误差中的系统误差部分，称为偏倚（bias）,最著名的早期偏倚研究是Berkson做的，他在1946年证实了采用医院病人为对象的病例对照研究，容易遭受潜在的选择偏倚，这种偏倚来自于病人入院风险同病人的多种状况有关，又称为Berkson偏倚。,1976年Miettinen详细讨论了偏倚的定义，并给出了分类框架，这就是：,选择偏倚,信息偏倚,混杂偏倚,偏倚产生的阶段,1 设计阶段study design-选择偏倚 Selection bias,2 实施阶段data collection-测量偏倚 Measurement bias,3 分析阶段analysis-混杂偏倚 Confounding bias,一,选择偏倚,（一）选择偏倚(selection bias)的定义,指被选定的研究对象与未被抽取的人群在某些特征上存在系统差异而出现的误差。,主要发生在设计阶段，也产生于资料收集阶段的失访、无应答等。,以在病例对照研究与现况研究中为常见。,（二）选择性偏倚的种类,1.入院率偏倚（admission rate bias）,亦称伯克森偏倚（Berksons bias）,是指利用医院就诊或住院病人作为研究对象时，由于入院率的不同而导致的偏差。,2.现患-新发病例偏倚（prevalence-incidence bias）,也称奈曼偏倚,（Neyman bias）,研究病例一般是现患病人，不包括死亡病例和那些病程短、轻型、不典型的病例。,某些病人在患病后，有可能会改变其原来的某些因素的暴露状况。,这样用于研究的病例类型（现患病例）与队列研究或实验研究的病例不同，它们多用新病例，由此而产生的偏倚即为现患病例-新病例偏倚。,美国弗明汉地区居民血胆固醇水平与冠心病关系研究,胆固醇百分位,队列研究（第6次）,病例对照研究（第6次）,冠心病,非冠心病,合计,冠心病,非冠心病,合计,75,85,462,547,38,34,72,75,116,1511,1627,113,117,230,合计,201,1973,2174,151,151,302,RR=2.40,OR=1.16,3.无应答偏倚（non-respondent bias）,是指研究对象中那些没有按照研究设计对被调查的内容予以应答者。某个特定样本中的无应答者的患病状况，以及对某一或某些研究因素的暴露情况与应答者可能不同，由此而产生的偏简称为无应答偏倚。,无应答偏倚在观察性研究或实验性研究中均可发生。,4.失访偏倚(loss to follow up bias),由于失访而引起的偏倚称为失访偏倚。,为一种特殊的无应答形式，主要发生在前瞻性性研究及临床试验中。,失访：是指在追踪观察的过程中，某些对象由于种种原因而脱离了观察（迁走、与本病无关的死亡及本人退出实验等），观察者无法了解到他们的结局。,有两种形式：,失访：指观察期限短于规定的观察危险期者。,退出：指在随访过程中因种种原因拒绝继续留在观察组中。,5.志愿者偏倚(volunteer bias),志愿参加观察者同非志愿者在关心健康、注意饮食及营养食疗、禁烟、禁酒、坚持体育锻炼等方面有系统差异，因支援志愿者被入选为观察对象，而非志愿者落选，由此产生的选择性偏倚，称为志愿者偏倚。,（三）选择偏倚的控制,首先研究者对在整个研究中可能会出现的各种选,择偏倚应有充分的了解、掌握。,严格掌握研究对象纳入与排除的标准。,在研究中采取相应措施，尽量取得研究对象的合,作，以获得尽可能高的应答率，减少无应答率及,队列研究中的失访和实验性研究中的中途退出等。,尽量采用多种对照如在病例对照研究中，理想的,研究对象应是人群中的全体病例和非该病病例及,正常人，或其有代表性的样本，但往往很难做到。,二信息偏倚,（一）概述,信息偏倚（information bias):又称观察偏倚(observational bias），是指在研究的实施阶段从研究对象获取研究所需的信息时所产生的系统误差。,信息偏倚可来自于研究对象、研究者本身，也可来自用于测量的仪器、设备、方法等。,信息偏倚的表现是使研究对象的某种特征被错误分类（misclassification）。,（二）信息偏倚的种类,1.,回忆偏倚（recall bias）,指研究对象在回忆以往发生的事情或经历时，由于在准确性和完整性上的差异所致的系统误差。,回忆偏倚在病例对照研究中最常见。,产生的原因：,调查的事件或因素发生的频率甚低，未给研究对象留下深刻印象而被遗忘；,调查事件是很久以前发生的事情，研究对象记忆不清；,研究对象对调查的内容或事件关心程度不同，因而回忆的认真程度有异。,2.报告偏倚,（reporting bias）,指由研究对象有意的夸大或缩小某些信息而导致的偏倚，因此亦被称作说谎偏倚。,3.诊断怀疑偏倚（diagnostic suspicion bias）,由于研究者事先了解研究对象对研究因素的暴露情况，怀疑其已患某病，或主观上倾向于应该出现某种阳性结果，于是在作诊断或分析时，倾向于自己的判断。由此而造成的偏倚称为诊断怀疑偏倚。,诊断怀疑偏倚多见于临床试验和队列研究，在病例对照研究中也可产生,亦可发生于研究对象。,4.暴露怀疑偏倚（exposure suspicion bias）,研究者若事先了解研究对象的患病情况或某种结局，可能会对其以与对照组不可比的方法探寻认为与某病或某结局有关的因素，如多次认真地调查和询问病例组某因素的暴露史，而漫不经心地调查和询问对照组，从而导致错误结论，此即暴露怀疑偏倚。,5.,测量偏倚（detection bias）,测量偏倚指对研究所需指标或数据进行测定或测量时产生的偏差。,所用仪器、设备校正不准确，试剂不符合要求，使用方法的标准或程序不统一，分析、测试条件不一致，以及操作人员的技术问题等等，均可导致测量结果的不正确，使测量结果偏离真值。,所用调查表设计的科学性，记录是否完整，调查人员对工作的认真程度以及访问方式、态度等等，亦均可导致不准确的信息，产生测量偏倚。,（四）信息偏倚的控制,1.研究者对拟进行的研究要制定明细的资料收集方法和严格的质量控制方法,2.尽可能采用盲法收集资料,3.尽且采用客观指标的信息,4.回忆偏倚：可通过一定的调查技巧加以避免，如可选择一个与暴露史有联系的鲜明的记忆目标帮助其联想回忆等等。此外对在条件允许时询问到的暴露史，尽可能的与客观记录核实。,敏感问题：可通过调查知情人或相应的调查技术获取正确的信息。,三混杂偏倚,（一）混杂偏倚的定义,混杂偏倚或称混杂,(confounding),，是指在流行病学研究中，由于一个或多个潜在的混杂因素,(confounding factor),的影响，掩盖或夸大了研究因素与疾病（或事件）之间的联系，从而使两者之间的真正联系被错误地估计。,（二）混杂因素的定义与特点,1.定义,亦称混杂因子或外来因素,(extraneous factor)，,是指与研究因素和研究疾病均有关，若在比较的人群组中分布不均，可以歪曲（掩盖或夸大）因素与疾病之间真正联系的因素。,2.特点,必须是所研究疾病的独立危险因子；,必须与研究因素（暴露因素）有关联（有统计学,联系）；,一定不是研究因素与研究疾病因果链上的中间变量。,混杂现象,高血压冠心病,高脂血症,非混杂现象,风湿热风湿性瓣膜病,溶血性链球菌、咽炎,吸烟、火柴与肺癌,烟草公司的研究者坚持认为火柴暴露可以引起肺癌,他们开展了一项大型的病例对照研究来检验这个假说,研究者通过人群登记系统找到了,1000,名肺癌病例，其中,820,人曾携带过火柴,从人群中随机抽取了,1000,名对照，经,X,线确认未患肺癌，其中,340,人曾携带过火柴,根据这批数据，定量估计火柴与肺癌之间的关联,吸烟、火柴与肺癌,火柴与肺癌,想分别了解一下吸烟者与不吸烟者中火柴与肺癌的关系,结果发现在,1000,名病例中，,900,名为吸烟者，其中,810,名曾携带火柴,在,1000,名对照中，,300,名为吸烟者，其中,270,名曾携带火柴,分层绘制,22,表，计算火柴与肺癌的关联效应值,吸烟、火柴与肺癌,OR,粗,=8.8(7.2,10.9),OR,吸烟者,=1.0(0.6,1.5),OR,不吸烟者,=1.0(0.5,2.0),吸烟、火柴与肺癌,这个例子说明：即使本来没有任何效应，混杂也可以引起明显的效应,在火柴与肺癌的关系中，吸烟就是一个混杂因素,(confounding factor,confounder),吸烟混淆了火柴与肺癌之间的真实关系,问题：火柴对于吸烟与肺癌的关系是不是一个混杂因素,混杂：吸烟、火柴与肺癌,OR,粗,=21.0(16.4,26.9),OR,携带火柴,=21.0(10.7,41.3),OR,不携带火柴,=21.0(13.1,33.6),吸烟、火柴与肺癌,（三）混杂偏倚的测量,1.测量的方法,可通过比较含有该因素时研究因素与疾病的效应估计值，(如RR，OR)，与排除该因素后的效应估计值来实现。,设含有某可疑混杂因素(f)时，研究因素与研究疾病的效应估计值为cRR或cOR，称作粗RR或粗OR；,按该可疑混杂因素调整后的效应估计值，即排除掉该因素的可能混杂作用后的效应估计值为aRR(f)或aOR(f)，称作调整RR或调整OR(可用Mantel-Haenszel分层分析方法计算),A.若cRR=aRR(f)，则f无混杂作用，cRR不存在f的混杂偏倚。,B.若cRRaRR(f),则f有混杂作用，cRR存在f的混杂偏倚。,C.若cRRaRR(f),为正混杂(positive confounding)，亦称阳性混杂，即由于f的混杂作用，使cRR高估了研究因素与研究疾病之间的联系。,D.若cRRaRR(f),为负混杂(negative confounding)，亦称阴性混杂，即由于f的混杂作用，使cRR低估了因素与研究疾病之间的联系。,混杂偏倚=cRR-aRR(f)/aRR(f),口服避孕药（OC）与心肌梗死（MI）关系的病例对照研究结果,病例（MI）,对照,合计,服OC,39,24,63,未服OC,114,154,268,合计,153,178,331,cOR=2.20(1.26-3.84)(x2=7.70,P0.01),按年龄分层的结果,40岁,40岁,服OC,未服OC,合计,服OC,未服OC,合计,病例,21,(a,1,),26,(b,1,),47,(m,11,),18,(a,2,),88,(b,2,),106,(m,12,),对照,17,(c,1,),59,(d,1,),76,(m,01,),7,(c,2,),95,(d,2,),102,(m,02,),合计,38,(n,11,),85,(n,01,),123,(t,1,),25,(n,12,),183,(n,02,),208,(t,2,),OR,1,=2.80,OR,2,=2.78,OR,MH,=(a,i,d,i,/t,i,)/(b,i,c,i,/t,i,),OR,MH,=2.79,x,2,MH,=a,i,-E(a,i,),2,/V(a,i,),E(a,i,)=m,1i,n,1i,/t,i,I,V(a,i,)=m,1i,m,0i,n,1i,n,0i,/t,2,i,(t,i,-1),i=1,x,2,MH,=11.79,（四）混杂偏倚的控制,1.限制（restriction）,针对某一或某些可能的混杂因素，在设计时对研究对象的入选条件予以限制。,2.匹配,匹配是指在为指示研究对象选择对照时，使其针对一个或多个潜在的混杂因素与指示研究对象相同或接近，从而消除混杂因素对研究结果的影响。,3.随机化（randomization）,指以随机化原则使研究对象以等同的机率被分配在各处理组中，从而使潜在的混杂因素在各组间分布均衡。,4.统计处理,混杂偏倚在资料分析阶段也可以通过一定的统计处理方法予以控制。,随机误差可以利用统计学方法来减少。,研究对象的主观偏倚是随机误差的来源之一。,检出征候偏倚属于选择偏倚。,在观察性研究中，采用盲法可以控制选择偏倚。,病例对照研究在设计阶段控制混杂偏倚的措施是分层分析。,在实验研究中设立对照的主要目的是控制混杂偏倚。,在流行病学实验研究中采用双盲法的目的是尽可能减少混杂偏倚。,在流行病学研究中，随机抽样是为了控制随机误差。,在病例对照研究中,选择新发病例的主要原因是新发病例比现患病例的代表性更好。,流行病学研究的哪一阶段最容易发生选择偏倚A 研究设计 B 资料收集 C 资料整理 D 资料分析 E 结果解释,在一家医院进行的病例对照研究更容易发生下列哪项偏倚A 志愿者偏倚,B 入院率偏倚,C 观察者偏倚,D 回忆偏倚,E 新发病例和现患病例偏倚,控制观察者偏倚的最佳措施是A 随机抽样,B 随机分组,C 匹配,D 盲法,E 标准化,下列哪项是系统误差的特征A 观察值的平均值围绕真实值波动 B 通常可利用统计学方法来检验确定其大小或范围C 多次重复或样本量增大，误差的大小和方向不变D 不能通过改善研究设计来减少或控制 E 只可以减少但不能消除.,入院率偏倚，也叫（），指当利用医院就诊或住院患者作为研究对象时，由于入院率的不同所导致的（）。,偏倚分三类:()，()和（）,现况研究中常见的偏倚有()，(),病例对照研究中常见的偏倚有(),队列研究中常见的偏倚有(),

展开阅读全文