资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,中国疾病预防控制中心,研究设计的意义,研究设计是医学研究的必不可少的重要环节之一。,医学研究的步骤:,研究设计,收集资料,分析资料,结论表达,研究设计的意义,良好的科研设计将,较少的人力、物力、时间得到较为可靠的结果;,合理安排试验因素,提高研究质量和效率;,有效控制实验误差并对其进行估计,保证实验结果的可靠性、稳定性。,调查性研究:,因素客观存在,,研究者,不能主动设置研究因素,,“,被动,”,观察研究因素,的效应,实验性研究:,因素人为设置,,研究,者能主动设置处理因,素,在其它因素控制,下观察因素的效应,两者的区别,是否施加干预,统计学,研究设计,实验设计的基本要素,三要素:,处理因素(,treatment,),受试对象(,object,),实验效应(,experimental effect,),一、处理因素,处理因素,(,被试因素,),:根据研究目确定的欲施加或欲观察的、并能引起受试对象直接或间接效应的因素,简称处理或因素,(factor),。是根据研究目的确定的主要因素,处理因素在整个实验中应始终要保持不变。,非处理因素,:与处理因素可能同时存在的能使受试对象产生效应的非研究因素。非处理因素常常会干扰研究因素的观察与分析,因此又称为干扰因素或混杂因素,(confounder),。,二、受试对象,受试对象,(研究对象):是处理因素作用的客体,是根据研究目的确定的研究总体。,按受试对象不同实验可以分为三类:,动物实验,(,animal experiment,),临床试验,(,clinical trial,),现场试验,(,field trial,),受试对象应作严格规定,保证其,同质性,和,代表性,:,受试对象应满足三个基本条件:,一是对处理因素,敏感,;,二是,特异性,,即不受非处理因素干扰;,三是反应必须,稳定,。,三、实验效应,实验效应:,是处理因素作用于受试对象的反应,(response),和结局,(outcome),,它通常以某些观察指标,(,统计学常称为变量,),为载体来体现。,观察指标的具体要求,:,1.,客观性,:,2.,特异性和灵敏性,:,特异度(,specificity,)反映鉴别真阴性的能力;,灵敏度(,sensitivity,)反映检出真阳性的能力。,3.,指标的盲法观察,:为消除或最大限度地减少主观偏性,在设计时常采用盲法,(blind method),。,单盲法,(single blind method),双盲法,(double blind method),三盲法,(triple blind method),实验设计,实验设计的基本要素,实验设计的,基本原则,常用实验设计方法,样本含量估计,实验设计的基本原则,实验设计的三原则:,对照(,control,),随机(,randomization,),重复(,replication,),一、,对照原则,目的:控制混杂因素和偏倚;显露处理因素的效应;判断不良反应。,对照的方式:,(1),安慰剂对照,(placebo control),(2),空白对照,(blank control),(3),实验对照,(experimental control),(4),自身对照,(self control),(5),标准对照,(standard control),吃黄金搭档,一年,小孩长高了,5CM,,起效了,?,(1),安慰剂对照:安慰剂无药理作用,其外观如剂型、大小、颜色、重量、气味及口味等与试验药物一致。,(2),空白对照:对照组不施加任何处理因素。,(3),实验对照:,对照组不施加处理因素,但施加某种实验因素。,(4),自身对照:,对照与实验在同一受试者身上进行,如身体对称部位或实验前后结果后不同研究因素。,(5),标准对照:,对照用现有标准方法或常规方法,或者现有标准值或参考值。,二、,随机化原则,随机化是使每个受试对象都有同等的机会被抽取或分到不同的实验组和对照组。,随机化形式:,(1),抽样随机,(2),分组随机,(3),实验顺序随机,三、,重复原则,重复是指在相同实验条件下进行多次研究或多次观察。,重复最主要的作用是估计实验误差。,重复的情形:,(,1,)整个实验的重复;,(,2,)用多个受试对象进行重复:有足够的样本含量,(sample size),;,(,3,)同一受试对象的重复观察,。,实验设计,实验设计的基本要素,实验设计的基本原则,常用实验设计方法,样本含量估计,常用的实验设计类型,完全随机设计,(completely randomized design),配对设计,(paired design),随机区组设计,(,randomized block design,),交叉设计,(cross-over design),析因设计,(factorial design),序贯试验,(sequential trial),完全随机设计,平衡设计,(balanced design),非平衡设计,(unbalanced design),完全随机设计方案示意图,纳入标准,排除标准,研究总体,随机化,受试对象,实验组,对照组,完全随机设计,完全随机化分组三大步骤,编号,取随机数,确定组别,分组结果,:,第,1,3,10,12,15,号小白鼠分到,A,组,;,第,2,4,9,13,14,号小白鼠分到,B,组,;,第,5,6,7,8,11,号小白鼠分到,C,组。,例将体重相近的,15,只雌性小白鼠随机等分到,A,、,B,、,C,三组,SAS实现,实验设计在,SAS中可通过proc plan命令实现,该命令主要用于实验设计分组。常用的语句有:,Procplan;,Factors因素名称=m 抽样方式;,Proc plan最主要的选项是“seed=,”,设定随机数产生的种子。,Factors语句解释,Factors 因素名称=m 抽样方式;,因素名称,:,由研究者自行规定任意的英文字母名称,m,:指定抽样样本的组数,必须是正整数,抽样方式:常指定的抽样方式有两种:,random ordered,某医院欲比较药物A和药物B在糖尿病治疗中的效果,以空腹血糖测量值及空腹血糖疗效作为主要疗效指标。如何将384例研究对象随机分配至两组,接受不同的药物治疗。,PROC PLAN,seed=,091015;,FACTORS rand=,384,random;,OUTPUT out=outa;,DATA,outb;,SET outa;,IF rand=,192,THEN group=A;,ELSE group=B;,num=_n_;,PROC PRINT,;,RUN,;,第一部分,第二部分,配对设计,(paired design),将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到两个不同的处理组,.,配对的因素应为可能影响实验结果的主要混杂因素。,例 将符合实验要求的,14,只小鼠,按照月龄和体重相近的原则配成,7,对,试进行随机化分组,随机区组设计,(randomized block design),亦称配伍组设计。通常做法是将受试对象按性质,(,如动物的性别、体重,患者的性别、年龄、病情等非处理因素,),相同或相近分为,b,个区组,(,或称配伍组,),,然后将每个区组中的,k,个受试对象随机分配到,k,个处理组。,设计时应遵循“区组内差别越小越好,区组间差别越大越好”的原则,由下表可知,对于区组,1,,编号为,1.1,1.2,1.3,1.4,号的大鼠分别对应于,A,、,D,、,B,、,C,四个处理组,余类推。,随机区组设计的,16,只大鼠随机分组的结果,例,16,只大鼠,根据分层因素将其分为,4,个区组,每组,4,只大鼠,分别接受,A,、,B,、,C,、,D,四种处理。,SAS实现,某研究观察三种饲料对小鼠体重的影响情况,该研究应如何,将,69,只小鼠设计分组?,PROC PLAN,;,FACTORS block=,23,ordered rank=,3,random;,RUN,;,析因设计,简单来说,析因设计是两个或两个以上因素,且每个因素至少有两个水平的全面组合的实验设计。,单独效应、主效应、交互效应,例 为探讨贝那普利联合应用氯沙坦灌胃是否可预防环孢素,A,的慢性肾毒性,用析因设计如何分组,将,60,只,SD,大鼠皮下注射环孢素,A,然后随机分为,4,组,分别接受以下四种处理方式:,贝那普利和氯沙坦、氯沙坦、贝那普利、生理盐水,60,只,SD,大鼠按照下表的方式分配,22,析因设计,B,因素,A,因素,A,1,A,2,B,1,A,1,B,1,A,2,B,1,B,2,A,1,B,2,A,2,B,2,22=4,种处理,2,因素,2,水平全面组合,23=6,种处理,各因素各水平全面组合的设计,A,B,B,1,B,2,B,3,A,1,A,1,B,1,A,1,B,2,A,1,B,3,A,2,A,2,B,1,A,2,B,2,A,2,B,3,23,析因设计,A,B,1,B,2,C,1,C,2,C,1,C,2,A,1,A,1,B,1,C,1,A,1,B,1,C,2,A,1,B,2,C,1,A,1,B,2,C,2,A,2,A,2,B,1,C,1,A,2,B,1,C,2,A,2,B,2,C,1,A,2,B,2,C,2,222=8,种处理,222,析因设计,是一种多因素设计。,例如,两个因素时,第,1,个因素有,3,个水平,第,2,个因素有,2,个水平,全部因素组合共有,3,2,6,种组合。每种组合都作试验时就是析因试验设计。此试验设计也可称为,3,2,析因试验设计。,3,4,2,析因试验设计,有,3,个因素,,3,,,4,和,2,个水平。,卫生统计学教研室,二、析因设计的有关术语,单独效应(,simple effects,):,主效应(,main effects,):,交互作用(,Interaction,):,(一)单独效应,其它因素水平固定时,同一因素不同水平间效应的差别,22,析因设计,B,因 素,A,因 素,A,1,A,2,B,1,A,1,B,1,(a,1,b,1,=26),A,2,B,1,(a,2,b,1,=30),B,2,A,1,B,2,(a,1,b,2,=36),A,2,B,2,(a,2,b,2,=52),B,因素固定在,1,水平时,,A,因素的单独效应为,4,(二)主效应,某一因素各水平单独效应的平均差别,A,m,=,(a,2,b,2,-a,1,b,2,)+(a,2,b,1,-a,1,b,1,)/2=16+4/2=10,B,m,=,(a,1,b,2,-a,1,b,1,)+(a,2,b,2,-a,2,b,1,)/2=10+22/2=16,22,析因设计,B,因 素,A,因 素,A,1,A,2,B,1,A,1,B,1,(a,1,b,1,=26),A,2,B,1,(a,2,b,1,=30),B,2,A,1,B,2,(a,1,b,2,=36),A,2,B,2,(a,2,b,2,=52),(,三,),交互效应,AB,=(,a,2,b,2,-a,1,b,2,)-(,a,2,b,1,-a,1,b,1,),/2=,(,16-4,)/,2=6,AB,=(,a,2,b,2,-a,2,b,1,)-(,a,1,b,2,-a,1,b,1,),/2=,(,22-10,)/,2=6,22,析因设计,B,因 素,A,因 素,A,1,A,2,B,1,A,1,B,1,(a,1,b,1,=26),A,2,B,1,(a,2,b,1,=30),B,2,A,1,B,2,(a,1,b,2,=36),A,2,B,2,(a,2,b,2,=52),正交互效应(协同作用):,负交互作用(拮抗作用):,存在交互效应,表示,4,个处理组,A,1,B,1,A,2,B,1,A,1,B,2,A,2,B,2,对应的总体均值,B,A,A,1,(,未用药,),A,2,(,用药,),B,1,(,未用药,),A,1,B,1,A,2,B,1,B,2,(,用药,),A,1,B,2,A,2,B,2,两因素联合(共同)作用大于其单独作用之和,两因素联合作用小于其单独作用之和,协同作用,拮抗作用,SAS实现,某医生观察两种药物对清除幽门螺杆菌的效果,同时想了解两种药物联合应用是否更加有效。该研究如何将100人随机分入四组?,PROC PLAN,seed=,091016,;,FACTORS rand=,100,random;,OUTPUT out=outa;,DATA,outb;,SET outa;,IF rand=,25,THEN group=空白组;,ELSE IF rand=,50,THEN group=A药组;,ELSE IF rand=,75,THEN group=B药组;,ELSE group=A+B药;,num=_n_;,PROC PRINT,;,RUN,;,第一部分,第二部分,实验设计的基本要素,实验设计的基本原则,常用实验设计方法,样本含量估计,(,2,),SAS,样本含量估计方法,(,1,)公式计算、查表,样本含量估计,样本含量的估计视不同研究方法、资料类型而有所不同。样本含量估计之前一般需要事先确定以下因素:,(,1)第一类错误概率,假阳性错误,第一类错误概率设定的越小,所需样本含量越大,通常情况下取值为0.05。,(2)第二类错误概率,假阴性错误,第二类错误概率设定的越小,或把握度1-,设定的越高,所需样本含量越大。第二类错误概率一般取,0.1或0.2,即把握度取0.9或0.8。,(3)其它要素,组间均数比较、组间率比较、回归和相关分析,检验方式、各组例数分配等,样本含量,SAS,实现,样本含量估计在,SAS中可通过proc power实现。,Proc power;,twosamplemeans,;,/*,两组均数比较的样本含量,*,/,twosamplefreq,;,/*,两组率比较的样本含量,*,/,onewayanova,;,/*,单因素方差分析的样本含量,*,/,twosamplesurvival,;,/*,两组生存资料比较样本含量,*,/,Multreg,;,/*,线性回归的样本含量,*,/,Onecorr,;,/*,相关分析的样本含量,*,/,Plot;/*绘制样本含量随把握度(或把握度随样本含量)的变化图,*,/,样本含量,SAS,实现,样本含量估计时需要注意的选项:,Alpha=,指定第一类错误概率,如不指定,默认为0.05,Ntotal=,估计样本含量时,指定格式为“ntotal=.,”,此时需指定“,power=,”的值,Power=,估计把握度时,指定格式为“power=.,”,此时需指定“,ntotal=,”的值,Sides=,指定单双侧检验。1表示单侧检验2表示双侧检验。默认为双侧检验。,上面四个选项在所有设计类型中是通用的,此外,不同设计类型还需指定各自所需的参数,以下是不同设计方法的常用参数,冯老师,医学案例统计分析与,SAS,应用,完全随机设计样本含量估计,例某医院欲比较药物A和药物B在糖尿病治疗中的效果,以空腹,血糖测量值,作为主要疗效指标。研究者希望有,80%的把握发现两种药物的真实差异,该研究应如何确定样本含量。,研究者通过以往研究获得两组空腹血糖均值和标准差分别,8.061.82,和,7.231.52,,并据此计算出合并方差为,2.81,,标准差为,1.68,。,s,1,、,s,2,是两组的标准差,,n,1,、,n,2,是两组的例数,本例如果采用公式计算,可得,即对照组需要65例,根据1:1分配,两组共需130例。,完全随机设计样本含量估计,PROC POWER,;/*调用proc power命令,*,/,twosamplemeans/*指定估计的类型是两组均数比较,*,/,groupmeans=,8.06,|,7.23,/*指定两组的均数,*,/,stddev=,1.68,/*指定标准差,*,/,power=,0.8,/*指定把握度为0.8*/,ntotal=,.,;/*表明要对样本含量进行估计,*,/,RUN,;,完全随机设计样本含量估计,例某医院欲比较药物A和药物B在糖尿病治疗中的效果,以空腹,血糖,疗效,作为主要疗效指标。研究者希望能有,80%的把握发现两种药物的真实差异,该研究应如何确定样本含量。,完全随机设计样本含量估计,研究者通过预试验或以往研究了解两组的预期有效率。研究者通过以往研究获得两组有效率分别为,71%和83%。,PROCPOWER,;/*调用proc power命令,*,/,twosamplefreq/*指定估计的类型是两组率比较,*,/,groupproportions=(,0.71 0.83,)/*指定两组的有效率,*,/,power=,0.8,/*指定把握度为0.8*/,ntotal=,.,;/*表明要对样本含量进行估计,*,/,RUN,;,完全随机设计样本含量估计,随机区组设计样本含量估计,例某研究观察三种饲料对小鼠体重的影响情况,研究者希望能有,80%的把握发现三种饲料对增重的真实影响。该研究应如何估计样本含量?研究者根据前期实验结果,获得三种饲料的增重均数分别为61.4、72.2、68.7,标准差分别为10.7、12.3、11.8,则合并标准差为,PROC POWER,;,onewayanova/*表明对单因素方差分析进行样本估算,*,/,test=overall /*表明是做三组间总体比较,而不是两两比较,*,/,groupmeans=,61.4,|,72.2,|,68.7,/*给出了三组的均数,*,/,stddev=,11.6,/*给出了三组的合并标准差,*,/,power=,0.8,/*指定把握度为0.8*/,ntotal=,.,;/*表明要对样本含量进行估计,*,/,RUN,;,随机区组设计样本含量估计,析因设计样本含量估计,例某医生观察两种药物对清除幽门螺杆菌的效果,同时想了解两种药物联合应用是否更加有效。该研究应如何估计样本含量?,其中,,n,为每组例数,,是以,、,及自由度,=,k,-1(,k,为组数),查,界值表所得。,p,max,、,p,min,分别为最大率和最小率。,本例设定,=0.05,,=0.1,,=4-1=3,查,界值表可得,为,14.17。根据以往研究或预试验,最大率和最小率分别为69%和18%,根据公式求得样本量为25,即每组需25例,四组共需100例。,析因设计样本含量估计,关系型研究样本含量估计,例某医师欲研究空腹血糖与糖化血红蛋白的关系,考虑到年龄、身高、体重可能会影响到二者的关系,因此准备同时调查和测量这三个因素。该医师希望能以,80%的把握发现二者的真实关系,欲实现该研究目的,可选择什么分析方法?需要多少样本含量才能保证结果的可靠性?该医师查阅以往文献发现,空腹血糖与糖化血红蛋白的偏相关系数约为0.4。,PROCPOWER,;,multreg/*表明选择的方法是回归分析,*,/,nfullpredictors=,4,/*指定包括混杂因素在内共有4个因素,*,/,ntestpredictors=,1,/*指定分析的主要变量只有1个,其它作为校正因素,*,/,partialcorr=,0.4,/*指定两变量之间的偏相关系数为0.4*/,power=,0.8,/*指定把握度为0.8*/,ntotal=,.,;/*表明需要对样本含量进行估计,*,/,Plot x=power min=,0.2,max=,0.9,;/*以Power为X轴绘制样本含量的变化情况,*,/,RUN,;,PROCPOWER,;,onecorr/*表明对相关分析进行样本含量估计,*,/,corr=,0.4,/*指定两变量之间的相关系数为0.4*/,npartialvars=,3,/*指定共有3个校正因素,*,/,power=,0.8,/*指定把握度为0.8*/,ntotal=,.,;/*表明需要对样本含量进行估计,*,/,RUN,;,谢谢,
展开阅读全文