资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章 方差分析,Analysis of Variance,重点掌握,方差分析的基本思想,完全随机设计、随机区组设计方差分析和多重比较结果的合理解释,总体,同质、个体变异,总体参数,未知,样本,代表性、抽样误差,随机,抽样,样本统计量已知,统计推断,风 险,“,小概率反证法”思想,如果对总体的,H,0,是真实的,那么不利于或不能支持这一假设的事件,A,(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中,A,竟然发生了,就有理由怀疑该假设的真实性,拒绝,H,0,(,1,)建立假设和确定显著性水平,(,2,)计算检验统计量,(,3,)确定,P,值和做出推断,假设检验的原理和步骤,可能发生的两类错误,检验结果,真实情况,拒绝,H,0,不拒绝,H,0,H,0,成立,I,型错误,(,a,),推断正确,(1-,a,),H,1,成立,推断正确,(1-,b,),II,型错误,(,b,),问题的提出,t,检验实例,外用中药搽剂骨肌康对小鼠琼脂肉芽的抑制作用。给予对照组,0.5ml65%,乙醇,试验组施用大剂量骨肌康,给予,0.2g,生药,/0.5ml65%,乙醇,观察两组的肉芽肿重。,处理因素:不同的药物,水平:,0.5ml65%,乙醇,,0.2g,生药,/0.5ml65%,乙醇,问题的提出,一种新的降血脂药,,120,人分为安慰剂组,用药组,1(2.4g),,用药组,2(4.8g),,用药组,3(7.2g),。实验结束后观察血脂水平。,?,用药组,1,=2.72mmol/l,用药组,2,=2.70mmol/l,安慰剂组,=3.43mmol/l,用药组,3,=1.97mmol/l,问题的提出,进行一次假设检验,犯,I,型错误的概率:,进行多次,(,k,),假设检验,,犯,I,型错误的概率:,1,(1,),k,组数为,3,k,=3,1,(1,0.05),k,=0.1426,组数为,4,k,=6,1,(1,0.05),k,=0.2649,组数为,5,k,=10,1,(1,0.05),k,=0.4013,问题的提出,t,检验的局限性,比较两组样本均数,(单因素两水平),方差分析,方差分析(,Analysis of Variance,,简写为,ANOVA,),由英国统计学家,R.A.Fisher,在,1918,年提出,F,检验,方差分析的原理,单因素方差分析,/,完全随机设计方差分析(,one-way ANOVA,):研究一个处理因素(有,k,个水平),将,n,个观察单位随机分配到,k,个水平,观察水平间效应的差别,应用条件(,P63,),1,、各个样本是相互独立的随机样本;,2,、各个样本来自正态总体;,3,、各个处理组的总体方差相等,即方差齐。,t,检验的应用条件?,?,方差分析的应用条件,不满足应用条件时处理方法,1,、进行变量变换,以达到方差齐或正态的要求,2,、采用非参数法(秩和检验),3,、使用近似,F,检验,t,检验也类似!,方差分析的应用条件,一、方差分析的基本思想,P63-64,例,5-1,一、方差分析的基本思想,i,列,i,=1,2.k,在此,k=4,水平数,总例数,一、方差分析的基本思想,j,行,j,=1,2,n,i,,,在此,j,=8,总例数,一、方差分析的基本思想,第,i,个处理组的样本均数,总均数,总变异,所有个体的血清,IL-2,水平几乎都不同,离均差,平方和,变异度,总例数,n(,自由度,n-1),SS/(n-1),消除,n,的,影响,回顾:正态分布资料的离散趋势指标,方差,总变异,所有观察值几乎不同,各观察值与总体均数间的差异为总变异,第,i,个处理,水平,每个水平组的第,j,例,任一,观测值,总均数,组内变异同一水平处理组,各观测值不完全相等,组内变异,同组内的血清,IL-2,水平不一致,原因是不同个体的,随机误差,第,i,个处理,水平,每个水平组的第,j,例,任一,观测值,第,i,个处理组的均数,组间变异 各水平处理组的均值不同,组间变异,不同组间的血清,IL-2,水平不同,原因:,处理因素的效应,(如果存在的话);,随机误差,组间变异,第,i,个处理,水平,每个水平组的例数,第,i,组的均数,总均数,总变异,组内变异,SS,组内,组间变异,SS,组间,随机误差,随机误差,+,处理的作用(可能存在),SS,总,=SS,组内,+SS,组间,一、方差分析的基本思想,方差分析表,变异来源,SS,v,MS,F,组间,SS,组间,k-,1,SS,组间,/,v,组间,MS,组间,MS,组内,组内,SS,组内,N,-,k,SS,组内,/,v,组内,总,SS,总,N,-1,组间方差,又称组间均方,(,MS,组间,),组内方差,又称组内均方,(,MS,组内,),方差分析的原理,方差比的分布!,MSB,MSW,处理因素,无效,MS,组内,=MS,组间,MS,组内,MS,组间,处理因素,构造检验的统计量,(,F,分布,),构造检验的统计量,(,F,分布,),a,F,分布,F,(,k,-1,n,-,k,),0,拒绝,H,0,不能拒绝,H,0,F,若均值相等,F,=,MS,组间,/,MS,组内,1,当,FF,(V,组间,V,组内,),时,p,拒绝,H,0,,,可认为处理因素效应间差别有统计学意义;,当,F ,不,拒绝,H,0,,,尚不能认为处理因素效应间差别有统计学意义,一、方差分析的基本思想,SS,总,SS,组间,SS,组内,组内变异,(SS,组内,),:,随机误差,组间变异,(SS,组间,),:,处理因素,随机误差,当,H,0,为真时,由于处理因素不起作用,组间变异只受,随机误差,的影响。此时,组间变异与组内变异相差不能太大,有,1,、建立检验假设和确定检验水准,H,0,:,(四组,血清,IL-2,水平,总体均数相等),H,1,:,四组血清,IL-2,水平总体均数,不等或不全相等,0.05,2,、计算,F,值,3,、确定,P,值和作出推断结论,直接计算(软件)或间接估计(查表),二、完全随机设计方差分析步骤,二、完全随机设计方差分析步骤,变异来源,SS,v,MS,F,P,组间,21.429,3,7.143,40.766,0.01,组内,4.906,28,0.175,总,26.335,31,二、完全随机设计方差分析步骤,结论:,按,0.05,的水准,拒绝,H,0,,接受,H,1,,四组均数之间的差异有统计学意义,可认为四个模型组,IL-2,平均水平总体有差别。,如果方差分析有差别,只能说明总体间有差别,各组中哪两组间是否有差别,还要进一步做,多重比较,如果方差分析无差别,分析结束,二、完全随机设计方差分析步骤,注意!,三、基于样本统计量的方差分析,只获得样本统计量而无原始数据的情况下,P66,公式(,5-2,)和(,5-3,),四、多个样本均数间的多重比较,多重比较,(,Multiple Comparison,),,又称两两比较,假如每次,t,检验犯第一类错误的概率是,0.05,,那么要完全地进行比较,犯第一类错误的概率是,1,(1,),k,。,为避免增大犯第一类错误的概率,,不能使用,t,检验,,而应使用专门的方法。,四、多个样本均数间的多重比较,分类,事先计划好的多个试验组与一个对照组之间的比较,多个组与一个特定组间的比较或者特定组间的比较;,(,Planned Multiple Comparison,),方差分析得到有差别的结论后多个组之间的相互比较的探索性研究,(,Post Hoc,),;,四、多个样本均数间的多重比较,多重比较的方法较多,如,SPSS,软件中就有,18,种方法,应根据资料特点(方差是否齐性)和研究目的来选用。,两两比较方法,多个样本均数间每两个均数的比较,多个实验组分别与对照组均数间的两两比较,LSD-t,检验,SNK,q,检验,四、多个样本均数间的多重比较,四、多个样本均数间的多重比较,(一),LSD-t,检验,又称最小显著差异法,主要用于,确证性实验研究,设计阶段就根据研究目的或专业知识决定某些均数间的两两比较,如多个处理组与对照组的比较,处理后不同时间与处理前的比较等,计算公式,自由度,组内,=N-k,LSD,法实际上是一种,t,检验法,主要区别在于计算标准误中的合并方差及自由度的不同,仍按算得的,t,值查附表,2,,,t,界值表,作出推断结论,四、多个样本均数间的多重比较,例 在例,5.1,方差分析的基础上,对不同大鼠模型的,IL-2,水平进行多重比较。,1),建立假设,确定检验水准,H,0,:,A,=,B,H,1,:,A,B,四、多个样本均数间的多重比较,2,)计算统计量,t,值,由于各组的例数都一样,均为,8,例,而且在进行方差分析时,已知,MS,组内,=0.175,。故任意两个比较组的标准误均为:,四、多个样本均数间的多重比较,四、多个样本均数间的多重比较,3),确定,P,值,做出推断结论,v=N-K=32-4=28,查,t,界值表,得:,比较组,t,值,P,甲与乙,0.7287,3.4849,0.001,P,0.002,甲与丙,1.8575,8.8833,0.001,甲与丁,1.9737,9.4390,0.001,乙与丙,1.1288,5.3984,0.001,乙与丁,1.2450,5.9541,0.5,(二),SNK-q,检验,可对所有对照组及处理组的样本均数进行两两比较,适用于探索性研究,,,在研究设计阶段未预先考虑或未预料到,,经数据结果的提示后,才决定的多个均数间每两个的事后比较,四、多个样本均数间的多重比较,四、多个样本均数间的多重比较,计算公式,当两样本,n,相等时,自由度,组内,计算步骤,将多个样本均数由小到大顺序排列,按照两均数组合原则,计算出每两个样本均数比较的统计量,q,值,根据误差的自由度和两样本间隔组数,a,,查,q,界值表得,q,界值。注意:组数,a,的计算方法:由于各样本均数已由小到大顺序排列,因此,相邻两样本均数比较时,组数,a,=2,,中间间隔一个样本均数时,组数,a,=3,,间隔两个样本均数时,组数,a,=4,,余类推,四、多个样本均数间的多重比较,例,在例,5.1,方差分析的基础上,对不同大鼠模型的,IL-2,水平进行,SNK,法的多重比较。,先将样本均数从小到大排序,对比组次从,1-4,四、多个样本均数间的多重比较,均数排序,(,从小到大,),处理组(原组号)甲 乙 丙 丁,均 数,:0.2913 1.0200 2.1488 2.2650,例 数:,8 8 8 8,排序号(组次),:1 2 3 4,四、多个样本均数间的多重比较,1),建立假设,确定检验水准,H,0,:,A,=,B,H,1,:,A,B,0.05,2,),计算统计量,q,值。,由于各组的例数都一样,均为,8,例,而且在进行方差分析时,已知,MS,组内,=0.175,,任意两个比较组的标准误均为:,四、多个样本均数间的多重比较,3,)确定,p,值做出推断结论,比较组,a,q,值,q,0.05(a,28),q,0.01(a,28),p,1,与,4,1.974,4,13.345,3.87,4.84,0.01,1,与,3,1.858,3,12.559,3.51,4.49,0.01,1,与,2,0.729,2,4.927,2.90,3.92,0.01,2,与,4,1.245,3,8.418,3.51,4.49,0.01,2,与,3,1.129,2,7.632,2.90,3.92,0.05,查附表,4,当自由度在表中能找到时,直接选择,p,=0.05,和,p,=0.01,时对应,q,值(,P408,附表,4,),当自由度在表中不能找到时,根据,a,和自由度用,内插值法,计算出的,p,=0.05,和,p,=0.01,对应的,q,值,四、多个样本均数间的多重比较,比较组,a,q,值,q,0.05(a,28),q,0.01(a,28),p,1,与,4,1.974,4,13.345,3.87,4.84,0.01,1,与,3,1.858,3,12.559,3.51,4.49,0.01,1,与,2,0.729,2,4.927,2.90,3.92,0.01,2,与,4,1.245,3,8.418,3.51,4.49,0.01,2,与,3,1.129,2,7.632,2.90,3.92,0.05,内插值法计算,q,值,q=q1+(q2 q1)(v v1)/(v2 v1),,其中,v1,与,v2,分别为,v,左右相邻的自由度,,q1,为,v1,对应的,q,值,,q2,为,v2,对应的,q,值。,本例,当,0.05,,,a=4,,,v=28,时,,v1=20,,,v2=30,,,q1=3.96,,,q2=3.85,;故:,q=q1+(q2 q1)(v v1)/(v2 v1),=3.96+(3.85-3.96)*(28-20)/(30-20)=3.87,不能用,t,检验代替方差分析,也不能用,t,检验代替两两比较。,无论是,SNK,法还是,LSD,法,用于两组均数比较时,结果与,t,检验等价。,任意两组比较最常见方法,Bonferroni,检验,(,第七章,),按照研究目的和设计要求,有时只需要将各个处理组的试验结果与一个对照组进行比较,此时,仍可用,SNK,或,LSD,。但处理此类资料也有非常常用而经典的方法,称为,Dunnett,t,检验法,多重比较的注意事项,五、方差不齐时的扩展方差分析,Bartlett,检验法:主要用于正态分布的资料,对于非正态分布的资料不适用,统计软件中,最常用的是,Levene,方差齐性检验。可用于正态分布及非正态分布的资料,Levene,检验首先对原始资料进行,Levene,转换,再对,y,ij,进行单因素方差分析并作结论,(,二,),方差不齐时扩展方差分析方法,Welch,检验,构造,F,统计量,P69,公式(,5-8,),Welch,检验有统计学差异时,进一步进行多重比较的方法:,Tambanes,T2,、,Dunnetts,T3,等,五、方差不齐时的扩展方差分析,种子,A,种子,B,种子,C,肥,中,瘦,第二节 随机区组设计的方差分析,A,B,C,肥,中,瘦,BLOCK1,随机区组设计,的方差分析,处理因素,配伍因素,BLOCK2,BLOCK3,A,处理,B,处理,配对设计,A,处理,B,处理,C,处理,对子,区组,A,B,A,B,C,配伍(区组)设计,随机区组设计(,random block design,)又称配伍组设计,为什么要配伍?,配对的目的:排除干扰因素的影响;,配伍的目的:使同一区组内除了研究因素外的其他特征尽可能相似,排除干扰因素的影响,配伍是配对设计的扩大,当研究因素只有两水平时(,k=2,时),配伍设计方差分析,=,配对,t,检验,第二节 随机区组设计的方差分析,第二节 随机区组设计的方差分析,将处理因素分为,k,个水平(处理组),根据非处理因素将实验单位配成,b,个区组,每个区组中的,k,个观察单位随机分配到各处理组。,处理因素和区组因素(非处理因素),随机区组设计方差分析中变异的分解,总变异(,SS,总,),处理组变异(,SS,处理,),区组变异(,SS,区组,),误差(,SS,误差,),随机区组,设计的,SS,的分解,SS,总,SS,区组间,SS,处理间,SS,误差,v,总,v,区组间,v,处理间,v,误差,kb,-1,(,b,-,1),(,k,-,1),(,k,-,1),(,b,-,1),实质:两因素方差分析,变异分解,N,为总样本含量,,k,为水平数,,b,为区组数;,随机区组设计的方差分析,第二节 随机区组设计的方差分析,组内各观察值之间各不相同,(,误差项变异,),各组均数也不相等,(,处理组间变异,),不同区组的观察值之间各不相同,(,区组变异,),P71,例,5-6,随机区组设计方差分析的检验效率高于完全随机设计(从组内变异分离出配伍变异,使组内的误差更小,),SS,总,=SS,处理,+SS,区组,+,SS,误差,第二节 随机区组设计的方差分析,建立检验假设和确定检验水准,第二节 随机区组设计的方差分析,H,0,:,三种卡环抗拉强度相同,H,1,:,三种卡环抗拉强度不同或不全相同,0.05,H,0,:,各区组的卡环抗拉强度相同,H,1,:,各区组的卡环抗拉强度不同或不全相同,0.05,第二节 随机区组设计的方差分析,方差分析表,变异来源,SS,MS,F,P,处理,15.779,2,7.8895,26.690,0.01,配伍,123.710,9,13.7456,46.501,慎重做出推断或增加样本含量继续研究,P,,进行多重比较,LSD,法,Bonferroni,法,SNK,法,谢谢!,
展开阅读全文