1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,方差分析,(,ANOVA,),例子:,某研究者在某单位工作人员中进行了体重指数(,BMI,)抽样调查,随机抽取不同年龄组男性受试者各,16,名,测量了被调查者的身高和体重值,由此按照,BMI=,体重,/,身高,2,公式计算了体重指数,请问,不同年龄组的体重指数有无差异,。,项目,18,岁,30,岁,4560,岁,21.65,27.15,20.28,20.66,28.58,22.88,18.82,23.93,26.49,样本量,16,16,16,平均值,22.07,25.94,25.49,标准差,8.9
2、7,8.11,7.19,一、方差分析的基本思想,5,组间变异,总变异,组内变异,思想来源:,观察值总变异可以分解为组间变异和组内变异,6,总变异,(Total variation):,全部测量值,X,ij,与总均数 间的差异,组间变异,(between group variation):,各组的均数 与总均数 间的差异,组内变异,(,within group variation),:每组的每个测量值,与该组均数 的差异,可用,离均差平方和,反映变异的大小,1.,总变异,:,所有测量值之间总的变异程度,,,SS,总,2,组间变异:,各组均数与总均数的离均差平方和,,SS,组间,SS,组间,反映了
3、各组均数,的变异程度,组间变异随机误差,+,处理因素效应,3,组内变异:,用各组内各测量值,X,ij,与其所在组的均数差值的平方和来表示,,SS,组内,SS,组内,反映,随机误差,的影响(个体差异和测量误差)。,均方差,均方,(mean square,,,MS,),VS,VS,组间均方与组内均方比值越小,样本越可能来源于同一个总体,比值越大,样本越可能不是来源于一个总体,二、,F,值与,F,分布,,,如果各组样本的总体均数相等(,H,0,成立),即各处理组的样本来自相同总体,无处理因素的作用,则组间变异同组内变异一样,只反映随机误差作用的大小。组间均方与组内均方的比值称为,F,统计量,F,值接
4、近于,1,,就没有理由拒绝,H,0,;反之,,F,值越大,拒绝,H,0,的理由越充分。数理统计的理论证明,当,H,0,成立时,,F,统计量服从,F,分布。,F,分布曲线,回忆,t,分布和,t,检验,17,18,F,界值表,二、完全随机设计方差分析,(,单因素方差分析,),关于因素与水平,因素也称为处理因素(factor),每一处理因素至少有两个水平(level)(也称“处理组”)。,完全随机设计:,将实验对象随机分配到不同处理组的单因素设计方法。针对一个处理因素,通过比较该因素不同水平组均值,推断该处理因素不同水平组的均值是否存在统计学差异。,例,在评价某药物耐受性及安全性的I期临床试验中,对
5、符合纳入标准的30名健康自愿者随机分为3组每组10名,各组注射剂量分别为0.5U、1U、2U,观察48小时部分凝血活酶时间(,s,)试问不同剂量的部分凝血活酶时间有无不同?,方差分析步骤:,(,1,)提出检验假设,确定检验水准,H,0,:,1,=,2,=,3,H,1,:,1,,2,,3,不全相同,a,=,0.05,(,2,)计算检验统计量,F,值,(,3,)确定,P,值,做出推断结论,F,0.05(2,26),=,2.52,,F,F,0.05(2,26),,,P,0.05,拒绝,H,0,。,三种不同剂量48小时部分凝血活酶时间,不全相同。,例子:某研究者在某单位工作人员中进行了体重指数(,BM
6、I,)抽样调查,随机抽取不同年龄组男性受试者各,16,名,测量了被调查者的身高和体重值,由此按照,BMI=,体重,/,身高,2,公式计算了体重指数,请问,不同年龄组的体重指数有无差异。,项目,18,岁,30,岁,4560,岁,21.65,27.15,20.28,20.66,28.58,22.88,18.82,23.93,26.49,样本量,16,16,16,平均值,22.07,25.94,25.49,标准差,8.97,8.11,7.19,方差分析适合于任何多组独立均衡可比的数据,基本步骤,(,1,)建立假设,确定检验水准,H0,:三个总体均数相等,即三组工作人员的体重指数总体均数相等,H1,:
7、三个总体均数不等或不全相等,a=0.05,(,2,)计算检验统计量,F,值,变异来源,SS,自由度(,df,),MS,F,组间,143.406,2,71.703,8.87,组内,363.86,45,8.09,总变异,507.36,47,(,3,)确定,p,值,作出统计推断,P2,45=3.20-3.218.87,,本次,F,值处于,F,界值之外,说明组间均方组内均方比值属于小概率事件,因此拒绝,H0,,接受,H1,,三个总体均数不等或不全相等,方差分析的关键条件,第一、各组服从正态分布!,第二、各组符合方差齐性!,第三、独立性,方差齐性检验,Bartlett,检验法,Levene F,检验,最
8、大方差与最小方差之比,3,,初步认为方差齐同。,问题:,不符合条件怎么办?,第一招:数据转换,方差齐性转换;正态性转换,第二招:特别分析方法,非参数检验,三、多个样本均数的两两比较,方差分析能说明什么问题?,不拒绝,H,0,,表示拒绝总体均数相等的证据不足,分析终止,拒绝,H,0,,接受,H,1,表示总体均数不全相等,哪两两均数之间相等?哪两两均数之间不等?,需要进一步作多重比较,能否用,T,检验呢,当有,k,个均数需作两两比较时,比较的次数共有,c,=,k,!/(2!(,k,-2)!)=,k,(,k,-1)/2,设每次检验所用,类错误的概率水准为,,累积,类错误的概率为,,则在对同一实验资料
9、进行,c,次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积,类错误概率,与,c,有下列关系:,1,(1,),c,例如,设,0.05,,,c,=3(,即,k,=3),,其累积,类错误的概率为,1,(1-0.05),3,=1-(0.95),3,=0.143,多重比较的方法:,SNK,检验(,q,检验):探索性研究,进行两两比较。,LSD-t,检验:证实性检验,可认为,LSD,法是最灵敏的,Turkey,检验方法,探索性研究,要求样本量相同。,Duncan,检验方法,探索性研究,Dunnet,检验方法,证实性检验,常用于多个试验组与一个对照组间的比较。,例,1,在肾缺血再灌注过程的研究中,
10、将,36,只雄性大鼠随机等分成三组,分别为正常对照组、肾缺血,60,分组和肾缺血,60,分再灌注组,测得各个体的,NO,数据见数据文件,no.sav,,试问各组的,NO,平均水平是否相同?,单因素方差分析,分析:,对于单因素方差分析,其资料在,SPSS,中的数据结构应当由两列数据构成,其中一列是观察指标的变量值,另一列是用以表示分组变量。实际上,几乎所有的统计分析软件,包括,SAS,,,STATA,等,都要求方差分析采用这种数据输入形式,这一点也暗示了方差分析与线性模型间千丝万缕的联系。,单因素方差分析,预分析(重要):检验其应用条件,单因素方差分析,选择,data,中的,split file
11、出现如下对话框:,单因素方差分析,单因素方差分析,单因素方差分析,这里仅取其中一组结果,表明该资料符合分组正态性的条件。,单因素方差分析,注意分组检验正态性后,要先回到,data,菜单下的,split file,,如下操作取消拆分后才能进行后续的方差分析:,单因素方差分析,单因素方差分析,选入分组变量,选入因变量,给出各组间样本均数的折线图,指定进行方差齐性检验,单因素方差分析,结果分析,单因素方差分析,(,1,)方差齐性检验,Levene,方法检验统计量为,3.216,,其,P,值为,0.053,,可认为样本所来自的总体满足方差齐性的要求。,单因素方差分析,结果分析,(,2,)方差分析表
12、第,1,列为变异来源,第,2,、,3,、,4,列分别为离均差平方和、自由度、均方,检验统计量,F,值为,5.564,,,P,0.008,,组间均数差别统计学意义,可认为各组的,NO,不同。,变异来源,单因素方差分析,结果分析,(,3,)各组样本均数折线图,Means plots,选项给出,更直观。,注意,:当分组变量体现出顺序的趋势时,绘制这种折线图可以提示我们选择正确的趋势分析模型。,通过以上分析得到了拒绝,H,0,的结论,但实际上单因素方差分析并不这样简单。在解决实际问题时,往往仍需要回答多个均数间到底是哪些存在差异。虽然结论提示不同组别个体的,NO,量不同,但研究者并不知道到底是三者之
13、间均有差别,还是某一组与其他两组有差别。这就应当通过两两比较(多重比较)进行考察。,均数两两比较方法,直接校正检验水准,(相对粗糙),专用的两两比较方法:,计划好的多重比较(,Planned Comparisons,),非计划的多重比较(,Post,Hoc Comparisons,),均数两两比较方法,Contrasts,按钮,Post Hoc,按钮,点击单因素方差分析主对话框中的,Post Hoc,按钮,总共有,14,种两两比较的方法,如下:,均数两两比较方法,LSD,法:,最灵敏,,会犯假阳性错误;,Sidak,法:比,LSD,法保守;,Bonferroni,法:比,Sidak,法更为保守
14、一些;,Scheffe,法:多用于进行比较的两组间样本含量不等时;,Dunnet,法:常用于多个试验组与一个对照组的比较;,S-N-K,法:寻找同质亚组的方法;,Turkey,法:最迟钝,要求各组样本含量相同;,Duncan,法:与,Sidak,法类似。,均数两两比较方法,仍以例,1,为例,,LSD,法的输出格式:,均数两两比较方法,结果分析,仍以例,1,为例,,SNK,法的输出格式:,结果分析,均数两两比较方法,该方法的目的是寻找同质子集,故各组在表格的纵向上,均数按大小排序,然后根据多重比较的结果将所有的组分为若干个子集,子集间有差别,子集内均数无差别。,当各组样本含量不同,选择,S,ch
15、effe,法,得结果:,均数两两比较方法,结果分析,假设在调查的设计阶段,就计划好了第二组和第一组,以及第三组和第一组的比较,可以使用主对话框中的,contrast,按钮,实现。,在,coefficients,后面的框中输入,1,,,-1,,,0,,每次输入后点击,add,,就可以比较第一组和第二组的,NO,;再点击,next,按钮,继续输入下一个组合,即,0,,,-1,,,1,。,均数两两比较方法,均数两两比较方法,结果分析,可见,第一个组合无统计学意义,而第二个组合有显著性差异。,四、多因素方差分析,多因素方差分析,一个因素(水平间独立),单因素方差分析,两个因素(水平间独立或相关),多,
16、两,),因素方差分析,一个个体多个测量值,重复测量资料的方差分析,目的:用这类资料的样本信息来推断各处理组间多,个总体均数的差别有无统计学意义。,(一)随机区组方差分析(水平间独立两因素),随机区组设计:,先将受试对象按条件相同或相近分成,m,个区组(或配伍组),每个区组有,k,个受试对象,再将其随机地分配到,k,个处理组中,称之为随机区组设计,属于两因素方差分析。,区组(,B,),处理因素(,A,),X11,X21,Xk1,区组,1,X12,X22,Xk2,区组,2,X13,X23,Xk3,区组,m,X1m,X2m,Xkm,总变异分解,SS,总,=SS,组间,+,SS,组内,(完全随机)
17、SS,总,=SS,组间,+,(,SS,区组,+SS,组内),(随机区组),在存在着区组的情况下,随机区组设计的方差分析效率要高于单因素方差分析,计算公式,总变异:,自由度,N-1,。,处理组变异:,自由度,k-1,区组变异:,自由度,n,i,-1,组内:,SS,总,-SS,处理,-SS,区组,自由度,N-k-n,i,-1,举例,为探讨,Rgl,对镉诱导大鼠睾丸损伤的保护作用,某研究者将同一窝别的,3,只大鼠随机地分到,T1,、,T2,、,T3,三组,进行不同处理,共观察了,10,个窝别大鼠的睾丸,MT,含量(,g/g,)。试问不同处理对大鼠,MT,含量有无影响?,方差分析,=3.55,,P,0.05,,,三组大鼠,MT,含量的总体均值不全相同。,随机区组设计方差分析前提条件:,数据服从正态分布,数据要求具有独立性,数据要求具有方差齐性,举例,对三组病人进行降血压药物治疗,一组病人为安慰剂,一组病人为常规药物,另外一组为新研制药物。,分别在服药,5,、,10,、,20,天测量血糖,这种例子看似随机区组设计,实则不然,数据之间存在相关性,需采用重复测量方差分析,小结,完全随机设计,t,检验:单因素两样本分析,完全随机设计方差分析:单因素多样本分析,随机区组设计方差分析:两因素多样本分析,






