收藏 分销(赏)

方差分析与协方差分析知识分享.ppt

上传人:精**** 文档编号:7814744 上传时间:2025-01-18 格式:PPT 页数:56 大小:1.16MB
下载 相关 举报
方差分析与协方差分析知识分享.ppt_第1页
第1页 / 共56页
方差分析与协方差分析知识分享.ppt_第2页
第2页 / 共56页
方差分析与协方差分析知识分享.ppt_第3页
第3页 / 共56页
方差分析与协方差分析知识分享.ppt_第4页
第4页 / 共56页
方差分析与协方差分析知识分享.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,方差分析与协方差分析,不能做,t,检验,如果有,K,(,K,3),个平均数,若用两两比较的方法来检验,则需作,K,(,K,-1)/2,次检验,不但程序繁琐,而且相当于从,t,分布中随机抽取多个,t,值,其落在大于临界值的范围内的概率大大增加,犯,类错误的概率大大增加:,如,6,次检验,H,0,的概率是,0.95,时的误差为:,1-0.95,6,=0.265,。,方差分析概念,第一类因素:可以控制的,控制因素,第二类因

2、素:不能控制的,随机因素,受前两类因素影响的事物为,观察变量,方差分析,目的,:分析控制变量的不同水平是否对观察变量产生了显著影响,检验各个水平下观察变量的均值是否相等,方差分析分类之一,单变量方差分析:一个观察变量,单因方差分析中的控制变量只有一个,多因素方差分析中的控制变量有多个,多变量方差分析:多个观察变量,方差分析分类之二,一般方差分析:因变量是定量变量,自变量是定类数据,协方差分析:将很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制变量进行评价。协变量一定要是连续数值型。,非定量方差分析:因变量为定序变量,统计技术分类图,定量因变

3、量,一个自变量,多个自变量,二分变量,多分变量,T,检验,单因子方差分析,定类,定类和定距,定距,N,因子方差分析,协方差分析,回归分析,一个因变量,多个因变量,多变量方差分析,因变量,非定量因变量,非定量方差分析,方差分析原理,目的,:通过方差的比较来检验各个水平下的观察值的均值是否相等,观察值差异,:观察值存在差异,差异的产生来自两个方面。,系统性差异,:由控制变量的不同水平造成的,例如饮料的不同颜色带来不同的销售量,随机性差异,:由于抽选样本的随机性而产生的差异,例如,相同颜色的饮料在不同的商场销售量也不相同。,方差分析的基本思想,(,单因素,),组间变异,总变异,组内变异,组内只包含,

4、随机误差,组间既包括,随机误差,,也包括,系统误差,8,组间变异组内变异,A,B,组间变异组内变异,A,B,单因素方差分析逻辑与步骤,(One-Way ANOVA),前提假设,模型与假设,平方和的分解与,F,检验,多重比较,(,事后检验,),关联强度与效应值,方差分析的前提条件,(1),每个水平下的因变量应当服从正态分布。方差分析对分布假设有稳健性,(robust),,即正态性不满足时,统计结果变化不大,因此一般并不要求检验总体的正态性。,(2),变异可加性,。各因素对离差平方和的影响可以分割成几个可以加在一起的部分。(多因素),(3),独立性,。观察对象是来自所研究因素的各个水平之下的独立随

5、机抽样,(4),方差齐性,(homogeneity of variance),,也称变异的同质性,各个水平下的总体具有相同的方差。这是方差分析一个很重要的前提,因此在进行方差分析之前,应当进行方差齐性检验。,Bartlett,检验法,Levene F,检验,最大方差与最小方差之比,3,,初步认为方差齐同。,方差不齐,若方差齐性的假定不满足,可考虑如下策略:,a.,检查某些表现“特殊”的观测值,看能否将其剔除,用剩下的数据进行方差分析。,b.,使用无方差齐性假设的多重比较方法。,c.,数据变换,用变换,(,平方根变换、对数变换等,),后的数据进行方差分析。正态性转换。,d.,非参数检验,模型与假

6、设,模型表达式(单因素),Y=+a+e,建立假设,确定检验水准,k,组总体均数不全相等。,方差分析表,组间变异体现了因素,A,的效应,组内变异则被视作误差。,来源,平方和,自由度,均方,F,值,P,值,组间,组内,总和,确定,P,值,做出统计推断,如果均值相等,,F,=,MSA,/,MSE,1,a,F,分布,F,(,k,-1,n,-,k,),0,拒绝,H,0,不能拒绝,H,0,F,事后比较,(posteriori/post hoc comparison),F,检验显著说明各组均值并不相同,(,至少两组不同,),,但不能回答到底哪几组不同。,通过对各组均值之间的配对比较来进一步检验到底哪些均值之

7、间存在差异。,方法众多,不下,20,种。,LSD,法:,最灵敏,,会犯假阳性错误;,Sidak,法:比,LSD,法保守;,Bonferroni,法:比,Sidak,法更为保守一些;,常用,Scheffe,法:多用于进行比较的两组间样本含量不等时;,Dunnet,法:常用于多个试验组与一个对照组的比较;,S-N-K,法:寻找同质亚组的方法;,Turkey,法:最迟钝,要求各组样本含量相同;,Duncan,法:与,Sidak,法类似。,均数两两比较方法,关联强度,(strength of association),与效应值,(effect size),的度量,实验处理引致的效应的大小或者数据的变异

8、有多少部分是由实验处理造成的。,Eta,平方,净,(,偏,),Eta,平方,Omega,平方,Cohens,f,(具体内容见附录),双因素(无交互作用)试验的方差分析表,方差来源,因素,A,总和,平方和,自由度,均方和,F,值,F,值临介值,因素,B,误差,注意,各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一。,双因素(有重复)试验方差分析表,方差来源,因素,A,总和,平方和,自由度,均方和,F,值,F,值临介值,因素,B,误差,这里,方差分析的应用范围:,(一),单因素多个样本均数的比较,:,1.,完全随机设计:只安排一种处理因素,不安排任何配伍因素。,2.,随机化区

9、组设计:只安排一种处理因素,安排一种配伍因素。,3.,拉丁方设计:只安排一种处理因素,安排两种配伍因素。,(二),多因素样本均数间的比较:,1.,析因设计:安排两种或两种以上处理因素,,分析处理因素间的交互作用,2.,裂区设计:安排两种或两种以上处理因素,,分析处理因素间的交互作用,3.,交叉设计:安排两种或两种以上处理因素,,分析处理因素间的交互作用,(三),多个样本均数向量间的比较,多元方差分析:结果变量有两个以上,需要综合评价。,(四),回归方程的假设检验,协方差分析,概念:,将方差分析和回归分析结合起来的一种统计分析方法,当试验指标(,Y,)的变异既受一个或几个分类变量,也受一个或几个

10、连续变量的影响,可采用协方差分析,方差分析:,一个或几个因子(,分类变量,)对变量,Y,(,连续变量,)的影响,回归分析:,一个或几个变量(,连续变量,)对变量,Y,(,连续变量,)的影响,26,目的,消除连续变量对,Y,的影响,使方差分析的检验功效更高,结果更可靠,连续变量可能会增大,Y,的组间差异,导致错误结论,连续变量可能会增大,Y,的组内变异,降低检验功效,消除分类变量的影响,使回归分析的结果更可靠,27,20,名男性,篮球运动员,和,20,名,大学生,的肺活量(,cm,3,)比较,篮球运动员,肺活量,Y,大学生,肺活量,Y,4700,3450,5200,4100,4800,4000,

11、协方差,分析基本思想,协方差,分析基本思想,篮球运动员,大学生,身高,X,肺活量,Y,身高,X,肺活量,Y,185,4700,168,3450,175,5200,170,4100,174,4800,169,4000,20,名男性,篮球运动员,和,20,名,大学生,的肺活量(,cm3,)比较,协,变,量,协方差分析基本思想,比较,肺活量,时,要消除,身高,的影响。,方法,1,:抽样时,选身高相近的。,方法,2,:从统计分析技巧上平衡数据。,校正了身高的影响后(,回归分析,),再比较两组肺活量的均数有无差异(,方差分析,)。,协方差分析基本思想,在方差分析中,用来校正因变量的数值型变量称为,协变量

12、,(,covariable,)。,含有协变量的方差分析称为,协方差分析。,协方差分析可提高方差分析的准确度。,观察指标(,Y,)的总变异:,SS,总,SS,协变量,SS,处理,SS,误差,协方差分析的基本思想,其实质就是从,Y,的总离均差平方和中扣除协变量,X,对,Y,的回归平方和,对剩余(残差)平方和作进一步分解后再进行方差分析,以更好的评价处理的效应。,SS,总,SS,回,SS,残,SS,总,SS,协变量,SS,处理,SS,误差,SS,修正,SS,组内残差,32,大学生,篮球运动员,图,1,协方差分析示意图,调,整,均,数,协方差分析步骤,完全随机设计的协方差分析,应用条件检验,回归分析,

13、求调整均数,对调整均数作方差分析,协方差分析的假设,协方差分析的基本假设与方差分析相同,包括,变量的正态性、观测值独立、方差齐性,等,此外还有三个重要的假设:,因变量与协方差之间,线性,关系;,所测量的协变量不应有误差,,如果选用的是多项的量表,应有高的内部一致性信度或重测信度,系数最好大于,0.80,。这一假设若被违反会造成犯一类错误的概率上升,降低统计检验力。,“组内回归系数同质性”(,homogeneity of with in rgression,),各实验处理组中一举协变量(,X,)预测因变量(,Y,)的回归线的回归系数要相等,即,斜率相等,,各条回归线平行。如果斜率不等则不宜直接进

14、行协方差分析。,协方差分析的模型和假定,回归分析,:,协方差分析,:,模型,协变量,Co-variable,方差分析:,36,Thanks!,问题:为什么一个比较均数差异的方法竟称为方差分析?,这种命名是因为在检验均数间差异是否具有统计学意义的过程中,我们实际上是通过比较方差而得到的。,与,t,检验直接比较两组的平均数的做法不同,方差分析把,“平均数之间差异是否显著”,的问题转化为,“平均数组间变异是否显著”,的问题,通过,“组间变异”,与,“组内变异”,的对比,进行,F,检验,,从整体上,同时比较多组的平均数之间,是否存在显著差异。,LSD(,费舍最小显著差异法,Fishers least

15、significant difference),该方法,是对检验两总体均值是否相等的,t,检验方法的总体方差估计加以修正,(,用,MSE,代替,),而得到的。,特点,检验敏感性高,即水平间的均值只要存在一定程度的微小差异就可能被检验出来。,但该方法没有控制范第一类错误的概率。,S-N-K(Student-Newman-Keuls,q,检验,),首先把各组均值排序,用每一比较的两个均值在排序序列种相差的等级数来确定不同的,q,临界值。,两均值的,rank,之差,是一种有效划分相似性子集的方法,该方法,适用于各水平下观测值个数相等的情况。,Tukey,法,(honesty significant

16、different,HSD),与,SNK,法类似,不同之处在于不论各组均值的大小次序,均使用同一临界值。,组数,它采用,q,统计量,适用于各水平下观测值个数相等的情况。与,LSD,方法比较,较好的控制了范第一类错误的概率。,Bonferroni,校正,(,以,t,分布作为检验分布,对检验水准进行调整,),与,LSD,方法基本相同。不同的是它控制了范第一类错误的概率。在每次两两组的检验中,它将显著水平除以两两检验的总次数。,在比较的次数较多时,该方法就不太适合。,Dunnett,方法,是一种唯一用于多个处理组和一个对照组,比较的方法。,SPSS,提供的常用多重比较检验方法,1,、,Tambane

17、,s T2:,基于,t,检验的保守的多重比较方法。,不满足方差齐性,多重,检验方法,2,、,Dunnett,s T3:,基于学生化极大模的多重比较方法。,3,、,Games-Howell:,非参数多重比较方法。,4,、,Dunnett,s C:,基于学生化极差的多重比较方,法,是一种可信区间的方法。,Eta,平方,(,Eta-Squared,2,),,又称关联强度,(,correlation ratio,),,因变量的变异被自变量解释的百分比。,净,Eta,平方,(partial,Eta-Squared,p,2,),,多因素,ANOVA,中,扣除了其他自变量后某自变量的效应。,判断标准:,0.

18、01,,小;,0.06,,中;,0.14,,大,Omega,平方,(Omega squared,2,),当,F,显著时,,2,将会是正值,若为负,则要解释为,0,。当样本很大而使,MS,w,变得很小,,F,很容易达到显著,此时若,2,很小,即使在统计上有意义,实际应用上仍然没意义。,判断标准:,0.01,,小;,0.06,,中;,0.14,,大,Cohens,f,f,f,0,.25,,,中,;,f,0,.40,,高,修正均数 的计算:,修正均数间的多重比较:,S,2,y.x,为组内剩余方差,SS,总,SS,回,SS,总残,51,常用试验设计,1.,完全随机设计,(Completely rand

19、om design),单因素设计,.,优点,:,简单易行,缺点,:,只能分析一个因素,2.,配伍设计,(Randomized block design),随机区组或双因素无重复试验设计,.,交互作用和方差齐性无法考察,(1),同一受试对象在同一处理不同水平间的比较复,(2),将几个受试对象按一定条件划分成配伍组,再将每一配伍组的各受试者随机分配 到各处理组中,每个配伍组的例数等于处理组个数,.,3.,交叉设计,(Cross-over design),一种特殊的自身对照设计,.,克服了试验前后自身对照由于观察期间各种非试验因素 对试验结果的影响造成的偏移,.,优点,:,节约样本含量,能控制时间因

20、素及个体差异对处理方式的影响,均等考虑受试者利 益 缺点,:,不允许缺失数据,不适用于短程效果对比,4.,析因设计,(Factorial design),当一种因素的质和量改变时另一种现象的质和量也随之而改变,几个因 素间存在交互作用时使用,.,优点,:,节约样本含量,5.,拉丁方设计,(Latin square design),各因素间无交互作用且水平数相等,三个因素按水平数,r,排列成一个,r*r,随机方阵,.,纵横两向结尾皆为配伍组,可用较少的重复次数,获得较多的 信息,6.,正交设计,(Orthogonal design),三个及以上因素,存在交互作用,.,用正交表将各试验因素,各水平

21、之间的 组合进行均匀搭配,从而可以用较少的,有代表性的处理组合,提供充分 有用的信息,.,优点,:,高效,快速缺点,:,基于线性模型的设计,7.,星点设计,(Central composite design),在正交或析因设计的基础上将自变量与因变量的关系扩大到曲面,效应 面的设计,如二水平析因设计加上极值点和中心点构成,采用二次以上多 元非线性拟合,.,8.,嵌套设计(,Nested design,)各个试验因素的影响有主次之分,次要因素的各水平是嵌套在主要因素水 平之下的,不能交互,.,9.,裂区设计(,Split-plot design,)试验因素并非一次安排,而分二次甚至多次安排,.,先安排影响最重要的,而 后再加入影响较小,或精确度要求高的次要因素到主要因素的不同水平 中,.,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服