1、SPSS操作方差分析1.方差分析由英国统计学家R.A.Fisher在1923年提出,为纪念Fisher,以F命名,故方差分析又称 F 检验。2.三种变异总变异:全部观察值大小各不相等,其变异就称为总变异(total variationtotal variation)。用SSSST T表示组间变异:由于各组处理不同所引起的变异称为组间变异(variation between groups)variation between groups)。它反应了处理因素对不同组的影响,同时也包括了随机误差。用SSSS组间表示组内变异:每个处理组内部的各个观察值也大小不等,与每组的样本均数也不相同,这种变异称为
2、组内变异(variation within groupsvariation within groups)。组内变异只反映随机误差的大小,如个体差异、随机测量误差等。因此,又称为误差变异。用SSSS组内表示3.方差分析中的多重比较目的:如果方差分析判断总体均值间存在显著差异,接下来可通过多重比较对每个水平的均值逐对进行比较,以判断具体是哪些水平间存在显著差异。常用方法备选:LSDLSD法:t t检验的变形,在变异和自由度的计算上利用了整个样本信息。Duncan Duncan 新复极差测验法Tukey Tukey 固定极差测验法DunnettDunnett最小显著差数测验法 等实现手段:方差分析菜
3、单中的“Post hoc test”按钮4.实例-多重比较步骤一:步骤一:同同one-way one-way ANOVAANOVA步骤二:步骤二:选选“Post hoc Post hoc testtest”勾选多重比较的勾选多重比较的方法方法(如如LSDLSD、duncanduncan法法 确定显著性水平确定显著性水平continuecontinuePost Hoc Test5.方差分析的思路:将全部观测值的总变异按影响结果的诸因素分解为相应的若干部分变异,构造出反映各部分变异作用的统计量,在此基础上,构建假设检验统计量,以实现对总体参数的推断。检验假设:H H0 0:三个组的总体均数相同;H
4、 H1 1:三个组的总体均数不全相同;方差分析步骤6.单因素方差分析也称有一维方差分析,对二组以上的均值加以比较。检验由单一因素影响的一个(或几个相互独立的)分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较,还可以对该因素的若干水平分组中哪些组均值不具有显著性差异进行分析,即一致性子集检验。步骤AnalyzeCompare means One-way ANOVA7.One-Way过程One-Way过程:单因素简单方差分析过程。在Compare Means菜单项中,可以进行单因素方差分析(完全随机设计资料的多个样本均数比较和样本均数间的
5、多重比较,也可进行多个处理组与一个对照组的比较)、均值多重比较和相对比较,用于。One-Way ANOVA过程要求:n因(分析)变量属于正态分布总体,若因(分析)变量的分布明显的是非正态,应该用非参数分析过程。n对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。8.analyzecompare meansone-way ANVOA响应变量响应变量因素因素9.Contrasts:线性组合比较。是参数或统计量的线性函数,用于检验均数间的关系,除了比较差异外,还包括线性趋势
6、检验Contrasts可以表达为:a1u1+a2u2+akuk=0;满足a1+a2+ak=0。式中ai为线性组合系数,ui为总体均数,k为分类变量的水平数10.Polynomial(多项式比较):均值趋势的检验有5种多项式:Linear线性、Quadratic二次、Cubic三次、4th四次、5th五次多项式 11.Coefficients:为多项式指定各组均值的系数。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。多项式的系数需要由
7、根据研究的需要输入。12.如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保ci0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。例如,当k4时,即有A、B、C、D 4个处理组,如果只将B组和D组比较,则线性组合系数依次为0、-1、0、-1;如果C组与其他3组的平均水平比较,则线性组合系数依次为-1、-1、3、-1,余类推。线性组合系数要按照分类变量水平的顺序依次填入Coefficients框中。13.均值的多项式比较可以同时建立多个多项式。一个多项式的一级系数输入结束,激活Next按钮,单击该按钮后Coefficients 框中清空,准备接受下一组系数数
8、据。如果认为输入的几组系数中有错误,可以分别单击Previous或Next按钮前后翻找出错误的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后击Change按钮,在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激活Remove按钮;单击该按钮将选中的系数清除。14.Post Hoc(均数的多重比较选项)进行多重比较是对每两个组的均值进行如下比较:MEAN(i)-MEAN(j)4.6625RANGESQRT(1/N(i)+1/N(j);其中i、j分别为组序号,MEAN(i)、MEAN(j)分别为第i、j组均值,N(i)、N(j)分别为第i、j组中的观测
9、数。各组均值的多重比较方法的算法不同RANGE值也不同。15.方差相等时可选择的比较方法方差不等时可选择的比较方法与对照组的配对比较用t检验完成各组均值的配对比较16.LSD(最小显著差异法):用 t检验完成各组均值间的配对比较。在变异和自由度的计算上利用了整个样本信息。对多重比较误差率不进行调整;(此法最敏感)Bonferroni(修正最小显著差异法):用 t检验完成各组均值间的配对比较,但通过设置每个检验的误差率来控制整个误差;(应用较多)Sidak(斯达克法):计算t统计量进行多重配对比较,可以调整显著性水平,比Bonferroni法的界限要小Scheffe(谢弗检验法):对所有可能的组
10、合进行同步进入的配对比较,这些选择可以同时选择若干个,以便比较各种均数比较方法的结果;R-E-G-W F(赖安艾耶盖F法):用F检验进行多重比较检验,显示一致性子集表;17.R-E-G-W Q(赖安艾耶盖Q法):正态分布范围进行多重配对比较;显示一致性子集表;S-N-K(SNK法):用student range分布进行所有各组均值间的比较;(应用较多)Tukey(图基法):固定极差测验法,用student-range统计量进行所有组间均值的配对比较,将所有配对比较误差率作为实验误差率;Tukeys-b(图基s-b法):用student range分布进行组间均值的配对比较。其精确值为前两种检验
11、相应值的平均值;Duncan(邓肯法):新复极差测验法,指定一系列的的Range值,逐步进行计算比较得出结论;Hochbergs GT2(霍耶比GT2法):用正态最大系数进行多重比较18.Gabriet(盖比理法):用正态标准系数进行配对比较,在单元数较大时,这种方法较自由;Waller-Duncan(瓦尔-邓肯法):用t统计量进行多重比较检验。使用贝耶斯接近;Dunnett(邓尼特法):最小显著差数测验法,进行各组与对照组的均值,默认的对照组是最后一组;选定此方法后,激活下面的Control Catetory参数框,展开小菜单,选择对照组Tamhanes T2(塔海尼T2法):t检验进行配对
12、比较;Dunnetts T3(邓尼特T3法):正态分布下的配对比较;Games-Howell(盖门-霍威尔法):各组均值的配对比较,该方法较灵活;DunnettC(邓尼特C法):正态分布下的配对比较。19.常用的多重比较方法的适用性LSD(Least significant Difference)LSD(Least significant Difference):存在明确对照组,进行验证性研究;两均数间的比较是独立的T(Tukey)T(Tukey)方法:如果事先未计划未计划多重比较,在方差分析得到由统计学意义的F F值之后,有需要进行任意两组之间的比较,且各组样本数相同S(Scheffe)S(
13、Scheffe)方法:多个均值间的比较,且各组样本数不相同SNK(Student-Newman-Keul)SNK(Student-Newman-Keul)方法:两两比较次数不多20.常用的方法有LSD,Scheffe法,SNK法,Turky法,Duncan法和Bonferroni法等。其中LSD法最敏感,Scheffe法不敏感,SNK法和Bonferroni法应用较多。21.Options(输出统计量的选择)Descriptive复选项,要求输出描述统计量。选择此项,会计算并输出:观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95可信区间;Fix and random e
14、ffects:输出固定效应模型的标准差、标准误和95%可信区间与随机效应模型的标准误和95%可信区间;22.Homogeneity of variance复选项,要求进行方差齐次性检验,并输出检验结果。Brown-Forsythe:检验各组均数相等,当不能确定方差齐性检验时,该统计量优于F统计量。Welch:检验各组均数相等,当不能确定方差齐性检验时,该统计量优于F统计量。Mean plot复选项,即均数分布图,横轴为分类变量,纵轴为反应变量的均数线图;Missing Values栏中,选择缺失值处理方法。Exclude cases analysis by analysis选项,对含有缺失值的
15、观测量根据缺失值是因变量还是自变量从有关的分析中剔除。Exclude cases listwise选项对含有缺失值的观测量从所有分析中剔除 23.饲料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6实例-单因素方差分析各处理重复数不等的方差分析用四种饲料喂养19头猪比较,四种饲料是否不同。24.实例-单因素方差分析25.第一栏:方差来源第二栏:离均差平方和第三栏:自由度第四栏:均方(第二栏与第三栏之比)第五栏:F值(组间均方与组内均方之比)第六栏
16、:F值对应的概率即P值实例-单因素方差分析(结果输出)26.存在问题与解决方法本例只考虑了猪体重的增加量,对其均值进行了比较。但实际工作中的问题往往不是这样简单,例如是否应该考虑每头猪的进食量对体重增加的影响,去除这个影响比较猪体重的增加会对饲料比较得出更切合生产实际的结论。这个问题应该使用ANOVA过程的协方差分析功能去解决。使用系统默认值进行单因素方差分析只能得出是否有显著性差异的结论,本例数据量少,哪两组之间差别最大,哪种饲料使猪体重增加更快,几乎是可以看出来的。实际工作中往往需要两两的组间均值比较。这就需要使用 One-way ANOVA进行单因素方差分析时使用选择项从而获得更丰富的信
17、息,使分析更深入。27.例题进一步分析用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下。比较四种饲料对猪体重增加的作用有无不同;并比较A、C饲料效应和与B、D效应和之间是否有显著性差异。饲 料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.628.指定多项式系数1.0mean11.0mean21.0mean31.0mean4检验饲料对使猪体重增加的效应,A、D饲料效应和与B、C饲料效应和之间是否有显著性差异;1
18、.0mean11.0mean21.0mean31.0mean4检验 A、C饲料效应和与B、D效应和之间是否有显著性差异。29.结果分析(1)描述统计量结果给出了四种饲料分组的样本含量N、平均数Mean、标准差 Std Deviation、标准误 Std Error、95的置信区间、最小值和最大值;30.结果分析(2)方差齐次性检验结果方差齐性检验由于方差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。SPSS单因素方差分析中,方差齐性检验采用了方差同质性(Homogeneity of Varianc
19、e)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路同SPSS两独立样本t检验中的方差齐性检验。从显著性概率看,P0.9950.05,说明各组的方差在=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。31.结果分析(3)方差分析结果与未使用选择项的输出结果一样给出了组间、组内的偏差平方和、均方、F值和概率P值。P0.05;Contrast2,p0.05;说明各组方差具有齐次性。对饲料间均值差两两比较,处在同一竖栏为差异不显著,反之则差异显著36.结果分析(8)均数图形以因素变量fodder为横轴,以独立变量Weight为纵轴而绘制的
20、均数散点图。可看出各组均数的水平分布。37.特别说明应该特别说明的是,选取哪些选择项是根据研究需要进行的。本例中希望比较各种饲料对猪体重增加的效应,因此选择多重比较的选择项。相对比较在此例中无实际意义,只是为了说明选择项的使用方法才选择了Contrast 选择项。38.ANOVAWEIGHT Sum of SquaresdfMean SquareFSig.Between Groups20538.69836846.233157.467.000Within Groups652.1591543.477Total21190.85818n=19,p=4Sum of Squares(平方和)df自由度Me
21、an Square(均方)FSig.Between Groups(处理)SSBP-1MSB=SSB/(p-1)F=MSB/MSEP(FFa a)Within Groups(误差)SSEn-pMSE=SSE/(n-p)Total(总和)SSTn-139.实例-单因素方差分析各处理重复数相等的方差分析调查5个不同小麦品系株高是否差异显著品 系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5和326.5322.0336.5
22、354.0343.0平均数65.364.467.370.868.6分析:5水平5重复的单因素(品系)固定模型的方差分析40.实例-单因素方差分析步骤一:步骤一:AnalyzeAnalyzeCompare Compare MeansMeansOne-way One-way ANOVAANOVA步骤二:步骤二:确定响应变量确定响应变量确定控制因素确定控制因素参数默认,参数默认,OKOK41.实例-单因素方差分析(结果输出)方差分析表方差分析表F F检验,检验,P0.01P0.05P0.05,齐性满足齐性满足71.实例-两因素方差分析(结果输出2)A A、B B效应均极显著,效应均极显著,AxBAx
23、B效应显著效应显著方差分析表方差分析表72.实例-两因素方差分析(结果输出3)对不同发酵温度之间对不同发酵温度之间的边缘均值的比较,的边缘均值的比较,用用”*”*”表示差异显著:表示差异显著:3 3个温度两两间差异个温度两两间差异均显著,温度均显著,温度30C30C最最佳佳73.实例-两因素方差分析(结果输出4)对不同原料之间的边缘对不同原料之间的边缘均值的比较,用均值的比较,用”*”*”表表示差异显著:仅原料示差异显著:仅原料2 2、3 3间差异不显著,原间差异不显著,原料料2 2、3 3最佳最佳74.实例-两因素方差分析(结果输出5)对不同温度和原料的组合计算其均值和相应的置信区间,温对不同温度和原料的组合计算其均值和相应的置信区间,温度度30C30C与原料与原料2 2或或3 3的组合效果的组合效果“最佳最佳”75.实例-两因素方差分析(结果输出6)对由数学模型计算对由数学模型计算的理论值的理论值”predicted”predicted”、实、实测值测值”observed”observed”及残差及残差”Std.”Std.residual”residual”之间进之间进行作图分析,检验行作图分析,检验模型的拟合程度。模型的拟合程度。76.实例-两因素方差分析(结果输出7)“交互作用交互作用”图,图,线段相交表示交互线段相交表示交互存在,平行则不存存在,平行则不存在在77.