1、 第5章 方差分析 方差分析是统计学的一个重要范畴,是对观察结果的数据作分析的一种常用的统计方法,目的是检验两个或多个样本均数间差异的显著性意义。这种命名是因为在检验均数间差异是否具有统计学意义的过程中,我们实际上是通过比较方差而得到结果的。方差分析主要用于均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用和方差齐性检验。 方差分析具有广泛的用途,例如医学界研究几种药物对某种疾病的疗效可以用方差分析方法去解决。 方差分析的概念 在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间差异。方差分析是检验两个或多个样本均数间差
2、异是否具有统计意义的一种方法。 1方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(l)随机误差,例如测量误差造成的差异,称为组内差异。用变量在各组的均值与该组内变量值之偏(离均)差平方和的总和表示。记作SS组内。 (2)实验条件, 即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏(离均)差平方和的总和表示。记作SS组间。 SS组间、SS组内除以各自的自由度得到其均方值即组间均方和组内均方。 一种情况是处理没有作用,即各样本均来自同一总体。 MS组间/MS组内l。考虑抽样误差的存在,则有MS组间/MS组内l。 另一种情况是处理因素确实有作用。组间
3、均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,组间均方会远远大于组内均方。MS组间MS组内。 MS组间/MS组内比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。 2方差分析的假设检验 假设有m个样本,如果原假设H0:样本均数都相同1=2=3= =m=,m个样本有共同的方差2。则m个样本来自具有共同的方差2和相同的均数的总体。 如果经过计算结果组间均方远远大于组内均方的FF0.05(f组间,f组内),(括号中的两个f是自由度)则p005,推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异,有统计意义。否则,FF0.05(f组间,f组内),P0
4、05承认原假设,样本来自相同总体,处理无作用。 方差分析中的术语 方差分析中常用的术语有以下几个: 1因素与处理 因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件。也可以通称为因素。例如影响农作物产量的因素有气温、降雨量、日照时间等;研究不同肥料对不同种系农作物产量的影响时农作物的不同种系可称为因素,所施肥料可视为不同的处理。一般情况下Factors与Treatments在方差分析中可作相同理解。在要求进行方差分析的数据文件中均作为分类变量出现。即它们的值只有有限个取值。即使是气温、降雨量等平常看作是连续变量的,在方差分析中如果作为影响产量的因素进行研究,就应该将其数值用分组定义
5、水平的方法事先变为具有有限个取值的离散变量。 2水平 因素的不同等级称作水平。例如,性别因素在一般情况下只研究两个水平:男、女。化学实验或生物实验中的“剂量”必须离散化为几个有限的水平数。如:lml、2ml、4ml三个水平。应该特别注意的是在SPSS数据文件中,作为因素出现的变量不能是字符型变量,必须是数值型变量。例如性别变量SEX,定义为数值型,取值为0、l。换句话说,因素变量的值实际上是该变量实际值的代码,代码必须是数值型的。可以定义值标签F、M(或Female、male)来表明0、l两个值的实际含义,以便在打印方差分析结果时使用。使结果更加具有可读性。 3单元(Cell) 在方差分析中C
6、e11指各因素的水平之间的每个组合。例如研究问题中的因素有性别Sex,取值为1、2;有年龄,分三个水平1(10岁)、2(11岁)、3( 12岁)。两个变量的组合共可形成六个单元:1,l、l,2、1,3、2,l、2,2、2,3,代表两种性别与三种年龄的六种组合。 4因素的主效应和因素间的交互效应 这是在科学实验中常常遇到的问题。举例说明之:有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是:第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红细胞增加数。要求分析两种药物的疗效(数据见表12l)。数
7、据来源于医用统计方法(金丕焕,人民卫生出版社)。 表 121实验数据(红细胞增加数百万/m3)第一组第二组第三组第四组0.81.30.92.10.91.21.12.20.71.11.02.0各组平均值0.81.21.02.1 这是个双因素方差分析的问题,因素A与因素B。每个因素均有用该药与不用该药两个水平,研究药物A和B是否对红细胞的增加有显著影响是对红细胞增加数的均值作以下比较: (l)比较第二组的均值与第一组的均值是否有显著性差异。 (2)比较第三组的均值与第一组的均值是否有显著性差异。 前两项研究的是A、B两因素的主效应。 (3)除了比较第四组的均值与第一组的均值是否有显著性差异外还要研
8、究A药对B药的疗效是否有影响。若A药对B药疗效无影响,那么除抽样误差外,第四组与第二组均值之差应该等于第三组均值减去第一组均值。但是实际上(2.11.2)=0.9;(1.00.8)=0.2。竞相差0.7,该差值几乎与第一组均值相同。0.7的差值包括抽样误差和A、B药的相互作用。这种因素之间的相互作用在统计学上称之为交互效应。如果交互效应存在,说明两个因素不是相互独立的。 5均值比较 均值的相对比较是比较各因素对因变量的效应的大小的相对比较。例如研究A、B效应之和是否等于它们的交互效应。或者研究A、B对红细胞增加数的效应是否相等,等。 均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性
9、差异,例如例题中研究A、B药物对红细胞增加数的疗效是否存在显著性差异。 6协方差分析 在一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究各种处理对研究对象的影响就是这个道理。例如研究身高与体重的关系时要求按性别分别进行分析。这样消除性别因素的影响。不同年龄的身高对体重的关系也是有区别的,被测对象往往是不同年龄的。要消除年龄的影响,应该采用协方差分析。 7重复测量(略) 在社会学研究中常常遇到的问题是,研究社会某些条件对人类特定方面的特性的影响,社会调查、数据采集量相当大。往往是在某一个地区采样100,另一个地区采样100。两个地
10、区的社会条件对研究对象来说可能是独立的,但同一地区的100个个体同处于相同社会条件下,彼此并不独立。进行方差分析时修正条件不独立造成的误差,或者比较组间因素与组内因素的效应,以便得出正确的分析结论,使用重复测量的方差分析。 方差分析过程SPSS提供的方差分析过程有: 1Oneway过程Onewny过程就是单因素简单方差分析过程,它在Analyze菜单中的Compare Means过程组中,用 OneWay ANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。单因素方差分析 单因素方差分析也称作一维(元)方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平
11、分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析即进行均值的多重比较。oneWay ANOVA过程要求因变量属于正态分布总体、如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure命令调用 GLM过程。举例一(data12-01)用四种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下:饲料比较数据资料饲料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.71
12、82.8220.4128.9143.8188.5212.3135.7153.5198.6Fodder变量:数值型,取值1、2、3、4分别代表A、B、C、D四种饲料。Weight变量:数值型,其值为猪体重的增加数。应该特别注意,不能把A、B、C、D定义为四个变量。操作步骤:(1)读取数据data1201。(2)按 AnalysisCompare MeansOneWay ANOVA顺序,展开OneWay ANOVA主对话框。(3)指定因变量: Weight;因素变量: fodder; 表1即为单因素变量饲料fodder对猪体重weight的影响分析结果。表的左上方是因变量weight 。 (1)输
13、出结果说明 第一栏:方差来源,包括组间变差 Between Groups;组内变差: Within Groups和总变差Total。 第二栏:离差平方和,组间离差平方和为20538.698,组内离差平方和为652.159总离差平方和为21190.258,是组间离差平方和与组内离差平方和相加之和。 第三栏:自由度,组间自由度为3;组内自由度为15;总自由度为18。 第四栏:均方差,是第二栏与第三栏之比。组间均方差为6846.233。组内均方差为43.4770第五栏:F值,是组间均方与组内均方之比。 第六栏:F值对应的概率值。针对假设H0:组间均值无显著性差异,即四种饲料对猪体重的增加的平均值无显
14、著性差异)。计算的F值157.4668,对应的概率值为O.000。 (2)结果分析 根据输出的p值为O.000可以看出,无论临界值取0.05,还是取O.01,p值均小于临界值。因此否定H0假设,四种饲料对猪体重均数有显著性意义,结论是四种饲料对猪体重的增加明显作用不同。根据该结论选择饲料,犯错误的概率几乎为O。 (3)存在问题与解决方法 本例只考虑了猪体重的增加量,对其均值进行了比较但实际工作中的问题往往不是这样简单,例如是否应该考虑每头猪的进食量对体重增加的影响,去除这个影响比较猪体重的增加会对饲料比较得出更切合生产实际的结论。这个问题应该使用ANOVA过程的协方差分析功能去解决。 使用系统
15、默认值进行单因素方差分析只能得出是否有显著性差异的结论,本例数据量少,哪两组之间差别最大,哪种饲料使猪体重增加更快,几乎是可以看出来的。实际工作中往往需要两两的组间均值比较。这就需要使用 oneWny ANOVA进行单因素方差分析时使用选择项从而获得更丰富的信息,使分析更深入。单因素方差分析的选择项 单因素方差分析的选择项分为三类:Contrasts功能按钮,可以指定一种要用t检验来检验的Priori对比;Post Hoc功能按钮,可以指定一种多重比较检验;option功能按钮,可以指定要输出的统计量,指定处理缺失值的方法。分别使用主对话框中的三个按钮打开相应的对话框,然后进行选择。 1进行均
16、值的多项式比较的选择项 在主对话框中,鼠标单击Contrasts按钮,打开Contrasts 对话框。 均值的多项式比较是包括两个或更多个均值的比较。单因素方差分析的one way ANOV过程允许进行高达5次的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下:(1)选中polynomial复选项,该操作激活其右面的Degree参数框。(2)单击Degree参数框右面的向下箭头展开阶次菜单,可以选择Linear线性、Quadratic二次、 Cubic三次、 4th四次、 5th五次多项式。(3)为多项式指定各组均值的系数。方法是在Coefficients框中输
17、入一个系数,单击Add按钮,Coefficients 框中的系数进入下面的方框中。依次输入各组均值的系数,在方形显示框中形成一列数值。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为O值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。 可以同时建立多个多项式。一个多项式的一级系数输入结束,激活Next按钮,单击该按钮后Coefficients 框中清空,准备接受下一组系数数据。 如果认为输入的几组系数中有错误,可以分别单击Previous或Next按钮前后翻找出错误的一组数据。单击出错
18、的系数,该系数显示在编辑框中,可以在此进行修改,修改后年击Change按钮,在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激活Remove按钮;单击该按钮将选中的系数清除。(4)单击previous或Next按钮显示输入的各组系数检查无误后,按Continue按钮确认输入的系数并返回到主对话框。要取消刚刚的输入,单击Cancel按钮:需要查看系统的帮助,单击 Help按钮。 2.各组均数的多重比较选择项 在主对话框中,单击Post Hoc按钮,展开 Post Hoc Multiple Comparisons对话框,在这对话框中选择进行均值多重比较的方法。多重比较有如下选择
19、项:(l)方差具有齐次性时(equal variance assumed),该矩形框中有如下选择方法: Least-significant difference(LSD)复选项,用 t检验完成各组均值间的配对比较。对多重比较误差率不进行调整。TUKEY(Tukeys honestly significant difference)复选项,用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。Duncan(Duncans multiple range test)复选项,指定一系列的Range值,逐步进行计算比较得出结论。(2)方差不具有齐次性时(Equ
20、al variance not assumed)检验各均数间是否有差异的方法有四种可供选择:Tamhanes T2复选项,t检验进行配对比较。Dunnentts T3复选项,正态分布下的配对比较。 3输出统计量的选择 在主对话框中,单击option按钮,展开option 对话框。各组选择项的含义如下:(l)statistice栏中,输出统计量的选择项。 Descriptive复选项,要求输出描述统计量。选择此项,会计算并输出:观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95置信区间。 Homogeneityof variance复选项,要求进行方差齐次性检验,并输出检验
21、结果。用Levene test检验,即计算每个观测量与其组均值之差,然后对这些差值进行一维方差分析。(2)Mean plot复选项,即均数分布图,根据各组均数描绘出因变量的分布情况。(3) Missing Values栏中,选择缺失值处理方法。 Exclude cases analysis by analysis选项,对含有缺夫值的观测量根据缺失值是因变量还是自变量从有关的分析中剔除。 Exclude cases instwise选项对含有缺失值的观测量从所有分析中剔除。 以上三组选择项选择完成后,按Continue按钮,确认选择并返回主对话框。单击Cancel按钮作废本次选择:单击Help按
22、钮,显示有关的帮助信息。使用选择项的单因素方差分析实例(1)读取数据data1201。(2)按 AnalysisCompare MeansOneWay ANOVA顺序,展开OneWay ANOVA主对话框。(3)指定因变量: Weight;因素变量: fodder;指定选择项 打开Contrasts对话框,选择多项式比较选择一次多项比较各组均值,共指定了2组多项式系数:1.0*meanl1.0*mean21.0*mean3十1.0*mean4检验饲料对使猪体重增加的效应,A、D饲料效应和与B、C饲料效应和之间是否有显著性差异。1.0*meanl1.0*mean2十1.0*mean31.0*me
23、an4检验 A、C饲料效应和与B、D效应和之间是否有显著性差异。 单击Post Hoc按钮,展开Post Hoc Multiple Comparisons对话框,选择多重比较:在Equal Variance Assumed栏中,选择LSD、 Duncan两种方法。在Equal Variance Not Assumed栏中,选择TamhanesT2方法 单击options按钮,展开Options对话框,输出统计量选择项:结果说明 表1为描述统计量结果表。给出了四种饲料分组的样本含量N、平均数Mean、标准差 Std Deviation、标准误 Std Error、95的置信区间、最小值和最大值。
24、表2为方差齐次性检验结果。从显著性概率看, p0.05,说明各组的方差在=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。表3是使用选择项的方差分析结果。与未使用选择项的输出结果一样给出了组间、组内的偏差平方和、均方、 F值和概率p值。 P0.05;Contrast2,p0.05;说明各组方差具有齐次性。 图8是以因素变量fodder为横轴,以独立变量Weight为纵轴而绘制的均数散点图。可看出各组均数的水平分布。 应该特别说明的是,选取哪些选择项是根据研究需要进行的。本例中希望比较各种饲料对猪体重增加的效应,因此选择多重比较的选择项。相对比较在此例中
25、无实际意义,只是为了说明选择项的使用方法才选择了Contrast 选择项。 举例二(data12-02)下面的数据是ERDMAN(1946)的一个实验。同种三叶草被接种上不同的菌种测量三叶草植物中含氮量。每组数据中前面一个是菌种代码,变量名是strain,SPSS分析过程要求因素变量必须为数值型变量。后面一个是含氮量,变量名是nitrogen。(1)读取数据data1202。(2)按 AnalysisCompare MeansOneWay ANOVA顺序,展开OneWay ANOVA主对话框。(3)指定因变量: nitrogen;因素变量: strain;(4) 单击Post Hoc按钮,展开
26、Post Hoc Multiple Comparisons对话框,选择多重比较:在Equal Variance Assumed栏中,选择LSD、TUKEY两种方法。在Equal Variance Not Assumed栏中,选择TamhanesT2方法(5)单击options按钮,展开Options对话框,输出统计量和方差齐性检验选择项: 2General Linear Model(简称 GLM)过程 GLM过程由Analyze菜单直接调用,该过程可以完成简单的多因素方差分析和协方差分析,并且不但可以分析各因素的主效应,还可以分析各因素间的交互效应。 GLM过程属于专业统计和高级统计分析过程,
27、在 Analyze菜单中直接调用 General Linear Model过程,该过程有四项命令,分别完成不同任务。这四项的主要功能分别是: (l)Univariate命令Univariate命令调用GLM过程完成一般的单因变量、多因素方差分析。如果指定了协变量,则可进行协方差分析。Univariate过程在指定模型方面有较大的灵活性,并可以提供大量的统计输出。(单因变量)多因素方差分析过程 单因变量多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的回归分析和方差分析。利用该方差分析过程,可以检验不同组之间均数由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素
28、的作用,也可以分析因素之间的交互作用,以及分析协方差和协方差交互作用。单因变量多因素方差分析的菜单和选择项 单变量多因素方差分析的步骤:AnalysisGeneral Linar ModelsGLMUnivariate顺序逐一单击鼠标键,最后展开GLMUnivariate主对话框。 用与前2节中叙述的相同方法确定因变量,因变量移到Dependent Variable框中定义;固定变量移到Fixed Facter框中,随机变量移到Random Facter中。 应该特别注意由于内存容量的限制选择的因素水平组合数单元数)应该尽量少。因素数量和对选定因素定义的取值范围决定了组合数。 如果需要去除协变
29、量的影响,将协变量移到Covariates框中。 如果需要分析权重变量的影响,将权重变量移到WLS Weight框中。 完成以上工作即可通过功能按钮展开相应对话框选择模型、对比、输出统计量。 l选择分析模型 在主对话框中,单击Model按钮,展开Univariate :Model对话框。(l)在Specify Model栏中指定模型类型。 Full Factorial选项,此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个同素变量的主效应、两两的交互效应和三个因素的交互效应。Custom选项,建立自定义的模型。此项的
30、选择激活下面各操作框。 (2)建立自定义模型 选择了Custom 后,在FactorsCovariates框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母“F”;和可以作为协变量的变量名,其变量名后面的括号中标有字每“C”。 选择模型中的主效应 鼠标键单击某一个单个的因素变量名该变量名背景将改变颜色(一般变为蓝色),单击Build Term(s)栏中下面的箭头,该变量出现在Mode1中。一个变量名占一行称为主效应项。欲在模型中包括几个主效应项,就进行几次如上的操作。注意,选择主效应必须选择一个,用箭头按钮送入模型一个。也可以同时送两个或多个到Model框中。 选择交互效应类型
31、 在Build Term(s)栏中有一个可下拉的小菜单: Main effects选项,选中此项可以指定主效应。指定上效应也可以使用所叙述的方法。 Interactin选项,选中此项可以指定任意的交互效应。 All2way选项,指定所有2维交互效应。 All3way选项, 指定所有3维交互效应。 All4Way选项,指定所有4维交互效应。 All4Way选项,指定所有有5维交互效应。 在下拉菜单中用鼠标单击某一项,该项背景改变颜色后下拉菜单收回选中的交互类型菜单项占据矩形框。 建立模型中的交互项 利用选中的交互效应类型可以建立模型中的交互项了。例如,因素变量有Light(F)、Device(F
32、)、 Target(F)。 要求模型中包括变量Light与Device交互效应,相应的操作是在FactorsCovariates框内的变量表中,用鼠标单击device变量使其背景改变颜色,此为选择了交互项之一,再用鼠标单击变量light变量使其背景改变颜色;此为选择了交互项之二。单击Build Term(s)栏内参数框的箭头按钮,一个交互效应出现在Model框中。模型增加了一个交互效应项:device*light。 要求模型中包括三个变量的所有2维交互效应项时应该分别用鼠标单击light、Device、Target三个变量名。在Build Term(s)栏内参数框中选择All2way项,单击箭
33、头按钮。在Model中出现三个 2维交互效应项: light*device、 light*target、device*target。 若要求模型中包括所有3维效应,由于可以作为因素变量的只有三个变量,因此可以有两种操作方法。鼠标分三次单击变量 light、 device、 target。选择 Build Term(s)栏内参数框中的Interaction或All3way项,再申击箭头按钮,均可以在Model框中出现3维交互效应项:ligh*device*target。 (3)选择分解平方和的方法 在对话框的下部有 Sum of后跟一个矩形框,可以进行四项选择来确定平方和的分解方法,包括TYPE
34、I、 TYPE、 TYP 和TYPEIV四种。其中TYPE是系统默认的,也是常用的一种。 2选择对照方法 在主对话框中,单击Contrast。按钮,展开Contrasts对话框。 (1)在Factors框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的对比方法。 (2) Change Contrast栏中改变对照方法。 None选项,不进行均数比较。 Deviation选项,比较预测变量或因素的每个水平的效应。选择Last或First作为忽略的水平。 Simple选项,除了作为参考的水平外对预测变量或因素变量的每一水平都与参考水平进行比较。选择Last或Firt作为参考水平
35、。 Difference选项,对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。与Helmert对照方法相反。 对照的参考水平有两个,只有选择了Deviation或Simple 方法时需要选择参考水平。共有两种可能的选择,最后一个水平Last选项和第一水平Fist选项。系统默认的参考水平是Last。 3选择分布图形 在主对话框中,单击 Plots选项,展开Univariate : Profile Plots对话框。对话框是为描绘因变量的均数分布而设置的,它可以一个或多个因素变量为参考做因变量的均数分布图。 横坐标框,纵坐标框,散点框。 例如要以 targat变
36、量为横轴,以Score均数为纵轴。做score变量均数的分布图,则在Factors中选中targat变量将其移入Honrizontal Axis框中,再单击Add钮,将其送入下面的Plot框中即可。精,再重新输入正确内容。在检查无误后担Continue按钮确认,返回到主均话框。如果取消做图单击Cancel钮。需要查看系统的帮助信息,单击Help。 4多重比较分析 在主对话框中,单击Post Hoc 5选择保存运算值 在主对话框中,单击Save按钮。通过在对话框中的选择,可以将所计算的预测值、殊差和检测值作为新的变量保存在编辑数据文件中。以便在其他统计分析中使用这些值。举例一(data12-03
37、)随机区组设计资料的方差分析使用系统默认值进行随机区组设计资料的方差分析 四个种系未成年雌性大白鼠各三只,每只按一种剂量注射雌激素,一段时间后,解剖称子宫重量。 操作方法与步骤 定义三个变量:两个分类变量,一个连续变量。 大白鼠种系变量mouse,取值14,是种系AD种系的代码。 雌激素剂量变量:etrogen,取值l3,是剂量0.2、0.4、0.8三种剂量的代码。 子宫重量变量: wuteri,连续变量。是本课题的研究对象。不同种系、剂量的子宫重量剂量种系0.2(1)0.4(2)0.8(3)A(1)106116145B(2)4268115C(3)70111133D(4)426387输出结果
38、表1为变量信息,大白鼠子宫重量按大白鼠种系和雌激素剂量分组。 表2是方差分析表,在表的左上方标明研究的对象是wuteri 。 Sours列:偏差的来源。这一列表明此列不面将按以下各项列出各统计量: Corrected Model校正模型Mouse、Etrogen。 Intercept截距。在分析中没有实际意义。 Error误差。 Total是偏差平方和在数值上等于截距、主效应、误差之和。 Corrected Total 校正总和。偏差平方和在数值上等于校正模型与误差之和。 TYP sum of squares偏差平方和。 df自由度。 Mean Square均方。数值上等于偏差平方和除以相应的
39、自由度。 F值,是两个均方差之比。 Sig,进行F检验的p值。从p值看,此得出种系和剂量对因变量在.=0.05水平上是有显著性差异的。举例二(data12-04)2*2析因实验方差分析实例有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是:第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红细胞增加数。要求分析两种药物的疗效(数据见表12l)。数据来源于医用统计方法(金丕焕,人民卫生出版社)。 表 121实验数据(红细胞增加数百万/m3)第一组第二组第三组第四组0.81.30.92.10.91.
40、21.12.20.71.11.02.0各组平均值0.81.21.02.1数据说明:因素变量两个:drugA和drugB,两个变量均有两水平,0表示不用此药,1表示使用此药。因变量:redcell(红细胞增加数百万/m3)。结果说明与分析表1是“两种药物对红细胞增加数作用的研究”课题中的变量信息。表中列出drugA和drugB两个因素变量和分类水平,以及每水平的样本含量。表2为方差分析结果。可以看出 drugA、 drugB均对红细胞的增加有显著疗效。并且交互效应也很显著。表3为定义均值比较假设检验索引表均值比较结果。表中说明了选用的是 Simple比较方法,选择了第一水平作为参考水平。由于每个
41、因素变量只有两个水平,因此均值比较都是与第一水平的比较。Custom Hypothesis Test1和Custom Hypothesis Test2表分别列出drugA、 drugB 。以drugA为例说明表中内容。表4列出drugA的第二水平与第一水平的对比值(Contrast Estimate)检验值(Hypothesis Value)、对比值与检验值的差值(Difference)、标准误(Std.error)、差值95置信区间。表4为均数对比方差分析表。从概率值概值分析 p0.05,说明检验结果拒绝无效假设。举例三(data12-05)拉丁方区组设计的方差分析实例拉丁方实验设计的特点是
42、有两个以上因素变量,每个因素变量的水平数相等。 为了评价六种不同甜菜,选择地块土壤条件相同,要求分析六种甜菜品种的产量是否有显著性差异。为了得出这一结论,同时检验地块是否对平均产量有影响。即地块的行与行之间、列与列之间的平均产量是否有显著性差异。将六种甜菜(变量variety)种了播种在六行(rep)、六列(变量col)的地块上,记录两次收获(变量havrvest)的产量(变量yield)。表1为变量信息表表2为方差分析表表3为各列、各行和各个品种的平均值, 标准误和区间估计。表4为方差分析表。表中没有给出F值及概率。不考虑交互作用,而只考虑主效应。表5各个组合均值。其中 rep*col是各列与各行的组合均值;rep*variety是各列与各种的组合均值;col*variety是各行与各种的组合均值。举例四(data12-06)协方差分析实例协方差分析是将线性回归和方差分析结合应用的一种统计分析方法。这种方法常用来消除混杂因素对分析指标的影响,减少随机误差。1 难以完全控制影响因素的观察研究 例如,比较城市和农村儿童头围的差异,应考虑体重对头围的影响,原因是体重与头围有关,体重重的儿童头围也较大。2实验设计中尚存在未加控制的实验研究 本小节实验数据镉作业工人年龄与肺活量的资料数据来源于医用统计方法(金丕焕,人民卫生出版社)。 1数据资料(data12