资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,t,检验法适用于两样本平均数的差异检验,但,需进行多个平均数间的差异显著性检验。,这时若仍采用,t,检验法就不适宜。,处理这类问题通常采用,方差分析,方法。,方差分析,(Analysis of variance,简称,ANOVA),用于推断,多个总体均数,有无差异,例,在饲料养鸡增肥的研究中,某饲料研究所提出,三种饲料配方,:,A,1,是以鱼粉为主的饲料,,A,2,是以槐树粉为主的饲料,,A,3,是以苜蓿粉为主的饲料。,为比较三种饲料的效果,特选,24,只,相似,的雏鸡,随机,均分为三组,每组各喂一种饲料,,60,天后观察它们的重量。试验结果如下表所示:,鸡饲料试验数据,饲料,A,鸡 重(克),A,1,1073,1009,1060,1001,1002,1012,1009,1028,A,2,1107,1092,990,1109,1090,1074,1122,1001,A,3,1093,1029,1080,1021,1022,1032,1029,1048,本例中,我们要比较的是三种饲料对鸡的,增肥作用是否相同。,为此,我们把饲料称为,因子,,记为,A,,,而三种不同的配方称为,因子,A,的三个水平,,记为,A,1,A,2,A,3,,,使用配方,A,i,下第,j,只鸡,60,天后的重量用,y,ij,表示,,i,=1,2,3,j,=1,2,10,。,我们的目的是,比较三种饲料配方下鸡的平均重量是否相等,,为此,需要做一些,基本假定,,把所研究的问题归结为一个统计问题,然后用方差分析的方法进行解决。,方差分析又叫变异数分析,,,1928,年由英国统计学家,Ronald Fisher,首先提出来的,所以,方差分析又叫,F,检验,。,第一节 方差分析简介,单因素方差分析(即完全随机设计资料的方差分析)、,两因素方差分析(即随机区组设计资料的方差分析)和,三因素方差分析(即拉丁方设计资料的方差分析)及,多个样本均数间的多重比较。,方差分析,主要内容,方差分析的基本思想借助以下例题予以说明:,例:,为研究煤矿粉尘作业环境对尘肺的影响,将,18,只大鼠随机分到甲、乙、丙,3,个组,每组,6,只,分别在地面办公楼、煤炭仓库和矿井下染尘,,12,周后测量大鼠全肺湿重(,g,),数据见表,92,,问不同环境下大鼠全肺湿重有无差别?,一、方差分析的基本思想,甲,组,乙,组,丙,组,4.2,4.5,5.6,3.3,4.4,3.6,3.7,3.5,4.5,4.3,4.2,5.1,4.1,4.6,4.9,3.3,4.2,4.7,n,i,6,6,6,从以上资料可看出,三个组的数据各不相同,这种差异(,总变异),可以分解成两部分:,即,(,1,),组间变异,:甲、乙、丙三个组大鼠全肺湿重 各不相等(此变异反映了处理因素的作用,以及随机误差的作用),(,2,),组内变异,:各组内部大鼠的全肺湿重各不相等(此变异主要反映的是随机误差的作用),各部分变异的计算:,总变异,(全部试验数据间大小不等)用总离均差平方和 来表示。,其中,组间变异,(由于所接受的处理因素不同而致各组间大小不等)用组间离均差平方和 来表示。,各组均数 之间相差越大,它们与总均数 的差值就越大,越大;反之,越小。,组内变异,(同一处理组内部试验数据大小不等)用组内离均差平方和 来表示。,三个变异之间的关系:,其中:,离均差平方和只能反映变异的绝对大小。,变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须除以相应的自由度,该比值称,均方差,简称均方,(,MS,)。,的大小就反映了各部分变异的平均大小。,方差分析就是通过比较组内均方 和组间均方 的大小关系来判断处理因素有无效应。,检验统计量:,如果各组的总体均数相等,即无处理因素的作用,则组内变异和组间变异都只反映随机误差的大小,此时组间均方 和组内均方 大小相当,即,F,值则接近,1,,各组均数间的差异没有统计学意义;反之,如果处理有作用,则组间变异不仅包含随机误差,还有处理因素引起的变异,(,组间变异主要反映处理因素的作用,),,此时组间均方,远大于组内均方 ,则,F,值远大于,1,,各组均数间的差异有统计学意义。故依据,F,值的大小可判断各组之间有无差别。,可见,方差分析的,基本思想,就是,根据实验设计的类型,将全部测量值总的变异分解成两个或多个部分,每个部分的变异可由某个因素的作用(或某几个因素的作用)加以解释,通过比较各部分的均方与随机误差项均方的大小,借助,F,分布来推断各研究因素对实验结果有无影响。,方差分析的应用条件,(,1,),各观测值相互独立,并且服从正态分布,;,(,2,)各组总体方差相等,即方差齐性。,1,用于两个或多个均数间的比较,2,分析两个或多个因素的交互作用,3,回归方程的假设检验,4,方差齐性检验,方差分析的用途,第二节,单因素方差分析,完全随机设计资料的方差分析,一、完全随机设计,完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到,g,个处理组,各处理组分别接受不同的处理,试验结束后比较各组均数之间差别有无统计学意义,以推断处理因素的效应。,将衡量试验结果的标志称为,试验指标,。,将影响试验结果的条件称为,因素,。,因素在试验中所处的不同状态称为该因素的,水平,。,只考察一个影响条件即因素的试验称为,单因素试验,,相应的方差分析称为,单因素方差分析,。,方差分析的基本概念,二、变异分解,完全随机设计资料的方差分析表,变异来源 自由度,SS MS F,总变异,组间,组内,单因素方差分析表,方差来源,离差平方和,自由度,均方,F,值,临界值,F,因素,A,(组间),SS,A,k-1,SS,A,/(k-1),F,(k-1,n-k),误差,E,(组内),SS,E,n-k,SS,E,/(n-k,),总变量,SS,T,=SS,A,+SS,E,n-1,例,1,试根据表,2,试验结果,检验三组大鼠全肺湿重的总体均数是否相同。,解:,(,),建立假设,并确定检验水准。,H,0,:,H,1,:,不等或不全相等,三、分析步骤,(,),计算,F,值,表,2,三组大鼠的全肺湿重(,g,),本例,,,,,以上计算结果代入方差分析表,并求出相应的,MS,及,F,值:,表,9-3,例,9-1,的方差分析表,变异来源,SS,v,MS,F,值,P,值,组,间,2.528,2,1.264,4.70,F,0.05,(,2,,,15,),,故,P,0.05,,,按,=0.05,水准拒绝,H,0,,,接受,H,1,,,差别有统计学意义,可认为不同粉尘环境影响大鼠的全肺湿重。,当,g,=2,时,方差分析的结果与两样本均数比较的,t,检验等价,且有 。,单因子方差分析的统计模型,只考察了一个因子,称其为单因子试验。通常,在单因子试验中,记因子为,A,设其有,r,个水平,记为,A,1,A,2,A,r,。,在每一水平下考察的指标可以看成一个总体,因为现共有,r,个水平,故有,r,个总体,,1,、每一总体均为正态总体,记为,N,(,i,i,2,),,,i,1,2,r,;,2,、各总体的方差相同,:,1,2,=,2,2,=,r,2,=,2,;,(,即,具有方差齐次性,),3,、从每一总体中抽取的样本是相互独立的,,即所有的试验结果,y,ij,都相互独立。,假定:,我们要比较各水平下的均值是否相同,即要对如下的一个假设进行检验,:,H,0,:,1,=,2,=,=,r,H,1,:,1,2,r,不全相等,如果检验结果为,H,0,成立,因子,A,的,r,个水平均值相同,,称因子,A,的,r,个水平间没有显著差异,简称因子,A,不显著,反之,当,H,0,不成立时,,因子,A,的,r,个水平均值不全相同,,称因子,A,的不同水平间有显著差异,简称因子,A,显著,。,单因子方差分析的统计模型:,模型可以改写为,H,0,:,a,1,=,a,2,=,=,a,r,=0,第三节 两因素方差分析,随机区组设计资料的方差分析,一、随机区组设计,随机区组设计,(,randomized block design,),,又称配伍组设计,是配对设计的扩展。,具体做法是:先按影响试验结果的非处理因素将受试对象配成区组,(,block,),,再将各区组内的受试对象随机分配到不同的处理组,各处理组分别接受不同的处理,试验结束后比较各组均数之间差别有无统计学意义,以推断处理因素的效应。,该设计的,特点,:,(,1,),该设计包含两个因素,一个是区组因素,一个是处理因素;,(,2,),各区组及处理组的受试对象数相等,各处理组的受试对象生物学特性较均衡,可减少试验误差,提高假设检验的效率。,此类资料的方差分析,其应用,条件,同前:即资料满足正态性及方差齐性的要求。,因为随机区组设计可以将区组间变异从完全随机设计的组内变异中分离出来以反映不同区组对结果的影响,所以随机区组设计全部测量值总的变异相应地就分成三部分。,各种变异之间的关系是,:,其中:,二、变异分解,(,1,)总变异:,反映全部试验数据间大小不等的状况,,(,2,)处理组间变异:,甲、乙、丙三个组间测量值的均数大小不等,,(,3,)区组间变异:,12,个区组间测量值的均数大小不等,,(,4,)误差变异:,反映随机误差产生的变异,,表,9-5,随机区组设计的方差分析表,变异来源 自由度,SS MS F,总变异,处理间,区组间,误差,二、分析步骤,结合例,9-2,:,例,9-2,研究甲、乙、丙三种营养素对小白鼠体重增加的影响,已知窝别为影响因素。拟用,6,窝小白鼠,每窝,3,只,随机地安排喂养甲、乙、丙三种营养素之一种,,8,周后观察小白鼠体重增加情况,数据见表,9-6,。问:(,1,)不同营养素之间小白鼠的体重增加是否不同?(,2,)不同窝别之间小白鼠的体重增加是否不同?,表,9-6,三种营养素喂养小白鼠所增体重(,g,),窝别号,甲营养素,乙营养素,丙营养素,1,64,65,73,2,53,54,59,3,71,68,79,4,41,46,38,5,50,58,65,6,42,40,46,(,1,)建立假设、确定检验水准。,处理,:,H,0,:,甲,=,乙,=,丙,(,三种营养素对小白鼠体重增加作用相同,),H,1,:,甲,,,乙,,,丙,不全相等,(,三种营养素对小白鼠体重增加作用不全相同,),区组,:,H,0,:,1,=,2,=,6,(,窝别对小白鼠体重增加无影响),H,1,:,1,,,2,,,,,6,不全相等,(窝别对小白鼠体重增加有影响),(,2,)计算检验统计量,F,值。,计算各处理组的小计,各区组的小计,见表,9-6,。,表,9-6,三种营养素喂养小白鼠所增体重(,g,),窝别号,甲营养素,乙营养素,丙营养素,区组合计,(,B,j,),1,64,65,73,202,2,53,54,59,166,3,71,68,79,218,4,41,46,38,125,5,50,58,65,173,6,42,40,46,128,处理组合计,(,T,i,),321,331,360,1012,17891,18845,22836,59572,53.5,55.2,60.0,56.22,本例,,表,9-2,例,9-2,方差分析表,变异来源,SS,V,MS,F,P,处理组间,136.778,2,68.389,4.24,0.05,区组间,2377.111,5,475.422,29.49,F,0.01,(,5,10,),,故,P,0.05,。,结论:按,=0.05,水准,拒绝,H,0,,,接受,H,1,,,差别有统计学意义,可认为不同窝别对小白鼠体重增加有影响。,()查,F,界值表,确定,P,值并作结论。,随机区组设计的,优点,是,从组内变异中分离出区组变异从而减少了误差均方,使处理组间的,F,值更容易出现显著性,即提高了统计检验效率。,当,g,=2,时,随机区组设计方差分析与配对设计资料的,t,检验等价,有,t,2,=,F,。,第四节,三因素方差分析,拉丁方设计资料的方差分析,一、拉丁方设计,完全随机设计只涉及到一个处理因素;随机区组设计涉及一个处理因素和一个区组因素。若实验涉及一个处理因素和两个控制因素,而且每个因素的水平数相等,此时可采用拉丁方设计来安排实验,将两个控制因素分别安排在拉丁方的行和列上。,拉丁方是由,g,个拉丁字母排成的,g,g,方阵,每行或每列中每个字母都只出现一次,这样的方阵称为,g,阶拉丁方。,拉丁方设计是在随机区组设计的基础上发展的,它可多安排一个已知的对实验结果有影响的非处理因素,提高了效率。应用时,根据水平数,g,来选定拉丁方大小。,33,44,55,A,B,C,C,A,B,B,C,A,A,B,C,D,D,A,B,C,C,D,A,B,B,C,D,A,A,B,C,D,E,E,A,B,C,D,D,E,A,B,C,C,D,E,A,B,B,C,D,E,A,例,9-3,研究,A,、,B,、,C,、,D,四种食品,以及甲、乙、丙、丁四种加工方法对小白鼠增体重的影响。拟用,4,窝大鼠,每窝,4,只,每只小白鼠随机喂养一种食品、随机采用一种加工方法;,8,周后观察大鼠增体重情况。实验结果如表,9-9,所示。问:(,1,)食品种类是否影响大鼠体重增加?(,2,)食品加工方法是否影响大鼠增体重?(,3,)不同窝别的大鼠体重增加是否不同?,区组号,甲,乙,丙,丁,1,80(D),70(B),51(C),48(A),2,47(A),75(C),78(D),45(B),3,48(B),80(D),47(A),52(C),4,46(C),81(A),49(B),77(D),表,9-9,四种食品及四种加工方法喂养大鼠所增体重(,g,),44,A,B,C,D,D,A,B,C,C,D,A,B,B,C,D,A,二、变异分解,表,9-8,拉丁方设计资料的方差分析表,表中,C,为校正数,、分别为不同处理、,行区组、列区组的合计。,三、分析步骤,例,9-3,问:(,1,)食品种类是否影响大鼠体重增加?(,2,)食品加工方法是否影响大鼠增体重?(,3,)不同窝别的大鼠体重增加是否不同?,表,9-9,四种食品及四种加工方法喂养大鼠所增体重(,g,),解:,(1),建立检验假设,确定检验水准,H,处理,0,:,A,=,B,=,C,=,D,即四种食品对大鼠体重增加相同,H,处理,1,:,A,,,B,,,C,,,D,不全相等 即四种食品对大鼠体重增加不全相同,H,行,0,:,1,=,2,=,3,=,4,即不同窝别大鼠体重增加相同,H,行,1,:,1,,,2,,,3,,,4,不全相等 即不同窝别大鼠体重增加不全相同,H,列,0,:,甲,=,乙,=,丙,=,丁,即不同加工方法对大鼠体重增加相同,H,列,1,:,甲,,,乙,,,丙,,,丁,不全相等 即不同加工方法对大鼠体重增加不全相同,=0.05,(,2,)计算检验统计量,=62772-59292.25=3479.75,(2232,2122,2242,3152)-59292.25=1726.25,(2492,2452,2272,2532)-59292.25=98.75,(2212,3062,2252,2222)-59292.25=1304.25,=,3479.75-1726.25-98.75-1304.25,350.5,表,9-10,例,9-3,方差分析表,变异来源,SS,V,MS,F,P,处理间,1726.25,3,575.417,9.85,0.05,列区组,1304.25,3,434.750,7.44,0.05,误差,350.50,6,58.417,总,3479.75,15,(,3,)确定,P,值,作出推断结论,对处理:以,处理,=3,和,误差,=6,查,F,界值表,,F,0.05,(,3,6,),=4.76,,,F,0.01,(,3,6,),=9.78,,得,P,0.05,,,按,=0.05,水准不拒绝,H,0,,,差别无统计学意义,尚不能认为不同窝别可影响大鼠增重。,对列区组:以,列,=3,和,误差,=6,查,F,界值表,,F,0.05,(,3,6,),=4.76,,,F,0.01,(,3,6,),=9.78,,得,P,0.05,,,按,=0.05,水准拒绝,H,0,,,接受,H,1,,,差别有统计学意义,可认为食品加工方法会影响大鼠增重。,拉丁方设计的要求:,一定是三因素,且三因素水平数相等;,行间、列间、处理间均无交互作用;,各行、列、处理的方差齐。,拉丁方设计的优缺点:,优点是可同时研究三个因素,减少实验次数。从组内变异中不但分离出行区组变异,而且还分离出列区组变异,使误差变异进一步减小。缺点是要求处理组数与所要控制的两个因素水平数相等,一般实验不容易满足此条件,而且数据缺失会增加统计分析的难度。,第五节 多个均数间的两两比较,经过方差分析,若拒绝了检验假设,H,0,,,只能说明多个总体均数不等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。,SNK-q,检验、,LSD-t,检验和,Dunnett-t,检验。,多重比较常用的方法有:,一,、,SNK-q,检验,SNK,(,Student-Newman-Keuls,),检验,亦称,q,检验,适用于,多个均数两两之间的全面比较,。检验统计量,q,的计算公式为:,例,1,经,F,检验结论有统计学意义,试用,SNK-,q,检验方法对三组均数进行多重比较。,解:,(1),建立假设,确定检验水准。,H,0,:(对比组总体均数相等);,H,1,:(对比组总体均数不等);,(,2,)计算检验统计量,q,值,。,计算差值的标准误:本例,n,A,n,B,6,,,MS,误差,MS,组内,0.269,将三个样本均数从小到大排序,并赋予秩次:,均数,3.817 4.233 4.733,组别 甲组 乙组 丙组,秩次,(,R,),1 2 3,列表,计算检验统计量,q,值:,表,9-12,例,9,1,的,3,个样本均数两两比较的,q,检验,(,3,)确定,P,值,作出推断结论,以,误差,15,及组数,a,查,q,界值表,并确定,P,值,填入表,9-12,。,结论:甲组与丙组(“,1,与,3”,)比较,P,0.05,,,按,=0.05,水准不拒绝,H,0,。,因此,可认为矿井下环境会造成肺功能损害。,二、,Dunnett,-,t,检验,Dunnett,t,检验适用于,多个实验组与一个对照组,均数差别的多重比较。检验统计量为:,例,2,中甲组是对照组,研究目的是比较乙营养素和丙营养素是否比甲营养素多增加体重,经,F,检验结论有统计学意义,试用,Dunnett-,t,检验方法对三组均数进行多重比较。,解:,(,1,)建立假设,确定检验水准。,H,0,:,(所比较实验组与对照组总体均数相等),H,1,:,(所比较实验组与对照组总体均数不等),(,2,)计算检验统计量,Dunnett-,t,值。,本例,n,T,=,n,C,=6,,,MS,误差,16.122,,,则差值的标准误为,2.318,列表计算,t,D,统计量,如表,9-13,所示。,(,3,)确定,P,值,作出推断结论。,以 及处理数,T,=2,查,Dunnett-,t,检验界值表,并确定,P,值,填入表,9-13,。丙组与甲组比较,P,0.05,,,没有统计学意义,按,=0.05,水准不拒绝,H,0,,,尚不能认为乙营养素与对照组增加体重不同。,表,9-13,例,9,2,的,2,个处理组与对照组均数比较的,tD,检验,三、,LSD-,t,检验,LSD-,t,检验即最小显著差异,t,检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。,检验统计量,t,的计算公式为,:,LSD,-,例,3,中食品种类是否影响大鼠增体重,研究目的只为比较,A,食品与,B,食品,,C,食品与,D,食品便可;多组间经,F,检验结论有统计学意义,试用,LSD-,t,检验方法对这两对均数进行多重比较。,检验步骤为:,(,1,)建立检验假设,确定检验水准,H,0,:,A,=,B,即所研究的两个对比组的总体均数相等,H,1,:,A,B,即所研究的两个对比组的总体均数不等,=0.05,(2),计算检验统计量,本例,n,A,n,B,4,,,MS,误差,58.417,,,误差,6,计算统计量,LSD-,t,值,如表,9-14,所示。,(,3,)确定,P,值,作出推断结论,以,误差,6,查,t,界值表,并确定,P,值,填入表,9-14,。由表,9-14,得,A,食品与,B,食品比较,P,0.05,,,按,=0.05,水准,不拒绝,H,0,,,无统计学意义,还不能认为,A,食品和工食品增体重不同。但,C,食品与,D,食品比较,P,0.01,,,按,=0.05,水准,拒绝,H,0,,,有统计学意义,可认为,C,食品增体重不如,D,食品。,表,9-14,例,9,3,的两个对子均数比较的,LSD-,t,检验,第五节 多组样本的方差齐性检验,方差分析的一个应用条件,是,相互比较的各样本的总体方差相等,即具有方差齐性,,,这就需要在作方差分析之前,,先对资料的方差齐性进行检验,,特别是在样本方差相差悬殊时,应注意这个问题。,本节介绍,多个样本的方差齐性检验方法,,,Bartlett,检验法和,Levene,检验,法,。,一、,Bartlett,检验,检验统计量为:,例,7,对例,1,资料,检验其是否满足方差齐性?,解:,H,0,:,H,1,:,不全相等,=0.10,表,15,例,1,的方差齐性检验计算表,首先计算各样本方差,S,i,2,和合并方差,S,C,2,,,再计算,2,。,=3,1=2,查,2,界值表,,2,0.10,,,按,=0.10,水准,不拒绝,H,0,,,差别无统计学意义,尚不能认为不同环境下大鼠全肺湿重的方差不齐。,注意事项:,1,当,2,值仅略大于某一临界值时可计算校正,2,值,减少偏倚。计算公式为,2,Bartlett,检验法要求资料具有正态性。,二、,Levene,检验,与,Bartlett,检验法比较,,Levene,检验法在用于多样本方差齐性检验时,所分析的资料可不具有正态性。,检验统计量为,检验过程:,1.,建立假设、确定检验水准。,H,0,:(即三个总体方差相等);,H,1,:,三个总体方差不等或不全相等;,2.,计算检验统计量,W,值,3.,查,F,界值表作结论,Levene,法的计算量较大,一般借助于统计软件来完成。,第七节 数据变换,当数据为偏态或方差不齐时,有时可通过数据转换的方法改善。常用方法有对数变换、平方根变换、倒数变换、平方根反正弦变换等。,第七节 数据变换,变量变换是将原始数据做某种函数变换。其,目的是:,使各组达到方差齐性;使资料转换为正态分布,以满足方差分析和,t,检验的应用条件。,曲线拟合时曲线的直线化。,常用变换有,:,1,对数变换,(logarithmic transformation),2,平方根变换(,square root transformation,),3,平方根反正弦变换,4.,倒数变换(,reciprocal transformation,),平方根变换常用于:,使服从,Poisson,分布的计数资料或轻度偏态的资料正态化;,使方差不齐且各样本的方差与均数间呈正相关的资料达,到方差齐的要求。,当各处理标准差与其 平均数 的 平 方 成 比 例 时,可 进 行 倒 数转换;,对于一些分 布 明 显 偏 态 的 二项分布资料,,进行 的转换,,可使,x,呈良好的正态分布。,
展开阅读全文