1、 第五章第五章 方方 差差 分分 析析 许 碧 云v课件网址:http:/ 习 定量且服从正态性的资料:样本均数与已知总体均数的比较 单样本t检验配对资料均数的比较 配对资料的t检验两组完全随机资料均数的比较 t检验(方差齐)、t检验(方差不齐)问题的提出:例5-1 P63 假定有k个样本均数,对每两个样本均数间的差别都作t检验,可作k!/(2!(k-2)!)()次比较,每个样本均数都重复比较了k-1次,如果仍以 为临界值,其型错误的概率会远远超过0.05,因为这些比较并非都是独立的。若5个样本均数的比较采用两样本均数的t检验,需进行 =10次比较。若每次比较的检验水准=0.05,则每次不犯第
2、一类错误(推断正确)的概率为(1-0.05)=0.95,则10次检验推断正确的概率为0.9510=0.599,这时犯第一类错误的概率为 1-0.599=0.401。因此,两两比较时,不宜用前面所述的t检验。方差分析(analysis of variance,ANOVA)又称变异数分析,1918年由英国著名统计学家Fisher提出,也叫F检验。完全随机设计方差分析又称单因素方差分析(one-way ANOVA)。完全随机设计 完全随机设计(completely randomized design)指安排一种处理因素,该因素包含有k个离散的水平,即k个处理组(如:病情轻、中、重;不同的几种浓度;不
3、同的药物等),将n个观察单位随机分配到k个处理组,分别接受不同水平的处理,观察实验效应。方差分析的目的:通过分析处理组均数之间的变异,推导k个总体均数间是否相等,或k个处理之间的差别是否有统计学意义。方差分析的基本思想v将全部观察值之间的变异(总变异),根据方差可加性的特点,按设计和需要分解成两个或多个部分,每一部分变异都反映了研究工作中某种特定的内容。v总变异分解成两个或多个变异,其中有一个是由随机误差引起的,而其它变异是由各自因素引起的。v然后比较各因素变异与误差项引起的变异,评价由某种因素所引起的变异是否具有统计学意义。变异是离均差平方和(方差)为指标的由于离均差平方和与样本数目有关,因
4、此计算自由度第一节第一节 完全随机设计资料的方差分析完全随机设计资料的方差分析 变异的分解总变异(SS总)所有观察值大小参差不齐,存在变异(总变异,total variation),即个体值与总均数间的差异校正数该变异包括了二方面v随机误差(个体误差和测量误差)v 三个组处理的不同(即剂量不同)组内变异 同一水平处理组内,观测值并不完全相等,这种变异称为组内变异,用SS组内表示(variation within groups)。它实际是由抽样带来的随机误差,如个体差异,测量误差等MS组内=SS组内/(n-k)组间变异(variation between groups)四个组的均数分别为0.29
5、13,1.0200,2.1488,2.2650,不尽相同,该变异称为组间变异,用SS 组间表示。SS组间反映各组均数之间的差别,它含有:v处理效应(用药不同的影响)v随机误差效应(个体误差和测量误差)F值的意义 均方MS(mean square):由SS除以自由度而得。各种均方表示为:组间均方:组内均方:SS总=SS组间+SS组内 总=组间+组内 MS总MS组间+MS组内 F值的意义 处理效应和随 机误差效应随机误差F值越大,P值越小若k个处理均数没有差别时,MS组间与MS组内应该非常接近,这时F值应接近于1。反之,若出现MS组间比MS组内大的多时(即F值将明显大于1时),这时 k个样本均数来
6、自不同总体,即k个处理方案差别有意义。到底要多大时才有统计学意义?F值服从于自由度 的F分布。服从自由度为(组间,组内)的F分布。若 则 不拒绝H0,还不能认为各组总体均数的差别有统计学意义若 则 拒绝H0,可以认为总体均数间有差别基本思想基本思想H0:SS总SS组间SS误差MS误差MS组间F=MS组间/MS误差F较大P较小拒绝二、完全随机设计方差分析步骤:1、建立检验假设,确定检验水准 H0:,即四组IL-2水平总体均数相等 H1:不全相等,即四组IL-2水平总体均数不都相等或不全相等2、根据表5-2公式计算统计量3、确定P值并作出推断结论 查附表3.2 得 P0.01。按=0.05水准拒绝
7、H0,接受H1,可以认为四种总体均数不都相同。方差分析与t检验的异同相同点 两者要求各样本是独立的 两者要求各样本来自正态总体 两者要求总体方差齐性不同点 t检验仅用于两组资料的比较,可进行单、双侧检验;而方差分析可用于两组或两组以上的均数比较。当处理组只有两组时,以前用两组比较的t检验,这时能用方差分析吗?在随机对照为两组时,方差分析所算得统计量F与t检验所得统计量t 有如下关系:F=t2。它们所对就的P值相等。三、基于样本统计量的方差分析 若有每一组的样本含量、均数、标准差,则可以进行方差分析四、多个样本均数间的多重比较 多个样本均数间的多重比较(multiple comparison)又
8、称两两比较(pairwise comparison),是在方差分析有统计学意义基础上进一步深入的分析,故又称为基于方差分析后的后续检验(post hoc test)(一)LSD-t检验又称最小显著差法(least significant difference test,简称LSD法):v=v组内组内 最小显著差法计算的统计量是t值,其公式为:例5-3 在例5-1方差分析基础上,对不同大鼠模型的IL-2水平进行多重比较。1、建立假设检验,确定检验水准2、计算检验统计量t由于四组例数相同,故任意两比较组的标准误为2、计算检验统计量t由于四组例数相同,故任意两比较组的标准误为3、确定P值,做出推断结
9、论按v=28,查t界值表,得到P值。(二)SNK检验为Student-Newman-Keuls的缩写,又称Newman-Keuls检验q分布随自由度(V组内)和组数(a)不同而不同。a 指样本均数排序后两对比组间所包含的组数,如1组与4组比较,包含组数a=4。对例5-3资料进行SNK两两比较。vH0:任两对比组的总体均数相等,H1:将四个样本均数从小到大顺序排列,并编上组次:处理组 甲 乙 丙 丁 均数 0.2913 1.0200 2.1488 2.2650 组次 1 2 3 4v方差分析的应用条件是:各样本是相互独立的随机样本,且来自正态分布总体。各样本的总体方差相等,即方差齐性。v当数据不
10、符合上述条件时,可以通过三种不同的途径来处理:(1)变量变换法;(2)非参数方法;(3)扩展方差分析方法(Welch检验)。第二节 随机区组设计资料的方差分析 随机区组设计(randomized block design)又称配伍组设计,将处理因素分为k个水平(处理组),根据非处理因素将实验单位配成b个区组(block),每一个区组中的k个观察单位随机分配到各处理组即所谓“局部随机”。区组因素为非处理因素,是为了增强组间可比性设置的控制因素,提高实验效率。k=2为配对设计,k3为随机区组设计 例:采用随机区组设计方案,以窝作为区组标志,给断奶后的小鼠喂以三种不同的营养素A、B、和C。四周后检查
11、各种营养素组的小鼠所增体重(g)。资料列于下表第一部分。v不同区组的平均体重有一定差异,称为区组变异,是由个体差异造成的。变异的分解处理间的变异区组间的变异随机误差的变异SSSS总总=SSSS误差误差+SSSS处理处理+SSSS区组区组一、建立假设检验,确定检验水准1、处理间H0:三种不同营养素的总体平均体重相等H1:三种不同营养素的总体平均体重不全相等2、区组间H0:八个窝别的总体平均体重相等H1:八个窝别的总体平均体重不全相等=0.05 处理因素在=0.05水准上不拒绝无效假设,不同营养素对小鼠所增体重的差别无统计学意义。区组因素在=0.05水准上拒绝无效假设,故窝别对小鼠所增体重的差别具
12、有统计学意义。第三节 析因设计资料的方差分析v给药剂量与给药后时间对血药浓度的影响v不同药物在不同器官中的分布v析因设计(factorial design):多个实验因素不同水平完全交叉的多因素实验设计,不仅可以进行每个因素各个水平间的比较,还可以分析因素间的交互作用。v例5-8 P73实验组A1对照组A215min(B1)60min(B2)15min(B1)60min(B2)0.5541.0150.3370.5030.5501.0050.2760.6120.5781.0710.3130.5930.7061.1060.3870.6040.6861.1550.4310.6400.6511.145
13、0.3620.560表5-12 小鼠肝脏组织的铁浓度(mg/g)检测结果A因素B因素(药物作用时间)B1-B2(B的单独效应)15min(B1)60min(B2)附加磁场(A1)0.621(a1b1)1.083(a1b2)0.462(固定A1)不附加磁场(A2)0.351(a2b1)0.585(a2b2)0.234(固定A2)A1-A2(A的单独效应)0.270(固定B1)0.498(固定B2)0.114(交互效应)表5-13 小鼠肝脏组织铁浓度均数及A、B因素的效应分析单独效应(simple effect):指其他因素的水平固定时,同一因素不同水平间的差别。主效应(main effect):
14、某一因素各水平间的平均差别。A的主效应=(a1b1-a2b1)+(a1b2-a2b2)/2=(0.270+0.498)/2=0.384B的主效应=(a1b1-a1b2)+(a2b1-a2b2)/2=(0.462+0.234)/2=0.348A因素B因素(药物作用时间)B1-B2(B的单独效应)15min(B1)60min(B2)附加磁场(A1)0.621(a1b1)1.083(a1b2)0.462(固定A1)不附加磁场(A2)0.351(a2b1)0.585(a2b2)0.234(固定A2)A1-A2(A的单独效应)0.270(固定B1)0.498(固定B2)0.114(交互效应)表5-13
15、小鼠肝脏组织铁浓度均数及A、B因素的效应分析交互效应:某一因素的单独效应随另一因素水平的变化而变化,相互间的差别超出随机波动范围AB=(a1b1-a2b1)-(a1b2-a2b2)/2=(0.270-0.498)/2=0.114BA=(a1b1-a1b2)-(a2b1-a2b2)/2=(0.462+0.234)/2=0.348效应分解:若交互效应存在,需分别分析各因素的单独效应;若交互效应不存在,则可以认为两个因素间相互独立,分析某一因素的作用只需考察该因素的主效应(1)建立检验假设并确定检验水准:一、假设附加磁场与不附加磁场的铁浓度总体均数相等二、假设不同药物作用时间的铁浓度总体均数相等三、
16、是否附加磁场对药物作用时间长短的铁浓度无影响,即假设AB两因素无交互作用=0.05。变异来源SSvMSFP附加磁场(A)0.883210.8832252.340.01作用时间(B)0.727310.7273207.800.01AB0.077810.077822.230.01误差0.0707200.0035总变异1.759023表5-15 小鼠肝脏组织铁含量22析因试验方差分析表A因素、B因素的主效应、两因素的交互效应均有统计学意义。附加磁场对小鼠肝脏组织铁含量有影响,附加磁场可使小鼠肝脏组织铁含量增高;药物作用时间对小鼠肝脏组织铁含量有影响,药物作用时间长,小鼠肝脏组织铁含量高;A、B两因素间
17、交互效应反映随药物作用时间的延长,是否附加磁场对小鼠肝脏组织铁含量的影响是不同的,即药物作用时间长,附加磁场组小鼠肝脏组织铁含量增加幅度更大。A因素B因素(药物作用时间)B1-B2(B的单独效应)15min(B1)60min(B2)附加磁场(A1)0.621(a1b1)1.083(a1b2)0.462(固定A1)不附加磁场(A2)0.351(a2b1)0.585(a2b2)0.234(固定A2)A1-A2(A的单独效应)0.270(固定B1)0.498(固定B2)0.114(交互效应)v当交互作用有统计学意义时,可采用两样本比较的t检验进行单独效应的分析。v标准误应采用基于方差分析的整体标准误
18、,即以方差分析误差项的均方计算标准误,以误差自由度查表-基于“整体标准误”的单独效应分析第四节 重复测量资料的方差分析v重复测量资料:对同一实验单位的某项观测指标接受同一处理后,至少在3个及以上时点或部位等进行多次测量所得到的数据。如,对病人治疗(或手术)后一天、三天、一周、二周等多个时间点进行连续观察v重复测量数据具有相关性,不满足一般方差分析数据独立性的要求v重复测量方差分析(repeated measures ANOVA)要求各时点间满足球对称(sphericity)的假设v若不满足,采用校正(epsilon correction),调整方差分析中重复测量因素主效应和重复测量因素与其处理
19、因素交互效应的自由度例5-9 P78变异分解:SS总=SS观察单位间+SS观察单位内 =(SS处理+SS观察单位误差)+SS观察单位内 =(SS处理+SS观察单位误差)+(SS时间+SS处理时间+SS重复测量误差)SS总=SS组间+SS组内 =(SS处理+SS时间+SS处理时间)+(SS观察单位误差+SS重复测量误差)SS总总SS观察单位误差SS处理SS时间SS处理时间SS重复测量误差SS观察单位间观察单位间SS观察单位内观察单位内SS组内组内SS组内组内SS组间组间图图5-2 重复测量方差分析变异分解图示重复测量方差分析变异分解图示H0:不同灌注部位氧分压的总体均数相同H1:不同灌注部位氧分
20、压的总体均数不同H0:不同时间氧分压的总体均数相同H1:不同时间氧分压的总体均数不同H0:两因素间无交互效应H1:两因素间有交互效应=0.05表表5-17 灌注前后灌注前后Mauchly球对称检验结果球对称检验结果不满足球对称不满足球对称校正校正表表5-19 观察单位间效应的方差分析表观察单位间效应的方差分析表(1)灌注部位灌注部位个体误差个体误差灌注部位间差别有统计学意义灌注部位间差别有统计学意义表表5-20 观察单位内效应的方差分析观察单位内效应的方差分析(2)不同灌注时间的差不同灌注时间的差别具有统计学意义别具有统计学意义灌注部位与时间之间存在交互效应灌注部位与时间之间存在交互效应设计类
21、型设计类型平方和划分平方和划分完全随机设计完全随机设计SS组间组间+SS组内组内随机区组设计随机区组设计 SS处理处理+SS区组区组+SS误差误差两因素析因设计两因素析因设计SSA+SSB+SSAB+SS误差误差重复测量设计重复测量设计SS处理处理+SS观察单位误差观察单位误差+SS时间时间+SS处理处理时间+SS重复测量误差重复测量误差表表 方差分析的变异分解方差分析的变异分解多个样本均数比较多个样本均数比较方差齐性检验方差齐性检验变量变换变量变换其他方法其他方法不齐不齐齐齐根据设计类型选用合适的方差分析方法根据设计类型选用合适的方差分析方法差别无统计学意义差别无统计学意义有差别应行多重比较有差别应行多重比较LSD法法Bonferroni法法SNK法法