1、Analysis of Variance,ANOVAChapter 9方差分析方差分析统计图表统计图表1 1【例例9-1】为为研研究究煤煤矿矿粉粉尘尘作作业业环环境境对对尘尘肺肺的的影影响响,将将24只只Wistar 大大鼠鼠随随机机分分到到甲甲、乙乙、丙丙三三个个组组,每每组组8只只,分分别别在在地地面面办办公公楼楼、煤煤炭炭仓仓库库和和矿矿井井下下染染尘尘,12周后测量大鼠全肺湿重(周后测量大鼠全肺湿重(g)。)。案例分析案例分析甲组甲组甲组甲组4.24.23.33.33.73.74.34.34.14.13.33.33.53.54.14.1乙组乙组乙组乙组4.54.54.44.43.53.
2、54.24.24.64.64.24.24.44.44.14.1丙组丙组丙组丙组5.65.63.63.64.54.55.15.14.94.94.74.74.84.84.44.4表表9-1 三组大鼠的全肺湿重(三组大鼠的全肺湿重(g)请思考以下问题请思考以下问题该该实实验验属属何何种种设设计计方方案案?处处理理因因素素是是什什么么?有有几几个个水水平平?观观察察指指标标是是什么什么?能能否否采采用用 t 检检验验比比较较不不同同作作业业环环境境中的大鼠全肺湿重是否有差异?中的大鼠全肺湿重是否有差异?n n对对于于小小样样本本多多组组均均数数的的比比较较不不能能采采用用t检检验进行两两比较验进行两两
3、比较n n原因:原因:割裂整体设计,只见树木,不见森林割裂整体设计,只见树木,不见森林增大一型错误的概率增大一型错误的概率n n可以采用方差分析的方法进行分析可以采用方差分析的方法进行分析第一节第一节ANOVA基本思想和应用条件基本思想和应用条件 基本概念的复习基本概念的复习n n方差:方差:n n离均差平方和(离均差平方和(sum of square,SS):):n n自由度:自由度:n n均方(均方(mean square,MS):即方差):即方差ANOVA的概念的概念 ANOVA,变异数分析,最早由英国,变异数分析,最早由英国著名统计学家著名统计学家R.A.Fisher提出,又称提出,又
4、称F检验,是推断两个或多个总体均数是检验,是推断两个或多个总体均数是否相同的统计分析方法。否相同的统计分析方法。表表9-2 三组大鼠的全肺湿重(三组大鼠的全肺湿重(g)甲组甲组甲组甲组乙组乙组乙组乙组丙组丙组丙组丙组合计合计合计合计观观观观察察察察值值值值4.24.24.54.55.65.63.33.34.44.43.63.63.73.73.53.54.54.54.34.34.24.25.15.14.14.14.64.64.94.93.33.34.24.24.74.73.53.54.14.14.84.84.14.14.44.44.34.38 88 88 82424(N N )3.81253.8
5、1254.23754.23754.68754.68754.24584.24580.16980.16980.11700.11700.34690.34690.32600.326024个观测值彼此不同总变异同一组内的观测值不同组内变异不同组间的各个观测值不同组间变异各组样本均数差异可能原因:各组样本均数差异可能原因:n n随机误差随机误差:包括抽样误差、测量误差等包括抽样误差、测量误差等 即即各各样样本本来来自自同同一一总总体体,但但由由于于随随机误差使得样本均数各不相等。机误差使得样本均数各不相等。n n处理因素处理因素 即即不不同同的的处处理理(本本例例为为不不同同的的作作业业环环境境)引引起起
6、不不同同的的作作用用或或效效果果,导导致致各处理组均数不同。各处理组均数不同。1.根据实验设计类型将总变异分解;根据实验设计类型将总变异分解;如完全随机设计:如完全随机设计:2.计算各部分的计算各部分的 和和 ;3.计算计算F值;值;4.作出统计推断。作出统计推断。方差分析的基本思路 变异分解变异分解 构造检验统计量构造检验统计量 ANOVA变异的分解变异的分解n n总变异(总变异(total variation)以完全随机设计为例以完全随机设计为例n n组间变异(组间变异(variation between groups)引起原因:引起原因:1.处理因素处理因素2.随机误差(个体差异和测量误
7、差随机误差(个体差异和测量误差)n n组内变异(组内变异(variation between groups)引起原因:引起原因:随机误差(个体差异和测量误差随机误差(个体差异和测量误差)三种变异及相应自由度的关系为三种变异及相应自由度的关系为 构造检验统计量构造检验统计量F1.组间无差异,理论上组间无差异,理论上F=12.若处理组间有差异,则若处理组间有差异,则F1。是否统计学。是否统计学 意义查方差分析界值表意义查方差分析界值表统计量统计量F 服服从从 F 分布分布 F 分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F
8、如果H0成立,F=MSTR/MSe 1各观察值相互独立(独立性)各观察值相互独立(独立性)各样本来自正态分布总体(正态性)各样本来自正态分布总体(正态性)各个样本的各个样本的总体方差齐总体方差齐(方差齐性)(方差齐性)ANOVA应用条件应用条件第二节第二节完全随机设计的完全随机设计的 ANOVA 完完 全全 随随 机机 设设 计计(completely random design)又又称称成成组组设设计计,按按随随机机化化原原则则将将受受试试对对象象随随机机分分配配到到某某一一研研究究因因素素的的多多个个水水平平中中去去,然然后后观观察察实实验验效效应应。其其目目的的都都是是推推断断不不同同水
9、水平平下下各各组组均均数数之之间间的的差差别别是是否否有有统计学意义。统计学意义。表表9-3 完全随机设计方差分析计算公式完全随机设计方差分析计算公式变异来源变异来源变异来源变异来源SSSS MSMSF F组间(处理)组间(处理)组间(处理)组间(处理)k k-1-1组内(误差)组内(误差)组内(误差)组内(误差)N N-k k总变异总变异总变异总变异N N-1-1 【检验步骤】【检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准 不等或不全相等不等或不全相等 2.计算检验统计量计算检验统计量F值值 表表9-4 方差分析结果方差分析结果变异来源变异来源SSSSMSMSF FP
10、P组间组间3.0633.0632 21.5321.5327.2507.2500.010.01组内组内4.4354.43521210.2110.211总总7.4987.4982323 3.确定确定P值,做出统计推断值,做出统计推断 查附表查附表7(F界值表)界值表),P0.01。按。按 水水准准,拒拒绝绝H0,接接受受H1,差差异异有有统统计计学学意意义义,可可认认为为不不同同粉粉尘尘环环境境影影响响大大鼠鼠的全肺湿重。的全肺湿重。第三节第三节随机区组设计的随机区组设计的 ANOVA表表9-6 39-6 3种营养素喂养小白鼠所增体重(种营养素喂养小白鼠所增体重(g g)方差分析计算表)方差分析计
11、算表区组区组区组区组A A营养素营养素营养素营养素B B营养素营养素营养素营养素C C营养素营养素营养素营养素n nj j1 162.162.163.563.573.273.23 366.26766.2672 253.253.254.154.158.158.13 355.13355.1333 371.271.267.867.878.778.73 372.56772.5674 441.341.346.646.638.938.93 342.26742.2675 550.450.456.956.964.564.53 357.26757.2676 642.542.543.143.146.646.63
12、344.06744.0677 752.652.658.758.775.175.13 362.13362.1338 849.849.856.156.165.365.33 357.06757.0679 962.662.651.051.054.654.63 356.06756.067101048.348.354.854.847.247.23 350.10050.1001010101010103030N N53.40053.40055.26055.26060.22060.22056.29356.29387.89387.89353.66053.660180.131180.131108.406108.40
13、6变异分解 SSSS总总=SSSS处理处理+SS+SS区组区组+SSSSe e检验统计量F 值 【检验步骤】【检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准 3种营养素对小白鼠体重增加作用相同种营养素对小白鼠体重增加作用相同 不等或不全相等不等或不全相等 对于处理组:对于处理组:【检验步骤】【检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准 十个区组的总体均数相等十个区组的总体均数相等 十个区组的总体均数不等或不全相等十个区组的总体均数不等或不全相等 对于区组:对于区组:【检验步骤】【检验步骤】2.计算检验统计量计算检验统计量F值值 (1)计算各项离均差平
14、方和与自由度)计算各项离均差平方和与自由度 【检验步骤】【检验步骤】2.计算检验统计量计算检验统计量F值值 (2)计算均方与)计算均方与F值值 【检验步骤】【检验步骤】2.计算检验统计量计算检验统计量F值值 (3)列方差分析表)列方差分析表 【检验步骤】【检验步骤】3.确定确定P值,做出统计推断值,做出统计推断 查附表查附表7(F界值表)界值表),P0.05。按。按 水水准,拒绝准,拒绝H0,接受,接受H1,差异有统计学意义,可,差异有统计学意义,可认为认为3种营养素对小白鼠体重增加作用不同或不种营养素对小白鼠体重增加作用不同或不全相同。全相同。(1)对处理组:)对处理组:【检验步骤】【检验步
15、骤】3.确定确定P值,做出统计推断值,做出统计推断 查附表查附表7(F界值表)界值表),P0.05),其其余余各各两两组组间间差差异异均均有有统计学意义(统计学意义(P0.05)。)。当方差分析的结果为拒绝当方差分析的结果为拒绝H0,接受,接受H1,差异有统计学意义时,可以认为三组总体差异有统计学意义时,可以认为三组总体均数不等或不全相等,即至少有两组总体均数不等或不全相等,即至少有两组总体均数不同。如果要进一步判断三组中究竟均数不同。如果要进一步判断三组中究竟哪两组总体均数有差别,不能直接用哪两组总体均数有差别,不能直接用t检验检验进行比较,需进行多个样本均数的两两比进行比较,需进行多个样本
16、均数的两两比较。较。本节介绍常用的两种:本节介绍常用的两种:SNK-q 检验和检验和LSD-t检验检验 SNK(Student-Newman-Keuls)检检验验,也也称称q检检验验,适适用用于于探探索索性性研研究究,对对任任意意两个样本均数都进行检验。检验统计量两个样本均数都进行检验。检验统计量q SNK-q 检验检验 【检验步骤】【检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准 【检验步骤】【检验步骤】2.计算检验统计量计算检验统计量 (2)计算差值的标准误:)计算差值的标准误:本例各组例数相等,故任意两组均数本例各组例数相等,故任意两组均数差值的标准误相等。差值的标准
17、误相等。(3)列表计算)列表计算q 统计量统计量 【检验步骤】【检验步骤】3.确定确定P值,做出统计推断值,做出统计推断 q界值不但考虑自由度,而且考虑组数界值不但考虑自由度,而且考虑组数a,即任,即任意两对比组包含的组数。意两对比组包含的组数。按按 水水准准,甲甲组组和和丙丙组组的的总总体体均均数数差差异异有有统统计计学学意意义义,而而甲甲组组和和乙乙组组、乙乙组组和和丙丙组组的的总总体体均数之间差异均无统计学意义。均数之间差异均无统计学意义。最最最最 小小小小 显显显显 著著著著 性性性性 差差差差 异异异异(least least significant significant diff
18、erencedifference)t t 检检检检验验验验,用用用用于于于于某某某某一一一一对对对对或或或或某某某某几几几几对对对对在在在在专专专专业业业业上上上上有有有有特特特特殊殊殊殊意意意意义义义义的的的的均均均均数数数数间间间间的的的的比比比比较较较较,如如如如多多多多个个个个处处处处理理理理组组组组与与与与对对对对照照照照组组组组的的的的比比比比较较较较,一一一一般般般般在在在在设设设设计计计计阶阶阶阶段段段段确确确确定定定定哪哪哪哪些些些些均数需进行多重比较。统计量均数需进行多重比较。统计量均数需进行多重比较。统计量均数需进行多重比较。统计量t t值。值。值。值。LSD-t检验检验
19、 【检验步骤】【检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准 【检验步骤】【检验步骤】2.计算检验统计量计算检验统计量F值值 (1)计算差值的标准误:本例各组例数相等,故)计算差值的标准误:本例各组例数相等,故任意两组均数差值的标准误相等。任意两组均数差值的标准误相等。(2)计算统计量)计算统计量LSD-t 值值 【检验步骤】【检验步骤】3.确定确定P值,做出统计推断值,做出统计推断 以以 =21查查 t 界界值值表表,按按 水水准准,除除甲甲组组和和丙丙组组的的总总体体均均数数差差异异有有统统计计学学意意义义外外,甲甲组组与与乙乙组组、乙乙组组与与丙丙组组总总体体均数之间差异均无统计学意义均数之间差异均无统计学意义。
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100