1、双因素方差分析方法双因素方差分析方法l 双因素试验的方差分析双因素试验的方差分析 在实际应用中,一个试验结果(试验指标)往往在实际应用中,一个试验结果(试验指标)往往受多个因素的影响。不仅这些因素会影响试验结果,受多个因素的影响。不仅这些因素会影响试验结果,而且这些因素的不同水平的搭配也会影响试验结果。而且这些因素的不同水平的搭配也会影响试验结果。例如:某些合金,当单独加入元素例如:某些合金,当单独加入元素A或元素或元素B时,时,性能变化不大,但当同时加入元素性能变化不大,但当同时加入元素A和和B时,合金性时,合金性能的变化就特别显著。能的变化就特别显著。统计学上把多因素不同水平搭配对试验指标
2、的统计学上把多因素不同水平搭配对试验指标的影响称为交互作用。交互作用在多因素的方差分析影响称为交互作用。交互作用在多因素的方差分析中,把它当成一个新因素来处理。中,把它当成一个新因素来处理。我们只学习两个因素的方差分析,更多因素的我们只学习两个因素的方差分析,更多因素的问题,用正交试验法比较方便。问题,用正交试验法比较方便。无交互作用的双因素试验的方差分析无交互作用的双因素试验的方差分析 数学模型数学模型 假设某个试验中,有两个可控因素在变化,因素假设某个试验中,有两个可控因素在变化,因素A有有a个水平,记作个水平,记作A1,A2,Aa;因素;因素B有有b个水平,个水平,记作记作B1,B2,.
3、Bb;则;则A与与B的不同水平组合的不同水平组合AiBj(i=1,2,a;j=1,2,b)共有)共有ab个,每个水平组个,每个水平组合称为一个处理,每个处理只作一次试验,得合称为一个处理,每个处理只作一次试验,得ab个观测个观测值值Xij,得双因素无重复实验表,得双因素无重复实验表双因素无重复(无交互作用)试验资料表双因素无重复(无交互作用)试验资料表因素因素 A因素因素 B 无交互作用的双因素试验的方差分析无交互作用的双因素试验的方差分析线性统计模型线性统计模型 基本假设(基本假设(1)相互独立;相互独立;(2),(方差齐性)。,(方差齐性)。其中其中 所有期望值的所有期望值的总平均总平均
4、水平水平Ai对试验结果的效应对试验结果的效应 水平水平Bj对试验结果的效应对试验结果的效应 试验误差试验误差 特性:特性:水平水平Ai对试验结果的效应对试验结果的效应 水平水平Bj对试验结果的效应对试验结果的效应 试验误差试验误差 要分析因素要分析因素A,B的差异对试验结果是否有显著的差异对试验结果是否有显著影响,即为检验如下假设是否成立:影响,即为检验如下假设是否成立:总离差平方和的分解定理总离差平方和的分解定理仿单因素方差分析的方法,考察总离差平方和仿单因素方差分析的方法,考察总离差平方和可分解为:可分解为:称为因素称为因素A的离差平方和,的离差平方和,反映因素反映因素 A 对试验指标的影
5、响。对试验指标的影响。称为因素称为因素B的离差平方和,的离差平方和,反映因素反映因素 B 对试验指标的影响。对试验指标的影响。称为误差平方和,反映试验误差对试验指标的影响。称为误差平方和,反映试验误差对试验指标的影响。可推得:可推得:将将 的自由度分别记作的自由度分别记作,则,则若假设若假设 成立,则:成立,则:对给定的检验水平对给定的检验水平 ,F 右侧检验右侧检验时,时,当当时,时,当当拒绝拒绝H01,即,即A 因素的影响有统计意义。因素的影响有统计意义。拒绝拒绝H02,即,即B 因素的影响有统计意义。因素的影响有统计意义。双因素(无交互作用)试验的方差分析表双因素(无交互作用)试验的方差
6、分析表方差来源方差来源因素因素A总和总和平方和平方和 自由度自由度均方和均方和F 值值F 值临介值值临介值因素因素B误差误差注意注意 各因素离差平方和的自由度为水平数减一,总平方各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一。和的自由度为试验总次数减一。双因素(无交互作用)试验的方差分析表双因素(无交互作用)试验的方差分析表简便计算式:简便计算式:其中:其中:例例1 设甲、乙、丙、丁四个工人操作机器设甲、乙、丙、丁四个工人操作机器、各一天,各一天,其产品产量如下表,问工人和机器对产品产量是否有显著其产品产量如下表,问工人和机器对产品产量是否有显著 影响?影响?工人工人
7、A机器机器 B甲甲 乙乙 丙丙 丁丁 解解 基本计算如原表基本计算如原表 结论:工人对产品的产量有显著影响,结论:工人对产品的产量有显著影响,机器对产品的产量有极显著影响。机器对产品的产量有极显著影响。例例2:某厂对生产的高速钢铣刀进行淬火工艺试验,考察回火温度:某厂对生产的高速钢铣刀进行淬火工艺试验,考察回火温度A和淬火温度和淬火温度B两个两个因素对强度的影响。今对两个因素各因素对强度的影响。今对两个因素各3个水平进行试验,得平均硬度见表:个水平进行试验,得平均硬度见表:BjAi试验结果试验结果B1(1210C)B2(1235C)B3(1250C)A1(280C)64 66 68 A2(30
8、0C)66 68 67A3(320C)65 67 68假设:不同组合水平下服从正态分布、互相独立、方差相等。假设:不同组合水平下服从正态分布、互相独立、方差相等。所需要解决的问题是:所有所需要解决的问题是:所有Xij的均值是否相等。的均值是否相等。方差分析表:方差分析表:方差来源方差来源 离差平方和离差平方和 自由度自由度 F值值 F0.05(2,4)F0.01(2,4)显著性显著性因素因素A 1.56 2 FA=1.01 6.94 18.0因素因素B 11.56 2 FB=7.46 6.94 18.0 *试验误差试验误差 3.1 4总误差总误差 16.22 8A影响不显著。影响不显著。B影响
9、显著,由于影响显著,由于高速钢洗刀的硬度越大越好,因此因素高速钢洗刀的硬度越大越好,因此因素B可取可取B3水平,即淬火温度水平,即淬火温度1250C为好,因素为好,因素A水平的确定,应考虑经济方便,取水平的确定,应考虑经济方便,取A1水平为好。水平为好。不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据 品牌品牌(因素因素A)销售地区销售地区(因素因素B)B1B2B3B4B5A1A2A3A4365345358288 350368323280 343363353298 340330343260 323333308298【例例例例3 3】有有四四个个品品牌牌的的彩彩电电在在五五个
10、个地地区区销销售售,为为分分析析彩彩电电的的品品牌牌(因因素素A A)和和销销售售地地区区(因因素素B B)对对销销售售量量是是否否有有影影响响,对对每每个个品品牌牌在在各各地地区区的的销销售售量量取取得得以以下下数数据据,见见下下表表。试试分分析析品品牌和销售地区对彩电的销售量是否有显著影响?牌和销售地区对彩电的销售量是否有显著影响?四、双因素方差分析例题1、对因素A提出的假设为H0:m1=m2=m3=m4 (品牌对销售量没有影响)H1:mi (i=1,2,4)不全相等 (品牌对销售量有影响)2、对因素B提出的假设为H0:m1=m2=m3=m4=m5 (地区对销售量没有影响)H1:mj(j=
11、1,2,5)不全相等 (地区对销售量有影响)四、双因素方差分析例题 结论:结论:结论:结论:F FA A18.1077718.10777F F 3.49033.4903,拒绝原假设,拒绝原假设H H0 0,说明彩电,说明彩电的品牌对销售量有显著影响的品牌对销售量有显著影响 F FB B2.100846 2.100846 F F 3.25923.2592,接受原假设,接受原假设H H0 0,说明销售,说明销售地区对彩电的销售量没有显著影响地区对彩电的销售量没有显著影响例例1的上机操作的上机操作对应例对应例1 的数据输入方式的数据输入方式原始数据,行因素水平,列因素水平原始数据,行因素水平,列因素
12、水平*在在 下接受,在下接受,在 下否决下否决在在 下否决下否决(A)(B)工人对产品产量有显著影响,而机器对产品产量的影响工人对产品产量有显著影响,而机器对产品产量的影响极极显著。显著。有交互作用的双因素试验的方差分析有交互作用的双因素试验的方差分析 引例引例.大豆施肥量试验大豆施肥量试验.某农场在某农场在4块面积相同的的试验田块面积相同的的试验田用不同的方式施肥用不同的方式施肥,试验结果如表试验结果如表:磷(P1)磷(P2)P1P2氮(N1)氮(N2)40043045056050130N1N2 30110160 从试验结果的数据来看从试验结果的数据来看,在没有施氮肥在没有施氮肥(N1=0)
13、和施磷肥和施磷肥4公斤公斤(P2=4)时时,大豆增产大豆增产50公斤公斤,这反映磷肥的作用这反映磷肥的作用;当没当没有施磷肥有施磷肥(P1=0)和施氮肥和施氮肥6公斤公斤(N2=6)时时,大豆增产了大豆增产了30公斤公斤,这反映了氮肥的作用这反映了氮肥的作用.当同时施磷肥当同时施磷肥4公斤氮肥公斤氮肥6公斤公斤,共增产了共增产了160公斤公斤(560-400),这一增长量不是只用氮肥和这一增长量不是只用氮肥和只用磷肥的简单相加只用磷肥的简单相加,30+50=80公斤公斤.因此因此160-80=80反映反映了施磷肥和氮肥的交互作用了施磷肥和氮肥的交互作用.磷(P1)磷(P2)P1P2氮(N1)氮
14、N2)40043045056050130N1N230110160双因素有重复(有交互作用)试验资料表双因素有重复(有交互作用)试验资料表因素因素 A因素因素 B 有交互作用的双因素试验的方差分析有交互作用的双因素试验的方差分析基本假设(基本假设(1)相互独立;相互独立;(2),(方差齐性)。,(方差齐性)。处理方法:把交互作用当成一个新因素来处理,处理方法:把交互作用当成一个新因素来处理,即把每种搭配即把每种搭配AiBj看作一个总体看作一个总体Xij。记记 所有期望值的总平均所有期望值的总平均 有交互作用的双因素试验的方差分析有交互作用的双因素试验的方差分析线性统计模型线性统计模型 其中其中
15、 所有期望值的总平均所有期望值的总平均 水平水平Ai对试验结果的效应对试验结果的效应 水平水平Bj对试验结果的效应对试验结果的效应 试验误差试验误差 交互效应交互效应 特性:特性:要判断因素要判断因素A,B及交互作用及交互作用A B对试验结果是否对试验结果是否有显著影响,即为检验如下假设是否成立:有显著影响,即为检验如下假设是否成立:总离差平方和的分解定理总离差平方和的分解定理仿单因素方差分析的方法,考察总离差平方和仿单因素方差分析的方法,考察总离差平方和可分解为:可分解为:SSA称为因素称为因素A的离差平方和,反映因素的离差平方和,反映因素 A 对试验对试验指标的影响。指标的影响。SSB称为
16、因素称为因素B的离差平方和,反映因素的离差平方和,反映因素 B 对试验指标的影响。对试验指标的影响。SSA B称为交互作用的离差平方称为交互作用的离差平方和,反映交互作用和,反映交互作用A B对试验指标的影响。对试验指标的影响。SSE称为误称为误差平方和,反映试验误差对试验指标的影响。差平方和,反映试验误差对试验指标的影响。若若“各因素、各水平及其交互作用的影响无统计意义各因素、各水平及其交互作用的影响无统计意义”的假设的假设 成立,则成立,则 则则可推得:可推得:由由 作右侧假设检验来考察各因素及因素作右侧假设检验来考察各因素及因素间的交互作用对试验指标的影响力间的交互作用对试验指标的影响力
17、双因素(有重复)试验方差分析表双因素(有重复)试验方差分析表方差来源方差来源因素因素A总和总和平方和平方和 自由度自由度均方和均方和F 值值F 值临介值值临介值因素因素B误差误差各离差平方和的计算公式参看出各离差平方和的计算公式参看出P180_181这里这里双因素有重复(有交互作用)试验资料表双因素有重复(有交互作用)试验资料表因素因素 A因素因素 B各变异来源的自由度和平方和的估计为:变异来源DFSSMS处理组合ab-1 A因素a-1 B因素b-1 AB互作(a-1)(b-1)试验误差ab(n-1)总变异abn-1例施用A1、A2、A33种肥料于B1、B2、B33种土壤,以小麦为指示作物,
18、每处理组合种3盆,得产量结果(g)如下表,试作方差分析。肥料种类(A)盆土壤种类(B)总和Ti.平均B1(油沙)B2(二合)B3(白僵)A1121.419.617.6169.218.8221.218.816.6320.116.417.5Tij.62.754.851.7A2112.013.013.3118.213.1214.213.714.0312.112.013.9Tij.38.338.741.2A3112.814.212.0122.013.6213.813.614.6313.713.314.0Tij.40.341.140.6总和T.j.141.3134.6133.5T=409.4平均15.7
19、15.014.81、自由度和平方和的分解2、F 测验将上述结果及自由度录于方差分析表中,以固定模型作F测验变异来源DFSSMSFF0.01处理8202.5825.2227.283.71肥料间2179.3889.6996.656.01土类间23.961.982.136.01 肥料土类419.244.815.184.58试验误差1816.700.928总变异26219.28例例9-2 两因素:疾病种类(两因素:疾病种类(A)与护士年龄()与护士年龄(B)a=4(心脏病、肿瘤、脑血管意外、结核病)(心脏病、肿瘤、脑血管意外、结核病)b=3(20、30、40);n=5;Yijk为访视时间为访视时间问:
20、问:(1)护士年龄的主效应?护士年龄的主效应?(2)疾病病种的主效应?疾病病种的主效应?(3)护士年龄与疾病病种间是否存在交互作护士年龄与疾病病种间是否存在交互作用?用?两因素析因分析的方差分析步骤两因素析因分析的方差分析步骤三、交互作用 实例实例实例实例2 2 2 2:白血病患儿的淋巴细胞转化率(),问:白血病患儿的淋巴细胞转化率(),问:白血病患儿的淋巴细胞转化率(),问:白血病患儿的淋巴细胞转化率(),问不同不同不同不同缓解程度缓解程度缓解程度缓解程度、不同化疗、不同化疗、不同化疗、不同化疗时期时期时期时期淋转率是否相同?淋转率是否相同?淋转率是否相同?淋转率是否相同?两者间有无两者间有无两者间有无两者间有无交互作用交互作用交互作用交互作用?例例3因素因素A(能量)(能量)因素因素 B(蛋白质)(蛋白质)输入数据时,输入数据时,C2表示行因素表示行因素水平,水平,C3表示列因素水平。表示列因素水平。第几次重复不必列明,软件第几次重复不必列明,软件自会识别。自会识别。结果显示如结果显示如P185均均0.01饲料中能量的高低、蛋白质含量的不同饲料中能量的高低、蛋白质含量的不同及两者的交互作用对鱼的体重的影响极及两者的交互作用对鱼的体重的影响极有统计意义。有统计意义。各因素,各水平,各交互作用下的均值。各因素,各水平,各交互作用下的均值。






