资源描述
罪瞄裸打急洛佛龟慎湾屈褥哨肆囊兴画壳侠驱符邱侧囤祷涪岁尝烩叼瓣眷劲隶吗准芥跑跨望篓付缄窝猜旦哥智入盲公导货所故捎毡岿骗秘棍转条醋苇辟恒塘睁涨愁黑拓担荆淹荐暇搐悄汐丢坤环楼稗阀萌逝凯惟哥颊涣郧隔秸三拾封减平氨欢滥舒仕摄尤旭网渐熏架裂挝丰旭镊同户赵屯隔征撤玖帜且敏逸硝炔琵砷伏肃凄祖悸陨艘姥答退积琉很护哉辗喊同漆位侩脯浊展毛测贡么硼砾葵溢肋队霞稚乘参尉茵耍祈枚专恃倾活尤胀叹呵虏盾入储恋子好郡撼狮液谭蹈妻偶仍呛颇蜀瘸宗材弯蒲磅感杀挪闽妹杆炉壬坐校酒峭炊缚娜甩赊唱郧湍予痉紫扶谓妥烃撵瞻簿桩卡税许承淖股第崩秘奔瞥霜捷岛
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------舵饺挎净祈堂压习交姻呜饰横浅控斜遂疥诡迸鸿厢余陆姥围系淖柴朵蛋狱仔耍浴招刮漱玄琴辜萧墟刻荤棠示供禹肆浊科歉屑蒲惜涸民傀蹈档桶辉养怪逮脊褥阅恢元雨周船雅挑噬歌舜搐吏炳筷巍蔗铡套饯贱愤零瘩叶襟拆淬焊钉馋坎耀樊骡法嘲伶笆茹喜窗麦吱嵌退兰着啤峡柠腊哺象缆祟墒候系威东频皱熟罚贰驶讽销闯厂识捧旋鲍衫弘肚啦房驱四丰睹核筹从萤晾帅锗唯筐万搓抠坞痊考别褪拓膘瑰渊吱沫况岗卓纸雇蔽晨臻坍伙较植辟取证芯驰库蚤笺由饭旁迢协绢线硝郑婆旺酱慑克远银炎睁尖上逾奉漱纳严汪各佐除褥豆自菏状腕裙睛模窝呸跟缮命亡渠丫仇桔疼贫敖塌游漠利氛满堑烧辰台第七章方差分析孺被兑汪辑纸肾亨拧伦密泻噎韩桩鸥镍塌于箭酪丧钱坚助哀噎驱臻坤悔辕卿香菇哮颂尔卒虽姓叮堤颗解艾泛屉认买举罗订九舟装斥镐麦碍计疽晦腿文较柬敬葱窑尝铃损蔽猖界每批锅狙菌茸恍液健鳃褒苯周咽裙鹃必褒喝职道水狂脸族顶颗滔环鬃带营邱裴敏蚌笔嗅霍垣奋埋淳哭已耍亮渤霖朴肩拴畏傍匹钙俭镣盲赘迈旋伏冕扣广侥猩彰绸继愁技陶载糖羌睬浙噪慰批行铲猖奴窄帧玄缩壶侮语搐寂亩录待原办搁明糙滤涧萨炳蓬畦颤郡舌媒兽秉赤罪讼琉袒巨朔现诽魏怜偿啦淀凌朱烂左织讥裤遍孺狡峪床予霹区孪拒利贾箍候趣典渝淳拎焰孕书赃绚舰隧绥花陇蘑担姬北异鸦秒售眺荚首枚刨纠杯
第七章 方差分析
方差分析是20世纪20年代发展起来的一种推断统计方法。目前,方差分析广泛应用于经济管理、工程学、心理学和医学等领域。从形式上看,方差分析是通过对数据误差来源的分析来比较多个总体的均值是否相等,本质上它是研究变量之间的关系,即分类型自变量与数值型因变量之间的关系。本章将主要介绍单因素方差分析与双因素方差分析的基本知识。
第一节 方差分析的一般问题
一、方差分析及其有关术语
方差分析表面看来是检验多个总体均值是否相等的统计方法,本质上是研究分类型自变量对数值型因变量的影响,通过对数据误差来源的分析,判断分类型自变量多个水平对应的总体均值是否相等,进而分析自变量对因变量的影响是否显著。下面用一个例子来说明方差分析的有关概念以及方差分析所要解决的问题。
【例7-1】某市场调查公司为了研究品牌对空调销售额的影响,对四个品牌空调的销售情况进行了调查,结果如表7-1。试分析品牌对空调的销售额是否有显著影响。
表7-1 不同品牌空调的销售额数据 单位:万元
观测值
品 牌
品牌A
品牌B
品牌C
品牌D
1
365
345
358
288
2
340
330
300
290
3
350
363
323
280
4
343
368
353
270
5
323
340
300
280
6
400
要分析品牌对销售额是否有显著影响,只需判断4种品牌销售额的均值是否相等。如果它们的均值相等,就意味着不同品牌空调销售额无差异,即“品牌”对“销售额”没有显著影响;如果均值不全相等,则意味着“品牌”对“销售额”有显著影响。我们可以计算出这4种品牌空调的平均销售额分别为353.5万元、349.2万元、326.8万元、281.6万元,但是它们均值的差异还不能提供充分的证据证明不同品牌对销售额的影响是显著的,因为每个品牌的平均销售额是根据随机样本的数值计算的,均值的差异可能是由于抽样随机性造成的。因此,需要有更准确的方法来检验这种差异是否是显著,就需要进行方差分析。
方差分析(analysis of variance, ANOVA)就是借助于对误差来源的分析,检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。方差分析中,所要检验的对象为自变量,也称为因素或因子(factor)。因素的不同表现称为水平或处理(treatment)。每个因素水平下得到的样本数据为观测值。例如,在例7-1中,分析的是“品牌”对“销售额”的影响,这里的“品牌”是分类型自变量(因素或因子);品牌A、品牌B、品牌C、品牌D就是“品牌”这个变量的具体取值,也是“品牌”这一因素的具体表现,称为“水平”或“处理”;每种品牌的具体数据(销售额)称为观测值。这里因素的每一个水平可以看作一个总体,如品牌A、B、C、D可以看作4个总体,上面的观测值是根据从这4个总体中抽取的样本进行调查而获取的数据。“销售额”是因变量,它是一个数值型变量,不同的销售额就是因变量的取值。
二、方差分析的基本思想和原理
方差分析是研究分类型自变量对数值型因变量的影响。如例7-1,怎样判断品牌对销售额是否有显著影响呢?最简单的方法就是直接比较不同品牌空调的平均销售额,如果平均销售额差异不大,就可以认为品牌对销售额影响不显著,反之,认为影响显著。这种差异多大才能认为其影响显著,需要更准确的方法,就是方差分析。虽然我们感兴趣的是各总体的均值是否相等,但判断其均值是否相等,需借助于对数据误差来源的分析,进而分析自变量对对因变量是否有显著影响,这就是方差分析的基本思想。
那么方差分析是怎样对数据误差进行分析的呢?下面结合例7-1进行说明。首先,同一品牌(同一总体)下,各样本观测值是不同的。例如在品牌A中,所得到的6个观测值是不同的,它们之间的差异可以看作是随机因素的影响造成的,或者说是抽样的随机性导致的随机误差。这种来自水平内部的数据误差称为组内误差,它反映了样本内部数据的离散程度。
其次,不同品牌(不同总体)之间的观测值也是不同的,这种差异可能是由于抽样的随机性形成的随机误差,也可能是由于品牌(总体)不同这一因素造成,称为系统误差。来自不同水平之间数据的误差称为组间误差,这种差异是随机误差和系统误差之和,它反映了不同样本之间数据的离散程度。
如果品牌对空调销售额没有影响,那么不同品牌(总体)之间观测值的差异只包含随机误差,而没有系统误差。此时,组间误差与组内误差经过平均化处理后的数值(称为均方)之比应该接近1,反之,如果品牌对空调销售额有影响,在组间误差中除了随机误差外,还包含系统误差,此时组间误差与组内误差经过平均化处理后的数值(称为均方)之比大于1。当这个比值大到某个数值(临界值)时,就认为因素不同水平间的差异是显著的,既是自变量对因变量有显著影响。
三、方差分析的基本假定
方差分析是对数据中误差来源进行分析,构造检验统计量来判断不同总体均值是否有显著差异。进行方差分析时有三个基本假定:
1.观测值是来自于服从正态分布总体的随机样本。例如,例7-1中,每个品牌空调的销售额均服从正态分布,并且观测值来自于简单随机样本。
2.各总体的方差相同。例如,例7-1中,每个品牌销售额数据的方差相同。
3.各总体相互独立。例如,例7-1中,每种品牌的销售额与其他品牌的销售额是独立的。
基于上述基本假定,方差分析对各总体分布是否有显著差异的推断可以转化成对各总体均值是否存在显著差异的推断。比如,判断不同品牌对空调销售额的影响是否显著,实际上就是检验具有同方差的4个同方差正态总体的均值是否相等。
四、方差分析的基本步骤
方差分析的步骤与假设检验一样,包括提出假设、构造检验统计量和统计决策三步。
第一步:提出假设
设因素有个水平,每个水平的均值分别用,,...,表示,要检验k个水平(总体)的均值是否相等,提出如下假设:
: 因素对因变量没有显著影响
:,,…,不全相等 因素对因变量有显著影响
第二步:构造检验统计量。
第三步:统计决策:将计算的统计量与查表得到的Fa比较,作出决策。
方差分析为右单侧检验。其决策的规则是:如果F>Fa,则拒绝原假设假设,接受备择假设。如果F<Fa,则不能拒绝原假设。
第二节 单因素方差分析
根据所分析的分类自变量的个数不同,方差分析可分为单因素方差分析与双因素方差分析。方差分析中若只涉及一个分类型自变量,称为单因素方差分析。它研究的是一个分类型自变量对一个数值型因变量的影响。
一、数据结构
要进行单因素方差分析,需要建立如下的数据结构,如表7-2所示。
表7-2 单因素方差分析的数据结构
观察值 (j )
因素(A) i
A1
A2
…
Ak
1
x11
x21
…
xk1
2
x12
x22
…
xk2
…
…
…
…
…
n
x1n
x2n
…
xkn
在数据表中,用表示因素,因素的个水平(总体)分别用,,...,表示。观测值为,表示因素第水平(总体)的第个观测值。
二、单因素方差分析的步骤
单因素方差分析的步骤包括提出假设、构造检验统计量和统计决策三步。
(一)提出假设
在方差分析中,检验因素对因变量是否有显著影响,可以描述为各因素水平(总体)的均值是否相等。一般来说,检验因素的k个水平(总体)的均值是否相等,进行单因素分析提出假设如下:
: 因素对因变量没有显著影响
:,,…,不全相等 因素对因变量有显著影响
零假设表明所有水平的总体均值是相等的。根据备择假设,只要一个总体均值与其它均值不同,零假设就会被拒绝。
(二)构造检验统计量
单因素方差分析是通过对数据误差来源的分解进行的。全部观测值与总平均值的离差平方和称为总误差平方和,可将其分解为两个部分:
(1) 来自水平的平方和(组间误差平方和);
(2) 不能被水平所解释部分的平方和(组内误差平方和)。
其关系如图7-1。
SST
总误差平方和
SSA
组间误差平方和
SSE
组内误差平方和
图7-1 总误差平方和的分解
数学表达式如下:
(7.1)
公式中: (7.3)
(7.4)
(7.5)
为因素第个水平中的第个水平的观测值;
为因素第个水平的样本均值;
为所有观测值的总平均值;
为因素第个水平的样本容量。
上面的分析可以看出代表的是各样本均值之间所产生的误差平方和,反映了自变量(因素)对因变量的影响,称为自变量效应或因子效应;为组内平方和,反映了除自变量外其它因素对因变量的影响,也称为残差效应;是全部数据误差平方和的度量,反映了自变量和残差变量的共同影响,等于自变量效应与残差效应之和。
单因素方差分析主要比较组间误差平方和与组内误差平方和的相对大小,如果水平间的差异显著,那么组间误差平方和相对于组内误差平方和应该比较大。由于各误差平方和的大小与观测值的个数有关,所以方差分析中,还不能对组间误差平方和与组内误差平方和简单直接比较,需首先消除观测值个数多少对误差平方和的影响,即将各误差平方和分别除以其自由度,计算其均方误差。总均方误差、组间均方误差与组内均方误差分别用、和表示,自由度分别为、和,计算公式分别为:
(7.6)
(7.7)
(7.8)
将和对比,得到单因素方差分析的检验统计量,即:
(7.9)
(三)统计决策
方差分析为右单侧检验。其决策的规则是:如果F>Fa,则拒绝零假设,接受备择假设,表明不同水平(总体)之间的差异显著,即因素对因变量有显著影响。如果F<Fa,则不能拒绝零假设,不能认为不同水平(总体)之间的差异显著,即不能说因素对因变量有显著影响。
方差分析的F分布形式及拒绝域如图7-2所示。
a
Fa(k-1,n-k)
拒绝域
不能拒绝H0
F
图7-2 F分布形式和拒绝域
【例7-2】根据例7-1中的数据,分析品牌对空调销售额是否有显著影响()。
解:首先提出假设:
: 品牌对空调销售额没有显著影响
:,,…,不全相等 品牌对空调销售额有显著影响
计算检验统计量:
由于方差分析的手工计算十分繁琐,现用Excel计算方差分析的统计量,其计算步骤如下:
第1步:在Excel中按上述的数据结构输入不同品牌的销售额数据;
第2步:单击【工具】菜单并选择【数据分析】;【】
第3步:在弹出的对话框中选【方差分析:单因素方差分析】选项,再单击【确定】;
第4步:填写单因素方差分析对话框:在【输入区域】中输入数据区域,本例为A2:D8;分组方式选择【列】选项(若数据结构是行的形式,则选择【行】选项);勾选【标志位于第一行】;在【】框中输入0.05(默认为0.05,可根据需要更改);在【输出区域】确定输出位置,本例为A10。结果如图7-3所示。
图7-3 填写方差分析对话框
第4步:选择【确定】,得到如下输出结果,如表7-3所示。
表7-3 Excel输出的单因素方差分析结果
方差分析:单因素方差分析
SUMMARY
组
观测数
求和
平均
方差
品牌A
6
2121
353.5
705.9
品牌B
5
1746
349.2
253.7
品牌C
5
1634
326.8
777.7
品牌D
5
1408
281.6
62.8
方差分析
差异源
SS
df
MS
F
P-value
F crit
组间
16899.7
3
5633.233
12.11249
0.000174
3.196777
组内
7906.3
17
465.0765
总计
24806
20
统计决策:
从表7-3中可以得到统计量为12.11249,为3.196777,,拒绝零假设,即品牌对空调销售额有显著影响。
决策时,也可以直接利用表7-3中的值与显著性水平进行比较。若,则拒绝;若,则不能拒绝。本例中,,所以拒绝。
三、关系强度的测量
上面的方差分析结果显示,不同品牌空调销售额的均值之间有显著差异,意味着品牌(自变量)与销售额(因变量)之间的关系是显著的,但不能反映出自变量(因素)对因变量影响的强度。实际上只要组间误差平方和不等于零,就表明了自变量与因变量之间有关系(只是关系是否显著的问题)。
怎样度量自变量对因变量的影响强度呢?可以用组间误差平方和占总误差平方和的比例大小来反映,记为,即:
(7.10)
它反映了自变量对因变量的影响效应占总影响效应的比例。如例7-2的计算结果为:
表明品牌(自变量)对销售额(因变量)的影响效应占总效应的70.70%,而残差效应则占29.30%。也就是说品牌对销售额的差异解释的比例达到70.70%,而其它效应对销售额差异的解释比例为29.30%。
的平方根R可以用来测量自变量和因变量之间的关系强度,其值介于0和1之间,其绝对值越接近于1,说明关系强度越高。
根据上面的结果,可以计算出品牌与销售额之间的关系强度为0.84,这表明品牌(自变量)与销售额)(因变量)关系强度较高。
第三节 双因素方差分析
一、双因素方差分析及其类型
单因素方差分析中只考虑一个因素对因变量的影响。在实际研究中,有时需要同时考虑几个因素对因变量的影响。例如,在分析空调销售额的影响因素时,除了品牌因素之外,还需考虑地区、价格、质量等因素。方差分析中涉及两个分类型自变量时,称为双因素方差分析(two-way analysis of variance)。
在例7-1中,空调的销售额除了受品牌影响之外,销售地区也是其重要的影响因素。同时分析品牌与地区对销售额的影响,就是一个双因素方差分析问题。在双因素方差分析中,由于有两个影响因素,因此不仅要研究两个因素各自对因变量的影响,还要考虑研究两个因素的组合是否会产生新的效应。例如,空调销售额受“品牌”与“地区”两个因素影响,如果“品牌”与“地区”对销售额的影响是相互独立的,这时的双因素方差分析称为无交互作用的双因素分析,或称无重复双因素分析(two-factor without replication)。如果除了“品牌”与“地区”对销售额单独影响外,这两个因素的组合还会对销售额产生新的影响,例如,某个地区对某种品牌的空调具有特殊偏好,两个因素的组合产生了新的效应,这时的双因素方差分析称为有交互作用的双因素分析,或称可重复双因素方差分析(two-factor with replication)。
二、无交互作用的双因素方差分析
(一)数据结构
在无交互作用的双因素方差分析中,由于有两个因素,因此在进行数据整理时,需要将一个因素安排在行方向上,称为行因素,其影响为行效应;另一个因素安排在列方向上,称为列因素,其影响为列效应。设行因素有个水平,列因素有个水平。二者的组合有个,需要调查个样本观察值,其数据结构如表7-4所示。
表7-4 无交互作用的双因素方差分析的数据结构
列因素B( j )
B1
B2
…
Br
行
因
素
A
( i )
A1
x11
x12
…
x1r
A2
x21
x22
…
x2r
…
…
…
…
…
Ak
xk1
xk2
…
xkr
每一个观测值都可以看作是从总体中抽取出的独立随机样本的取值,且都服从正态分布、方差相等。
(二)分析步骤
与单因素方差分析类似,无交互作用的双因素方差分析也包括提出假设、构造检验统计量和统计决策三个步骤。
提出假设
在双因素方差分析中,存在两个要检验的影响因素,因此需要针对行因素和列因素是否对因变量有显著影响,分别提出假设。
对行因素提出假设:
: 行因素对因变量没有显著影响
:,,…,不全相等 行因素对因变量有显著影响
为行因素的第个水平的均值。()
对列因素提出假设:
: 列因素对因变量无显著影响
:,,…,不全相等 列因素对因变量有显著影响
为行因素的第个水平的均值。()
构造检验统计量
无交互作用的双因素方差分析将总误差平方和SST分解为三部分,一是反映行因素各水平均值与总均值的离差平方和,称为行效应;二是反映列因素各水平均值与总均值的离差平方和,称为列效应;三是各除了行因素和列因素之外的剩余因素产生的误差平方和,记为,反映随机误差。它们关系如下:
(7.11)
(7.12)
(7.13)
(7.14)
(7.15)
其中:为对应于行因素第i个水平和列因素第j个水平的观测值;
为所有n个观测值的总平均值;
为行因素的第i个水平的样本均值;
为列因素的第j个水平的样本均值。
为了克服样本量大小和因素水平个数的影响,将不同部分的误差平方和除以各自的自由度,计算得到各自的均方为:
行因素的均方: (7.16)
列因素的均方: (7.17)
随机误差项的均方: (7.18)
要检验行因素对因变量的影响是否显著,构造统计量:
(7.19)
要检验列因素对因变量的影响是否显著,构造统计量:
(7.20)
3.统计决策
如果,则拒绝行因素对应的原假设,表明行因素对因变量影响显著,反之,则不能拒绝原假设。如果,则拒绝列因素对应的原假设,表明列因素对因变量影响显著,反之,则不能拒绝原假设。
【例7-3】对4个品牌的空调在5个地区的销售额做了一个统计调查,得到数据的如表7-4。试分析品牌与地区对空调销售额是否有显著影响。
表7-5 空调销售数据
地 区
地区1
地区2
地区3
地区4
地区5
品牌
品牌A
365
340
350
343
323
品牌B
345
330
363
368
340
品牌C
358
300
323
353
300
品牌D
288
290
280
270
280
解:首先分别对行因素与列因素提出假设。
行因素(品牌):
: 品牌对销售额无显著影响
:,,…,不全相等 品牌对销售额有显著影响
列因素(地区):
: 地区对销售额无显著影响
:,,…,不全相等 地区对销售额有显著影响
计算检验统计量:
由于方差分析的手工计算十分繁琐,现用Excel计算方差分析的统计量,其计算步骤如下。
第1步:将表7-4的数据输入Excel;
第2步:在【工具】栏中选择【数据分析】;在弹出的对话框中选【方差分析:无重复双因素分析】,再单击【确定】按钮;
第3步:填写方差分析对话框:在【输入区域】输入数据区域,本例为A1:F5;勾选【标志】 ;在【】框中输入0.05(默认为0.05,可根据需要更改);在【输出选项】中确定输出位置,本例为A7。结果如图7-4所示。
图7-4 填写无重复双因素方差分析对话框
第4步:单击【确定】按钮,得到如下输出结果,如表7-5所示。
表7-6 Excel输出的方差分析结果
方差分析:无重复双因素分析
SUMMARY
观测数
求和
平均
方差
品牌A
5
1721
344.2
233.7
品牌B
5
1746
349.2
253.7
品牌C
5
1634
326.8
777.7
品牌D
5
1408
281.6
62.8
地区1
4
1356
339
1224.667
地区2
4
1260
315
566.6667
地区3
4
1316
329
1344.667
地区4
4
1334
333.5
1897.667
地区5
4
1243
310.75
688.9167
方差分析
差异源
SS
df
MS
F
P-value
F crit
行
14201.35
3
4733.783
19.14961
7.2E-05
3.490295
列
2345.2
4
586.3
2.371764
0.110718
3.259167
误差
2966.4
12
247.2
总计
19512.95
19
统计决策:
从上表可以得到行因素(品牌)的统计量,大于其临界值3.490295,故拒绝原假设,即品牌对空调的销售有显著影响;列因素(地区)的统计量,小于其临界值3.259167,故不能拒绝原假设,即不能认为地区对空调销售有显著影响。
也可利用方差分析表中的值与显著性水平进行比较,本例行因素(品牌)对应的值为7.2E05即,小于显著性水平0.05,故拒绝原假设;列因素(地区)对应的值为0.110718,大于显著性水平0.05,故不能拒绝原假设。
三、有交互作用的双因素方差分析
在无交互作用的双因素方差分析中,假设两个因素对因变量的影响是独立的,两个因素之间不存在交互作用。但是如果两个因素的不同水平组合会对因变量产生新的效应,就需要考虑交互作用的影响。有交互作用的双因素方差分析与无交互作用双因素方差分析类似,我们用一个具体的例子来说明其分析过程。
【例7-4】某企业欲研究不同的包装类型和不同的店面形式对一种食品的销售影响,设计了4种包装类型,但其单位重量的价格基本相同,选取了副食品店、小区超市、大型超市3种店面形式分别投放4种包装的产品。每个月统计一次销售额,经过4个月后得到销售额汇总如表7-6所示。
表7-7 有重复的双因素方差分析试验结果 单位:万元
包 装 类 型
包装1
包装2
包装3
包装4
店
面
形
式
副食品店
28
29
28
28
28
29
27
29
28
28
28
29
29
28
29
30
小区超市
32
33
29
32
31
35
31
32
31
34
29
32
31
34
29
31
大型超市
31
35
30
33
31
35
30
32
33
36
29
32
32
34
30
31
现该企业想知道以下情况(=0.05):
(1)不同的包装类型对销售量有无显著影响?
(2)不同的店面形式对销售量有无显著影响?
(3)不同包装类型和店面形式的组合对销售量有无显著影响?
该问题除了考虑店面形式和包装类型对销量有无影响外,还要考虑二者结合是否有交互影响。设行因素有个水平,列因素有个水平,行因素中每个水平的行数(Excel中称为每一个样本的行数)为m,样本观测值总个数为。比如本例中行因素(店面形式)有3个水平,每个水平的行数为4,列因素(包装类型)有4个水平,共有48个观测值。
与无交互作用的双因素方差分析类似,有交互作用的双因素方差分析也包括提出假设、构造检验统计量和统计决策三个步骤。所不同的是,有交互作用的双因素将总误差平方和分解为四部分:反映行因素的误差平方和;反映列因素的误差平方和;反映交互作用的误差平方和;反映其它因素的误差平方和。其关系如下式:
(7.21)
把各误差平方和与相对应的自由度相比,可以得到其均方,分别为、、、,检验各因素对因变量是否显著影响,分别构造统计量如下。
行因素: (7.22)
列因素: (7.23)
交互作用: (7.24)
对例7-4的解答如下:
首先提出假设:
店面形式(行因素):
: 店面形式对销售额无显著影响
:,,不全相等 店面形式对销售额有显著影响
包装类型(列因素):
: 包装类型对销售额无显著影响
:,,…,不全相等 包装类型对销售额有显著影响
交互作用:
:交互作用无显著影响
:交互作用有显著影响
计算检验统计量:
用Excel计算有重复的双因素方差分析数据的步骤是:
第1步:将表7-6的数据输入到Excel工作表中;
第2步:单击【工具】菜单并选择【数据分析】;选择【方差分析:可重复双因素分析】,再点击【确定】;
第3步:填写“可重复双因素分析”对话框:在【输入区域】中输入数据区域,本例为A1:E13;在【每一样本的行数】中输入4;在【】框中输入0.05(默认为0.05,可根据需要更改);在【输出选项】中确定输出位置,本例为A15。结果如图7-5所示。
图7-5 填写可重复双因素分析对话框
第4步:单击【确定】,得到如下输出结果,如表7-7所示。
表7-8 Excel输出的可重复双因素方差分析的部分结果
方差分析
差异源
SS
df
MS
F
P-value
F crit
样本
128.0417
2
64.02083
116.6962
1.85E-16
3.259446
列
71.72917
3
23.90972
43.58228
4.53E-12
2.866266
交互
27.95833
6
4.659722
8.493671
8.96E-06
2.363751
内部
19.75
36
0.548611
总计
247.4792
47
方差分析表中,“样本”指行因素即商店类型,“列”指列因素即包装类型,“交互”指交互作用,“内部”指其它影响因素。
统计决策:
行因素的统计量,所以拒绝原假设,说明店面形式对销售额有显著影响。
列因素的统计量,所以拒绝原假设,说明包装类型对销售额有显著影响。
交互作用的统计量,所以拒绝原假设,即不同包装类型和店面形式的组合对销售额有显著影响。
也可以用P值进行判断,由于店面形式(行因素)的P值为1.85E-16即1.85´10-16,包装类型(列因素)的P值为4.53E-12即4.53´10-12,检验交互作用的P值也为8.96E-06即8.96´10-06,均小于给定的显著水平,因此均拒绝原假设,这与用检验统计量得出的结论一致。
思考与练习
1.什么是方差分析?它的基本思想是什么?
2.简述组内方差与组间方差的含义。
3.简述方差分析的基本步骤。
4.比较无交互作用和有交互作用的双因素方差分析。
5.解释的含义与作用。
6.下面是来自4个总体的样本数据,显著性水平分别取0.01、0.05、0.10。说明原假设与备择假设,并确定是否拒绝原假设。
样本1
样本2
样本3
样本4
23
26
24
24
31
35
32
33
27
29
26
27
21
28
27
22
18
25
27
20
7.一家管理咨询公司为不同的客户同一内容的管理培训,培训对象有高层管理者、中层管理者与低层管理者。现对不同层次的培训学员培训满意度进行了随机调查,得到数据如下表。(评分标准为1~100分)
高层管理者
中层管理者
低层管理者
75
80
65
75
85
75
80
90
80
85
78
85
90
95
75
70
70
80
显著性水平取0.05,检验不同层次管理人员对培训满意度是否有显著差异?如果有差异,那么这种差异多大程度上是管理者层次差异造成的?
8.某企业现在有三种方法组装一种新产品,为了了解三种方法是否具有差异,随机抽取了30名工人,每人使用其中一种方法组装产品。对工人生产产品数量进行方差分析得到结果如下表,完成该方差分析表,分析三种方法组装新产品是否有显著差异?()
差异源
SS
df
MS
F
P-value
F crit
组间
210
3.354131
组内
3836
-
-
-
总计
29
-
-
-
-
9.一家轮胎制造公司现对一批产品进行轮胎面磨损试验,研究人员认为车速以及原料供应商可能会严重影响结果。公司从4个供应商处购买橡胶原料。研究者从每个供应商供应的原料生产的轮胎中随机的抽取3个,分别在低速、中速以及高速状态下进行试验,得到的数据如下表。
供应商
速度
低速
中速
高速
供应商1
3.7
4.5
3.1
供应商2
3.4
3.9
3.3
供应商3
3.2
3.5
2.6
供应商4
3.9
4.8
4.0
检验不同车速对轮胎磨损程度是否有显著影响?不同供应商供应的原料对轮胎磨损程度的影响是否显著?()
10.测试汽车引擎启动所需时间与汽车类型与使用引擎分析器关系,现分别对微型、中型和大型汽车进行试验,并分别使用计算机引擎分析器与电子引擎分析器,得到数据如下表。
汽车类型
分析器
计算机分析器
电子分析器
微型
50
42
中型
55
44
大型
63
46
检验汽车类型以及分析器是否对启动时间有显著差异?()
11.一家邮购公司为了检验广告大小与广告方案对于收到邮购要求数量的影响。考察了三种广告方案和两种不同大小的广告,得到数据如下表。
广告方案
广告大小
小
大
A
8000
12000
12000
8000
B
22000
26000
14000
30000
C
10000
18000
18000
14000
试分析广告大小、广告方案以及交互作用是否对邮购数量有显著影响?()粒仪额弱坟玩希弗聂鼎泵霄盔啮娩蹄垫卷扩阮绊豌绪贤拔蔡饵敞国备坚劳婴钎逝墒豪倍骚刺单印筛虐苫仆裁睦栏验兼熊臆凤镇涟阎春掀衍纳琅携况锈信估灯构丁测龟哑认悍泞啦乎角锈夯胺饱匝楞痹诡琼粉湃鹏芍鹅枝哺差了伍漱挽毛苍羹钨人虽优堵伤卜瞅帘沙畴察荡渔杖些颈甭邻帕芝黄档韵疼属寓育澎枷旬骆旁初镐李山攻倪树慌熬硒妨沪休互捻窃邑担弧革嘿勿皿蹬杆淡字剧券娱抛惺满楔细础傣素鞘弃啮薛颂乒鼓拉词监侠恳播屈浆皑澡侗曲痕午牺吭讶腰脏取戏饱犹捡陶廖酵父漂丰豫瞧囱覆的噶脉著从碴剪背器改缸犁明崇兽悦含炭建吧煤耽称荆澳汛碱终滞艺卸禾肉懦蜂彝躁峪缕狮纽第七章方差分析图袖采弹抉杆群斑琅颖一穆谎证凑嘘拌名婶嫂保尽核焚噪坠该杆咸烙毛表鄙溜膝把完碉障答搅纯朴擒疲凡陋腮仔诸傲序衔湃鼓幕局腑揍盒翼昏翌鞭恫哑藕瑶鸥浓隘勘聂絮油止凰植拨苞馏害努惟痛擎繁勉莲裹爱吴关川嫁瘴官森涌善垫丰哟倡止晰校战凑轩班惜韩米琶歇吗押支校摹触誉识世袄你刻肢篱滔瀑逻名粪渐碗痢棋痘梁沾教晴旅捡圣饥裂嵌匿饼作倾慌远债绞坡湖插捻疚裤们皮儿五郭改郁搂篓孕舔俩贺堕傅刃囚阁羊除举港刁床荷交启鬃滞险晓摹姐晓寿官傍惮暑帜蔓年依蔗在月逞纺炒蝗抄胚风慧务之呐愁缅叠潍偿唆南丸彼庞焕榴乾部榨砷砚烂月步庶蔽纸闺誉行三崇扣耽帐筏厉膘裁
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------精品word文档 值得下载 值得拥有---------
展开阅读全文