资源描述
西南民族大学经济学院 统计学 毛瑞华一、相关一、相关术语(1)试验指指标:把不同条件下所做的把不同条件下所做的试验的的结果果,用用X表示表示;(2)试验因素因素:影响影响试验结果的各种条件果的各种条件,用用A、B、C表示表示;(3)固定效固定效应模型模型:人人为确定确定试验条件下的条件下的试验模型模型;随机效随机效应模型模型:随机确定随机确定试验条件下的条件下的试验模型。模型。(4)试验水平或水平或处理理:每一每一试验条件在所条件在所处的状的状态,或,或对试验条件所条件所给定的定的值。用。用A1,A2,Ar和和B1,B2,Bs表示表示;(4)单因素方差分析、两因素方差分析和多因素方差因素方差分析、两因素方差分析和多因素方差分析。分析。西南民族大学经济学院 统计学 毛瑞华例例11.1 国民国民计算机公司在国内三个不同地区生算机公司在国内三个不同地区生产打印机,打印机,为了解每个地区生了解每个地区生产分厂的分厂的员工的工的质量意量意识,从各个生从各个生产厂中分厂中分别6名名员工工进行行质量知量知识考核考核,得到一得到一组数据数据资料料,如下表如下表:678285675697156974764627382364757525971851分厂分厂3分厂分厂2 分厂分厂1 分厂分厂观察观察试验条件试验条件(试验因素试验因素):生产分厂生产分厂试验水平试验水平:3试验指标试验指标:质量考核得分质量考核得分单因素试验单因素试验:生产地点生产地点西南民族大学经济学院 统计学 毛瑞华例例11.2 一企一企业为推推销某种某种产品在五个不同地区建品在五个不同地区建立了立了销售点售点,统计的四个的四个时期的期的销售量售量资料如下表料如下表:试验因素试验因素:地区和时期地区和时期试验水平试验水平:地区水平地区水平5个个,时期水平时期水平4个个试验指标试验指标:销售量销售量两因素试验两因素试验:地区和时期地区和时期4 5水平的方差分析水平的方差分析 地点地点时期时期B1B2B3B4B5A162448A210711912A3139787A421223问问:该企业在不同地区和该企业在不同地区和不同时期的销售量情况不同时期的销售量情况是否存在显著的差异?是否存在显著的差异?西南民族大学经济学院 统计学 毛瑞华二、方差分析的假定条件二、方差分析的假定条件(1)各因素水平的各因素水平的观察察值Xij是随机是随机变量量,可分解可分解为 Xij=j+ij,i=1,2,n,j=1,2,r 其中其中E(Xij)=j,n 为试验次数次数,r为因素水平数。因素水平数。(2)ijN(0,2),且相互独立且相互独立;在上述条件下,方差分析的数据模型在上述条件下,方差分析的数据模型为 XijN(i,2)西南民族大学经济学院 统计学 毛瑞华(1)在某一因素水平下的在某一因素水平下的试验数据数据,由于由于试验条件基本条件基本相同相同,因而数据因而数据间的差异可看成是随机的差异可看成是随机误差引起的差引起的;(2)在不同因素水平下的在不同因素水平下的试验数据数据,由于由于试验条件的改条件的改变,其差异可看成是因其差异可看成是因试验条件不同而引起的条件不同而引起的;每个因素每个因素j水平下的水平下的观察察值可当作来自于因素可当作来自于因素j水平水平的的总体的一个体的一个样本本,因此因此应该有一个均有一个均值 j;各因素影响是否显著问题转化为各因素影响是否显著问题转化为 检验检验 1=2=r 是否成立是否成立,其中其中随机随机误差差可分成可分成 各因素水平下的数据的各因素水平下的数据的误差差-组内内误差差(w2),(Sw2),不同条件影响的数据的不同条件影响的数据的误差差-组间误差差(b2),(Sb2).三、方差分析的基本思想三、方差分析的基本思想西南民族大学经济学院 统计学 毛瑞华 如果如果试验因素水平的因素水平的变化化对试验指指标的影响不的影响不大大,则Sw2和和Sb2结应该比比较接近接近,其比其比值应该趋近于近于1,反之反之,则Sb2明明显大于大于Sw2,其比其比值应该大于大于1.四、方差分析的一般提法四、方差分析的一般提法 设因素有因素有r个水平,每一个水平的均个水平,每一个水平的均值分分别用用 1,2,r 表示,要表示,要检验 r个水平的均个水平的均值是否相等,是否相等,可提出如下假可提出如下假设:H0:1=2=r(水平水平变化化对指指标没有没有显著影响著影响)H1:1,2,r不全相等不全相等(水平水平变化化对指指标有有显著影著影响响)西南民族大学经济学院 统计学 毛瑞华 10.2 10.2 单因素方差分析单因素方差分析 分析中只涉及到一个因素分析中只涉及到一个因素,对该因素在不同水平因素在不同水平下的下的试验结果果进行分析行分析,判断判断试验因素是否因素是否对试验结果果产生生显著的影响。著的影响。一、等重复的一、等重复的单因素方差分析因素方差分析1.单因素等重复因素等重复试验方差分析的一般性提法方差分析的一般性提法 假假设试验中只有一个因素中只有一个因素A,共做了共做了A1,A2,Ar个水平的个水平的观察察,每个水平每个水平Ai满足足AiN(i,2),其中其中 i,2 均是未知量。均是未知量。为检验H0:1=2=r 是否成立是否成立,对每个水平均做每个水平均做n次独立次独立试验,共得到,共得到n r个数据。个数据。西南民族大学经济学院 统计学 毛瑞华 因素因素 指标指标样品样品因素水平因素水平A1A2Ar1X11X12X1r2X21X22X2r nXn1Xn2Xnr数据结构模型为数据结构模型为Xij=j+ij,ij N(0,2),i=1,2,n j=1,2,r其中其中 ij相互独立相互独立,j、2为各总体为各总体Aj 的未知参数。的未知参数。表表11.3 单因素等重复试验数据结构单因素等重复试验数据结构西南民族大学经济学院 统计学 毛瑞华(2)全体总体的样本观平均值为全体总体的样本观平均值为2.总离差平方和的分解总离差平方和的分解(1)设从第设从第j个总体中随机抽取容量为个总体中随机抽取容量为n的样本的样本,则第则第j个总体的样本均值为个总体的样本均值为:全体样本的离差为全体样本的离差为(3)总离差平方和的分解总离差平方和的分解西南民族大学经济学院 统计学 毛瑞华令令当当H0成立成立时,有有则可构造检验统计量则可构造检验统计量F:西南民族大学经济学院 统计学 毛瑞华表表11.4 方差分析表方差分析表方差来源方差来源 平方和平方和SS 自由度自由度df 均方均方MS F P值值 F crit.组间组间组内组内Sb2Sw2r-1r(n-1)MSBMSWF1-总计总计ST2nr-1F1-P值值F西南民族大学经济学院 统计学 毛瑞华例例11.3 根据例根据例11.1的数据的数据检验不同生不同生产厂厂员工的工的质量量意意识是否存在判是否存在判别?方差来源方差来源SSdf 均方均方MS FP值值F crit.组间组间组内组内51643021525828.679 0.00273.682总计总计946 17FF1-或或PF1-或或PF1-或或PF1-(3,12),FBF0.95=4.49,FBF0.95=4.49,应该拒拒绝H0A,H0B,即不同即不同时间和路段的行和路段的行车时间之之间有有显著差异著差异;(2)FABF0.95=4.49,应该接受接受H0AB,即即时间和路段的和路段的 交互作用交互作用对行行车时间没有没有显著影响。著影响。西南民族大学经济学院 统计学 毛瑞华P294例例11.7 GMAT是商学院用来考核申是商学院用来考核申请攻攻读硕士学位士学位学生学学生学习能力的一种能力的一种标准化考准化考试,录取参考分数一般在取参考分数一般在200800分之分之间,考分越高表明学生的学考分越高表明学生的学习能力越能力越强。根据。根据过去的去的经验,参加参加GMAT考考试的学生的学生,多数来自于商学院、多数来自于商学院、工学院和社会技工学院和社会技术学院。某考前学院。某考前辅导机构机构为使自己的考使自己的考前前辅导更有更有针对性性,也是也是为了了对考生考生负责,决定决定进行一次行一次试验。首先从商学院、工学院和社会技。首先从商学院、工学院和社会技术学院各抽取两学院各抽取两名学生名学生,让他他们参加不同授参加不同授课方式的培方式的培训,授授课方式主要方式主要包括三种形式包括三种形式:3小小时复复习、1天天课程程强化和化和10周学周学习班。班。现在的在的问题是来自于不同背景的学生,参加不同授是来自于不同背景的学生,参加不同授课方方式式,对他他们最最终得分是否有影响。得分是否有影响。经过培培训后的后的测试资料料如下表。如下表。试根据根据这组资料料,在在显著性水平著性水平0.05下下检验假假设假假设:H0:原来的学原来的学习背景和培背景和培训方式方式对学生的考分没有影响学生的考分没有影响.西南民族大学经济学院 统计学 毛瑞华原来的学习背景原来的学习背景商学院商学院 工学院工学院社会技术学院社会技术学院培培训训方方式式3小时学习小时学习5005404805804604001天强化天强化46056042054062048010周学习周学习560600480600580410西南民族大学经济学院 统计学 毛瑞华解解:两因素三水平的两因素三水平的试验问题,每个因素的搭配各做每个因素的搭配各做了两次了两次观察察,属于等重复的方差分析属于等重复的方差分析问题。提出假提出假设:H0A:培培训方式方式对考分影响不考分影响不显著著;H1A:培培训方式方式对考分影响考分影响显著著;H0B:原来的背景原来的背景对考分影响不考分影响不显著著;H1B:原来的背景原来的背景对考分影响考分影响显著著;H0AB:培培训方式与原来背景方式与原来背景对考分影响不考分影响不显著著;H1AB:培培训方式与原来背景方式与原来背景对考分影响不考分影响不显著著;西南民族大学经济学院 统计学 毛瑞华误差来源误差来源SSdfMSF值值P值值F crit.方式因素方式因素6100230501.3830.2994.26背景因素背景因素4530022265010.270.0054.26交互作用交互作用11200428001.2700.3503.63误差误差1985092205.57总和总和8245017时间和路段的等重复双因素方差分析表时间和路段的等重复双因素方差分析表(1)FAF0.95=4.26,应该拒拒绝H0B,即不同背景即不同背景对考分有考分有显著影响著影响;(2)FABF0.95=3.36,应该接受接受H0AB,即不同培即不同培训方式和背方式和背景的交互作用景的交互作用对考分没有考分没有显著影响。著影响。
展开阅读全文