收藏 分销(赏)

方差分析1.ppt

上传人:xrp****65 文档编号:13338231 上传时间:2026-03-04 格式:PPT 页数:22 大小:435.50KB 下载积分:10 金币
下载 相关 举报
方差分析1.ppt_第1页
第1页 / 共22页
方差分析1.ppt_第2页
第2页 / 共22页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,严谨笃实,尚善立人,统计与应用数学学院,方差分析作为分析试验数据的一种重要工具,是数理统计的 基本方法之一.方差 分析是研究一些因素(自变量)对某个指标(因变量)的相关关系,研究哪些因素对指标的影响是显著的,哪些因素对指标的影响不显著,最终找到有力的试验条件,有时也将因素称为因子,第三章 方差分析,当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。通常方差分析简称为ANOVA(Analysis of Variance),严谨笃实,尚善立人,统计与应用数学学院,3.1单因素方差分析,3.1.1单因素方差分析模型,设指标变量为Y,因素为,A,,它可以取几个不同的水平,记为,A,1,A,a,在水平,A,i,上作若干次试验,试验结果为,y,i1,y,ini,需要考虑因素A对指标的影响是否显著.,将,A,在某个水平下的试验结果看成一个随机变量(总体),因此考虑A取不同水平时的指标有无显著差异,就是检验几个总体的均值是否相等.假定在水平,A,i,下的总体服从正态分布,他们可以有不同的均值,i,但有相同的方差,2,,需要检验假设:,不全相等,(3.1),严谨笃实,尚善立人,统计与应用数学学院,将每次试验结果,y,ij,分解为,其中,表示总的均值,,i,=,i,-,是水平A,i,对指标的效应,满足,ij,是相互独立的随机误差,服从正态分布N(0,2,).,建立方差分析模型如下:,(3.2),严谨笃实,尚善立人,统计与应用数学学院,例如两组考试成绩如下:75,70,65,90;(4人)60,70,80,90,50,70(6人),1,=(,75+70+65+90)/4=75,2,=(,60+70+80+90+50+70)/6=70,=(4*,1,+6*,2,)/10=72,n,1,=4,n,2,=6,1,=3,2,=-2,n,1,*,1,+n,2,*,2,=12-12=0,ij,如何计算?,ij,=,每人的成绩-各组的平均:,0,-5,-10,15,-10,0,10,20,-20,0,显然,ij,的均值为零,(3.2),严谨笃实,尚善立人,统计与应用数学学院,记 是水平A,i,下试验数据的均值,,3.1.2 因素效应的显著性检验,2.平方和分解公式,1.原假设与备择假设,对于模型,(3.2)提出检验如下:,是总的平均值,其中,n,i,是水平A,i,下的试验次数,,n,是总的试验次数.,可以证明下列平方和公式:,其中,严谨笃实,尚善立人,统计与应用数学学院,考虑所有试验数据对总平均 的离差平方和,证:,由于,故得证,严谨笃实,尚善立人,统计与应用数学学院,记,如果原假设H,0,成立,是,2,的无偏估计,且分别服从自由度为,a-1,n-a的卡方分布,他们彼此独立,故有,是各组均值与总平均的离差平方和,,反映了因素A的不同水平之间的差异.,反映了在相同条件下的试验误差.,是组内数据与组平均离差平方和,,3.方差分析统计量,严谨笃实,尚善立人,统计与应用数学学院,对给定的检验水平,,比较F与F,(a-1,n-a),拒绝H,0,,即认为因素A各水平效应是显著的;,接受H,0,,即认为因素A各水平效应不显著.,或者根据计算的概率p与显著水平,比较,若p 接受原假设,严谨笃实,尚善立人,统计与应用数学学院,4.单因素方差分析的Matlab实现,p=anova1(X,group),输入:X是一个向量,从第一个总体的样本到第r个总体的样本依次排列,group是与X有相同长度的向量,表示X中的元素是如何分组的.group中某元素等于,i,表示X中这个位置的数据来自第,i,个总体.因此group中分量必须取正整数,从1直到r.,p=anova1(X)%比较X中各列数据的均值是否相等,此时输出的p是零假设成立时,数据的概率,当p0.05称差异是显著的,当p0.01称,差异是高度显著,的.,输入X各列的元素相同,即各总体的样本大小相等,称为均衡数据的方差分析,不均衡时用下面的命令,严谨笃实,尚善立人,统计与应用数学学院,例3.1.某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。,表3-1 饲喂不同饲料的鱼的增(单位:10g),饲料,鱼的增重(,x,ij,),A,1,31.9,27.9,31.8,28.4,35.9,A,2,24.8,25.7,26.8,27.9,26.2,A,3,22.1,23.6,27.3,24.9,25.8,A,4,27.0,30.8,29.0,24.5,28.5,四种不同饲料对鱼的增重效果是否显著?,严谨笃实,尚善立人,统计与应用数学学院,解:这是单因素均衡数据的方差分析,Matlab程序如下:,A=31.927.931.828.435.9,24.825.726.827.926.2,22.123.627.324.925.8,27.030.829.024.528.5;%原始数据输入,B=A;,%将矩阵转置,Matlab中要求各列为不同水平,p=anova1(B),运行后得到一表一图,表是方差分析表(重要);图是各列数据的盒子图,离盒子图中心线较远的对应于较大的F值,较小的概率p.,严谨笃实,尚善立人,统计与应用数学学院,Source,方差来源,SS,平方和,df,自由度,MS均方差,F统计量,P值,Columns,(因素A组间),SS,A,r-1,SS/(r-1),7.14,0.0029,Error误差(组内),SS,E,n-r,SS/(n-r),Total,总和,SS,T,n-1,表中所列出的各项意义如下:,因为p=0.00290.01,故不同饲料对鱼的增重效果极为显著.如果没有给出概率,如何查表?,严谨笃实,尚善立人,统计与应用数学学院,四种不同饲料对鱼的增重效果极为显著,那么哪一种最好呢?请看下图,此时,第一个图对应第一种饲料且离盒子图中心线较远,效果最突出。如果从原始数据中去掉第一种饲料的试验数据,得到的结果为各种饲料之间对鱼的增重效果不显著.,严谨笃实,尚善立人,统计与应用数学学院,p=anova1(B(:,2:4),严谨笃实,尚善立人,统计与应用数学学院,例3.2 为比较同一类型的三种不同食谱的营养效果,将19支幼鼠随机分为三组,各采用三种食谱喂养.12周后测得体重,三种食谱营养效果是否有显著差异?,食谱,体重增加量,甲,164 190 203 205 206 214 228 257,乙,185 197 201 231,丙,187 212 215 220 248 265 281,解:这是单因素非均衡数据的方差分析,A=,164 190 203 205 206 214 228 257 185 197 201 231 187 212 215 220 248 265 281,;,group=ones(1,8),2*ones(1,4),3*ones(1,7);,p=anova1(A,group),严谨笃实,尚善立人,统计与应用数学学院,方差分析表,均值盒子图,由于概率p=0.1863比较大,故认为三种食料没有显著差异.,严谨笃实,尚善立人,统计与应用数学学院,3.1.3 因素各水平均值的估计与比较,从例3.1的结果可以知道四种饲料对鱼类体重增长效果有显著差异,如何进一步比较选择最优的因素水平?,1.各水平均值的估计及其置信区间,根据方差分析的要求每个因素水平Ai的数据来自正态分布,N(,i,2,),因此样本均值,标准化得到,又因为 ,所以,严谨笃实,尚善立人,统计与应用数学学院,进而根据,定理:设XN(0,1),则,因为,代入定理立得,对给定的置信水平,,可得,i,置信度为1-,的置信区间为:,严谨笃实,尚善立人,统计与应用数学学院,2.各对均值差的置信区间,根据两样本均值差构造标准正态分布,进而得到两样本的T统计量,于是,i,-,j,置信度1-的置信区间,3.多重比较的MATLAB实现,为了便于解决实际问题,我们给出多重比较的MATLAB命令。,c=multcompare(s),其中输入s,由p,c,s=anova1(b);得到,输出C共有6列,每一行给出均值差的置信区间,严谨笃实,尚善立人,统计与应用数学学院,例3.3 四个实验室试制同一型号纸张,为了比较光滑度每个实验室测量了8张纸,进行方差分析,实验室,纸张光滑度,A1,38.7,41.5,43.8,44.5,45.5,46,47.7,58,A2,39.2,39.3,39.7,41.4,41.8,42.9,43.3,45.8,A3,34,35,39,40,43,43,44,45,A4,34,34.8,34.8,35.4,37.2,37.8,41.2,42.8,解:,a=38.7,41.5,43.8,44.5,45.5,46,47.7,58,39.2,39.3,39.7,41.4,41.8,42.9,43.3,45.8,34,35,39,40,43,43,44,45,34,34.8,34.8,35.4,37.2,37.8,41.2,42.8;,%输入数据,b=a;%MATLAB只对各列进行分析,p,c,s=anova1(b);%方差分析,c=multcompare(s)%多重比较,严谨笃实,尚善立人,统计与应用数学学院,从方差分析表可知:四个实验室生产有差异,那么如何比较?软件输出c如下所示:1,2列表示比较的实验室号码,3,5 列分别为置信区间左右端点,第4 列是均值差的统计量观测值.,1.0000 2.0000 -1.4753 4.0375 9.5503,1.0000 3.0000 -0.1753 5.3375 10.8503,1.0000 4.0000 2.9497 8.4625 13.9753,2.0000 3.0000 -4.2128 1.3000 6.8128,2.0000 4.0000 -1.0878 4.4250 9.9378,3.0000 4.0000 -2.3878 3.1250 8.6378,若置信区间包含原点则无显著差异,可见只有1,4实验室有显著差异.,严谨笃实,尚善立人,统计与应用数学学院,另外,软件输出一幅图形,告知1,4有显著差异.,作业:P109,3.4,3.5,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 百科休闲 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服