收藏 分销(赏)

卫生统计学-方差分析.ppt

上传人:精*** 文档编号:12679781 上传时间:2025-11-24 格式:PPT 页数:81 大小:815.50KB 下载积分:18 金币
下载 相关 举报
卫生统计学-方差分析.ppt_第1页
第1页 / 共81页
卫生统计学-方差分析.ppt_第2页
第2页 / 共81页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,例,8-1,某大学营养与食品卫生研究所将,800,只条件一致的雌性果蝇随机分配到,4,种不同浓度的某受试物培养基组,各组,200,只。经,2,至,3,月的培养试验,得各组寿命最高的,10,只果蝇的生存天数如下,试比较各最高寿命组的平均生存天数。,浓度 生存天数 合计,0,:,61 63 64 64 65 65 66 66 68 68 650,0.022,:62 63 64 64 65 66 67 69 70 70 660,0.067,:63 64 64 65 67 68 68 69 70 70 668,0.600,:65 66 66 67 68 68 70 72 74 76 692,表,8-1,某受试物不同浓度组最高寿命果蝇的生存天数,:,i,组第,j,个数据,:,i,组的样本均数,g,:处理组数,:,全部数据的样本均数,:,i,个处理组的例数,各组样本均数各不相等,可能由两种原因引起:,随机误差(抽样误差、测量误差等);,处理因素,即不同的处理引起不同的作用或效果。,方差分析的原假设,H,0,为各组的总体均数相等。若,H,0,成立,则组间变异和组内变异均只反映随机误差,此时理论上,,F,=1,。反之,若各样本不是来自同一总体(处理因素有效应),则组间变异不仅反映随机误差,还包括处理因素的效应,此时组间均方应明显大于组内均方,即,,F,1,。,根据,F,分布的分布规律,通过查,F,界值表,由,P,值作出统计推断。,拒绝,H,0,,接受,H,1,,可认为各总体均数不等或不全相等;反之,则差别无统计学意义,尚不能认为各总体均数不等或不全相等。,完全随机设计,方差分析的基本思想,:,将全部测量值总的离均差(总变异)平方和分解为处理组间(组间变异)平方和与组内(误差)平方和两部分,将总变异的自由度分解为组间变异自由度与组内变异自由度两部分。用各平方和除以各自的自由度,分别得到组间均方、误差均方。用组间均方除以误差均方得,F,值。根据,F,分布的规律推论处理因素的作用。,二、方差分析的应用条件,理论上要求数据满足以下两个条件:,(,1,)各样本相互独立,均服从正态分布;,(,2,)各样本的总体方差相等,即具有方差齐性,(homogeneity of variance),。,第 二 节,完全随机设计多组均数,比较的方差分析,分 析 步 骤,1.,建立检验假设、确定检验水准,H,0,:,1,=,2,=,3,=,4,H,1,:,各,i,不全等或全不等,0.05,2.,计算各自由度,、均方,MS,及,F,值,平方和的计算,:,399.50,96.30,303.20,总,=N-1=39,组间,=g-1=3,总,=N-g=36,3.,查表确定,P,值、下结论,查附表(方差分析用),F,界值表(,P322,单侧),:,3.81,P F,c 3 362.9 121.0 1.68 0.1896,Error 36 2599.4 72.2053,Sum of,Source DF Squares Mean Square F Value Pr F,Model 3 96.3000000 32.1000000 3.81 0.0180,Error 36 303.2000000 8.4222222,Corrected 39 399.5000000,Total,Comparisons significant at the 0.05 level are indicated by*.,Difference Simultaneous,c Between 95%Confidence,Comparison Means Limits,4 -1 4.200 1.017 7.383 *,3 -1 1.800 -1.383 4.983,2 -1 1.000 -2.183 4.183,第三节随机区组设计多个样本均数,比较的方差分析,随机区组设计,(randomized block design),将条件一致的试验对象编入同一区组,再随机分配到各个处理组。,一、实 例 及 符 号,例,8-2.,为研究氯化镉,CdCl,2,对细胞的毒性作用,分别以,V79(,中国仓鼠肺成纤维细胞,),、,WI38,(人肺细胞株)、,L929,(小鼠成纤维细胞,),、,CHO,(中国仓鼠卵巢成纤维细胞,),、,SHE,(叙利亚地鼠胚胎细胞株),5,种不同细胞作为,5,个区组,以,3,种不同的染毒时间作为,3,个处理组,观察细胞的克隆率,资料如表,8-3,。试比较不同染毒时间组的细胞克隆率。,n:,区组个数,g,:处理组个数,:j,区组内第,i,处理组的数据,:,j,区组全部数据的和,:,第,j,区组的样本均数,SS,总,=SS,处理,SS,区组,SS,误差,总,=,处理,+,区组,误差,二、分 析 步 骤,各区组样本均数间的变异,由随机误差及,各区组总体均数可能不同所引起。区组间变异,的大小用区组间平方和表示。,=0.0897/4=0.0224,=0.0068/8=0.0009,F=0.0094/0.0009=10.44,3.,查表查表确定,P,值、下结论,data,li8_2;do a=,1,to,3,;,do b=,1,to,5,;,input x;output;end;end;,cards;,0.880 0.823 0.763 0.711 0.669,0.823 0.790 0.748 0.701 0.643,0.774 0.765 0.707 0.670 0.505,;,proc,anova,;class a b;model x=a b;,means a b/snk;,run,;,Means with the same letter are not significantly different.,SNK Grouping Mean N b,A 0.82567 3 1,A,B A 0.79267 3 2,B,B C 0.73933 3 3,C,C 0.69400 3 4,D 0.60567 3 5,第四节 多个样本均数的两两比较,多重比较,(1),在研究设计阶段未预先考虑到是否进行均数的两两比较,但经假设检验得出多个总体均数不全相等的提示后,才决定进行多个均数的两两事后比较,这类研究多属于探索性研究。可采用,SNK-,q,检验、,Bonfferoni,t,检验等。,(2),在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较,常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较;某一对或某几对在专业上有特殊意义的均数间的比较等,可采用,Dunnett-,t,检验、,LSD-,t,检验、,Bonfferoni,t,检验等。,一、,SNK-,q,检验,计算差值的标准误:,列表计算,q,统计量:,确定,P,值,做出统计推断,二、,LSD-,t,检验,LSD-,t,检验即最小显著性差异,(least significant difference),t,检验,适用于某一对或某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段确定哪些均数需进行多重比较。,1,建立检验假设,确定检验水准,第五节 析因设计的方差分析 一、析因分析的基本概念,1.,单独效应:单独效应是指其它因素水平固定,同一因素不同水平间指标平均值的差别。如表,8-8,中,,B,因素固定在,1,水平时,A,因素,1,水平的指标平均值为,24,,,B,因素固定在,1,水平时,A,因素,2,水平的指标平均值为,28,,则得,B,因素固定在,1,水平时,A,因素的单独效应为,28,24,4,。,2.,主效应:主效应是指某因素各单独效应的 平均值。,A,因素的主效应(,4,8)/2=6,(,%,),B,因素的主效应(,20,24)/2=22,(,%,),3.,交互效应:某因素的各单独效应随另一因素变化而变化时,称两因素间存在交互作用。因素,A,的各单独效应随因素,B,的水平变化而变化的大小称交互效应,记作,AB,或,BA,。,AB,BA,(a2b2-a1b2)-(a2b1-a1b1)/2,=(24-20)/2=2,(,%,),二、变异分解,三、析因设计方差分析的基本步骤,data,li8_4;do a=,1,to,2,;,do b=,1,to,2,;do f=,1,to,5,;,input x;y=x/,100,;output;,end;end;end;,cards;,10 10 40 50 10,30 30 70 60 30,10 20 30 50 30,50 50 70 60 30,;,proc,anova,;class a b;model y=a b;,run,;,The ANOVA Procedure,Dependent Variable:y,Sum of,Source DF Squares Mean Square F Value Pr F,Model 2 0.26000000 0.13000000 4.59 0.0256,Error 17 0.48200000 0.02835294,Corrected Total 19 0.74200000,R-Square Coeff Var Root MSE y Mean,0.350404 45.50900 0.168383 0.370000,Source DF Anova SS Mean Square F Value Pr F,a 1 0.01800000 0.01800000 0.63 0.4366,b 1 0.24200000 0.24200000 8.54 0.0095,三因素析因设计举例,用,522,析因设计研究,5,种类型的军装在两种环境、两种活动状态下的散热效果,观察指标是从,“,冷,”,到,“,热,”,按等级评分,每种处理重复实验,5,次。试作方差分析。,data,b3ys;,do a=,1,to,5,;,do b=,1,to,2,;,do c=,1,to,2,;,do i=,1,to,5,;,input x;output;,end;end;end;end;,cards;,0.25-0.25 1.25-0.75 0.40 4.75 3.45 4.00 4.85 4.55 /*a1b1c1,、,c2,5*/,0.50 2.10 2.75 1.00 2.35 3.75 4.00 4.00 4.25 4.60 /*a1b2c1,、,c2,5,*/,0.30 0.10 0.50-0.35 0.05 4.60 4.80 4.00 5.20 4.30 /*a2b1c1,、,c2,5,*/,1.50 1.50 1.25 1.37 2.55 4.00 4.05 4.15 4.10 4.25 /*a2b2c1,、,c2,5*/,0.75 -0.50 0.60 0.40-0.20 4.55 3.50 4.25 4.10 4.40 /*a3b1c1,、,c2,5*/,0.75 2.65 3.00 0.05 1.17 4.10 5.00 4.20 4.15 4.175 /*a3b2c1,、,c2,5*/,0.20 -1.00 0.85-0.50 0.90 4.25 3.10 4.00 5.00 4.20 /*a4b1c1,、,c2,5*/,-0.75 0.90 0.95 0.625 1.05 3.275 4.25 4.00 4.25 4.25 /*a4b2c1,、,c2,5*/,-0.10 0.00 2.50 0.10-0.10 4.725 4.30 4.10 4.80 3.60 /*a5b1c1,、,c2,5*/,1.75 2.40 1.75 3.05 2.75 4.80 4.02 4.15 4.75 4.80 /*a5b2c1,、,c2,5*/,;,proc,anova,;class a b c;,model x=a b c a*b a*c b*c a*b*c;,run,;,The ANOVA Procedure,Dependent Variable:x,Sum of,Source DF Squares Mean Square F Value Pr F,Model 19 316.2058040 16.6424107 38.72 F,a 4 5.2089865 1.3022466 3.03 0.0222,b 1 9.9288010 9.9288010 23.10 .0001,c 1 283.3498890 283.3498890 659.25 .0001,a*b 4 1.9412715 0.4853179 1.13 0.3488,a*c 4 1.4795085 0.3698771 0.86 0.4914,b*c 1 12.6878440 12.6878440 29.52 F,Model 5 141.0000000 28.2000000 11.28 0.0834,Error 2 5.0000000 2.5000000,Corrected Total 7 146.0000000,R-Square Coeff Var Root MSE x Mean,0.965753 1.747115 1.581139 90.50000,Source DF Anova SS Mean Square F Value Pr F,a 1 8.00000000 8.00000000 3.20 0.2155,b 1 18.00000000 18.00000000 7.20 0.1153,c 1 60.50000000 60.50000000 24.20 0.0389,d 1 4.50000000 4.50000000 1.80 0.3118,a*b 1 50.00000000 50.00000000 20.00 0.0465,第六节 重复测量资料的方差分析,一、重复测量资料的数据特征,重复测量资料(,repeated measurement data,)是指同一观查对象被给予某种处理后,在不同时间点上对某指标进行多次测量所得的资料;有时是指从同一观查对象不同部位(或组织)上重复测得某指标的资料。,(,一)重复测量资料的类型,1.,单因素重复测量设计资料,例,8-5.,从,6,名健康人抽血后制成血滤液。每个受试者的血滤液分成,4,份,把,4,份血滤液随机分别放置,0,、,45,、,90,、,135,分钟,测定其血糖浓度如表,8-10,。,2.,两因素重复测量设计资料,例,8-6.,为比较两种同类药物,A,、,B,在体内的代谢速度,将,10,名受试对象随机分为两组,一组给予,A,药,另一组给予,B,药。分别在服药后,1,、,2,、,4,、,6,小时测定血中的药物浓度,结果见表,8-11,。,(二)重复测量设计与随机区组设计的区别,1.,重复测量设计中,各观察对象各时间点是固定的,同一观察对象依次接受各时间点的测量。两因素重复测量设计中,处理(如例,8-6,中的药物因素)是在观察对象间随机分配,不能在各时间点随机分配。在随机区组设计中,各区组内有多个条件一致的观察对象,每个观察对象随机分配给一种处理。,2.,随机区组设计中,各区组内各处理水平相互独立,各区组内各观察对象所得数据相互独立。重复测量设计中各区组内的数据重复测自同一观察对象,他们之间往往有较高的相关性。,3.,为了有效地处理重复测量资料间的相关性,须使用特定模型的多元方法。如对单因素重复测量设计资料,必须满足,“,球对称,”,(,sphericity,)的假设条件,方可采用完全随机设计方差分析,否则会增大,型错误的概率。,二、重复测量资料的变异平方和及自由度分解,()单因素重复测量设计资料,(二)两因素重复测量设计资料,三、重复测量设计资料的方差分析,()单因素重复测量设计资料,对例,8-5,的资料,进行,SAS,编程:,data,li8_5;,input grp time1-time4;,cards;,1 5.27 5.27 4.94 4.61,1 5.31 5.26 4.93 4.70,1 5.88 5.83 5.38 5.01,1 5.49 5.43 5.32 5.04,1 5.66 5.44 5.38 4.88,1 6.22 5.72 5.61 5.22,;,proc,glm,;/*,调用一般线性模型*,/,class grp;,model time1-time4=grp /*,将,time1-time4,按一,整体作反应变量*,/,/nouni;/*,不把,time1-time4,作,4,个独立变量*,/,repeated time,4 /*,重复测量因素的变量名为,time,,水平为,4*/,/printe;/*,作球性检验*,/,run,;,The GLM Procedure,Repeated Measures Analysis of Variance,Sphericity Tests,Mauchlys,Variables DF Criterion Chi-Square Pr ChiSq,Transformed Variates 5 0.3067417 4.3987332 0.4935,Orthogonal Components 5 0.4347452 3.1005928 0.6845,The GLM Procedure,Repeated Measures Analysis of Variance,Univariate Tests of Hypotheses for Within Subject Effects,Adj Pr F,Source DF Type III SS Mean Square F Value Pr F G-G H-F,time 3 1.81443333 0.60481111 47.00 .0001 .0001 ChiSq,Transformed Variates 5 0.1418387 13.128934 0.0222,Orthogonal Components 5 0.2451614 9.4503599 0.0924,The GLM Procedure,Repeated Measures Analysis of Variance,Tests of Hypotheses for Between Subjects Effects,Source DF Type III SS Mean Square F Value Pr F,g 1 794.5048225 794.5048225 19.32 0.0023,Error 8 328.9996800 41.1249600,The GLM Procedure,Repeated Measures Analysis of Variance,Univariate Tests of Hypotheses for Within Subject Effects,Adj Pr F,Source DF Type III SS Mean Square F Value Pr F G-G H-F,t 3 22209.52731 7403.17577 46.04 .0001 .0001 .0001,t*g 3 654.25557 218.08519 1.36 0.2799 0.2859 0.2838,Error(t)24 3859.28040 160.80335,思考题,1.t,检验与方差分析的异同点,?,相同点:,计量资料,单因素研究,实验设计:,完全随机,配对与区组,条件:,正态,方差齐性,不同点:,水平数,检验方法,多组比较不能两两,t,检验,2.,完全随机设计方差分析与随机区组设计方差分析的异同点,?,相同点:,计量资料,单因素研究,多水平,方差分析,修正数,总平方和、组间平方和及其自由度计算,不同点:,实验设计,平方和、自由度的分解,区组因素,组内平方和,区组、误差平方和,检验效能,3,、从,8,名健康人中抽血并制成血滤液。每人的血滤液分成,4,份,再随机地把,4,份血滤液分别放置,0,,,45,,,90,,,135,分钟,测定其血糖浓度如下表,试分析放置不同时间的平均血糖浓度是否不同。,随机区组设计方差分析,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服