1、 根据以往经验,一般胃溃疡病患者有根据以往经验,一般胃溃疡病患者有20%发发生胃出血症状。现某医生观察生胃出血症状。现某医生观察65岁以上胃溃疡病岁以上胃溃疡病人人152例,其中例,其中48例发生胃出血,占例发生胃出血,占31.6%。问老年胃溃疡病患者是否较一般胃溃疡病患者易问老年胃溃疡病患者是否较一般胃溃疡病患者易发生胃出血。发生胃出血。率的抽样误差率的抽样误差 率的率的z z检验检验 应用条件:应用条件:当样本含量当样本含量n n足够大,且样本率足够大,且样本率p p和和(1(1p p)均不太小,均不太小,如如npnp 与与 n n(1(1p p)均均5 5时时 一、样本率与总体率比较的一
2、、样本率与总体率比较的z z检验检验 根据以往经验,一般胃溃疡病患者有根据以往经验,一般胃溃疡病患者有20%20%发生发生胃出血症状。现某医生观察胃出血症状。现某医生观察6565岁以上胃溃疡病人岁以上胃溃疡病人152152例,其中例,其中4848例发生胃出血,占例发生胃出血,占31.6%31.6%。问老年。问老年胃溃疡病患者是否较一般胃溃疡病患者易发生胃胃溃疡病患者是否较一般胃溃疡病患者易发生胃出血。出血。(1 1)建立检验假设)建立检验假设 H0:=H0:=oo H1:0 H1:0(2 2)计算)计算z z值值 (3 3)确定)确定P P值,作出推断结论值,作出推断结论 P0.01 P0.0
3、1 拒绝拒绝HoHo二、两样本率比较的二、两样本率比较的u u检验检验 (1 1)建立检验假设)建立检验假设 H0:H0:1 1=2 2 H1:H1:1 12 2 (2 2)计算)计算z z值值 (3 3)确定)确定P P 值,作出推断结论值,作出推断结论 P0.05 P0.05 拒绝拒绝H0H0方差分析方差分析方差分析(方差分析(Analysis of Variance ANOVA)由英国统计学家由英国统计学家R.A.Fisher提出。提出。Ronald Aylmer Fisher(1890-1962)出)出生于英国伦敦,在剑桥大学生于英国伦敦,在剑桥大学攻读数学和物攻读数学和物理理。他早年
4、居无定所。他早年居无定所在一家投资公司在一家投资公司任过职,在加拿大的一个农场工作过,在任过职,在加拿大的一个农场工作过,在英国的公立学校教过书。英国的公立学校教过书。他对生物测定学产生了兴趣,而这一兴趣令他在他对生物测定学产生了兴趣,而这一兴趣令他在1919年加入了位于英国洛桑的一个世界著名的农业试验场。年加入了位于英国洛桑的一个世界著名的农业试验场。在那里,他负责对有关田间试验和天气记录的在那里,他负责对有关田间试验和天气记录的66年累积年累积数据进行分类和再评估数据进行分类和再评估在这个过程中,他成为了那个在这个过程中,他成为了那个世纪的主导统计学家之一。早期他发表了开创新纪元的世纪的主
5、导统计学家之一。早期他发表了开创新纪元的Statistics Methods for Research Workers(1925)(研究人员的统计方法研究人员的统计方法),该书后,该书后来被翻译成来被翻译成各种语言再版了各种语言再版了14次次,并成为世界各地研究,并成为世界各地研究者的者的“圣经圣经”。其后,其后,The Genetical Theory of Natural Selection(1930)(自然选择的遗传理论自然选择的遗传理论)一本把达一本把达尔文的进化论和孟德尔的遗传学融合到一起的书,以及尔文的进化论和孟德尔的遗传学融合到一起的书,以及The Design Experime
6、nts(1935)(实验设计实验设计);这些书籍奠定了这些书籍奠定了Fisher作为一个一流统计学家和一流遗传学作为一个一流统计学家和一流遗传学家的地位。实际上,在他晚年迁往澳大利亚之前,家的地位。实际上,在他晚年迁往澳大利亚之前,Fisher先先后在伦敦大学学院和剑桥大学长期担任优生学教授。后在伦敦大学学院和剑桥大学长期担任优生学教授。在在5050年的时间里,他每两个月发表一篇论文,而且绝大年的时间里,他每两个月发表一篇论文,而且绝大部分论文都开辟了新天地!因此,很难确定他的诸多贡献中部分论文都开辟了新天地!因此,很难确定他的诸多贡献中哪一个才是最值得称颂的,也绝对没有可能用少许的篇幅来哪一
7、个才是最值得称颂的,也绝对没有可能用少许的篇幅来展示这位多产的学者是如何彻彻底底地纵横统计学这一领域展示这位多产的学者是如何彻彻底底地纵横统计学这一领域的。的。他是在实验中使用随机分组、拉丁方格、因子设计和混他是在实验中使用随机分组、拉丁方格、因子设计和混合设计的先驱者。合设计的先驱者。之后,之后,他推进了估计理论(并引入了无偏他推进了估计理论(并引入了无偏性、一致性、有效性等概念),使相关、回归和方差(和协性、一致性、有效性等概念),使相关、回归和方差(和协方差)分析发展成现在的状态。是方差)分析发展成现在的状态。是FisherFisher在在William William S.Gosset
8、S.Gosset研究的基础上建立了小样本假设检验的综合理论研究的基础上建立了小样本假设检验的综合理论。v一、方差分析的主要用途:一、方差分析的主要用途:v进行两个或两个以上样本均数的比较;进行两个或两个以上样本均数的比较;v可以同时分析一个、两个或多个因素对试验结可以同时分析一个、两个或多个因素对试验结果的作用和影响;果的作用和影响;v分析多个因素的独立作用及多个因素之间的交分析多个因素的独立作用及多个因素之间的交互作用;互作用;v进行两个或多个样本的方差齐性检验等。进行两个或多个样本的方差齐性检验等。v方差分析对分析数据的要求及条件比较严格,即方差分析对分析数据的要求及条件比较严格,即要求各
9、样本为随机样本,各样本来自正态总体,要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。各样本所代表的总体方差齐性或相等。v三、方差分析的类型三、方差分析的类型v1、单因素方差分析(、单因素方差分析(one-way ANOVA)也也称为完全随机设计称为完全随机设计(completely random design)的方差分析。该设计只能分析一个因素的方差分析。该设计只能分析一个因素下多个水平对试验结果的影响。下多个水平对试验结果的影响。v2、双因素方差分析(、双因素方差分析(two-way ANOVA)称为随机区组设计(称为随机区组设计(randomized block
10、 design)的方差分析。该设计可以分析两个因的方差分析。该设计可以分析两个因素。一个为处理因素,也称为列因素;一个为区素。一个为处理因素,也称为列因素;一个为区组因素,也称为行因素。组因素,也称为行因素。v3、三因素方差分析、三因素方差分析 也称为拉丁方设计(也称为拉丁方设计(Latin square design)的方差分析。该设计特点是,的方差分析。该设计特点是,可以同时分析三个因素对试验结果的作用,且三可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。个因素之间相互独立,不能有交互作用。v4、析因设计(、析因设计(factorial design)的方差分
11、析的方差分析 当两个因素或多个因素之间存在相互影响或交互当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。该设计不仅可作用时,可用该设计来进行分析。该设计不仅可以分析多个因素的独立作用,也可以分析多个因以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析方法。素间的交互作用,是一种高效率的方差分析方法。5、正交试验设计的方差分析、正交试验设计的方差分析 如果要分析的因素有如果要分析的因素有三个或三个以上,可进行正交试验设计三个或三个以上,可进行正交试验设计(orthogonal experimental design)的的方差分析。当分析因素较
12、多时,试验次数会急剧方差分析。当分析因素较多时,试验次数会急剧增加,用此设计进行分析则更能体现出其优越性。增加,用此设计进行分析则更能体现出其优越性。该设计利用正交表来安排各次试验,以最少的试该设计利用正交表来安排各次试验,以最少的试验次数,得到更多的分析结果。验次数,得到更多的分析结果。方差分析的前提条件方差分析的前提条件v各样本是相互独立的随机样本,各样本是相互独立的随机样本,均服从正态分布均服从正态分布v各样本的各样本的总体方差齐性总体方差齐性。1 12 2=2 22 2=3 32 2=4 42 2方差分析的基本思想方差分析的基本思想 把全部观察值间的变异按照设计和需要分解把全部观察值间
13、的变异按照设计和需要分解成两个或多个组成部分,然后将各部分的变异与成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具随机误差进行比较,以判断各部分的变异是否具有统计学意义。有统计学意义。方差分析方差分析例:例:为研究为研究A A、B B、C C三种治疗缺铁性贫血的药三种治疗缺铁性贫血的药物的疗效,某研究者将物的疗效,某研究者将1111例患者完全随机例患者完全随机地分为三组,分别给予三种药物,治疗一地分为三组,分别给予三种药物,治疗一个疗程后的结果如表个疗程后的结果如表5.35.3,请作统计分析。,请作统计分析。完全随机资料的方差分析完全随机资料的方差分析变异分
14、解变异分解v总变异组间变异总变异组间变异+组内变异组内变异vSS总总=SS组间组间+SS组内组内完全随机设计的方差分析完全随机设计的方差分析 completely randomized design 单因素方差分析(单因素方差分析(one-way ANOVA)建立检验假设建立检验假设 H H0 0:三种药物效果相同,:三种药物效果相同,1 12 23 3;H H1 1:三种药物效果相同不全相同。:三种药物效果相同不全相同。0.05,0.05,计算检验统计量计算检验统计量F F值值 v组间组间=K-1=2 MS组间组间=SS组间组间/v组间组间=0.4426v组内组内=N-k=8 MS组内组内=
15、SS组内组内/v组内组内=0.0441(3)确定p值 根据0.05,1组间2,2组内8,查F界值表,得F界值:F0.01(2,8)=8.65。本例F10.04,大于界值F0.01(2,8)=8.65,则P0.01。(4)推断结论 由于P0.01,在0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为三种药物效果不全相同。该结论的意义为,至少有两种药物不同。如果想确切了解哪两种药物有差异,可进一步作多个样本均数的两两比较。随机区组设计的方差分析v双因素方差分析双因素方差分析(two way ANOVA)v特点特点:按照随机区组设计的原则来分析两个因素对试验结按照随机区组设计的原则来分析两
16、个因素对试验结果的影响及作用。其中一个因素称为处理因素,一般作为果的影响及作用。其中一个因素称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素。两个因素相互独立,且无交互影响。为行因素。两个因素相互独立,且无交互影响。v但双因素方差分析的设计对选择受试对象及试验条件等方但双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意。面要求较为严格,应用该设计方法时要十分注意。该设计方法中,总变异可以分出三个部分:该设计方法中,总变异可以分出三个部分:SS总总SS处理处理SS区组区组SS
17、误差误差 总总 处理处理+区组区组+误差误差 某医院研究五种消毒液对四种细菌的抑制效果。抑制效果某医院研究五种消毒液对四种细菌的抑制效果。抑制效果用抑菌圈直径(用抑菌圈直径(mm)表示。数据见表)表示。数据见表4-5。试分析五种消毒。试分析五种消毒液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。计算公式:计算公式:根据得到的根据得到的F值,查附表值,查附表F界值表,确定界值表,确定P值值得出结论。得出结论。某医院研究五种消毒液对四种细菌的抑制效果。抑制效果某医院研究五种消毒液对四种细菌的抑制效果。抑制效果用抑菌圈直径(用抑菌圈直径(mm)
18、表示。数据见表)表示。数据见表4-5。试分析五种消毒。试分析五种消毒液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。例题例题检验步骤及方法检验步骤及方法(1)建立检验假设)建立检验假设1)对处理因素作用的检验假设对处理因素作用的检验假设 H0:五种消毒液的消毒效果相同,五种消毒液的消毒效果相同,12345;H1:五种消毒液的消毒效果不全相同。五种消毒液的消毒效果不全相同。0.052)对区组因素作用的检验假设对区组因素作用的检验假设H0:四种细菌的抑菌圈直径相同,四种细菌的抑菌圈直径相同,1234;H1:四种细菌的抑菌圈直径不全相同。四种细
19、菌的抑菌圈直径不全相同。0.05v(2 2)计算统计量)计算统计量F F值值 ,有:,有:vSSSS总总S S2 2(N-1)(N-1)660.8660.8v总总N N1 120201 11919v处理处理k k1 15 51 14 4v区组区组b b1 14 41 13 3vSSSS误差误差SSSS总总SSSS处理处理SSSS区组区组660.8660.831.331.3566566 =63.5=63.5v误差误差(k k-1)-1)(b b-1-1)1212vMS处理处理SS处理处理 处理处理(31.3)47.825v MS区组区组SS区组区组 区组区组(566)3188.667vMS误差误
20、差SS误差误差 误差误差(63.5)125.292vF处理处理MS处理处理MS误差误差 7.8255.292=1.4796vF区组区组MS区组区组MS误差误差 188.6675.292=35.654)确定)确定P值值 根据根据 0.05,处理组处理组 1处理处理4,2误差误差12,查,查F界值表,得界值表,得F0.05(4,12)3.26,F0.01(4,12)5.41,F处理处理1.48,P0.05。;区组间区组间 由由1区组区组3,2误差误差12,查,查F界值表,得界值表,得F0.05(3,12)3.49,F0.01(3,12)5.95。F区组区组35.65,P0.05,在,在0.05水准
21、上不拒绝水准上不拒绝H0,差异差异无统计学意义。可以认为五种消毒液之间的消毒效果相同。无统计学意义。可以认为五种消毒液之间的消毒效果相同。区组间区组间P0.01,在在0.05水准上拒绝水准上拒绝H0,接受接受H1,差异有统计学意义。可认为不同细菌的抑菌圈直径不全相同,差异有统计学意义。可认为不同细菌的抑菌圈直径不全相同,即消毒液对不同细菌类型的抑菌效果不全相同。即消毒液对不同细菌类型的抑菌效果不全相同。v配伍区组设计的方差分析和完全随机设计的方配伍区组设计的方差分析和完全随机设计的方差分析有何区别?差分析有何区别?v对于配伍区组设计的资料,可否用完全随机的对于配伍区组设计的资料,可否用完全随机
22、的方差分析进行统计分析?方差分析进行统计分析?vt检验和方差分析有何区别和联系?检验和方差分析有何区别和联系?析因设计资料的方差分析析因设计资料的方差分析Factorial design 析因设计析因设计 将两个或多个实验因素的各水平进行全面组合的将两个或多个实验因素的各水平进行全面组合的实验,能够分析各实验因素:实验,能够分析各实验因素:单独效应单独效应(simple effect)、)、主效应主效应(main effect)、因素间的)、因素间的交互效应交互效应(interaction)析因设计析因设计 因素因素AA1A2BB1A1B1A2B1B2A1B2A2B2v某研究者欲研究煤焦油(某
23、研究者欲研究煤焦油(A A)以及作用时间()以及作用时间(B B)对细胞毒性的作用,煤焦油含量分为对细胞毒性的作用,煤焦油含量分为3 3微克微克/毫升毫升(a a1 1)和)和7575微克微克/毫升(毫升(a a2 2)两个水平,作用时间)两个水平,作用时间分别为分别为6 6小时(小时(b b1 1)和)和8 8小时小时(b(b2 2),将统一制备的,将统一制备的1616盒已培养好的细胞随机分为四组,分别接受盒已培养好的细胞随机分为四组,分别接受A A、B B不同组合情况下的四种处理(不同组合情况下的四种处理(a a1 1b b1 1,a,a1 1b b2 2,a,a2 2b b1 1,a a
24、2 2b b2 2)测得处理液吸光度的值()测得处理液吸光度的值(%),结果如表,),结果如表,试对该资料进行分析。试对该资料进行分析。例题:四种不同处理下吸光度的值例题:四种不同处理下吸光度的值煤焦油煤焦油 a13微克微克/ml煤焦油煤焦油 a275微克微克/ml6h(a1 b1)8h(a1 b2)6h(a2 b1)8h(a2 b2)合计合计Xij0.1630.1270.1240.100.1990.1680.1510.1920.1840.1520.1270.0790.1980.1500.1010.086nij4444160.1860.1490.1260.1150.144Sij20.00030
25、.00030.00040.00280.0015一、单独效应、主效应、交互效应一、单独效应、主效应、交互效应单独效应:其他因素水平固定时,同一因素不同水平的效应之差主效应:指某一因素单独效应的平均值交互效应:指两个或多个因素间的效应互不独立的情形例题例题8-3 吸光度均数的差别吸光度均数的差别B因素因素A因素因素平均值平均值a1-a2a1a2b10.1860.1260.1560.060b20.1490.1150.1320.034平均值平均值0.1680.1200.1440.047b1-b20.0370.0110.024单独效应主效应22析因设计交互效应示意图析因设计交互效应示意图二、离均差平方和
26、与自由度的分解二、离均差平方和与自由度的分解 根据根据F值、以及自由度,查值、以及自由度,查F界值表,确定界值表,确定p值。值。例题例题 分析基本步骤分析基本步骤一、建立检验假设一、建立检验假设因素因素A H0:1=2,不同煤焦油含量吸光度总体均数相同。,不同煤焦油含量吸光度总体均数相同。H1:12,不同煤焦油含量吸光度总体均数不相同。不同煤焦油含量吸光度总体均数不相同。=0.05因素因素B H0:1=2,不同作用时间其吸光度总体均数相同。,不同作用时间其吸光度总体均数相同。H1:12,不同作用时间其吸光度总体均数不相同。不同作用时间其吸光度总体均数不相同。=0.05AB交互作用交互作用 H0
27、:AB之间无交互作用。之间无交互作用。H1:AB之间有交互作用。之间有交互作用。=0.05变异变异SSdfMSFP总变异总变异0.02315处理处理0.0123 A0.00910.0099.6550.009 B0.00210.0022.4650.142 AB0.00110.0010.6960.421误差误差0.011120.001第五节第五节 重复测量资料的方差分析重复测量资料的方差分析 重复测量资料(重复测量资料(R Repeated measurement dataepeated measurement data)指指同一受试对象同一受试对象的的同一观察指标同一观察指标在在不同时间点不同时
28、间点上进行多次测量所得的资料,常用来分析观察指标上进行多次测量所得的资料,常用来分析观察指标在不同时间点上的变化。在不同时间点上的变化。放血后小鼠血压变化放血后小鼠血压变化编号编号 t1 t2 t3 t4 t51.00139.60102.6096.2068.5055.502.00139.60102.6096.2068.5055.503.00139.60102.6096.2068.5055.504.00139.60102.6096.2068.5055.505.00119.7090.1082.1060.1045.506.00143.10113.0097.5072.5059.607.00107.80
29、77.1064.2051.4044.708.00130.0092.1082.8059.1050.509.00154.30118.40105.8078.9064.5010.00127.8099.3089.2062.9051.90重复测量资料(重复测量资料(A B两种处理方法)两种处理方法)处理处理 t1 t2 t3 t4 t5A139.60102.6096.2068.5055.50A 139.60102.6096.2068.5055.50A 139.60102.6096.2068.5055.50A 139.60102.6096.2068.5055.50A 119.7090.1082.1060.1
30、045.50B143.10113.0097.5072.5059.60B 107.8077.1064.2051.4044.70B 130.0092.1082.8059.1050.50B 154.30118.40105.8078.9064.50B 127.8099.3089.2062.9051.90v例题例题 8-4 8-4 某研究者欲研究青光眼结膜成纤维细胞增值某研究者欲研究青光眼结膜成纤维细胞增值表达情况,在某医院随机抽取了表达情况,在某医院随机抽取了2020例青光眼患者例青光眼患者和和2424例对照,取两组研究对象眼角膜细胞进行培例对照,取两组研究对象眼角膜细胞进行培养,分别在养,分别在3
31、3、7 7、1414、2121天四个时间点观察平均天四个时间点观察平均细胞数。细胞数。重复测量数据与随机区组设计资料的区别重复测量数据与随机区组设计资料的区别1、重复测量资料中,同一受试对象的数据具有相、重复测量资料中,同一受试对象的数据具有相关性。随机区组设计不具有这一特点。关性。随机区组设计不具有这一特点。2、重复测量资料各时间点不是随机的;随机区组、重复测量资料各时间点不是随机的;随机区组设计资料,各区组受试对象独立,处理因素在区设计资料,各区组受试对象独立,处理因素在区组内是随机分配。组内是随机分配。离均差平方和与自由度分解离均差平方和与自由度分解v多个干预的重复测量数据方差分析表(多
32、个干预的重复测量数据方差分析表(分析处理组间变异分析处理组间变异)变异来源变异来源自由度自由度SSMSFP受试对象间受试对象间总变异总变异N-1SS受试对象间总受试对象间总处理组处理组K-1SS处理处理MS处理处理F个体间误差个体间误差N-KSS个体间误差个体间误差MS个体间个体间误差误差多个时间点测量多个时间点测量变异来源变异来源自由度自由度SSMSFP个体内个体内总变异总变异N(m-1)SS个体内个体内总变异总变异时间点时间点M-1SS时间时间MS时间时间F时间时间交互作用交互作用(k-1)(m-1)SS交互交互MS交互交互F交互交互个体内误差个体内误差(N-K)(m-1)SS个体内个体内
33、误差误差MS个体内个体内误差误差v重复测量资料资料的分析步骤:重复测量资料资料的分析步骤:1、建立检验假设、建立检验假设 处理因素处理因素:H0:不同处理组两组间总体均数相同:不同处理组两组间总体均数相同 H1:不同处理组两组间总体均数不同:不同处理组两组间总体均数不同 =0.05 时间因素时间因素 H0:不同时间总体均数相同:不同时间总体均数相同 H1:不同时间两组间总体均数不全相同:不同时间两组间总体均数不全相同 =0.05 处理与时间的交互作用处理与时间的交互作用 H0:处理与时间无交互作用:处理与时间无交互作用 H1:处理与时间有交互作用:处理与时间有交互作用 =0.05计算计算SS总
34、总以及各部分以及各部分SS计算计算MS;计算各部分;计算各部分F值;值;确定各部分P值 变异来源变异来源SSdfMSFP总变异总变异1191.197175303.7466受试对象间受试对象间884.867043278.6225处理处理263.83601363.836017.84 0.001个体间差异个体间差异621.03104214.7865受试对象内受试对象内306.330113225.1241时间时间65.9290321.976311.70 0.001交互作用交互作用3.810331.27010.680.568个体内差异个体内差异236.59081261.8777三、重复测量资料方差分析的
35、前提条件三、重复测量资料方差分析的前提条件进行重复测量方差分析时的条件进行重复测量方差分析时的条件1、各样本来自于正态总体,各总体方差齐性、各样本来自于正态总体,各总体方差齐性2、满足协方差阵的球形性或复合对称性。、满足协方差阵的球形性或复合对称性。球对称性采用球对称性采用Mauchlys 检验来判断。检验来判断。若按规定检验水若按规定检验水准准=0.10,拒绝,拒绝H0,接受,接受H1,球形对称性质不能满足,则方,球形对称性质不能满足,则方差分析的差分析的F值有偏,因为它增大了第一类错误的概率。则从理值有偏,因为它增大了第一类错误的概率。则从理论上讲应对受试对象内所有变异的自由度进行校正,用
36、校正论上讲应对受试对象内所有变异的自由度进行校正,用校正后的自由度查后的自由度查F界值表获得界值表获得P值,再做出推论。值,再做出推论。Wauchlys WX2dfp球对称系数球对称系数 G-GH-F0.64218.07550.0030.7630.829例题例题8-4 Mauchlys 检验和球对称性系数检验和球对称性系数例题例题8-4 经球对称系数校正后的计算结果经球对称系数校正后的计算结果变异来源变异来源dfFP校正校正df校正校正PG-GH-FG-GH-F受试对象内受试对象内132时间时间311.700.0012.2892.2480.0010.001交互作用交互作用30.680.5682
37、.2892.2480.530.542个体内误差个体内误差12696.138104.454第六节第六节 多个样本均数的两两比较多个样本均数的两两比较v不能用两样本不能用两样本t检验的原因:用两样本检验的原因:用两样本t检验增加了犯检验增加了犯第一类错误(第一类错误(错误)的概率。错误)的概率。做一次做一次t检验,检验,=0.05,1-=0.95;做三次做三次t检验,不犯检验,不犯错误的概率错误的概率(1-)3=0.857 =0.143两两比较的常用方法两两比较的常用方法一、一、SNK法法 全称为Student-Newman-Keuls-q检验法,属于多重极差检验。检验步骤:1、建立检验假设 Ho
38、:两对比组总体均数相同 H1:两对比组总体均数不相同 =0.052、计算检验统计量组别组别正常钙组正常钙组中剂量钙组中剂量钙组高剂量钙组高剂量钙组293.37239.49224.78组次组次123(1)首先将比较的样本均数按由大到小的顺序排列,并编组次。计算q值v确定确定p值,值,查查q界值表界值表 为误差自由度,为误差自由度,a为对比组内包含组数。为对比组内包含组数。组数组数a a的计算方法的计算方法:由于各样本均数已由大到小:由于各样本均数已由大到小顺序排列,因此,相邻两样本均数比较时,组数顺序排列,因此,相邻两样本均数比较时,组数a a=2=2,中间间隔一个样本均数时,组数,中间间隔一个
39、样本均数时,组数a a=3=3,间隔,间隔两个样本均数时,组数两个样本均数时,组数a a=4=4,余类推。,余类推。比较组A与B两均数之差标准误q值a q 0.05q 0.01P值(1)(2)(3)(4)(5)(6)(7)(8)1与368.599.127.5233.494.450.011与253.879.125.9122.893.890.05Dunnett法法:适用于多个处理组与一个对照组均数间的两两比较。适用于多个处理组与一个对照组均数间的两两比较。特点及意义特点及意义 在进行科研时,经常需要设立在进行科研时,经常需要设立一个对照组和若干个实验一个对照组和若干个实验组或处理组组或处理组。按照
40、研究目的和设计要求,有时只需要将各个。按照研究目的和设计要求,有时只需要将各个处理组的试验结果与一个对照组进行比较,而各处理组之间处理组的试验结果与一个对照组进行比较,而各处理组之间并不需要比较。此时,仍可应用前述并不需要比较。此时,仍可应用前述SNKSNKq q检验法处理资料。检验法处理资料。因为因为q q检验方法包括所有各组之间的比较。但处理此类资料也检验方法包括所有各组之间的比较。但处理此类资料也有非常常用而经典的方法,称为有非常常用而经典的方法,称为DunnettDunnettt t检验法。该法在检验法。该法在大型统计软件中的应用非常广泛。大型统计软件中的应用非常广泛。Dunnett-
41、t检验计算公式为:检验计算公式为:计算出计算出t值后,查附表值后,查附表5-2 Dunnett-t界值表。界值表。表中表中:a=k-1 k为实验组数为实验组数 m为比较次数为比较次数,是检验水准,是检验水准,=0.05vBonferroniBonferroni(邦弗朗尼邦弗朗尼)法)法 主要是通过调整主要是通过调整水平,来控制犯第一类错误的概率。水平,来控制犯第一类错误的概率。方差分析的前提条件和数据变换方差分析的前提条件和数据变换前提条件:前提条件:v各样本是互相独立的随机样本,均服从正态分布各样本是互相独立的随机样本,均服从正态分布v各样本方差相等,即方差齐性。各样本方差相等,即方差齐性。
42、v方差齐性检验方差齐性检验1 1、bartlettbartlett(巴特利特)(巴特利特)x x2 2检验:检验:缺陷是对资料的正态性要求过高。缺陷是对资料的正态性要求过高。2 2、levenelevene(列文)检验:(列文)检验:可检验两个或以上的总体方差齐性。不依赖于资料分布可检验两个或以上的总体方差齐性。不依赖于资料分布类型,且计算结果较为稳定。缺点是计算繁琐,要用到原类型,且计算结果较为稳定。缺点是计算繁琐,要用到原始数据。始数据。3 3、残差图法、残差图法数据变换数据变换v对明显偏态分布的资料,处理方法:对明显偏态分布的资料,处理方法:v1、通过各种数据变换,如:对数变换、平方根变
43、、通过各种数据变换,如:对数变换、平方根变换等。变换成正态分布资料,采用正态分布法处换等。变换成正态分布资料,采用正态分布法处理。理。v2、改用秩变换的非参数统计,如秩和检验、改用秩变换的非参数统计,如秩和检验SAS命令命令完全随机设计方差分析完全随机设计方差分析DATA prg8_1;do c=1 to 3;do i=1 to 12;INPUT x;output;end;end;CARDS;332.96 297.64 312.57 295.47 284.25 307.97 292.12 244.61 261.46 286.46 322.49 282.42 253.21 235.87 269.
44、30 258.90 254.39 200.87 227.79 237.05 216.85 238.03 238.19 243.49 232.55 217.71 216.15 220.72 219.46 247.47 280.75 196.01 208.24 198.41 240.35 219.56;PROC anova;CLASS c;MODEL x=c;means c;means c/lsd;means c/snk;run;分析结果分析结果LSD法两两比较法两两比较SNK两两比较两两比较Dunnets法两两比较法两两比较随机区组方差分析随机区组方差分析DATA prg8_2;DO a=1 t
45、o 3;DO b=1 to 10;INPUT x;OUTPUT;END;END;CARDS;2.21 2.32 3.15 1.86 2.56 1.98 2.372.88 3.05 3.42 2.91 2.64 3.673.29 2.45 2.74 3.15 3.44 2.61 2.864.25 4.56 4.33 3.89 3.78 4.62 4.713.56 3.77 4.23;PROC anova;CLASS a b;MODEL x=a b;MEANS a/snk;means b/snk;RUN;析因设计资料的方差分析析因设计资料的方差分析-SAS程序程序DATA prg8_3;DO a=
46、1 to 2;DO b=1 to 2;DO n=1 to 4;INPUT x;OUTPUT;END;END;END;CARDS;0.163 0.199 0.184 0.1980.127 0.168 0.152 0.1500.124 0.151 0.127 0.1010.101 0.192 0.079 0.086;PROC anova;CLASS a b;MODEL x=a b a*b;RUN;重复测量资料的方差分析重复测量资料的方差分析DATA prg8_4;INPUT g time3 time7 time14 time21;CARDS;10.19171.66671.65000.700012.
47、59382.80002.40003.800011.20004.37504.52500.216712.17921.93751.66880.640011.00001.45001.77500.425012.20004.70003.96671.700016.61675.56671.56252.510016.60004.43332.41251.687515.80004.61672.98755.950018.05007.10004.95005.000010.72502.19172.80001.725014.43756.45635.52506.933313.06257.12505.10000.983315.
48、47084.40003.25002.200011.60000.85003.37501.875016.35008.86674.50005.900016.55006.5667 3.8375 5.0700111.05004.7833 4.9750 2.8875110.93337.7750 5.2875 9.200018.900011.200 7.4000 8.916721.33750.9750 0.6125 0.000020.21880.0857 0.1000 0.000022.30002.0833 1.3833 1.725020.93330.4667 0.5250 0.475020.60000.4
49、750 0.1375 0.075022.00000.6000 0.3800 0.360021.41670.5625 0.4000 0.387521.05000.9375 0.3300 0.280020.18330.1500 0.0500 0.033323.95001.9125 1.3500 1.000023.77503.7667 0.8667 1.500021.33332.0500 1.5333 0.416724.30003.1375 4.0000 0.325020.45630.2643 0.2286 0.100021.93333.8000 4.1500 3.225021.81670.6333
50、 0.5250 0.50002 0.85001.15000.32500.53752 2.85003.30002.57001.18002 1.21670.66252.37501.33752 3.85003.32500.86003.31002 1.10001.62000.55000.20002 10.0500 4.17502.90002.98002 9.77507.70002.48333.10002 5.20003.93334.21671.7500;PROC anova;CLASS g;MODEL time3 time7 time14 time21=g/nouni;REPEATED time 4/