1、Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,*,*,线性回归与协方差分析,第十章,1,方差分析:,用于比较两组或者多组总体均数之间的差异,推论相应的处理效应间的差异。,自变量为分类变量,。,回归分析:,用于拟合变量间的关系,通过回归分析可以估计反应变量与一系列自变量之间的回归关系,同时建立具体的回归方程。,自变量为连续变量,。,两者可统一于一般线性模型,2,第一节 协方差分析的基本思想和步骤,3,假定这样一个
2、问题:已知某变量,X,对观察指标,Y,有影响(,称,X,为协变量,),由方差分析得到不同的处理组,Y,的总体均数之间有差别,那么这个,差别是因为各组处理效应确有不同还是因为协变量,X,的影响所致?,如何鉴别,?,需要通过一种方法,该方法可以,消除,X,对,Y,的影响。,4,表,13-3,三种饲料喂养猪的初始重量与增重(单位:,kg,),A,饲料,B,饲料,C,饲料,X,1,Y,1,X,2,Y,2,X,3,Y,3,1,15,85,17,97,22,89,2,13,83,16,90,24,91,3,11,65,18,100,20,83,4,12,76,18,95,23,95,5,12,80,21,
3、103,25,100,6,16,91,22,106,27,102,7,14,84,19,99,30,105,8,17,90,18,94,32,110,13.750,81.750,18.625,98.000,25.375,96.875,A,饲料,B,饲料,C,饲料,X,1,Y,1,X,2,Y,2,X,3,Y,3,1,15,85,17,97,22,89,2,13,83,16,90,24,91,3,11,65,18,100,20,83,4,12,76,18,95,23,95,5,12,80,21,103,25,100,6,16,91,22,106,27,102,7,14,84,19,99,30,10
4、5,8,17,90,18,94,32,110,13.750,81.750,18.625,98.000,25.375,96.875,编号,均值,5,方差分析表,变异来源,自由度,SS,MS,F,P,总变异,23,2555.958,组间变异,2,1317.583,658.792,11.17,0.01,组内变异,21,1238.375,58.970,完全随机设计类型的方差分析,6,方差分析表,变异来源 自由度,SS,MS,F P,总变异,23 720.50,组间,2 545.25 272.63 32.67,0.01,组内,21 175.25 8.35,初始体重的组间比较,7,多个均数两两比较表,三组
5、猪的初始重量两两比较均有差别,,A,组初始重量最低,,C,组最高。,对比组,组数,a,q,q,0.05,q,0.01,P,C,组与,B,组,6.75,2,6.61,2.95,4.02,0.01,C,组与,A,组,11.625,3,11.38,3.58,4.64,0.01,B,组与,A,组,4.875,2,4.77,2.95,4.02,0.01,8,10,名正常孕妇妊娠时间与血清载脂蛋白含量,(g/L),9,x,y,原则:各实测点至直线纵向距离的平方和为最小,求解回归直线,10,直线回归方程的计算,11,10,名正常孕妇妊娠时间,(,周,),与血清载脂蛋白含量,(g/L),12,P,应变量,y,
6、离均差平方和划分示意图,y,x,13,总离均差平方和的分解:,+,=,即,对于所有观测点,都有:,14,协方差分析:,把回归分析和方差分析结合起来的一种统计分析方法,综合了两种方法的优点,,提供了一个比较组间处理效应更加有效的方法,。由,Fisher,(,1932,)最早提出。,15,学生,城市学校,乡村学校,年龄(月),身高(,cm,),年龄(月),身高(,cm,),1,109,137.6,121,139.0,2,113,147.8,121,140.9,3,115,136.8,128,134.9,4,116,140.7,129,149.5,5,119,132.7,131,148.7,6,12
7、0,145.4,132,131.0,7,121,135.0,133,142.3,8,124,133.0,134,139.9,9,126,148.5,138,142.9,10,129,148.3,138,147.7,11,130,147.5,138,147.7,12,133,148.8,140,134.6,13,134,133.2,140,135.8,14,135,148.7,140,148.5,15,137,152.0,16,139,150.6,17,141,165.3,18,142,149.9,均数,126.8,144.5,133.1,141.7,表,10-1,某城市学校和某乡村学校儿童身高
8、及年龄,16,方差分析结果:,两组平均身高的差值:,144.5-141.7,2.8cm,,,F,1.121,,,P,=0.298,,还不能认为城乡儿童的身高有差异。,另有:,两组平均年龄的差值:,133.1-126.8,6.3,月,那么,如果城乡儿童年龄分布相同,结果会怎样,?,17,利用协方差分析:,消除年龄的影响,对组间差异,2.8cm,进行校正,得到更为准确的一个差值。,结果:,校正之后的组间差异为,5.5cm,,差异具有统计学意义(,P,0.05,组内,28,1270.444,45.373,F,0.05,(,1,,,28,),4.20,方差分析表,39,1.Y,与,X,为非线性关系,(
9、1,),Y,与,X,是平行的非线性关系,办法:,可只对,X,做变量变换,例如:对,X,做平方根转换,,Y,与 之间的为线性关系。,40,(,2,),Y,与,X,是不平行的非线性关系,办法:,可对,Y,和(或),X,做变量变换。,例如:可对,Y,做对数变换,且分析完成之后应作逆变换以便解释处理效应。,41,举例:,假设两对比组数据,对反应变量,Y,做对数变换后 ,进行协方差分析得到,则有:,(对照组),(处理组),42,那么:,说明处理组相对于对照组,由某因素,X,造成处理效应增加约,20,倍。,43,(,3,),Y,与,X,是不平行的非线性关系,且没有合适的数据转换方法将其转换为线性关系。,
10、44,2.,两回归线不平行,Y,i,+,i,X,+,e,i,0,,,1,图,10-2,两组回归线不平行的情况,45,3.,多个混杂因素的控制,同时对多个协变量进行校正,10-8,10-9,一些专家认为,应重点考虑一个或两个最重要的混杂因素,这样,既可消除大部分的偏倚又可避免因协变量太多而使问题复杂化。这种做法在很多情况下是有效的,但有时也会出现“校枉过正”(不如不校)的情形。,46,第三节 交互作用与协同作用,47,比较,四种方法,对轴突通过率的影响,处理因素是缝合方法,有,4,个水平。可以有以下几种设计:,完全随机设计:,n,个家兔随机分为,4,组,随机区组设计:将,n,个家兔按出生年龄相近
11、的原则,,4,个一组配成区组后,每个区组随机分配处理,拉丁方设计:在随机区组基础上增加了一个列区组,如家兔按甲、乙、丙、丁,4,个种系(行区组),每个种系的,4,只小鼠按年龄大小分,、,、,、,4,个级别(列区组),,A,、,B,、,C,、,D4,个字母代表处理,例 研究两种神经缝合方法在不同时间点对神经进行缝合后的恢复效果,将,20,只家兔随机分为四组,48,比较,4,种缝合方法对家兔神经轴突通过率的影响,处理因素是缝合方法,有,4,个水平。,目的:比较,4,种方法的差别,分析缝合方法、缝合时间对神经轴突通过率的影响。,缝合方法,外膜 束膜,时 间,1,月,2,月,1,月,2,月,两因素试验
12、49,缝合方法,外膜缝合,束膜缝合,缝合后时间,1,月,2,月,1,月,2,月,10,30,10,50,10,30,20,50,40,70,30,70,50,60,50,60,10,30,30,30,24,44,28,52,家兔神经缝合后的轴突通过率,(,%,),比较不同缝合方法及缝合后时间对轴突通过率的影响。,50,1,单独效应 单独效应,(,simple effect,),是指其他因素的水平固定时,同一因素不同水平间的差别。,2,主效应 主效应,(,main effect,),指某一因素各水平间的平均差别。,51,B,因素(,2,水平),缝合后,1,月 缝合后,2,月,2,因素,2,水平析因试验示意图,A,因素(,2,水平),外膜缝合,束膜缝合,24 44,28 52,52,3,交互作用 当某因素的各个单独效应随另一因素变化而变化时,则称这两个因素间存在交互作用,(,interaction,),。,图,11-2,两因素交互作用示意图,缝合,1,月,缝合,2,月,53,






