收藏 分销(赏)

协方差分析简介.doc

上传人:二*** 文档编号:4614756 上传时间:2024-10-07 格式:DOC 页数:6 大小:222KB
下载 相关 举报
协方差分析简介.doc_第1页
第1页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、协方差分析简介在许多研究中,两组或多组均数的比较还需要控制一些非研究因素的影响,这些非研究因素称为混杂因素(Confounding factor)。为了帮助读者进一步理解分类自变量的线性回归的回归系数的特殊意义。先用下例说明自变量为二分类变量的直线回归中的回归系数检验与成组t检验之间的关系。例12.7 为了评价控制饮食对糖尿病控制的作用,在坚持控制饮食的糖尿病人群和未控制饮食的糖尿病人群中各随机抽取30个对象,测量其空腹血糖如下控制饮食组(group=1)6.6 7.3 7.2 7.3 7.4 6.5 7.3 6.4 7.2 7.7 6.8 6.3 7.1 7.8 7.2 7.7 6.7 7.

2、2 6.8 8 6.9 6.6 7 7.4 7.7 7.1 7.1 7.8 6.4 7.4未控制饮食组(group=0)7.7 7.7 7.2 6.9 7.6 7.4 7.9 6.9 7.5 6.9 8.4 7.2 7.2 7.1 7.8 7.4 7.4 8.4 7.6 7.9 6.9 7.9 7.2 7.5 7 7.2 6.7 7.1 7.3 7.6数据格式groupy116.6217.3317.2417.3517.4616.5717.3816.4917.21017.71116.81216.31317.11417.81517.21617.71716.71817.21916.820182116

3、.92216.623172417.42517.72617.12717.12817.82916.43017.43107.73207.73307.23406.93507.63607.43707.93806.93907.54006.94108.44207.24307.24407.14507.84607.44707.44808.44907.65007.95106.95207.95307.25407.555075607.25706.75807.15907.36007.6正态性检验和方差齐性检验的结果表明二组的资料都近似服从正态分布,并且方差齐性。成组t检验的Stata操作和结果如下ttest y,by(

4、group) Two-sample t test with equal variances- Group | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+- 0 | 30 7.416667 .0777682 .4259539 7.257613 7.57572 1 | 30 7.13 .0840293 .4602473 6.958141 7.301859-+-combined | 60 7.273333 .0597484 .4628089 7.153777 7.39289-+- diff | .2866666 .1144937 .057482

5、5 .5158507-Degrees of freedom: 58 Ho: mean(0) - mean(1) = diff = 0 Ha: diff 0 t = 2.5038 t = 2.5038 t = 2.5038 P |t| = 0.0151 P t = 0.0076 上述结果表明两组样本均数的差值为0.286666,两组样本均数差值的标准误为0.1144937。t值为2.5038,相应的P值为0.0151。若设未控制饮食组(g=0)的空腹血糖总体均数为m0,控制饮食组(g=1)的空腹血糖总体均数为m0+b,即饮食控制组的总体均数未饮食控制组的总体均数b,因此两组总体均数相等对应就是b

6、0。因此两组的空腹血糖总体均数可用下列表达式描述。 (1)以空腹血糖为应变量y,以分组变量group为自变量,用线性回归对参数m0和b进行估计,相应的Stata命令和主要结果如下reg y group- y | Coef. Std. Err. t P|t| 95% Conf. Interval-+- group | -.2866666 .1144937 -2.50 0.015 -.5158507 -.0574825 _cons | 7.416667 .0809593 91.61 0.000 7.254609 7.578724-常数项的估计值为7.416667,正好为未控制组的样本均数;回归系数

7、b的估计值为-.2866666,正好对应两组样本均数的差值,回归系数b0的t检验值为-2.5,正好对应成组t检验的值,相应的P值也相同。由此可知,t检验也可以用直线回归进行分析并且两分类变量为协变量的回归系数的意义就是两组均数的差值,并且不难证明:凡符合成组t检验条件的资料必定满足线性回归对资料的要求:残差正态和方差齐性。因此以下将通过一些例子介绍利用线性回归在校正一些混杂因素情况下对某两组均数进行比较,即协方差分析。例12.8 治疗缺铁性贫血50人,随机分为二组:A组和B组,分别用两种不同的治疗方案对患者进行一个疗程的治疗,由此评价两种治疗方案的疗效。数据如下: A组g=1治疗前y03183

8、16345288329331330305294324312337294治疗后y1492485515426492499500461443475471477442治疗前y0323295359304307300334313313357324336治疗后y1483461525460466457499470493542498517B组g=0治疗前y0298327322325329295326289322342306285316治疗后y1430461449430472422448414448487434409435治疗前y0345321340303323307352308296315331342治疗后y1

9、468454475440429432500437423442453478其中变量y0为患者在治疗前的红细胞数(万/ml),y1为治疗后的红细胞数(万/ml),group为分组变量,group1表示A组和group=0表示B组,相应的Stata格式为:y0y1group1318492123164851334551514288426153294921633149917330500183054611929444311032447511131247111233747711329444211432348311529546111635952511730446011830746611930045712033

10、44991213134701223134931233575421243244981253365171262984300273274610283224490293254300303294720312954220323264480332894140343224480353424870363064340372854090383164350393454680403214540413404750423034400433234290443074320453525000463084370472964230483154420493314530503424780在临床研究中,通常以红细胞增加数作为效应指标评价,

11、因此首先产生红细胞增加数的变量yd,相应的Stata命令如下:gen yd=y1-y0以治疗后的红细胞数治疗前的红细胞数为增加数若不考虑治疗前红细胞数(称为基线红细胞数)对增加数的影响,则参照上例的(1)式,对应可以写出相应的两组总体均数表达式:md=md0+bgroup (2)其中md0为A组的红细胞增加数的总体均数,md0+b为B的红细胞增加数的总体均数,b为两组红细胞增加数总体均数之差。但是一般而言,基线红细胞数低的患者经治疗后的增加数可能要大于基线红细胞数较高的患者的增加数,所以要校正基线红细胞数对红细胞增加数的影响,并假定基线红细胞数与红细胞增加数成线性关系。因此在(2)式中增加基线

12、红细胞数变量y0。md=md0+b1group+b2y0 (3)由(3)式可知,A组(group=0)的红细胞增加数的总体均数为md=md0+b2y0,而B组 (group=1)的红细胞增加数的总体均数为md=md0+b1+b2y0,因此对于同一基线红细胞数y0情况,两组红细胞增加数的总体均数差异为b1,故(3)式消除了不同基线红细胞数y0对两组总体均数差异的影响。b10说明两组的疗效相同;b10说明B组疗效优于A组;b1|t| 95% Conf. Interval-+- g | 34.01444 2.873596 11.84 0.000 28.23351 39.79537 y0 | .245

13、1717 .0782794 3.13 0.003 .0876939 .4026496 _cons | 50.08828 25.02241 2.00 0.051 -.2503122 100.4269-md0的估计值为50.0882828,b1的估计值为34.01444,相应的P值z-+- e | 50 0.95512 2.111 1.593 0.05555设正态性检验的a0.05,正态性检验的P值为0.05555,故可以认为残差近似服从正态分布。sdtest e,by(group) 方差齐性检验Variance ratio test- Group | Obs Mean Std. Err. Std

14、. Dev. 95% Conf. Interval-+- 0 | 25 1.04e-07 1.959625 9.798123 -4.044466 4.044467 1 | 25 6.08e-08 2.059203 10.29601 -4.249986 4.249986-+-combined | 50 8.23e-08 1.406728 9.947072 -2.826926 2.826927- Ho: sd(0) = sd(1) F(24,24) observed = F_obs = 0.906 F(24,24) lower tail = F_L = F_obs = 0.906 F(24,24)

15、 upper tail = F_U = 1/F_obs = 1.104 Ha: sd(0) sd(1) P F_obs = 0.4051 P F_U = 0.8101 P F_obs = 0.5949设方差齐性检验的a0.10,方差齐性的P值为0.8101,故可以认为残差的方差齐性。gen gy0=g*y0 产生基线与分组变量的交互作用项. reg yd g y0 gy0 作线性回归- yd | Coef. Std. Err. t P|t| 95% Conf. Interval-+- g | -22.92482 49.9281 -0.46 0.648 -123.4249 77.57523 y0 | .1515984 .1131301 1.34 0.187 -.0761208 .3793176 gy0 | .1784719 .1562382 1.14 0.259 -.1360193 .4929631 _cons | 79.90075 36.10009 2.21 0.032 7.235036 152.5665-设检验交互作用的a=0.05,交互作用项的系数为0.1784719,P值0.259a,故不能认为基线红细胞数与分组变量g有交互作用,根据上述检查结果表明本例资料满足上述协方差分析的条件,因此上述资料用协方差分析的方法是合适的,结果是可信的。

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 环境建筑 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服