1、重复测量资料的统计分析方法简介 在医学研究中,一些干预研究和纵向研究都需要对研究对象进行随访,每次随访进行观测或测量一些效应指标,考察同一研究对象同一指标的变化情况。同一个对象的多次观察或测量所获得的资料称为重复测量的资料。由于同一对象同一指标的相邻两个时间点的效应指标观测值往往是相关的,也就是重复测量的资料存在不独立的问题,然而大多数的医学统计方法都要求资料是独立,所以这些资料的统计分析需要用比较特殊的统计方法进行分析。 重复测量资料的统计分析方法可以用重复测量的方差分析,也可以用混合回归模型(Mixed regression Model),由于重复测量的方差分析要求资料满足球形对称性(
2、可以理解为相关资料情况下的方差齐性),而Mixed回归模型并不要求资料满足球形对称,并可以借助计算机统计软件对未知参数进行限制的最大似然估计,其他统计分析的思想都是类似的。本节将主要介绍如何借助统计软件应用Mixed回归模型对重复测量资料进行统计分析。 为了帮助读者对重复测量资料分析有一个简单的了解,本节将举一个非常简单的例子初步说明重复测量资料的统计分析概况。 例1 为了比较A药和B药在疗程为6个月中的持续减肥的疗效,现有10个身高为160cm的女性肥胖者志愿参加这项研究。随机分成2组,每组各5人。分别考察这2组肥胖者在服药前、服药3个月和服药6个月的体重变化。这2组肥胖者在服用该药前、
3、服药3个月和服药6个月的体重测量值(kg)见表1。 表 1 2组肥胖者在服用该药前、服药3个月和6个月的体重 组别和肥胖者编号 服药前 () 3个月() 6个月() A药组1号 52 49 42 A药组2号 51 50 46 A药组3号 50 49 41 A药组4号 51 49 44 A药组5号 49 47 40 B药组1号 51 54 53 B药组2号 49 47 46 B药组3号 50 47 44 B药组4号 49 48 41 B药组5号 52 50 48 这是两组观察对象的多个测量时间点的重复观
4、察测量资料,同样对于同一对象的不同观察时间点的观察资料是相关的,但由于需要比较两个药的减肥疗效,所以采用两因素方差分析,随机区组设计的方差分析或Friedman秩检验的统计方法都不适用于本例的数据统计分析,但可用Mixed模型对本例资料进行统计分析。 设A药组对象在服药前体重总体均数为;服药3个月后的总体体重改变量为,故服药3个月时的体重总体均数为;服药6个月时,体重比服药前的总体改变量为,即服药6个月时的体重总体均数为; 同理,设B药组对象在服药前体重总体均数为;服药3个月后的总体体重改变量为,故服药3个月时的体重总体均数为;服药6个月时,体重比服药前的总体改变量为,即服药6个月时的体重
5、总体均数为; 为了便于两组比较,引入两组比较的差异参数如下:记服药前的两组差异为b0=m1-m0,即:B组服药前的总体均数可以表示为;在服药3个月时A药和B药的体重总体改变量分别为b1和b11 ,记服用B药和A药3个月时的体重总体改变量的差异为,即在服药3个月时B药的体重总体改变量可以表示为;在服药6个月时A药和B药的体重总体改变量分别为b2和b12 ,记服用B药和A药6个月时的体重总体改变量的差异为,即在服药6个月时B药的体重总体改变量可以表示为,把两组差异的参数代入上述表达式,得到下列2组肥胖者在服用该药前、服药3个月和6个月的体重总体均数表达式如表2所示: 表2 两组3个时点总体均
6、数表达式 服药前 (t1=0,t2=0) 服药3个月 (t1=1,t2=0) 服药6个月 (t1=0,t2=1) A组总体均数(g=0) B组总体均数(g=1) 不难验证表2的总体均数表达式可以用下列总体回归方程(式1)表示: (1) 由于不同对象之间存在个体差异,,同一对象不同时点之间也存在随机差异,因此第g组第i个对象第t时刻的体重观察值可以用式(2)表示为 (2) 并且假定,,称式(2)为混合线性模型(Mixed Model)。 若和不全为0,则称两种药物与服药时间对疗效有交互作用。两
7、组在3个时间点的总体均数差异分别为,和,因此只需检验H0:、H0:和 H0:就可以推断两组总体均数差异。反之若和全为0,则称两种药物与服药时间对疗效无交互作用,并且两组各个时间点的总体均数差异均为,因此只需检验H0:b3=0就可以推断两组的总体均数差异。我们同样借助Stata软件对上述资料用混合模型进行统计分析,相应的Stata软件的数据格式如下 y g no t1 t2 52 0 1 0 0 49 0 1 1 0 42 0 1 0 1 51 0 2 0 0 50 0 2 1 0 46 0 2 0 1 … … … …
8、 … 52 1 10 0 0 50 1 10 1 0 48 1 10 0 1 Stata操作命令如下: gen gt1=g*t1 产生交互作用项变量g´t1 gen gt2=g*t2 产生交互作用项变量g´t2 xtreg y t1 t2 g gt1 gt2,i(no) Random-effects GLS regression Number of obs = 30 Group variable (i) : no
9、 Number of groups = 10 R-sq: within = 0.8288 Obs per group: min = 3 between = 0.0973 avg = 3.0 overall = 0.5927 max = 3 Random effects u_i
10、~ Gaussian Wald chi2(5) = 78.32 corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
11、 -------------+---------------------------------------------------------------- t1 | -1.8 1.053565 -1.71 0.088 -3.86495 .2649502 t2 | -8 1.053565 -7.59 0.000 -10.06495 -5.93505 g | -.4 1.612452 -0.25 0.804 -3
12、560347 2.760347 gt1 | .8 1.489966 0.54 0.591 -2.120281 3.720281 gt2 | 4.2 1.489966 2.82 0.005 1.279719 7.120281 _cons | 50.6 1.140175 44.38 0.000 48.3653 52.8347 -------------+-------------------------
13、 sigma_u | 1.9300259 sigma_e | 1.6658331 rho | .57307692 (fraction of variance due to u_i) ------------------------------------------------------------------------------ 由此得到下列统计结论: 在服药前,A组的体重总体均数的估计值为50.6(kg) 服药3个月时,A组的体重改变量的总体均数
14、为b1的估计值为-1.8(kg),P值=0.088>0.05,因此没有足够证据推断在服用A药3个月时,服用A药的人群平均体重发生改变。 服A药6个月时,A组的体重改变量的总体均数为b2的估计值为-8(kg),P值<0.001,因此可以认为在服用A药6个月时,服用A药人群的平均体重已有下降。 服药前两组平均体重的差异的估计值为-0.4(kg),相应的P值为=0.804>0.05,差别无统计学意义。 服药3个月时,服药A药和服拥B药的两个人群平均体重下降的差异的估计值为0.8,P值=0.591,差异无统计学意义。 服药6个月时,服药A药和服拥B药的两个人群平均体重下降的差异的估计值为4.2
15、P值=0.005<0.05,差异有统计学意义。 服用A药和B药在各个时间的总体均数估计见表3。 表3 在各个时间点的两组总体均数及其估计值 A组(g=0) B组(g=1) B组-A组 两组差异检验 服药前 (t1=0,t2=0) 服药3个月时 (t1=1,t2=0) 服药6个月时 (t1=0,t2=1) 总体 均数 总体均数 估计值 总体 均数 总体均数 估计值 总体 均数之差 总体均数 估计值 P值 50.6 50.2 -0.4 0.804 48.8 49.2 0.4 0.804 42
16、6 46.4 3.8 0.018 注:表中均数估计值是参数估计值和总体均数参数表达式计算所得。如:服药3个月时A组的总体均数估计值=50.6-1.8=48.8。 服药后的2个时间点的两组平均体重比较的Stata统计检验命令和输出结果如下 设a=0.05 服药3个月时的两组平均体重比较的Stata命令和输出结果如下: test g+gt1=0 (H0:=0 即服药3个月时的两组体重总体均数相等) ( 1) g + gt1 = 0.0 chi2( 1) = 0.06 Prob > chi2 = 0.
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818