收藏 分销(赏)

第9讲--协方差分析与混合线性模型.ppt

上传人:二*** 文档编号:12817995 上传时间:2025-12-10 格式:PPT 页数:38 大小:869KB 下载积分:5 金币
下载 相关 举报
第9讲--协方差分析与混合线性模型.ppt_第1页
第1页 / 共38页
本文档共38页,全文阅读请下载到手机保存,查看更方便
资源描述
单击此处编辑母版标题样,单击此处编辑母版文本样式单击此处编辑母版文本样式,第9讲 协方差分析与混合线性模型,理学院,汪晓银 教授,如果在单因素、双因素或多因素试验中有无法控制的因素,x,影响试验的结果Y,且,x,可以测量、,x,与Y之间又有显著的线性回归时,常常利用线性回归来矫正Y的观测值、消去,x,的差异对Y的影响。,例如,研究施肥对苹果树产量的影响,由于苹果树的长势不齐,必须消去长势对产量的影响。又如,研究饲料对动物增重的影响,由于动物的初重不同,必须消去初重对增重的影响。,协方差分析,这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计控制,可以作为试验控制的辅助手段。以统计控制为目的,综合线性回归分析与方差分析所得到的统计分析方法,称为协方差分析,所需要统计控制的一个或多个因素,例如苹果树的长势,又如动物的初重等等称为协变量。,1 协方差分析思想原理,2 单因素协方差分析-理论,2 单因素协方差分析-理论,2 单因素协方差分析-理论,2 单因素协方差分析-理论,2 单因素协方差分析-计算,data,ex;do a=,1,to,3,;do i=,1,to,8,;,input x y ;output;end;end;,cards;,47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53 66,;,proc,glm,;class a;model y=x a/solution;,lsmeans a/stderr pdiff;,run,;,2 单因素协方差分析-计算,2 单因素协方差分析-计算,施用三种肥料的产量矫正后有极显著的差异,2 单因素协方差分析-计算,3双因素协方差分析-不考虑交互作用,方差来源,平方和,自由度,均方和,F值,显著性,A,QA,r-1,MQA,F,A,B,QB,s-1,MQB,F,B,误差,QE,rs-r-s,MQE,总和,QT,rs-2,3双因素协方差分析-不考虑交互作用,data ex;do a=1 to 3;do b=1 to 5;,input x y ;output;end;end;,cards;,8 2.85 10 4.24 12 3.00 11 4.94 10 2.88,10 3.14 12 4.50 7 2.75 12 5.84 10 4.06,12 3.88 10 3.86 9 2.82 10 4.94 9 2.89,;,proc glm;class a b;model y=x a b/solution;,lsmeans a b/stderr pdiff;run;,3双因素协方差分析-不考虑交互作用,3双因素协方差分析-不考虑交互作用,方差来源,平方和,自由度,均方和,F值,显著性,A,0.6046,2,0.3023,2.49,N,B,7.1245,4,1.7811,14.66,*,误差,0.8502,7,0.1215,总和,8.5793,1,各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。,3双因素协方差分析-不考虑交互作用,方差来源,平方和,自由度,均方和,F值,显著性,A,QA,r-1,MQA,F,A,B,QB,s-1,MQB,F,B,AB,QAB,(r-1)(s-1),MQAB,F,AB,误差,QE,rs(m-1)-1,MQE,总和,QT,rsm-2,4双因素协方差分析-考虑交互作用,4双因素协方差分析-考虑交互作用,data ex;do a=1 to 4;do b=1 to 2;,do i=1 to 2;input x y;output;end;end;end;,cards;,14.6 97.8 12.1 94.2 19.5 11.2 18.8,110.1 1.6 100.3 12.9 98.5 18.5 119.4,12.2 114.7 12.8 99.2 10.7 89.612.2,122.2 16.9 105.3 12.0 102.1 12.4 103.8,16.4 117.2 17.2 117.9,proc glm;class a b;model y=x a b,a*b/solution;lsmeans a b/stderr pdiff;,run;,4双因素协方差分析-考虑交互作用,4双因素协方差分析-考虑交互作用,方差来源,平方和,自由度,均方和,F值,显著性,A,277.43485,3,92.478286,6.51,*,B,2.845259,3,2.845259,0.20,N,AB,12.848100,1,4.282700,0.30,N,误差,99.441171,7,14.205882,A与B的交互作用矫正后不显著,促生长剂之间的差异极显著,试验批次间的差异不显著,4双因素协方差分析-考虑交互作用,3.混合线性模型,通过一个例子讲述混合线性模型的使用,艾滋病疗法的评价,艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。,艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”,英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。,3.混合线性模型,艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。,迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。,3.混合线性模型,请你完成以下问题:,(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。,(2),利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。,(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。,3.混合线性模型,ID 疗法 年龄 时间 Log(CD4 count+1),1236.427103.1355,1236.42717.57143.0445,1236.427115.57142.7726,1236.427123.57142.8332,1236.427132.57143.2189,1236.4271403.0445,2447.846703.0681,2447.846783.8918,2447.8467163.9703,2447.8467233.6109,2447.846730.71433.3322,2447.8467393.0910,3160.287503.7377,4336.596904.1190,4336.59697.14294.1109,4336.596916.14294.7095,3.混合线性模型,1对4种疗法的疗效评价的分析,对题目所给的附件2的数据进行分析可知,决定病人的CD4的浓度的因素有年龄,检查的时刻,治疗方案这三个因素。因此我们将年龄分成5类,检查的时刻分为4个时间段,治疗方案有4种。而问题是以CD4的浓度为标准来评价疗效的优劣,即CD4的浓度越大,那么疗效越好。由于考虑题中所给的样本有6000多个(病人的个数*各个病人检查的次数),因此我们考虑用MIXED(混合线性模型)。下面我们就混合线性模型的原理进行说明。,3.混合线性模型,混合线性模型过程是拟合许多不同数据的混合线性模型,并利用所拟合的模型对数据进行统计推断。,首先混合线性模型的主要假设是数据服从正态分布,由于本题所给的数据的样本容量有6000多个,因此,我们可认为它服从正态分布。又由于正态分布的数据可完全有均值和方差确定,因此一个混合线性模型是由两个模型决定的。分别是均值模型和方差模型。MIXED使用约束最大似然的方法来拟合数据的。一旦数据的模型已经建立,我们可以使用该模型通过固定效应参数和协方差参数进行统计推断。用这些统计量可以对模型进行评价。,3.混合线性模型,再者,该分析的重要假设是数据是正态分布的,由于我们将附录2的数据进行了分类。由于数据出现在类(如可能是同一年龄段中),那可能的情况是来自同一年龄段的这些CD4的值是相关的,不是独立的。鉴于此,由于附录2所给的数据是高度数据(即样本容量很大),那么考虑这种因素是相关。因此我们对这些因素进行相关性建模,我们使用随机效用。在本题中,我们规定年龄、检查时刻为随机效应,即使得具有相同年龄水平或相同检查时刻的水平之间存在共同的相关性,那么,此模型才较为合理。,3.混合线性模型,2 对4种疗法的疗效模型的建立,1)数据的处理,a、所有病人的年龄是在14.9021,74.193的区间内,以(74.193-14.9021)/5=11.85818为区间长度。我们将患者按照年龄阶段分为5级,分别记作1至5(如表4所示);,b、我们将患者所接受的治疗方法分为4种,分别记作1至4;,c、我们将病人的检查的时刻0,40以10为区间长度,分为4级,分别记作1至4,3.混合线性模型,3.混合线性模型,2)确定固定效应和随机效应,固定效用是设计者所研究的因素,在此题中为4种疗法。因为病人的年龄是随机的,并且病人接受检验的时刻是也是随机进行的,故病人的年龄和病人接受检验的治疗时刻应该为随机效应。,3.混合线性模型,3)协方差结构的选择,模型中具体选用哪种结构矩阵:在相同模型结构下,选择几个不同结构的协方差矩阵,从中选取似然比统计量(-2Log Likeli-hood)、Akaikes Information Schwartz Bayesian三个指标均较小的一个,通常以AIC为主要判断指标。依据专业知识和既往文献,在此模型中选用符合对称结构CS、不规则结构UN、一阶自回归结构AR(1)、空间幂相关结构 SP(POW)。,3.混合线性模型,4)建立混合线性模型的线性模型,如下:,3.混合线性模型,data,ex;input name a x1 x2 y;,if x1,26.76,then x1=,1,;if,26.76,=x1,41.662,then x1=,2,;,if,41.662,=x1,56.56,then x1=,3,;if,56.56,=x1,71.467,then x1=,4,;,if,71.467,=x1 then x1=,5,;if x2,10,then x2=,1,;,if,10,=x2,20,then x2=,2,;if,20,=x2,30,then x2=,3,;if,30,=x2 then x2=,4,;,cards;,1 2 36.4271 0 3.1355,1 2 36.4271 7.5714 3.0445,1 2 36.4271 15.5714 2.7726,1 2 36.4271 23.5714 2.8332,3.混合线性模型,1313 1 15.8412 20 4.4067,1313 1 15.8412 27 3.5553,1313 1 15.8412 35 3.4657,;,proc,glm,;class a x1 x2;model y=a x1 x2;,means a/duncan;,proc,mixed,;class a x1 x2;model y=a;,random x1 x2;,lsmeans a;,run,;,3.混合线性模型,3.混合线性模型,3.混合线性模型,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 环境建筑 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服