收藏 分销(赏)

广义估计方程.pptx

上传人:天**** 文档编号:4311282 上传时间:2024-09-05 格式:PPTX 页数:35 大小:128.98KB
下载 相关 举报
广义估计方程.pptx_第1页
第1页 / 共35页
广义估计方程.pptx_第2页
第2页 / 共35页
点击查看更多>>
资源描述
广义估计方程主要内容主要内容n n一、广义线性模型简介 1)一般线性模型 2)广义线性模型n n二、广义估计方程 1)纵向资料 2)广义估计方程 3)应用举例一、广义线性模型简介一、广义线性模型简介1)一般线性模型 一般线性模型一般线性模型(general linear model)(general linear model),简称线性,简称线性模型模型(linear model)(linear model),是数理统计学中发展较早、理,是数理统计学中发展较早、理论丰富而且应用性很强的一个重要分支。论丰富而且应用性很强的一个重要分支。方差分析方差分析 一般线性模型一般线性模型 多元回归模型等多元回归模型等一般线性模型一般线性模型应用:用于研究某个指标用于研究某个指标(应变量,记为应变量,记为Y Yi i)与一组指与一组指标标(Xi1(Xi1,Xi2Xi2,Xij)Xij)之间的线性关系。之间的线性关系。表达式:yi=0+1Xi1+2Xi2+jXij+ei 一般线性模型一般线性模型一般线性模型对于残差分布的三个重要假设:一般线性模型对于残差分布的三个重要假设:(1)(1)独立独立 (2)(2)符合正态分布,且均数为符合正态分布,且均数为0 0 (3)(3)方差齐性,即方差齐性,即ei的方差相等的方差相等一般线性模型一般线性模型局限性:线性模型只能拟合应变量服从正态分布的资线性模型只能拟合应变量服从正态分布的资料,如果应变量是分类变量,或不服从正态分布料,如果应变量是分类变量,或不服从正态分布的变量,线性模型则不能适用。的变量,线性模型则不能适用。广义线性模型广义线性模型 2)广义线性模型 概念:概念:很多非线性模型,如指数模型、很多非线性模型,如指数模型、LogisticLogistic回归模型,如回归模型,如对应变量作一定的变量变换可满足或近似满足线性模型分对应变量作一定的变量变换可满足或近似满足线性模型分析的要求,能够借助线性模型的分析思路解决模型构造、析的要求,能够借助线性模型的分析思路解决模型构造、参数估计和模型评价等一系列问题。这就是广义线性模型参数估计和模型评价等一系列问题。这就是广义线性模型(generalized linear model)(generalized linear model)广义线性模型广义线性模型模型构造:(1)(1)应变量,相互独立,服从指数分布族,方差能够应变量,相互独立,服从指数分布族,方差能够表达为均数的函数。应变量的期望值记为:表达为均数的函数。应变量的期望值记为:E(YE(Yi i)=)=i i。(2)(2)线性部分,即自变量的线性组合,线性部分,即自变量的线性组合,为待求的参数为待求的参数向量。向量。i i=0 0+1 1X Xi1 i1+2 2X Xi2 i2+j jX Xij ij=X=X i i 广义线性模型广义线性模型(3)(3)联接函数联接函数(link function)(link function),将应变量的期望值和线性,将应变量的期望值和线性预测值预测值i i关联起来。关联起来。g g(i i )=i i=0 0+1 1X Xi1 i1+2 2X Xi2 i2+j jX Xij ij g(.g(.)是联接函数,联接函数的作用就是对应变量作是联接函数,联接函数的作用就是对应变量作变换使之符合正态分布,变量变换的类型依应变变换使之符合正态分布,变量变换的类型依应变量的分布不同而不同。通过指定应变量的分布和量的分布不同而不同。通过指定应变量的分布和联接函数,就可以拟合各种不同的模型。联接函数,就可以拟合各种不同的模型。广义线性模型广义线性模型表表1 1 常见的概率分布和联接函数常见的概率分布和联接函数分布分布 联接函数联接函数 数学表达式数学表达式 模型模型正态分布正态分布 恒等函数恒等函数 =多元线性回归模型多元线性回归模型二项分布二项分布 LogitLogit函数函数 LogisticLogistic回归模型回归模型二项分布二项分布 ProbitProbit函数函数 =-1-1()ProbitProbit回归模型回归模型PossionPossion分布分布 对数对数 =log(=log()PossionPossion回归模型回归模型广义线性模型广义线性模型优点:广义线性模型不仅可以用于拟合应变量服从广义线性模型不仅可以用于拟合应变量服从正态分布的模型,还可以拟合应变量服从二项分正态分布的模型,还可以拟合应变量服从二项分布、布、PoissonPoisson分布、负二项分布等指数分布族的模分布、负二项分布等指数分布族的模型,通过指定不同的联接函数,把指数分布族的型,通过指定不同的联接函数,把指数分布族的众多模型统一到一个模型框架中,具有极大的灵众多模型统一到一个模型框架中,具有极大的灵活性,其应用也日趋广泛。活性,其应用也日趋广泛。纵向数据纵向数据 概念:纵向数据纵向数据(longitudinal data)(longitudinal data)是按照时间顺序对是按照时间顺序对个体进行重复测量得到的资料。个体进行重复测量得到的资料。比如儿童的生长监测资料,出生后每月测量比如儿童的生长监测资料,出生后每月测量其体重其体重(Y(Y变量变量)以及影响体重的因素以及影响体重的因素(X(X变量,如性变量,如性别、喂养、疾病等别、喂养、疾病等),这样每个儿童的多次测量值,这样每个儿童的多次测量值称为纵向数据的一个串称为纵向数据的一个串(cluster)(cluster),是由一组,是由一组Y Y变量变量(各次测定的体重各次测定的体重)和一组相对应的和一组相对应的X X变量组成。变量组成。纵向数据纵向数据纵向数据特点:同一对象的多次观测之间呈相关倾向同一对象的多次观测之间呈相关倾向 因而,纵向数据与一般的多元应变量的资料因而,纵向数据与一般的多元应变量的资料不同,因为它的反应变量之间高度相关。也有别不同,因为它的反应变量之间高度相关。也有别于时间序列数据,纵向数据是由每个个体的重复于时间序列数据,纵向数据是由每个个体的重复测量数据,按时间顺序组成较短的序列,并由大测量数据,按时间顺序组成较短的序列,并由大量这样的序列组成,而时间序列数据是很多各数量这样的序列组成,而时间序列数据是很多各数据组成一个长的序列。据组成一个长的序列。纵向数据纵向数据 传统的统计方法一般都要求应变量是独立的,因而,由于应变量之间的相关,纵向数据不能用传统的方法来分析。因为如果忽略重复测量间的相关性,将损失数据中的信息,参数估计可能不准确。因此,Liang和Zeger等创立了广义估计方程(generalized estimating equations)。广义估计方程广义估计方程2)广义估计方程 应用:广义估计方程是在广义线性模型的基础上发展广义估计方程是在广义线性模型的基础上发展起来的、专用于处理纵向数据的统计模型。广义起来的、专用于处理纵向数据的统计模型。广义估计方程可以对符合正态分布、二项分布等多种估计方程可以对符合正态分布、二项分布等多种分布的应变量拟合相应的统计模型,解决了纵向分布的应变量拟合相应的统计模型,解决了纵向数据中应变量相关的问题,得到稳健的参数估计数据中应变量相关的问题,得到稳健的参数估计值。值。广义估计方程广义估计方程一、模型的基本构成 假设假设Y Yij ij为第为第i i个个体的第个个体的第j j次测量的变量次测量的变量(i=1,(i=1,k,j=1,k,j=1,t)t),Y Yi i=(Y=(Yi1 i1,Y,Yi2 i2 Y Yij ij),X Xij ij=(X=(Xij1 ij1 X Xijpijp),为对应于,为对应于Y Yij ij的的p1p1维解释变量向量。如果维解释变量向量。如果解释变量在各个观察时刻不变解释变量在各个观察时刻不变(比如性别比如性别),则,则X Xi1pi1p=X=Xi2p i2p =X=Xijpijp。如果。如果j j时刻没有观测值,则时刻没有观测值,则Y Yij ij和和X Xij ij都缺失。都缺失。广义估计方程广义估计方程模型构成如下:(1)(1)指定指定Y Yij ij的边际期望的边际期望(marginal expectation)(marginal expectation)是协变是协变量量X Xij ij线性组合的已知函数。线性组合的已知函数。E(YE(Yij ij)=)=ij ij,g(,g(ij ij)=)=0 0+1 1X Xij1ij1+2 2X Xij2ij2+p pX Xijpijp 式中:式中:g(.)g(.)称为联接函数;称为联接函数;=(=(1 1 p p)为模型需为模型需要估计的参数向量。要估计的参数向量。广义估计方程广义估计方程(2)(2)指定指定Y Yij ij边际方差边际方差(marginal variance)(marginal variance)是边际期望是边际期望的已知函数。的已知函数。Var(YVar(Yij ij)=V()=V(ij ij)式中:式中:V(.)V(.)为已知函数;为已知函数;为尺度参数为尺度参数(scale(scale parameter)parameter),表示,表示Y Y的方差不能被的方差不能被V(V(ij ij)解释的部分解释的部分。这个参数也是需要模型估计的,对二项分布。这个参数也是需要模型估计的,对二项分布和和PoissonPoisson分布而言,分布而言,=1=1。广义估计方程广义估计方程(3)(3)指定指定Y Yij ij协方差是边际均数和参数协方差是边际均数和参数 的函数。的函数。Cov(YCov(Yis is,Y,Yit it)=c()=c(is is,it it;);)式中:式中:c(.)c(.)为已知函数;为已知函数;又叫相关参数又叫相关参数 (correlation parameter)(correlation parameter);s s和和t t分别表示第分别表示第s s次和第次和第t t次测量。次测量。广义估计方程广义估计方程 构造如下广义估计方程为:构造如下广义估计方程为:求解方程求解方程Var(YVar(Yij ij)=V()=V(ij ij)可得到可得到 的一致性估计。其的一致性估计。其中中V Vi i表示作业协方差矩阵表示作业协方差矩阵(working covariance matrix)(working covariance matrix),并有,并有 式中:式中:R Ri i()()是是Y Yij ij的作业相关矩阵的作业相关矩阵(working correlated(working correlated matrix)matrix);A Ai i是以是以V(V(ij ij)为第为第i i个元素的个元素的t t维对角矩阵。维对角矩阵。广义估计方程广义估计方程二、作业相关矩阵 作业相关矩阵是广义估计方程中的一个重要作业相关矩阵是广义估计方程中的一个重要概念,表示的是因变量的各次重复测量值两两概念,表示的是因变量的各次重复测量值两两之间相关性的大小,常用之间相关性的大小,常用R Ri i(a)(a)表示,是表示,是tttt维对维对角阵,角阵,t t是总测量次数。其第是总测量次数。其第s s行第行第t t列的元素表列的元素表示示Y Yis is和和Y Yit it的相关,尽管个体之间的相关性可能的相关,尽管个体之间的相关性可能不尽相同,不尽相同,R Ri i(a)(a)近似地表示个体之间平均的相关。近似地表示个体之间平均的相关。广义估计方程广义估计方程 作业相关矩阵的形式常有以下几种,其中s、t表示测量次数,Rst表示第s次和第t次测量之间的相关系数,如果s=t,则Rst=1。(1)独立(independent),即不相关(uncorrelated)。Rst=0,st 就是假设应变量之间不相关。广义估计方程广义估计方程 (2)(2)等相关,或可交换的相关等相关,或可交换的相关(exchangeable(exchangeable correlation)correlation)。R Rst st=,st st 假设任意两次观测之间的相关是相等的。这种假设任意两次观测之间的相关是相等的。这种假设常用于不依时间顺序的重复测量资料,比如假设常用于不依时间顺序的重复测量资料,比如说测量血压,间隔说测量血压,间隔5 5分钟连续测分钟连续测3 3次,次,3 3次测量结果次测量结果有相关,但与时间的先后顺序可能无关。有相关,但与时间的先后顺序可能无关。广义估计方程广义估计方程 (3)不确定型相关(unstructured correlation)。即不预先指定相关的形式,让模型根据资料的特征自己估计。另外,还有两种不太常用的相关形式:稳态相关(stationary correlation)和自回归过程(autoregressive process),此处不再作介绍。广义估计方程广义估计方程作业相关矩阵的使用:作业相关矩阵的形式在拟合模型之前预先设定作业相关矩阵的形式在拟合模型之前预先设定好,模型拟合完毕时会计算出具体的相关矩阵。好,模型拟合完毕时会计算出具体的相关矩阵。假设等相关的情况下,计算的相关矩阵除了对角假设等相关的情况下,计算的相关矩阵除了对角线上的元素外,其他的元素都相等,即任两次观线上的元素外,其他的元素都相等,即任两次观测的相关是相同的。如果假设独立,则矩阵对角测的相关是相同的。如果假设独立,则矩阵对角线以外元素都为线以外元素都为0 0。广义估计方程广义估计方程广义估计方程的特性:只要联接函数正确,总观测次数足够大,即只要联接函数正确,总观测次数足够大,即使使R Ri i()()指定不完全正确,指定不完全正确,的可信区间和模型的其的可信区间和模型的其他统计量仍然渐近正确。因而作业相关矩阵的选他统计量仍然渐近正确。因而作业相关矩阵的选择对参数估计的影响不大。择对参数估计的影响不大。广义估计方程广义估计方程三、模型求解过程(1)(1)假设重复测量值独立,按照广义线性模型计算出假设重复测量值独立,按照广义线性模型计算出,作为,作为 的初始值,相当于普通最小二乘法估的初始值,相当于普通最小二乘法估计。计。(2)(2)基于标准化残差基于标准化残差g gij ij和假设的相关结构和假设的相关结构R R,计算作,计算作业相关矩阵和作业协方差阵。业相关矩阵和作业协方差阵。(3)(3)根据当前的作业协方差阵,修正根据当前的作业协方差阵,修正 的估计。的估计。(4)(4)重复重复(2)(2)、(3)(3)过程直至收敛。过程直至收敛。应用举例应用举例 为了解某抗癫痫药物的作用,对为了解某抗癫痫药物的作用,对5858名癫痫病名癫痫病人进行临床试验,对照组使用安慰剂。观察病人进行临床试验,对照组使用安慰剂。观察病人在连续人在连续8 8周内的发作次数,作为基线发作次数周内的发作次数,作为基线发作次数(base)(base)。然后给病人服药,记录服药后每。然后给病人服药,记录服药后每2 2周的发周的发作次数作次数(visitk1visit4)(visitk1visit4),一共观察了,一共观察了8 8周,所得资周,所得资料如表料如表2 2及表及表3 3。请分析该药物是否有抑制癫痫。请分析该药物是否有抑制癫痫发作的作用。发作的作用。应用举例应用举例表表2 2 某药物抗癫痫的随机对照临床试验对照组每某药物抗癫痫的随机对照临床试验对照组每2 2周的发作次数周的发作次数 ID Base Visit1 Visit2 Visit3 Visit4ID Base Visit1 Visit2 Visit3 Visit4 1 11 5 3 3 3 1 11 5 3 3 3 2 11 3 5 3 3 2 11 3 5 3 3 3 6 2 4 0 5 3 6 2 4 0 5 26 9 2 1 2 1 26 9 2 1 2 1 27 10 3 1 4 2 27 10 3 1 4 2 28 47 13 15 13 12 28 47 13 15 13 12应用举例应用举例表表3 3 某药物抗癫痫的随机对照临床试验试验组每某药物抗癫痫的随机对照临床试验试验组每2 2周的发作次数周的发作次数 ID Base Visit1 Visit2 Visit3 Visit4ID Base Visit1 Visit2 Visit3 Visit4 29 76 11 14 9 8 29 76 11 14 9 8 30 38 8 7 9 4 30 38 8 7 9 4 31 19 0 4 3 0 31 19 0 4 3 0 56 25 2 3 0 1 56 25 2 3 0 1 57 13 0 0 0 0 57 13 0 0 0 0 58 12 1 4 3 2 58 12 1 4 3 2应用举例应用举例 这种发作次数的资料也叫作计数资料,一般认为服从Poisson分布。不同病人可以认为是独立的,而同一个病人的各次发作次数是前后相关的。应而考虑以发作次数为应变量,指定应变量分布为Poisson分布,联接函数为对数,作业相关矩阵指定为等相关,拟合广义估计方程。总结总结 广义估计方程是在广义线性模型基础上发展起来的,因而具有广义线性模型的优点,可接受多种分布的应变量,通过不同的联接函数拟合多种形式的广义估计方程。同时,广义估计方程很好的解决了纵向数据的相关性问题,因而广泛应用于具有多次重复测量的纵向数据分析。总结总结其特点归纳如下:1)1)建模稳健。即使作业相关矩阵指定不正确,建模稳健。即使作业相关矩阵指定不正确,只要联接函数正确,仍然可以得到稳定的参数估只要联接函数正确,仍然可以得到稳定的参数估计值。计值。2)2)充分利用资料信息。对多次重复测量的纵向充分利用资料信息。对多次重复测量的纵向数据,广义估计方程利用了每次测量的结果,较数据,广义估计方程利用了每次测量的结果,较少损失资料的信息。少损失资料的信息。总结总结 3)3)应变量不是连续性变量时,考察应变量之间应变量不是连续性变量时,考察应变量之间联合分布和协方差矩阵非常困难,常规的统计模联合分布和协方差矩阵非常困难,常规的统计模型难以处理这个问题。利用广义估计方程不仅解型难以处理这个问题。利用广义估计方程不仅解决了这类资料的建模问题,还可得到相关矩阵以决了这类资料的建模问题,还可得到相关矩阵以衡量重复测量之间相关性的大小,是一种较好的衡量重复测量之间相关性的大小,是一种较好的分析策略。分析策略。4)4)模型可以引入多种形式的自变量,考察分类、模型可以引入多种形式的自变量,考察分类、等级、连续的或其他形式的自变量对应变量影响等级、连续的或其他形式的自变量对应变量影响的大小。的大小。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服