收藏 分销(赏)

贝叶斯空间同质回归模型.pdf

上传人:自信****多点 文档编号:604238 上传时间:2024-01-12 格式:PDF 页数:15 大小:2.44MB
下载 相关 举报
贝叶斯空间同质回归模型.pdf_第1页
第1页 / 共15页
贝叶斯空间同质回归模型.pdf_第2页
第2页 / 共15页
贝叶斯空间同质回归模型.pdf_第3页
第3页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、应用概率统计第 39 卷第 4 期2023 年 8 月Chinese Journal of Applied Probability and StatisticsAug.,2023,Vol.39,No.4,pp.491-505doi:10.3969/j.issn.1001-4268.2023.04.002贝叶斯空间同质回归模型陈梦瑶戴微金百锁(中国科学技术大学管理学院统计与金融系,合肥,230026)摘要:对于高维空间回归问题,本文提出了一种有效的稀疏贝叶斯模型.通过引入分层高斯马尔可夫随机场先验,模型可以获取稀疏的空间变化参数,同时对于相邻的空间区域也可以获取同质的参数.相较于传统的采样方法,

2、本文采用一种快速收敛的变分 EM 算法进行后验推断.对于 M 步,最优化问题可以通过简单的变形转化为经典的自适应 lasso 问题进行快速求解.通过数值模拟可以发现模型在参数估计和变量选择问题上取得较好的效果.最后模型用来分析欧洲社会人口学因素对各国新冠死亡率的影响.关键词:空间回归;贝叶斯;高斯马尔可夫随机场;同质性;变分 EM中图分类号:O212.8英文引用格式:CHEN M Y,DAI W,JIN B S.Bayesian spatial homogeneous regressionJ.ChineseJ Appl Probab Statist,2023,39(4):491505.(in

3、Chinese)1引言空间数据分析在地球科学、生物医学以及流行病学等领域得到了广泛的应用.不同于传统的回归模型,在空间回归分析中,数据来源于较大的空间区域,因此往往假设解释变量是随空间变化的.由于邻域间的相互影响,解释变量也会表现出同质性,即相邻位置的系数相近.对于高维的空间回归分析模型,如何学习稀疏的空间同质参数是一项重要的研究.为获得空间变化的回归系数,许多学者提出了有效的方法.Gelfand 等1提出了 SVC(spatially varying coefficient,空间变系数)模型.Fotheringham 等2在最小二乘回归的基础上提出了 GWR(geographically w

4、eighted regression,地理加权回归)模型,该模型对每一个观察值进行局部拟合.给定线性模型,响应变量为 Y,设计矩阵为 X,可以得到空间第i 个位置系数的估计值为bi=(XTWiX)1XTWiY,其中 Wi为对角权重矩阵,定义在到点 i 距离上的核函数.Tibshirani 和 Taylor3提出了一种广义的 lasso 方法通过惩罚空间相邻参数差值的 1范数(i,j)Ei j1,其中 E 表示空间相邻的点组成的边集合.Li等4提出了一种基于网络的惩罚 T0L0来获得网络聚类的截距项,其中 L 为拉普拉斯矩阵.更一般的情形,对于所有的变量,Tang 和 Song5提出了一种基于

5、fused lasso 的系数聚国家自然科学基金项目(批准号:7201101228、71873128)资助.通讯作者,E-mail:.本文 2021 年 5 月 24 日收到,2022 年 1 月 12 日收到修改稿.492应用概率统计第 39 卷类方法来学习同质的参数模型.在此基础上,Li 和 Sang6提出了 SCC(spatially clusteredcoefficient,空间聚类系数)回归模型,该模型首先基于空间权重矩阵构造最小生成树,使得连接的边数减少为 n 1,其中 n 为空间样本总数.在获得空间点的拓扑关系后,可将模型转化为经典的 lasso 问题进行求解,相比于广义 las

6、so 方法,在运算速度上有了较大的提高.然而,上述方法都旨在获取空间系数的同质性,无法得到稀疏的模型.在贝叶斯框架下,得益于贝叶斯变量选择方法的发展:贝叶斯 lasso7以及 spike-and-slab 变量选择8等.许多贝叶斯模型被应用于高维空间回归分析中.Andersen 等9提出了分层的结构化 spike-and-slab 先验来获取结构化的稀疏模型,通过为稀疏参数引入空间高斯过程分层先验.Kim 和 Gao10提出的 spike-and-slab 图拉普拉斯先验可以得到基于图的结构化光滑系数,但是模型缺乏稀疏性.以上模型都能获得结构化的同质参数估计,然而都只适用于空间单响应变量情形.

7、基于上述贝叶斯方法,对于高维空间多响应变量回归问题,本文提出一种新的贝叶斯模型.模型首先引入高斯马尔可夫随机场先验,该先验由两部分组成:spike-and-slab 混合高斯先验获取参数的稀疏性和 spike-and-slab 图拉普拉斯先验获取参数的同质性.然后对于稀疏性和同质性概率参数给定分层二项分布先验.由于贝叶斯方法的灵活性,模型对不同的变量可以产生不同程度的稀疏性,具有较好的变量选择能力.此外,该模型对于不同的空间领域产生不同程度的同质性,因此该模型可以在保证参数同质性的同时,也可以发现空间的突变结构(相邻的参数产生较大的变化).本文采用近似的变分 EM 算法11来进行后验推断,相比

8、于 MCMC 采样贝叶斯推断方法,该算法能够快速收敛.在算法的 M 步,模型通过变形可以转化为经典的自适应 lasso 问题,从而进一步提高运算速度.本文结构如下:第 2 节介绍了贝叶斯框架下的多变量空间回归模型,在给定各参数的先验分布后,提出一种快速的变分 EM 方法来进行后验推断;第 3 节对两种不同的空间网络产生模拟数据,通过对比不同的经典空间回归方法,验证第二节提出的模型有效性;第 4节将提出的模型应用于欧洲新冠死亡率分析,研究各国社会人口学因素对死亡率的影响;第 5 节提供了对该模型的一些总结以及未来的研究方向.2模型与方法给定空间 n 个位置 s1,s2,sn R2的观测数据(x(

9、si),y(si),i=1,2,n,其中 x(si)=(x1(si),x2(si),xp(si)T为 p 维解释变量,y(si)为空间相关的响应变量.对于位置 si,给定线性回归模型y(si)=pk=1xk(si)k(si)+(si),其中 k(si)为空间变化的回归系数,误差项(si)独立同分布地服从均值为 0、方差为 2的正态分布.本文的模型设定中,回归系数具有空间同质性,即相邻位置的系数相近.在贝第 4 期陈梦瑶,等:贝叶斯空间同质回归模型493叶斯空间回归模型框架下,样本的似然函数为p(y(s1),y(s2),y(sn)|)ni=1expy(si)pk=1xk(si)k(si)222.

10、2.1模型先验对于回归系数 k=(k(s1),k(s2),k(sn)T,k=1,2,p,我们引入高斯马尔可夫随机场先验12,13形式为p(k|Vk)expTkVkk2,k=1,2,p,其中 Vk为精度矩阵,由两部分组成.k先验分布可以表示为如下形式:p(k|V)expni=12k(si)22ki+(i,j)Ek(si)k(sj)22v2kij,k=1,2,p,(1)其中 E=(i,j):s(i),s(j)相连,1 6 i 6 j 6 n 为图的边集合.公式(1)中第二部分为图拉普拉斯先验,给定方差参数的分层先验,v2kij=(1 kij)v20+kijv21,其中 0 v0 v1为给定的超参数

11、,kij为独立同分布的二元变量 p(kij)=kij(1 )1kij.该部分可以看作 Ro ckov a 和 George8提出的 spike-and-slab 混合高斯先验(图 1(a)的 smooth 版本.当参数 kij=0 时,表示 k(si)k(sj)来自于 spike 部分,系数在空间 s(i)和 s(j)间表现出同质性.当参数为 kij=1 时,表示 k(si)k(sj)来自于 slab 部分,系数在空间 s(i)和s(j)间表现出空间突变性.通过引入二元变量,模型能够自适应地获得空间同质参数,并能发现一些空间的突变结构.公式(1)中第一部分为高斯先验,作为岭回归的贝叶斯对应版本

12、,虽然能将参数压缩到较小的值,但缺乏变量选择能力.根据 Rockova 和 Lesaffre14的先验设置,我们为方差参数 2ki设置 Gamma 分层先验,p(2ki|v2k)exp2ki/(2v2k),有以下积分公式:p(k(si)|vk)0122kiexp2k(si)22kiexp2ki2v2kd2ki exp|k(si)|vk.可以将该先验等价为 spike-and-slab 拉普拉斯15先验(图 1(b),使得模型具有稀疏性,其中 vk=(1 k)v0+kv1,k为独立同分布的二元变量 p(k)=k(1 )1k.当参数k=0,表示 k来自于 spike 部分,第 k 个变量为噪声,被

13、压缩到 0,当参数 k=1,表示k来自于 slab 部分,第 k 个变量为信号.对于误差项方差 2,我们采用共轭逆 Gamma 先验,p(2|0,0)(2)01exp02;对于稀疏性概率以及同质性概率参数 和,我们采用共轭 Beta 先验,p()=a11(1 )b11,p()=a21(1 )b21,其中 0,0,a1,b1,a2,b2为给定的超参数.494应用概率统计第 39 卷(a)(b)图 1(a)为 spike-and-slab 高斯混合先验的 pdf(b)为 spike-and-slab 拉普拉斯混合先验的 pdf2.2变分 EM 算法给定参数的先验分布,以及样本似然函数,可以给出参数

14、的后验分布如下:p(1:p,2,|x(s1,s2,sn),y(s1,s2,sn)=p(1:p,2,x(s1,s2,sn),y(s1,s2,sn)p(x(s1,s2,sn),y(s1,s2,sn)p(y(s1),y(s2),y(sn)|)p(2)pk=1p(k|Vk)p(k)(i,j)Ep(kij)p()p()ni=11expy(si)pk=1xk(si)k(si)222(2)01exp02pk=1expTkVkk2k(1 )1k(i,j)Ekij(1 )1kija11(1 )b11a21(1 )b21.最大化该参数的后验概率,可以采用吉布斯(Gibbs)抽样方法(算法细节见附录 A).但由于参

15、数维度较高,算法收敛速度较慢,因此我们使用快速收敛的 EM 算法进行后验推断.将参数,看成隐变量,算法的关键是求出隐变量的条件概率 p(|1:p,2,),p(|1:p,2,).由图 2 中的贝叶斯网络图可以看出,在给定参数 k时,隐变量 k和 kij不独立,使得条件概率求解困难.我们借助变分推断16来近似复杂的条件概率.根据平均场(mean-filed)理论,我们假设独立的近似分布为q(,)=pk=1q(k|k)(i,j)Eq(kij|kij)=pk=1kk(1 k)1k(i,j)Ekijkij(1 kij)1kij,第 4 期陈梦瑶,等:贝叶斯空间同质回归模型495图 2模型在空间局部位置

16、si,sj处的贝叶斯网络结构(灰色圈表示隐变量,白色圈表示参数和观测值,其余为超参数,箭头表示条件分布)其中k,kij为未知参数.通过最小化分布q(,)和p(,|1:p,2,)之间的KL散度KL(q p)=Eq(,)ln(p(,|1:p,2,)q(,),可以按下式更新参数:bk=q(k=1|bk)=vn1expv11ni=1|k(si)|vn1expv11ni=1|k(si)|+(1 )vn0expv10ni=1|k(si)|,(2)b kij=q(kij=1|b kij)=v11expk(si)k(sj)2(2v21)1v11expk(si)k(sj)2(2v21)1+(1)v10expk(

17、si)k(sj)2(2v20)1.(3)在算法的第 t+1 步迭代中,由第 t 步得到的参数 t1:p,2t,t,t,根据式(2)和(3),可以得到近似的条件概率.对 ln 后验求条件期望,可以得到 Q 函数如下:Q(1:p,2,|t1:p,2t,t,t)=Eq(,)lnp(1:p,2,|x(s1,s2,sn),y(s1,s2,sn)=ni=1y(si)pk=1xk(si)k(si)222pk=1ni=1|k(si)|(1 bkv0+bkv1)pk=1(i,j)Ek(si)k(sj)22(1 b kijv20+b kijv21)(n2+0+1)ln202+(pk=1bk+a1 1)ln+(p

18、pk=1bk+b1 1)ln(1 )+(pk=1(i,j)Eb kij+a2 1)ln+pk=1(i,j)E(1 b kij)+b2 1ln(1 ).(4)496应用概率统计第 39 卷通过最大化 Q 函数更新参数,t+11:p,2t+1,t+1,t+1=argmax1:p,2,Q(1:p,2,|t1:p,2t,t,t).由式(4)可以看出最大化 Q 函数可以对参数 1:p,2,分别进行.首先给定 2t,根据下式更新 t+11:p:t+11:p=argmin1:pni=1y(si)pk=1xk(si)k(si)2+pk=1kni=1|k(si)|+pk=1(i,j)Ekijk(si)k(sj)

19、2,(5)其中,k=22t(1 bk)/v0+bk/v1,kij=2t(1 b kij)/v20+b kij/v21.式(5)的优化过程可以看成 smooth-lasso17和 spline-lasso18在多响应空间回归模型上的推广.通过定义eY=y(s1).y(sn)0p|E|,fX=diagx1(s1),x1(sn)diagxp(s1),xp(sn)eB1.eBp,e=(T1,T2,Tp)T,其中|E|为空间边集合的个数,eBk,k=1,2,p 为定义在图上的入射矩阵(incidence matrix),维度为|E|n,满足下式:eBkk=kijk(si)k(sj)(i,j)E.式(5)

20、的优化过程可以转化为经典的自适应 lasso 问题,惩罚参数由算法的 E 步求出,et+1=argmineeY fXe2+pk=1kni=1|k(si)|.(6)在给定参数 t+11:p,按下式更新 2t+1:2t+1=argmin2ni=1y(si)pk=1xk(si)t+1k(si)222+(n2+0+1)ln2+02=ni=1y(si)pk=1xk(si)t+1k(si)2+20n+2+2.(7)更新 t+1如下:t+1=argmin(pk=1bk+a1 1)ln+(p pk=1bk+b1 1)ln(1 )=pk=1bk+a1 1p+a1+b1 2.(8)第 4 期陈梦瑶,等:贝叶斯空间

21、同质回归模型497同理,更新 t+1如下:t+1=pk=1(i,j)Eb kij+a2 1pk=1(i,j)E1+a2+b2 2.(9)算法 1:变分 EM 算法输入:y1n,Xnp,E输出:初始化:0,20,0,0,t=0while t 30 do#E-stepfor k in 1:p do根据式(2)更新 kfor(i,j)in E do根据式(3)更新 kijend forend for#M-step通过求解式(6)自适应 lasso 更新 t+1根据式(7)更新 2t+1根据式(8),(9)更新 t+1,st+1=t+1if t2 0.001 thenbreakend ift t+1e

22、nd while3数值模拟为验证模型的有效性,我们在模拟数据集上,将两种经典的空间回归模型 GWR、SCC与第二节提出的贝叶斯空间回归模型(记为 BSR)进行比较.我们选取两种不同结构的空间网络:结构 1 为网格结构,在正方形内生成行列各 30 个节点的网格,每个结点只与其上下左右的邻居节点相连;结构 2 为随机结构,在正方形区域内随机地生成 900 个节点,通过对距离设置阈值,来选取邻居节点.设置参数 p=5,=1,2,5,其中 4,5498应用概率统计第 39 卷为噪声变量,在空间所有位置均为 0.系数向量 1,2,3从 2,1,0,0.5,2 里取值,各变量在两种空间结构的分布见图 3

23、和图 4 的第一行.对于空间节点 si,生成 3 维正态向量x1(si),x2(si),x3(si),响应变量为y(si)=1(si)x1(si)+2(si)x2(si)+3(si)x3(si)+(si),其中误差项(si)N(0,0.12).使用不同的模型得到系数的估计值b,选取以下指标作为图 3网格结构下,不同模型 的估计值,从上到下依次为真实值,GWR、SCC 和 BSR 的估计值第 4 期陈梦瑶,等:贝叶斯空间同质回归模型499图 4随机结构下,不同模型 的估计值,从上到下依次为真实值,GWR、SCC 和 BSR 的估计值各模型的平均标准:MSE:=1npni=1pk=1k(si)bk

24、(si)2,500应用概率统计第 39 卷Specificity:=ni=1pk=11(k(si)=0,bk(si)=0)ni=1pk=11(k(si)=0),Sensitivity:=ni=1pk=11(k(si)=0,bk(si)=0)ni=1pk=11(k(si)=0),F1-score:=2 ni=1pk=11(k(si)=0,bk(si)=0)ni=1pk=11(k(si)=0)+1(bk(si)=0).MSE 可用来评价模型参数估计准确率,特异度(Specificity)、敏感度(Sensitivity)和 F1-score 用来评价模型的变量选择能力.在两种网络结构下,使用三种不

25、同的模型估计出的参数分别在图 3 和图 4 中用散点图表示.对于两种网络结构,可以看出三种模型均能恢复参数的空间平滑性,但是 GWR 模型无法发现参数在空间的突变,而且缺乏稀疏性.SCC 模型在网格结构下取得不错的效果,但在随机结构下参数估计效果下降,由于在随机结构中,任意边的权重不相同,相比于网格结构,最小生成树的结构对模型结果影响较大.BSR 在两种网络结构下均有不错的效果,得益于贝叶斯方法的灵活性,模型既能使估计参数具有空间同质性,同时能够发现参数的空间突变性.从表 1 中也可以看出,在两种网络结构下,GWR 和 SCC 模型的特异度较低,由于模型缺乏稀疏性,BSR 有较高的 F1-sc

26、ore,同时取得较小的估计误差.表 1不同网络结构下各模型参数估计评价指标网格结构随机结构GWRSCCBSRGWRSCCBSRMSE0.1010.0920.0840.1290.1510.094特异度0.5130.8470.9740.5530.5830.734敏感度0.9880.9810.9750.9860.9870.980F1-score0.8350.9350.9770.8480.8580.8984实证分析新冠肺炎的爆发,给全球带来了较大的影响.由于新冠肺炎的感染率和死亡率具有较强的空间依赖性,许多学者采用空间回归模型研究和新冠肺炎感染率、死亡率相关的重要因素19,20.我们使用 BSR 模型

27、来分析欧洲各国死亡率与社会人口因素的关系,尝试发现各社会人口因素对各国疫情发展的不同影响程度.我们选取欧洲 28 个国家作为研究对象,数据包含各国从 2019 年 12 月 31 日到 2021 年 5 月 1 日新冠肺炎的每千人死亡数,以及 11个社会人口数据(来源于欧洲统计局).表 2 展示了 11 个社会人口变量以及变量说明,我们对数据进行 ln(1+x)变换以消除不同变量间的异方差性.https:/ec.europa.eu/eurostat/data/database第 4 期陈梦瑶,等:贝叶斯空间同质回归模型501表 2社会人口变量及含义变量名称变量描述贫困风险率可支配收入低于全国平

28、均可支配收入的 60%的人口比例消费物价指数多种商品和服务零售价格的平均变化值青年人口就业率2064 岁的就业人数除以同年龄组的总人口住房成本负担率家庭的总住房费用占家庭可支配总收入的 40%以上的家庭的人口比例长期护理支出长期护理(健康)包括一系列医疗和个人护理服务的支出人口密度年平均人口与土地面积之比老年赡养比率每 100 名工龄人(1564 岁)需要赡养的老人数目人均 GDP国内生产总值和国家人口数的比例研究和发展支出用于研究和发展应用的支出社会保障支出社会保护方面包括社会福利,行政费用等的开支基尼系数进行不平均分配的那部分收入占全部居民收入的比例从图 5 中可以看到,西班牙、爱尔兰、奥

29、地利、克罗地亚、罗马尼亚这些国家平均每一千人的死亡数目最高,其次是比利时、德国、芬兰、希腊等国家,英国、瑞典、捷克这些国家平均每一千人死亡人数较少.死亡人数(每千人)人均 GDP人口密度长期护理支出图 5欧洲各国新冠每千人死亡人数以及各重要回归模型系数的空间分布502应用概率统计第 39 卷模型从社会人口变量中选出了三个显著变量:人均 GDP、人口密度和长期护理支出,均表现出较强的空间同质性.对于人均 GDP,法国、芬兰、捷克、比利时等国家死亡人数受其影响较大,意大利、拉脱维亚、立陶宛、挪威次之,波兰、瑞典等国家受到影响较小;对于人口密度,法国,奥地利,匈牙利等国家受到的影响较高,瑞典、保加利

30、亚等国家受到的影响较小;对于长期护理支出,这和死亡人数呈现负相关,受其影响较高的是德国、丹麦、捷克、奥地利等国家,英国、罗马尼亚、保加利亚等国家受其影响较小.5结论与展望本文提出了一个新的贝叶斯模型用于空间多响应回归分析.通过引入高斯马尔可夫随机场先验,模型能够同时获得空间稀疏性和同质性.由于分层贝叶斯模型的灵活性,通过引入隐变量 和,模型可以自适应地进行变量选择,在保持空间同质性的同时能够发现空间的突变点.本文采取高效的变分 EM 算法代替基于采样的贝叶斯方法,可以降低算法的运行时间.根据本文模型同质性的设定,具有同质性的系数接近,该模型可以推广到空间变点检测问题,使得同质性的系数严格相同.

31、同时通过引入高斯混合模型先验,模型也可以推广到空间聚类问题.附录 AA1Gibbs 抽样1.抽样 k,k=1,2,p,定义Yk=y(s1)l=kxl(s1)l(s1).y(sn)l=kxl(sn)l(sn),Xk=xk(s1).xk(sn),k的条件分布为p(k|)p(y|k)p(k|Vk)exp(Yk Xkk)T(Yk Xkk)+TkVkk2 exp(k k)T1k(k k)2 Gaussian(k,k),其中 k=(XTkXk+Vk)1,k=1kXTkYk.2.抽样 2,从以下条件分布:p(2|)p(y|2)p(2|0,0)第 4 期陈梦瑶,等:贝叶斯空间同质回归模型503(2)(0+n/

32、2)1exp0+ni=1y(si)pk=1xk(si)k(si)22 InvGamma(0+n2,0+ni=1y(si)pk=1xk(si)k(si)2).3.抽样 2ki,i=1,2,n,k=1,2,p,从以下条件分布:p(2ki|)p(k(si)|2ki)p(2ki|v2k)2ki3/2exp2ki k(si)v2k22kiv2k InvGaussian(k(si)vk,v2k).4.抽样 k,k=1,2,p,从以下条件分布:p(k|)ni=1p(2ki|k)p(k|)Bernoulli(v2n1expA(2v21)1v2n1expA(2v21)1+1 v2n0expA(2v20)1),其

33、中 A=ni=12ki.5.抽样 kij,(i,j)E,k=1,2,p,从以下条件分布:p(kij|)p(k|kij)p(kij|)Bernoulli(v11expB(2v21)1v11expB(2v21)1+(1 )v10expB(2v20)1),其中 B=k(si)k(sj)2.6.抽样,从以下条件分布:p(|)pk=1p(k|)p()Beta(pk=1k+a1 1,pk=1(1 k)+b1 1).7.抽样,从以下条件分布:p(|)pk=1(i,j)Ep(kij|)p()Beta(pk=1(i,j)Ekij+a1 1,pk=1(i,j)E(1 kij)+b1 1).参考文献1 GELFAN

34、D A E,KIM H J,SIRMANS C F,et al.Spatial modeling with spatially varying coefficientprocessesJ.J Amer Statist Assoc,2003,98(462):387396.504应用概率统计第 39 卷2 FOTHERINGHAM A S,BRUNSDON C,CHARLTON M.Geographically Weighted Regression:TheAnalysis of Spatially Varying RelationshipsM.New York:Wiley,2002.3 TIBS

35、HIRANI R J,TAYLOR J.The solution path of the generalized lassoJ.Ann Statist,2011,39(3):13351371.4 LI T X,LEVINA E,ZHU J.Prediction models for network-linked dataJ.Ann Appl Stat,2019,13(1):132164.5 TANG L,SONG P X K.Fused lasso approach in regression coefficients clustering learning parameterheteroge

36、neity in data integrationJ.J Mach Learn Res,2016,17(113):123.6 LI F R,SANG H Y.Spatial homogeneity pursuit of regression coefficients for large datasetsJ.JAmer Statist Assoc,2019,114(527):10501062.7 PARK T,CASELLA G.The Bayesian lassoJ.J Amer Statist Assoc,2008,103(482):681686.8 ROCKOVA V,GEORGE E I

37、.EMVS:the EM approach to Bayesian variable selectionJ.J AmerStatist Assoc,2014,109(506):828846.9 ANDERSEN M R,WINTHER O,HANSEN L K.Bayesian inference for structured spike and slabpriorsC/GHAHRAMANI Z,WELLING M,CORTES C,et al.(eds)Proceedings of the 27thInternational Conference on Neural Information

38、Processing Systems,Vol.1.Cambridge,MA:MITPress,2014:17451753.10 KIM Y,GAO C.Bayesian model selection with graph structured sparsityJ.J Mach Learn Res,2020,21:109(61 pages).11 EL ASSAAD H,SAME A,GOVAERT G,et al.A variational expectation-maximization algorithmfor temporal data clusteringJ.Comput Stati

39、st Data Anal,2016,103:206228.12 RUE H,HELD L.Gaussian Markov Random Fields:Theory and ApplicationsM.New York:CRCPress,2005.13 SRBYE S H,RUE H.Scaling intrinsic Gaussian Markov random field priors in spatial modellingJ.Spat Stat,2014,8:3951.14 ROCKOVA V,LESAFFRE EIncorporating grouping information in

40、 Bayesian variable selectionwith applications in genomicsJ.Bayesian Anal,2014,9(1):221258.15 ROCKOVA V,GEORGE E I.The spike-and-slab lassoJ.J Amer Statist Assoc,2018,113(521):431444.16 BLEI D M,KUCUKELBIR A,MCAULIFFE J D.Variational inference:a review for statisticiansJ.J Amer Statist Assoc,2017,112

41、(518):859877.17 HEBIRI M,VAN DE GEER S.The smooth-lasso and other 1+2-penalized methodsJ.ElectronJ Statist,2011,5:11841226.18 GUO J H,HU J C,JING B Y,et al.Spline-lasso in high-dimensional linear regressionJ.J AmerStatist Assoc,2016,111(513):288297.19 SANNIGRAHI S,PILLA F,BASU B,et al.Examining the

42、association between socio-demographiccomposition and COVID-19 fatalities in the European region using spatial regression approachJ.Sustain Cities Soc,2020,62:102418(14 pages).20 MOLLALO A,VAHEDI B,RIVERA K M.GIS-based spatial modeling of COVID-19 incidence ratein the continental United StatesJ.Scien

43、ce of the Total Environment,2020,728:138884(8 pages).第 4 期陈梦瑶,等:贝叶斯空间同质回归模型505Bayesian Spatial Homogeneous RegressionCHEN MengyaoDAI WeiJIN Baisuo(Department of Statistics and Finance,School of Management,Universityof Science and Technology of China,Hefei,230026,China)Abstract:For high-dimension spa

44、tial regression problems,we propose a effective sparse Bayesian model.By introducing a hierarchical Gaussian Markov random field prior,the model can obtain sparse spatialvarying parameters,and meanwhile,it can obtain homogeneous parameters estimation for adjacent spa-tial regions.We use a fast-conve

45、rging variational EM algorithm for posterior inference,rather than thetraditional sampling-based methods.In the M-step of the algorithm,the optimization can be transformedinto a classic adaptive lasso problem by simple deformation.The simulation result demonstrate the betterperformance of our model

46、both in parameters estimation and variable selection.Finally,the proposedmodel is used to analyze the impact of the socio-demographic factors on the death rate of the COVID-19in countries of Europe.Keywords:spatial regression;Bayesian;Gaussian Markov random field prior;homogeneous;variationalEM2020 Mathematics Subject Classification:62F15;62H11

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服