变量选择的稳健贝叶斯LASSO方法.pdf

资源描述

1、第4 8卷第8期西南师范大学学报(自然科学版)2 0 2 3年8月V o l.4 8 N o.8 J o u r n a l o f S o u t h w e s tC h i n aN o r m a lU n i v e r s i t y(N a t u r a l S c i e n c eE d i t i o n)A u g.2 0 2 3D O I:1 0.1 3 7 1 8/j.c n k i.x s x b.2 0 2 3.0 8.0 0 5变量选择的稳健贝叶斯L A S S O方法梁韵婷,张辉国,胡锡健新疆大学数学与系统科学学院,乌鲁木齐8 3 0 0

2、4 6摘要:针对数据中广泛存在的异常值会扭曲贝叶斯L A S S O方法的参数估计和变量选择结果的问题,通过引入异方差扰动的先验设定,借此提升贝叶斯L A S S O方法的稳健性,并推导出各参数的后验分布,利用G i b b s抽样得到其估计值与置信区间.该方法在数值模拟中表现出较低的拟合误差与较高的变量识别准确率,对糖尿病数据集和血浆-胡萝卜素水平数据集的分析表明该方法能达到简化模型与减少预测误差的平衡,实现稳健的变量选择与系数估计,并对数据中可能包含的异常值与异方差扰动有良好的抑制作用.关键词:变量选择;贝叶斯L A S S O;稳健性;异常值;异方差中图分类号:O 2 1 2.8 文

3、献标志码:A 文章编号:1 0 0 0 5 4 7 1(2 0 2 3)0 8 0 0 3 3 0 8R o b u s tB a y e s i a nL A S S Of o rV a r i a b l eS e l e c t i o nL I ANGY u n t i n g,Z HANG H u i g u o,HUX i j i a nC o l l e g eo fM a t h e m a t i c sa n dS y s t e mS c i e n c e,X i n j i a n gU n i v e r s i t y,U r u m q i 8 3 0 0 4

4、6,C h i n aA b s t r a c t:G i v e nt h a t t h eu b i q u i t o u so u t l i e r s i nt h ed a t ac a nd i s t o r t t h ep a r a m e t e re s t i m a t i o na n dv a r i a b l es e l e c t i o nr e s u l t so fB a y e s i a nL A S S O,t h ep r i o r i n f o r m a t i o no f h e t e r o s c e d a s

5、 t i cd i s t u r b a n c e s i s i n t r o d u c e d t oi m p r o v e t h er o b u s t n e s so fB a y e s i a nL A S S O.T h ep o s t e r i o rd i s t r i b u t i o no fe a c hp a r a m e t e r i sd e r i v e d,a n dt h ee s t i m a t i o na n dc o n f i d e n c e i n t e r v a l o f e a c hp a r

6、a m e t e ra r eo b t a i n e db yG i b b ss a m p l i n g.T h em e t h o de x-h i b i t s l o wf i t t i n ge r r o ra n dh i g hv a r i a b l e i d e n t i f i c a t i o na c c u r a c yi nn u m e r i c a l s i m u l a t i o n,a n dt h ea n a l y s e so fd i a b e t e sd a t a s e ta n dP l a s m

7、aB e t a-C a r o t e n eL e v e lD a t a s e ts h o wt h a tt h ep r o p o s e dm e t h o da c h i e v e st h eb a l a n c eb e t w e e ns i m p l i f y i n gm o d e l a n dr e d u c i n gp r e d i c t i o ne r r o r.T h ep r o p o s e dm e t h o dc a nr e a l i z er o b u s tv a r i a b l es e l e

8、c t i o na n dc o e f f i c i e n t e s t i m a t i o na n dh a sag o o d i n h i b i t o r ye f f e c t t oo u t l i e r sa n dh e t e r o s c e d a s t i cd i s t u r b a n c e s t h a tm a yb e i n c l u d e d i nt h ed a t a.K e yw o r d s:v a r i a b l es e l e c t i o n;B a y e s i a nL A S S

9、O;r o b u s t n e s s;o u t l i e r;h e t e r o s c e d a s t i c i t y随着信息化时代的到来,大数据的应用越来越广泛,同时也不可避免地出现了异质性问题,表现出异方差特性.而当数据中存在异方差误差或异常点时,变量选择的结果将不再稳定.目前变量选择方法主要分为非贝叶斯方法和贝叶斯方法.基于惩罚函数的变量选择是非贝叶斯方法的主流1-9,最常见的包括L A S-S O(L e a s tA b s o l u t eS h r i n k a g ea n dS e l e c t i o nO p e r a t o r)及其改进

10、方法,如:E N(E l a s t i cN e t)、自适应L A S-收稿日期:2 0 2 2 1 0 2 3基金项目:国家自然科学基金项目(1 1 9 6 1 0 6 5);教育部人文社会科学研究规划基金项目(1 9 Y J A 9 1 0 0 0 7);新疆自然科学基金项目(2 0 1 9 D 0 1 C 0 4 5).作者简介:梁韵婷,硕士研究生,主要从事贝叶斯空间计量模型的研究.S O(A L A S S O)、组L A S S O、S C A D(S m o o t h l yC l i p p e dA b s o l u t eD e v i a t i o n)、MC P

11、(M i n i m a xC o n v e xP e n a l-t y)、最小绝对偏差L A S S O7等.尽管非贝叶斯方法已经取得了不错的成果,但这类方法都不能提供令人满意的标准差估计.文献1 表明当回归参数具有独立且相同的拉普拉斯先验时,L A S S O估计可以解释为后验众数估计.因此,基于该联系和贝叶斯思想,文献1 0 提出了贝叶斯L A S S O(B L A S S O)并构造了全贝叶斯分层模型和相应的采样器.文献1 1 证明在预测均方误差方面,贝叶斯L A S S O的表现与频率派L A S S O相似甚至在某些情况下更好.基于文献1 0-1 3 的研究,本文将贝叶斯L

12、A S S O与异方差误差先验相结合,以实现稳健的变量选择与系数估计,同时该法能自动产生各参数的置信区间.1 分层模型1.1 G i b b s采样器考虑以下线性回归模型Y=X+,N(0,2V)(1)其中:Y为n1维的因变量,X为np维的解释变量,误差服从异方差的多元正态分布,V=d i a g(V1,Vn),则该模型的似然函数如式(2)所示L(Y|,2,V)=(2 2)-n2|V|-12e x p-122(Y-X)TV-1(Y-X)(2)结合文献1 0,1 2的工作,则全模型的分层表示为Y=X+,N(0,2V)p(|21,22,2p)N(0,2D)D=d i a g(21,22,2p)p(2

13、1,22,2p)pj=122e-22j2p(2)()(2)-1e-2(0,0)prVii.i.d.2(r),i=1,n将该模型的似然函数与各参数的先验分布相乘,可得联合后验分布为p(,2,V,21,2p|Y,X)|V|-12(2 2)-n2e x p-122(Y-X)TV-1(Y-X)()(2)-1e-2pj=11(2 22j)12e-2j222j22e-22j2r2n r2r2-nni=1V-r+22ie-r2V i(3)基于式(3),可得的全条件后验分布服从均值为B-1XTV-1Y,方差为2B-1的多元正态分布,其中:B=XTV-1X+D-1;2的全条件后验分布服从形状参数为n2+p2+,

14、尺度参数为(Y-X)TV-1(Y-X)2+TD-12+的逆伽马分布;12j的全条件后验分布服从形状参数为=2,均值参数为=222j的逆高斯分布;文献1 2得出V的全条件后验分布服从以下形式的卡方分布pe2i-2+rVi,2,V-i,21,2p2(r+1)式中ei项为向量e=Y-X 的第i个元素,V-i=(V1,Vi-1,Vi+1,Vn),i=1,n.根据各参数后43西南师范大学学报(自然科学版)h t t p:/x b b j b.s w u.e d u.c n 第4 8卷验分布可构造出稳健贝叶斯L A S S O的G i b b s采样算法:算法1:稳健贝叶斯L A S S O的G i b

15、b s采样器输入:Y,X,迭代次数Td r a w,预热次数To m i t,初值(0),2(0),2(0),V(0)输出:,2,2,V1:k12:当kTd r a w3:从后验分布p(|Y,X,2(k-1),V(k-1),2(k-1)中抽样并记为(k)4:从后验分布p(2|Y,X,(k),2(k-1),V(k-1)中抽样并记为2(k)5:从后验分布p(2|Y,X,(k),V(k-1),2(k)中抽样并记为2(k)6:从后验分布p(V|Y,X,(k),2(k),2(k)中抽样并记为V(k)7:kk+18:结束9:删去前To m i t轮样本,取后Td r a w-To m i t轮样本计算各参

16、数的后验平均值作为估计值1.2 超参数选取关于超参数2的选取,借鉴文献1 0提出的基于边际最大似然的经验贝叶斯法,具体算法如下:1)令k=0并设初值为(0)=p 2WL Spj=12WL S,其中2WL S和2WL S为以普通线性最小二乘估计残差值的绝对值的倒数为权重的加权最小二乘估计值;2)令=(k)并利用上述G i b b s采样器从,2,2,V的后验分布中生成第k轮样本;3)利用第k轮样本近似计算更新(k+1)=2ppj=1E(k)2jY并令k=k+1;4)重复步骤2)-3)直至所需的收敛水平.由于经验贝叶斯法需要多次G i b b s采样,因此该法计算量极大.文献1 4提出了一种基于随

17、机近似的单步方法作为替代,该方法可以仅使用单次G i b b s采样器来获得超参数的极大似然估计,从而极大减少计算量.该法首先作变换(k)=es(k),具体算法如下:1)令k=0并设初值为s(0)=0,(0)=(0),2(0),2(0),V(0);2)从Ks(k)(k),)中生成(k+1),其中Ks为联合后验分布p(Y,s)的G i b b s采样器的马尔科夫核;3)令s(k+1)=s(k)+ak(2p-e2s(k)pj=12j,(k+1)令k=k+1;4)重复步骤2)-3)直至所需的迭代次数.其中ak,k0 为一个非降的正数序列,并满足以下性质l i mkak=0,ak=,a2k 2 数值模

18、拟本节将评估异方差误差先验下稳健贝叶斯L A S S O的实验特性与优点.根据式(1)生成数据,令X=n,X ,n为n维的单位向量,X=X1,X2,Xp-1 为多元正态分布N(0,)生成,其中i j=0.5|i-j|.为了考虑系数向量不同的稀释度,所有模拟均设置n=1 0 0和p=5 0并令非零系数的个数q1 0,2 0.此外,为了测试收缩的适应性,一半的非零系数从正态分布N(0,1)中生成,另一半非零系数从正态分布N(0,5)中抽样,从而使得一半的非零系数接近于0,另一半的非零系数则表现出更大的变化,剩余系数则设置为0.每次模拟均使用50 0 0次迭代并取后25 0 0次抽样计算各参数的后验

19、均值作为估计值,为了避免偶然性,模拟均重复1 0 0次.为了考察所提方法对异常值的稳健性,本文考虑了4种不同的.例1(异方差误差):为了生成异方差误差,对于样本量n按照文献1 5 生成随机组,其中组的个数由均53第8期梁韵婷,等:变量选择的稳健贝叶斯L A S S O方法匀分布U(3,2 0)抽样得出.如果组个数大于1 0,则将该组所有样本的方差设置为等于组个数,否则将方差设置为组个数倒数的平方,并令的第i个元素为i=ii其中:i为第i个观测样本的标准差,i来自独立同分布的标准正态分布N(0,1).例2(污染分布):服从污染分布,其中前9 0%来自标准正态分布,后1 0%服从标准柯西分布.例

20、3(柯西分布):服从标准柯西分布.例4(拉普拉斯分布):服从标准拉普拉斯分布.为了衡量系数估计与变量选择的性能,本文采用均方误差(MS E)与平衡准确率(B A R)作为指标.平衡准确率能综合衡量变量选择方法正确选择、错选、漏选变量的个数,其计算公式如下B A R=12T PT P+FN+TNTN+F P其中T P,TN,F P,FN分别表示真阳性、真阴性、假阳性和假阴性的数量.将本文提出的稳健贝叶斯L A S S O方法简记为R B L A S S O.表1列出了不施加异方差误差先验下几种常见方法与R B L A S S O的实验结果,其中每项指标为基于1 0 0次模拟的平均值.值得注意的是

21、,贝叶斯方法的变量选择结果基于参数的9 5%置信区间.若9 5%置信区间含0,则可认为该参数被识别为0.从模拟结果可得,本文方法在大多数情况下都具有较好的综合表现,其中当误差分布为异方差时R B L A S S O的各项性能指标均为最优.根据对比可得,当非零系数的个数q增大时,即系数向量越密集时,每种方法的估计值往往会稍差,这是因为需要用相同数量的观测值估计更多的非零参数.当误差分布服从标准柯西分布,即例子3时,不施加异方差误差先验下的贝叶斯L A S S O的M S E()相比其他误差分布大得多,而R B L A S S O依然能保持较好的系数估计与变量选择能力,甚至在q增大时M S E()

22、反而减小,这表明了施加异方差误差先验对抵抗异常值具有重大作用.表1 不同模型在4种扰动下基于1 0 0次模拟试验的变量选择结果方法q=1 0M S E()B A Rq=2 0M S E()B A RE x a m p l e1B L A S S O0.0 7 880.7 2 690.1 0 520.7 2 94L A S S O0.0 5 680.7 2 010.0 8 780.6 8 84A L A S S O0.0 5 100.7 3 410.1 0 380.7 0 57R B L A S S O0.0 1 480.8 3 700.0 4 840.7 9 33E x a m p l e2B

23、 L A S S O0.4 1 440.7 4 270.3 4 320.7 8 46L A S S O0.0 9 980.7 1 510.2 6 480.6 5 33A L A S S O0.1 0 080.7 6 470.2 4 060.7 6 95R B L A S S O0.1 1 240.7 6 830.2 7 240.8 0 82E x a m p l e3B L A S S O1 9.8 5 660.5 8 296 0.0 5 740.5 2 35L A S S O0.5 3 840.6 2 000.4 6 660.5 5 61A L A S S O0.7 0 620.6 0 79

24、0.7 8 720.5 5 21R B L A S S O0.6 5 940.6 3 690.3 5 420.5 8 79E x a m p l e4B L A S S O0.0 3 040.9 3 530.0 4 740.8 2 76L A S S O0.0 1 940.7 8 540.0 4 500.6 6 99A L A S S O0.0 1 780.8 5 240.0 3 520.8 1 34R B L A S S O0.0 3 020.9 2 440.0 5 520.8 1 323 案例研究3.1 糖尿病数据集将本文提出的稳健贝叶斯L A S S O方法应用到糖尿病数据集中,该数据集

25、由文献1 6 提供,共有4 4 263西南师范大学学报(自然科学版)h t t p:/x b b j b.s w u.e d u.c n 第4 8卷个样本和1 1个变量,其中1 0个解释变量分别为年龄(a g e)、性别(s e x)、体重指数(b m i)、平均血压(m a p)及6种血清测量(t c,l d l,h d l,t c h,l t g,g l u),因变量为基线点一年后疾病进展的定量测量.本文所使用的数据集来自R包c a r e,所有变量均已标准化使得均值为0、方差为1.为了研究所提方法的稳健性,随机选取2 0%的样本在因变量上加上噪音c,其中c取为3倍的因变量标准差,并随机划

26、分7 0%的数据集作为训练集,剩余3 0%作为测试集.评估指标采用预测均方误差(M S E)与中值绝对预测误差(MA P E).图1为该数据集各变量的箱线图,初步可得解释变量和因变量均存在异常值;图2为学生化残差与帽子统计量关系图,其中圆圈面积与观测点的C o o k距离成正比,垂直两条虚线分别为两倍和三倍平均帽子值的参考线,水平两条虚线分别是学生化残差为0及2的参考线,进一步分析可得该数据集中样本2 9 5和3 0 5为离群点,样本3 2 3和3 5 4为高杠杆值点,若以4n-k-1为C o o k距离的阈值则有3 5个强影响点.图1 糖尿病数据集各变量的箱线图图2 学生化残差与帽子统计量的

27、气泡图,其中圆圈的面积表示与C o o k距离成正比的观测值各模型估计结果如表2所示,其中标粗体的系数估计值代表其置信区间含0.B L A S S O和R B L A S S O均排除了7个相同的非重要变量,而L A S S O和A L A S S O仅排除了4个非重要变量,且这4个非重要变量73第8期梁韵婷,等:变量选择的稳健贝叶斯L A S S O方法均为4个模型所排除的共同变量,分别为s e x,l d l,t c h,g l u.根据M S E和MA P E,本文所提方法的预测误差最低.此外,由图3可得相比B L A S S O,施加了异方差先验的R B L A S S O具有更短的

28、置信区间.因此,所提方法的结果应具备更高的可靠性.表2 不同方法下糖尿病数据集的估计结果L e a s tS q u a r e sW e i g h t e dL e a s tS q u a r e sB a y e s i a nL A S S OR o b u s tB a y e s i a nL A S S OL A S S OA d a p t i v eL A S S Oa g e-0.0 0 26-0.0 9 49-0.0 6 61-0.0 4 91-0.0 8 31-0.1 1 19s e x0.0 1 20-0.0 2 820.0 0 41-0.0 4 8900b m i

29、0.4 4 090.4 1 750.4 1 590.3 4 170.4 3 150.4 4 28m a p0.2 8 500.2 5 130.2 3 680.1 6 430.2 5 250.2 7 35t c-1.0 0 98-0.8 5 14-0.0 5 14-0.0 7 35-0.0 9 87-0.1 3 37l d l0.7 5 080.5 8 23-0.0 2 27-0.0 4 8500h d l0.2 9 280.2 3 36-0.0 5 82-0.0 5 91-0.0 3 74-0.0 3 59t c h0.0 0 670.0 2 430.0 0 470.0 2 8800l t g

30、0.7 7 540.6 8 810.3 5 580.3 8 820.3 9 030.4 2 36g l u-0.0 1 55-0.0 0 260.0 0 770.0 1 8600M S E2 7 8.7 3 432 7 3.4 8 272 7 2.9 4 382 6 6.5 3 152 7 4.3 9 072 7 6.0 1 92MA P E0.6 6 140.5 5 060.6 0 660.5 4 810.6 1 2 20.6 2 11图3 不同方法下糖尿病数据集各变量的系数估计值与对应的9 5%置信区间3.2 血浆-胡萝卜素水平数据集文献1 7 数据集包含了3 1 5名患者,均在3年内进行

31、过活检或切除肺、结肠、乳腺、皮肤、卵巢或子宫的非癌病变,选取其中的2 7 3名女性患者作为研究对象.该数据集共有1 1个变量,1 0个解释变量分别为年龄(a g e)、吸烟状态(s m o k s t a t)、Q u e t e l e t指数(q u e t e l e t)、维生素使用(v i t u s e)、每天摄入的卡路里数(c a l o-r i e s)、每天摄入的脂肪克数(f a t)、每天摄入的纤维克数(f i b e r)、每周摄入的酒精饮料数量(a l c o h o l)、胆固醇摄入量(m g/天,c h o l)、膳食-胡萝卜素消耗量(m c g/d,b e t a

32、 d i e t),因变量为血浆-胡萝卜素(n g/m l).所有变量均已标准化使得均值为0、方差为1,随机划分7 0%的数据集作为训练集拟合模型,将剩余3 0%作为测试集并通过计算预测均方误差(M S E)与中值绝对预测误差(MA P E)来评估模型的预测能力.图4和图5分别为血浆-胡萝卜素和胆固醇的直方图,由图可得这两个变量均含有异常值.将各模型应用于该数据,估计结果如表3所示,其中B L A S S O和R B L A S S O均认为q u e t e l e t,v i t u s e和b e t a d i e t为重要变量,而L A S S O和A L A S S O仅排除了c

33、a l o r i e s变量.尽管R B L A S S O的MA P E不是最低,但与MA P E最低的B L A S S O差距甚小,且R B L A S S O的M S E远低于其他方法,综合来说R B L A S S O模型的预测能力83西南师范大学学报(自然科学版)h t t p:/x b b j b.s w u.e d u.c n 第4 8卷最优.此外,从图6可得R B L A S S O明显比B L A S S O具有更短的置信区间,估计精度更高.图4 血浆胡萝卜素的直方图图5 胆固醇的直方图表3 不同方法下血浆胡萝卜素水平数据集的估计结果L e a s tS q u a r

34、e sW e i g h t e dL e a s tS q u a r e sB a y e s i a nL A S S OR o b u s tB a y e s i a nL A S S OL A S S OA d a p t i v eL A S S Oa g e0.0 6 230.0 5 070.0 4 860.0 7 480.0 5 470.0 6 41s m o k s t a t-0.0 4 60-0.0 3 46-0.0 3 37-0.0 2 01-0.0 3 28-0.0 4 24q u e t e l e t-0.2 0 52-0.1 8 18-0.1 8 36-0.1

35、 3 80-0.1 9 46-0.2 0 23v i t u s e-0.2 6 55-0.2 4 00-0.2 2 86-0.1 3 67-0.2 4 72-0.2 5 64c a l o r i e s-0.0 8 04-0.2 0 62-0.0 1 17-0.0 2 5700f a t-0.0 5 140.0 7 09-0.0 5 93-0.0 0 62-0.0 9 11-0.1 0 21f i b e r0.2 3 410.2 1 970.1 6 910.0 4 950.1 8 380.1 9 92a l c o h o l0.1 6 000.1 0 440.1 0 370.0 3 0

36、40.1 2 890.1 4 53c h o l-0.0 4 68-0.0 4 30-0.0 3 84-0.0 1 61-0.0 4 02-0.0 4 73b e t a d i e t0.2 3 600.2 2 230.2 1 500.1 5 260.2 2 730.2 3 53M S E3 4.9 1 412 8.5 9 222 9.4 6 532 0.3 7 033 2.3 8 533 4.2 6 73MA P E0.3 4 660.3 4 370.3 2 390.3 2 690.3 5 360.3 6 41图6 不同方法下血浆胡萝卜素水平数据集各变量的系数估计值与对应的9 5%置信区间

37、93第8期梁韵婷,等:变量选择的稳健贝叶斯L A S S O方法4 结论本文通过将异方差误差先验引入贝叶斯L A S S O,提出了贝叶斯L A S S O的稳健模型并建立了相应的贝叶斯分层模型与G i b b s采样器,从而提高了对异常值及异方差误差的稳健性.数值模拟和实证分析表明当存在异常值或异方差误差时,该方法能实现较简洁的模型与较低的误差,从而实现稳健的变量选择.此外,该模型立足于贝叶斯思想,能方便地得到估计值的置信区间,从而弥补了L A S S O类方法不能给出较好可信度评估的劣势.参考文献:1T I B S H I R AN IR.R e g r e s s i o nS h r

38、 i n k a g ea n dS e l e c t i o nv i a t h eL a s s oJ.J o u r n a l o f t h eR o y a l S t a t i s t i c a l S o c i e t yS e r i e sB:S t a t i s t i c a lM e t h o d o l o g y,1 9 9 6,5 8(1):2 6 7-2 8 8.2 Z OU H,HA S T I ET.R e g u l a r i z a t i o na n dV a r i a b l eS e l e c t i o nv i a t

39、h eE l a s t i cN e tJ.J o u r n a l o f t h eR o y a l S t a t i s t i c a l S o c i e-t yS e r i e sB:S t a t i s t i c a lM e t h o d o l o g y,2 0 0 5,6 7(2):3 0 1-3 2 0.3 Z OU H.T h eA d a p t i v eL a s s oa n dI t sO r a c l eP r o p e r t i e sJ.J o u r n a lo ft h eAm e r i c a nS t a t i s

40、 t i c a lA s s o c i a t i o n,2 0 0 6,1 0 1(4 7 6):1 4 1 8-1 4 2 9.4 YUAN M,L I NY.M o d e lS e l e c t i o na n dE s t i m a t i o n i nR e g r e s s i o nw i t hG r o u p e dV a r i a b l e sJ.J o u r n a l o f t h eR o y a l S t a-t i s t i c a lS o c i e t yS e r i e sB:S t a t i s t i c a lM

41、e t h o d o l o g y,2 0 0 6,6 8(1):4 9-6 7.5 F ANJQ,L IRZ.V a r i a b l eS e l e c t i o nv i aN o n c o n c a v eP e n a l i z e dL i k e l i h o o da n dI t sO r a c l eP r o p e r t i e sJ.J o u r n a lo f t h eAm e r i c a nS t a t i s t i c a lA s s o c i a t i o n,2 0 0 1,9 6(4 5 6):1 3 4 8-1

42、3 6 0.6 Z HAN GCH.N e a r l yU n b i a s e dV a r i a b l eS e l e c t i o nu n d e rM i n i m a xC o n c a v eP e n a l t yJ.T h eA n n a l so fS t a t i s t i c s,2 0 1 0,3 8(2):8 9 4-9 4 2.7 WANG HS,L IGD,J I ANGG H.R o b u s tR e g r e s s i o nS h r i n k a g ea n dC o n s i s t e n tV a r i a

43、b l eS e l e c t i o nt h r o u g ht h eL A D-L a s s oJ.J o u r n a l o fB u s i n e s s&E c o n o m i cS t a t i s t i c s,2 0 0 7,2 5(3):3 4 7-3 5 5.8 WU Y,L I U Y.V a r i a b l eS e l e c t i o n i nQ u a n t i l eR e g r e s s i o nJ.S t a t i s t i c aS i n i c a,2 0 0 9,1 9(2):8 0 1-8 1 7.9 W

44、ANGXQ,J I AN GYL,HUAN G M,e t a l.R o b u s tV a r i a b l eS e l e c t i o nw i t hE x p o n e n t i a l S q u a r e dL o s sJ.J o u r n a l o ft h eAm e r i c a nS t a t i s t i c a lA s s o c i a t i o n,2 0 1 3,1 0 8(5 0 2):6 3 2-6 4 3.1 0P A R KT,C A S E L L A G.T h eB a y e s i a nL a s s oJ.J

45、 o u r n a lo ft h eAm e r i c a nS t a t i s t i c a lA s s o c i a t i o n,2 0 0 8,1 0 3(4 8 2):6 8 1-6 8 6.1 1KYUNG M,G I L LJ,GHO S H M,e t a l.P e n a l i z e dR e g r e s s i o n,S t a n d a r dE r r o r s,a n dB a y e s i a nL a s s o sJ.B a y e s i a nA-n a l y s i s,2 0 1 0,5(2):3 6 9-4 1 2

46、.1 2G EWE K EJ.B a y e s i a nT r e a t m e n t o f t h e I n d e p e n d e n t S t u d e n t-tL i n e a rM o d e lJ.J o u r n a l o fA p p l i e dE c o n o m e t r i c s,1 9 9 3,8(S 1):S 1 9-S 4 0.1 3L ANG EKL,L I T T L ERJA,TAY L O RJM G.R o b u s t S t a t i s t i c a lM o d e l i n gU s i n g t

47、h e tD i s t r i b u t i o nJ.J o u r n a l o f t h eAm e r i c a nS t a t i s t i c a lA s s o c i a t i o n,1 9 8 9,8 4(4 0 8):8 8 1-8 9 6.1 4A T CHA D YF.AC o m p u t a t i o n a lF r a m e w o r kf o rE m p i r i c a lB a y e sI n f e r e n c eJ.S t a t i s t i c sa n dC o m p u t i n g,2 0 1 1,

48、2 1(4):4 6 3-4 7 3.1 5L I NX,L E ELF.GMME s t i m a t i o no fS p a t i a lA u t o r e g r e s s i v eM o d e l sw i t hU n k n o w nH e t e r o s k e d a s t i c i t yJ.J o u r n a l o fE c o n o m e t r i c s,2 0 1 0,1 5 7(1):3 4-5 2.1 6E F R ONB,HA S T I ET,J OHN S TON EI,e ta l.L e a s tA n g l

49、eR e g r e s s i o nJ.T h eA n n a l so fS t a t i s t i c s,2 0 0 4,3 2(2):4 0 7-4 9 9.1 7N I E R E N B E R GD W,S TUK E LTA,B A R ONJA,e t a l.D e t e r m i n a n t so fP l a s m aL e v e l so f b e t a-C a r o t e n e a n dR e t i n o lJ.Am e r i c a nJ o u r n a l o fE p i d e m i o l o g y,1 9 8 9,1 3 0(3):5 1 1-5 2 1.责任编辑张栒 04西南师范大学学报(自然科学版)h t t p:/x b b j b.s w u.e d u.c n 第4 8卷

展开阅读全文