1、应用数学MATHEMATICA APPLICATA2024,37(2):519-529偏正态条件下多元线性回归模型的统计推断及其应用赵伟凯1,2,杨兰军1,2,戴琳1,2,吴刘仓1,2(1.昆明理工大学理学院,云南 昆明 650500;2.昆明理工大学统计学研究中心,云南 昆明 650500)摘要:本文考虑带偏正态随机项多元线性回归模型的统计推断问题.基于最大似然方法,本文所做的工作如下:1)证明了参数最大似然估计在n p+1条件下以概率1存在唯一;2)在唯一性条件下给出参数估计的一致性结论;3)在一致性的条件下研究了参数的渐近性质,给出参数的渐近分布.最后通过数值模拟说明了所提理论和方法的有
2、效性.实例表明模型参数估计的渐近分布具有实际意义.关键词:偏正态分布;多元线性模型;最大似然估计;渐近正态性中图分类号:O212.1AMS(2010)主题分类:62F03;62F12文献标识码:A文章编号:1001-9847(2024)02-0519-111.引言为方便讨论,本文常用记号规定如下:对于方阵A,tr(A),AT,rank(A)分别表示A的迹、A的转置和A的秩;In表示n阶单位阵,1n表示元素都是1的n维列向量,x(i)表示X矩阵的第i行向量;=argF表示取内满足F的取值;E0()和D0()分别表示在模型参数0条件下的期望和方差;P和L分别表示依概率收敛和依分布收敛.在金融经济、
3、生物医学以及社会生产等实践活动中产生的实际数据的分布未必具有严格的对称性,这类数据如果使用正态分布等对称概率统计模型来拟合,难以正确地描述数据的分布规律.Azzalini1在正态分布模型的基础上进行推广,提出了偏正态分布概率统计模型,相继对它的性质、估计、统计诊断、推广以及多元偏正态分布等进行了系统深入地研究.随后越来越多的国外统计学者开始研究偏态分布模型,可参考文24.关于偏正态分布下模型的统计推断,国内相关文献众多,胡明星等5采用MCMC算法对偏正态空间自回归模型进行了贝叶斯估计;王丹璐等6采用EM算法研究了偏正态数据下位置、均值回归模型的极大似然估计;陈超等7定义了偏对称正态分布,探讨了
4、此类分布的一些性质,吴树礼等8研究了-偏正态分布的尾部特征及极值的极限分布;潘永博9研究了偏正态误差分布下一元线性回归模型的参数估计及比较;侯格格10以经验特征函数为主要工具,对一元偏正态分布的位置、尺度、形状等参数进行估计.在众多的研究文献中,由于不能够得到偏态条件下估计量的显式解,因此多数情况下只能采用Gauss-Newton迭代、EM算法等方法在有限样本条件下得到模型参数的数值解,因而估收稿日期:2023-04-17基金项目:国家自然科学基金(12261051)作者简介:赵伟凯,男,汉族,河南人,研究方向:应用统计.通讯作者:杨兰军.520应用数学2024计的存在性问题显得尤为重要.同时
5、,在实际应用中估计的统计特征也直接影响到模型的应用价值.基于最大似然的角度,本文考虑了偏正态条件下多元线性回归模型基于最大似然估计的一些统计特征,主要包括两个方面:(i)讨论了模型参数最大似然估计及估计的存在性问题;(ii)讨论了模型参数最大似然估计的一致性和渐近分布.本文剩余部分安排如下:在第2节中介绍了偏正态条件下线性回归模型,基于最大似然估计给出了存在性的证明,并通过反证法给出了最大似然估计唯一性的证明;在第3节中,在估计唯一等条件下给出了模型参数一致性的证明;在第4节中,在一致性条件下,依次讨论了模型偏度参数,尺度参数以及回归系数的渐近性质,并给出了渐近分布;在第5节中,通过数值模拟和
6、实例分析验证了本文所提出理论和方法的有效性.最后,在第6节中给出了本文的结论.2.偏正态条件下线性回归模型的最大似然估计如果随机变量Z的密度函数可以表示为:f(z)=2(z )(z ),(2.1)其中,为位置参数,为尺度参数,为偏度参数,(),()分别为标准正态分布的密度函数和分布函数,则称Z服从参数为(,2,)的偏正态分布,记为Z SN(,2,).当偏度参数=0时,密度函数(2.1)退化为正态分布的密度函数,即Z N(,2).本文考虑偏正态条件下线性回归模型:Y=X+,i SN(0,2,),i=1,2,n,(2.2)其中=(1,2,n)T,i,i=1,2,n,服从偏度参数为,尺度参数为2的偏
7、正态分布且相互独立,Y=(y1,y2,yn)T为响应变量,X为n p解释变量矩阵且rank(X)=p(=n),=(1,2,p)T为线性回归模型的回归参数向量.在模型(2.2)中,记x(i)为X的第i行行向量,则关于未知参数=(T,2,)的似然函数为L(T,2,)=ni=12(yi x(i)(yi x(i),对应的对数似然函数为lnL(T,2,)=n2ln2n2ln2ni=1(yi x(i)222+ni=1ln(yi x(i),(2.3)记zi=yix(i),则有似然方程n22+122ni=1zi222ni=1zi(zi)(zi)=0,1ni=1zix(i)T1ni=1(zi)(zi)x(i)T
8、=0,ni=1zi(zi)(zi)=0,即有2=1nni=1(yi x(i)2,ni=1zix(i)T ni=1(zi)(zi)x(i)T=0,ni=1zi(zi)(zi)=0.(2.4)第 2 期赵伟凯等:偏正态条件下多元线性回归模型的统计推断及其应用521假定参数=(T,2,)T的最大似然估计存在且为=(T,2,)T,记gi(T,)=(nyix(i)ni=1(yix(i)2)(nyix(i)ni=1(yix(i)2),i=1,2,n,Gn(T,)=(g1(T,),g2(T,),gn(T,)T则b可通过下式求得:2=1n(Y X)T(Y X),():=arg(T,)Rp+1(Y X)TInn
9、(Y X)Gn(T,)TX=0,(Y X)TGn(T,)=0,记 2()=1n(Y X)T(Y X),则关于参数(T,)T的对数似然函数为l(T,2(),)=n2ln2nn2+ni=1lnnyix(i)nj=1(yjx(j)2nj=1(yj x(j)2,由于n p+1,故nj=1(yj x(j)2 YTMXY,Rp以概率1大于0,即有l(T,2(),)关于(T,)T Rp+1连续且l(T,2(),)n2(ln2nYTMXY 1)以概率1成立,因而有如下定理.定理1 在模型(2.2)中,当n p+1时,参数=(T,2,)T最大似然估计=(T,2,)T以概率1存在.在模型(2.2)中,定理1说明了
10、未知参数=(T,2,)的最大似然估计=(T,2,)在有限样本条件n p+1下以概率1可以通过牛顿迭代等数值计算方式得到数值解.估计的唯一性也是关注内容之一,其对估计的收敛性、渐近正态性都非常重要,对估计的数值计算方法也会产生一定的影响.定理2 在模型(2.2)中,当n p+1时,参数=(T,2,)T最大似然估计=(T,2,)T以概率1唯一.证记对数似然函数为l(T,2,)=n2ln2n2ln2ni=1(yi x(i)222+ni=1ln(yi x(i),令zi=yix(i),且不失一般性假定=0,注意到2=1nni=1(yi x(i)2及是的连续可微函数,对任意总有l(T,2,)2=0,l(T
11、,2,)=0,因而l(T,2,)2=0,l(T,2,)=0,l(T,2,)2=0.假设模型存在两个不等的极大似然估计bi=(bTi,2(bi),(bi)T,i=1,2,则有l(bT1)=l(bT2)+l(T)T|=b2(b1b2)+12(b1b2)Tl(T)T|=e(b1b2),其中e为b1与b2连线上的某个点.由于l(bT1)=l(bT2),l(T)T|=b2=0,则有(b1b2)Tl(T)T|=e(b1b2)=0.522应用数学2024由于zi(zi)+(zi)zi=(zi)0,limzizi(zi)+(zi)=0,因而对任意的zi R都有(zi)zi(zi)+(zi)2(zi)0,即有2
12、l(T,2,)T=12ni=1x(i)Tx(i)1+2(zi)zi(zi)+(zi)2(zi)0,因而0=(0T,02,0)为Qn()的极小值点.类比于定理2的方法可知,0=(0T,02,0)为Qn()的最小值点,则在模型(2.2)中,关于模型参数=(T,2,)的最大似然估计有下面结论.定理3在模型(2.2)中,参数的最大似然估计=(T,2,)依概率收敛到参数真值0=(0T,02,0),即有 0,n .证注意到=(T,2,),样本来自参数0=(0T,02,0),且有lnL(T,2,)=n2ln2n2ln2ni=1(yi x(i)222+ni=1ln(yi x(i),由于Qn()=lnL()/n
13、,Qn()=E0lnL()/n,yi x(i),i=1,2,n,相互独立,则当n 时有Qn()Qn()0成立.对任意 0,记n=(T,2,)|Rp,2 0,R,Sno()是中心在0以Rp+2上半径为的球形开邻域,no()=Sno()n,no()c为no()的补集,注意到0是Qn()的最小值点,则有lim infnminno()cQn()Qn(0)0成立.综合上面所述,根据文12中定理3.3得证.定理3的结论表明模型参数的最大似然估计具有一致性,同时也为模型的进一步统计推断奠定了基础.4.未知参数估计的渐近分布对于偏正态条件下的多元线性回归模型,未知参数估计的大样本性质值得关注,尤其是偏度参数估
14、计的渐近性质.在模型最大似然估计一致性条件下,下面重点考虑参数T,2,估计的渐近分布.不失一般性,不妨假定模型参数的最大似然估计唯一且一致收敛于参数真值,X的元素一致有界及列元素绝对值和一致有界,limnXXTn存在且非奇异.由于估计满足ni=1 zi(0 zi)/(0 zi)=0,则有n(0)=1nni=1 zi(0 zi)(0 zi)1nni=1 z2i(zi)zi(zi)(zi)2(zi)1,第 2 期赵伟凯等:偏正态条件下多元线性回归模型的统计推断及其应用523其中 zi=(yi x(i)/,为 与0之间的某一个值,则关于估计 有下面近似分布.定理4在模型(2.2)中,n(0)LN(0
15、,Dz1(0z1)(0z1)E2z212(0z1)2(0z1),其中z1 SN(0,1,0).证注意到(2.4)式中ni=1 zi(zi)(zi)=0,其中 zi=yix(i),则由拉格朗日中值定理可得n(0)=1nni=1 zi(0 zi)(0 zi)1nni=1 z2i(zi)zi(zi)(zi)2(zi)1,其中 为 和0之间的某一值.注意到yi x(i)0,i=1,2,n,相互独立且各阶阶矩存在,X的元素一致有界及列绝对值和一致有界,limnXXTn存在且非奇异,P0,b P0,b 2P02,记zi=yix(i)00则有1nni=1x(i)(0)(0 zi)(0 zi)P0,1nni=
16、1 zi(0 zi)(0 zi)1nni=1zi(0zi)(0zi)P0,1nni=1 z2i2(zi)2(zi)1nni=1z2i2(0zi)2(0zi)P0,1nni=1 z2i(zi)zi(zi)2(zi)P0.由于z2i2(0zi)2(0zi),i=1,2,n,独立且期望、方差均存在且有界,故有1nni=1z2i2(0zi)2(0zi)PE0z212(0z1)2(0z1).由于zi(0zi)(0zi),i=1,2,n,独立,其方差存在且有界,其期望为E0zi(0zi)(0zi)=2zi(0zi)(0zi)(zi)(0zi)dzi=0,记2=Dzi(0zi)(0zi),则有1nni=1z
17、i(0zi)(0zi)LN(0,2).综合上面所述可得n(0)LN(0,Dz1(0z1)(0z1)E2z212(0z1)2(0z1),其中z1 SN(0,1,0),定理得证.偏度参数是刻画随机变量分布对称程度的基本尺度,随机变量是否具有对称分布尤为值得关注.当=0时,模型(2.2)即为正态条件下的经典多元线性模型,因而通常需要做假设检验H0:=0 H0:=0.定理3给出了偏正态条件下多元线性回归模型偏度参数的渐近分布,据此可以讨论上述偏度参数的假设检验问题,根据数据的渐近分布和检验的显著性水平确定拒绝域:W=|u1/2Dz1(0z1)(0z1)E2z212(0z1)2(0z1),其中z1 SN
18、(0,1,0),u1/2为标准正态分布的1 /2下分位数,进而可结合实际情况,对数据是否服从偏正态做出判断.定理5在模型(2.2)中,假定X列绝对值和一致有界,0=limnXXTn存在且非奇异,则有n(0)LN(0,0201).524应用数学2024证注意到(2.4)式中ni=1 zix(i)Tni=1(zi)(zi)x(i)T=0,其中 zi=yix(i)bb,则由拉格朗日中值定理可得n(0)=XTXn 2nni=1(yix(i)(yix(i)+(yix(i)1(yix(i)2(yix(i)x(i)Tx(i)1 1nni=1(0yix(i)0)(0yix(i)0)x(i)T1nni=1yi
19、x(i)0 x(i)T,其中为与0连线上的某一个点.注意到yi x(i)0,i=1,2,n,相互独立且各阶阶矩存在,X的元素一致有界及列绝对值和一致有界,存在且非奇异 limnXXTn,P0,b P0,b 2P02,则有1nni=1(yix(i)(yix(i)2x(i)T)(yix(i)x(i)P0,1nni=1 2 2(yix(i)2(yix(i)x(i)Tx(i)P0,1nni=1(0yix(i)0)(0yix(i)0)x(i)TP0,从而有n(0)+(XTXn)1 1nXT(Y X0)P0.由于(XTXn0)1/21nXTY X00LN(0,Ip),则有n(0)LN(0,02(limnX
20、TXn)1),根据文13中定理5.1.8,结论得证.定理5给出了回归系数的渐近分布,据此可以深入讨论模型及变量的显著性问题.定理6在模型(2.2)中,当n 时有n(2 20)LN(0,204).证由(2.4)式有 2=1n(Y X)T(Y X),从而 2=1n(Y X0)T(Y X0)(0)TXT(Y X0)(0)TXTX(0),注意X 到的元素一致有界及列绝对值和一致有界,limnXXTn存在且非奇异,0P0,则有1n(0)TXT(Y X0)P0,1n(0)TXTX(0)P0,从而n 21n(Y X0)T(Y X0)P0.由于yi x(i)0,i=1,2,n,相互独立且其矩母函数为M(t)=
21、2e2t22(t1+2),则有E(yi x(i)0)2=2M(t)t2?t=0=02,D(yi x(i)0)2=4M(t)t4?t=0(02)2=204,从而有1nni=1(yi x(i)0)2 E(yi x(i)0)21nD(yi x(i)0)2LN(0,1),第 2 期赵伟凯等:偏正态条件下多元线性回归模型的统计推断及其应用525结合n 21n(Y X0)T(Y X0)P0,则有n1nni=1(yi x(i)0)2 02LN(0,204),即有n 2 02LN(0,204),结论得证.定理6给出了尺度参数的渐近分布,该分布只与02有关.尺度参数描述了数据的离散程度,据此我们可以对数据做进一
22、步的尺度分析.5.模拟研究和实例分析为了验证偏正态条件下多元线性回归模型参数的一致收敛性以及渐近分布,本文对有限样本进行模拟研究.模拟数据由模型(2.2)产生,其中xi U(1,1),yi(i=1,2,n)是根据偏正态分布产生的响应变量,yi的产生过程如下11:1)样本Z1和Z2独立产生于标准正态分布N(0,1);2)产生偏正态分布样本:yi=xi0+0(0|z1|1+02+z21+02).一致收敛性的Monte Carlo模拟对模型(2)参数估计的一致收敛性进行模拟研究.用均方误差(MSE)和区间覆盖率(CP)来评价估计效果,定义均方误差(MSE):MSE()=1mmi=1(i 0)T(i
23、0),MSE(2)=1mmi=1(2i 02)2,MSE()=1mmi=1(i 0)2,其中0,02,0为参数,2,的真值,区间覆盖率(CP)为95%置信区间下估计的区间覆盖率.设置不同参数真值,研究样本量n对估计的影响.样本容量分别取50,100,200,400,采用Gauss-Newton 迭代法对参数进行估计,实验重复m=10000次,模拟结果见表1.表1偏正态条件下多元线性回归模型估计一致性模拟结果0样本量估计值nT 2 0=(1,1)T,02=2,0=250(-1.1016,0.9436)1.8976-1.9000100(-1.0685,0.9127)1.9042-1.9109200
24、(-1.0648,0.9527)1.9366-1.9904400(-1.0246,0.9829)1.9804-1.99590=(1,1)T,02=2,0=250(1.0901,-0.9227)1.8945-1.8938100(1.0729,-0.9165)1.8975-1.9141200(1.0635,-0.9525)1.9334-1.9359400(1.0194,-0.9926)1.9821-1.98180=(1,1)T,02=2,0=250(1.0944,0.9289)1.90081.8970100(1.0907,0.9426)1.90291.9050200(1.0667,0.9528)1
25、.93261.9356400(1.0194,0.9883)1.98151.9779526应用数学2024均方误差(MSE)区间覆盖率(CP)MSE(T)MSE(2)MSE()CP(T)CP(2)CP()0.03670.03470.03200.94220.94220.95100.02090.02610.01850.94180.94300.94820.01130.00990.00960.95360.95040.94720.00460.00360.00410.95520.95660.95820.03310.03410.03650.94240.94520.95600.01660.02070.01930
26、.95200.94480.95400.01080.01370.00960.94440.95020.94800.00500.00710.00590.95020.94980.95260.04120.03980.03720.94380.94380.94620.01890.02060.02080.95240.94480.94580.00890.00970.01030.94080.95220.94900.00850.00640.00570.95220.95560.9528从表1可知,参数取不同的真值,随着样本量n的增大,各参数估计的均方误差的值越来越小,且从各参数的区间覆盖率(CP)均在(0.94,0.
27、96)区间内可以看出估计效果较好,说明随着n增大,参数的估计值趋近于真值,模型(2.2)参数估计具有一致收敛性.参数渐近分布的Monte Carlo模拟基于上述一致收敛性模拟的数据,根据第3节的结论,讨论参数估计的渐近分布与样本经验分布(经验分布函数是真实分布函数的有效近似)随样本容量变化的规律.模拟中用b 的经验分布函数代替参数的实际分布函数,将数轴分割为m+1个区间(m=(max()min()/0.01),记vi为参数的估计值落在第i个区间的频数,n为样本容量,pi为理论落入第i个区间的近似概率,即为理论渐近分布函数值,则b 经验分布函数和理论分布函数的对比图如下:-3-2-101234x
28、00.10.20.30.40.50.60.70.80.91F(x)n=50-4-3-2-10123x00.10.20.30.40.50.60.70.80.91F(x)n=100-3-2-10123x00.10.20.30.40.50.60.70.80.91F(x)n=200-4-3-2-10123x00.10.20.30.40.50.60.70.80.91F(x)n=400图1b 经验分布函数和理论分布函数的对比图第 2 期赵伟凯等:偏正态条件下多元线性回归模型的统计推断及其应用527从图1可以很直观看出,随着样本量n的增大,偏度参数估计的理论分布函数与经验分布函数趋于重合.参数的理论分布与经
29、验分布差异的度量可用Dn=1m+1m+1i=1(vin pi)2表示,设置不同参数真值,研究样本量n对参数,2理论分布与经验分布差异的影响.样本容量分别取50,100,200,400,所得数据如表2.表2偏正态条件下多元线性回归模型偏度参数渐近分布模拟结果0样本量参数nT20=(1,1)T,02=2,0=2500.41140.50690.45281000.21770.32230.29792000.10720.12380.12694000.05440.06280.07110=(1,1)T,02=2,0=2500.40020.48020.44971000.21110.29150.30982000.
30、10390.11930.11424000.05550.05950.05680=(1,1)T,02=2,0=2500.40490.49380.44821000.20160.29760.31222000.10100.12250.12374000.05900.05980.0520从表2结果中可以得出以下结论:Dn随着样本量n的增大而逐渐减小,表明基于最大似然估计得到参数估计的渐近分布是有效的.实例分析利用某市2020年第七次全国人口普查男性各年龄人口状况数据集来讨论本文所提出理论和方法的实际应用效果.数据集包括某市0-100岁各年龄男性平均人口数据.图2绘制了数据集的直方图和概率密度曲线,图3绘制了
31、数据的正态Q-Q图,其散点存在一定程度的偏离,表明数据存在明显的偏斜,该数据集服从偏正态分布.?图2 男性平均人口数据密度函数拟合图图3男性人口数据的正态Q-Q图运用夏皮罗-威尔克(Shapiro-Wilk)检验14(W检验)、单样本柯尔莫可洛夫斯米洛夫(Ko-lmogorov-Smirnov)检验15(K-S检验)以及本文第4节的方法分别对该数据集进行正态性检验.其中W检验和K-S检验是常用的正态性检验方法,理论体系成熟完善,默认显著性528应用数学2024水平为0.05,检验结果见表3:表3K-S、W检验结果K-S检验W检验统计量显著性统计量显著性男性平均人口0.2390.2000.924
32、0.004从表3可以看出,单样本K-S检验的显著性为0.200 0.05接受原假设,说明数据总体与正态分布不存在显著差异,而W检验显著性小于0.05,拒绝原假设,说明数据总体与正态分布存在显著性差异,从检验结果上看,单样本K-S检验并没有达到理想的效果.表4为用第4节的方法对该数据集进行假设检验的结果,其中原假设和备择假设为H0:=0,H1:=0,对数据集进行归一化处理,根据第4节的结论计算得到偏度参数的渐近分布为N(0,0.2314),运用Gauss-Newton迭代法得到偏度参数的估计值,结果如下:表4假设检验结果表显著性水平拒绝域 结论=0.05WI=|0.94292.3988拒绝H0表
33、4假设检验的结果表明,该数据集与正态分布存在差异,达到了理想的检验效果,说明本文提出理论方法的有效性.W检验是基于相关性的算法,通过计算W统计量的大小与临界值比较做出判决,更适用于小样本容量(8 n 4000)数据,因此对于本文实例的数据集,检验效果并不理想.而本文提出的理论方法的有效性依赖于模型拟合与参数估计的效果,计算过程较为复杂,但适用性较广,且实例分析说明了其有效性.6.结论本文主要研究了偏正态条件下多元线性回归模型的统计推断问题,基于最大似然方法,主要结论如下:1)在n p+1条件下证明了模型参数的估计以概率1存在;2)通过反证法证明了模型参数估计以概率1唯一;3)在估计唯一性等假定
34、下,参数的最大似然估计依概率收敛到参数真值;4)在估计依概率收敛条件下得到了各参数的渐近分布,为模型参数的假设检验提供了基理论依据.最后,数值模拟验证了随着样本量的增大参数的估计值越来越接近真值,且参数的理论渐近分布也越来越接近真实分布;实例表明估计的近似分布应用于实际数据往往更符合现实情况.参考文献:1 AZZALINI A.A class of distributions which includes the normal onesJ.Scandinavian journal ofstatistics,1985:171-178.2 ARELLANO-VALLE R B,BOLFARINE
35、H,LACHOS V H.Skew-normal linear mixed modelsJ.Journal of data science,2005,3(4):415-438.3 ARELLANO-VALLE R B,BOLFARINE H,LACHOS V H.Bayesian Inference for Skew-normalLinear Mixed ModelsJ.Journal of Applied Statistics,2007,34(6):663-682.4 CANCHO V G,LACHOS V H,ORTEGA E M M.A nonlinear regression mode
36、l with skew-normalerrorsJ.Statistical papers,2010,51(3):547-558.第 2 期赵伟凯等:偏正态条件下多元线性回归模型的统计推断及其应用5295 胡明星,句媛媛,戴琳,吴刘仓.偏正态空间自回归模型的贝叶斯估计J.昆明理工大学学报(自然科学版),2021,46(6):144-151.6 王丹璐,吴刘仓,郑桂芬.基于偏正态数据下位置、均值回归模型的参数估计J.应用数学,2021,34(3):590-599.7 陈超,田芫,宗序平.偏对称正态分布的若干性质J.统计科学与实践,2019(1):25-28.8 吴树礼,彭作祥.-偏正态分布的尾部特
37、征及极值的极限分布J.西南师范大学学报(自然科学版),2020,45(9):19-22.9 潘永博.偏正态误差分布下一元线性回归模型的参数估计及比较D.郑州:郑州大学,2017.10 侯格格.经验特征函数在偏正态分布中的应用J.温州大学学报(自然科学版),2019,40(3):13-21.11 郑桂芬,吴刘仓,聂兴锋.基于偏Laplace正态数据下位置,均值回归模型的参数估计J.应用数学,2020,33(3):747-756.12 GALLANT R A,WHITE H.A Unified Theory of Estimation and Inference for Nonlinear Dyn
38、amicModelsM.New York,USA:Basil Blackwell Inc.,1988.13 LEHMANN E L.Elements of Large-Sample TheoryM.New York,NY:Springer,1999.14 SHAPIRO S S,WILK M B.An analysis of variance test for normality(complete samples)J.Biometri-ka,1965,52(3/4):591-611.15 梁小筠.正态性检验M.北京:中国统计出版社,1997.Statistical Inference of M
39、ultiple Linear Regression Modelswith Skewed Normal Errors and Its ApplicationsZHAO Weikai1,2,YANG Lanjun1,2,DAI Lin1,2,WU Liucang1,2(1.School of Science,Kunming University of Science and Technology,Kunming 650500,China;2.Statistics Research Center,Kunming University of Science and Technology,Kunming
40、 650500,China)Abstract:In this paper,the statistical inference for multiple linear regression models with skewednormal errors is considered.Based on the maximum likelihood approach,the works are as follows:1)It is proved that the maximum likelihood estimators of the parameters exist with probability
41、 1 undercondition n p+1 and the uniqueness of the parameter estimators is discussed.The results of thenumerical studies show that the estimators exist and are unique.2)The consistency of the estimators isgiven under the uniqueness assumption;3)The asymptotic distributions of the estimators are given
42、 underthe uniqueness assumption.Finally,the validity of the proposed theory and method is illustrated bynumerical simulations.The empirical examples show that the asymptotic distributions of the estimatorsare of practical significance.Key words:Skew-normal distribution;Multiple linear model;Maximum likelihood estimation;Asymptotical distribution