1、Mlinex损失函数下反向帕累托分布形状参数的Bayes估计何贵阳,周菊玲*(新疆师范大学 数学科学学院,新疆 乌鲁木齐 830017)摘要:文章研究了Mlinex损失函数下反向帕累托分布的参数估计问题。在已知反向帕累托分布位置参数的情况下,给出形状参数的五种估计方法:极大似然估计、最大后验估计、经典Bayes估计、多层Bayes估计、E-Bayes估计,并推导出相应估计方法下的具体表达式。利用MC方法在R软件下进行数值模拟,对比模拟数据确定了参数估计的最优环境,并验证了估计方法的合理性和估计结果的准确性与稳健性,得到了E-Bayes估计为最优估计方法的结论;最后利用最优估计方法对实例进行数据
2、拟合,确定了新疆县市级城市的人均城市道路面积可以利用反向帕累托分布近似拟合,并结合最终数据给出了相应的数据分析。关键词:Mlinex损失函数;反向帕累托分布;E-Bayes估计;数值模拟;数据拟合中图分类号:O212文献标识码:A文章编号:1008-9659(2024)01-0001-12Vol.43,No.1Mar.2024第43卷 第1期2024年3月新疆师范大学学报(自然科学版)Journal of Xinjiang Normal University(Natural Sciences Edition)收稿日期 2023-05-29 修回日期 2023-08-14 作者简介 何贵阳(19
3、99-),男,新疆石河子人,硕士研究生,主要从事数理统计方面研究。*通讯作者 周菊玲(1968-),女,新疆乌鲁木齐人,副教授,主要从事数理统计方面研究。帕累托分布是一类经典的,能充分反映幂律特征的分布函数,因此一直备受关注。其名称是由意大利经济学家维弗雷多 帕累托(18481923)定义的,这一分布在经济学以外领域被称为“布拉德福分布”。因帕累托分布中变量的独特取值要求,即定义变量取值在特定数值之上,使得帕累托分布在应用上受限。如黄娟等人讨论了Pareto分布参数的经验Bayes(EB)单边检验问题,构造了参数的经验Bayes检验函数,证明了其具有渐近最优性,并且获得了收敛速度1。李超建等人
4、介绍了基于帕累托分布的禽畜种苗交易系统入侵容忍模型,每台服务器的结构不同,但禽畜种苗交易网站服务内容相同,具有响应结果一致性2。温利民等人建立贝叶斯模型,讨论帕累托索赔额分布中参数的估计问题,得到了风险参数的极大似然估计、贝叶斯估计和信度估计,并证明了这些估计的强相合性3。钱小仕等人提到地震震级超过某一阈值的超出量分布可以近似为广义帕累托分布,并介绍了基于广义帕累托分布给出的若干地震活动性参数的估计公式4。张悦基于多种复杂删失数据研究帕累托分布的统计特性,构建了逐步II型删失下的拟合优度检验,推导了广义逐步II型删失下帕累托分布的寿命绩效指数的统计推断,讨论了适应性逐步II型删失模式下帕累托分
5、布的竞争风险模型分析,并将结论推广到更复杂的广义指数分布5。通过查阅近些年关于帕累托分布的相关研究文献,可以确定帕累托分布只局限于刻画幂律特征的分布函数中的上尾部分1-7。从此特性出发,考虑变量的取值,如果将帕累托分布变量的定义域取相反数,则可以求解其受限外的区域,即刻画幂律特征的分布函数中的下尾部分。王超探讨了反向帕累托分布的统计推断问题,通过研究2010年我国655个城市人口规模,证明了中小型城市人口规模可以使用反向帕累托分布进行拟合8。简单的取值变化弥补了帕累托分布刻画区域的不足,同时也完善了对满足幂律特征区域的一种刻画问题。针对帕累托分布变量取相反数的特点,结合帕累托分布特点,提出反向
6、帕累托分布。反向帕累托分布的密度函数和分布函数分别为 f(x;a,)=a-x-1,0 x a F(x;a,)=a-x,0 0,0,符号表示为RP(a,).在处理参数估计问题上,常见方法有极大似然估计、矩估计、熵估计、Bayes估计等。根本上是频率学派与贝叶斯学派就估计方法进行激烈讨论,其中频率学派的极大似然估计与贝叶斯学派的最大后验估计最具代表性。但无论是哪一学派的哪一种估计方法,都离不开样本信息与损失函数的选取,其中常用的损失函数有熵损失函数、平方损失函数、加权平方损失函数、Linex损失函数、复合Linex损失函数、Mlinex损失函数等。值得一提的是Mlinex损失函数,Mlinex损失
7、函数是一类非对称损失函数,是由Podder在2004年提出的一种修正的线性指数损失函数,其具体表达式为L(,)=()c-cln()-1,0,c 0(1)其中,是未知参数判别空间的一个估计。Mlinex损失函数虽是对原有损失函数的一种修正,但一直未停止对其进行研究。例如王琳等人基于逐步增加型截尾样本,研究了Mlinex损失下Burr部件可靠性指标的经验Bayes估计9。丁新月等人在Mlinex损失函数下,讨论了逆伽马分布尺度参数的Bayes估计及其可容许性10。李新鹏等人利用信度理论的方法得到了Mlinex损失函数下Bhlmann-Straub模型具有特殊相依效应的信度保费,进而推导出Mline
8、x损失函数下Bhlmann模型具有此种相依效应的信度保费11。事先说明Mlinex损失函数中常数c的取值问题。文章只研究c 0的情况,c 0,0.证明 选取形状参数的先验分布为(),,其中参数,为超参数,且 0,0,同时令p(X|)是样本 X1,X2,Xn对参数的条件密度,则有()=()-1e-(2)p(X|)=i=1n(a-x-1)=na-ni=1n()xi-1=ni=1nxiet,t=i=1n(lnxi-lna)(3)因此有p(X|)()=ni=1nxiet()-1e-=()i=1nxin+-1e-(-t)(4)考虑到形状参数的最大后验估计是寻找的估计量,使形状参数的后验密度函数达到最大值
9、的情况,即找到使p(X|)()达到最大值。令g()=n+-1e-(-t),由最大后验估计方法的原理可知,要对p(X|)()关于求解最大值,就是要对g()关于求解最大值。但关于g()直接求解最值问题处理较为复杂,考虑变式,因g()=exp ln(g()=exp ln(n+-1e-(-t),则对g()求解最值问题可转化对ln g()求解最值问题。对ln g()关于形状参数取一阶微分,同时令微商为0,即()ln g()=n+-1-(-t)=0解得形状参数的最大后验估计MAP=n+-1-t3 形状参数的Bayes估计上文介绍了反向帕累托形状参数的最大后验估计。由于最大后验估计是Bayes估计解的近似值
10、,其估计结果相比于利用Bayes理论下的经典估计方法得到的结果,还存在一定偏差。具体体现在损失函数的影响,所以下面将继续讨论在考虑损失函数情况下,反向帕累托形状参数在Bayes理论下的经典估计方法并确定估计结果的具体表达式。考虑位置参数a已知的情况下,形状参数在Mlinex损失函数下的经典Bayes估计问题。定理2 设 X1,X2,Xn是来自RP(a,)分布的简单随机样本,其中a与分别为位置参数与形状参数。令 X=(X1,X2,Xn),并且x1,x2,xn是相应随机样本下的观察值,在Mlinex损失函数(1)下,对于任意的先验分布(),在位置参数已知的情况下,形状参数的唯一Bayes估计为B(
11、)X=()E()-c|X-1c证明 设(X)为形状参数的任意一个估计,用(X)代替损失函数中的,则在Mlinex损失函数下,(X)相应的风险函数为R(X)()=E ()(X)c-cln(X)-1但在贝叶斯观点下,R(X)()是形状参数的函数,而还是随机变量,它也有先验分布().于是(X)的损失函数应由R(X)()()d判定,同时考虑贝叶斯观点下的最优估计,所以引入形状参数对X的“后验风3新疆师范大学学报(自然科学版)2024年险”,即R(X)|X)=()(X)c-cln(X)-1 p(X|)()d其中,p(X|)()表示参数与样本 X=(X1,X2,Xn)的联合密度函数。结合贝叶斯观点下(X)
12、的损失函数,则有R(X)()()d=E ()(X)c-cln(X)-1()d=n+1次()(X)c-cln(X)-1 p(X|)()dXd=n次R(X)|X)dX=E E ()(X)c-cln(X)-1|X所以(X)相应的风险函数为R(X)()()d=E E ()(X)c-cln(X)-1|X其中,E ()(X)c-cln(X)-1|X表示参数与样本 X=(X1,X2,Xn)的联合分布下的数学期望。由损失函数定义可知,在对特定分布的参数进行估计时,考虑到给定相应损失函数后,需要使风险函数尽可能的小,以保证参数估计时的准确性。为此需使风险函数中的E ()(X)c-cln(X)-1|X极小化即可。
13、因为E ()(X)c-cln(X)-1|X=(X)cE()-c|X-cln(X)+cE()ln|X-1设f(X)=(X)cE()-c|X-cln(X)+cE()ln|X-1将f(X)关于(X)求一阶微分并令其等于零,便可解得形状参数的Bayes估计为B(X)=()E()-c|X-1c由于f(X)是凸函数,所以(X)是f(X)的唯一最小值。同时若存在使得R(X)()0,0,在Mlinex损失函数(1)下,且位置参数a已知的情况下,形状参数的Bayes估计的精确表达式为4何贵阳,等:Mlinex损失函数下反向帕累托分布形状参数的Bayes估计B*()X=()E()-c|X-1c=()(n+)(n+
14、-c)1c(-t)证明 因为选取(),作为形状参数的先验分布(),则由式(2)可得()=()-1e-又因为RP(a,)分布的密度函数是 f(x;a,)=a-x-1;0 0,所以样本的似然函数由式(3)确定为L(X|)=i=1n(a-x-1)=na-ni=1n()xi-1=ni=1nxiet,t=i=1n(lnxi-lna)因此,形状参数的后验分布密度为()|X=L(X|)()0L(X|)()d=ni=1nxiet()-1e-0ni=1nxiet()-1e-d=()i=1nxin+-1e-(-t)()i=1nxi0n+-1e-(-t)d =n+-1e-(-t)0n+-1e-(-t)d=n+-1e
15、-(-t)(-t)n+(n+)(5)由式(5)可以看出,形状参数的后验分布服从伽马分布(n+,-t).于是有E()-c|X=0-c(|X)d=0-c n+-1e-(-t)(-t)n+(n+)d=0n+-c-1e-(-t)(-t)n+(n+)d=(-t)n+(n+)(n+-c)(-t)n+-c=(-t)c(n+-c)(n+)因此,由定理2可知,Mlinex损失函数下形状参数的Bayes估计的精确表达式为B*()X=()(-t)c(n+-c)(n+)-1c=()(n+)(n+-c)1c(-t)4 形状参数的E-Bayes估计(EB)与多层Bayes估计(HB)在Bayes理论不断进步的同时,对特定
16、分布参数的估计方法也一直不断地发展与完善。这一系列的发展也使得参数估计不断逼近于真值,使其误差不断地缩小,这样的结果正是对特定分布参数进行估计的最终理想。所以接下来文章进一步研究形状参数在Mlinex损失函数下,先验分布选定为(),的E-Bayes估计与多层Bayes估计。根据相应文献,为了使估计的效果较好,(),中参数和的取值应使先验分布密度函数为形状参数的减函数13。再考虑估计的稳健性,最终确定0 0,0.令X=(X1,X2,Xn),并且x1,x2,xn是相应随机样本下的观察值,在位置参数已知时,RP(a,)分布中的形状参数,在Mlinex损失函数下的E-Bayes估计的精确表达式为EB(
17、)X=1m lnm-t-t01()(n+)(n+-c)1cd其中,t=i=1n(lnxi-lna),(),中参数和的先验分布分别为U()0,1和U()0,m.证明 首先由推论1可知,RP(a,)分布的形状参数,在Mlinex损失函数下的Bayes估计的精确表达式为B*()X=()(n+)(n+-c)1c(-t)其中,t=i=1n(lnxi-lna).给定形状参数的先验分布为(),且,均为超参数,0,0.假设,独立,则有和的先验分布分别为U()0,1和U()0,m上的均匀分布,所以得到先验分布密度函数f(),=1m.最后由定义1,RP(a,)分布的形状参数,在Mlinex损失函数下的E-Baye
18、s估计的精确表达式为EB()X=E()|X=0m01()(n+)(n+-c)1c(-t)f(,)dd=0m01()(n+)(n+-c)1c(-t)1mdd=1m01()(n+)(n+-c)1cd0m1-td=1m lnm-t-t01()(n+)(n+-c)1cd4.2 多层Bayes估计(HB)定义2 若的先验分布为(),分布,其密度函数()=()-1e-,其中参数,为超参数,且 0,0.假设,独立,则有和的先验分布分别为U()0,1和U()0,m上的均匀分布,所以得到先验分布密度函数f(),=1m,同时在和独立时,则的多层先验密度函数为6何贵阳,等:Mlinex损失函数下反向帕累托分布形状参
19、数的Bayes估计*()=0m01()f(,)dd=0m01()-1e-1mdd,0定理4 同定理3条件。在位置参数a已知时,若形状参数的多层先验密度函数*()由定义2给出,则在位置参数已知时,在Mlinex下形状参数的多层Bayes估计为HB=0m01(n+1)()(-t)n+1dd0m01(n+)()(-t)n+dd其中,t=i=1n(lnxi-lna),(),中参数和的先验分布分别为U()0,1和U()0,m.证明 设 X1,X2,Xn为来自RP(a,)分布的简单随机样本,在位置参数a已知时,样本的似然函数由式(3)给定L(X|)=i=1n(a-x-1)=na-ni=1n()xi-1=n
20、i=1nxiet,t=i=1n(lnxi-lna)若形状参数的多层先验密度函数由定义2给出,根据Bayes定理,形状参数的多层后验分布密度为h()|X=L(X|)*()0L(X|)*()d=ni=1nxiet0m01()-1e-1mdd0ni=1nxiet0m01()-1e-1mdd d=0m01()n+-1e-(-t)dd0m01(n+)()(-t)n+dd在Mlinex损失函数下,形状参数的多层Bayes估计为HB=0 h()|X d=0 0m01()n+-1e-(-t)dd0m01(n+)()(-t)n+ddd=0m01()()0n+-1e-(-t)d dd0m01(n+)()(-t)n
21、+dd=0m01()()0n+e-(-t)d dd0m01(n+)()(-t)n+dd=0m01(n+1)()(-t)n+1dd0m01(n+)()(-t)n+dd5 数值模拟文章研究了形状参数的五种估计方法并给出了相应的具体表达式。为确保估计所得结果的准确性、稳健性,接下来利用R软件对给出的估计方法进行MC数值模拟,并在模拟中运用控制变量的原理,观察对比偏差量Abs的数值变化,逐步得到最优估计的参数环境。在最优估计参数环境下,通过对均方误差MSE的数值变化进行讨论,最终确定Bayes理论下的最优估计。在RP(a,)分布中,给定参数真值,即位置参数a=100和形状参数=3时,对样本取值为7新疆
22、师范大学学报(自然科学版)2024年n=20、50、100、150,Mlinex损失函数相应参数=1、形状参数的先验分布为()2,1均给定。采用MC方法进行数值模拟计算,每种情况均进行2000次模拟计算,其计算结果如表1、表2、表3所示。其中,表1为给定条件下,确定Mlinex损失函数中常数c的最优环境;表2为给定条件下,确定形状参数的先验分布下参数的最优环境;表3为在最优环境下形状参数的三种估计方法下的均方误差MSE.表1 确定Mlinex损失函数中常数c的最优环境(给定条件)检验样本数与估计结果的相关性nMLE(Abs)MAP(Abs)503.13500.13502.93650.06351
23、003.05800.05802.95950.04051503.04460.04462.98120.0188 Mlinex损失函数=1,n=50、100、150,c=1、3、5,形状参数的先验分布为()2,1ncB(Abs)5012.94030.059732.87200.128052.82800.172010012.96370.036332.92970.070352.90430.095715012.98280.017232.96280.037252.94890.0511由表1数据可得结论如下:(1)与近似Bayes估计方法和Bayes估计方法相比,基本估计方法中极大似然估计结果比真值大,即偏差量
24、为正。相比于极大似然估计,最大后验估计结果更接近真值。这是最大后验估计在估计问题上考虑了待估参数先验分布与样本相关的体现。(2)Mlinex损失函数中常数c的取值变化对RP(a,)分布中形状参数的Bayes估计有一定的影响。可以看出,当Mlinex损失函数常数c=1时,其估计结果最接近真值,所以可以判断在已给定条件下,Mlinex损失函数参数的最优环境为=1,c=1.(3)对比三种估计方法在样本容量逐步增大时,估计结果也逐步趋近真值,即三种估计方法均满足大样本性质。同时对比偏差量可知所列举估计方法得到的结果是准确的,估计结果均满足准确性。(4)结合数据可以判断出,在无损失函数环境影响下,处理满
25、足反向帕累托分布形状参数的大样本数据的估计问题上,选择最大后验估计是最优的。表2 确定形状参数的先验分布中参数的最优环境(给定条件)n2050100150m0.20.510.20.510.20.510.20.51B(Abs)2.83082.9403(0.0597)2.9637(0.0363)2.9828(0.0172)HB(Abs)3.1998(0.1998)3.1065(0.1065)3.0534(0.0534)3.0830(0.0830)3.0457(0.0457)3.0182(0.0182)3.0199(0.0199)3.0144(0.0144)3.0102(0.0102)3.0292(
26、0.0292)3.0165(0.0165)3.0010(0.0010)EB(Abs)3.0323(0.0323)2.9573(0.0427)2.8556(0.1444)2.9626(0.0374)2.9519(0.0481)2.9318(0.0682)2,9871(0.0129)2.9760(0.0240)2.9575(0.0425)2.9866(0.1134)2.9878(0.0122)2.9714(0.0286)注:=1,c=1,n=20、50、100、150,形状参数的先验分布为()2,1且m=0.2、0.5、1.8何贵阳,等:Mlinex损失函数下反向帕累托分布形状参数的Bayes估计
27、由表2数据可得结论如下:(1)在Bayes理论下,相比于经典Bayes估计(B)和E-Bayes估计(EB),多层Bayes估计(HB)估计结果的偏差为正偏差量,其他两个为负偏差量。(2)形状参数的先验分布中参数的数值选取对Bayes估计结果有一定的影响,可以看出当先验分布中参数的数值选取m=1时,其估计结果最接近真值。所以可以判断在已给定条件下,形状参数的先验分布中参数的数值选取最优环境是m=1.同时对比m取值量的变化,三种Bayes估计方法得到结果变化的幅度都较小,即可说明三种Bayes估计方法所得结果均满足稳健性,其中E-Bayes估计稳健性最强。(3)同表1结论,以上三种Bayes方法
28、也均满足大样本性,估计结果均满足准确性。(4)结合数据可以判断出:在Mlinex损失函数环境影响下,如需准确地处理满足反向帕累托分布形状参数的大样本数据估计问题时,选择E-Bayes估计方法是最优的。如需处理满足特定的正偏差逼近问题时,可选择多层Bayes估计方法得到较准确的近似值。表3 在最优环境下形状参数的三种估计方法下的均方误差MSEn2050100150m1B0.35510.16980.08820.0597HB0.47690.18590.08980.0602EB0.36400.16800.08820.0548 注:=1,c=1,n=20、50、100、150,形状参数的先验分布为()2
29、,1且m=1.由表3数据可得结论如下:(1)在参数的最优环境下,Bayes理论中的三种估计方法所得结果的均方误差MSE数值变化较稳定,结果能体现三种Bayes估计方法的合理可靠性。同时随着样本数据的增加,均方误差MSE均控制在较小的有效值内,即三种Bayes估计方法所得结果是准确有效的。(2)数据对比可得:三种Bayes方法的均方误差MSE偏差量,在大样本数据下均控制在0.001,即三种Bayes估计方法所得结果较相近。同大样本数据下,E-Bayes估计方法中均方误差MSE控制较好,其可靠性较其他两种较强。6 结论文章所给出的包括近似Bayes与Bayes理论下常用的三种估计方法,通过数值模拟
30、并分析比较,得到以上五种估计方法都满足大样本性质且部分估计结果具有一定的可靠性、准确性、稳健性。结合样本条件与稳健性要求,五种估计方法中E-Bayes估计法,在处理Mlinex损失函数下反向帕累托分布形状参数的估计问题上较为快捷、准确、稳定,即可判断E-Bayes估计是最优估计方法。7 实例应用文章14节内容已解决了所提出的估计问题,并最终做出总结,给出了处理相应参数估计问题的最优方法。但理论研究不仅仅是对处理问题的方法进行总结,更是要解决实际问题。在对反向帕累托分布的研究中,鲜有见到相关实际问题的讨论。王超探讨了反向帕累托分布的统计推断问题,通过2010年我国655个城市人口规模的案例,证明
31、了中小型城市人口规模可以使用反向帕累托分布进行拟合8。蓝海等人基于E-Bayes估计的定义,分别在加权平方损失函数和平方损失函数下讨论了反向帕累托分布在位置参数已知时,形状参数的E-Bayes估计15。徐宝等人使用加权p,q对称损失函数研究了反向帕累托分布的形状参数在刻度参数给定条件下Bayes估计的形式与性质。得到了形状参数Bayes估计的一般形式以及在给定共轭先验下的精确形式,证明了所得Bayes估计具有可容许性以及最小最大性16。文章将从文献 16 提出的反向帕累托分布可以拟合中小型城市人口规模的研究出发,对新疆维吾尔自治区二十座县市级城市的人均城市道路面积进行拟合研究。9新疆师范大学学
32、报(自然科学版)2024年一座城市的发展,不仅仅依赖于经济水平的提升,经济的发展与城市道路面积的扩建也体现在城市常住人口数的变化,但要考虑到经济发展同时伴随着人口流动。面对近些年不断发展的新疆,常住人口数已不能再作为衡量某座城市的发展标准,所以文章引入人均城市道路面积作为城市发展的判断依据。文章利用反向帕累托分布对新疆维吾尔自治区内二十座县市级城市的人均城市道路面积进行拟合,并利用最优估计方法判断拟合结果是否准确。以下数据来自于新疆维吾尔自治区统计局 2021年新疆统计年鉴11-2各城市市区设施水平。表4 2021年新疆20座县市级城市人均城市道路面积数据城市名称阿克苏市和田市博乐市昌吉市伊宁
33、市乌鲁木齐市阜康市人均城市道路面积(m2)12.6914.3414.3615.4216.9719.6823.72城市名称哈密市伊州区塔城市阿勒泰市乌苏市库车市阿图什市喀什市人均城市道路面积(m2)24.2024.5525.0427.9828.4930.5830.82城市名称奎屯市吐鲁番市高昌区库尔勒市克拉玛依市阿拉山口市霍尔果斯市人均城市道路面积(m2)40.5346.0152.5255.5472.9973.61注:表中数据不含兵团。通过分析,设表中数据为 X=(X1,X2,X20)的样本,通过计算得到样本均值与样本方差:E(X)=32.50,Var(X)=345.50.观察样本数据分布情况,
34、有较多的小样本数据。同时结合人口分布的特点,数据可视为满足幂律特征的下尾分布,即考虑利用反向帕累托分布拟合。通过反向帕累托分布期望与方差公式E(X)=a+1Var(X)=a2(+1)2(+2)结合样本均值与样本方差信息,求解得到参数真值a 64.561,1.014.但由于限定0 x a,所以上述表格中存在异常数据,从而限制了参数a的确定。对比实际人口数据判断阿拉山口市与霍尔果斯市数据存在一定异常,主要体现为流动人口数较多,常住人口数较其他地区偏少,使得在同等城市道路面积下,人均城市道路面积值偏大。利用Excel软件,在理想环境下,对已知的20组数据进行参数的E-Bayes估计。通过迭代拟合,修
35、正参数a的值并对估计结果与真值进行数值比较,在误差可允许范围内找到最优估计下参数的近似估计值,最后验证拟合的准确性。由表5拟合结果可以得出:(1)2021年新疆城市市区设施水平中人均城市道路面积数据可以用反向帕累托分布近似拟合,拟合结果相对准确。(2)在处理2021年新疆城市市区设施水平中人均城市道路面积数据时,发现在给定数据的情况下,得到的参数a的真值存在误差,在后期数据拟合中,也验证了数据中阿拉山口市与霍尔果斯市数据存在异常。在数据不变的条件下,通过Excel软件的迭代修正参数a数值,并对修正后数据进行估计。对比参数真值,可以判断当a=244时,估计结果与真值相同,数据拟合最完美。同时确定
36、当a 136,845时,数据均方误差MSE 0.3640,即在可偏差范围内。(3)在对参数a进行修正过程中发现,表中给定的数据中存在异常,但异常不是错误。根据对资料的查询与研究,找到阿拉山口市与霍尔果斯市数据异常原因为:该地区人口数据变化幅度较大,即流动人口数较多,常住人口数量较少,人口流动性较强。同时也说明该地区城市公共资源开发力度较强,开发后使用程度较低等问题。(4)对比全国人居城市道路面积数据可以判断,以上城市中较多数城市数据高于全国标准数据17.36 m2.10何贵阳,等:Mlinex损失函数下反向帕累托分布形状参数的Bayes估计即说明新疆县市级城市资源利用率较低,固定人口数较少,人
37、口流动性较强。表5 通过迭代修正参数a的值并对参数拟合,得到近似拟合值y(理想环境)a城市名称阿克苏市和田市博乐市昌吉市伊宁市乌鲁木齐市阜康市哈密市伊州区塔城市阿勒泰市乌苏市库车市阿图什市喀什市奎屯市吐鲁番市高昌区库尔勒市克拉玛依市阿拉山口市霍尔果斯市T=sum(log(x)/a)y=log(1-1)*(-l)A(-1)*19.5人均城市道路面积(m2)12.6914.3414.3615.4216.9719.6823.7224.2024.5525.0427.9828.4930.5830.8240.5346.0152.5255.5472.9973.6173.61-0.763-0.710-0.71
38、0-0.679-0.637-0.573-0.492-0.483-0.477-0.468-0.420-0.412-0.381-0.378-0.259-0.204-0.147-0.122-0.0040-8.3212.213136-1.030-0.977-0.976-0.945-0.904-0.840-0.758-0.750-0.743-0.735-0.687-0.679-0.648-0.645-0.526-0.471-0.413-0.389-0.270-0.267-13.6531.378200-1.198-1.144-1.144-1.113-1.071-1.0070.9260.9170.9110.
39、9020.8540.8460.8160.8120.6930.6380.5810.5560.438-0.434-17.0021.114244-1.284-1.231-1.230-1.199-1.158-1.093-1.012-1.004-0.997-0.989-0.941-0.933-0.902-0.899-0.780-0.725-0.667-0.643-0.524-0.520-18.7301.014245-1.286-1.233-1.232-1.201-1.159-1.095-1.014-1.0050.9990.9910.9420.9340.9040.9000.7810.7260.6690.6
40、450.526-0.522-18.7651.012800-1.800-1.747-1.746-1.715-1.673-1.609-1.528-1.519-1.513-1.504-1.456-1.448-1.418-1.414-1.295-1.240-1.183-1.158-1.040-1.036-29.0430.661845-1.823-1.770-1.770-1.739-1.697-1.633-1.551-1.543-1.537-1.528-1.480-1.472-1.441-1.438-1.319-1.264-1.207-1.182-1.064-1.060-29.5190.650850-1
41、.826-1.773-1.772-1.741-1.670-1.635-1.554-1.546-1.539-1.531-1.483-1.475-1.444-1.441-1.322-1.267-1.209-1.185-1.066-1.062-29.5700.6498 总结文章对Mlinex损失函数下反向帕累托分布形状参数估计进行充分讨论,对比了频率学派的极大似然估计与贝叶斯学派的最大后验估计两大经典估计方法,两者的估计结果在数值上较为相似。结合两者在处理问题上的出发点不同,所以应用也各不相同。同时文章也在Bayes理论下,对相应参数进行了近似Bayes估计与经典Bayes估计的对比,给定了形状参数
42、在估计时的参数最优环境,并通过数值模拟得到在Bayes理论下,处理相应估计问题的最优估计,即E-Bayes估计是最优估计方法。最后利用最优估计方法,对 2021年新疆统计年鉴11-2各城市市区设施水平 中人均城市道路面积的数据进行参数拟合,确定了新疆县市级城市的人均城市道路面积可以利用反向帕累托分布拟合,并结合最终数据给出了相应的数据分析。参考文献:1 黄娟,刘华祥,张健.混合样本下帕累托分布参数的经验贝叶斯分析 J.数学研究,2009,42(03):335-340.2 李超建,朱晓姝,龚榆桐.基于帕累托分布假设的禽畜种苗交易系统入侵容忍模型分析 J.沈阳农业大学学报,2014,45(01):
43、122-125.3 温利民,张美,程子红,等.帕累托索赔分布中风险参数的经验贝叶斯估计 J.应用概率统计,2015,31(03):225-237.11新疆师范大学学报(自然科学版)2024年4 钱小仕,王福昌,盛书中.基于广义帕累托分布的地震震级分布尾部特征分析 J.地震学报,2013,35(03):341-350.5 张悦.基于复杂删失数据帕累托分布的统计推断 D.北京:北京交通大学,2021.6 陶瑞芳.帕累托分布中参数的线性贝叶斯估计 D.南昌:江西师范大学,2020.7 石林.排序集抽样下帕累托分布形状参数的估计 D.武汉:华中师范大学,2014.8 王超.反向帕累托分布参数估计及应用
44、 J.统计与决策,2021,(14):41-44.9 王琳,师义民,袁修国.MLINEX损失下Burr部件可靠性指标的经验贝叶斯估计 J.青岛科技大学学报(自然科学版),2011,32(02):204-207.10 丁新月,徐美萍.Mlinex损失函数下逆伽马分布尺度参数的Bayes估计 J.广西师范大学学报(自然科学版),2014,(03):61-64.11 李新鹏,吴黎军.MLINEX损失函数下具有风险相依效应的信度模型 J.江西师范大学学报(自然科学版),2020,44(01):17-19.12 峁诗松,王静龙,濮晓龙.高等数理统计学 M.北京:高等教育出版社,1998.13 韩明.多层
45、先验分布的构造及其应用 J.运筹与管理,1997,6(03):31-40.14 BERGER J O.Statistical Decision Theory and Bayesian Analysis M.New York:Springer Verlag,1985.15 蓝海,徐宝.两种平方损失下反向帕累托分布形状参数的E-Bayes估计 J.内江师范学院学报,2022,37(04):58-62.16 徐宝,蓝海,赵仲达.一种对称损失函数下反向帕累托分布形状参数的估计 J.南开大学学报(自然科学版),2023,56(01):76-81.Bayes Estimates of Shape Para
46、meters of Reverse Pareto Distribution under Mlinex Loss FunctionHE Gui-yang,ZHOU Ju-ling*(School of Mathematical Sciences,Xinjiang Normal University,Urumqi,Xinjiang,830017,China)Abstract:In this paper,the parameter estimation problem of inverted Pareto distribution under Mlinex loss function is stud
47、ied.In the case of knowing the positional parameters of the inverted Pareto distribution,five estimation methods for the shape parameters are given:maximum likelihood estimation,maximum posterior estimation,classical Bayes estimation,multilayer Bayes estimation,E-Bayes estimation,and the specific ex
48、pressions under the corresponding estimation methods are derived.The MC method is used to carry out numerical simulation under R software,the optimal environment for parameter estimation is determined by comparing the simulation data,and the rationality of the estimation method and the accuracy and
49、robustness of the estimation results are verified,the conclusion that E-Bayes estimation is the optimal estimation method is obtained.Finally,the optimal estimation method is used to fit the data of the examples,and it is determined that the per capita urban road area of Xinjiang counties and cities can be approximated by using the reverse Pareto distribution,and the corresponding data analysis is given in combination with the final data.Keywords:Mlinex loss function;Reverse Pareto distribution;E-Bayes estimation;Numerical simulation;Data fitting12