我国人口死亡风险异质与混合模型研究_赵明.pdf

资源描述

1、第 40 卷第 3 期统计研究 Vol.40，No.3 2023 年 3 月 Statistical Research Mar.2023 我国人口死亡风险异质与混合模型研究*赵明王晓军内容提要：多人口随机死亡率模型是人口统计和保险精算领域的前沿问题。建立符合我国人口特征的死亡率预测模型，对人口预测、长寿风险度量和积极管理长寿风险具有重要意义。然而，当前研究中对人口死亡风险异质性问题的关注较少，不能为多人口随机死亡率建模提供科学的研究假设。本文从我国人口死亡风险异质性的检验出发，构建两性别人口死亡率联合预测的混合泊松公因子模型，并给出极大似然参数估计的迭代算法，对我国男女两性别人口死亡

2、率进行联合建模和预测，最后用于对保险公司养老年金的长寿风险资本需求测算。研究表明，混合泊松公因子模型能够有效刻画人口死亡风险的异质性，提升模型拟合优度，有效避免传统模型低估人口死亡率改善的弊端，并且死亡率性别比变动趋势符合人类生物规律。在风险导向的第二代偿付能力体系下，本文提出的死亡率模型能够为保险公司提供更稳健的长寿风险资本评估。关键词：人口死亡率；死亡异质性；混合泊松模型；长寿风险 DOI:10.19343/ki.111302/c.2023.03.011 中图分类号：F840.62 文献标识码：A 文章编号：10024565(2023)03013912 *基金项目：国家社会科学基金重点项目

3、“我国基本养老保险制度研究”（20AZD075）；教育部哲学社会科学研究重大课题攻关项目“健康中国2030背景下的健康老龄化体系优化研究”（20JZD023）；全国统计科学研究重点项目“新时代人口长期均衡发展综合评价指标体系研究”（2022LZ36）；首都经济贸易大学青年学术创新团队项目“大数据背景下健康老龄化综合评价指数体系与精算测度研究”（QNTD202104）；北京市属高等学校优秀青年人才培育计划项目（The Project of Cultivation for young top-motch Talents of Beijing Municipal Institutions）“大数据背

4、景下老年人健康预期寿命不平等的多维测度研究”（BPHR202203166）。Study on the Heterogeneity of Population Death Risk and Mixed Mortality Model in China Zhao Ming&Wang Xiaojun Abstract:Multi-population stochastic mortality model is a frontier issue in the fields of population statistics and actuarial science.It is meaningful t

5、o establish a mortality forecasting model in line with the characteristics of Chinese population for population forecast,longevity risk measurement and active management.However,the current research pays less attention to the heterogeneity of population death risk,which can not provide scientific re

6、search assumptions for multi-population stochastic mortality modeling.Based on the test of the heterogeneity of death risk in China,this paper constructs a Mixed Poisson Common Factor Model for the joint forecasting of male and female mortality.Furthermore,the iterative algorithm of maximum likeliho

7、od parameter estimation is given to jointly forecast the mortality of men and women in China,so as to provide a scientific basis for insurance companies to deal with the risk of longevity.The research shows that the Mixed Poisson Common Factor Model can effectively describe the 140 统计研究 2023 年 3 月 h

8、eterogeneity of population death risk,improve the fitting of the model,effectively avoid the disadvantages of traditional models underestimating the improvement of population mortality,and the change trend of mortality sex ratio is in line with human biological laws.Under the second generation of Ch

9、inas risk oriented solvency system,this study can provide a more robust additional capital reserve for the longevity risk evaluation of insurance companies.Key words:Population Mortality;Death Heterogeneity;Mixed Poisson Model;Longevity Risk 一、引言和文献综述人口寿命延长与老龄化程度的持续加重，对养老保险的财务可持续性造成较大冲击，已成为世界各国关注的重

10、要问题。根据历次人口普查数据，我国人口平均预期寿命在不断提高，意味着人口年龄别死亡率整体上呈下降趋势。然而，由于人口死亡风险受收入、环境、遗传等多种因素的影响，这些因素对不同性别和年龄人口的影响效应存在差异，使人口死亡模式存在明显的性别和年龄差异。因此，充分挖掘和利用我国分年龄、分性别人口死亡率数据的有效信息，建立符合我国人口寿命变化特征的随机死亡率模型，合理预测未来人口死亡率，掌握人口性别与年龄结构的变动趋势，是积极进行长寿风险管理的基础性科学问题。对人口随机死亡率建模方法的研究经历了从单人口模型向多人口模型发展的过程。单人口随机死亡率模型最有代表性的是Lee-Carter模型、APC模型和

11、CBD模型。Lee和Carter（1992）提出的Lee-Carter模型，开创了人口随机死亡率建模的先河，将对数分年龄死亡率用含有年龄效应因子和时间效应因子的线性形式表示，模型简洁且求解方便，在国内外得到普遍应用。随后，Renshaw等（2006）在Lee-Carter模型的基础上加入了队列效应，提出了含有队列效应的随机死亡率APC模型；Cairns等（2006）将死亡率进行逻辑斯蒂函数变换，提出了适用于老年人口死亡率预测的CBD模型。然而，随着对人口死亡率模型研究的不断深入，单人口模型的弊端逐渐暴露，在长期应用中会使相关群体人口死亡率预测值出现不合理的交叉或偏离。人口死亡率建模是系统性工作

12、，孤立的考虑单一人口群体，会造成不同人群死亡率随时间出现违背人类生物规律的结果，因此，多人口随机死亡率模型的研究逐步成为热点。Li和Lee（2005）提出了同时考虑多个人群死亡率变动共同趋势和个体趋势的公因子模型，该模型将共同时间效应因子建立为随机游走模型，刻画人口死亡率共同下降趋势，将单个人口群体的附加时间效应因子建立为均值回复模型，保证不同群体死亡率比值收敛为固定常数，模型预测结果更加符合人的生物规律。在公因子模型的基础上，Li和Hardy（2011）、Yang等（2016）和Zhou（2019）的研究分别从年龄别死亡率相依关系、死亡率变动的跳跃性和扩展队列效应等方面对多人口随机死亡率建模

13、方法进行了改进。参数估计方法改进是随机死亡率模型研究的核心内容，而参数估计方法又由模型的基础假设决定。最早的Lee-Carter模型采用奇异值分解法（SVD）和最小二乘法（OLS）进行参数估计，其中假设误差项服从独立同方差的正态分布（Lee和Carter，1992）。Brouhns等（2002）考虑到死亡人数是计数随机变量，假设其服从泊松分布，由此提出参数估计的极大似然方法。基于泊松假设的极大似然方法为人口死亡率模型参数估计提供了一个规范框架，能够方便地做出统计推断，成为当前研究中的主流方法。随着多人口死亡率建模思想的产生，Li（2013）提出了多人口随机死亡率的泊松公因子（PCF）模型，基于

14、泊松假设的极大似然估计方法随之推广到多人口死亡率模型的参数估计中（Li等，2016；Enchev等，2017；Wong等，2020）。尽管泊松假设框架下死亡率模型参数估计方法被普遍采用，但泊松假设中包含了均值和方差相等的限制条件，也有学者对该假设的合理性提出异第 40 卷第 3 期赵明王晓军：我国人口死亡风险异质与混合模型研究 141 议。Brown（2003）通过分析美国人口数据发现，死亡率受种族、民族、收入、财富、婚姻状况和教育程度等多种因素影响，不同年龄和性别人口死亡风险是非同质的，不能满足泊松假设的基本要求。Delwarde等（2007）考虑到人口死亡风险异质性导致的过度分散问题

15、，在Lee-Carter模型中假设死亡人数服从负二项分布，使模型拟合与预测效果得到显著提升。在此基础上，Wong等（2018）将负二项分布假设下的Lee-Carter模型纳入分层贝叶斯分析框架，采用马尔可夫链蒙特卡罗随机模拟（MCMC）方法进行参数估计，能够有效避免模型过度拟合问题，并为人口死亡率预测构造了更加宽幅的置信区间。综上，当前研究中针对人口死亡风险异质性的探讨相对较少，涉及到不同地区、不同性别的多个人口群体死亡率建模时，死亡风险异质性问题不可忽视，但当前研究尚未将风险异质假设拓展到多人口死亡率建模中。鉴于此，本文研究的边际贡献如下：第一，从死亡人数服从泊松分布的假设出发，检验我国人口

16、死亡风险是否存在异质性，为建立多人口随机死亡率模型提供经验依据；第二，为弥补分年龄、分性别死亡数据过度分散的异质性问题，将传统泊松分布假设改进为泊松参数服从伽马分布的混合泊松假设，建立两性别人口死亡率联合预测的混合泊松公因子模型，并给出新模型参数极大似然估计的迭代算法；第三，放宽死亡率模型中相关人口群体死亡率比值固定的假设，采用数据驱动的方法对时间效应因子进行建模预测，以应对外部事件常态化冲击下人口死亡模式转变的影响。本文研究结论能够为养老金计划和保险公司应对长寿风险提供科学依据。二、我国人口死亡风险异质性检验（一）风险同质假设下的随机死亡率模型对人口死亡风险是否存在异质性问题的探讨，能够为

17、建立人口随机死亡率模型提供合理假设。其中，基于人口死亡风险同质性假设的Lee-Carter模型，是单人口随机死亡率预测的经典方法（Lee和Carter，1992），其表达式为：lnxtxxtxtm=+（1）其中，12,Axx xx=，12,Ttt tt=；xtm是 x 岁的人在 t 年的死亡率；x表示不同年龄或年龄组的对数死亡率平均值；x为年龄效应因子，衡量特定年龄对数死亡率的改善水平敏感程度；t为时间效应因子，衡量全部年龄对数死亡率随时间的变动趋势；xt表示误差项。为使模型得到唯一解，要附加约束条件：1,0 xtxt=（2）Brouhns等（2002）提出了泊松Lee-Carter模型（以下

18、简称PLC模型），假设死亡人数服从泊松分布，即：Pionsson()xtxtxtDe m（3）其中，xtD表示死亡人数随机变量，xte表示人口暴露数。在死亡人数服从泊松分布的假设下，可以对Lee-Carter模型进行参数估计，其估计过程详见Brouhns等（2002）的研究。（二）人口死亡风险异质性的检验方法 PLC模型假设死亡人数服从泊松分布，即E()Var()xtxtDD=，意味着在同一年出生的个体具有完全相同的死亡风险。然而，该假设与现实情况差异较大，人口死亡风险受性别、收入、种族和遗传等多种因素影响（Brown，2003），从而个体之间存在除年龄之外的死亡风险差异，这种死亡风险异质性也

19、称为过度分散（Overdispersion）。Wong等（2018）构造了一个皮尔逊残差平方统计量，以检验人口死亡风险是否存在异质性，表达式为：142 统计研究 2023 年 3 月 222E()exp()Var()exp()xtxtxtxtxxtxtxtxtxxtdDderDe +=+（4）式（4）中，xtd是t年x岁时观察到的死亡人数，而x、x和t是模型参数的最大似然估计值。在零假设下，即PLC模型中死亡人数服从泊松分布的假设是真实的，则每个2xtr近似服从自由度为1的卡方分布（21）。在5%的置信水平下，当2xtr3.84时，将拒绝原假设，认为PLC模型拟合效果不佳。进一步，将2xtr加

20、总后得到新的统计量，即：222exp()exp()xtxtxxtxtxtxtxtxxtderre +=+（5）式（5）中，2r近似服从自由度为（A1）（T2）的卡方分布。在给定的置信区间下，当2r 2(1)(1)AT时，将拒绝原假设，认为PLC模型拟合效果不佳；当2r 2(1)(1)AT时，不能拒绝原假设，认为模型假设合理。（三）实证检验 1.数据来源与处理。文章数据来源于19952006年中国人口统计年鉴和20072020年中国人口和就业统计年鉴。本研究所采用的数据为全国人口分性别、分年龄（0100岁）的死亡率数据，数据期间为19942019年，共计26年。其中，2000年与2010年的死亡

21、率数据来自人口普查，1995年、2005年和2015年的死亡率数据来自1%的人口抽样调查，其他年份的死亡率数据来自1的人口变动抽样调查。结合我国人口死亡率数据特征，本文对原始数据做了如下处理。第一，插补年龄别死亡率数据的缺失值。国家统计局公布的各年度年龄别死亡率数据是依据人口普查、1%人口抽样调查和1人口抽样调查，其中部分年龄在抽样中的死亡人口数为0，导致死亡率数据缺失，本文采用线性插值法对人口死亡率为0的数据在年龄维度上进行插补。第二，修正新生婴儿人口死亡率数据。由于我国新生婴儿死亡人数存在一定程度的漏报（郭志刚，2011），导致婴儿死亡率可能不准确。大量研究表明，我国第三次人口普查的死亡数

22、据质量较高（翟振武和陶涛，2010），可以在此基础上对其他年份死亡率数据进行评估与修正。本文采用Brass-Logit生命表法（王金营和戈艳霞，2013），以1981年死亡率为基准，修正了历年0岁人口死亡率。第三，采用二维泊松P样条方法对184岁人口粗死亡率数据进行修匀（赵明，2017a），并采用Age-Shifting模型对85岁以上暴露数较少的高龄人口死亡率进行拟合（赵明，2017b）。第四，根据以上处理后的年龄别人口死亡率数据，以10万数量的人口为基准，调整计算各年龄死亡人口数。2.实证检验结果。首先，计算2xtr统计量的值，并在95%的置信水平下与自由度为1的卡方分布临界值3.84进行

23、比较。根据Wong等（2018）的研究显示，2xtr矩阵中统计量值大于3.84的数量占比低于5%时说明模型假设合理；否则，存在过度分散的异质性问题。本文绘制2xtr统计量热力图，可视化人口死亡风险是否存在过度分散的异质性。结果显示，男性人口统计量值大于3.84的数量占比为29.74%，女性人口占比为26.93%。进一步，计算2r统计量的值，其中男性为15586.54，女性为9530.50。95%置信水平下服从自由度为2400的卡方分布临界值为2515.08，两性别人口2r统计量的值均远大于临界值，因此拒绝原假设，认为PLC模型拟合效果不佳。此外，男女两性别人口死亡风险的异质性存在差异，其中男性

24、人口死亡风险异质性程度大于女性，且在年龄和时间维度上的结构特征存在差异。综上所述，我国男性和女性人口死亡风险均存在过度分散的异质性问题。因此在建立两性别人口死亡率联合预因篇幅所限，2xtr统计量热力图以附图1展示，见统计研究网站所列附件。下同。第 40 卷第 3 期赵明王晓军：我国人口死亡风险异质与混合模型研究 143 测模型时，不可忽视死亡风险异质性问题的存在，这一检验结果为本文后续建立混合泊松公因子随机死亡率模型提供了经验依据。三、混合泊松公因子随机死亡率模型（一）模型构建 Li（2013）提出了两性别人口死亡率联合预测的泊松公因子模型，即PCF模型，其表达式为：,lnx t ix

25、 ixtx it ix t imB K=+（6）,Pionsson()x t ix t ix t iDem（7）其中，i表示性别（男性=1，女性=2）；xtB K为男女人口死亡率变动趋势的公共因子，即两性别人口死亡率变动的共同趋势，其中xB为年龄效应公因子，tK为时间效应公因子；,x it i 是附加因子，表示单个性别人口死亡率变动的个体趋势，其中,x i为年龄效应附加因子，,t i为时间效应附加因子。PCF模型中沿用了死亡人数服从泊松分布的假设。然而根据上文检验结果，我国人口死亡风险存在异质性，尤其是针对两性别人口死亡率联合建模时，异质性问题在模型中更不可忽视。混合泊松分布可以描述一类风险非

26、同质随机变量的发生次数。若假设死亡人数服从泊松分布，而不同个体的泊松参数不同，即风险是异质的，且这些泊松参数服从另一个分布，则死亡人数将服从混合泊松分布。其中，伽马分布是刻画泊松参数分布的较好选择，由其构成的混合泊松分布为负二项分布（Delwarde等，2007；Wong等，2018）。由此，本文所构建的混合泊松分布的分布率为：,1/,11P()111!x t idkx t ix t ix t ix t ix t ix t ix t idkkDdkkdk+|=|+|（8）该混合泊松分布均值与方差的形式为：2,Var()()x t ix t ix t ix t ix t iDkE D=+=（9）

27、满足以上分布假设的死亡率预测模型为混合泊松公因子模型，即MPCF模型。模型中的泊松参数服从伽马分布，且方差大于均值，能够满足人口死亡风险异质性的要求。（二）参数估计方法由于对数死亡率矩阵是一个奇异矩阵，为得到唯一解，同PCF模型一样，MPCF模型需设置约束条件：,1,0,1,0 xtx it ixtxtBK=。基于此，再根据极大似然估计原理和Newton-Raphson法求解参数，()()()()122/jjjjll+=，其中，l为混合泊松分布的对数似然函数。进一步，本文给出极大似然估计方法的具体迭代计算步骤如下。步骤1：设置参数的初始值，并计算,x t i。其中，(0),x t i为历年

28、对数死亡率在年龄x和性别i上的均值；(0)(0),1/xx iBA=（A为年龄或年龄段的个数），(0)(0),0tt iK=，(0)1/1k=。步骤2：对所有的年龄x和性别i，根据式（10）更新,x i，并重新计算所有的,x t i。()()()()()?()()()()()()()()()(),1,2,jjx t ix t ix t itjjx t ijjx ix ijjjx t ix t itjjx t iddd+|+|+|=|+|+|（10）144 统计研究 2023 年 3 月步骤3：对所有的时间t，根据式（11）更新tK，同时根据0ttK=进行调整，并重新计算所有的,x t i。(

29、)()()()()()()()()()()()()()()()()(),12,2,jjjx t ix ix t ix t ixjjx t ijjttjjjjx t ix ix t ixjjx t iddKKd+|+|+|=|+|+|（11）步骤4：对所有的年龄x，根据式（12）更新xB，并重新计算所有的,x t i。()()()()()()()()()()()()()()()()()(),12,2,jjjx t ixx t ix t itjjx t ijjxxjjjjx t ixx t itjjx t iddBBd+|+|+|=|+|+|（12）步骤5：将式（11）中的tK替换为,t i，对所

30、有的时间t和性别i，更新,t i，同时根据,0t it=进行调整，并重新计算所有的,x t i。步骤6：将式（12）中的xB替换为,x i，对所有的年龄x和性别i，更新,x i，并重新计算所有的,x t i。步骤7：对所有的年龄x、时间t和性别i，根据式（13）更新，并重新计算所有的,x t i。()()()()()()()()()()()()()()()()(),1,1,22,1,1ln211xtxtjjdx t ix t ijjjjjx t ivx t ix t ix t ijjjjdxtx t ijx t ivjjjx t ix t iddjddj=+=|+|+|=|+|+|（13）步骤

31、8：计算对数似然函数，并重复迭代计算步骤2至步骤7，直到对数似然值收敛，完成参数估计。（三）死亡率预测方法对于时间效应主因子tK，采用带有漂移项的随机游走模型进行建模，即1tttKK=+，其中，是漂移项，为固定常数；t为随机扰动项，满足2 N(0,)t。漂移项通常为负，表明随着时间的推移，人口死亡率呈现递减趋势。此外，对于附加时间效应因子kt,j，大部分学者基于死亡率性别比长期收敛为某一个固定常数的假设，采用均值回复模型建模。然而，已有研究表明，部分人口寿命较高国家死亡率性别间的差距在不断减小（Li，2013）。尤其是在突发性重大公共卫生事件常态化的影响下，不同特征群体人口死亡率变动趋势具有

32、不确定性，因此死亡率性别差距固定为常数的假设存在弊端。本文对附加时间效应因子建模时，不再设置这一限制性假设，而是改进为数据驱动的建模方法，即通过对kt,j建立ARIMA（p，d，q）时间序列模型，采用统计中常用的BIC信息准则，选取能够刻画当前数据的最优模型。当新的数据加入后，重新驱动以上程序，得到新信息下的最优模型，用以对附加时间效应因子进行预测。基于以上预测结果，得到人口死亡率预测值，即：第 40 卷第 3 期赵明王晓军：我国人口死亡风险异质与混合模型研究 145 ()(),expx t ix s ixtsx it is immBKKbkk=+?（14）其中，tK和,t ik为均值估

33、计结果，,x s im?为预测基年，,x t im为死亡率预测值。四、实证分析（一）模型参数估计结果 1.年龄效应因子参数估计结果。根据本文给出的参数估计迭代方法，可以计算得到年龄效应因子的参数估计值，结果如图1和图2所示。图1为的估计结果，代表了两性别人口分年龄对数死亡率历史期内的均值，整体上男性人口死亡率高于女性。其中，低年龄段和高年龄段两性别人口死亡率之间的差距较小，而2060岁年龄段两性别人口死亡率间的差距较大。上述结果整体地描述了我国人口死亡率的年龄分布特征及性别差异特征。图1 年龄效应因子（）参数估计结果图2 年龄效应因子（B、）参数估计结果图2为公共年龄效应因子B和附加年龄效

34、应因子的参数估计结果，其中公因子代表了两性别人口死亡率在年龄上的共同分布规律，整体上表现为一条平缓下降的曲线，意味着随年龄增长人口死亡率改善速度在缓慢降低。此外，图2中两条附加年龄效应因子的曲线代表了男女人口死亡率在年龄分布上的个体差异，尽管二者在不同年龄上的数值存在一定差异，但变动趋势较为相似，体现了人口死亡率性别间变动趋势的一致性。实证结果也反映出，在多人口随机死亡率建模时，如果将附加年146 统计研究 2023 年 3 月龄效应因子设定为一个新的公共因子，对模型拟合结果不会造成显著影响，但可以有效解决过度参数化问题。2.时间效应因子参数估计结果。图3为两性别人口时间效应因子参数估计结果

35、，其中公因子代表了两性别人口死亡率在时间上的共同趋势，可见随着时间推移人口死亡率呈现匀速下降的变动趋势。公因子曲线的变动特征，能够为对其建立随机游走模型提供经验依据。此外，图3中两条附加时间效应因子曲线代表男女人口死亡率在时间维度上的个体差异，其中女性人口附加时间效应因子呈现缓幅递减变动趋势，而男性人口附加时间效应因子呈现缓幅递增变动趋势。也就是说，加入附加时间效应因子后，女性人口死亡率随时间推移下降的速度将大于两性别共同趋势，男性人口死亡率随时间推移下降的速度将小于两性别共同趋势。尽管两性别人口附加时间效应因子在不同时期的数值存在差异，但波动趋势均较为平稳，能够为建立平稳时间序列模型或单整后

36、的平稳时间序列模型提供经验依据。与依靠主观经验预设的模型相比，本文对时间效应因子的预测采用数据驱动的算法来选择最优模型，可以自动适应未来更新数据后对最优模型的选择。通过贝叶斯信息准则进行模型选择后，得到公因子的最优模型为ARIMA（0，1，0）模型，两个附加时间效应因子的最优模型均为ARIMA（1，0，0）模型。考虑到世界各国遭受重大公共卫生事件影响后，可能会在一定程度上改变分年龄、分性别死亡率的规律和随时间的变动特征，而本文对时间效应因子的预测方法能较好地适应数据的更新。图3 时间效应因子（K、）参数估计结果（二）拟合优度检验通过对MPCF模型和PLC模型样本内（19952019年）拟合结

37、果进行比较，检验本文方法的优劣，结果见表1。首先，对人口死亡风险异质性进行检验，MPCF模型下得到的男女人口2xtr统计量的值，分别有5.17%和4.89%的比例超过自由度为1的卡方分布临界值3.84。同时，观察到MPCF模型下男女表1 MPCF模型与PLC模型样本内（19952019年）拟合结果检验表 MPCF模型 PLC模型男性女性男性女性 2xtr 5.17%4.89%29.74%26.93%2r 2491.96 1927.15 15586.54 9530.50 BIC 23377.38 20321.54 32247.87 27839.54 MAE 2.86 1.64 5.46

38、 4.13 MAPE 2.81%2.63%3.75%3.42%第 40 卷第 3 期赵明王晓军：我国人口死亡风险异质与混合模型研究 147 人口2r统计量的值分别为2491.96和1927.15，小于自由度为2400的卡方分布临界值2515.08。以上结果显示，混合泊松分布能够较好地刻画人口死亡风险的异质性特征，模型表现显著提升。进一步，观察表1中贝叶斯信息准则（BIC）、平均绝对误差（MAE）和平均绝对百分比误差（MAPE）的数值，对MPCF模型和PLC模型的拟合优度进行比较。首先，MPCF模型下男女人口BIC值均小于PLC模型下的BIC值。尽管MPCF模型基于混合泊松分布建模，模型中

39、的参数更多，加大了计算BIC时的惩罚，但由于死亡风险异质性假设更加符合数据特征，因此具有更好的拟合优度。其次，MPCF模型下男女人口MAE值也小于PLC模型下MAE值。可见，MPCF模型拟合结果的平均绝对误差值显著降低，尤其是女性人口在全部历史期间和全年龄段上平均绝对误差值已低于2。最后，MPCF模型下男女人口拟合结果的MAPE值小于PLC模型下的MAPE值。结果显示，MPCF模型的两性别人口平均绝对百分比误差均低于3%，具有较好的拟合优度。（三）历史期内回溯预测为了检验上述拟合结果的稳健性，本文将历史期内的数据分成实验组和对照组，通过MAPE指标检验MPCF模型和PLC模型的短期预测效果，

40、结果见表2。分组方案包括：以19942005年的人口死亡率数据作为实验组，选取20062019年人口死亡率数据的实际值作为对照组；以19942010年的人口死亡率数据作为实验组，选取20112019年人口死亡率数据的实际值作为对照组；以19942015年的人口死亡率数据作为实验组，选取20162019年人口死亡率数据的实际值作为对照组。由表2可见，全部三组的历史期内回溯预测，无论男性群体还是女性群体，MPCF模型计算的MAPE值均小于PLC模型，表现出了较好的稳健性。其中，在第一个分组方案中，MPCF模型预测结果的MAPE值与PCF模型差距最大，意味着人口死亡率样本数据较少时，模型的预测效果更

41、加依赖于基础假设的合理性。随着样本数据的增大，模型间预测效果的差异略有减小。对于我国来说，国家统计局自1994年开始连续发布分年龄、分性别人口死亡率数据，至今已超过25年，但相对人类死亡率数据库（HMD）中大部分国家积累的近百年数据，仍相对较少。因此，采用合理的死亡人口分布假设，对我国人口死亡率建模与预测更具现实意义。表2 历史期内回溯预测结果的MAPE值（%）对照组 MPCF模型 PLC模型男性女性男性女性 20062019年 2.66 2.54 3.81 3.51 20112019年 2.84 2.67 3.69 3.46 20162019年 3.01 2.72 3.18 3.0

42、9（四）样本外死亡率长期预测首先，采用MAPE指标对2020年人口死亡率预测值和实际值进行比较检验。由于人口普查得到的2020年分性别、分年龄人口死亡率数据仍为粗死亡率，需要对数据进行调整与修匀。为了保证可比性，本文使用与样本数据（19942019年数据）相同的评估处理方法。通过计算得到，MPCF模型预测的男女两性别人口死亡率在全部年龄段上的MAPE值分别为2.93%和2.69%，均小于PLC模型的3.35%和3.21%。结果显示，MPCF模型对2020年人口死亡率预测的效果较好，与上文中样本内拟合及回溯预测检验的结论一致。进一步，附表1 给出了MPCF模型和PLC模型得到的20202050

43、年两性别人口死亡率和死亡率性因篇幅有限，样本外死亡率长期预测结果以附表1展示。148 统计研究 2023 年 3 月别比的预测结果。其中，0岁人口为婴儿，10岁人口为青少年人群代表，30岁人口为中壮年人群代表，60岁人口为低龄老年人群代表，100岁人口为高龄老年人群代表。从整体上来看，MPCF模型预测得到的死亡率普遍低于PLC模型，且二者之间的差距随时间推移不断增大，意味着死亡人口的基础假设对模型长期预测结果会产生较大影响。分年龄来看，MPCF模型预测得到的男婴死亡率低于PLC模型，而女婴死亡率则高于PLC模型，出现这一结果是因为MPCF模型中设置的公共因子能够保持一个相对稳定的死亡率性别

44、比。20202050年，MPCF模型得到的男女婴儿死亡率比值由1.70缓幅变动到1.95，而PLC模型得到的男女婴儿死亡率比值则由1.72快速增长到3.36。随着医疗技术的提升和传统生育观念的改变，未来两性别婴儿死亡率之间的差距大幅提高的可能性较小。对于青少年人口来说，MPCF模型预测的死亡率性别比随着时间推移出现了小幅的降低，而PLC模型预测结果仍表现为死亡率性别差距在增大，意味着MPCF模型在考虑死亡风险异质性的基础上能够得到不同年龄模式的死亡率预测结果。对于中壮年人口来说，MPCF模型与PLC模型预测得到的30岁人口死亡率较为接近，但随着时间推移PCF模型得到的死亡率性别比出现了极端结果

45、，到2050年时男女性人口死亡率比值超过25倍，该结果违背了人口生物规律。对于老年人口来说，MPCF模型男性人口死亡率低于PLC模型预测的结果，而女性人口死亡率高于PLC模型预测的结果，最终使得死亡率性别比的变动区间保持在一个合理的范围。尤其是高龄老年人口，人类寿命已接近极限，若无重大科学突破，两性别之间的死亡率很难出现较大差距。综上可见，MPCF模型对人口死亡率的长期预测结果，能够较好地反映死亡风险异质性导致的年龄与性别模式差异，预测结果符合人口生物规律，并且能够在一定程度上弥补PCF模型低估死亡率改善程度的缺陷（Richard，2011），预测得到的死亡率性别比保持在合理区间，与大部分人口

46、寿命较高的发达国家当前的经验事实相吻合。（五）保险公司生存年金长寿风险度量基于上述人口死亡率预测结果，本文将其用于保险公司生存年金长寿风险的度量中，以探讨MPCF模型的应用价值。保险公司连续型终身生存年金精算现值表达式为：1:11122xtxxtxxxxxtAPVaap vp v=+（15）其中，为极限年龄，txp为x岁的人活过t年的概率，v为折现因子，表达式为1(1)vi=+，i为折现率。根据赵明和王晓军（2015）的研究，令APVB为评估基期死亡率计算的精算现值，APVF为死亡率预测值计算的精算现值，可以通过式（16）得到保险公司长寿风险额外资本要求，即()/FBBLCRAPVAPVAP

47、V=（16）本文所构造的生命表极限年龄为100岁，假设生存年金领取年龄为60岁，领取金额为1单位，折现率为4.5%。由于保险公司偿付能力监管规则第3号：寿险合同负债评估中规定，对评估期超过40年的现金流折现应采用4.5%的基础利率，为更加稳健地测度长寿风险的影响，本文不再额外增加综合溢价率。此外，由于终身生存年金产品期限较长，保险公司负债评估时采用的终极生命表与国民生命表死亡率较为接近，因此不再对本文所使用的死亡率数据进行换算，直接用于计算生存年金精算现值。根据式（15）与式（16），可以计算得到生存年金精算现值与长寿风险额外资本要求，结根据人类死亡率数据库（HMD）中的数据显示，大部分人口

48、寿命较高国家的人口死亡率性别比保持在一个相对较小的区间内变动。例如，人口寿命较高的瑞典和日本，人口死亡率经历了大幅的改善后，2020年瑞典0100岁人口死亡率性别比在0.56.7区间内变动，日本在0.82.8区间内变动。第 40 卷第 3 期赵明王晓军：我国人口死亡风险异质与混合模型研究 149 果见附表2。从整体来看，随着未来人口死亡率的降低，保险公司生存年金精算现值不断提高，但MPCF模型计算得到的生存年金精算现值提高幅度更大，即合计值从2019年的27.91，提高到2050年的31.40，提升幅度为3.49，大于PLC模型2.56的提升幅度。意味着，保险公司为应对长寿风险，基于MP

49、CF模型进行负债评估需要计提14.26%的额外资本准备金，而基于PLC模型仅需计提9.17%的额外资本准备金。基于我国风险导向的第二代偿付能力监管体系，保险公司采用MPCF模型进行负债评估更为稳健。分性别来看，未来各年份男性人口生存年金精算现值小于女性，但长寿风险资本要求大于女性，且MPCF模型评估结果更为稳健。从绝对值上看，由于男性人口死亡率在长期中高于女性人口，对生存年金保险负债端产生的压力较小，但较高的死亡率具有更大的下降空间，未来变动趋势的不确定性也越大，而长寿风险正是由死亡率变动的不确定性所导致，因此MPCF模型可以更加充分地评估男性人口保单业务给保险公司带来的长寿风险。五、结论与讨

50、论本文从我国人口死亡风险异质性的探讨出发，采用混合泊松分布描述非同质的死亡人口发生次数，假设不同个体的泊松参数服从伽马分布，并在此基础上建立多人口随机死亡率模型，给出新建模型极大似然参数估计的迭代算法，对我国男女两性别人口死亡率联合预测，为长寿风险管理提供科学依据。本文研究结论如下：第一，我国分年龄、分性别人口死亡风险存在显著的异质性，基于死亡人数服从泊松分布假设的随机死亡率建模，将会导致拟合偏差；第二，相对于传统泊松分布假设下的死亡率模型，混合泊松公因子模型能够有效刻画人口死亡风险异质性特征，提升两性别人口死亡率联合预测模型的拟合优度；第三，通过稳健性检验发现，不同样本分组下的混合泊松公因

展开阅读全文