1、基于BP神经网络和GM(1,1)灰色模型的中国人口预测分析黄俸强 李晶 邓健萍摘 要人口预测对国民经济的发展有着非常重要的作用. 如何用操作性强, 可信度高的方法来预测人口的变化, 这是一个值得探讨的问题. 本文主要根据中国人口统计年鉴上收集到的2001年到2005年部分数据, 在灰色预测的基础上, 引入BP神经网络模型, 建立了中国人口增长的GM(1,1)和BP神经网络组合模型, 并由此对中国人口增长的中短期和长期趋势做出预测. 我们通过输入原始数据资料, 应用灰色模型进行预测, 得到预测数列, 然后将预测值作为输入量, 原始数据作为期望值, 对BP神经网络进行训练, 得到相应的权值和阀值,
2、 最后输入预测年份, 即可得到具有较高精度的预测量. 由此可以知道, 中国人口增长的中短期和长期趋势为:人口总量在中短期内继续增长, 增速较为平稳, 每年以0.11亿人口数增长. 人口总量在未来30年还将净增2亿人左右, 总人口将于2010年, 2020年分别达到13.63亿人和14.67亿人, 2033年前后达到峰值15.01亿人, 之后人口总量缓慢下降. 我国育龄妇女( 15-49岁) 人数在短期内持续增加, 在2014年达到顶峰, 之后开始缓慢下降, 到2033年左右, 下降速度加快;我国生育旺盛期育龄妇女( 20-29岁) 人数在短期内持续下降, 在2015年达到低谷, 之后开始缓慢回
3、升, 但是一段时期后, 又开始缓慢下降, 如此波动变化. 全国人口死亡率继续保持较低水平( 维持在7以下) , 并缓慢下降, 从1990年的6.67下降到2050年的5.66, 减少了1.01个千分点;我国男性人口死亡率高于女性人口死亡率, 乡人口死亡率高于城镇人口死亡率. 我国人口城镇化速度在未来20年里每年增长1.10-1.50个百分点, 之后人口城镇化开始放慢增长速度, 2021-2050年间仅增加11.41个百分点. 到本世纪中叶, 城镇化水平在75%左右. 2005年我国老年人口已超过1亿人, 到2020年, 65岁以上老年人口将达到1.74亿人, 比重从2005年的8.09%增长到
4、12.02%. 预计2050年, 65岁以上老年人口达3.38亿多人, 比重达23.23%. 老龄化进程加速. 老年人口数量多, 老龄化速度快, 高龄趋势明显. 出生人口性别比总体呈上升趋势. 中短期变化不大, 都在初始值附近波动;从2010年到2050年平均每年增长了0.75. 此组合模型兼有灰色预测和BP神经网络预测的优点, 既利用灰色系统理论具有所需要的样本数据少, 原理简单, 运算方便, 短期预测精度高, 可检验等优点, 也发挥神经网络并行计算, 容错能力强, 自适应能力强等优点, 模型既克服了原始数据少, 数据波动性大对预测精度的影响, 也增强了预测的自适应性. 关键词:BP神经网络
5、 GM(1,1)灰色预测模型 人口预测一, 问题重述1.1, 问题背景中国自古以来是一个人口大国. 新中国成立后, 我国人口进入飞速发展阶段. 1949年到1957年8年时间, 人口增长了1亿;1964年总人口超过7亿,1969年总人口超过8亿, 1974年总人口超过9亿. 这一时期每增长亿人时间间隔为5年. 中国人口净增长率波动比较剧烈. 80年代以后, 由于我国实行了计划生育, 人口膨胀得到了有效的控制. 实行近30年来, 使我国少生了4亿多人, 为中国现代化建设, 全面实现小康社会打下了坚实的基础, 同时也为世界人口控制做出了杰出贡献. 但是由于中国人口基数大, 人口增长问题依然十分严峻
6、. 在我国现代化进程中必须实现人口与经济, 社会, 资源, 环境协调发展和可持续发展, 而人口问题始终是制约我国发展的关键因素之一. 要发展, 必须进一步控制人口数量, 提高人口质量, 改善人口结构. 对中国未来人口的准确预测, 能够为中国经济和社会发展的重大决策提供科学依据, 这对加速推进我国现代化建设有着极为重要的现实意义. 因此, 根据已有数据, 运用数学建模的方法, 对中国人口做出分析和预测是一个重要问题. 1.2, 问题提出近年来中国的人口发展出现了一些新的特点, 例如, 老龄化进程加速, 出生人口性别比持续升高, 以及乡村人口城镇化等因素, 这些都影响着中国人口的增长. 2007年
7、初发布的国家人口发展战略研究报告(附录1) 还做出了进一步的分析. 关于中国人口问题已有多方面的研究, 并积累了大量数据资料. 现在得到了中国人口统计年鉴上收集到的部分数据(见附录2). 其中包含2001至2005年的市, 镇和乡人口不同性别的人在该类人口中所占的百分比, 死亡率, 生育率, 每年人口抽样调查的样本容量( 人数) 数据. 1994至2005年的市, 镇和乡男女出生比例. 1995至2005年的市, 镇和乡育龄妇女生育率的千分比( ) . 根据已知数据( 或搜索相关文献和补充新的数据) , 解决以下的问题:从中国的实际情况和人口增长的上述特点出发, 建立中国人口增长的数学模型,
8、并由此对中国人口增长的中短期和长期趋势做出预测. 二, 问题的分析一个国家人口的准确预测, 是制定相应宏观经济政策的重要依据, 对我国经济的发展有着巨大的作用. 预测是控制和规划的基础, 预测的精度是控制和规划成功的前提, 而选择预测的方法是提高预测精度的关键. 传统的人口预测方法主要有逻辑方法, 常微分方程方法和动态预测方法等. 这些方法在人口预测领域起到了一定的作用, 但采用这些方法时都要对数据进行模型假设. 由于真实模型往往是非线性的, 如果在一些简单的模型假设下就进行数据模拟, 常常不能达到较好的模拟效果. 神经网络对复杂非线性系统具有曲线拟合能力, 基于BP神经网络和GM(1,1)模
9、型的组合模型进行动态预测. 既利用灰色预测的需要数据资料少的优点, 又吸收了BP神经网络容错能力, 自适应能力强的优点. 由于神经网络的功能之强大, 型式之多样, 若能将其它网络形式同灰色模型相结合, 则有可能进一步提高预测精度. 三, 模型的假设与符号说明3.1, 模型假设与约定( 1) 未来人口的死亡模式保持不变;( 2) 所研究的人口为封闭人口; ( 3) 农村人口一旦迁入城镇或者城镇化, 其人口行为和特征即与城镇人口相同, 即忽略城镇人口与迁入城镇人口或城镇化人口的差别. ( 4) 人口数据质量高, 无误报和漏报等. ( 5) 在分析老年人口问题时, 是以65岁作为老年人口的起点年龄;
10、3.2, 名词定义主要统计指标解释人口数 指一定时点, 一定地区范围内有生命的个人总和. 出生率 指在一定时期内( 通常为一年) 一定地区的出生人数与同期内平均人数( 或期中人数) 之比, 用千分率表示. 其计算公式为:死亡率 指在一定时期内( 通常为一年) 一定地区的死亡人数与同期内平均人数( 或期中人数) 之比, 用千分率表示. 其计算公式为:人口自然增长率 是指在一定时期内( 通常为一年) 人口自然增加数( 出生人数减死亡人数) 与该时期内平均人数( 或期中人数) 之比, 用千分率表示. 计算公式为:预测时期 短期( 25年) ;出生人口性别比 是活产男婴数与活产女婴数的比值, 通常用女
11、婴数量为100时所对应的男婴数来表示. 正常情况下, 出生性别比是由生物学规律决定的, 保持在103107之间. 人口抚养比 指人口总体中处于供养年龄( 一般指15岁以下和64岁以上) 的人口与处于“经济活动”年龄( 15-64岁) 人口的比率. 用百分铝表示. 计算公式为:总和生育率:一定时期( 如某一年) 各年龄组妇女生育率的合计数, 说明每名妇女按照某一年的各年龄组生育率度过育龄期, 平均可能生育的子女数, 是衡量生育水平最常用的指标之一. 四, 模型的建立和求解4.1, GM(1,1)预测模型的基本原理( 1) GM(1,1)灰色系统1所谓灰色系统是指既含有已知信息, 又含有未知信息的
12、系统, 是由邓聚龙教授在1986年提出的. 灰色理论自诞生以来, 发展很快, 由于它所需因素少, 模型简单, 特别是对于因素空间难以穷尽, 运行机制尚不明确, 又缺乏建立确定关系的信息系统, 灰色系统理论及方法为解决此类问题提供了新的思路和有益的尝试. 灰色预测方法是根据过去及现在已知的或非确知的信息, 建立一个从过去引申到将来的GM模型, 从而确定系统在未来发展变化的趋势, 为规划决策提供依据. 在灰色预测模型中, 对时间序列进行数量大小的预测, 随机性被弱化了, 确定性增强了. 此时在生成层次上求解得到生成函数, 据此建立被求序列的数列预测, 其预测模型为一阶微分方程, 即只有一个变量的灰
13、色模型, 记为GM(1,1)模型. 灰色GM(1,1)预测模型在计算过程中主要是以矩阵为主, 它和MATLAB的结合可以有效的解决了灰色系统理论在矩阵计算中的问题, 为灰色系统理论的应用提供了一种新的方法. ( 2) GM(1,1)预测模型的基本原理GM(1,1)模型是灰色预测的核心, 它是一个单个变量预测的一阶微分方程模型, 其离散时间响应函数近似呈指数规律. 建立GM(1,1)模型的方法是:设为原始非负时间序列, 为累加生成序列, 即 ( 1) GM(1,1)模型的白化微分方程为: ( 2) 式( 2) 中, 为待辨识参数, 亦称发展系数;为待辨识内生变量,亦称灰作用量. 设待辨识向量,
14、按最小二乘法求得式中于是可得到灰色预测的离散时间响应函数为: ( 3) 为所得的累加的预测值, 将预测值还原即为: ( 4) ( 3) GM(1,1)预测模型的MATLAB程序根据上述GM(1,1)模型的数学思想, 结合MATLAB语言的特点编制了一套可读性强, 容易理解的预测程序. 该程序操作简单灵活, 稳定性好, 直接面向用户. 4.2, BP神经网络模型的基本原理( 1) 神经网络的定义简介2神经网络是由多个神经元组成的广泛互连的神经网络, 能够模拟生物神经系统真实世界及物体之间所做出的交互反应. 人工神经网络处理信息是通过信息样本对神经网络的训练, 使其具有人的大脑的记忆, 辨识能力,
15、 完成名种信息处理功能. 它不需要任何先验公式, 就能从已有数据中自动地归纳规则, 获得这些数据的内在规律, 具有良好的自学习, 自适应, 联想记忆, 并行处理和非线性形转换的能力, 特别适合于因果关系复杂的非确定性推理, 判断, 识别和分类等问题. 对于任意一组随机的, 正态的数据, 都可以利用人工神经网络算法进行统计分析, 做出拟合和预测. 基于误差反向传播(Back propagation)算法的多层前馈网络(Multiple-layer feedforward network, 简记为BP网络), 是目前应用最成功和广泛的人工神经网络. ( 2) BP模型的基本原理3 学习过程中由信号
16、的正向传播与误差的逆向传播两个过程组成. 正向传播时, 模式作用于输入层, 经隐层处理后, 传入误差的逆向传播阶段, 将输出误差按某种子形式, 通过隐层向输入层逐层返回, 并“分摊”给各层的所有单元, 从而获得各层单元的参考误差或称误差信号, 以作为修改各单元权值的依据. 权值不断修改的过程, 也就是网络学习过程. 此过程一直进行到网络输出的误差准逐渐减少到可接受的程度或达到设定的学习次数为止. BP网络模型包括其输入输出模型, 作用函数模型, 误差计算模型和自学习模型. BP网络由输入层, 输出层以及一个或多个隐层节点互连而成的一种多层网, 这种结构使多层前馈网络可在输入和输出间建立合适的线
17、性或非线性关系, 又不致使网络输出限制在-1和1之间. 见图( 1) . 输入层输出层隐含层P1X1P2P3Pn图1 BP网络模型 O O O O ( 大于等于一层) W(1)W(L)( 3) BP神经网络的训练BP算法通过“训练”这一事件来得到这种输入, 输出间合适的线性或非线性关系. “训练”的过程可以分为向前传输和向后传输两个阶段:1向前传输阶段:从样本集中取一个样本, 将输入网络;计算出误差测度和实际输出;对权重值各做一次调整, 重复这个循环, 直到. 2向后传播阶段误差传播阶段:计算实际输出与理想输出的差;用输出层的误差调整输出层权矩阵;用此误差估计输出层的直接前导层的误差, 再用输
18、出层前导层误差估计更前一层的误差. 如此获得所有其他各层的误差估计;并用这些估计实现对权矩阵的修改. 形成将输出端表现出的误差沿着与输出信号相反的方向逐级向输出端传递的过程. 网络关于整个样本集的误差测度:4.3, 应用步骤( 1) 输入原始数据资料;( 2) 应用灰色模型进行预测, 得到预测序列;( 3) 将预测值作为输入量, 原始数据作为期望值, 对BP神经网络进行训练, 得到相应的权值和阀值;( 4) 输入需要预测的年份, 即可得到具有相当精度的预测量. 4.4, 预测与结果分析( 1) 未来我国总人口变化情况通过查询中国人口与发展研究中心在中国人口信息网上所公布的数据, 获知我国199
19、62005年的人口总数, 出生率和死亡率数据. 根据此数据, 应用灰色模型预测我国未来10年人口总数, 出生率和死亡率, 将其作为训练样本( 输入量) , 19902005年的原始数据作为检验样本( 期望值) , 对BP神经网络进行训练. 在此基础上, 对我国未来45年人口总数进行预测. 并且我们还分别使用单独的GM(1,1)模型和BP神经网络模型对中国未来45年人口总数进行预测, 预测数据见下表4, 每年详细数据见附录表1. 表1 2001-2050年全国总人口变动情况预测单位(亿人)GM(1:1)模型BP神经网络GM(1,1)和BP神经网络组合国家2003人口计生委预测结果(TFR=1.8
20、)199612.192412.238912.2389199712.297612.362612.3626199812.403712.476112.4761199912.510712.578612.5786200012.618712.674312.6743200112.727612.762712.762712.87200212.837412.845312.845312.97200312.948212.922712.922713.06200413.0612.998812.998813.15200513.172713.075613.075613.24200613.172713.15713.172713
21、.33200713.286413.248913.286413.42200813.40113.342713.40113.51200913.516713.436613.516713.61201013.633313.528313.633313.7201113.75113.615413.75113.8201213.869613.696113.869613.9201313.989313.768813.989314201414.110113.832814.110114.1201514.231813.887814.231814.19202014.856614.044914.677514.54202515.5
22、08814.067714.913114.73203016.189714.001615.000714.83203516.900413.853815.011714.86204017.642413.664214.98114.83204518.416913.518814.920514.68205019.225413.447014.838114.4000将所得数据制成图表, 如下图所示图2 未来我国总人口预测图按此预测, 从以上图表中可以知道我国人口增长的中短期和长期趋势为:中国人口自然增长率继续保持平稳下降, 人口总量在中短期内继续增长, 增速较为平稳. 人口总量在未来30年还将净增2亿人左右, 总人
23、口将于2010年, 2020年分别达到13.63亿人和14.67亿人, 2033年前后达到峰值15.01亿人, 之后人口总量缓慢下降. 对比国家人口计生委2003年预测结果, 单独的GM(1,1)模型和神经网络模型都能非常精确的预测出在短期内我国未来人口总数, 在中期预测中, 也能较好的反映出人口变化趋势. 在长期预测时, GM(1,1)的预测数据偏差非常大, 神经网络虽然变化趋势较符合我国未来人口变化情况, 但偏差还是较大. 而组合模型在这三个时期内, 都能够很好的预测出中国未来人口总量的及其变化情况. 显然组合模型的预测效果最佳. 关于GM(1,1)长期预测的局限性将在模型评价中讨论. (
24、 2) 妇女生育水平变化情况根据题中附录1的数据, 利用组合模型分别预测出未来全国育龄妇女人数变化情况及未来我国生育旺盛期育龄妇女( 20-29岁) 人数预测, 结果见下图图3.1 未来我国育龄妇女( 15-49岁) 人数预测图3.2 未来我国市镇乡育龄妇女( 15-49岁) 人数预测图3.3 未来我国生育旺盛期育龄妇女( 20-29岁) 人数预测图3.4 未来我国市镇乡生育旺盛期育龄妇女( 20-29岁) 人数预测未来我国育龄妇女( 15-49岁) 人数在短期内持续增加, 在2014年达到顶峰, 之后开始缓慢下降, 到2033年左右, 下降速度加快. 相反, 我国生育旺盛期育龄妇女( 20-
25、29岁) 人数在短期内持续下降, 在2015年达到低谷, 之后开始缓慢回升, 但是一段时期后, 又开始缓慢下降, 如此波动变化. 由表3.2和表3.4可知城市面临生育水平降低农村则一直持续较高的生育水平. ( 3) 人口死亡率变化情况人口死亡水平是造成人口数量和结构变化的重要因素之一, 随着我国社会经济的迅速发展医疗卫生条件的进一步改善我国人口的健康水平有了明显改善, 人口的死亡率较低. 利用组合模型对人口死亡率变化情况进行预测. 所得结果下图 图4.1 全国人口死亡率预测图4.2 全国城市男女死亡率预测图4.3 全国镇男女死亡率预测图4.4 全国乡男女死亡率预测由上图4.1可以知道, 全国人
26、口死亡率继续保持较低水平( 维持在7已下) , 并缓慢下降, 从1990年的6.67下降到2050年的5.66, 减少了1.01个千分点. 从上图4.2, 4.3, 4.4可以知道, 我国男性人口死亡率高于女性人口死亡率, 乡人口死亡率高于城镇人口死亡率. ( 4) 城镇化水平变化情况;城镇人口比重是衡量经济发展水平特别是工业发展水平的重要标志, 随着我国改革开放和经济建设的发展, 城镇化水平有了较大提高. 可预测城镇化水平变化情况, 如下表所示, 详细数据, 请见附录表2年份人口城镇化年份人口城镇化年份人口城镇化201052.27202566.53204073.99201559.172030
27、68.57204575.65202065.07203571.41205076.48表2 2001-2050年我国人口城镇化水平变化趋势图5 2001-2050年我国人口城镇化水平变化趋势可以知道我国人口城镇化速度在未来20年里每年增长1.10-1.50个百分点, 之后人口城镇化开始放慢增长速度, 2021-2050年间仅增加11.41个百分点. 到本世纪中叶, 城镇化水平在75%左右, 达到中等发达国家城镇化水平. ( 5) 老龄化人口问题随着人口年龄结构的不断老化, 人口年龄结构的类型就会从年轻型进入成年型, 最后进入老年型, 我国人口年龄结构的变化也是经过了不同类型的变化. 从2000年开
28、始我国65岁以上人口占总人口的比重达到7%, 14岁人口比例为22.9%, 老少比为30.4%, 年龄中位数为30.8岁表, 这就意味着我国即将开始进入老龄社会. 根据中国人口与发展研究中心在中国人口信息网上所公布的数据, 获知我国20012005年的老年人口总数. 见下表3表3 我国20012005年的老年人口数据2001200220032004200565岁以上人口数(亿人)0.910.940.960.981.01人口老龄化程度(%)7.097.247.367.487.61分别使用GM(1,1)和组合模型, 对老龄化情况作出预测, 其结果见下图5.1, 5.2图6.1 我国未来65岁以上人
29、口数预测图6.2 我国未来人口老龄化程度预测图6.3 我国城市人口年龄结构预测图6.4 我国镇人口年龄结构预测图6.5 我国乡人口年龄结构预测2005年我国老年人口已超过1亿人, 到2020年, 65岁以上老年人口将达到1.74亿人, 比重从2005年的8.09%增长到12.02%. 预计2050年, 65岁以上老年人口达3.38亿多人, 比重达23.23%. 老龄化进程加速. 老年人口数量多, 老龄化速度快, 高龄趋势明显. 人口老龄化将导致抚养比不断提高, 尤其是乡老年人口变化显著, 50年增加了30多个百分点. 老年人口比重的不断提高和老年人口绝对数的大量增加, 在如何搞好老年人口的衣食
30、住行和老有所养, 老有所乐, 老有所为等方面是国家和社会不容忽视的问题. ( 6) 出生人口性别比问题( 持续升高) 中国出生人口性别比自1984年开始失调, 伴随着出生人口性别比异常升高的速度从缓慢到加速, 失调从轻度到重度, 因而对于出生人口性别比的预测就显得相当重要. 由组合模型和题中附录1中1995-2005年的数据, 对出生人口性别比问题进行预测, 所得结果如下图( 图7) 所示, 详细数据查看附录表3. 图7 2006-2043年全国城, 镇, 乡出生人口性别比变动趋势出生人口性别比呈上升趋势. 城乡失调程度都较高, 其中农村失调程度最为严重, 镇人口失调程度略轻于乡人口失调程度,
31、 城市人口失调程度又略轻与镇人口失调程度. 如果随着失调情况的进一步增长, 导致我国男女人口比例不正常而产生一系列问题. 例如婚姻挤压问题凸现, 导致的社会秩序混乱将成为影响社会稳定的严重隐患. 五, 模型检验现有我国19902005年的人口总数, 出生率和死亡率数据. 用MATLAB编写的灰色GM(1,1)模型和BP神经网络模型的程序, 首先根据我国1990-2004年的数据, 利用此组合模型进行预测, 将所预测得到的2005年全国人口总数与已有数据进行比较, 并验证组合模型的短期预测精度. 通过计算, 可知单独利用GM(1,1)模型进行预测得到的2005年全国人口总数为13.1727亿人,
32、 利用组合模型得到的预测数据为13.0615亿人, 实际数值为13.0756亿人. 由此得出GM(1,1)预测的数据与实际数值的绝对误差是0.0961, 相对误差是0.0074, 均方差为0.0687. 组合模型得到的仿真数据与实际数值的绝对误差是0.0143, 相对误差是0.00108, 均方差为0.00997. 显而易见, , , 此组合模型在人口总数预测方面仿真数据的精确性较单独的GM(1,1)模型要高得多. 六, 模型评价及推广1, 灰色GM(1,1)模型评价推广( 1) 灰色GM(1,1)模型优点灰色GM(1,1)预测模型在计算过程中主要以矩阵为主, 它与MATLAB的结合解决了它在
33、计算中的问题. 由MATLAB编制的灰色预测程序简单实用, 容易操作, 预测精度较高. ( 2) 灰色GM(1,1)模型的缺点该模型是指运用曲线拟合和灰色系统理论对我国人口发展进行预测的方法, 因此它对历史数据有很强的依赖性, 而且GM(1,1)的模型没有考虑各个因素之间的联系. 因此, 误差偏大, 尤其是对中长期预测, 例如对中国人口总数变化情况做长期预测时, 误差偏大, 脱离实际. 下面我们来讨论GM(1,1)模型的适用范围. GM(1,1)模型的白化微分方程:其中为发展系数, 有命题 当GM(1,1)发展系数时,GM(1,1)模型无意义. 通过分析,可得下述结论:当时,GM(1,1)可用
34、于中长期预测;当时, GM(1,1)可用于短期预测,中长期预测慎用;当时, GM(1,1)作短期预测应十分谨慎;当时, 应采用残差修正GM(1,1);当时,不宜采用GM(1,1)在对中国人口总数变化情况做长期预测时, =-0.3572, 因此只能做短期的预测. 如果要考虑到多因素的联系和影响, 此时我们不妨建立GM( 1, n) 模型. GM( 1, N) 模型能模拟系统发展的动态过程, 不但吸收了传统的灰色模型的建立, 而且建立了多中改进的灰色模型, 提高了预测精度. 具体参考52, BP神经网络模型评价推广( 1) 运用BP神经网络进行人口预测的可行性 一个好的人口预测模型首先应符合人口基
35、本理论和数学建模要求, 这是选择模型的关键. 其次要保证模型数据可得, 一致和可比性, 在数据预测检验阶段应充分拟合原始数据,特别是有波动的数据, 因为波动性数据往往蕴藏了系统重要信息. 具有P个输入, Q个输出的BP网络可看作P维欧氏空间到Q维欧氏空间的一个非线性映射, 含一个隐含层的BP网络可以逼近任何连续函数. BP网络的非线性映射与人口非线性特征是相近的, 对于未知的人口动力学系统可通过神经网络来学习系统的表征量并进行预测, 已有定理从数学上保证了网络用于时间序列预测的可行性. 网络的输入向量和结构参数可由相空间重构技术予以确定, 同时BP网络的动态学习能力对人口波动性数据具有较强的识
36、别和拟合能力, 克服了以往人口预测模型剔除奇异值或划分阶段处理的缺陷. 因此从模型映射性质, 输入变量的选择和波动性数据拟合等方面表明BP神经网络模型用于人口预测是可行的. 用神经网络对人口历史数据进行分析拟合, 是人口预测的有效方法. 与传统的人口预测方法相比, 将基于BP神经网络的时间序列预测方法用于人口预测, 避免了繁琐的常规建模过程. 神经网络模型良好的适应和自学习能力, 使预测系统计算简单, 灵活, 运用计算机强大的组合能力, 可以更好地实现人口分类预测和管理, 大大提高人口预测效率和预测精度. ( 2) BP神经网络模型的不足: BP神经网络需要大量的样本数据用来训练和测试, 当样
37、本数量不够时, 预测的误偏差很大. 针对这些问题, 我们提出GM(1,1)和BP神经网络的组合模型, 这样利用灰色系统理论具有所需要的样本数据少, 原理简单, 运算方便, 短期预测精度高等优点, 也发挥了神经网络并行计算, 容错能力强, 自适应能力强等优点. 七, 我们的一些建议( 1) 今后20年前后我国人口趋于年青化的发展态势, 之后人口老年化的趋势逐渐显著, 且成年群体的负担会越来越重. 鉴于此, 要加强发展基层的养老保险等社会保障事业, 现在的年轻群体可以投入这样的组织来保障老年的生活, 同时也减轻年轻一代的负担. ( 2) 继续实施计划生育政策, 促使人口健康, 稳定发展, 并利用教
38、育, 宣传等形式来. 引导男女性别比的协调发展, 如果按照上述的态势发展, 势必会造成一系列严重的社会问题. ( 3) 发挥地区优势, 创造就业机会, 我国的优势, 发展自己的经济, 活跃市场, 给上述的群体创造更多的就业和再就业机会. 结语: 此组合模型将灰色GM(1,1)模型与BP神经网络模型相结合, 既利用灰色预测的需要数据少的优点, 又吸收了BP神经网络容错能力, 自适应能力强的优点. 此组合模型简单, 实用, 特别是在原始数据非常有限的情况下, 可以得到相当精度的拟合数据, 并能得到可靠的预测数据. 由于神经网络的功能之强大, 型式之多样, 若能将其它网络形式同灰色模型相结合, 则有
39、可能进一步提高预测精度, 并能在人口预测方面发挥更大的作用. 参考文献:1邓聚龙, 灰预测与灰决策, 武汉:华中科技大学出版社, 2002年. 2闻新 周露 李翔 张宝伟, MATLAB神经网络仿真与应用, 北京:科学出版社, 2003. 3飞思科技产品研发中心, MATLAB6.5辅助神经网络分析与设计, 北京:电子工业出版社, 2003. 4 2001-2050年全国总人口变动情况预测, 2007年9月21日. 5邓聚龙, 多维灰色规划, 武汉:华中理工大学出版社, 1989年. 附录附表1 2001-2050年全国总人口变动情况预测单位(亿人)GM(1:1)模型BP神经网络GM(1,1)
40、和BP神经网络组合国家2003人口计生委预测结果(TFR=1.8)199011.433311.433311.4333199111.679611.582311.5823199211.780411.717111.7171199311.88211.851711.8517199411.984611.98511.985199512.08812.112112.1121199612.192412.238912.2389199712.297612.362612.3626199812.403712.476112.4761199912.510712.578612.5786200012.618712.674312.
41、6743200112.727612.762712.762712.87200212.837412.845312.845312.97200312.948212.922712.922713.06200413.0612.998812.998813.15200513.172713.075613.075613.24200613.172713.15713.172713.33200713.286413.248913.286413.42200813.40113.342713.40113.51200913.516713.436613.516713.61201013.633313.528313.633313.720
42、1113.75113.615413.75113.8201213.869613.696113.869613.9201313.989313.768813.989314201414.110113.832814.110114.1201514.231813.887814.231814.19201614.354613.934114.334114.27201714.478513.972214.433214.35201814.603514.002814.523814.42201914.729514.026814.605314.48202014.856614.044914.677514.54202114.984
43、814.057914.740714.59202215.114114.066214.795214.63202315.244614.070414.841614.67202415.376114.070814.880714.7202515.508814.067714.913114.73202615.642714.061214.939614.76202715.777714.051314.96114.78202815.913814.038114.97814.8202916.051214.021614.99114.81203016.189714.001615.000714.83203116.329413.9
44、78315.007414.84203216.470313.951615.011614.85203316.612413.921715.013614.85203416.755813.888915.013514.86203516.900413.853815.011714.86203617.046313.816615.008314.86203717.193413.778215.003414.86203817.341713.739514.997214.86203917.491413.701214.989714.85204017.642413.664214.98114.83204117.794613.629314.97114.81204217.948213.59714.9599