资源描述
确定经济实质性增长的合理指标
摘要
针对问题一,就1978年至2011年的生产总值(GDP)和物价消费指数(CPI)等相关统计数据,先分别建立了关于GDP和CPI增长的回归分析模型,通过matlab编程计算, 本文判断出
对GDP现实数据的拟合效果最好, 对CPI现实数据拟合效果最好。最后做出了客观的评价,分析了所建模型的优缺点。
针对问题二,就1978年至2011年GDP和CPI等相关统计数据,运用SPSS软件做出了两者的关系散点图,观察后发现该图像与指数函数图像较为相近,令 ,两边取对数得,即看成简单线性回归模型。通过matlab软件进行拟合,建立了GDP增长与CPI相关的线性回归方程 。
针对问题三,联系社会实际背景,我们分析了用单一GDP作为衡量经济实质性增长指标的缺陷,并在次基础上设计了另一相对固定、客观合理的指标——可购黄金量,其计算公式为:可购黄金量=GDP/黄金价格,因为黄金价格的影响因素有:美元走势、世界金融危机、通货膨胀、石油价格、本地利率等等。黄金作为长期的价值衡量物,能购买黄金的量也能一定程度上反映了经济水平。用黄金作为参考量也无形之中考虑的价格因素与汇率等关系对经济实质增长的影响。即购买能力的水平的比较来揭示经济的实际增长与否。
针对问题四,根据上述模型,对2020年的GDP和人均GDP进行预测,经过换算,得出要实现目标一与目标二2000年至2020年每年平均的GDP增长率分别为p1= 7.177%, p2= 7.921%。因为p2>p1,所以目标二比目标一更难实现,但两者差距不大。计算的结果与十七大的目标相近,不需要做出改变。
关键词:GDP;CPI;回归预测模型;经济实质性增长;合理指标;
1.问题重述及分析
1.1问题提出的背景
背景1: 中国改革开放三十余年, 国内生产总值(GDP)从1978年的2164亿美元/人民币3645亿元增长到2010年的58790亿美元/人民币397983亿元,按美元计约27倍,按人民币计约109倍;以2000年GDP 11984亿美元/人民币99214亿元为基点计算,则2010年分别为4.9倍和4倍;
背景2: 黄金价格自2011年7月创历史新高突破1600美元/盎司,目前一直在1600美元/盎司上下;而1978年的黄金收盘价为208美元;2000年为272美元,也即目前的黄金价格约为1978年、2000年的8倍和6倍;
背景3: 国家统计局每月发布消费物价指数(CPI)数据,CPI反映消费价格上涨,也反映货币贬值;从1978年起计算累积CPI,到2010年约为500%;从2000年起计算累积CPI,到2010年约为124%;
从以上背景数据我们可以粗略地判断出中国经济总量的快速发展,但由于观察的出发点不同,合理的解释可能得到不同的结论,例如在某些年份按人民币结算GDP增加,如果按美元结算则GDP减少;因此如果要比较精确地确定经济的实质性增长,应该有一个相对固定的参照标准。
1.2问题的重述
问题1: 通过数据分析建立我国GDP和CPI增长的数学模型,且分析你所建立模型的优缺点;
问题2: 建立适当的模型分析揭示GDP增长与CPI之间的内在联系;
问题3: 设计一个客观合理的指标,能更准确地反映经济的实质性增长;
问题4: 2002年党的十六大提出国内生产总值到2020年比2000年翻两番(目标1), 2007年党的十七大在此基础上又把总量表述为人均指标,提出了“人均国内生产总值到2020年比2000年翻两番”的目标(目标2),如果假设这里的翻两番意思是实质性的4倍,那么根据你上面的分析,以上两个目标有什么差别;在未来年份我国GDP按什么速度增长可以完成这个目标?如果分析的结果与十六大十七大提出的目标有偏离,那么在十八大关于GDP目标作怎样的合理修正?
2.符号说明及名词解释
x: 当年年份减去1977的值
y: GDP值
z: 累计CPI增长率
CPI增长率:消费物价指数(CPI)增长率是指CPI的年度增长率。其计算公式为:以1987年为基年,CPI增长率=
CPI:消费物价指数(CPI)是指以上年CPI=100为基准,当年CPI的值。其计算公式为:
累计CPI增长量:累计消费物价指数(CPI)增长量是指 以1978年CPI=100.7为基准,累计当年CPI增长率得到的CPI值。其计算公式为:
通过搜集和计算得到表一的数据
表一 1978-2011年GDP及CPI的相关数据
年份
GDP(亿元)
CPI增长率(%)
CPI(上年=100)
累积CPI增长量(%)
人均GDP(美元∕人)
1978
3624.4
0.7
100.7
100.7
226
1979
4038.2
1.9
101.9
102.6
269
1980
4517.8
7.5
107.5
110.3
309
1981
4862.4
2.4
102.4
113.0
288
1982
5294.7
1.9
101.9
115.1
279
1983
5934.5
1.5
101.5
116.8
295
1984
7171.9
2.8
102.8
120.1
299
1985
8964.4
9.3
109.3
131.3
292
1986
10202.2
6.5
106.5
139.8
279
1987
11962.5
7.3
107.3
150.0
299
1988
14928.3
18.8
118.8
178.2
367
1989
16909.2
18.0
118.0
210.3
403
1990
18547.9
3.1
103.1
216.8
343
1991
21617.8
3.4
103.4
224.2
355
1992
26638.1
6.4
106.4
238.5
419
1993
35334.0
14.7
114.7
273.6
520
1994
48198.0
24.1
124.1
339.5
469
1995
60794.0
17.1
117.1
397.6
604
1996
71176.6
8.3
108.3
430.6
703
1997
78973.0
2.8
102.8
442.6
775
1998
84402.3
(0.8)
99.2
439.1
821
1999
89677.1
(1.4)
98.6
432.9
864
2000
99214.6
0.4
100.4
434.7
945
2001
109655.2
0.7
100.7
437.7
1041
2002
120332.7
(0.8)
99.2
434.2
1135
2003
135822.8
1.2
101.2
439.4
1273
2004
159878.3
3.9
103.9
456.6
1490
2005
183217.4
1.8
101.8
464.8
1739
2006
211923.5
1.5
101.5
471.8
2052
2007
257305.6
4.8
104.8
494.4
2553
2008
314045.0
5.9
105.9
523.6
3386
2009
335353.0
(0.7)
99.3
519.9
3678
2010
397983.0
3.3
103.3
537.1
4382
2011
471564.0
5.4
105.4
566.1
5414
3.数据分析
利用Excel和SPSS软件对表一中的数据进行处理,得到图1、图2和图3
图3 GDP增长与CPI之间关系的散点图
3.模型假设
1、假设GDP与CPI的增长和GDP与CPI的内在联系所建立的数学模型不受通货膨胀率、城镇失业率、货币收支影响。
2、CPI数据以1977年=100为基准。
3、忽略环境带来的负面影响、非市场经济活动对经济的实质性影响。
4.模型的建立
回归分析模型:
多项式回归模型为:
(1-1)
将数据点代入,有
( i = 1 , 2 ,⋯ , n ), (1-2)
式中是未知参数,为剩余残差项或随机扰动项,反映所有其他因素对因变量的影响。
在运用回归方法进行预测时,要求满足一定的条件,其中最重要的是必须具备如下特征:1、是一个随机变量;2、的数学期望值为零,即;3、在每一个时期中,的方差为一常量,即;4、各个间相互独立;5、与自变量无关。
大多数情况下,假定。
建立一元线性回归模型分以下步骤:
Step1.建立理论模型
针对某一因变量,寻找适当的自变量,建立如(1-1)的理论模型
Step2.估计参数
运用普通的最小二乘法或其他方法评估参数的值,建立如下的一元线性回归预测模型:
( i = 1 , 2 ,⋯ , n ) (1-2) 这里分别是的估计值。
如果是采用最小二乘法估计的值,即时残差平方和(也称剩余平方和)
达到最小, 令 得
(1-3)
其中
Step3.进行检验
回归模型建立之后,能否用来进行实际预测,取决于它与实际数据是否有较好的拟合度,模型的线性关系是否显著等。为此,在实际用来测量之前,还需要对模型进行一系列评价检验。
1、标准误差
标准误差是估计值与因变量值间的平均平方误差,其计算公式为:
(1-4)
它可以用来衡量拟合优度。
2、判定系数
判定系数是衡量拟合优度的一个重要指标,它的取值介于0与1之间,其计算公式为:
(1-5)
越接近于1,拟合程度越好;反之越差。
3、相关系数
相关系数是一个用于测定因变量与自变量之间线性相关程度的指标,其计算公式为
(1-6)
相关系数与判定系数之间存在关系式:
但两者的概念不同,判定系数用来衡量拟合优度,而相关系数用来判定因变量与自变量之间的线性相关程度。
相关系数的数值范围是当时,称正相关;当时,称负相关;当时,称不相关;当,称完全相关,越接近于1,相当程度越高。
相关系数的显著性检验,简称相关检验,它是用来判断是否显著线性相关的。
相关检验要利用相关系数表,步骤如下:
首先计算样本相关系数值。然后根据给定的样本容量和显著性水平查相关系数表,得临界值,最后进行检验判断:
4、回归系数显著性检验
回归系数的显著性检验可用检验法进行,令
(1-7)
其中
取显著性水平,则回归系数显著,此检验对常数项亦适用。
5、检验
统计量
(1-8)
服从分布,取显著性水平,则表明回归模型显著;如果,则表明回归模型不显著,改回归模型不能用于预测。
6、统计量
统计量是用来检验回归模型的剩余项之间是否存在自相关的一种十分有效的方法。
(1-9)
式中
将利用式(1-9)计算而得到的值与不同显著性水平下的值之上限和下限进行比较,来确定是否存在自相关。值应在之间。
当值小于或等于2时,检验法则规定:
如果,则认为存在正自相关;
如果,则认为无自相关;
如果,则不能确定是否有自相关。
当值大于2时,检验法则规定:
如果,则认为存在负自相关;
如果,则认为无自相关;
如果,则不能确定是否有自相关
根据经验,统计量的值在1.5-2.5之间时表示没有显著自相关问题。
以上检验可利用统计软件包进行回归时同时完成
Step4.进行预测
预测可分为点预测和区间预测两类,在一元线性回归中,所谓点预测,就是当给定时,利用样本回归方程求出相应的样本拟合值,以此作为因变量个别值和其均值的估计。
区间预测是给出一个在一定概率保证程度下的预测置信区间。
进行区间预测,首先要进行点预测,确定的值,求得的预测值。
的置信度为的预测区间的端点为:
(1-10)
其中,S为标准偏差,可由t分布表查得,其自由度为,满足,而
5.模型的求解
5.1问题一的分析与求解
从图1中我们大致可以确定该图与幂函数多项式的图象较为相近,所以我们建立了多项式模型,运用matlab计算
表二 回归检验参数
次数
可决系数R^2
F值统计
P值统计拒绝无效假设的概率
2
0.958
349.241
0
3
0.989
904.876
0
4
0.997
2099.550
0
5
0.998
2194.700
0
6
0.998
2212.615
0
7
0.998
2337.177
0
8
0.998
2079.794
0
利用matlab统计工具求解,得到回归系数估计值及置信区间(置信水平=0.05)见表三。
表三 模型计算结果
系数估计值
置信区间下限
置信区间上限
常数项
11292.68465
11292.6846548869
11292.6846549940
X
-11053.86808
-11053.8680787702
-11053.8680786706
X^2
4876.217404
4876.2174040095
4876.2174040401
X^3
-887.688136
-887.6881359885
-887.6881359842
X^4
79.85381426
79.8538142606
79.8538142609
X^5
-3.632887408
-3.6328874084
-3.6328874084
X^6
0.080764327
0.0807643271
0.0807643271
X^7
-0.000691728
-0.0006917283
-0.0006917283
于是得到回归方程 :(其中x表示具体年度减去1977)
但是x为7次的实际预测值与实际严重不符,(到2020年预测的GDP已为负值)。所以我们决定采用x的6次为拟合方程,通过上表的检验也是非常符合线性关系的,通过了线性关系的F检验与P检验。
系数估计值
置信区间下限
置信区间上限
常数项
-11545.0274
-11545.0273707508
-11545.0273707259
X
15125.9098
15125.9098347623
15125.9098347771
X^2
-4042.9906
-4042.9905857107
-4042.9905857079
X^3
447.6030
447.6030055366
447.6030055369
X^4
-21.9932
-21.9932026521
-21.9932026521
X^5
0.4969
0.4968636317
0.4968636317
X^6
-0.0040
-0.0039723910
-0.0039723910
因此拟合的回归方程为:
绘制下图
图4 GDP随时间变化拟合曲线
由图4,我们可以进一步确定拟合效果非常好。
从图2中我们大致可以确定该图与一次函数的图象较为相近,所以我们建立了线性回归模型,运用matlab计算、得到回归方程
根据上述检验方法运用matlab计算得出
说明通过检验,绘制下图
图5 CPI随时间变化拟合曲线
5.2 问题二的分析与求解
从图3我们大致可以确定该图与指数函数的图像较为相近,令 ,两边取对数得,即看成简单线性回归模型。
,再根据模型算得
所以。
所以得到回归方程为
通过上述回归检验方法得到通过检验。
绘制下图:
图6 GDP增长与CPI关系的拟合曲线
5.3 问题三的分析与求解
目前,GDP是衡量一个国家经济实力的最普遍指标。然而,GDP并非一个完美的指标,它只计算最终产品的市场价值,却难以反映更深刻的东西,例如GDP不能反映经济发展对资源环境所造成的负面影响;不能准确反映一个国家的财富变化;不能反映某些重要的非市场经济活动;不能全面反映人们的福利状况。为了更加精确地反映经济的实质性增长,我们设计了可购黄金作为指标,其计算公式为:可购黄金=GDP/黄金价格。黄金作为长期的价值衡量物,能购买黄金的量也能一定程度上反映了经济水平。用黄金作为参考量也无形之中考虑的价格因素与汇率等关系对经济实质增长的影响。即购买能力的水平的比较来揭示经济的实际增长与否。
通过搜集和计算得到表三的数据
表三 1978-2009年GDP和黄金价格相关数据
年份
GDP(亿美元)
黄金价格(美元/盎司)
可购黄金量(亿盎司)
1978
2307
193.24
11.93852205
1979
2709
306.67
8.833599635
1980
2971
612.74
4.848712341
1981
2926
459.75
6.364328439
1982
2813
375.8
7.485364556
1983
3012
424.12
7.101763652
1984
2574
360.36
7.142857143
1985
2818
317.27
8.882024774
1986
2762
367.94
7.506658694
1987
3242
446.07
7.267917591
1988
4044
436.77
9.25887767
1989
3600
380.79
9.45402978
1990
3576
383.59
9.322453661
1991
4011
362.26
11.07215812
1992
4682
343.95
13.61244367
1993
6092
359.82
16.93068757
1994
5704
384.15
14.84836652
1995
7307
384.05
19.02616847
1996
8576
387.87
22.11050094
1997
9538
331.29
28.79048568
1998
10193
294.09
34.65945799
1999
10831
267.2
40.53517964
2000
11982
279.11
42.92931102
2001
13243
271.04
48.85994687
2002
14533
309.73
46.92151228
2003
16404
403
40.70471464
2004
19309
413.86
46.65587397
2005
22703
475.5
47.74553102
2006
27135
623.38
43.52882672
2007
35247
723.65
48.70724798
2008
45200
856.95
52.745201
2009
60400
903.85
66.82524755
运用SPSS软件做出可购黄金随时间变化的散点图如下:
从上图可看出可购黄金量在1978-2008年虽有小幅波动,但上升趋势显著,表明我国经济呈实质性增长。
5.4、问题四的分析与求解
假如要实现目标一即国内生产总值到2020年比2000年翻两番,则根据公式,2000年至2020年每年平均的GDP增长率p1应为0.07177。
假如要实现目标二即人均国内生产总值到2020年比2000年翻两番,查询文献得到2020年中国人口预计达到14.5亿。所以2020年的人均GDP预计为455764亿元。则根据公式,2000年至2020年每年平均的人均GDP增长率p2应为0.07921。
因为p2>p1,所以目标二比目标一更难实现,但两者差距不大。
查表一得到2000年的GDP为亿元,根据模型得到的回归预测方程得到2020年的GDP为亿元。所以列出以下式子(其中p为2000年至2020年每年平均的GDP增长率)
即14.517%。
6.模型的评价
问题一中我们采用的一元多项回归线性模型进行拟合,在研究GDP的增长模型的时候,在matlab你拟合过程中发现前期的拟合效果非常好,几乎一致,但之后 进行预测的GDP值域实际的有明显的差别。所以我们得出此模型比较适合短期的预测与分析。而在CPI增长的模型建立中,发现简单线性回归拟合效果好,预测值也符合实际,此模型比较完善的揭示了CPI的增长模型,具有一点的参考价值。
问题二中建立的类线性回归模型,发现CPI增长积累值与GDP值具有类似对数增长的关系。从图像的斜率来看,也说明随着GDP的增长,CPI的增长率速率缓慢下降,这点不叫符合实际规律。所以此模型也较好的说明看GDP增长与CPI之间的内在联系,具有一定的参考价值。
问题三中我们采用黄金购买量来作为经济实质增长的横量指标。中心思想就是等价交换物。黄金作为长期的价值衡量物,能购买黄金的量也能一定程度上反映了经济水平。用黄金作为参考量也无形之中考虑的价格因素与汇率等关系对经济实质增长的影响。但在与实际GDP的值进行同期比较是发现,GDP的增长趋势与黄金购买量吻合,但也存在部分的误差。所以此模型可也比较粗略的反映经济的实质增长。
参考文献
[1] 林军 陈翰林,《数学建模教程》[M],科学出版社,第四章 统计回归模型,2011
[2] 王兵团,《数学建模基础》[M],清华大学出版社、北京交通大学出版社,第三章 经济增长模型,2004
[3] 姜启源 谢金星,《数学模型》[M] 北京高等教育出版社,2003;
附录
预测GDP的matlab程序:
a=xlsread('GDP CPI数据 2');
x=a(:,1);
y=a(:,2);
p7=polyfit(x,y,7);
t=1:1:34
s2=polyval(p7,t);
z=polyval(p7,40);
hold on
xlabel('年份(x为年份减去1977的值)') % 给X轴加标签
ylabel('GDP(亿元))') % 给Y轴加标签
plot(t, s2, 'b--','linewidth',3);
plot(x, y, 'k.', 'Markersize', 15) % 绘制x和y的散点图
%*******************调用regress函数做回归析************************************
T=[ones(34,1) t' (t.^2)' (t.^3)' (t.^4)' (t.^5)' (t.^6)' (t.^7)' ];
[b, bint, r, rint, s] = regress(s2', T);
预测CPI的matlab程序:
a=xlsread('GDP CPI数据 2');
x=a(:,1);
y=a(:,5);
p1=polyfit(x,y,1);
t=1:1:34
s1=polyval(p1,t);
hold on
xlabel('年份(x为年份减去1977的值)') % 给X轴加标签
ylabel('累积CPI增长(%))') % 给Y轴加标签
plot(t, s1, 'r--','linewidth',3);
plot(x, y, 'k.', 'Markersize', 15) % 绘制x和y的散点图
%*******************调用regress函数做回归析************************************
T=[ones(34,1) t'];
[b, bint, r, rint, s] = regress(s1', T);
预测GDP与CPI关系的matlab程序
x=[100.7, 102.6 ,110.3, 113.0, 115.1, 116.8, 120.1,131.3, 139.8 ,150.0 ,178.2 ,210.3, 216.8, 224.2, 238.5 ,273.6 ,339.5, 397.6 ,430.6, 442.6 ,439.1, 432.9, 434.7, 437.7 ,434.2, 439.4 ,456.6 ,464.8, 471.8, 494.4, 523.6, 519.9, 537.1, 566.1 ]
y=[3624.4 ,4038.2,4517.8, 4862.4, 5294.7, 5934.5, 7171.9 ,8964.4, 10202.2, 11962.5, 14928.3, 16909.2, 18547.9 ,21617.8 ,26638.1, 35334.0 ,48198.0, 60794.0,71176.6, 78973.0, 84402.3, 89677.1, 99214.6, 109655.2, 120332.7, 135822.8, 159878.3, 183217.4, 211923.5, 257305.6, 314045.0, 335353.0,397983.0, 471564.0]
y1=log(y);
p=polyfit(x,y1,1);
s1=polyval(p,x);
s2=exp(s1);
hold on
xlabel('CPI积累增长(%)') % 给X轴加标签
ylabel('GDP(亿元))') % 给Y轴加标签
plot(x, s2, 'r--','linewidth',3);
plot(x, y, 'k.', 'Markersize', 15) % 绘制x和y的散点图
%*******************调用regress函数做回归析************************************
T=[ones(34,1) x'];
[b, bint, r, rint, s] = regress(s2', T);
展开阅读全文