资源描述
目录
1.问题综述………………………………………………………………1
2.分析问题………………………………………………………………1
3.建立模型………………………………………………………………2
3.1模型一……………………………………………………………2
3.1.1模型假设……………………………………………………2
3.1.2 建模过程……………………………………………………2
3.1.3建模结果……………………………………………………9
3.1.4模型验证……………………………………………………9
3.1.5模型评价……………………………………………………10
3.2模型二……………………………………………………………10
3.2.1模型假设……………………………………………………10
3.2.2建模过程……………………………………………………11
3.2.3建模结果……………………………………………………11
3.2.4模型验证……………………………………………………11
3.2.5模型评价……………………………………………………12
4.模型比较和优化………………………………………………………12
5.结论……………………………………………………………………14
6.反思……………………………………………………………………14
7.参考文献………………………………………………………………14
6.附录
6.1附录1…………………………………………………附录1.xlsx
6.2附录2…………………………………………………附录2.xlsx
6.3附录3…………………………………………………附录3.xlsx
1问题综述:
中国股市发展的二十余年中,随着市场经济环境的日益发展和成熟,投资观念的不断更新,股市已成为影响经济发展的重要原因之一。所以为了使经济较为理想地发展,采取适当的预测方法是非常重要的。
2011年A股市场的上证指数和深成指数都出现暴跌,使投资者蒙受了很大的损失。在这种情况下,定量分析并预估未来一年时间内A股市场的涨跌变化显然愈显重要。
自从股票“诞生”以来,我们就与这个无形的智能机器人——股市,开始长久的博弈,为了掌握股价的未来走向,我们人类提出了很多预测的模型,例如:灰色系统模型、ARMA模型、马尔科夫模型、各种神经网络模型、混沌力学模型、GARCH模型等。
的确,这些模型发挥了很大作用,并被不少学者深入研究。陈赣洪(1993),胡锡健(1997)等研究了股价预测的马尔科夫模型 ;Franeesand、恤 n(1996), Choo(1999)等讨论了用oAReH模型预测股市的方法;张悦华(1997)一,徐迪等(1998),杨一文等(2001)研究了股价预测的各种神经网络模型;樊智(2001),田宏伟 (2001),刘文财(2002)等研究了股价预测的ARFIMA模型;崔健福,李兴绪 (2004)用GARcH模型和BP神经网络模型对股票价格进行了预测和比较;鲁万波,李竹渝(2005)基于非参数核回归估计方法研究了上海和深圳股市收益率的波动性;曹剑,刘璐(2006)“运用非对称ARCH模型分析了上海股市波动性;高宇(2007)‘5’运用GARCH模型分析了沪深300指数波动性;严定琪,李育锋(2008)61用GARcH族模型对沪深300指数波动率进行预测;张深(2008)川用GARCH类模型对沪深股市波动性进行分析;肖冬荣,杨子天(2009)R’用基于粒子群训练的神经网络模型对股票价格行情进行预测;白营闪(2009),运用ARIMA模型对上证指数进行预测,等等。【1】
但是股票市场是一个极其复杂的非线性系统,受经济形势、国家政策、政治局势、国际环境以及投资者心态等因素的影响,所以单纯用某一个模型来描述股票市场是很片面而且预测结果与真实情况相差较大。同时在以往学者的研究成果中,不少是依据股票的历史价格来对未来价格进行预测,而忽视股票系统内在因素对其影响,这样会导致对于长期预测的结果相当不可靠。
因此,汲取各模型的优点并从股票市场内部影响机制入手来预测股票市场显得更为准确客观。
2分析问题:
影响股市因素有很多,经济形势、国家政策、政治局势、国际环境以及投资者心态等因素。将各大类因素分解后可得如下。
经济形势:工业总产值、全民工业总产值、预算内工业企业销售收入、社会商品零售额、国内商品纯销售、海关进口额、一次能源生产总量、钢产量、铁矿石产量、10种有色金属产量、国内工业品纯购进、国内钢材库存、国内水泥库存、新开工项目数、基建贷款、工业贷款、商品销售收入等先行指标。【2】
国家政策:房地产价格指数、一次能源进出口额、主要农牧渔业生产情况等。
国际形势:海关进出口情况、国际股价变化情况、国际石油价格变化等。
分别找到每一个子因素的近年数据,求出各自的相关系数,按照相关系数的大小从大到小排列各个因素,选取相关系数较大的一部分因素进行下一步分析。之后,用Verhulst模型分别分析所筛选出的因素,得出各自的预测函数和预测值。最后,以相关度来代替权重,用加权移动平均方法得出股票预测值并进行检验。
3.建立模型:
3.1模型一:
3.1.1模型假设:
1.所查到的数据真实性、可靠性较为理想。
2.不考虑子因素之间的影响。
3.认为未被选中的因素对股市没有影响。
3.1.2 建模过程
依据【附录3】【3】的原始数据得到相关系数如下(表一):
子因素类别
货币和准货币(M2)
CPI
当月出口额(亿美元)
PPI
制造业
非制造业
社会消费品总额
相关系数
-0.30024
0.359078
-0.19261
0.202285
0.62118
0.188527
-0.2802
(表一)
Verhulst模型简介:
设x(0)为原始数据序列
为的一次累加生成(1-AGO)序列
为的紧邻均值生成序列
,k=2,3,…,n
则称
为灰色Verhulst模型,a和b为参数。称
为灰色Verhulst模型的白化方程,t为时间。
设Verhulst模型如上所述,若
为参数列,且
,
则参数列的最小二乘估计满足
白化方程的解(时间响应函数)为
灰色Verhulst模型的时间响应序列为
取为,则上式变为
还原式为
用Verhulst模型预测未来CPI
下表即为
时间
CPI
2012 /2
103.2
2012 /1
104.5
2011 /12
104.1
2011 /11
104.2
2011 /10
105.5
2011 /9
106.1
2011 /8
106.2
2011 /7
106.5
2011 /6
106.4
2011 /5
105.5
2011 /4
105.3
2011 /3
105.4
2011 /2
104.9
……
……
初值化后得
时间
初值化
2012 /2
1.016749
2012 /1
1.029557
2011 /12
1.025616
2011 /11
1.026601
2011 /10
1.039409
2011 /9
1.04532
2011 /8
1.046305
2011 /7
1.049261
2011 /6
1.048276
2011 /5
1.039409
2011 /4
1.037438
2011 /3
1.038424
2011 /2
1.033498
……
……
一次累加后得
时间
累加值
2012 /2
50.98719
2012 /1
49.97044
2011 /12
48.94089
2011 /11
47.91527
2011 /10
46.88867
2011 /9
45.84926
2011 /8
44.80394
2011 /7
43.75764
2011 /6
42.70837
2011 /5
41.6601
2011 /4
40.62069
2011 /3
39.58325
2011 /2
38.54483
……
……
求紧邻均值,
时间
紧邻均值
2012 /2
50.47882
2012 /1
49.45567
2011 /12
48.42808
2011 /11
47.40197
2011 /10
46.36897
2011 /9
45.3266
2011 /8
44.28079
2011 /7
43.233
2011 /6
42.18424
2011 /5
41.14039
2011 /4
40.10197
2011 /3
39.06404
2011 /2
38.02808
……
……
用Matlab软件进行矩阵运算
得
将k带入得,累减还原,得
CPI
预测初始值
2013/3
2013/2
0.980272
2013/1
1.009983
2012/12
1.037865
2012/11
1.063645
2012/10
1.087056
2012/9
1.107847
2012/8
1.125791
2012/7
1.140682
2012/6
1.15235
2012/5
1.160656
2012/4
1.165501
2012/3
1.166827
将预测初始化值乘基准值得2012/3~2013/3的CPI预测值,如下表
CPI
预测值
2013 /3
2013 /2
99.4976
2013 /1
102.5132
2012 /12
105.3433
2012 /11
107.96
2012 /10
110.3361
2012 /9
112.4465
2012 /8
114.2677
2012 /7
115.7792
2012 /6
116.9635
2012 /5
117.8066
2012 /4
118.2983
2012 /3
118.4329
2010 /1
同理得到下述PPI、当月出口额、非制造业、货币和准货币、社会消费品额、制造业的预测值。
PPI
预测初始值
预测值
2013/3
0.992628
103.5311
2013/2
1.020823
106.4719
2013/1
1.047038
109.206
2012/12
1.071007
111.706
2012/11
1.09248
113.9457
2012/10
1.111224
115.9006
2012/9
1.12703
117.5492
2012/8
1.139717
118.8725
2012/7
1.149139
119.8552
2012/6
1.155184
120.4857
2012/5
1.15778
120.7565
2012/4
1.156896
120.6642
2012/3
1.152542
120.2101
2010/1
104.3
出口额
预测初始值
预测值
2013/3
1.537717
1683.416
2013/2
1.531818
1676.958
2013/1
1.522207
1666.437
2012/12
1.508979
1651.955
2012/11
1.49226
1633.652
2012/10
1.472208
1611.7
2012/9
1.44901
1586.304
2012/8
1.422876
1557.693
2012/7
1.394036
1526.121
2012/6
1.36274
1491.859
2012/5
1.329245
1455.191
2012/4
1.293819
1416.409
2012/3
1.256734
1375.81
2010/1
1094.75
非制造业
预测初始值
预测值
2013/3
1.000264
1.310994
2013/2
1.036681
1.355068
2013/1
1.071533
1.396728
2012/12
1.104476
1.435542
2012/11
1.135168
1.471088
2012/10
1.163276
1.502963
2012/9
1.188482
1.530793
2012/8
1.210489
1.554242
2012/7
1.229032
1.573018
2012/6
1.243879
1.586884
2012/5
1.254843
1.595659
2012/4
1.261783
1.599231
2012/3
1.264607
0.696799
2010/1
0.551
货币和准货币(M2)
预测初始值
预测值
2013/3
1.260577
788628.6
2013/2
1.261037
788916.6
2013/1
1.258005
787019.4
2012/12
1.251512
782957.8
2012/11
1.241632
776776.4
2012/10
1.22847
768542.6
2012/9
1.21217
758344.6
2012/8
1.192901
746289.9
2012/7
1.170863
732502.6
2012/6
1.146276
717121.2
2012/5
1.119381
700295.1
2012/4
1.090429
682182.2
2012/3
1.059681
662946.1
2010/1
625609.3
社会消费品总额
预测初始值
初始值
2013/3
1.168896
14866.13
2013/2
1.178308
14985.84
2013/1
1.184443
15063.86
2012/12
1.187232
15099.33
2012/11
1.186643
15091.84
2012/10
1.182682
15041.47
2012/9
1.175396
14948.8
2012/8
1.164865
14814.88
2012/7
1.151208
14641.17
2012/6
1.134572
14429.61
2012/5
1.115138
14182.44
2012/4
1.093108
13902.26
2012/3
1.068708
13591.93
2010/1
12718.1
社会消费品总额
制造业
预测初始值
初始值
2013/3
0.844236
0.471084
2013/2
0.877295
0.489531
2013/1
0.909253
0.507363
2012/12
0.939809
0.524413
2012/11
0.968657
0.540511
2012/10
0.995495
0.555486
2012/9
1.020027
0.569175
2012/8
1.041971
0.58142
2012/7
1.061067
0.592075
2012/6
1.077081
0.601011
2012/5
1.089811
0.608114
2012/4
1.099094
0.613294
2012/3
1.104809
0.616483
2010/1
0.558
根据(表一)的相关系数,得各因素权重
货币和准货币(M2)
CPI
当月出口额(亿美元)
PPI
制造业
非制造业
社会消费品总额
相关系数
-0.30024
0.359078
-0.19261
0.202285
0.62118
0.188527
-0.2802
绝对值
0.300241
0.359078
0.192613
0.202285
0.62118
0.188527
0.280201
权重
14%
17%
9%
9%
29%
9%
13%
(表二)
3.1.3建模结果:
从而得2012/3~2013/3的股价预测值,如下
股价
预测初值
预测值
2013/3
0.893595
2938.119
2013/2
1.073966
3531.174
2013/1
1.093252
3594.585
2012/12
1.110199
3650.306
2012/11
1.124636
3697.775
2012/10
1.13641
3736.487
2012/9
1.145388
3766.006
2012/8
1.15146
3785.972
2012/7
1.154544
3796.112
2012/6
1.154585
3796.246
2012/5
1.151558
3786.294
2012/4
1.14547
3766.277
2012/3
1.13636
3736.322
2010/1
3287.975
(表3)
3.1.4模型验证:
将历史股价数据带入已得到的Verhulst模型,再经加权移动得到【附录1】
得图如下
摘录相对误差在30%内数据
沪指均
预测初始值
相对误差
2011/9
0.78574
1.024187
30%
2011/8
0.820336
0.997451
22%
2011/7
0.876649
0.968981
11%
2011/6
0.857995
0.939014
9%
2011/5
0.89546
0.907795
1%
2011/4
0.945737
0.875567
7%
2011/3
0.933565
0.842571
10%
2011/2
0.888593
0.809041
9%
2011/1
0.861403
0.775199
10%
2010/12
0.901398
0.741256
18%
2010/11
0.946983
0.707409
25%
2010/10
0.916328
0.673838
26%
2010/9
0.840993
0.640705
24%
2010/8
0.839307
0.608154
28%
2010/7
0.793171
0.576313
27%
3.1.5模型评价:
由图表可知,尽管从2011年5月后误差逐渐增大,但预测值偏离真实值的速度逐渐减小,而真实值从2012年2月后开始回涨,所以在未来的某些月中的相对误差会再次减小到30%以下。
所以得到(表3)的预测值和曲线是比较合理的。
3.2模型二:
3.2.1模型假设:
所下载的数据真实可靠。
3.2.2建模过程:
为了与模型一对比分析,将Verhulst模型依据历史股价数据直接应用到股价预测而不具体分析各因素对股价的影响。
详细表格见【附录2】
修正值为0.1
3.2.3建模结果:
3.2.4模型验证:
3.2.5模型评价
修正后的模型二较修正前更加吻合实际,所以模型二较为理想。
4.模型比较和优化:
预测股价
模型一
模型二
2013/3
2938.119
1532.565
2013/2
3531.174
1633.525
2013/1
3594.585
1736.014
2012/12
3650.306
1839.493
2012/11
3697.775
1943.358
2012/10
3736.487
2046.939
2012/9
3766.006
2149.506
2012/8
3785.972
2250.273
2012/7
3796.112
2348.41
2012/6
3796.246
2443.052
2012/5
3786.294
2533.309
2012/4
3766.277
2618.288
2012/3
3736.322
2697.101
2010/1
因为模型二对短期预测较为准确,所以将模型一加一个修正系数,使其在未来近期与模型二符合。
预测股价
模型一
模型二
优化后模型一
修正系数
2013/3
2938.119
1532.565
1898.898
-1039.221
2013/2
3531.174
1633.525
2491.953
2013/1
3594.585
1736.014
2555.364
2012/12
3650.306
1839.493
2611.085
2012/11
3697.775
1943.358
2658.554
2012/10
3736.487
2046.939
2697.266
2012/9
3766.006
2149.506
2726.785
2012/8
3785.972
2250.273
2746.751
2012/7
3796.112
2348.41
2756.891
2012/6
3796.246
2443.052
2757.025
2012/5
3786.294
2533.309
2747.073
2012/4
3766.277
2618.288
2727.056
2012/3
3736.322
2697.101
2697.101
5.结论:
经过上述两个模型优化互补后,未来一年股价预测值为
时间
模型一优化后
2013/3
1898.898
2013/2
2491.953
2013/1
2555.364
2012/12
2611.085
2012/11
2658.554
2012/10
2697.266
2012/9
2726.785
2012/8
2746.751
2012/7
2756.891
2012/6
2757.025
2012/5
2747.073
2012/4
2727.056
2012/3
2697.101
6.反思:
经过紧张的三天努力虽然建了一个模型,但是符合的程度不是很好,究其原因是我们没有深入了解那些基础理论和模型的适用条件,因此在方向性问题上产生一些错误。所幸的是,经过后期的从新优化得到了令我们较为满意的综合模型。
这三天虽然说很紧张,但是并没有发挥出每个人的最好状态,合作的效率也很不容乐观,所以今后我们要调整好合作过程,在短短的三天发挥更大的团队作用。
充实自己,笑望未来!
7. 参考文献
【1】李文静,《股票价格的影响因素分析及其预测》,中国知网,2012/4/7
【2】经济形势(Economic situation),
【3】数据来源:东方财富网, ,2012/4/7
王志远,《基于灰色神经网络的股票分析预测研究》,中国知网2012/4/7
李剑波,《A股股票价格影响因素的通径分析》, 2012/4/7
展开阅读全文