收藏 分销(赏)

结合长短时记忆网络和宽度学习的股票预测新模型研究.pdf

上传人:自信****多点 文档编号:645728 上传时间:2024-01-23 格式:PDF 页数:6 大小:1.30MB
下载 相关 举报
结合长短时记忆网络和宽度学习的股票预测新模型研究.pdf_第1页
第1页 / 共6页
结合长短时记忆网络和宽度学习的股票预测新模型研究.pdf_第2页
第2页 / 共6页
结合长短时记忆网络和宽度学习的股票预测新模型研究.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷第 期运 筹 与 管 理 ,年 月 收稿日期:基金项目:国家自然科学基金资助项目();南方海洋科学与工程广东省实验室(珠海)基金项目()作者简介:韩莹(),女,辽宁沈阳人,副教授,博士,研究方向:大数据处理方法及其应用;陆超(),通讯作者,男,江苏盐城人,副教授,博士,研究方向:实证金融。结合长短时记忆网络和宽度学习的股票预测新模型研究韩 莹,张 栋,孙凯强,谈昊然,陆 超(南京信息工程大学 自动化学院,江苏 南京 ;北京交通大学 经济管理学院,北京 )摘要:长短时记忆网络()近年来广泛应用于股票预测中,其结构特点易陷入局部最优,从而影响预测精度。借鉴宽度学习系统()在时间序列预测上良好

2、的逼近能力,本文尝试宽度学习与深度学习相结合。进一步地,针对股票序列不平稳特点,引入互补集成经验模态分解()进行降噪处理,提出 ()股票预测模型。选取农林牧渔行业股票价格,对新提出的模型进行实证研究。通过与基线模型、现有股票预测模型对比,证明了新模型在多个精度指标上都有明显提升。特别地,通过分别将 模型与不融入 的 模型,对 分解后的分量预测结果进行对比发现:模型预测存在一定的误差,且越是拐点处,越是高频波动,预测误差越明显。而 模型中的 模块能够解决这类问题。当数据出现较大波动时,本文提出的新模型与现有模型相比,可以很好的解决拟合差、时滞等问题。关键词:股票预测;互补集成经验模态分解;长短时

3、记忆网络;宽度学习系统中图分类号:文章标识码:文章编号:():,(,;,):,(),(),(),()(),:;引言股票市场是资本市场的核心组成部分 。股票关注的重点之一就是股价的走势和未来趋势预测。股票市场的数据具有非线性、多尺度的特点,传统的金融计量方式存在大量的局限性,等 证明深度学习预测的结果优于传统的机器学习。(,循 环 神 经 网络)及其扩展模型,如 (,长短期记忆网络),(,门控循环单元)等,近年被用于进行股票预测。丁文绢 利用 模型与 模型分别对上证股 的历史交易数据进行训练预测比较,得出 模型在股票预测精度方面优于 模型的结论。等 通过对比证明 预测模型在股票预测中相比 (,支

4、持向量回归)、随机森林和神经网络模型有更高 的 预 测 精 度。罗 鑫 和 张 金 林 引 入 (,卷积神经网络)并与 相结合,提出多时间尺度 模型,改善了对沪深 指数涨跌预测的效果。乔若羽 分别将 ,与注意力机制()机制相结合,并通过对比单一模型证明了注意力机制与深度学习相结合,提高了股票预测的准确性。网络具有的优势使其被广泛用于金融预测,且复合模型相比单一的 模型更有优势。但金融序列中的噪声对精确预测有很大挑战。等 构建了深度学习复合预测模型,分别将 (,经验模态分解),(,集合经验模态分解),(,互补集成经验模态分解),提取抽象、高级特征,并将其用于单 步 向 前 股 票 价 格 的 预

5、 测。并 得 出 模型能有效地提高股票指数的收益率预测精度的结论。等 提出新的混合算法,构建 了 与 模型,为股票预测提供了更有效的方法。等 提出了一种混合模型,将 算法、模糊时间分析技术和 模型复合。实验结果表示混合算法的每个部分都可以在很大程度上提高预测能力。结构特点造成了其易陷入局部最优、具有时滞性的缺点,从而影响股票价格的预测精度。近年来,(,宽度学习系统)的提出为预测提供了新的解决方案 ,且实验证明了 采用的随机设置权重训练出的模型已经能达到与深度学习相当的分类准确率,且建模时间远小于深度学习。等 在理论角度证明了在时间序列的预测上,具有良好的函数逼近能力,通过实验证明其在回归性能上

6、优于现有的几种学习算法。综上分析,本文首先尝试将深度学习与宽度学习相结合用于股票价格预测问题,提出了 股票价格预测模型。模型将 模块的输运 筹 与 管 理 年第 卷出特征交于 进行承接处理,以防止模型出现局部最优。进一步地,考虑到股票价格序列的非线性、非平稳特点,引入了时频分析中的 模块,提出了 ()股票复合预测模型。据笔者所知,本文新提出的两类深度、宽度融合的预测模型都是首次应用于股票价格预测中。为了验证本文提出模型的有效性,选取了我国农林牧渔行业股票收盘价作为实例验证。分别选择三个性能指标平均绝对误差()、均方根误差()和决定系数()评估算法性能。首先,证明了三个评价指标上,本文提出的 模

7、型不但在预测精度方面明显优于 ,等基线模型,而且也高于已有的 ,以及 等股票价格预测模型。特别地,当股票数据出现较大波动时,现有的 模型出现了拟合程度差的 现 象,模型则出现了滞后现象,但新提出的 模型即使在数据较大波动时,仍然很好的拟合了真实值,且避免了滞后现象。通 过 对 比 ,与 三个预测模型的预测精度,证明了 在股票收盘价分解上的优势。进一步融合了 模块后,的预测精度与 模型相比进一步提升。特别地,为了验证 在 预测精度方面的提升,将 模型与不融入 的 模型分别对经 分解后的分量的预测结果进行对比。结果表明,分解后的信号仅通过 模型进行预测会存在一定的误差,且越是拐点处,预测误差越明显

8、,越是高频分量,预测误差越大,而 模型中的 模块能够适当解决这类精度问题。在三个评价指标上,相比现有的 这类“分解预测 整合”股票价格模型的预测精度也有相应的提高。同样地,在数据波动较大时,的预测优势与现有模型相比,更为明显。注意到,模型的 与 的值均未超过 ,达到了 。对于股票价格这种受多种因素影响,波动较大的预测问题,本文模型在只考虑单一收盘价历史数据的前提下,能达到这样的预测精度,证明了本文模型的有效性。本文提出的深度 宽度预测模型架构给出了时间序列预测模型架构的新思路,不但可以应用于股票预测,亦可应用于其他序列数据。模型结构本节主要首先回忆了本文模型所需要的一些基本模型原理及结构。接着

9、给出了本文提出的两个新的股票预测模型结构。基本原理及应用 由遗忘门、输入门 和输出门 构成,其数学原理运算公式如式()()所示。()()()()()()()()()()其中 ,分别表示对应单元的权重矩阵,分别表示对应的偏置向量,表示矩阵的 积。在原始信号中加入一组正负相反的白噪声 信 号 来 改变 信 号 的 极值 点 分 布,之 后 进行 分解。分解的步骤如下:()在原始信号中加入符号相反的多组噪声信号,每次加入幅值相同的新噪声(式()、式()。()()()()()()()()其中 ()为原始信号,()为正噪声,()为负噪声。()对()以及()进行 分解,之后得到两组集成的 (,本征模态函数

10、)分量:,。为加入正噪声组集成平均结果,为加入负噪声组集成平均结果。()最终的分解结果为两组 分量的集成平均值。年陈俊龙提出了不需要深度架构的增量学习系统宽度学习系统。提供了很好的泛化能力,若网络需要扩展,网络可以快速重构,无需重新训练过程。用 承接深度模型能有效降低模型的复杂度,一定程度上防止 在训练过程中出现过拟合、滞后的现象。具体运算流程如下:()输入数据 先进行处理(特征提取),把输入数据映射为 个映射节点,记作,。其中,如式()。(),()()把,乘上一组随机权重 再第 期韩 莹,等:结合长短时记忆网络和宽度学习的股票预测新模型研究加上偏置(),激活函数处理后作为增强节点,记作,。其

11、中,如式()。()()()最后把,与,合并,记作 ,输出 。深度和宽度融合的股票预测新模型融合深度和宽度学习的优势,提出了 股票价格预测模型。并进一步引入了 模块 对 股票 序列 进行降 噪 提 升预 测 精度,提出 股票预测模型(其映射原理图见图 ),具体流程如下。首先,在信号分解前采取将数据限定在一定范围内,即归一化处理。归一化的股票收盘价数据投入分解模块,通过 算法将数据分解成多个 分量。其次,将分解得到的序列分别输入 预测模 块 进 行 训 练。分 解 后 的 序 列 分 别 输 入 模块提取出投入分量的简单特征、抽象特征,形成映射节点。再通过 层进行训练,再次提取特征,同时自动生成增

12、强节点,更新权重以及偏置,输出各个分解模块预测结果。最后,不同序列的预测结果求和,得到最终的预测结果。图 模型的映射原理 实验验证 数据准备与预处理本文选取的农林牧渔指数()收盘价数据来 自 于 国 泰 安 数 据 库()。时 间 选 自 年 月 日至 年 月 日,将空缺数据排除,只留交易日数据,共 组数据。设置时间分割点将处理好的数据划分成训练集和测试集,本文选取前 作为训练集,剩下的 作为测试集。为将寻优过程变得平缓,先将数据通过转换函数做归一化处理。其中转换函数如式()。()其中,分别为分量内最大最小值。实验设置对于本文模型所涉及到的参数,首先,不对 模块的参数进行修改,自行分解为最佳分

13、量。其次,模块考虑到 条数据量并不是很大,故选择较小的 (层数),(神经元数目),(批量大小)以及 (迭代次数),相应的,对 (激活函数),(损失函数)以及 (优化器)做出选择。然后 层链接 与 ,其 应与 中 (每个映射特征节点个数)保持一致。最后对于 模块,与 (映射特征个数)的乘积应略大于 (增强节点总个数),另选取较小值作为 (正则化参数)。经反复调参实验,得到如表 所示的模型的所有参数。表 算法的参数 ,本文选择三个性能指标:(式(),(式()和 (式()评估算法性能。(珓()珋)()(珓()()槡()()珓()()珋)()运 筹 与 管 理 年第 卷其中,(),珓(),珋分别表示实

14、际值,预测值和平均值。结果分析 模型的预测结果对比与分析表 给出本文提出的 模型与基线模型 ,模型的预测结果对比。通过表 可以看出,基线模型相比 模型在具体数据的表现上存在明显差距。模型训练速度值得肯定,但是精确度远不及本文模型,且 本身在训练股票这类大规模数据时存在一定缺陷。模型对于处理稳定数据具有一定优势,但股票属于非平稳数据,会受到政策、新闻等因素的影响而波动,所以 模型对收盘价的预测精度比不上本文所提出的 模型。表 与基线模型预测的性能指标对比 图 给出了 模型与现有广泛应用的 模 型、模 型 以 及 模型的预测结果对比图。图 等模型预测值与实际值对比从图中可以明显看出本文提出的 模型

15、在数据的拟合程度上好于现有模型,且明显好于单一的 模型。特别地,当股票数据出现较大波动时(天到 天这一时间段),现有的 模 型 出 现 了 拟 合 程 度 差 的 现 象。而 模型则出现了滞后现象,但新提出的 模型在数据较大波动时,仍然很好的拟合了真实值,且避免了滞后现象。分解模块对比分析为证明本文选取的 分解模块在处理股票收盘价数据时优于 以及 分解模块,针对不同分解方式进行实验对比,实验对比结果如表 给出的性能指标所示,可以得出 分 解 模 块 在 处 理 股 票 收 盘 价 数 据 时 性 能 优 于 模块,更优于 模块。表 不同分解方式模型性能指标对比 模块分析通过前两节的实验分析,模

16、型虽然预测精度已经较高,但通过图 可以看出在 天附近的预测值存在一定误差。为进一步提升模型精度,引入 分解模块。图 给出了收盘价的 分解结果。其中包含高、中、低三部分频率分量(低频 为趋势项)。图 分解图各个分量显示了股民不同频率的波动特征,高频分量波动较大,表征短线炒股现象,中频分量表征受政府政策法规影响下的股市波动,低频分量波动较小,表征股市长期波动趋势,也代表股民投资的整体趋势。模型预测结果对比与分析为验证本文模型更加适应股票收盘价预测,接下来对比 模型与 ()模型对这支股票收盘价的预测结果。图 模型预测值与实际值对比第 期韩 莹,等:结合长短时记忆网络和宽度学习的股票预测新模型研究图

17、模型预测与实际值对比图 、图 分别给出 以及 模型的预测值与实际值对比曲线图。通过两图的对比可以看出 模型在数据的拟合程度上明显好于 模型。尤其是当数据有一个大幅度波动时,只有 模型能够达到一个优异的拟合程度。表 给出了相应评价指标的对比结果。结合表 与前几节中不同模型的数据对比,可以明显地看出,模型的三个评价指标在 模型的基础上有很大提升,相比 以及 等复合模型也有较为显著的提高。表 模型与现有模型性能指标对比 结束语股票价格走势和未来趋势预测一直是亿万投资者关心的重点之一,但现有的单一的深度学习预测模型在预测精度上存在一定的误差,且存在一定的过拟合风险。本文将宽度学习与深度学习中的循环神经

18、网络相结合,提出了两类深度、宽度融合的股票预测模型。通过大量的对比实验验证,证明了在 模块后加入 模块构造的 预测模型,能够解决单一 模型的滞后、拟合差等问题,提高预测的准确性。为进一步提升预测精度,采用 分解模块相比 ,能更好的处理股票数据中的噪声问题,进而提升在极值点附近的预测精度。通过对比一些现有模型,本文构造的 股票收盘价预测模型能较为精准的预测股市的涨跌情况,对股民的投资有一定的参考价值。本文模型只单一考虑了股票收盘价,而未加入其他股票价格因素,亦未考虑政策、舆论等对股票几个的影响。在后续工作中,我们将研究多变量、多因素影响下的深度、宽度融合的股票预测模型。参考文献:吴晓求,方明浩 中 国 资 本 市 场 年:探 索 与 变 革 财贸经济,():,:,:丁文绢 基于股票预测的 模型、模型比较 工业控制计算机,():,():罗鑫,张金林 基于多时间尺度复合深度神经网络的股票价格预测 武汉金融,():乔若羽 基于神经网络的股票预测模型 运筹与管理,():,:,:,:,():,:,():,():运 筹 与 管 理 年第 卷

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服