结合长短时记忆网络和宽度学习的股票预测新模型研究.pdf

资源描述

1、第卷第期运筹与管理，年月收稿日期：基金项目：国家自然科学基金资助项目（）；南方海洋科学与工程广东省实验室（珠海）基金项目（）作者简介：韩莹（），女，辽宁沈阳人，副教授，博士，研究方向：大数据处理方法及其应用；陆超（），通讯作者，男，江苏盐城人，副教授，博士，研究方向：实证金融。结合长短时记忆网络和宽度学习的股票预测新模型研究韩莹，张栋，孙凯强，谈昊然，陆超（南京信息工程大学自动化学院，江苏南京；北京交通大学经济管理学院，北京）摘要：长短时记忆网络（）近年来广泛应用于股票预测中，其结构特点易陷入局部最优，从而影响预测精度。借鉴宽度学习系统（）在时间序列预测上良好

2、的逼近能力，本文尝试宽度学习与深度学习相结合。进一步地，针对股票序列不平稳特点，引入互补集成经验模态分解（）进行降噪处理，提出（）股票预测模型。选取农林牧渔行业股票价格，对新提出的模型进行实证研究。通过与基线模型、现有股票预测模型对比，证明了新模型在多个精度指标上都有明显提升。特别地，通过分别将模型与不融入的模型，对分解后的分量预测结果进行对比发现：模型预测存在一定的误差，且越是拐点处，越是高频波动，预测误差越明显。而模型中的模块能够解决这类问题。当数据出现较大波动时，本文提出的新模型与现有模型相比，可以很好的解决拟合差、时滞等问题。关键词：股票预测；互补集成经验模态分解；长短时

3、记忆网络；宽度学习系统中图分类号：文章标识码：文章编号：（）：，（，；，）：，（），（），（），（）（），：；引言股票市场是资本市场的核心组成部分。股票关注的重点之一就是股价的走势和未来趋势预测。股票市场的数据具有非线性、多尺度的特点，传统的金融计量方式存在大量的局限性，等证明深度学习预测的结果优于传统的机器学习。（，循环神经网络）及其扩展模型，如（，长短期记忆网络），（，门控循环单元）等，近年被用于进行股票预测。丁文绢利用模型与模型分别对上证股的历史交易数据进行训练预测比较，得出模型在股票预测精度方面优于模型的结论。等通过对比证明预测模型在股票预测中相比（，支

4、持向量回归）、随机森林和神经网络模型有更高的预测精度。罗鑫和张金林引入（，卷积神经网络）并与相结合，提出多时间尺度模型，改善了对沪深指数涨跌预测的效果。乔若羽分别将，与注意力机制（）机制相结合，并通过对比单一模型证明了注意力机制与深度学习相结合，提高了股票预测的准确性。网络具有的优势使其被广泛用于金融预测，且复合模型相比单一的模型更有优势。但金融序列中的噪声对精确预测有很大挑战。等构建了深度学习复合预测模型，分别将（，经验模态分解），（，集合经验模态分解），（，互补集成经验模态分解），提取抽象、高级特征，并将其用于单步向前股票价格的预

5、测。并得出模型能有效地提高股票指数的收益率预测精度的结论。等提出新的混合算法，构建了与模型，为股票预测提供了更有效的方法。等提出了一种混合模型，将算法、模糊时间分析技术和模型复合。实验结果表示混合算法的每个部分都可以在很大程度上提高预测能力。结构特点造成了其易陷入局部最优、具有时滞性的缺点，从而影响股票价格的预测精度。近年来，（，宽度学习系统）的提出为预测提供了新的解决方案，且实验证明了采用的随机设置权重训练出的模型已经能达到与深度学习相当的分类准确率，且建模时间远小于深度学习。等在理论角度证明了在时间序列的预测上，具有良好的函数逼近能力，通过实验证明其在回归性能上

6、优于现有的几种学习算法。综上分析，本文首先尝试将深度学习与宽度学习相结合用于股票价格预测问题，提出了股票价格预测模型。模型将模块的输运筹与管理年第卷出特征交于进行承接处理，以防止模型出现局部最优。进一步地，考虑到股票价格序列的非线性、非平稳特点，引入了时频分析中的模块，提出了（）股票复合预测模型。据笔者所知，本文新提出的两类深度、宽度融合的预测模型都是首次应用于股票价格预测中。为了验证本文提出模型的有效性，选取了我国农林牧渔行业股票收盘价作为实例验证。分别选择三个性能指标平均绝对误差（）、均方根误差（）和决定系数（）评估算法性能。首先，证明了三个评价指标上，本文提出的模

7、型不但在预测精度方面明显优于，等基线模型，而且也高于已有的，以及等股票价格预测模型。特别地，当股票数据出现较大波动时，现有的模型出现了拟合程度差的现象，模型则出现了滞后现象，但新提出的模型即使在数据较大波动时，仍然很好的拟合了真实值，且避免了滞后现象。通过对比，与三个预测模型的预测精度，证明了在股票收盘价分解上的优势。进一步融合了模块后，的预测精度与模型相比进一步提升。特别地，为了验证在预测精度方面的提升，将模型与不融入的模型分别对经分解后的分量的预测结果进行对比。结果表明，分解后的信号仅通过模型进行预测会存在一定的误差，且越是拐点处，预测误差越明显

8、，越是高频分量，预测误差越大，而模型中的模块能够适当解决这类精度问题。在三个评价指标上，相比现有的这类“分解预测整合”股票价格模型的预测精度也有相应的提高。同样地，在数据波动较大时，的预测优势与现有模型相比，更为明显。注意到，模型的与的值均未超过，达到了。对于股票价格这种受多种因素影响，波动较大的预测问题，本文模型在只考虑单一收盘价历史数据的前提下，能达到这样的预测精度，证明了本文模型的有效性。本文提出的深度宽度预测模型架构给出了时间序列预测模型架构的新思路，不但可以应用于股票预测，亦可应用于其他序列数据。模型结构本节主要首先回忆了本文模型所需要的一些基本模型原理及结构。接着

9、给出了本文提出的两个新的股票预测模型结构。基本原理及应用由遗忘门、输入门和输出门构成，其数学原理运算公式如式（）（）所示。（）（）（）（）（）（）（）（）（）（）其中，分别表示对应单元的权重矩阵，分别表示对应的偏置向量，表示矩阵的积。在原始信号中加入一组正负相反的白噪声信号来改变信号的极值点分布，之后进行分解。分解的步骤如下：（）在原始信号中加入符号相反的多组噪声信号，每次加入幅值相同的新噪声（式（）、式（）。（）（）（）（）（）（）（）（）其中（）为原始信号，（）为正噪声，（）为负噪声。（）对（）以及（）进行分解，之后得到两组集成的（，本征模态函数

10、）分量：，。为加入正噪声组集成平均结果，为加入负噪声组集成平均结果。（）最终的分解结果为两组分量的集成平均值。年陈俊龙提出了不需要深度架构的增量学习系统宽度学习系统。提供了很好的泛化能力，若网络需要扩展，网络可以快速重构，无需重新训练过程。用承接深度模型能有效降低模型的复杂度，一定程度上防止在训练过程中出现过拟合、滞后的现象。具体运算流程如下：（）输入数据先进行处理（特征提取），把输入数据映射为个映射节点，记作，。其中，如式（）。（），（）（）把，乘上一组随机权重再第期韩莹，等：结合长短时记忆网络和宽度学习的股票预测新模型研究加上偏置（），激活函数处理后作为增强节点，记作，。其

11、中，如式（）。（）（）（）最后把，与，合并，记作，输出。深度和宽度融合的股票预测新模型融合深度和宽度学习的优势，提出了股票价格预测模型。并进一步引入了模块对股票序列进行降噪提升预测精度，提出股票预测模型（其映射原理图见图），具体流程如下。首先，在信号分解前采取将数据限定在一定范围内，即归一化处理。归一化的股票收盘价数据投入分解模块，通过算法将数据分解成多个分量。其次，将分解得到的序列分别输入预测模块进行训练。分解后的序列分别输入模块提取出投入分量的简单特征、抽象特征，形成映射节点。再通过层进行训练，再次提取特征，同时自动生成增

12、强节点，更新权重以及偏置，输出各个分解模块预测结果。最后，不同序列的预测结果求和，得到最终的预测结果。图模型的映射原理实验验证数据准备与预处理本文选取的农林牧渔指数（）收盘价数据来自于国泰安数据库（）。时间选自年月日至年月日，将空缺数据排除，只留交易日数据，共组数据。设置时间分割点将处理好的数据划分成训练集和测试集，本文选取前作为训练集，剩下的作为测试集。为将寻优过程变得平缓，先将数据通过转换函数做归一化处理。其中转换函数如式（）。（）其中，分别为分量内最大最小值。实验设置对于本文模型所涉及到的参数，首先，不对模块的参数进行修改，自行分解为最佳分

13、量。其次，模块考虑到条数据量并不是很大，故选择较小的（层数），（神经元数目），（批量大小）以及（迭代次数），相应的，对（激活函数），（损失函数）以及（优化器）做出选择。然后层链接与，其应与中（每个映射特征节点个数）保持一致。最后对于模块，与（映射特征个数）的乘积应略大于（增强节点总个数），另选取较小值作为（正则化参数）。经反复调参实验，得到如表所示的模型的所有参数。表算法的参数，本文选择三个性能指标：（式（），（式（）和（式（）评估算法性能。（珓（）珋）（）（珓（）（）槡（）（）珓（）（）珋）（）运筹与管理年第卷其中，（），珓（），珋分别表示实

14、际值，预测值和平均值。结果分析模型的预测结果对比与分析表给出本文提出的模型与基线模型，模型的预测结果对比。通过表可以看出，基线模型相比模型在具体数据的表现上存在明显差距。模型训练速度值得肯定，但是精确度远不及本文模型，且本身在训练股票这类大规模数据时存在一定缺陷。模型对于处理稳定数据具有一定优势，但股票属于非平稳数据，会受到政策、新闻等因素的影响而波动，所以模型对收盘价的预测精度比不上本文所提出的模型。表与基线模型预测的性能指标对比图给出了模型与现有广泛应用的模型、模型以及模型的预测结果对比图。图等模型预测值与实际值对比从图中可以明显看出本文提出的模型

15、在数据的拟合程度上好于现有模型，且明显好于单一的模型。特别地，当股票数据出现较大波动时（天到天这一时间段），现有的模型出现了拟合程度差的现象。而模型则出现了滞后现象，但新提出的模型在数据较大波动时，仍然很好的拟合了真实值，且避免了滞后现象。分解模块对比分析为证明本文选取的分解模块在处理股票收盘价数据时优于以及分解模块，针对不同分解方式进行实验对比，实验对比结果如表给出的性能指标所示，可以得出分解模块在处理股票收盘价数据时性能优于模块，更优于模块。表不同分解方式模型性能指标对比模块分析通过前两节的实验分析，模

16、型虽然预测精度已经较高，但通过图可以看出在天附近的预测值存在一定误差。为进一步提升模型精度，引入分解模块。图给出了收盘价的分解结果。其中包含高、中、低三部分频率分量（低频为趋势项）。图分解图各个分量显示了股民不同频率的波动特征，高频分量波动较大，表征短线炒股现象，中频分量表征受政府政策法规影响下的股市波动，低频分量波动较小，表征股市长期波动趋势，也代表股民投资的整体趋势。模型预测结果对比与分析为验证本文模型更加适应股票收盘价预测，接下来对比模型与（）模型对这支股票收盘价的预测结果。图模型预测值与实际值对比第期韩莹，等：结合长短时记忆网络和宽度学习的股票预测新模型研究图

17、模型预测与实际值对比图、图分别给出以及模型的预测值与实际值对比曲线图。通过两图的对比可以看出模型在数据的拟合程度上明显好于模型。尤其是当数据有一个大幅度波动时，只有模型能够达到一个优异的拟合程度。表给出了相应评价指标的对比结果。结合表与前几节中不同模型的数据对比，可以明显地看出，模型的三个评价指标在模型的基础上有很大提升，相比以及等复合模型也有较为显著的提高。表模型与现有模型性能指标对比结束语股票价格走势和未来趋势预测一直是亿万投资者关心的重点之一，但现有的单一的深度学习预测模型在预测精度上存在一定的误差，且存在一定的过拟合风险。本文将宽度学习与深度学习中的循环神经

18、网络相结合，提出了两类深度、宽度融合的股票预测模型。通过大量的对比实验验证，证明了在模块后加入模块构造的预测模型，能够解决单一模型的滞后、拟合差等问题，提高预测的准确性。为进一步提升预测精度，采用分解模块相比，能更好的处理股票数据中的噪声问题，进而提升在极值点附近的预测精度。通过对比一些现有模型，本文构造的股票收盘价预测模型能较为精准的预测股市的涨跌情况，对股民的投资有一定的参考价值。本文模型只单一考虑了股票收盘价，而未加入其他股票价格因素，亦未考虑政策、舆论等对股票几个的影响。在后续工作中，我们将研究多变量、多因素影响下的深度、宽度融合的股票预测模型。参考文献：吴晓求，方明浩中国资本市场年：探索与变革财贸经济，（）：，：，：丁文绢基于股票预测的模型、模型比较工业控制计算机，（）：，（）：罗鑫，张金林基于多时间尺度复合深度神经网络的股票价格预测武汉金融，（）：乔若羽基于神经网络的股票预测模型运筹与管理，（）：，：，：，：，（）：，：，（）：，（）：运筹与管理年第卷

展开阅读全文