基于多尺度核自适应滤波的股票收益预测_汤兴恒.pdf

资源描述

1、2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1385-1393ISSN 1001-9081CODEN JYIIDUhttp：/基于多尺度核自适应滤波的股票收益预测汤兴恒1，2，郭强1，2*，徐天慧1，2，张彩明2，3，4（1.山东财经大学计算机科学与技术学院，济南250014；2.山东省数字媒体技术重点实验室（山东财经大学），济南250014；3.山东大学软件学院，济南 250101；4.山东省未来智能金融工程实验室（山东工商学院），山东烟台264005）（通信作者电子邮箱）摘要：在股票市场中，投资者可通过捕捉历史

2、数据中潜在的交易模式实现对股票未来收益的预测，股票收益预测问题的关键在于如何准确地捕捉交易模式，但受公司业绩、金融政策以及国家经济增长等不确定性因素的影响，交易模式往往难以捕捉。针对该问题，提出一种多尺度核自适应滤波（MSKAF）方法，从过去的市场数据中捕捉多尺度交易模式。为刻画股票的多尺度特征，该方法采用平稳小波变换（SWT）得到不同尺度的数据分量，不同尺度的数据分量蕴含着股票价格波动背后潜在的不同交易模式，然后采用核自适应滤波（KAF）方法捕捉不同尺度的交易模式，以预测股票未来收益。实验结果表明，相较于基于两阶段核自适应滤波（TSKAF）的预测模型，所提方法的预测结果的平均绝对误差（MAE

3、）减小了10%，夏普比率增加了8.79%，可见所提方法实现了更好的股票收益预测性能。关键词：股票收益预测；核自适应滤波；交易模式；多元数据依赖；序列学习中图分类号：TP181 文献标志码：AStock return prediction via multi-scale kernel adaptive filteringTANG Xingheng1，2，GUO Qiang1，2*，XU Tianhui1，2，ZHANG Caiming2，3，4（1.School of Computer Science and Technology，Shandong University of Finance a

4、nd Economics，Jinan Shandong 250014，China；2.Shandong Provincial Key Laboratory of Digital Media Technology（Shandong University of Finance and Economics），Jinan Shandong 250014，China；3.School of Software，Shandong University，Jinan Shandong 250101，China；4.Shandong Provincial Laboratory of Future Intellig

5、ence and Financial Engineering（Shandong Technology and Business University），Yantai Shandong 264005，China）Abstract:In stock market，investors can predict the future stock return by capturing the potential trading patterns in historical data.The key issue for predicting stock return is how to find out

6、the trading patterns accurately.However，it is generally difficult to capture them due to the influence of uncertain factors such as corporate performance，financial policies，and national economic growth.To solve this problem，a Multi-Scale Kernel Adaptive Filtering（MSKAF）method was proposed to capture

7、 the multi-scale trading patterns from past market data.In this method，in order to describe the multi-scale features of stocks，Stationary Wavelet Transform（SWT）was employed to obtain data components with different scales.The different trading patterns hidden in stock price fluctuations were containe

8、d in these data components.Then，the Kernel Adaptive Filtering（KAF）was used to capture the trading patterns with different scales to predict the future stock return.Experimental results show that compared with those of the prediction model based on Two-Stage KAF（TSKAF），the Mean Absolute Error（MAE）of

9、the results generated by the proposed method is reduced by 10%，and the Sharpe Ratio（SR）of the results generated by the proposed method is increased by 8.79%，verifying that the proposed method achieves better stock return prediction performance.Key words:stock return prediction;Kernel Adaptive Filter

10、ing(KAF);trading pattern;multivariate data dependence;sequence learning0 引言股票时序预测是指利用股票市场历史数据建立预测模型来捕捉潜在的交易模式，从而为投资者理性投资提供指导。精确稳定的股票时序预测模型能够为投资者制定合理投资策略、规避潜在投资风险提供帮助。然而，股票市场是一个受多种因素影响的复杂非线性动态系统1，这使得根据获取的历史信息对股票时序数据进行预测成为一项非常具有挑战性的任务。目前，众多技术被应用于股票时序数据预测领域，如：差文章编号：1001-9081（2023）05-1385-09DOI：10.1177

11、2/j.issn.1001-9081.2022030401收稿日期：2022-03-30；修回日期：2022-05-18；录用日期：2022-05-30。基金项目：国家自然科学基金资助项目（61873145）；山东省高等学校青创科技支持计划项目（2019KJN045）。作者简介：汤兴恒（1998），男，山东济宁人，硕士研究生，主要研究方向：数据挖掘、时序数据预测；郭强（1979），男，山东淄博人，教授，博士，主要研究方向：数据挖掘、时序数据分析、计算机视觉；徐天慧（1998），女，山东临沂人，硕士研究生，主要研究方向：时序数据异常检测；张彩明（1955），男，山东乳山人，教授，博士，主要研究方

12、向：计算机图形学、计算机视觉、医学影像处理、时序数据分析。第 43 卷计算机应用分整合移动平均自回归2、卡尔曼滤波3、长短期记忆（Long Short-Term Memory，LSTM）神经网络4。这些方法虽然在平均绝对误差（Mean Absolute Error，MAE）和均方误差（Mean Square Error，MSE）等指标方面表现出较好的性能，但投资者在交易活动中往往更加看重投资行为能否获得较高的回报率。针对这一问题，文献 5 中使用核自适应滤波（Kernel Adaptive Filtering，KAF）捕捉股票时序数据中潜在的交易模式，用以预测股票未来收益。实验结果表明，该方法

13、可以比较准确地捕捉潜在的交易模式，取得较高的回报率。然而，股票市场具有高波动性和非平稳性的特点，这为准确捕捉潜在的交易模式增加了难度6。股票时间序列具有多尺度特征，对股票时间序列进行多尺度分解能够将非平稳的时间序列分解成若干个平稳的子序列，且每个子序列具备不同的尺度波动特征7，这便于进一步捕捉股票市场中潜在的多尺度交易模式，能有效增强股票收益预测模型的性能8。受此启发，本文提出了一种基于多尺度核自适应滤波（Multi-Scale Kernel Adaptive Filtering，MSKAF）的股票收益预测方法。为准确刻画股票时间序列的多尺度特征，该方法对股票时序数据利用平稳小波分解得到具有不

14、同尺度特征的子序列，并对各子序列分别使用核自适应滤波方法进行序列学习，以得到不同尺度的波动规律，捕捉潜在的多尺度交易模式。此外，在处理多元时序数据时，为利用股票间的相互依赖关系9，该方法对每只股票的预测不仅依赖于该只股票的交易模式，还会参考其所依赖股票的交易模式，从而进一步增强模型的预测能力。在公开数据集上的实验结果充分说明了本文方法在股票时序未来收益预测问题上的有效性。1 相关工作统计预测模型主要基于统计理论对股票时序数据进行预测。针对金融时序预测问题，Sims 提出了向量自回归（Vector Autoregression，VAR）模型10-11。该模型通过将系统中每一个变量作为所有变量的

15、滞后值函数建模得到，从而将单变量自回归模型推广到由多元变量组成的向量自回归模型。然而，VAR 模型仅能对平稳的时序数据作出比较准确的预测，对于受多种因素影响的非平稳数据，VAR模型的预测性能有所下降，这使它的应用范围受到限制。为此，Engle等12在 VAR 的基础上引入误差修正项，提出了向量误差修正模型（Vector Error Correction Model，VECM）。该模型常被用于具有协整关系的非平稳时间序列建模。上述基于统计模型的预测方法一般采用线性形式建立相应的数学模型对时序数据进行拟合，但股票时序数据受多种因素的影响一般呈非线性形式，这导致该类预测方法难以得到理想的预测结果。此

16、外，统计预测模型在建模过程中依赖于数据满足正态分布和平稳性假设，这对于具有非线性、非平稳、非正态等特征的股票时序数据来说，假设条件难以满足。故统计模型对非线性时序数据的拟合效果较差，这限制了该类方法在股票时序预测领域中的应用。伴随着非线性时序预测问题研究的深入，以支持向量机（Support Vector Machine，SVM）和核自适应滤波为代表的核函数方法在时序预测领域得到广泛使用5，13-14。SVM以结构风险最小化为原则，具有良好的泛化能力，但它的关键参数很难确定，这在很大程度上限制了它的应用范围。核自适应滤波是一种记忆学习和纠错相结合的方法，本质是通过一个线性的自适应滤波算法实现非线

17、性函数映射。该类方法结合了神经网络的普适逼近特性和线性自适应滤波方法的凸优化特性5，能够很好地拟合非线性函数关系，被广泛地应用于时间序列预测领域。核最小均方（Kernel Least Mean Square，KLMS）算法15是一种典型的基于核自适应滤波的时序预测方法，但它在进行时序预测时，计算复杂度会随着样本量的增加而增长。为此，Chen等16提出了量化核最小均方（Quantized Kernel Least Mean Square，QKLMS）算法。该方法通过矢量量化技术压缩输入或特征空间，以抑制高斯核结构的增长，降低模型计算复杂度。此外，文献 17 将矢量量化技术与最近实例质心估计方法相

18、结合，提出了最近实例质心估计核最小均方（Nearest Instance Centroid Estimation Kernel Least Mean Square，NICE-KLMS）算法，在一定程度上解决了核自适应滤波方法随样本数量增加导致的计算复杂度增长的问题，并表现出良好的性能。近年来，基于神经网络的方法因具备优秀的非线性映射能力，在时序预测领域得到了研究人员的广泛关注18-20。基于前馈神经网络的预测方法通过动态调整网络神经元的互连权值来拟合时间序列数据内在的映射关系21，最终能够获得比统计模型更准确的预测结果。但基于前馈神经网络的预测方法并不能反映股票的时序依赖性。为解

19、决这一问题，文献 22 中提出了基于循环神经网络（Recurrent Neural Network，RNN）的股票时序预测方法。RNN可以通过保存并传递上一时刻的状态信息来捕捉时序数据的依赖性。但该模型在训练时会随着隐藏层数量的增加而产生梯度消失或梯度爆炸问题，严重影响预测结果。为此，Hochreiter等23在RNN模型中引入细胞状态和门结构提出了LSTM，较好地缓解了长序列训练过程中的梯度消失和梯度爆炸问题，并在捕捉长期时序依赖方面表现出良好的性能。尽管基于神经网络的预测方法在非线性数据处理方面表现出色，但在训练时通常需要较强的硬件资源和大量的训练数据，并且存在易陷入局部最优解和可解释性较

20、差等缺点，这在一定程度上限制了此类方法在股票时序预测领域的应用。不同于神经网络，核自适应滤波不仅具有较低的计算复杂度和简单的递归更新形式，而且具有较好的可解释性，故本文专注于基于 KAF 的股票时序预测方法。此外，由于股票时序数据具有多尺度特征，因此对它们进行多尺度分解有助于刻画时序数据在不同尺度上的波动规律，捕捉潜在的多尺度交易模式，这对于提升股票预测模型的性能具有重要意义8。鉴于此，本文提出了一种基于多尺度核自适应滤波（MSKAF）的股票收益预测方法。实验结果表明，相较于其他对比方法，本文方法能够获得更高的回报率。2 本文方法股票是具有多尺度特征的时间序列。本文方法首先使用平稳小波变换（

21、Stationary Wavelet Transform，SWT）对股票数据进行多尺度分解，以获得具有不同尺度特征的子序列；在此基础上，对各子序列使用KAF方法进行序列学习，刻画股票时序数据在不同尺度上的波动规律，捕捉潜在的多尺度交易模式；最后，模型借助捕捉到的多尺度交易模式对股票未来收益作出预测，MSKAF模型如图1所示。此外，为应对KAF方法的计算复杂度会随样本量的增加而增长的问题，本1386第 5 期汤兴恒等：基于多尺度核自适应滤波的股票收益预测文采用分段学习策略和矢量量化技术抑制高斯核结构的增长，实现降低模型计算复杂度的目的。2.1多尺度分解传统的小波变换是进行多尺度分解常用的工具，但

22、因其分解过程中存在下采样操作，会使获得的子序列长度缩减为原始序列长度的一半，导致子序列在时间维度上无法与原始序列相对应，不利于模型对时序数据的进一步分析。与传统的小波变换不同，SWT 在对股票时间序列进行多尺度分解时，由于滤波器的延展，可使多尺度分解后的子序列与原始序列长度相同，保留原始序列中的时间维度信息。因此，本文采用SWT对股票时间序列进行多尺度分解。SWT 的多尺度分解过程如图 2所示。给定原始股票时序数据D=yt：t 1，2，n，t 为时间变量，yt R为第 t时刻的收益。SWT分别通过高通滤波器H0和低通滤波器L0对D进行卷积运算得到子序列D0和D1。在此基础上，将滤波器H0和L0

23、进行插值补零得到H1和L1，并利用H1和L1对D1进行分解得到D1和D2。依此类推，经过k阶分解后，可得到最终的高频子序列Dk-1和低频子序列Dk。2.2异常点检测在时序预测过程中，核自适应滤波方法会为每一个新样本创建内核单元，导致计算复杂度会随样本量的增加而增长14。针对上述问题，本文采用文献 24 提出的异常点检测算法对股票时序数据进行异常点检测，并依据异常点对股票时间序列进行分段，通过分段学习策略实现降低模型计算复杂度的目的。如图 3 所示，对于时序数据D=yt：t 1，2，n，图中实线条代表D的数据波动情况，首先根据序列段 y1，y2，yt-1（图 3 中阴影窗

24、口）的概率密度pt-1计算yt的异常得分，然后依据异常得分判断yt是否为异常点。异常得分通过式（1）计算：Score(yt)=-logpt-1(yt)（1）式（1）被称为对数损失分数，表示yt相较于概率密度函数pt-1的预测损失25。当分数Score(yt)时，表示yt为一个异常点，其中为异常点阈值；反之，yt为正常点。2.3多尺度核自适应滤波本文方法对原始股票时序数据进行多尺度分解后，可以获得具有不同尺度波动规律的子序列。在此基础上，对各个子序列采用核自适应滤波方法进行序列学习，以捕捉潜在的多尺度交易模式。令尺度为 s（由于D0中存在较多干扰，故本文不考虑D0）的子序列表示为Ds=yst：t

25、 1，2，n，通过滑动长度为 m 的时间窗口得到一系列序列段xst=yst-m：yst-1，作为第 t时刻的输入向量；将原始股票数据第 t时刻的收益yt作为样本xst的标签值。MSKAF模型利用核自适应滤波捕捉子序列Ds的波动规律，最终学习出潜在的函数fst(xst)，使t时刻的输入样本xst可以预测出其标签值y?st。核自适应滤波算法的递推公式如下：|f0=0 est=yt-fst-1(xst)fst(xst)=fst-1(xst)+estK(xst，)（2）其中：est R称为先验误差；R+是步长因子；K(，)R+是带宽为 R+的 Mercer 核，用来控制映射的平滑

26、程度26。以时间窗口长度m=3为例，首先得到第一个训练样本的输入向量xs1=ys-2：ys0，样本标签为y1，由式（2）即可得出t=1时刻的映射函数fs1(xs1)。接着，滑动该窗口得到第二个训练样本的输入向量xs2=ys-1：ys1，样本标签为y2，可由式（2）得到t=2时刻的映射函数fs2(xs2)。依此类推，最终得到 t时刻的函数fst(xst)，上述过程如图4所示。由fst(xst)的迭代式（2）可以看出，核自适应滤波方法会为每一个新样本都创建一个以xst为中心和est为系数的内核单元，这使得模型在处理较长时序数据时会产生大量的冗余信息，进而导致计算复杂度随着样本数的增加而不断增大。为

28、j：j 1，2，L、Ysi*=ysj：j 1，2，L、Wsi*=esj：j 1，2，L 是yst-1最邻近的字典。如图4所示，在序列学习过图1MSKAF模型示意图Fig.1Schematic diagram of MSKAF model图2多层级平稳小波分解Fig.2Multi-level stationary wavelet decomposition图3异常点检测过程示意图Fig.3Schematic diagram of outlier detection process1387第 43 卷计算机应用程中，只有输入向量xst已知，而它的样本标签yt是需要预测的值，故Csi*、Ysi*和W

29、si*是通过yst-1得到的。在计算过程中，利用Kullback-Leibler散度找到最邻近字典的i*值：i*=argminipYsit-1ln()pYsit-1 pYsit（3）其中：pYsit-1和pYsit分别是Ysi在编入yst-1前后的概率密度函数。式（3）可以量化yst-1为Ysi所提供的信息量，当yst-1不向字典Ysi提供较高信息量时，Kullback-Leibler散度将趋于0，这就意味着概率密度函数pYsit-1和pYsit分布类似。因此，由式（3）得到的字典Ysi将会是yst-1最邻近的字典。2）Score(yt)时，为最邻近字典Csi*添加一个新的内核中心xst，并将

30、yst-1添加到字典Ysi*中，同时更新系数字典Wsi*。上述字典更新过程如下：Csi*=Csi*，xstYsi*=Ysi*，yst-1Wsi*=Wsi*，est不同于文献 16 中的矢量量化策略，本文采用数据分布特征代替输入空间中距离度量作为更新函数结构的标准，提高了最邻近中心的利用效率，使算法计算复杂度有所下降。算法1给出了基于多尺度核自适应滤波的序列学习过程。算法1 基于多尺度核自适应滤波的序列学习算法。输入原始股票时序数据 D，步长因子，核参数，异常点阈值，量化阈值，分解级数k。输出尺度为s时的字典集合：Cs，Ys，Ws。对D进行多尺度分解：SWT(D)D0，D1，Dk对于尺度为s

31、的子序列：字典初始化：Cs1=xs1，Ys1=ys0，Ws1=ys1设置初始字典：Cs=Cs1，Ys=Ys1，Ws=Ws1input samples xst，labels yt，do：i*=argminipYsit-1ln()pYsit-1 pYsit/选择最邻近的字典y?st=j=1LWsi*(j)K(Csi*(j)，xst)/计算滤波输出est=yt-y?st/计算误差if Score(yt)then：Cs|Cs|+1=Csi*，xstYs|Ys|+1=Ysi*，yst-1Ws|Ws|+1=Wsi*，est/创建新的字典Cs=Cs，Cs|Cs|+1Ys=Ys，Ys|Ys|+1Ws=Ws，W

32、s|Ws|+1/更新字典集合else：if minipYsit-1ln(pYsit-1/pYsit)then：j*=argminjxst-Csi*(j)/选择最邻近内核中心Wsi*(j*)=Wsi*(j*)+est/更新最邻近内核中心的参数集合else：Csi*=Csi*，xst/创建新的内核中心Ysi*=Ysi*，yst-1/更新字典Wsi*=Wsi*，est/更新字典endreturn Cs，Ys，Ws该方法需对 n 个样本分别进行处理，时间复杂度为O(N)；对于每一个样本，在计算滤波输出时均需要寻找其最邻近的字典，该子过程的时间复杂度为O(N)；在后续字典存储过程中，还需寻找样本的最邻近

33、内核中心，此子过程的时间复杂度同为O(N)。因此，本文算法的时间复杂度为O(N3)。2.4多元时序数据依赖模型为捕捉不同股票之间的相互依赖关系，提高模型的预测性能，本文将算法1中的模型扩展为多元数据依赖模型。该模型在处理多元时序数据时，设Dstock=Dr：r 1，2，q为 q 只股票时序数据，其中Dr=yt，r：t 1，2，n为第 r只股票时序数据。如图5所示，对于每只股票分别使用算法1进行多尺度序列学习，最终每只股票序列都会由子序列D1和D2分别得到高频字典和低频字典，即：高频字典：Chr=Chi，r：i 1，2，|Chr，Yhr=Yhi，r：i 1，2，|Yhr和Whr=Whi，r

34、：i 1，2，|Whr。低频字典：Clr=Cli，r：i 1，2，|Clr，Ylr=Yli，r：i 1，2，|Ylr和Wlr=Wli，r：i 1，2，|Wlr。本文提出的多元时序数据依赖模型如算法 2所示。在进行股票收益预测任务时，多元时序数据依赖模型的任务是根据输入向量x RM去预测其标签值y?R。如2.3节中，图4股票时间序列采样过程Fig.4Sampling process of stock time series1388第 5 期汤兴恒等：基于多尺度核自适应滤波的股票收益预测首先需要寻找最邻近的高频字典i*h和低频字典i*l，使用如下表达式：i*h=argmini，rpYhi，r

35、t-1ln()pYhi，rt-1 pYhi，rt（6）i*l=argmini，rpYli，rt-1ln()pYli，rt-1 pYli，rt（7）由上述公式可以看出，有多只股票会被同时考虑用于选择最邻近的高频字典和低频字典。在预测阶段时，这些字典会被用于预测y?，如式（8）：y?=w1j=1LWl(j)i*lK()Cl(j)i*l，x+(1-w1)j=1PWh(j)i*hK()Ch(j)i*h，x（8）其中w1的设置如下：w1=11011+e-var-+（9）w1为预测阶段低频字典所占权重；var为训练样本收益日变化率的方差；和为超参数。由式（6）（8）可知，当对第 r 只股票中样本x进行预测

36、时，不仅依赖在该股票时序数据上捕捉的交易模式，还会参考从其他股票中捕捉到的交易模式，为将股票市场间的相互依赖关系融入模型提供了一种有效的方法，能进一步增强模型的预测性能。算法2 多元时序数据依赖模型。输入 x；高频字典，包括Chi，1，Chi，2，Chi，q，Yhi，1，Yhi，2，Yhi，q和Whi，1，Whi，2，Whi，q；低频字典，包括Cli，1，Cli，2，Cli，q；Yli，1，Yli，2，Yli，q；Wli，1，Wli，2，Wli，q；核参数。输出 y?。i*h=argmini，rpYhi，rt-1ln()pYhi，rt-1 pYhi，rt/选择最邻近的高频字典i*l=a

37、rgmini，rpYli，rt-1ln()pYli，rt-1 pYli，rt/选择最邻近的低频字典y?=w1j=1LWl(j)i*lK()Cl(j)i*l，x+(1-w1)j=1PWh(j)i*hK()Ch(j)i*h，x/计算输出return y?3 实验与结果分析在公开数据集上进行实验以验证本文所提出的MSKAF方法在股票市场未来收益预测上的有效性。3.1实验数据本文实验数据来源于公开数据集，该数据集中共包含来自德国（DE）、英国（UK）和美国（US）三个经济体的24只股票（见表1）。本文使用调整后的收盘价计算每日收益27，采用m=10的滑动窗口对2006年1月17日至2016年11月3

38、0日的股票时序数据进行采样，并将获得的10 880组实验数据作为训练集；对2017年1月3日至2018年2月28日的股票收益数据以同种方式进行采样，并将获得的6 720组实验数据作为测试集。此外，该数据集中的股票收益数据是标准化的，所有收益数据的均值估计为0，标准差为1。3.2对比方法及参数设置为评估 MSKAF 的预测性能，将它与以下 6 种常用的时序预测方法进行对比：1）基于神经网络的预测方法4。LSTM 是一种特殊的RNN 模型，可以有效地捕捉时序数据的依赖性并缓解训练过程的梯度消失和梯度爆炸问题，是一种常用的神经网络时序预测方法。2）基于向量自回归模型的预测方法10-11。VAR 是一

39、种经典的多元变量向量自回归模型，可用于多元时序数据预测问题建模。3）基于向量误差修正模型的预测方法12。VECM 在VAR 的基础上增加了误差修正项，常被用于具有协整关系的非平稳时间序列建模。4）基于量化核最小均方算法的预测方法16。QKLMS通过量化操作压缩输入数据，有效地抑制了高斯核结构的增长。5）基于最近实例质心估计核最小均方算法的预测方法17。NICE-KLMS采用矢量量化技术与最近实例质心估计相结合的策略，有效降低了模型的计算复杂度。6）基于核自适应滤波算法的预测方法 TSKAF（Two-Stage KAF）5。该方法采用一种新的矢量量化策略，并将多图5多元时序数据依赖模型Fig.5

40、Multivariate time series data dependence model表1实验过程中使用的股票信息Tab.1Stock information used in experimental process市场DEUKUS股票代码ADSALVDPWDTEHEILINMRKSAPADMAHTBABPCCLIAGSKYVODAALAAPLAMZNCGOOGLMSFTSPYT股票名称Adidas AGAllianz SEDeutsche Post AGDeutsche Telekom AGHeidelberg Cement AGLinde AGMerck KGaASAP AGAdmi

41、ral Group PLCAshtead Group PLCBAE Systems PLCBP PLCCarnival PLCInternational Consolidated Airlines GroupSKY PLCVodafone Group PLCAmerican Airlines Group IncApple IncAmazon IncCitigroup IncAlphabet In-CL AMicrosoft CorpSPDR S&P 500 EtfAT&T1389第 43 卷计算机应用元时序数据相互依赖关系有效地融入模型，表现出了较好的时序预测性能。如表2所示，以上6种对比方法

42、均采用作者公开的源代码以及默认的参数设置。此外，对基于 LSTM 的预测方法，本文采用20个神经元的单隐层结构进行训练，使用Sigmoid函数作为激活函数，并采用Adam算法对模型进行优化。对基于自回归模型的预测方法的参数设置主要参考之前的研究28-29，以保证它们可在测试数据集上获得较好的性能。3.3评价指标本文使用在时序预测领域中最为广泛采用的平均绝对误差（MAE）30、均方误差（MSE）31以及夏普比率（Sharpe Ratio，SR）32作为模型预测性能评价标准。MAE是样本预测值与真实值的绝对平均误差，值越小代表预测结果越接近于真实值，即预测方法的性能越好；MSE是样本预测值与真实值

43、误差平方的均值，用来衡量二者之间的差异程度，值越接近于0代表预测方法的性能越好；SR是风险调整后的收益率指标，用来衡量承担单位风险所获得的超额收益，值越高代表预测方法的性能越好。3.4实验结果与分析表35分别给出了各预测方法实验结果的MAE、MSE以及 SR，每个表格的最后两行都给出了各预测方法的平均性能，且在该指标下用粗体标记最优值。从表 3可以观察到，基于 LSTM 的预测方法实验结果的平均 MAE 值为 0.012，这表明它的预测性能在 MAE 指标上优于其他方法。虽然该方法表现出了最好的性能，但其他对比方法的实验结果也均取得了相对较低的 MAE值。此外，本文方法实验结果平均 MAE 值

44、为 0.018，略高于基于 LSTM的预测方法。虽然MAE可从预测精准度的角度衡量预测方法的性能，但投资者在交易活动中往往更看重投资行为能否获得较高的回报率5。由表 4 可以看出，对比方法都获得了相同的平均 MSE值，这表明在该指标下所有的预测方法都表现出了较好的预测性能。然而，基于LSTM的预测方法在训练时需要较强的硬件资源和大量的训练数据33，并且该类方法的可解释性较差。不同于基于LSTM和自回归模型的预测方法，核自适应滤波是一种基于记忆学习和纠错相结合的方法，故该类预测方法可在未获得完整训练集的情况下即开始模型训练。此外，本文模型在对多元股票时序数据进行预测时，不仅使用在该股票中捕捉的多

45、尺度交易模式，而且会参考其所依赖股票的交易模式来进行预测，从而进一步提升模型的预测能力，为将股票间的相互依赖关系融入预测模型提供了一种有效的方法。表2比较方法的参数设置Tab.2Parameter setting of comparison methods参数时间窗口大小m时间窗口滑动步长step步长带宽量化值质心距离异常点阈值低频序列异常点阈值l高频序列异常点阈值h信息量阈值网络层数L每层神经元数量N最大滞后次数滞后差异数A协整秩I超参数超参数LSTM101120VAR10115VECM10130NICE-KLMS1010.050.50.062QKLMS1010.050.50.4TSKAF1

46、010.050.5100.000 1本文方法1010.050.515100.000 1-6.50.9表3测试阶段各模型的MAE值Tab.3MAE values of different models in test phase股票代码ADSALVDPWDTEHEILINMRKSAPADMAHTBABPCCLIAGSKYVODAALAAPLAMZNCGOOGLMSFTSPYT均值标准差LSTM0.011 00.010 00.061 00.006 30.009 70.007 60.007 10.007 20.008 40.015 10.009 10.007 60.008 10.021 10.032

47、 20.007 10.013 90.008 50.009 40.008 60.007 90.007 60.003 90.008 20.0120.012VAR0.011 50.010 10.060 10.006 50.010 20.007 70.007 30.007 20.008 70.016 20.009 30.007 60.008 50.021 40.032 50.007 40.015 50.008 80.010 10.009 70.008 20.007 80.004 10.008 10.0130.011VECM0.013 60.012 20.071 10.007 30.011 50.009

48、 30.008 70.008 60.010 50.019 60.010 60.0090.010 60.024 60.039 80.008 80.018 10.009 50.011 50.012 30.009 10.009 00.005 00.009 60.0150.014NICE-KLMS0.010 90.010 10.060 80.006 30.009 70.007 50.007 10.007 80.008 30.015 30.008 70.007 70.008 20.021 30.032 30.008 30.014 90.008 60.010 20.009 40.008 20.007 40

49、.003 80.008 10.0130.012QKLMS0.010 90.010 00.060 90.006 30.009 80.007 50.007 10.007 80.008 30.015 20.008 80.007 70.008 20.021 20.032 20.008 10.014 80.008 50.010 00.009 40.008 10.007 50.003 80.008 20.0130.012TSKAF0.013 70.012 20.064 50.014 20.016 10.010 00.011 20.013 00.015 40.021 50.013 40.019 40.015

50、 60.032 20.039 00.016 60.022 80.022 40.023 20.041 70.009 80.010 00.005 70.010 50.0200.013本文方法0.014 00.013 20.064 10.019 00.020 20.011 00.010 30.011 50.012 40.016 80.016 70.010 40.011 20.025 90.034 40.011 30.016 80.026 10.027 10.019 60.011 10.012 10.006 80.011 20.0180.0121390第 5 期汤兴恒等：基于多尺度核自适应滤波的股票收

展开阅读全文