1、Jun.20232023年6 月JOURNAL OF DONGGUAN UNIVERSITY OF TECHNOLOGYVol.30No.3第3 0 卷第3 期学院学报东莞理基于加权马尔可夫链的股票价格预测研究陈梓海黄香香(东莞理工学院计算机科学与技术学院,广东东莞523808)摘要:对股票的预测研究一直是社会的热点问题,而一个合适的模型对于股票的研究至关重要。选用加权马尔可夫链模型,对该模型的状态划分区间做了优化改进,使得该模型能更好地应用于股票的预测研究。通过对招商港口股票的收益率建立加权马尔可夫链模型,并与马尔可夫链模型的相应预测结果进行对比,在状态预测上,加权马尔可夫链的准确率提高了一
2、倍,在平均股价绝对误差上降低了2.0 2%。此外,为说明模型的泛化性,增加了10 只股票3 个日期共3 0 个数据预测股价,其与实际股价在每只股票每个日期下的平均绝对误差为1.6 7%,相比马尔可夫链模型的相应结果降低了0.5 1%,这表明加权马尔可夫链模型对于多种股票的收益率和股价的预测均具有合理性。关键词:加权马尔可夫链;转移概率;收益率的预测;股价的预测中图分类号:F830.91;0 2 11.6 2文献标志码:A文章编号:10 0 9-0 3 12(2 0 2 3)0 3-0 0 0 1-0 8股票作为金融市场的重要组成成分,随着经济社会的快速发展,越来越成为人们进行投资理财和风险规划
3、的一种金融产品与工具,因而,对于股票的分析一直是研究者的热门话题。但是,股票市场是一个数据量庞大且复杂的非线性系统1,过往的数据往往只能代表股票发展的一个可能趋势,这导致股票市场的发展会呈现出较大的随机波动性。现实中的投资者在选择股票时,往往会以股票的历史价格作为一个衡量指标,而股价经常会受到国家政策、国际形势、社会变化以及公司财政情况等诸多不确定性因素的影响,使得当前的股价相比历史价格更能反映股票下一步的变化情况。因此,基于这种特点,研究者给出了一系列关于预测股价的方法,常用的有支持向量机【2-3 ,ARIMA4、神经网络5 、马尔可夫链6-8 、多目标优化9】和Legendre小波法10】
4、等,其中较具代表性的是具备随机性的马尔可夫链。除了在股票的研究上,马尔可夫链也被广泛地应用到其他多个领域的研究中,如降雨量预测 11-15 和客流的预测16 等。在研究过程中,马尔可夫链模型因其具备随机特性,使得实验结果往往会受到某个特定因素的影响。因此,有研究者引人了加权的概念,建立了加权马尔可夫链模型,通过加权的方法能更充分地利用现有的数据,有效降低某个突发因素对实验结果的不确定性影响,并衍生出了多种基于加权马尔可夫链的预测方法(-13.15 。鉴于股票受到非市场因素的影响较大,其股票价格往往具有较大的动性,将加权马尔可夫链模型应用到股票的预测当中具有一定的现实意义。本文应用加权马尔可夫链
5、来预测股票收益率,并进一步计算其股价。同时,在现有文献14和15 的基础上对该模型的状态划分区间进行了优化改进,与马尔可夫链模型的相应预测结果进行了对比分析。最后,我们增加了10 只股票的数据对加权马尔可夫链模型的可行性和泛化性进行进一步的验证,为加权马尔可夫链预测的准确性提供实证依据。实证发现,相比于马尔可夫链模型,加权马尔可夫链模型在多种股票的预测上均具有较高的精度。1加权马尔可夫链理论基础马尔可夫链是基于俄国数学家马尔可夫在1906年提出马尔可夫理论的基础上发展而来的,收稿日期:2 0 2 2-10-14基金项目:国家自然科学基金(118 0 10 7 3);广东省自然科学基金(2 0
6、17 A030310598)。作者简介:陈梓海(1997 一),男,广东汕头人,硕士生,主要从事马尔可夫链的应用研究,Email:2 8 3 17 5 5 93 5 q q.c o m。*通讯作者:黄香香(198 5 一),女,湖南怀化人,讲师,博士,主要从事马氏决策过程和随机博奔研究,Email:h x x 15 5 2 1117 2 7 8 。2023年工学院学报东莞理其最大的特点是“无后效性”16 ,也就是马尔可夫性,即“未来只依赖现在(假设现在已知),而与过去无关”17 O1.1加权马尔可夫链的状态预测对于一个随机序列X,t=0,1,2,3,其中,X,为t时刻系统的状态,其所有取值集合
7、为可数的状态空间S,若对于任意的t=1,2,3,都满足PX,I X,-1,X-2,-,X2,Xi,XoX,1 X,(1)则称序列X为马尔可夫链17 。马尔可夫链在第n时刻k步转移情况下的状态概率向量为T,=s,P(k)(2)其中,t=n-k,=1,2,n,s,为第t时刻的状态概率向量,P(k)表示k步状态转移概率矩阵。令加权马尔可夫链(14】在在第n时刻的状态概率向量为6T=W.T,(3)k=1其中,bn为最大步长,w表示状态概率向量在k步转移情况下的权重,概率向量T中各元素的最大值对应的状态即为预测状态。综上,加权马尔可夫链是对马尔可夫链的改进优化14,它能够利用更多的数据信息来提升预测结果
8、的精度。在马尔可夫链(2)的基础上得到1步到b步转移情况下的状态概率向量,将第n时刻在k步转移情况下的状态概率向量与相应的权重w,相乘,再相加,即得第n时刻的各状态预测概率(3),从而实现加权的目的,其中的最大概率值所对应的状态即为预测状态,1.2加权马尔可夫链的模型建立为了更直观地刻画加权马尔可夫链的建模过程,我们给出了建模流程图,如图1所示。为了更详细地了解加权马尔可夫链的建模过程,下面我们来进行一一分析。1.2.1划分各状态区间状态空间是加权马尔可夫链建模的重要前提,也是后续步骤的基础。根据实际的需求,我们可以将数据集x,i=1,2,n划分到个状态中,即假定状态空间S=1,2,m通过这些
9、状态就可以为数据建立转移频数矩阵和选择股票数据集划分各状态区间建立状态转移频数矩阵建立状态转移概率矩阵不符合马氏性检验符合计算各步状态概率向量计算各步权重预测待测样本的收益率和股价图1加权马尔可夫链建模流程图转移概率矩阵。目前,状态空间的划分方法12 常用的有数据序列约定俗成的分组法、均值-标准差分组法和模糊有序聚类分组法等。1.2.2建立状态转移频数矩阵转移频数是从状态空间中的某一个状态经过k步转换到其它状态的次数。根据状态划分的方法可以为数据集中的每个数据确定一个状态,由这些确定好的状态统计出从状态i经过k步转移到状态j的次数,即频数,记为f(,最终整合成一个矩阵f(h),即f(k)(h)
10、111m()(4),f(k)mlmm称f(k)为k步状态转移频数矩阵。1.2.3建立状态转移概率矩阵k步状态转移概率是指从状态i经过k步转移到状态j的频率,记为P(),用状态转移频数矩阵中的每个元素除以矩阵中该元素所在行的总和即得相应的转移概率。即转移频数与转移概率的关系为=f/Zf,mP(k)(5)由k步状态转移概率构成的矩阵为k步状态转移概率矩阵P(k),即P(h)11P(t)1mP(h)(6)P(k)P(k)mlmm为陈梓海,等:基于加权马尔可夫链的股票价格预测研究第3 期1.2.4马氏性检验加权马尔可夫链模型要求相应的随机过程具备马氏性,所以在运用加权马尔可夫链建模的时候,我们首先需要
11、验证其是否具备马氏性。一般采用卡方统计量进行马氏性检验,用状态转移频数矩阵中每一列的和除以矩阵的总和即得每一列的边际概率p.immmP.(7)1=1k=1由边际概率和转移频数,定义卡方统计量14mmD(1)=2(1)XIn(8)D该卡方统计量服从自由度为(1)的卡方分布,在给定显著性水平时,通过查卡方分布表可得x(m-1))的的值,将其与卡方统计量的观测值进行比较,若xx(m-1)),则认为相应的随机过程具备马氏性。1.2.5权重计算及状态预测加权马尔可夫链引人了加权的概念,而权重的计算涉及到数据的相关关系,我们通过各阶的自相关系数来反应数据之间的相关关系,即n-k(x:-x)(x+-x)/Z
12、(x-),(9)=1其中,x,指某股票第i期的收益率,x为该只股票的平均收益率。由此,就能为k步转移情况下的状态预测概率T赋予权重,其权重W定义为(10)根据(10)算出的权重w和(6)计算出各步转移概率,以待测股票日期的前6 天的状态作为初始的状态概率向量,代回(2)和(3),就能预测出待测股票日期的状态,1.2.6级别特征值和股票收益率为通过预测出来的状态计算股票的收益率,需引人模糊集理论12 的级别特征值,即mh=ipi,(11)i=1P(12)mPk=其中,;为级别特征值中状态i所对应的权重,Pi为处于状态i的概率,也就是向量T的第i个分量,6 为最大概率作用系数,其值通常取2 或者4
13、/16O若预测第n期的状态为i时,则其股票收益率的预测值交,(i)12为U,*h/(i+0.5),h i(i):(13)D;*h/(i-0.5),h i其中,U,和D,分别为状态i所处状态区间的上限和下限。2实例验证2.1股票数据的处理本文实验数据来源于tushare库,选取招商港口(股票代码:0 0 18 7 2.SZ)从2 0 2 2 年1月1日到2 0 2 2 年6 月15 日的股票收盘价作为实验样本,排除节假日等特殊情况,收集到的有效数据共106个,将其中前10 0 个数据作为训练集,后6个作为测试集。为了提高预测的精度,本文采用滚动预测的方法,在保持数据长度不变的情况下,先用前10
14、0 个数据预测出第10 1个数据,然后将预测出的数据加人训练集中,再去预测下一个数据。根据获取数据中的收盘价计算股票的对数收益率,简称收益率,即x;=ln-,i=2,3,4,(14)yi-1其中,x;表示第i期的实际股票收益率,y;和yi-1分别表示第i期和第i1期的实际股票收盘价。为了对整个数据集进行状态分类,我们根据计算出的股票收益率数据集xi,i=1,2,106!,可得平均收益率元为X+x2+x3+x1066=0.0012,(15)106以及标准差s为1061(x;-x)2=0.020 5.(16)S=106以样本均值x为中心,结合样本的标准差s将数据集中的数据划分到5 个状态里,即m=
15、5,故状态空间S=1,2,3,4,5。基于均值-标准差分组法,现有文献16 和17 用五个区间(-,x-ajs),(x-a j s,x-a 2 s),(x-a2s,x+a2s),(x+a s,x+a j s),(x+a j s,+o o)来划分五个状态,其中a1.0,1.5 ,a E0.3,0.6 】。但是,通过对多组股票数据的实验2023年东莞理工学院学报结果发现,该划分方法对于股票收益率的状态分组存在数据堆叠集中的问题,基本集中在第三个区间,导致预测结果不理想,因此,有必要对状态的划分区间作出改进,我们采用一个参数将实数轴分成五个互不相交的区间,即(8 0,xas),(x-a s,x-0.
16、5 a s),(x-0.5 a s,x),(x,x+as),(x+a s,+),0.3,0.6。针对我们的实验数据,本文采用=0.6,正负无穷分别用数据集中的最大值和最小值代替,设x为数据集中的任何一个数据,xmin为数据集中最小的数据,xmax为数据集中最大的数据,具体划分结果见表1。表1股票收益率状态区间状态划分标准划分区间1Xminxx-0.6s-0.0575x-0.01092x-0.6sxx-0.3s-0.0109x-0.00493x-0.3sxx-0.004 9x0.001 24XXx+0.6s0.0012x0.013255+0.65Xmax0.0132x0.0552整理后可得各日期
17、的股票收益率以及状态划分等情况,我们仅列出前10 天和后10 天的数据作为示例,详见表2。表2股票收益率及状态日期收盘价收益率状态日期收盘价收益率状态2022010417.31032022052414.68-0.0196一2022010517.680.021152022052515.430.049.852022010617.18-0.028 712022052615.240.012.412022010717.580.023052022052715.280.002 642022011017.720.0079942022053015.23-0.00332022011117.810.00514202
18、2053115.340.007242022011217.50-0.017 612022060115.510.011 042022011317.47-0.001 732022060215.42-0.005822022011417.17-0.017 312022060615.34-0.005222022011717.12-0.002 932022060715.780.028.3352.2股票模型的建立与应用接下来,我们将为招商港口股票建立加权马尔可夫链模型,首先运用该模型预测股票6 月8日的状态,然后将预测出的状态加人训练集中,再去预测6 月9日的状态,同理,依次求出6 月10日,6 月13 日,
19、6 月14日和6 月15 日的状态,再进一步算出相应的股价,并与实际情况以及马尔可夫链模型的预测结果进行对比分析2.2.1股票收益率的转移概率矩阵由(4)(5)(6)可得6 月8 日对应的一步到五步的频数转移矩阵和概率转移矩阵,即(842 492一2427023345484(61464P(0.296 30.14810.074 20.148 10.33330.181 80.090.90.181 80.363 60.181 80.466 700.133 30.200 00.200 00.160 00.20000.160 00.320 00.160 00.28570.047 6 0.190 50.2
20、85 70.1905(82485024一34一1458337 4(73254P(2)(0.296 30.07410.14810.29630.1852)00.200 00.400 0 0.100 00.300 00.266 70.066 7 0.066 70.266 70.333 30.320 00.120 00.120 00.280 00.160 00.33330.142 880.095 20.23810.190.5(427955012142一5366364(71238P(3)一(0.148 10.074 10.259 20.333 30.185 2)0.555 600.111 10.222
21、20.111 10.266 70.133 30.0667 0.33330.200 00.240 00.240 00.120 0 0.240 00.160 00.333 30.047 60.09520.142.90.3810(824670024342054473563(74343P(4)二0.29630.074 10.14810.22220.2593000.222 20.444 40.333 30.266 70.133 300.333 30.266 70.291 70.125 00.208 30.25000.125 00.33330.190 40.142.90.190 40.1429陈梓海,等:
22、基于加权马尔可夫链的股票价格预测研究第3 期5277)4 01223133553 67 282254P(S)(0.22220.185 20.074.10.25930.25930.444 400.111 10.222 20.222.20.200 00.066 70.200 00.200 00.333 30.217 40.130 40.260 90.304 30.087 00.380 90.095 20.095 20.23810.19052.2.2股票模型的马氏性检验由2.2.1节的k步转移频数和概率矩阵结合(7)和(8),可得边际概率(p.1,P.2,P.3,P.4,P.)=((0.2857,0
23、.1048,0.1428,0.2571,0.2 0 95)及卡方统计量的观测值=60.577 8。当显著性水平=0.05时,通过查卡方分布表可知,Xo.os(16)=2 6.2 96,显然有x0.0s(16)60.5778,即股票的收益率序列具有马氏性。因此,可以用加权马尔可夫链模型进行预测研究。2.2.3预测股票的状态令n=100,b=5,结合(9)和(10),用训练集中的数据计算出x=0.0009,可得6 月8日在k步转移情况下的状态概率向量T的权重,如表3 所示。表3自相关系数rk和权重Wk步长12345KTk0.024 606 9 0.016 101 7 0.100 452 0-0.0
24、10 761 9-0.110 975 0Wk0.093 598 5 0.061 246 9 0.382 096 00.04093580.422122.0把6 月7 日、6 月6 日、6 月2 日、6 月1日和5 月3 1日的股票收益率状态作为一步到五步转移情况下的初始状态概率向量,即(2)中的ss=(0,0,0,0,1),$4=s,=(0,1,0,0,0),S2=s=(0,0,0,1,0),由(2)可得(T,T2,T,T4,T,)T=(0.285.70.047 60.190 50.285 70.190500.200 00.400 00.100 00.300 00.555 600.111 10.
25、22220.111 10.291 70.125 0 0.208 30.250 00.12500.217 40.130 40.260 90.30430.0870结合(3),可得6 月8 日各状态的预测概率T=(p1,P2,P3,P4,Ps)=(0.342 7,0.076 9,0.2034,0.256 5,0.120 5)最大值是0.3 42 7,其对应的状态为1,则预测2022年6 月8 日的状态为1。同理可得其它五个日期的预测情况,为了结果的可分析性,我们同时给出了马尔可夫链模型下的相应结果,详见表4表4马尔可夫链与加权马尔可夫链状态预测情况实际马尔可夫链加权马尔可夫链日期状态预测状态预测情况
26、预测状态预测情况2022-06-08141V2022-06-091412022-06-103412022-06-131412022-06-144412022-06-15444从预测的结果来看,马尔可夫链的预测状态全为4,其中预测正确的有2 个,而加权马尔可夫链预测出的状态只有2 个出错,相比马尔可夫链的预测结果,其准确率有了较大的提高,这表明加权马尔可夫链在运用更多的信息进行预测时表现出更大的优势2.2.4股票价格的预测与分析根据预测出来的状态,取=4,结合(11),(12)和(13)可预测股票的收益率,不妨记第i期收益率的预测值为。由于股票的收益率存在零的情况,使得计算收益率的预测值与实际值
27、的相对误差进行结果分析时存在无法分析的情况,但可以由(14)基于(13)预测出来的收益率;进一步计算其相应的股价,为yi=yie,i=101,102,10 6.(17)则第i期的预测股价与实际股价y的相对误差为8;二(18)分别针对马尔可夫链和加权马尔可夫链,可由(17)和(18)得出预测股价和相对误差,详见表5 和表6。由表5 可知,加权马尔可夫链模型的股价相表5加权马尔可夫链的预测情况级别预测预测实际股价相对日期特征值收益率股价股价误差/%2022-06-081.86072-0.013515.5715.520.322022-06-091.52177-0.011 115.4015.340.3
28、92022-06-102.258.58-0.016415.1515.28-0.852022-06-132.057 46-0.015 014.9215.08-1.062022-06-142.468.59-0.018 014.6615.15-3.302022-06-153.212.830.001 114.6715.31-4.18620233年工学院学报东莞理表6马尔可夫链的预测情况级别预测预测实际股价相对日期特征值收益率股价股价误差/%2022-06-082.747180.000 9115.7915.521.772022-06-093.632.360.001 2115.8115.343.09202
29、2-06-103.746 290.0012415.8315.283.622022-06-133.822.870.001 2715.8515.085.132022-06-143.874140.0012915.8715.154.782022-06-153.908 810.0013015.8915.313.82对误差在(-4.18%,0.3 2%)之间,平均股价绝对误差为1.6 8%,而状态预测出错的两个日期,其平均股价绝对误差大于2%,这表明在总体上状态的预测和股价的预测情况是同步的,但最后一个日期在状态预测正确的情况下其股价相对误差的绝对值是最大的,且股价绝对误差随着日期的推移而不断地增大,这在
30、一定程度上说明加权马尔可夫链模型比较适合于预测近期的数据,而在预测较长日期的数据时可能会存在较大的偏差,这与股票的价格受随机因素的影响较大有关,离现在越久的未来,其不确定性的因素越多,因而越难用我们的模型来进行准确的预测。由表6可知,非加权的马尔可夫链模型的股价相对误差在(1.7 7%,5.13%)之间,平均股价绝对误差为3.7 0%。相比于普通的马尔可夫链模型,加权马尔可夫链模型在除了最后一个日期外,每一期的股价绝对误差都小于相应的马尔可夫链模型,且其平均绝对误差比相应的马尔可夫链模型少2.02%。同时,加权马尔可夫链模型的预测股价与实际股价的涨跌情况基本保持一致,说明加权马尔可夫链模型对于
31、股价及其拐点的预测准确率都较高。2.3扩展实验为了说明加权马尔可夫链模型的可泛化性以及实验结果的可分析性,同时针对马尔可夫链和加权马尔可夫链这两种模型,进一步选取与招商港口日期一致、数据量相同的10 只股票数据进行股价预测结果分析。由于数据太多,我们仅列出前3 天的预测情况,如表7 和表8。表7加权马尔可夫链模型扩展实验预测情况日期2022-06-082022-06-092022-06-10平均绝对预测预测股价实际股价相对误差预测股价实际股价相对误差预测股价实际股价相对误差误差/%股票/%/%/%1陆家嘴10.7710.700.6510.9010.592.9311.0210.613.862.4
32、82中船防务16.2216.35-0.8016.2616.20.3716.3116.32-0.060.413平安银行14.3214.161.1314.0114.35-2.3713.9414.32-2.652.054中通客车14.2215.02-5.3614.8016.00-7.4715.4215.80-2.425.085老凤祥39.6639.580.2139.2639.42-0.3939.3339.92-1.470.696豫园股份9.689.78-0.989.699.640.499.699.72-0.290.597大众公用3.243.26-0.493.253.240.263.253.28-0.
33、840.538南玻A6.286.33-0.796.226.180.656.156.32-2.691.389万业企业17.3917.76-2.0817.1617.27-0.6616.8917.53-3.682.1410爱建集团6.136.100.436.106.090.145.996.20-3.351.31表8马尔可夫链模型扩展实验预测情况日期2022-06-082022-06-092022-06-10平均绝对预测相对误差相对误差相对误差预测股价实际股价预测股价实际股价预测股价实际股价误差/%股票/%/%/%1陆家嘴10.7710.700.6910.8910.592.8911.0210.613.
34、862.482中船防务16.2816.35-0.4316.0016.2-1.2315.7616.32-3.431.703平安银行13.9014.16-1.8413.7114.35-4.4613.5414.32-5.453.924中通客车14.2115.02-5.3714.8016.00-7.5015.4115.80-2.465.115老凤祥39.6739.580.2239.7239.420.7639.7839.92-0.360.456豫园股份9.689.78-0.979.519.64-1.409.519.72-2.171.517大众公用3.243.26-0.493.253.240.263.25
35、3.28-0.840.538南玻A6.416.331.266.436.184.056.466.322.222.519万业企业17.3317.76-2.4017.0717.27-1.1816.8217.534.062.5510爱建集团6.076.10-0.436.126.090.466.066.20-2.321.07由表7 可知,在加权马尔可夫链的扩展实验中,相对误差的取值在区间(-7.47%,3.8 6%)内,其中绝对误差大于3%的数据有5 个,占比16.67%;绝对误差小于1%的数据有17 个,占比5 6.6 7%;所有股票在3 个日期内的平均绝对误差的取值在区间(0.41%,5.0 8%)
36、内,10 只陈梓海,等:基于加权马尔可夫链的股票价格预测研究第3 期股票的平均绝对误差的平均值为1.6 7%。由表8可知,在马尔可夫链的扩展实验中,相对误差的取值在区间(-7.5 0%,4.0 5%)内,其中绝对误差大于3%的数据有8 个,占比2 6.6 7%;绝对误差小于1%的数据有11个,占比3 6.6 7%;所有股票在3 个日期内的平均绝对误差取值在区间(0.45%,5.11%)内,10 只股票的平均绝对误差的平均值为2.18%。同日期的同只股票在加权马尔可夫链模型预测下的股价绝对误差不大于相应的马尔可夫链模型占比8 3.3 3%,且10 只股票的平均绝对误差的平均值降低了0.5 1%,
37、这表明加权马尔可夫链的预测结果更加理想,具备更强的泛化能力,能够较好地应用到其它多种股票数据的预测中。为了更直观地反应加权马尔可夫链和非加权马尔可夫链模型在预测结果上的差异,我们以10 只股票在6 月10 日的相对误差和6 月8日到6 月10 日这3 天的平均绝对误差为例,给出了相关的折线图,分别见图2 和图3。6.00%(3.86%)4.00%2.00%0.00%9(-3.68%)-2.00%-4.00%3(-5.45%)-6.00%加权6 月10 日非加权6 月10 日图210只股票的相对误差6.00%5.00%4.00%3.00%102.00%51.00%0.00%加权平均绝对误差非加权
38、平均绝对误差图310只股票的平均绝对误差由图2 可知,通过加权马尔可夫链模型预测的第9只股票的股价相对误差取到了10 只股票中的最低点,为-3.6 8%;而通过马尔可夫链模型预测的第3 只股票的股价相对误差取到了10 只股票中的最低点,为-5.45%,两种模型预测的股价相对误差均在第1只股票达到了最大值,为3.86%。相比于非加权马尔可夫链模型,加权马尔可夫链模型的10 只股票在6 月10 日的相对误差变化幅度更小,同时加权马尔可夫链模型的相对误差在(-2%,2%)之间的有4只,而相应的马尔可夫链模型仅有2 只,表明加权马尔可夫链的预测结果其误差相对更小。由图3 可知,除了第5 和第10 只股
39、票以外,加权马尔可夫链模型在其他8 只股票的预测中,其平均绝对误差都不大于相应的非加权马尔可夫链模型。总体来说,加权马尔可夫链模型在股票预测结果上具有更高的精度,也表明该模型能够更好地帮助股民进行多只股票价格的预测3总结与展望本文通过建立加权马尔可夫链模型对股票的收益率和股价进行预测研究,在与马尔可夫链模型的对比中可知,加权马尔可夫链模型对于预测状态的准确率有了较大的提高,这为加权马尔可夫链继续应用于股票的预测提供了实测依据,也证明了加权马尔可夫链在股票研究方面的价值。同时,通过预测出来的状态计算出的股价,其平均绝对误差明显小于相应的非加权马尔可夫链模型。此外,扩展实验中的结果进一步表明了加权
40、马尔可夫链模型的泛化能力更强,在多种股票价格的预测上均优于非加权的马尔可夫链。但在预测更远日期的结果上表现不佳,其预测结果的精度还有进一步提升的空间,这将是我们下一步工82023年东莞理工学院学报作的方向,希望能在更大的数据集上实现更准确的预测。参考文献1刘致谦.基于马尔可夫链的股票价格波动预测J.合作经济与科技,2 0 2 1,3 7(2 4):6 4-6 7.2王冰玉,刘勇军.基于模糊近似支持向量回归的股价预测研究J.计算机技术与发展,2 0 2 1,3 1(3):14-2 0.3张晓芳,钱蕊.基于支持向量机的股价预测研究J.洛阳师范学院学报,2 0 2 2,41(5):2 2-2 6.4
41、黄诗敏.基于ARIMA模型的股价分析与预测以招商银行为例J.中小企业管理与科技,2 0 2 2,3 1(11):18 4-18 7.5XUE Y,WANG W H,MIAO C.Research on financial assets transaction prediction model based on Istm neural networkJ.Neural Computingand Applications,2021,33(1):257-270.6楚霹.马氏决策规划在股票价格预测中的应用D.成都:成都理工大学,2 0 0 8.7邹杨,朱芸.马氏环境下的股市大盘指数预测模型J.湘潭大学自
42、然科学学报,2 0 13,3 5(2):12 3-12 6.8李嵩松,惠晓峰.含马氏链的股票指数模糊随机预测模型J.哈尔滨工程大学学报,2 0 11,3 2(8):10 8 6-10 90.9张松松,万宇晴,袁华强.基于多目标优化的股市趋势追踪交易策略J.东莞理工学院学报,2 0 2 2,2 9(1):6 7-7 6.10李钰,吕会影.基于改进的Legendre小波方法的期权定价J.东莞理工学院学报,2 0 2 2,2 9(1):13-2 3.11孙才志,张戈,林学钰.加权马尔可夫模型在降水丰枯状况预测中的应用J.系统工程理论与实践,2 0 0 3,2 3(4):10 0-10 5.12苗正伟
43、,徐利岗.基于隶属度修正的加权马尔可夫链的降水预测J.长江科学院院报,2 0 18,3 5(1):40-46.13宋帆,杨晓华,武翡翡,等.基于聚类分析的模糊马尔科夫链在降雨量预测中的应用J.节水灌溉,2 0 18,43(10):3 3-3 6+41.14张伟.基于马尔可夫链的郑州地区降雨量预测研究D.郑州:华北水利水电大学,2 0 19.15周安琪,高松,喻丹.加权马尔可夫链阶数对湖北省年降雨量预测精度的影响研究J.水资源开发与管理,2 0 2 2,8(5):6 4-7 1+7 6.16徐熠明,赵寿为.改良马尔可夫模型在节假日客流预测中的应用J.软件导刊,2 0 2 1,2 0(9):17
44、4-17 9.17李航.统计学习方法M.北京:清华大学出版社,2 0 19.Research on Forecasting Stock Price Basedon Weighted Markov ChainCHENZihaiHUANGXiangxiang(School of Computer Science and Technology,Dongguan University of Technology,Dongguan 523808,China)Abstract The research of stock prediction has been a hot issue in the soci
45、ety,and a suitable model is very important for theresearch of stock.This paper selects the weighted Markov chain in which the state partition interval of the model is optimized tomake the model better applied in forecasting stock.By establishing a weighted Markov chain model for the return rate of C
46、hina Mer-chants Port stock,and comparing the corresponding prediction results with those of the Markov chain model,the accuracy of theweighted Markov chain is doubled in the state prediction,and the absolute error of the average stock price is reduced by 2.02%.Inaddition,in order to illustrate the g
47、eneralization of the model,we add 30 data of 10 stocks in 3 days to predict the stock price,andthe average absolute error between the actual stock price and the predict stock price in each day is 1.67%,which is 0.51%lowerthan the corresponding results of the Markov chain.This shows that the weighted Markov chain model is reasonable for the predictionof the rate of return and stock price of various stocks.Key wordss weighted Markov chain;transition probability;prediction of the rate of return;prediction of the stock price