资源描述
股票的关联规则挖掘2024/5/22 周三1目录nCopula函数n股票相关性网络n协同微粒群nApriori算法2024/5/22 周三2Copula函数n一致性相关系数:度量了两个随机变量的变化一致性或协调性(同时增大或减小)程度。n=P(x1-x2)(y1-y2)0-P(x1-x2)(y1-y2)x1|X2x2:当X2x2时X1x1的概率是否会发生变化,x1,x2相当大时,就是X1和X2的尾部相关性。2024/5/22 周三4Copula函数nCopula函数描述的是变量间的相关性,实际上是一类将联合分布函数与它们各自的边缘分布函数连接在一起的函数。n利用Copula函数可以计算一致性相关系数。2024/5/22 周三5构造股票相关性网络n将每一只股票看作一个节点,股票与股票之间的关联关系看成边;n当股票a 的价格变化影响股票b 的价格变化时,则它们的关联关系是从a 指向b 的。当股票b 的价格变化影响股票a 的价格变化时,则它们的关联关系是从b 指向a 的;n当a 对b 的影响大于b对a 的影响,则认为两只股票的关联关系是从a 指向b,反之则是从b 指向a。2024/5/22 周三6构造股票相关性网络n任意选取两只股票a 和b,则a 股票和b 股票的相关性系数为:其中2024/5/22 周三7构造股票相关性网络根据关键点可以对股票网络进行板块划分2024/5/22 周三8协同微粒群n将粒子编码为影响股票走势的各个相关因素,粒子通过适应度函数来进行更新,并且在更新的过程中保留原来的较优成分进行遗传。2024/5/22 周三9协同微粒群n假设微粒群的节点搜索位置空间的维度为D 维,粒子的编码使用某种属性下的关联股票的属性值。初始化选取m个粒子构成的粒子群,粒子的空间优化问题就是选取属性关联下的符合目标函数的粒子。n空问中第i个粒子的编码就是选取的分析股票下某种属性的属性值,表示为以下的形式Xi=(Xi1,Xi2,Xin),n代表分析股票的总数。2024/5/22 周三10协同微粒群第第i个粒子空个粒子空间更新的速度更新的速度为第第i个粒子个粒子历史最史最优位置位置为整个粒子群整个粒子群历史最史最优位置位置粒子可以根据如下的公式粒子可以根据如下的公式进行速度与位置的更新行速度与位置的更新K 为微粒群中微粒群中优化的迭代次数,化的迭代次数,r 1和和 r2是在区是在区间 0,1上的随机数,上的随机数,这两个随机数能两个随机数能够有效保持微有效保持微粒群粒群优化的多化的多样性。性。C1和和 C2是两个学是两个学习因子,因子,这两个系数可以保两个系数可以保证粒子粒子对全局位置的学全局位置的学习能力。能力。2024/5/22 周三11协同微粒群支持度挖掘粒子群S(i),S(R)分分别表示微粒的支持度与用表示微粒的支持度与用户预先先设置的支持度。置的支持度。cov(A+B)是指两种事件在数据)是指两种事件在数据库中的比例。中的比例。置信度挖掘粒子群2024/5/22 周三12协同微粒群初始化m个粒子支持度微粒群规则度微粒群规则提取更新进入规则微粒群更新符合适应度粒子补充不符合适应度粒子更新能力保持2024/5/22 周三13Apriori算法n依据支持度找出所有频繁项集n依据置信度产生关联规则项集(集(Itemset):同):同时出出现的的项的集合。定的集合。定义为:k-itemset(k项集)。集)。2024/5/22 周三14Apriori算法n首先,找出频繁“1项集”的集合,该集合记作L1。L1用于找频繁“2项集”的集合L2,而L2用于找L3。如此下去,直到不能找到“K项集”。找每个Lk都需要一次数据库扫描。n置信度大于给定最小置信度minConf的关联规则称为频繁关联规则(Frequent Association Rule)。2024/5/22 周三15数据预处理n插值:由于连续交易的时间间隔不同,因此在一个时间段内,甚至可能没有任何的记录。按照给定的时间单元间隔对高频交易数据采样,选择最近的一个价格点填充。n小波分析:股票的价格变动可以看作一个一维离散信号,对于一维离散信号来说,其高频部分影响的是小波分解的第一层细节,其低频部分影响的是小波分解的最深层和低频层。小波降噪的过程,就是把信号分解为多个子信号,通过对小波分解系数的处理去掉其中的噪音部分,然后把余下部分进行合并重构的过程。n使用SYM8小波,对价格信号进行两层分解,对分解得到的分解系数进行Heursure阈值处理。2024/5/22 周三16数据预处理n涨幅z定义如下:若第I时刻成交价为Pi,第I-1时刻成交价为Pi-1,则涨幅z=(Pi -Pi-1)/Pi-1 。同时约定:z 1%时为涨,记为1;z -1%时为跌,记为0。n考虑时滞性:以时间窗口的个数作为事务项。2024/5/22 周三17数据预处理2024/5/22 周三18数据预处理2024/5/22 周三19数据预处理2024/5/22 周三20构造股票相关性网络n利用股票的相关性网络找出关键点并进行板块划分。投资者的盈亏大约80%是来自于买卖时机的选择,还有20%的比例是来自于板块和个股的选择。如果个股所属的板块整体有行情,那么买卖这样的个股盈利可能性更大。2024/5/22 周三21Apriori算法n挖掘关联规则n频繁项集n关联规则2024/5/22 周三22
展开阅读全文