1、云南民族大学学报(自然科学版),():收稿日期:基金项目:湖北省重点研究项目();湖北省中央引导地方科技发展专项()作者简介:邹旺(),男,硕士 主要从事机器学习、自然语言处理研究通信作者:张吴波(),男,硕士,副教授 主要从事人工智能、机器学习、大数据挖据研究基于混合神经网络模型的卷烟投放预测方法邹旺,张吴波,马勋政,(湖北汽车工业学院,电气与信息工程学院,湖北 十堰 ;武汉科技大学,计算机科学与技术学院,湖北 武汉 ;湖北省烟草公司十堰市公司,湖北 十堰 )摘要:为科学制定卷烟产品的投放策略,提出 种基于混合神经网络模型的卷烟投放预测方法通过结合 多元预测模型、产品销售量至投放值计算以及
2、多分类模型 种方法来实现卷烟产品不同档位的投放策略的生成 以湖北省十堰市的卷烟产品历史销售数据为实验对象,对所提的方法进行验证 实验结果表明,该方法的产品销售量预测平均准确率达到了 ,投放策略生成的平均绝对误差均低于 关键词:多元预测模型;多分类模型;平均绝对误差中图分类号:文献标志码:文章编号:()烟草部门落实国家“总量控制,稍紧平衡”的方针,为了更好的消化社会库存,促进市场良性发展,在每轮投放中都会根据卷烟规格和不同档位的零售户来制定具体的投放策略 由于卷烟品种繁多,投放策略需要每轮重新制定,任务繁重,同时存在主观情感等局限性,难以实现大规模的准确计算 建立科学的卷烟投放预测模型有利于烟草
3、专卖局对资源合理的利用和产品精确的投放,有利于推进精细化管理目前卷烟投放预测技术的研究主要包括传统方法和机器学习方法 传统方法是应用概率统计学和计量经济学的思想,建立概率模型或多组线性函数去拟合并预测卷烟历史销售数据 王伟民等 提出种基于灰色马尔科夫模型的卷烟需求预测方法,并在 年的全国卷烟销量数据集上验证该模型的准确性 王诗豪等 集成差分自回归移动平均模型()、向量自回归模型()、支持向量回归()以及习惯消费下的卷烟需求模型来实现卷烟需求的预测 随着机器学习算法的广受瞩目,不少研究者逐渐将其引入到卷烟销量预测的任务中 武牧等 提出 种线性模型整合支持向量机()的卷烟销量预测方法,该模型相比
4、模型的误差率降低 为了进一步提升学习器的性能,研究者考虑将单个学习器融合向集成学习方向发展 目前,集成学习按照优化方向可以分为用于减少方差的装袋算法()、用于减少偏差的提升算法()、用于提升准确率的堆叠算法()大类 韩伟民等 提出 种极端梯度提升()的卷烟创新产品的工商交易预测 机器学习方法中的深度学习算法的适用性更广、精度较优 在卷烟销量预测中广泛使用有门控神经网络特点的长短期记忆网络()和循环门控单元()模型 邓超等 提出 种基于 和 神经网络模型的卷烟智能投放模型,该模型能实现产品销量的预测和卷烟产品投放策略的生成 相关技术 神经网络 作为 的改进优化模型,拥有更少的参数和简单的结构 只
5、包含更新门、重置门两种门控结构,更新门负责对信息的筛选和存储;重置门负责对上一节点状态选择性遗忘 内部结构如图 所示tXt1hrh1+thtanhEEF4z图 结构图其中,表示当前节点的输入;表示上一节点的隐藏状态;为重置门;为更新门;为候选隐藏状态;表示传递给下一节点的隐藏状态 内部计算如式()()所示 (,)()(,)()(,)()()()其中:表示 激活函数;为激活函数;表示两个向量相连接;为权重矩阵;为偏置项 模型 算法的思想是将多个基学习器串联组合,通过不断的调整样本权重来训练每个基学习器,然后计算每个基学习器的权重值,待所有基学习器训练完成后,按相应的权重值线性组合所有基学习器得到
6、一个整体模型,以此来提升模型的性能 更新样本权重的目的是使本轮预测错误的样本在下一轮训练中得到更大的权重,受到更多的重视 权重值用于评估每个基学习器的重要性,基学习器预测越准确在整体模型中的权重越大3KF1F2FnF13KGRU1A(1F1F3M3F23KGRU2A(2F2Fn3KGRUnA(nFnAK.图 模型结构 模型的结构如图 所示,在 模型中采用多个 模型作为基学习器 首先对训练集分配初始样本权重值,将带样本权重值 训练集输入到 模型中进行训练 然后采用测试集进行模型的预测,计算预测的误差率并以此来更新样本权重 和计算当前基学习器的权重值 最后采用带样本权重值 训练集训练第二个基学习器
7、,依次串联的训练所有的基学习器 卷烟产品投放策略生成模型产品投放策略生成模型如图 所示 为精确的预测投放值序列(即下一年 轮投放值组成的序列),卷烟产投放策略生成模型采用 种不同的方法来计算投放值 第 种方法首先采用多元预测模型得到产品销售量序列,然后通过销售量与投放值之间的关系来计算投放值序列 ;第 种方法直接采用多元预测模型来计算投放值序列 ;第 种方法采用多分类模型进行海量数据的训练并预测投放值序列 ,最后选择 种序列中误差值最小的序列为最终序列 数据处理数据处理将历史销售数据处理为模型所需的输入数据,历史销量数据为 卷烟产品的所有零售户的订购信息,其中包括时间、档位、投放值、订购量(销
8、售量)、定足率、订单满足率共 条信息 首先将数据按不同的档位划分为 份数据,该数据可以用于训练 多分类模型 然后在档位划分的基础之上按时间进一步处理,得到数据包括总户数、订购户数、销售量(累加)、投放值、定足率(均值)、订单满足率(均值)、订云南民族大学学报(自然科学版)第 卷GRU1)1()3Boosting-GRUMJF+,)AJ3)2(K2)2100E图 卷烟产品投放策略生成模型购率(计算)其中定足率、订单满足率、订购率的计算方法如下:定足率 (订购量 投放量)订单满足率 (客户订购量 客户需求量)订购率 (订购户数 总户数)最后将数据进行监督学习处理来用于训练 多元预测模型 多元预测模
9、型原理采用神经网络模型进行序列预测前需要对数据进行监督学习处理 ,设定一定长度的“回溯”值 例如,投放值序列为 ,回溯值设置为 ,则预测模型训练数据为 ,、,;回溯值设置为 ,则预测模型训练数据为 ,、,即采用前回溯个数据 来预测后一个数据 多元预测是将每一行的总户数、订购户数、销售量、投放值、定足率、订单满足率、订购率采用归一化处理至 之间,然后将 作为数据 为标签输入 模型进行训练,通过 模型捕捉这 种数据之间的关系和各自数据随时间变化的前后联系,算法能降低 模型预测的偏差,模型输出的结果为产品销售量序列和投放值序列烟草行业常规的投放策略主要按“档位”来制定 例如 产品卷烟在第挡位投放条,
10、第档位投放条,则属于 挡位的零售户订购上限为 条,属于 档位的零售户订购上限为 条,依次类推 由此来计算投放值的估值,第 档位零售户下一轮关于 产品销售量 和投放值 之间的计算公式如下:(总户数 订购率),()其中,销售量 通过模型预测得到;总户数为第 档位零售户数量;订购率为第 档位的订购率由于投放值只能为整数,采用公式计算和模型预测的投放值会存在小数的问题,模型采用四舍五入函数进行取整 多分类模型原理多分类模型采用有监督的学习方式,数据集为同档位内的零售户所有信息,将投放值作为标签 ,其它相关数据为 首先统计投放值有多少类值来确定模型属于几分类任务,如果投放值设置为 那么模型设置为 分类
11、然后将数据转化为计算机便于计算的形式,即 数据归一化至 之间,标签 数据采用独立热编码表示 最后将(,)输入到 模型中进行训练,模型会根据标签 来挖掘 数据之间的关联,并通过全连接层和 层计算投放值类别的概率 由于模型在测试集上预测的不确定性,同时还需要对预测的结果进行筛选来确定最适合该时间段的投放值,筛选原则在某时间段预测结果类别数量最多则为该时间的投放值 实验验证 数据集实验的数据来源湖北省烟草公司十堰公司 年 月 日至 年 月 日的 万条历史销售数据,为实现对具体产品不同档位零售户的投放预测,选取 万条红金龙软装精品为实验对象 对实验数据按照档位处理得到 份平均 万条的历史销售数据,卷烟
12、产品按周投放,不包括假期每年共 轮投放,按照时间段处理得到 条累计数据 采用 年时间段内的数据为训练集,年时间段内的数据为测试集,在 年数据上验证投放策略生成模型的性能 卷烟产品投放策略生成模型的各部分输入输出和数据集划分如表 、表 所示第 期邹旺,张吴波,马勋政:基于混合神经网络模型的卷烟投放预测方法表 模型各部分的输入输出方法输入输出多元预测模型总 户 数、订 购 户数、销售量、投放值、定足率、订单满足率、订购率销售量序列、投放值序列 多分类模型订购 量、定 足 率、订 单 满 足 率、投放值投放值序列 销售量至投放值销售 量、总 户 数、订购户数投放值序列 表 模型各部分的数据集划分模型
13、训练集测试集多元预测模型 条 条多分类模型平均 万条平均 万条表 各种预测方法的平均准确率对比预测方法平均准确率 实验设置及评价指标实验在 上进行,为 ()(),为 ,编程语言为 ,深度学习框架为 和 实验中模型的的参数设置:中隐藏单元数为 ;算法中 模型的个数为 ;迭代次数为 次;批次大小设置为 ;学习率为 ;优化器 ;为防止过拟合 设置为 ;预测模型的损失函数为均方根误差;分类模型的损失函数为交叉熵代价函数实验选用准确率和平均绝对误差()作为投放策略生成模型的衡量指标,其计算过程如下式()()所示准确率 实际销售量 预测销售量()预测销售量 ()()其中,为预测序列的长度 ;表示实际序列值
14、;表示预测的序列值 销售量预测销售量预测通过多元预测模型来实现,为了验证 多元预测模型的准确性,实验同时采用支持向量回归()、逻辑回归()、决策树()、随机森林()、季节性差分回归移动平均模型()、神经网络模型共 种回归预测方法作为对比 计算几种方法在 档位零售户的历史销售数据上预测销售量的准确率并取平均值,各种方法预测的平均准确率对比如下表 所示 为便于直观的观测模型预测的性能,列举多元预测模型在 档、档和 档零售户上红金龙软装精品卷烟 年的销售量预测如下图 所示图 多元预测模型的预测对比由表 可知,模型在不同档位数据上的预测相比其它预测方法预测效果更优,平均预测准确率达到 ,对比另外 种预
15、测方法的平均准确率最低提升 ,最高提升 由图 观测可知,在列举的 档、档和 档零售户档位上预测的效果均为:,神经网络的预测结果要优于传统预测模型,而结合 算法的神经网络模型能通过不断调整样本权重来降低预测结果的误差,从而提高整体模型的预测能力 投放策略生成模型验证卷烟产品投放策略生成模型在十堰市 年红金龙软装精品的 档位零售户的历史销售数据上云南民族大学学报(自然科学版)第 卷进行验证,通过观测模型销售量预测值以及投放值序列的平均绝对误差来验证模型的性能,实验结果如下表所示 为便于直观的观测投放策略生成模型性能,同时列举模型在 档、档和 档零售户上红金龙软装精品卷烟 年的投放策略生成效果,如下
16、图 所示表 投放策略生成模型验证档位实际销量 条预测销量 条平均绝对误差 投放值序列 投放值序列 投放值序列 最终序列档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 档 注:实际销售量、预测销售量为 年该产品的总销售量;投放值序列为预测 年 轮的序列图 投放策略生成模型预测效果由表 对比计算可知,实际销量和预测的销量的差值均在 条以内 通过对比各投放值序列的误差,最终序列的平均绝对误差均低于 分析原因,最终序列是选择 种投放值序列误差最小的序列,因此最终序列更符合卷烟产品的投放策略 由图 观测可知,投放策略生成模型分别采用 种
17、不同的方法计算投放值序列,在 档和 档零售户数据上预测效果,投放值序列 要优于投放值序列 和投放值序列 ,模型最第 期邹旺,张吴波,马勋政:基于混合神经网络模型的卷烟投放预测方法终会选择投放值序列 作为最终投放策略;在 档零售户数据集上预测的效果,投放值序列 优于投放值序列 和投放值序列 ,即模型最终会选择投放值序列 作为最终投放策略 结语为科学制定卷烟产品投放策略,结合 神经网络模型和 集成学习算法各自的优点,提出一种混合神经网络模型的卷烟投放预测方法 该模型采用 多元预测模型、产品销量至投放值计算以及 多分类模型 种方法来分别计算卷烟产品投放值序列,并选择误差最小为最终的投放值序列在湖北省
18、十堰市卷烟产品的历史销售数据上进行实验,实验结果表明,该模型能很好的完成卷烟投放策略生成任务参考文献:王伟民,汪禨,张国安 基于灰色马尔科夫模型的全国卷烟需求预测研究 中国烟草学报,():王诗豪,张晓妮,张云,等 铜川市卷烟需求集成预测 中国烟草学报,():武牧,林慧苹,李素科,等 一种基于支持向量机的卷烟销量预测方法 烟草科技,():,():,():,():韩伟民,杨应广 卷烟创新产品工商交易预测研究 中国烟草学报,():,:,():,():邓超,刘颂,王露笛,等 基于深度神经网络的卷烟智能投放模型构建方法 烟草科技,():张文生,于廷照 算法理论与应用研究 中国科学技术大学学报,():左亚尧,王铭锋,洪嘉伟,等 一种基于集成学习的多元时间序列预测方法 小型微型计算机系统,():,(,;,;,):,:,:;(责任编辑段鹏)云南民族大学学报(自然科学版)第 卷