1、科 技 创 新科 技 创 新收稿日期:2022-12-22作者简介:肖伟强,男,汉族,河北省水务中心黄壁庄水库事务中心,高级工程师。数据挖掘在黄壁庄水库调度管理中的应用研究数据挖掘在黄壁庄水库调度管理中的应用研究摘要以黄壁庄水库为例,将数据挖掘技术应用在水库调度中,采用决策树算法,探索数据之间的关联和规则,挖掘海量数据潜在的、有价值的信息及相关规律,更直观、便捷、高效地为黄壁庄水库调度提供决策参考,有助于提升水库运行管理水平。关键词数据挖掘;调度管理;应用研究肖伟强黄壁庄水库经过 60多年的调度运行管理,积累了大量工情、雨情、水情观测数据及管理调度信息,但存在数据类型多且复杂、处理方式单一、数
2、据资源利用率低等问题,未能将大量数据进行提取、利用、研究。对此,我们利用数据挖掘技术,采取决策树算法,对海量数据进行分析研究,发现其潜在的、有价值的调度管理规律。采用该技术可以更直观、更便捷、更高效地为黄壁庄水库调度提供决策依据,能够提升水库控制运用整体管理水平。1.研究区域黄壁庄水库是海河流域子牙河系滹沱河上的重要控制性大(I)型水利枢纽工程,水库以防洪为主,兼顾灌溉、发电、工业及城市生活供水等,总库容12.1亿 m3。建库以来,水库发挥了巨大的经济效益和社会效益。对于水库而言,经过几十年的运行管理,积累了海量数据,这些数据蕴含着十分有价值的信息。2.数据概述水库调度运行过程中会产生庞大的数
3、据,在进行数据挖掘之前,需要筛选并整理有价值的资料组成基础数据集,现得到黄壁庄水库 1980 年2021年数据,并将数据资料和调度结果作为基础数据集。黄壁庄水库调度的基础数据集包括水库出入库流量、库水位、降水量、多年调度情况等。数据整理后以 2021年为例,结果如表 1所示。在对黄壁庄水库调度数据进行整理后,得到其供水任务和供水次序。供水任务主要分为石家庄城市生活用水、西柏坡电厂发电用水、农业灌溉用水、石家庄民心河及滹沱河生态用水及其他临时性供水任务。在供水次序上,黄壁庄水库以优先满足石家庄市城市生活和工业用水为主,其次是河道生态用水,在保证其他供水的前提下,最后是农业灌溉用水。遇到特枯年份,
4、水量不满足供水发生矛盾时,应优先保证城市居民生活用水。3.基于决策树的水库调度规则建立3.1决策树方法决策树模型是一种常见的分类、聚类和预测方法,这种算法可以从一系列无规律性的案例中运用信息论原理,分析和总结样本属性,用决策树的方式推导出可供决策者参考的分类规则。目前,在决策树模型方法中,一般采用ID3和 C4.5两种算法。3.2水库调度决策树模型的建立水库调度规则是当前时段的决策变量(出库流量、出力、时段末水位)与影响因子之间的函数映射关系,即在当前状态已知的情况下,根据映射关系,通过水库当前状态,可以确定下泄流量、时段末水位等,即 Y=F(X),其中 Y为输出变量,即水库出库流量、末水位等
5、;X 为输入变量,即水库前期调度状态等。对于水库调度规则的提取,即以实际调度运行管理数据为样本,对函数映射关系进行拟合,决策树的模型结构就是通过输入因子(当前入库流量、水位等)的取值范围,确定不同的决策变量取值。对水库调度规则的提取,将采用表 12021年黄壁庄水库基础数据集表 2整理后的历史调度数据格式日期2021年 1月2021年 2月2021年 3月2021年 4月2021年 5月2021年 6月2021年 7月2021年 8月2021年 9月2021年 10月2021年 11月2021年 12月月初库水位(m)117.38117.28117.49116.26113.19113.6311
6、3.52114.86116.03117.42119.17119.33月初库容(亿 m3)2.9522.90013.00962.39341.18391.33291.29491.79312.29242.97293.95624.052降水量(mm)1.128.419.564648.6433.653135.4169.645.46.1入库流量(m3/s)213.59533.861742.3842.31974.641014.843354.491117791.27298.72094.91652.3出库流量(m3/s)279.64394.612412.21282.18827.11004.22705.63666
7、.8928.66116.9820141679调度时段2020-082020-092020-10水位(m)113.88116.33116.59入库流量(m3/s)1196.60308.02347.73降水量分级331供水类别21146科 技 创 新科 技 创 新C4.5算法进行计算,该算法的步骤大致为:首先将各属性进行离散分级,然后以某一个条件属性作为根节点,以该属性条件生成新的分支,之后按新的属性条件继续分割,直到节点所有样本数据属于同一类别,或没有其余属性进行分割,最终形成一个按照各种信息进行分类的水库调度规则决策树,具体决策树分类结构示意如图 1所示。对于水库兴利调度,选择可以反映调度本质
8、的 5个属性,分别为调度时段(月份)、入库流量、月初库水位、降水量、供水类别生成水库调度决策树,其中确定供水类别作为决策属性,其余为条件属性,这 5个属性作为下一步数据挖掘的基本数据集。收集整理历史资料后,对水库历史数据的各属性针对不同条件进行离散分级,连续属性需要根据该属性多年数据分割成若干个等级,对于所选取的影响水库调度的 5 个属性来说,调度时段和供水类别为离散属性;入库流量为连续属性,可根据具体资料进行处理;月初库水位为连续属性,按照从死水位到兴利水位划分 5个等级;降水量为连续属性,根据多年降水量的数据集,按照一定频率进行分级。为了得到更好的结果,样本数据集应尽可能多,分级数目尽可能
9、少(大约在 210级之间)。4.实例应用以黄壁庄水库为例,选取 1980 年2021 年的数据资料和调度结果(以月为调度时段)组成基础数据集,通过决策树 C4.5 算法从中提取水库调度规则。根据黄壁庄水库的特性,首先对各属性进行分级处理。4.1调度时段分级调度时段以月为单位,由于每个月的来水量不同,调度决策亦不相同。黄壁庄水库所在区域 6 月进入汛期,7 月8 月为主汛期,因此 6 月水库将开始腾库预泄,腾出库容为主汛期的强降雨做准备;7 月8 月在确保防洪安全的情况下进行供水、发电;9 月10 月属于汛期后期,来水逐渐减少,此时水库以蓄水为主,保证后期用水;11 月来年 5月径流量较小且趋于
10、稳定。因此,将调度时段划分为:6 月、7 月8 月、9月10 月、11 月5 月4个阶段。4.2入库流量分级对 于 实 时 调 度 而言,入库流量需根据水文资料、预报信息等进行预测,准确的入库流量较难获取,因此通过长期历史资料采用聚类的方法进行分析,将入 库 流 量 分 为 枯、偏枯、平、偏丰、丰 5 个级别。4.3 月初库水位分级水 库 调 度 不 同 时期水位高低也会影响调度决策,黄壁庄水库死 水 位 为 111.5m,兴利 水 位 为 120.0m,将水 库 水 位 分 为 5 个 级别:111.5m112.5m、112.5m114.0m、114.0m116m、116m118m、118m
11、120m。4.4降水量分级黄 壁 庄 水 库 所 在流域降水量年内分布不均匀,流域内多年平均 降 水 量 400mm600mm,受 季 风 影 响,80%以 上 的 降 水 量 集中 在 6 月 9 月,其 余月份降水较少。因此,按照调度时段的划分来进行降水量的分级处理,时段划分为 6月、7月8月、9月10月、11月次年 5 月 4 个阶段,每一调度时段降水量均分为 1 级、2 级、3 级。6 月降水量分级依次为0,40)、40,60)、60;7月8 月降水量分级依次为0,50)、50,100)、100;9 月10 月降水量分级依次为0,20)、20,40)、40;11月次年 5月 的 降 水
12、 量 分 级 依 次 为 0,15)、15,30)、30;4.5供水类别供水以生活生产和农业灌溉为主,具体按照以下几种情况进行分级:能够满足供水,必要时可根据需要加大供水量为级别 1;能够满足农业灌溉和生活生产供水保证率时为级别 2;农业灌溉不能满足供水保证率,生活生产可满足供水时为级别 3;农业灌溉和生活生产均不能满足供水保证率时为级别 4;农业灌溉停止供水时为级别 5。各属性分级处理后,整理后部分调度数据格式如表 2所示。最后通过决策树 C4.5 算法从黄壁庄水库 1980年2021年供水调度数据中提取调度规则,并将该方法封装在黄壁庄水库智慧管理平台中,调度规则通过图表形式展示,实现可视化
13、展示和分析,如图 2 所示。从图中可以看出,不同调度时段,不同库水位所对应的调度决策不同,实际应用时,可根据输入的月份、库水位、预测的入流级别、降雨级别,得到对应的供水类别。通过系统平台的可视化展示,为水库兴利调度提供技术支撑,使数据更直观,决策更智慧。黄壁庄水库供水调度图见图 2。除兴利调度以外,将决策树算法应用在岗黄调度管理中,作为防汛调度管理的一部分。如图 3所示,由于黄壁庄水库与岗南水库属于联合调度,因此需要分别考虑两个水库的水位情况,从而确定凑泄量。5.结语将数据挖掘技术的决策树方法与水库调度相结合,基于决策树提取水库调度规则,研究表明基于决策树方法的水库调度规则,是通过大量数据挖掘而成,能够集中反映历史水文数据和调度数据的规律性,该方法将调度时段、入库流量、库水位等调度信息形成关联规则,得到的调度方案合理可行。在实际调度中,这一方法产生的调度规则具有简便、可操作性强等优点,能够直观、高效地反映水库控制运用中的规律性,便于管理者决策,对指导水库调度具有重要意义。图 1决策树分类示意图图 2黄壁庄水库供水调度图图 3岗黄水库调度管理47