收藏 分销(赏)

基于机器学习的数据中心稳态热参数预测.pdf

上传人:自信****多点 文档编号:2337086 上传时间:2024-05-28 格式:PDF 页数:6 大小:2.54MB
下载 相关 举报
基于机器学习的数据中心稳态热参数预测.pdf_第1页
第1页 / 共6页
基于机器学习的数据中心稳态热参数预测.pdf_第2页
第2页 / 共6页
基于机器学习的数据中心稳态热参数预测.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、计算机时代 2023年 第11期0 引言传统行业与云计算、人工智能、5G、物联网技术呈深度融合的趋势,数据及流量爆发式增长使数据中心向着大规模、高密度的方向发展1,导致数据中心能耗逐年增加。数据中心的能耗由IT设备、制冷系统、供配电和照明系统三部分组成。其中IT设备占总能耗50%2,其产生的热量直接决定了空调负荷的大小,影响空调能耗;而空调运行参数的改变,反过来影响着IT设备的运行环境及其运行能耗,两者的能耗因热环境而彼此耦合3。因此,以IT设备的负载动态变化为基础,预测数据中心的温度情况,探索数据中心热环境与能耗之间的平衡、对于数据中心能源优化管理具有现实意义。基于计算流体力学(CFD)模拟

2、的方法是预测数据中心温度分布的主流办法4。但 CFD 预测过程中需求解复杂的数学物理模型,大型的数据中心机房往往需要划分几十万到几千万的网格5,求解过程困难,难以实现气流的实时预测。近年来兴起的机器学习预测方式使数据中心气流组织的实时预测成为可能,对此国内外学者已有一些研究。Song Zhihang6开发了基于计算流体动力学(CFD)仿真的人工神经网络(ANN)模型对高架地板入口气流的温度和速度预测。Tsukamoto等7人开发了可基于低网格数CFD模型计算出的机柜出口风速对高网格数CFD模型的机柜出DOI:10.16644/33-1094/tp.2023.11.014基于机器学习的数据中心稳

3、态热参数预测*殷佳辉,朱兵,张一鸣,黄金森,苗益川(贵州大学电气工程学院,贵州 贵阳 550025)摘要:为提高数据中心空调运行性能,对某数据中心建立模型,对机柜出口温度在机箱不同的负载率下进行仿真抽样,建立CFD数据集。基于CFD数据集,分别使用三种机器学习模型即:Elman神经网络、RBF神经网络和SVR支持向量回归机,对数据中心稳态运行情况下的不同机柜负载率时空调回风温度进行快速预测。仿真结果表明:三种模型均在短时间内实现了较为准确的预测,但SVR支持向量回归机凭借其训练过程简洁、精度高、训练速度快等优势,更有效地预测热负荷温度。关键词:数据中心;气流模拟;机器学习;快速预测;热参数中图

4、分类号:TK221文献标识码:A文章编号:1006-8228(2023)11-71-06Machine learning-based prediction of steady-state thermal parameters in data centersYin Jiahui,Zhu Bing,Zhang Yiming,Huang Jinsen,Miao Yichuan(College of Electrical Engineering,Guizhou University,Guiyang,Guizhou 550025,China)Abstract:To improve the perform

5、ance of data centre air conditioning,a data centre is modeled and the cabinet outlet temperaturesat different load rates of the chassis is simulation sampled to establish a CFD dataset.Based on the dataset,three machine learningmodels,i.e.,Elman neural network,RBF neural network and SVR support vect

6、or regression machine,are used to quickly predictthe air conditioning return air temperature at different cabinet load rates under steady-state operation of the data centre.Thesimulation results show that all three models achieve more accurate prediction in a short time,but the SVR is more effective

7、 inpredicting the heat load temperature by virtue of its advantages of concise training process,high accuracy and fast training speed.Key words:data center;airflow simulation;machine learning;fast prediction;thermal parameters收稿日期:2023-06-28*基金项目:贵州省科技支撑计划项目(No.2017YFB0902100)作者简介:殷佳辉(1999-),男,湖北孝感人

8、,硕士研究生,主要研究方向:数据中心气流组织。通讯作者:朱兵(1967-),女,贵州贵阳人,硕士,高级工程师,主要研究方向:数据中心节能技术。71Computer Era No.11 2023口风速做出预测的深度神经网络(DNN)回归预测模型。Athavale等8评估了人工神经网络(ANN)、高斯过程回归(GPR)和支持向量回归(SVR)三种机器学习方法对数据中心稳态工况下机架入口温度分布的预测性能。石桃桃等9建立了多参数POD降阶温度场预测模型,基于POD-IDW模型预测机柜进出风平面的温度场分布。上述学者在数据中心气流组织优化、模型开发和数据中心结构设计等领域取得了大量研究成果,但在模型评

9、估与优化及稳态热环境实时预测等领域研究不够深入。虽然CFD模拟可以提供实验难以得到的特殊工况下的气流分布数据,但目前CFD计算中常用的湍流模型并不适合,准确性较差,难以为快速预测模型提供高保真数据。基于此,本文为提高CFD预测数据中心气流组织稳态热参数的准确性,以雪城大学/IBM 绿色数据中心(GDC)实验室(RL)10-11为模型。通过参数化仿真,模拟了在不同机柜负载率下的稳态温度分布建立 CFD 数据集,并基于 CFD 数据集训练将其用于Elman神经网络,RBF神经网络和SVR支持向量回归三种机器学习模型训练。从而实现对不同机柜负载率下空调回风温度的快速预测,并评估了不同机器学习模型稳态

10、热参数预测性能。1 数据中心模型1.1 实验模型实验室共设有R1、R2、R3三个大功率模拟机架,每个机架长 1m,宽 0.61m,高 2m,在满载时可产生102kW以上的热量(每个机架约34kW),每个机架包含四个模拟机箱,每个机箱均设置有恒速风扇和可变功率加热器,模拟机箱的流量特性和瞬态热响应特性与真实IBM刀片机箱相同。并且高架地板模型采取数 据 中 心 常 用 的 的 体 积 力 模 型;湍 流 模 型 采 用standard k-e湍流模型。每个机箱的最大功率见表1。表1机箱与机架满载功率(kW)C4C3C2C1机架总功率R18.878.848.828.9035.43R28.949.0

11、29.019.0235.99R38.728.758.828.8035.101.2 CFD模型及边界条件设置如图1所示,机架吸入穿过高架地板进入机房的空气以及部分房间内的再循环空气冷却机架,机架的排气进入机房与房间空气混合,然后进入空调回风口进行降温,冷空气进入增压室后穿过高架地板进入房间完成循环。图1实验室三维模型图将实验室模型的计算域包含除机柜内部和增压室之外的整个房间,房间墙壁、天花板均为无滑移绝热边界、由于实验时未开启CRAH2所以同样将其设置为绝热边界,地板设置为温度边界,机柜前方十块高架地板设置为速度入口,CRAH1设置为质量出口,本实验研究房间级的气流组织,未对机柜内部气流进行分析

12、,将机柜建模为一个黑箱,机柜入口为压力出口,机柜出口为速度入口,根据实验数据对机柜进行设置,边界条件及参数设置见表2。表2边界条件设置序号123456边界条件高架地板机柜入口机柜出口空调出口房间地板屋顶、墙壁类型速度入口压力出口速度入口质量出口定温边界绝热边界稳态仿真基于三个机柜全部满载情况下进行,数据中心实际运行过程中服务器负载变化范围为 0100%,而负载率的变化直接影响机柜的出口温度,因此在探究机柜出口温度对针对12个模拟机箱在不同的负载率下进行仿真抽样,为了确保数据集的填充,且尽量减少仿真次数,使用拉丁超立方抽样对12个模拟机箱的负载率建立了容量为500的样本,使用黑箱模型计算出不同负

13、载率下的机柜出风口温度,此外,由于实验室模拟机箱均为恒速风扇,因此机柜出口流量不发生变化。2 机器学习模型训练建立CFD数据集后,将数据集用于机器学习模型72计算机时代 2023年 第11期的训练,为了建立更准确的数学模型分别采用了三种机器学习算法,包括Elman神经网络、RBF神经网络与SVR支持向量回归机。将12个模拟机箱的出风温度作为输入参数,空调回风温度作为输出参数,进行了参数化仿真,完成500组数据的仿真时间约为2500分钟,且避免了繁杂的后处理工作。2.1 Elman神经网络Elman神经网络特点是其在隐含层中添加了一个可进行一步延时的承阶层12,承接层将隐含层的输出进行延时与储存

14、,并在下一时间步将其传递到隐含层的输入,使其对历史数据具有敏感性,从而使网络可以适应时变特性13。Elman神经网络结构如图2所示。图2Elman神经网络结构图2.2 RBF神经网络本文使用的RBF基于MATLAB神经网络工具箱,该神经网络由三个层组成包括输入层,由隐藏层神经元构成的径向基层和由输出层神经元组成的线性输出层,构建函数newrbe可建立精确径向基神经网络,与常用的中心选取方法不同,该函数直接将样本作为中心,并将第一层权值设置为输入向量的转置向量。其网络结构如图3所示。图3RBF神经网络结构图2.3 SVR支持向量回归支持向量机是一种监督学习的机器学习模型,它用分类算法来解决二分类

15、问题,可利用已经标记了类别的训练集来训练SVM模型,然后用它来对新的文本进行分类。支持向量机的分类问题求解思路是先将样本映射到一个特征空间内,基于间隔最大化的原则在特征空间内找到一个超平面对样本进行分割,对于多元分类问题,可将其分解为多个二分类问题进行分割。支持向量机结构如图4所示。图4支持向量机示意图3 训练及预测结果评价分析3.1 Elman神经网络预测结果分析图5Elman训练集期望输出与预测输出对比图图6Elman测试集期望输出与预测输出对比图使用Elman神经网络对空调回风温度进行预测,隐含层神经元数量设置为58个,承接层神经元数量为73Computer Era No.11 2023

16、1个,epochs设置为10000次,学习率设置为0.1,由图5可知在训练集的期望输出与预测输出吻合较好,但在某些样本点仍有一定程度的误差。由图6可知在测试集与训练集的误差情况大致相同,但在某些点仍有一定程度的误差,没有出现过拟合。Elman预测性能指标见表3。表3Elman温度预测性能指标表数据集MEMAEMSERMSEMAPERR2Train0.401720.086710.013050.114240.029%0.996790.99359Test0.352360.103770.018830.137220.035%0.996030.99208由表3可知Elman神经网络表现出了很强的预测能力,

17、训练集和测试集的均方根误差分别为0.11424K和0.13722K,远低于0.51K的测量不确定度,训练集和测试集的最大误差分别为0.40172K和0.3526K说明Elman神经网络对某些点的拟合情况不够理想,但精度均在可接受范围内,Elman神经网络的训练时间约为11秒。3.2 RBF神经网络预测结果分析使用MATLAB中的精确径向基神经网络对空调回风温度进行预测,结果如图7所示。图7RBF训练集期望输出与预测输出对比图由图7可知,训练集的期望输出与预测输出吻合较好,没有观测到有明显误差的样本。由图8可知,测试集的期望输出与预测输出吻合情况与训练集相似,没有观测到有明显误差的样本,没有出现

18、过拟合。RBF 神经网络的预测性能指标见表4。由表4可知,RBF神经网络表现出了很强的预测能力,训练集和测试集的均方根误差分别为0.04937K和 0.05713K,训练集和测试集的最大误差分别为0.16601K和0.21838K,均方根误差与最大误差均远低于0.51K的测量不确定度,在空调回风温度预测的问题中RBF神经网络的精度明显优于Elman神经网络,此外 RBF 神经网络还有更快的学习速度,训练用时1.56秒。图8RBF测试集期望输出与预测输出对比图表4RBF温度预测性能指标表数据集MEMAEMSERMSEMAPERR2Train0.166010.036650.002440.04937

19、0.012%0.999420.99884Test0.218380.040890.003260.057130.014%0.999260.998523.3 SVR预测结果分析使用基于MATLAB的SVR工具箱中的RBF核函数 SVR 模型对空调回风温度进行预测,由图 9 可知SVR预测模型训练集的期望输出与预测输出吻合较好,没有观测到有明显误差的样本。由图10可知测试集的期望输出与预测输出吻合情况与训练集相似,精度较高,没有出现过拟合。SVR预测性能指标见表5。SVR预测性能指标见表5。图9SVR训练集期望输出与预测输出对比图74计算机时代 2023年 第11期图10SVR训练集期望输出与预测输出

20、对比图表5SVR预测性能指标数据集MEMAEMSERMSEMAPERR2Train0.078630.0366030.001910.04370.012%0.999540.99908Test0.132060.132060.002310.04810.013%0.999470.99894使用基于RBF核函数的支持向量回归机的预测结果各项数据均优于RBF与Elman神经网络,训练集和测试集的均方根误差分别为 0.0437K 和 0.0481K,训练集和测试集的最大误差分别为 0.0.07863K 和0.13206K,均方根误差与最大误差均远低于0.51K的测量不确定度,在空调回风温度预测的问题中SVR表

21、现出了比神经网络更高的精度,此外支持向量回归机有比神经网络更快的学习速度,训练用时0.86秒。3.4 机器学习模型训练效果分析由三种模型的模拟结果可知,在三种模型中Elman模型计算时间最长精度最差,RBF 模型计算时间大幅减少同时精度也有所提高,SVR模型表现最佳,有最短的计算时间和最高的精度。从网络结构上看Elman神经网络常用结构为四层,在隐含层增加一个承接层,RBF神经网络只有一个隐含层,并且输入层到隐含层单元之间为直接连接,RBF神经网络的结构更加简单,需要确定的模型参数更少。从训练方式上看,Elman神经网络需要确定的参数是连接权值和阈值,主要的训练算法为BP算法或改进的BP算法;

22、RBF神经网络可以动态确定隐含层单元数、数据中心和扩展常数等参数,训练算法支持在线和离线训练,有较强的输入和输出映射功能,并且理论证明在前向网络中RBF网络是完成映射功能的最优网络。RBF神经网络从隐层空间到输出层空间的变换是线性的,这样可以有效地降低计算复杂度内存消耗。因此,从理论上来说,RBF神经网络具有更快的学习速度、更好的逼近性能、更优的泛化能力、更简单的结构参数学习等优点。与RBF神经网络和Elman神经网络相比,SVR结构更简单,参数更少,SVR只需要在输出层进行误差反向传播和权重更新,而RB神经网络需要在每个隐含层都进行误差反向传播并根据梯度下降法进行权重更新,因此 SVR 的训

23、练过程更简洁,计算量更小。此外数据中心内部热参数具有较强的相关性,所以不必使用结构较复杂的神经网络,使用SVR即可实现数据中心热参数的准确快速预测。SVR相比于RBF神经网络和Elman神经网络,不需要确定隐含层的结构和数量,也不需要进行复杂的误差反向传播算法,训练过程更加简单和高效,SVR可以有效地处理高维数据和小样本数据,而不会出现维数灾难或过拟合问题且SVR可以通过调整核函数、惩罚参数和松弛变量等超参数,来控制模型的复杂度和精度,具有较强的灵活性和鲁棒性。4 结论通过参数化CFD仿真建立不同机柜负载率下空调回风温度的数据集,分别使用Elman神经网络、RBF神经网络与SVR支持向量回归机

24、对数据中心稳态运行情况下的空调回风温度进行预测,三种模型均在短时间内实现了较为准确的预测。在三种机器学习模型中,SVR支持向量回归机凭借其训练过程更简洁,计算量小的优势成为精度最高、训练速度最快的机器学习模型,均方根误差为 0.048K,训练时间为 0.86s。原因是数据中心负载率与空调回风温度具有较强的关联性因此并不需要复杂结构的神经网络即可建立快速预测模型,因此结构简单、泛化能力强的 SVR模型更具有优势。参考文献(References):1 丁肇豪,曹雨洁,张素芳,等.能源互联网背景下数据中心与电力系统协同优化(一):数据中心能耗模型J.中国电机工程学报,2022,42(9):21081

25、3.2 中国制冷学会数据中心冷却工作组.中国数据中心冷却技术年度发展研究报告M,2021.3 傅珏忻.数据中心温度预测与空调控制策略研究D.重庆:重庆大学,2020.4 Abdelmaksoud W A,Khalifa H E,Dang T Q,et al.Experimentalandcomputationalstudyofperforated(下转第78页)75Computer Era No.11 2023Y=(1+X0.51+X-0.52+X-13)2图3RBFKit和BPKit软件对另一函数逼近比较图通过上述软件的良好运行和两个函数逼近示例获得的良好效果,证明了本RBF神经网络软件编程

26、的正确性和可用性。示例说明RBF神经网络具有比BP神经网络更好的泛化能力,函数逼近效果更好,达到同等精度需要的循环次数更少。但是必须指出的是,要想达到同样的精度要求时RBF神经网络通常需要比BP神经网络更复杂的结构。比如图2的函数逼近RBF神经网络用了48个隐含层节点,而BP神经网络只用了8个隐含层节点。4 结束语本文阐述了通过VB 6.0软件实现RBF神经网络的编程;同时,通过和BP神经网络在函数逼近的比较示例验证了该开发的 RBF 神经网络软件的正确性。该项研究较好地充实了作者编写的神经网络软件工具箱套件,包括 ART2Kit、BPKit、CPNKit、RBFKit和SOMKit共五种软件

27、。本文论述开发的软件在深度学习软件的应用条件受限时(比如数据较少)仍有较好的选择应用价值,可具体用于预测、分类或函数逼近的场合。参考文献(References):1 Martin T.Hagan,Howard B.Demuth,Mark HudsonBeale,et al.Neural Network Design ebook.https:/hagan.okstate.edu/nnd.html,2014.9.2 韩力群.人工神经网络理论、设计及应用M.第二版.北京:化学工业出版社,2007:164-172.3 陈鹏.基于VB的单隐含层BP神经网络编程及验证J.计算机时代,2018(5):41-

28、43,48.4 赵林明,胡浩云,魏德华,等.多层前向人工神经网络M.郑州:黄河水利出版社,1999:91-94.5 哈林顿(Harrington,P.).机器学习实战M.北京:人民邮电出版社,2013:184-199.floor tile in data centersC/2010 12th IEEE interso-cietyconferenceonthermalandthermomechanicalphenomena in electronic systems.IEEE,2010:1-10.5 Edeling W N,Cinnella P,Dwight R P,et al.Bayesian

29、estimatesofparametervariabilityinthek-turbulence modelJ.Journal of Computational Physics,2014,258:73-94.6SongZ,MurrayBT,SammakiaB.Airflowandtemperaturedistributionoptimizationindatacentersusing artificial neural networksJ.International Journalof Heat and Mass Transfer,2013,64:80-90.7 Tsukamoto H,Sog

30、awa Y,Matsuda K,et al.High-speedSearchforOptimalOperationParametersofAirConditioningSysteminDataCenterbyUsingRegressionPredictionandDeepReinforcementLearningonCFDSimulationC/202160thAnnualConference of the Society of Instrument and ControlEngineers of Japan(SICE).IEEE,2021:105-112.8 Athavale J,Yoda

31、M,Joshi Y.Comparison of data drivenmodelingapproachesfortemperaturepredictionindata centersJ.International Journal of Heat and MassTransfer,2019,135:1039-1052.9 石桃桃.数据中心热环境快速预测及基于热点反演的空调送风温度优化控制研究D.上海:上海交通大学,2021.10 Abdelmaksoud W A,Khalifa H E,Dang T Q,et al.Improved CFD modeling of a small data ce

32、nter testcellC/2010 12th IEEE Intersociety Conference onThermalandThermomechanicalPhenomenainElectronic Systems.Las Vegas:IEEE,2010:1-9.11 Abdelmaksoud W A,Dang T Q,Khalifa H E,et al.PerforatedtilemodelsforimprovingdatacenterCFD simulationC/13th InterSociety Conference onThermalandThermomechanicalPhenomenainElectronic Systems.San Diego:IEEE,2012:60-67.12 李浩.基于改进灰色理论和 Elman 神经网络的电力负荷预测研究D.南京:南京理工大学,2021.13 Fan Q,Zhang Z,Huang X.Parameter conjugate gradientwithsecantequationbasedelmanneuralnetworkand its convergence analysisJ.Advanced Theory andSimulations,2022,5(9):2200047.(上接第75页)CECE78

展开阅读全文
收益排行: 01、路***(¥15400+),
02、曲****(¥15300+),
03、wei****016(¥13200+),
04、大***流(¥12600+),
05、Fis****915(¥4200+),
06、h****i(¥4100+),
07、Q**(¥3400+),
08、自******点(¥2400+),
09、h*****x(¥1400+),
10、c****e(¥1100+),
11、be*****ha(¥800+),
12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服