1、自动化技术与应用2023 年第 42 卷第 8 期行业应用与交流Industrial Applications and CommunicationsTechniques ofAutomation&Applications高效能多核处理器芯片功耗测试及其DVFS调度算法研究*陈道品,武利会,罗春风,范伟成,何子兰(广东电网有限责任公司佛山供电局,广东 佛山 528000)摘要:针对处理器纳米级工艺快速发展,使高效能多核处理器芯片上集成晶体管,进而导致高效能多核处理芯片功耗大幅增加的问题,研究设计了一种双阈值功耗自适应的DVFS调度算法。该算法采用两级阈值调节配合功耗自适应实现了对高效能多核处理器
2、的功耗优化,相较于传统的单阈值调节方式,该算法调节CPU的方式更科学有效。在大部分测试程序中,该算法的性能可保持在90%以上,最大功耗优化比例可达到35%以上。关键词:DVFS算法;节能调度;功耗测试;高效能多核处理器中图分类号:TN402文献标识码:A文章编号:1003-7241(2023)08-0149-05Research on Power Test and DVFS Scheduling Algorithm of HighPerformance Multi Core Processor ChipCHEN Dao-pin,WU Li-hui,LUO Chun-feng,FAN Wei-c
3、heng,HE Zi-lan(Guangdong Power Grid Co.,Ltd.Foshan Power Supply Bureau,Foshan 528000 China)Abstract:With the rapid development of nano scale processor technology,transistors are integrated into high-efficiency multi-core processorchips,which leads to a significant increase in power consumption of hi
4、gh-efficiency multi-core processor chips.A dual thresholdpower adaptive dvfs scheduling algorithm is studied and designed.Compared with the traditional algorithm,this algorithm can ad-just the maximum power consumption to more than 35%of the traditional CPU,and can achieve more efficient performance
5、.Keywords:Dvfs algorithm;energy saving scheduling;power test;high efficiency multi-core processor*基金项目:广东电网有限责任公司科技项目资助(GDKJXM20185496)收稿日期:2021-05-07DOI:10.20033/j.1003-7241.(2023)08-0149-05.1引言随着互补金属氧化物半导体(CMOS)技术的广泛应用,高效能多核处理器芯片上的集成晶体管数量快速增长,无法避免地增大了处理器的功耗,阻碍了处理器的性能提升。因此,如何优化高效能多核处理器的功耗已成为亟需解决的问题
6、。近年来,许多IT提供商和相关从业者针对该问题进行了相关研究,提出基于虚拟机技术的算法实现处理器节能。如王喆等1、颜军等2、张展等3、朱金彬等4,通过分析集群中节点的能耗差异,在部署虚拟机时尽量将虚拟机部署在能耗较低的节点,实现了集群能耗的节省。上述处理器功耗优化策略虽然可在一定程度上实现CPU节能,但无法实时动态调整CPU频率。基于此,研究提出一种双阈值功耗自适应(DTPA)的DVFS调度算法,以实现动态管理功耗和调节电压频率,进而降低高效能多核处理器芯片功耗,提高CPU的利用率。2DVFS算法简介DVFS算法是一种基于系统内核节能的动态电压频率调整技术,可根据应用程序对CPU的需求,实时动
7、态调整CPU的频率和电压,实现系统节能。实现DVFS算法的理论支撑如下5:(1)(2)式中,P表示功率;C为常数;V表示电压;f 表示频率;E表示能耗;t表示时间。由式(1)(2)可知,功率与频率正相关,当频率降低,功率随之下降,导致CPU计算能力减弱,进而增加了应用程序的运行时间。因此,均衡频率与功率是高效能多核处理器芯片功耗节能的关键。本研究通过分析DVFS的频率管理策略,如表1,选用Userspace模式调节CPU运行频率6-7。该调整策略下,用户可根据不同需求动态改变频率,降低CPU运行频率,达到降低处理器的功耗的目的。3高效能多核处理器中DVFS调度算法设计高效能多核处理器中,基准频
8、率和电压的调节是对整个芯片进行调节,而分频的调节是对每个簇进行调节,因此基准频率和电压调节的速度相较于分频调节,速度相对较慢8。为快速调节高效能多核处理器,本研究采用149行业应用与交流Industrial Applications and Communications自动化技术与应用2023 年第 42 卷第 8 期Techniques ofAutomation&Applications两种频率的分频方式进行DVFS调节。采用该方式设计DVFS调节时,会产生相应的两个阈值,第一级阈值为分频调节阈值,第二级为基准频率调节阈值9。考虑到功耗阈值会影响CPU利用率,本研究在高效能多核处理器的DVF
9、S调节中加入独立于两级阈值的功耗阈值10-12。通过反复实验,确定了1.8 GHz、1.5 GHz、1.2 GHz基准频率下,功耗阈值分别为16 W、12 W、0 W。表1DVFS频率管理策略频率策略PerformancePowersaveOndemandConservativeUserspace目标性能最大化节能最大化根据作业需求动态调整CPU频率基于Ondemand算法的改进支持用户自定义的频率描述静态地将CPU频率设置为最高可用频率静态地将CPU频率设置为可用最低频率负载高时动态调整CPU频率至最高可用频率,负载低时逐渐降低CPU频率降低频率时选择可供80%以上应用程序正常运行的负载频率
10、,相比于Ondemand更加高效节能用户可根据需求不同动态的改变频率缺点过高的能耗较低的性能无法保证频率预测的准确性频率调整过程过于复杂采用两级阈值和功耗阈值配合调节CPU,即采用双阈值功耗自适应(DTPA)调节CPU时,DVFS算法的调节框架如图1所示。图1采用DTPA的DVFS算法调节框架考虑到高效能多核处理器中,采用分频调节以簇为粒度时,可能出现单核CPU利用率较高的情况,导致整个程序运行速度较慢13-14。因此,为避免这一情况的发生,研究在上述调节框架中增加了一个单核利用率检测机制,当检测到有单核CPU利用率较高时,则上调该单核的簇频率到基准频率,以确保程序的运行速度。在调试高效能多核
11、处理器中DVFS算法时,电压值和频率值的对应关系,如表2所示。根据上述思路,本研究将高效能多核处理器中采用DTPA的DVFS调度算法框架设计为如图2所示。整个算法对高效能多核处理器CPU频率的调节分为3个部分,具体调节方法如下:表2电压与频率对应关系电压值/V1.010.920.860.81频率值/GHz2.01.81.51.2(1)当CPU的利用率处于第一级阈值范围内时,维持CPU当前频率不变;(2)采用分频调节频率时,若CPU利用率低于第二级阈值下限,对CPU进行降频和降压;若CPU利用率高于第二级阈值上限,测定其功耗,若测定功耗大于功耗阈值,则对CPU进行升频和升压,若测定功耗小于功耗阈
12、值,则CPU当前频率不变;(3)开启高效能多核处理器自动调节后,当没有负载时,处理器频率会快速降低到最低值;当负载出现时,处理器频率从第二级阈值下限上升至合理的基准频率,并在该频率下通过分频自适应调频以适应不同程序。通常情况下,自适应调频每0.5 s调节一次,直到高效能多核处理器上的每个核均空闲一段时间后,自动关闭时钟。图2高效能多核处理器中DVFS算法流程在上述频率调节中,每个基准频率与其对应的分频频率如表3所示。表中,分频频率为每个簇在该基准频率下可变动的频率。由表可知,基准频率对应的是整个CPU电压下所有簇的最高频率。150自动化技术与应用2023 年第 42 卷第 8 期行业应用与交流
13、Industrial Applications and CommunicationsTechniques ofAutomation&Applications表3不同基准频率对应的分频频率/GHz基准频率2.01.81.51.2分频频率2.0/1.8/1.61.8/1.62/1.41.5/1.35/1.21.2/1.08/0.96通过反复实验,本研究最终确定第一级阈值的上下限分别为65%和40%;第二级阈值的上下限分别为85%和20%。4仿真实验4.1实验环境本实验选用自主设计的开发板作为高效能多核处理器芯片功耗测试和DVFS调度算法实验平台。该开发板包括网卡、显卡、内存条、硬盘、VR芯片、CP
14、LD、高效能多核处理器等硬件设施,可支持高效能多核处理器运行的操作系统。其中,内存为32 GB,硬盘为1 TB。软件测试环境为Linux3.14。实验过程中,内存频率为800 MHz。4.2实验结果4.2.1参数设置为确定采用DTPA的DVFS算法的最优参数,研究采用不同参数对parsec3.0大部分测试题进行实验,并统计其能耗,结果如图3所示。图中,横坐标表示不同调节方式的功耗值,纵坐标解释如表4。由图3可知,在相同两级阈值条件下,不同功耗阈值对最终能耗的降低效果不同,功耗阈值限定值越小,能耗节省效果越好;在相同功耗阈值条件下,不同两级阈值对最终能耗的降低效果不同,两级阈值范围越大,能耗节省
15、效果越好。图3不同调节方式能耗对比根据上述分析可知,本研究采用DTPA的DVFS算法的参数为:第一级利用率阈值下限和上限分别为0.4和0.65,第二级利用率阈值下限和上限分别为0.2和0.85,不同基准频率下的功耗阈值分别为16 W、12 W、0 W。4.2.2算法对比为验证采用DTPA的DVFS算法的优越性,实验选取parsec中部分程序对其进行了测试,并对比了该算法与传统单阈值调节方法的功耗和性能,结果如图4所示。图中,2G表示CPU运行固定频率为2 GHz;atuo-4065表示单阈值调节方式,其阈值下限和上限分别为0.4和0.65;atuo-20854065-161200表示本研究采用
16、DTPA的DVFS算法的双阈值调节和功耗限制方法,其第一级阈值下限和上限分别为0.4和0.65,第二级阈值下限和上限分别为 0.2 和 0.85,功耗阈值分别为 16 W、12 W、0 W。由图可知,采用单阈值和本研究的改进DVFS算法双阈值调节方式,在性能方面的调节效果接近,其原因是实验用的测试程序属于计算密集型,采用任何一种调节方式对性能的影响都较为敏感;但在功耗方面的调节效果方面,本研究采用DTPA的DVFS算法具有明显的优势,可较大幅度降低功耗。综上可知,相较于传统的单阈值调节方式,本研究采用DTPA的DVFS算法调节CPU的方式更科学有效。表4纵坐标参数解析2Gatuo_2060_3
17、050_191309atuo_2070_3050_191300atuo_2080_4060_171209atuo_2080_4060_191300atuo_2080_4060_191309atuo_2080_4060_l 91400atuo_2085_4065_161200atuo_2085_4065_181200利用率阈值/%一级:30-50二级:20-60一级:30-50二级:20-70一级:40-60二级:20-80一级:40-60二级:20-80一级:40-60二级:20-80一级:40-60二级:20-80一级:40-65二级:20-85一级:40-65二级:20-85功耗阈值/W1
18、9、13、919、13、017、12、919、13、019、13、919、14、016、12、018、12、0图4算法调节结果对比151行业应用与交流Industrial Applications and Communications自动化技术与应用2023 年第 42 卷第 8 期Techniques ofAutomation&Applications4.2.3算法验证为验证采用DTPA的DVFS算法的调度优化效果,实验在2 GHz运行频率条件下,选取unixbench中的部分测试题对算法进行了测试,结果如图5所示。由图可知,采用DTPA的DVFS算法对选取的unixbench测试题的整体调
19、度优化效果良好,基本保持了unixbench的90%以上的性能,且对于每一道测试题,其性能降幅均小于功耗降幅,尤其是对于计算性能要求不高的测试题,如file-copy,采用DTPA的DVFS算法可保证其性能达到85%以上时,功耗降低30%左右。对于dhrystone类计算密集的测试题,采用DTPA的DVFS算法调度优化后,性能降幅小于功耗降幅,且CPU的利用率接近100%,说明算法优化结果理想。但对于execl-throughput类测试题,采用DTPA的DVFS算法调度优化的结果不太理想,性能损失达到25%以上。综上可知,采用DTPA的DVFS算法可调度优化大多数unixbench测试题,优
20、化效果良好。图5算法调节效果为进一步验证上述结论,本研究在2 GHz运行频率条件下,对unixbench中的所有测试题进行了测试,其功耗和性能综合效果如图6所示。由图可知,采用DTPA的DVFS算法对unixbench上的调度优化综合效果良好,性能保持在90%以上,功耗降低了25%以上。图6采用DTPA的DVFS调度优化unixbench的综合效果4.2.4实例验证为验证采用DTPA的DVFS算法的实际应用效果,研究采用日常使用较为频繁的mplayer应用程序对其功耗进行测试。使用mplayer同时播放两个1080p的高清视频,分别采用DTPA的DVFS算法和2 GHz固定频率进行调节,结果如
21、图 7 所示。由图可知,采用 DTPA 的DVFS 算法自动调节的方式可降低 mplayer 视频播放35%以上的功耗,而采用2 GHz固定频率的方式进行调节,仅使mplayer视频播放的平均功耗降低了20%左右,说明本研究采用DTPA的DVFS算法可有效降低功耗,且优于固定频率的优化效果。图7平均功耗对比5结束语综上所述,本研究设计的采用DTPA的DVFS调度算法可优化高效能多核处理器芯片性能,维持其性能可在90%以上。同时,该算法可节省高效能多核处理器芯片功耗,最大优化比例可达到35%以上。相较于传统单阈值调度算法,本研究算法的优化效果更科学有效,具有一定的实际应用价值。参考文献:1 王喆
22、,唐麒,王玲,等.一种基于模拟退火的动态部分可重构系统划分-调度联合优化算法J.计算机科学,2020,47(8):26-31.2 颜军,唐芳福,张志国,等.异构多核人工智能SoC芯片的低功耗设计J.航天控制,2020,38(2):62-68.3 张展,张宪琦,左德承,等.面向边缘计算的目标追踪应用部署策略研究J.软件学报,2020,31(9):2691-2708.4 朱金彬,肖利民,王继业,等.多核处理器环境下功耗感知的任务调度算法研究J.电力信息与通信技术,2021,19(3):19-25.5 段维虎,卢海涛.基于DVFS技术的SOC架构分析J.中国集成电路,2020,29(12):73-7
23、7.6 陈阳,王勇.绿色云计算环境中基于温度感知的虚拟机迁移策略J.重庆邮电大学学报(自然科学版),2020,32(2):192-199.7 吴昊天,郭锐锋,彭阿珍,等.一种考虑可靠性的常带宽服务器低功耗调度算法J.吉林大学学报(工学版),2020,50(5):1802-1808.8 许苗苗,于炯,蒲勇霖,等.Storm平台非关键路径电压调控节能策略J.东北师大学报(自然科学版),2019,51(4):57-64.9 韩晓镭.基于深度强化学习的云计算调度优化研究J.长春师范大学学报,2020,39(8):30-34,103.10 GARG Vaneet,JINDAL Balkrishan.云计
24、算中 SLA 守恒的高效虚拟机迁移方法(英文)J.Journal of Central South(下转第160页)152行业应用与交流Industrial Applications and Communications自动化技术与应用2023 年第 42 卷第 8 期Techniques ofAutomation&Applications法的完成任务时间也不断增加,但是对于相同数量的用户任务,本文算法的完成任务时间总是少于对比算法,减少了完成用户任务时间成本,表示本文算法找到了更加理想的云计算资源调度优化方案。图5两种算法最优方案完成任务时间比较3.4云计算资源负载分配合理性比较对6个云计算
25、资源上的任务进行统计,结果如图6所示。从图6可以发现,对比算法的云计算资源负载出现了不均衡现象,个别云计算资源上的任务过多,而有些云计算资源上的任务相当少,而本文算法的云计算资源负载比较均衡,最大程度利用了云计算资源,云计算资源负载分配更加合理,使云计算系统的整体保持最优。图6云计算资源负载分配合理性比较4结束语为了解决云计算资源调度优化过程存在的一些难题,如难以找到最优云计算资源调度优化方案、云计算资源利用率低等,设计了人工智能技术的云计算资源调度算法,对比结果表明,本文算法可以提升云计算资源利用率,不会出现云计算资源负载不均衡现象,节约了用户完成任务的成本,可以为用户提供更好的服务,具有较
26、高的实际应用价值。参考文献:1 赵宏伟,田力威.基于改进细菌觅食算法的云计算资源调度策略J.计算机科学,2019,46(11):309-314.2 聂清彬,潘峰,吴嘉诚,曹耀钦.基于改进蚁群算法的自适应云资源调度模型研究J.激光与光电子学进展,2020,57(1):90-96.3 李志敏,张伟.基于差分进化人工蜂群算法的云计算资源调度J.计算机工程与设计,2018,39(11):3451-3455.4 王欣欣,刘晓彦.基于双适应度动态遗传算法的云计算资源调度J.计算机工程与设计,2018,39(5):1372-1376,1421.5 贾嘉,慕德俊.基于粒子群优化的云计算低能耗资源调度算法J.西
27、北工业大学学报,2018,36(2):339-344.6 王镇道,张一鸣,石雪倩.基于竞争粒子群算法的云计算资源调度策略J.湖南大学学报(自然科学版),2021,48(6):80-87.7 王瑞娜.基于自适应拍卖和迁移机制的云计算资源调度算法J.西南师范大学学报(自然科学版),2017,42(7):54-62.8 赵昱,惠晓滨,高杨军,郭庆.基于改进QPSO算法的云计算资源调度策略研究J.火力与指挥控制,2017,42(4):14-17.9 孟凡超,张海洲,初佃辉.基于蚁群优化算法的云计算资源负载均衡研究J.华中科技大学学报(自然科学版),2013,41(S2):57-62.10 孙力,叶得学
28、.基于混合群智能优化算法的私有云资源调度方法J.现代电子技术,2021,44(3):111-114.11 张红.基于改进差分进化算法的云计算资源调度策略J.中南民族大学学报(自然科学版),2020,39(5):532-538.12 李卫星.基于改进共生优化算法的云计算资源调度优化J.数学的实践与认识,2020,50(17):148-157.作者简介:王婷(1992-),女,硕士,中级工程师,研究方向:信息系统检修维护。University,2021,28(3):760-770.11 张静.云数据中心能量与热量感知的虚拟机合并与部署J.计算机应用与软件,2021,38(1):63-69,104.12 刘敬玲,黄家玮,蒋万春,等.数据中心负载均衡方法研究综述J.软件学报,2021,32(2):300-326.13 唐伦,贺兰钦,谭颀,等.基于深度确定性策略梯度的虚拟网络功能迁移优化算法J.电子与信息学报,2021,43(2):404-411.14 杨丽娜,赵鹏,王佩哲.基于GRU神经网络的数据中心能耗预测模型研究J.电力信息与通信技术,2021,19(3):10-18.作者简介:陈道品(1978-),男,硕士,高级工程师,研究方向:电力芯片与集成电路设计,变电站芯片化保护技术与电源设备运维管理。(上接第152页)160