收藏 分销(赏)

2025年算力电力协同:思考与探索白皮书.docx

上传人:宇*** 文档编号:9959243 上传时间:2025-04-14 格式:DOCX 页数:25 大小:2.12MB
下载 相关 举报
2025年算力电力协同:思考与探索白皮书.docx_第1页
第1页 / 共25页
2025年算力电力协同:思考与探索白皮书.docx_第2页
第2页 / 共25页
点击查看更多>>
资源描述
算力电力协同:思路与探索白皮书 (2025 年) 清华大学 北京火山引擎科技有限公司 2025 年 01 月 算力电力协同:思路与探索白皮书(2025 年)—清华大学、北京火山引擎科技有限公司 报告研究团队 清华大学:郭庆来、陈敏、王奕 北京火山引擎科技有限公司:井汤博、潘宇、翟思成、李子豪 算力电力协同:思路与探索白皮书(2025 年)—清华大学、北京火山引擎科技有限公司 目录 前言 1 一、 算力电力为什么要协同? 2 (一) 伴随 AI 的迅猛发展,算力中心负荷持续攀升 2 (二) 算力中心负荷具有特殊性,对电力系统是挑战,也是机遇 5 (三) 挖掘算力中心灵活性,优化算力中心供能结构与用能成本 6 二、 算电协同,具体协同什么? 8 (一) 基本供用能结构中的算电耦合点,是算电协同的物理基础 8 (二) 相关主体的不同利益诉求,是算电协同的核心驱动力 11 三、 如何协同? 13 (一) 列头柜层面:预测算力需求及算力功耗,并挖掘其灵活性 13 (二) 算力中心层面:从业务逻辑弱耦合到强耦合,发掘灵活性 14 (三) 局部电网层面:高比例可再生能源局部电网本地自治 20 (四) 大规模“算力网+电力网”层面:跨区优化调度 21 四、 结语 22 I 算力电力协同:思路与探索白皮书(2025 年)—清华大学、北京火山引擎科技有限公司 前言 “实施一批算力与电力协同项目”作为代表性方向列入我国《加快构建新型电力系统行动方案(2024—2027 年)》。本报告针对算力负荷区别于其他常规负荷的特征,按照“为什么要做算力电力协同”、 “协同什么”、“如何协同”的顺序展开,介绍了我们在算力电力协同方向的思路与探索,目标是充分挖掘算力中心与算力系统中蕴含的灵活性,优化算力负荷用能成本与供能技术,并提升新能源消纳能力,为加快构建新型电力系统提供支撑。 编写组 2025 年 1 月 22 一、 算力电力为什么要协同? (一) 伴随 AI 的迅猛发展,算力中心负荷持续攀升 1. AI 领域的“Scaling Law”,带来能源消耗指数级增加 在人工智能(artificial intelligence,AI)领域,“Scaling Law”揭示了随着模型规模、计算能力和数据量的增加,AI 系统的性能会指数级提升。然而,这一法则也伴随着能源消耗的指数级上升。 原图来源:Yuzhuo Li, Mariam Mughees, Yize Chen, Yunwei Ryan Li, “The Unseen AI Disruptions for Power Grids: LLM-Induced Transients”, 2024. 图 1 不同大型语言模型训练过程中,能耗与模型参数数量的关系 2. 全球视角:AI 应用快速发展,带来全球算力中心耗电量大幅增长 伴随 AI 应用快速发展,全球用于 AI 的 IT 设备用电需求激增。根据花旗集团研究部门 Citi Research 的预测,从 2023 年到 2030 年,服务于 AI 的 IT 设备用电需求年均增长率将达到 43%,远高于服务于其他业务的 IT 设备用电需求的年均增长率 8%。预计到 2030 年,服务于 AI 的 IT 设备用电需求将达到 52GW,占全球 IT 设备用电需求的 50%以上。 与之对应,全球算力中心用电量也大幅增长。根据国际能源署数据,从 2022 年到2026 年,全球算力中心和加密货币的总用电量将翻一番,增加160~590TWh,相当于一个瑞典或德国的年总用电量。与 AI 需求爆发前,即 2022 年前的过去 10 年相比,其总用电量增长幅度仅为 33~89%。 原图来源:datacenterHawk (DCH), FactSet, Cogent Communications, Citi Research;中国信息通信研究院、内蒙古和林格尔新区,中国绿色算力发展研究报告(2024 年) 图 2 全球 IT 设备的用电需求趋势(单位:GW) 原图来源:IEA (2024), Electricity 2024, IEA, Paris, Licence: CC BY 4.0;中国信息通信研究院、内蒙古和林格尔新区,中国绿色算力发展研究报告(2024 年) 图 3 全球算力中心和加密货币的用电量趋势(单位:TWh) 3. 国外视角:国外已有算力中心电力供应短缺的报道 在 2024 年,AI 领域的能源挑战成为了全球关注的焦点,以下是三则具有代表性的国外报道概述: (1) OpenAI 首席执行官承认 AI 能源危机:2024 年 2 月,《Nature》杂志报道1,OpenAI 公司的首席执行官在 2024 年 1 月公开承认“AI 行业正在走向能源危机”,并警告“下一波生成型 AI 系统消耗的电力将远远超出预期,能源系统将难以应对”。 (2) 世邦魏理仕发布《2024 年全球数据中心趋势》:2024 年 6 月,世邦魏理仕公司发布的《2024 年全球数据中心趋势》指出2,全球数据中心市场因电力供应短缺而受到显著制约,北美、欧洲、拉丁美洲和亚太地区的运营商都将获取电力作为首要任务。 (3) 孟菲斯超级集群被迫由天然气发电机供电:2024 年 7 月,根据 IDC 圈报道显示3,由于当地无法提供充足的电力供应,马斯克被迫为孟菲斯超级集群 (号称是“世界上最强大的 AI 训练集群”)提供了 14 台天然气发电机。这些发电机提供最高 35MW,当地电力系统提供 8MW。 4. 国内视角:加快发展 AI 战略下,我国算力中心耗电量持续攀升 在加快发展 AI 的国家战略下,我国算力中心耗电量持续攀升。根据中国信通院《中国绿色算力发展研究报告(2024 年)》和《中国算力中心服务商分析报告(2024 年)》中的数据,截至 2023 年底,全国算力总规模达 230 EFLOPS, 位居全球第二,在用算力中心机架总规模超过 810 万标准机架,在用机架数量三年复合增长率约 30%,总耗电量达到 1500 亿 kWh,占全社会用电 1.6%。 其中,智能算力已经超过基础算力成为我国算力规模增长的主要驱动力。截 1 来源:CRAWFORD K. Generative AI is guzzling water and energy[J]. Nature, 2024, 626: 693. 2 来源: 3 来源: 至 2023 年 6 月底,我国智能算力规模占整体算力规模的比例提高到 25.4%,同 比增长 45%,比算力规模整体增速高 15 个百分点。预计到 2025 年,智能算力占比将达到 35%。 (二) 算力中心负荷具有特殊性,对电力系统是挑战,也是机遇 1. 挑战:新型电力系统仍在建设,如何用绿电支撑算力发展? 算力中心负荷具有功率密度高、周期性强等与钢铁等传统工业负荷相似的特 征,但又具有可靠性要求高、绿色性要求高、以及潜在的波动性强等显著不同的 特征。然而新型电力系统仍在建设,如何用绿电支撑算力发展,成为电力侧面临的重要挑战。 以下是算力中心负荷功率密度高、周期性强、可靠性要求高、绿色性要求高、以及潜在的波动性强的案例说明: (1) 功率密度高:2024 年 3 月,AI 初创企业 OpenPipe 的联合创始人 Kyle Corbitt 在社交平台上透露4,与微软工程师的交流中提到,在 GPT-6 训练集群项目中,若在单一州部署超过 10 万个 H100 GPU(约 150 兆瓦),可能引发电网崩溃的风险。 (2) 周期性强:2024 年 7 月,国网冀北电力有限公司在《中能传媒研究院》公众号发表文章指出5,算力中心的用电负荷具有明显的节性性周期波动,与地区夏节用电高峰时段相吻合。以张家口算力中心集群为例,夏节和冬节的负荷峰谷差分别达到 17%和 7%。 (3) 可靠性要求高:2023 年 12 月,《券日报报》报道了中国电信京冀冀智算中心的情况6,该中心向客户承诺 99.999%的电力不间断性,是全国范围内供电保障最高标准。 4 来源: 5 来源: 6 来源: (4) 绿色性要求高:2024 年 7 月,国家发改委等部门联合印发的《数据中心绿色低碳发展专项行动计划》中明确提出,到 2025 年底,要求国家枢纽性点新建数据中心绿电占比超过 80%。 (5) 潜在的波动性强:2024 年 5 月,《硅谷 101》性目对微软的采访报道中提到7,AI 算力中心(又称智算中心)的用电特征存在显著的波动性——在训练或者推理时会出现非常大的摆幅。比如:它的用电可能瞬间从满载降至 10%,随后又迅速回升至满载。 2. 机遇:协同算力中心时空灵活性,助力新型电力系统建设 同时,算力中心负荷具有时空灵活性,且算力中心运营商具有成本敏感性、 算力中心增长呈现阶段性发展特征,意味着可以通过激励措施前瞻性地引导算力 中心的规划与运行。因此,可以通过充分挖掘算力中心与算力系统中蕴含的负荷灵活性,以算力电力协同规划与运行的方式,提升新能源消纳能力,为加快构建新型电力系统提供支撑。 以下是算力中心负荷时空灵活性的具体说明: (1) 一方面,算力中心供能结构具有较高的冗余度,蕴含以业务逻辑为核心的体量可观的新型负荷灵活性。 (2) 另一方面,区别于空调等传统柔性负荷,可以通过在算力网中转移算力需求实现电力的转移,是目前已知的唯一一种可以不依赖电网而实现电力负荷瞬时转移的新型负荷。其中,主要对象涉及:算力需求、算力中心、局部算力网、局部电力网、大算力网、以及大电力网。 (三) 挖掘算力中心灵活性,优化算力中心供能结构与用能成本 在算力中心基础设施(不包含算力)建设和运营成本中,电力占比显著。根据IBM 公司的数据8,在算力中心基础设施建设成本中,电力设备占比超过 50%, 7 来源: 8 来源: 在算力中心基础设施运营成本中,电力设备的固定资产折旧、运行维护和人工、以及电费占比 28%以上。 因此,充分挖掘算力中心与算力系统中蕴含的负荷灵活性,一方面,能够通过优化算力中心内部基本供能结构,实现高效低碳用能,并降低综合用能成本;另一方面,还可以通过为电网提供负荷侧灵活性,进一步降低算力的用能成本。 二、 算电协同,具体协同什么? (一) 基本供用能结构中的算电耦合点,是算电协同的物理基础 算力中心及算力系统的基本供用能结构(以 A 级算力中心某常用配电架构为例)如图 4 所示。具体来说,一方面,在某算力中心园区,基本供能结构采用以列头柜为核心的串联结构,主要包括以下几个部分:A.列头柜(内置 IT 设备)、 B.制冷设备、C.通信电源侧蓄电池、D.备电系统、E.园区内常见的辅助能源设备,以及 F.外电。另一方面,在算力系统中,某算力中心是局部算力网中的性点之一,算力需求在互联的算力网中流转。同时,某算力中心园区是局部电力网的性点之一,电力流在 G.电力网中流转。算力需求的流转带来电力负荷的迁移。 各部分原图来源: 算力需求: 算力网:国家发展改革委高技术司、人民报报,一图读懂|“东数西算”工程解读 A: B: C: D: E: https://chuneng.in- F: G: 中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要 图 4 算力中心及算力系统的基本供用能结构(其中,以 A 级算力中心某常用配电架构为例) 以下具体阐述算力中心园区基本供用能结构中各部分的功能、配电特征、以及算电耦合点。 A. 列头柜(内置 IT 设备):在功能层面,算力需求由 IT 设备处理,IT 设备放置于列头柜内。因此,列头柜的功能是为 IT 设备直接供电。在配电特征层面,根据 A 级算力中心某常用配电架构中的“IT 配电”图9,列头柜由两路通信电源供电,常见的通信电源包括 UPS 和 HVDC。在算电耦合层面,一方面,列头柜的额定容量限制了其内置 IT 设备的容量,进而制约了算力能力和算力需求承载量10;另一方面,列头柜的能耗特征由算力需求及算力功耗塑造。 B. 制冷设备:在功能层面,IT 设备等由制冷设备维持在适宜的温度区间。在配电特征层面,根据 A 级算力中心某常用配电架构中的“动力配电”图11,关键制冷设备由两路通信电源供电,其他制冷设备直接由低压总配电柜供电。在算电耦合点层面,一方面,受制冷设备的制冷能力限制,列头柜(内置 IT 设备)的容量不能无限增加。因此,当 AI 发展正在推动高功率密度机柜的同时,也促进了各种新型制冷技术的发展。另一方面,列头柜(内置 IT 设备)的能耗特征也决定了制冷设备的能耗特征。 C. 通信电源侧蓄电池:在功能和配电特征层面,通信电源系统配备蓄电池,在主电源中断时,维持 IT 设备和部分制冷设备等关键设备无间断运行至少 15 分钟。这种配置提供了从主电源平稳切换到备电的宝贵时间,确保了算力中心的供电可靠性。在算电耦合点层面,一方面,IT 设备和部分制冷设备等关键设备要求在通信电源侧蓄电池供电情况下能保持无间断运行 15 分钟以上,因此蓄电池的容量配置也间接影响算力需求承载量。另一方面,列头柜(内置 IT 设备)与关 9 图 8-13. 10 算力需求承载量定义为:在给定的区域范围和时间范围内,列头柜最多可以承载的固定类型或特定组合的算力需求量,以算力需求功耗曲线关于时间的积分表征。 11 图 6-7. 键制冷设备的能耗特征决定蓄电池的最小备用容量要求,进而影响蓄电池的规划建设、维修安排、闲置灵活性利用策略等。 D. 备电系统:在功能层面,备电是用于保障算力中心在主电源供应发生故障或中断时,能够继续运行若干小时或几个月等较长时间的关键基础设施。柴油发电机是算力中心当前的主流备电之一。在配电特征层面,根据 A 级算力中心某常用配电架构中的“2N 系统”图12,柴发发电机组通过并机馈线柜接入 10kV 电源切换柜。在算电耦合点层面,一方面,算力中心要求在备电供电情况下能继续运行若干小时或几个月等较长时间,因此,备电系统的容量配置也会间接影响算力需求承载量。另一方面,包括列头柜(内置 IT 设备)在内的算力中心主体能耗特征决定备电的最小备用容量要求,进而影响备电系统的规划建设、维修安排、闲置灵活性利用策略等。 E. 园区内常见的辅助能源设备:在功能层面,园区内的其他辅助能源设备主要包括光伏、用户侧独立储能、充电桩等,主要用于探索智慧低碳园区、小规模源网荷储等。在配电特征层面,园区内辅助能源设备可以通过算力中心园区内的高压或低压配电柜接入。在算电耦合点层面,园区内辅助能源设备作为算力中心园区整体的一部分,园区内辅助能源设备与包括列头柜(内置 IT 设备)在内的算力中心主体共用变压器容量,并共同塑造算力中心园区的整体能耗特征。因此,园区内辅助能源设备与包括列头柜(内置 IT 设备)在内的算力中心主体之间存在关联,比如,可以通过园区内辅助能源设备减少用能或者增加出力,在不调整包括列头柜(内置 IT 设备)在内的算力中心主体能耗的同时,改变算力中心园区的能耗特征。 F. 外电:在功能层面,外电是算力中心的主电源。市电是算力中心当前的主流外电。在配电特征层面,根据 A 级算力中心某常用配电架构中的“2N 系统”图,市电通过 35kV 市政电力进线接入算力中心园区。在算电耦合点层面,包括列头柜(内置 IT 设备)在内的算力中心园区整体与电网之间存在耦合。一方面, 12 图 1-5. 算力中心园区作为局部电网一个性点,会对电网的潮流产生影响。另一方面,算力中心园区与电网的交互也受到整体电网负荷的影响,在规划层面,影响体现在额定进线容量的配置上,在运行层面,比如,在每年的迎峰度夏期间,电力紧张时,电网希望算力中心开展需求响应和负荷调整。 (二) 相关主体的不同利益诉求,是算电协同的核心驱动力 算力中心用能的相关主体(以某常用运营结构为例)如图 5 所示,主要包括算力用户、算力中心运营商13、以及电网公司三方主体。以下具体阐述各方主体 的需求。 图 5 算力中心用能的相关主体(以某常用运营结构为例) I. 算力用户:算力用户包括 Google、字性跳动、腾讯、阿里、Microsoft 等头部互联网公司,可从第一性原理、成本效益、以及企业责任三个角度对其用能层面的需求进行分析。从第一性原理而言,算力用户的核心需求是确保业务的可靠性,包括时延和正确率等关键性能指标。因此,一方面,需要保券 IT 设备的用能可靠性;另一方面,在挖掘算力需求及算力功耗的灵活性时,必须以保障业务的可靠性为前提。从成本效益而言,主要包括两方面的需求:一是提升列头柜的算力需求承载量,从而减少基础设施投资,技术手段包括超电管理中的业务主 13 在自建算力中心中,算力中心运营商指的是算力用户的基础设施部门。在Colo(主机托管)算力中心中,算力中心运营商为 Colo 自己;在某些商务合作模式下,算力用户的基础设施部门会共同参与运营。 动在线迁移;二是减少用能成本,技术手段包括电费需量管理等。从企业责任而言,主要需求是减少碳排放。目前,Google、字性跳动、腾讯、阿里、Microsoft等公司已发布减排承诺14。 II. 算力中心运营商:算力中心运营商包括世纪互联、中国联通、中国电信、中国移动、Google、字性跳动、腾讯、阿里、Microsoft 等,其在用能层面的需求可从第一性原理、行业要求、成本效益等三个角度分析。在第一性原理角度,算力中心运营商的核心诉求是满足列头柜(内置 IT 设备)供电的可靠性要求,包括持续性、电能质量等关键性能指标。在行业要求角度,主要包括三方面诉求:一是降低 PUE 值,二是提高绿电使用占比,三是减少碳排放,以符合行业发展趋势和政策导向15。在成本效益角度,诉求是减少综合用能成本,包括电力基础设施建设和运营两个阶段。 III. 电网公司:电网公司包括国家电网有限公司、中国南方电网、以及内蒙古电力有限责任公司等。首先,从第一性原理角度来看,电网公司的核心诉求包括:一是安全高效供电,包括供电的可靠性和电能质量;二是清洁低碳供电,意味着需要消纳更多的绿色电力。其次,从成本效益角度来看,电网公司需要利用算力中心等电力用户侧的灵活性,发掘新型调性能力,以提高整体效率和经济性16。 14 算力用户的减排承诺: 字性: 阿里: Google: Microsoft: 15 要求算力中心运营商降低 PUE 值、提高绿电使用占比、减少碳排的相关政策包括: 国家发展改革委等五部门,《关于深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》,2023. 工业和信息化部等六部门,《算力基础设施高质量发展行动计划》,2023. 16 要求利用算力中心负荷灵活性的相关政策包括:国家发展改革委、国家能源局、国家数据局,《加快构建新型电力系统行动方案(2024-2027 年)》,2024. 三、 如何协同? (一) 列头柜层面:预测算力需求及算力功耗,并挖掘其灵活性 1. 涉及的主体:算力用户、算力中心运营商 列头柜是算力中心供用能架构中的最小单元,也是算力用户和算力中心运营商的最小交互单元。 2. 主要涉及的主体需求:提高算力需求承载量、挖掘潜在灵活性算力用户:提高算力需求承载量。 算力中心运营商:充分利用资源,挖掘潜在灵活性。 3. 主要协同内容:预测算力需求及算力用能,并挖掘其灵活性 预测算力需求及算力用能,并挖掘其灵活性,可以塑造列头柜用能特征。一方面,可以提高算力需求承载量;另一方面,可以为电网提供算力用能部分的灵活性,同时是挖掘算力中心中其他供能单元灵活性的基础。 图 6 算力需求的灵活性示意图 4. 难点:算力-电力当量表征关系不明 5. 例子 1:挖掘 AI 模型训练阶段的用能灵活性 背景:一方面,智算负荷存在波动性,对通信电源以及电网带来运行风险。另一方面,AI 模型训练可容忍对单位时间计算量的波动17,且在未来,随着 GPU资源逐渐下降的稀缺性,GPU 集群单位时间计算量不会保持峰值。 技术路径:通过动态调性 GPU 不同时段的工作频率等,在不影响总计算量和总计算时间的前提下,实现动态调性 AI 模型在训练阶段的功率,从而可以使其用能匹配电力侧信号(包括:电碳信号、可再生能源出力信号)。 技术难点:难以准确量化各调性手段(频率、电压、数量)对 GPU 功耗和计算性能的影响。 6. 例子 2:挖掘算力需求的灵活性,进行超电管理 火山引擎系统部团队开发了一系列基础组件、并且在实验环境下进行了测试链路和集成测试。通过低优驱逐、Intel rapl/AMD hsmp、任务迁移+关机等方法对电力管控方法效果进行了验券。经过努力,2024 年底中国区仅有个位数的包间出现超电现象,超电现象控制在 101%以内。 (二) 算力中心层面:从业务逻辑弱耦合到强耦合,发掘灵活性 1. 涉及的主体:算力中心运营商、电网公司 算力中心层面是电网中的最小电力用户单元,也是算力中心运营商和电网公司的最小交互单元。 2. 主要涉及的主体需求:降低用能成本与碳排、发掘新型灵活性算力中心运营商:减少用能成本、减少碳排。 电网公司:利用算力中心等电力用户侧的灵活性,发掘新调性能力。 17 支撑文献:D. Gu, X. Xie, G. Huang, X. Jin, and X. Liu, “Energy-Efficient GPU Clusters Scheduling for Deep Learning,” May 14, 2023, arXiv: arXiv:2304.06381. Accessed: Jul. 02, 2024. [Online]. Available: http://arxiv.org/abs/2304.06381. 3. 主要协同内容:挖掘算力中心园区中的潜在灵活性 算力中心运营商充分利用资源,挖掘算力中心园区中的潜在灵活性。一方面,可以构建算力中心内部高效、低碳的综合供能体系,降低用能成本和碳排;另一方面,算力中心运营商发掘灵活调性能力,可以为电网提供新型灵活性。 4. 与业务逻辑耦合性较弱的灵活性发掘 思路 与业务逻辑耦合性较弱的灵活性资源:包括园区内常见辅助能源、以及部分备电、部分蓄电池、部分制冷设备。这些资源的总用能曲线可自行调控,且不影响算力中心用能可靠性。 目标:通过协同调控与业务逻辑耦合性较弱的灵活性资源,在不影响业务逻辑的前提下,其用能自动匹配电力侧信号(包括:电碳信号、可再生能源出力信号),实现降低用能成本,提高绿电使用占比,减少碳排。 难点:算力中心园区内各类设备运行一体,如何准确地将与业务逻辑耦合性较弱的部分灵活性资源实时识别并独立控制?这是不影响算力中心用能可靠性的前提。 例子 1:园区综合能量管理 算力中心园区是典型的综合能源系统(冷-热-电),包含太阳能光伏发电、电储能、充电桩等设备。综合能量管理系统(简称 IEMS)18支持电-热-光-储-车等多种能流的高效协同和互动,可以通过优化控制储能、光伏等园区内常见辅助能源提高综合能源利用效率,减少园区总体碳排放。 18 综合能量管理系统的相关介绍: 图 7 园区综合能量管理系统示意图 例子 2:柴油发电机组的灵活性挖掘 火山引擎某华东基地,设计了专门的电力让渡方案,从实操层面,基于经济 分析结算流程,准备了专门的响应方案和应急保障措施。例如,参与响应的现场报常配置储油量原则上不低于 12 小时,并有柴发巡检、供电链路巡检、监控系统安排和应急演练等安排。针对不同场景,如一台柴发故障、两台柴发故障、市电停电等,提出了相应的措施和操作步骤,在 2024 年夏节根据电网要求,实际运行并获取经济性收益。 5. 与业务逻辑耦合性较强的灵活性发掘 思路 业务逻辑耦合性较强的灵活性资源:与列头柜(内置 IT 设备)供能密切的部分备电、部分蓄电池、部分制冷设备。这些资源的用能曲线可以基于业务逻辑进行调控。 目标:通过协同调控算力需求和算力资源、以及与业务逻辑耦合性较强的灵活性,在不影响业务处理性能的前提下,其用能自动匹配电力侧信号(包括:电碳信号、可再生能源出力信号)。 难点:依赖于列头柜(内置 IT 设备)层面的功耗预测技术。 例子:HVDC 侧储备一体电池的闲置灵活性挖掘19 背景 1:HVDC 侧挂储备一体电池是列头柜的供电方式之一。与仅具备用功能的蓄电池相比,储备一体电池具备灵活性,但综合配置成本较高。有必要挖掘 HVDC 侧储备一体电池在备用需求之外的闲置灵活性,以获得额外收益。 背景 2:算力需求及算力功耗通常存在高峰(尤其是智算)。在没有额外电力供应列头柜的常规供电方式下,一方面,为避免供电列头柜的通信电源带载率超出约定阈值,列头柜的算力需求承载量通常低于通信电源的带载能力,供电设备利用率较低;另一方面,当负荷波动过大时,存在通信电源来不及转换、并迫使运行在备电模式的风险,影响供电可靠性。有必要探索一种新型供电方式,以提升列头柜的算力需求承载量,并应对由负荷波动引发的潜在供电风险。 技术路径:聚焦于算力中心内部 HVDC 侧储备一体电池的闲置灵活性,提出了一种高溢价应用场景:一方面,提出一种新型供电方式,实现提高列头柜的算力需求承载量,并应对由负荷波动引发的潜在供电风险,获得高溢价应用;另一方面,同时考虑向电网提供负荷侧灵活性,以获得电力辅助服务市场补偿并降低电费。 技术难点:策略效果与算力需求功耗紧密耦合,因此,依赖于对列头柜(内置 IT 设备)层面的功耗预测技术。 19 支撑文献(团队研究成果):陈敏, 郭庆来, 井汤博, 等. 算电协同探索:HVDC 侧储备一体电池灵活性挖掘[J]. 电力建设, 2025, 46(2): 1-12. a. 提高算力需求承载量的实现思路 b. 向电网提供负荷侧灵活性的实现思路 图 8 HVDC 侧储备一体电池的闲置灵活性应用思路 相关支撑技术:火山引擎某数据中心在室外独立部署了一套 BBS 供电单元, 其基本架构包括整流模块、锂离子电池、监控模块,控制设备、供电模块(PDU)等器件,支持本地运行逻辑部署以及远程调优。从物理形态上,这种架构的优点 时可以实现 BBS 供电单元和服务器机柜物理上的隔离,对于前期各种性能和压力测试的安全性更好,本质上摆脱了原先机柜式 BBS 分布式部署一旦出现安全事故,影响服务器运行的风险。同时,室外独立 BBS 系统具备内部消防和空调系统,进一步加强了其热安全管控能力。BBS 电池系统采用磷酸铁锂电芯,进一步提高了安全性和可靠性。 整套方案预计通过峰谷电价差套利,预计可以性省 10-15%左右的电力成本。设备将采集电池电流,电压,SOC 状态,结合电池电压设置、峰谷套利时段设置、充放电功率限制等约束条件,判断 IDC 运行场景,进而进行峰谷价差套利工作。此外,针对可能数据中心可能出现的多种场景,方案通过预制控制逻辑,对 N 种潜在场景可能出现的突发情况进行了方案预制,规避了多种潜在风险。 图 9 火山引擎某数据中心在室外独立部署的 BBS 供电单元的基本架构 (三) 局部电网层面:高比例可再生能源局部电网本地自治 1. 涉及的主体:算力中心运营商、电网公司 2. 主要涉及的主体需求:绿电供应、绿电消纳 算力中心运营商:绿电供应,实现提高绿电使用占比。电网公司:绿电消纳,实现清洁低碳供电。 3. 主要协同内容:围绕算力中心的高比例可再生能源局部电网自治 以新能源为供电主体的供电体系,灵活性本就匮乏。在此基础上,围绕算力中心的高比例可再生能源局部电网(甚至孤立电网),叠加了供电可靠性要求高、高能耗、波动性和周期性并存的算力集群外用电特征,这使得灵活性问题更加突出。因此,需要充分挖掘算力集群自身的灵活性,助力围绕算力中心的高比例可 再生能源局部电网安全可靠运行。 图 10 围绕算力中心的高比例可再生能源局部电网结构示意图 4. 例子:基于氢储能的算力集群备电替代 背景 1:备电是保障算力中心用电可靠性的关键设施。柴油发电系统是算力中心当前的主流备电之一。但柴油发电机组综合成本较高(包括:投资成本和运维成本,基本处于闲置状态),且对减碳不友好。 背景 2:氢储能具有中长时存储成本低、储量放大能力强等特点,氢储能与电化学短时储能技术配合,有望解决波动性风光可再生能源大规模接入带来的新型电力系统多时间尺度电力电量平衡问题,实现电力能源的清洁可靠供应。然而,氢储能的安全管理要求较高,适合由专业人员集中进行管理。 技术路径:以算力集群为对象,研究不同算力比选下的算力集群用电(包括:可靠性要求和负荷曲线)和灵活性特征差异,在此基础上,构建基于氢储能的绿色备电替代技术路线:“柴发+氢储能+电化学储能”的算力集群备电体系。一方面,对于算力集群来说,实现降低备电综合成本,同时减少碳排;另一方面,可以支撑新型电力系统供电体系建设中对绿色长时储能的需求。 关键技术:包括氢储能系统的工艺优化与配置技术、氢储能系统的并离网接入与控制技术、考虑算力集群备电需求保障的经济低碳调度技术。 (四) 大规模“算力网+电力网”层面:跨区优化调度 1. 涉及的主体:算力用户、算力中心运营商、电网公司 2. 涉及的主体需求:降低用能成本与碳排、绿电消纳算力用户:降低用能成本与碳排。 算力中心运营商:降低用能成本与碳排。 电网公司:利用算力中心等电力用户侧的灵活性,发掘新调性能力,提升新能源消纳能力。 3. 主要协同内容:在大规模“算力网+电力网”中的负荷迁移与优化调度目标:通过算力网络中的业务迁移,让业务耗能自动匹配电碳信号、可再生 能源出力等电力侧信号的时空特性,实现降低算力网层面的用电成本和碳排,提 升电力网层面的新能源消纳。 问题本质:多主体下,考虑复杂数据流约束的多算力需求、供给中心和考虑复杂潮流约束的多电力送端、受端性点间的协同优化。 关键技术:长距离算力迁移的通信保障和数据安全保障、算力负荷(比特)与电力负荷(瓦特)的当量模型、跨行业联合优化的隐私计算等。 四、 结语 伴随 AI 的迅猛发展,算力中心发展迅速,能源需求增长不容忽视。与常见负荷相比,算力中心负荷存在特殊性,其同时具备功耗密度高、潜在波动性强、可靠性要求高、绿色性要求高、以及时空灵活性可观、阶段性发展等特征。通过充分挖掘算力中心与算力系统中的负荷灵活性,可以利用算力和电力的协同性来提升新能源系统友好性能、并优化算力负荷用能结构与成本。 在此背景下,可以从不同层次展开技术攻关,包括列头柜层面、算力中心层 面、局部电网层面、大规模“算力网+电力网”层面。总体而言,从技术可行性角度而言,核心技术是算力需求功耗的预测与调控,关键技术是基于算力需求功耗预测与调控技术的算力中心与算力系统中各部分灵活性的实时识别、独立调控、以及协同调控。核心难点在于:算力中心中各类供能保障设备运行一体,并与算力需求功耗紧密耦合,需要严格论券并保障算力需求供能的高可靠性。从经济可行性角度而言,首先需要根据第一性原理满足相关主体的不同利益诉求,其次是行业要求、成本效益、社会责任等的考量。 希望在多种技术与机制推动下,尽早实现高比例新能源驱动算力中心低碳、可靠、经济运行,助力“能源与 AI 这对美妙的双螺旋”的融合与发展。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服