1、 1东数西算下新型算力基础设施发展白皮书单志广 何宝宏 张云泉 著东数西算下新型算力基础设施发展白皮书出品单位:支持单位:2编写委员会顾问:陈润生 陈国良 郑纬民 袁国兴主编:单志广 何宝宏 张云泉执行主编:安 静 王海峰 张广彬编委:沈文海 陈学斌 方 娟 贾海鹏 赖能和 袁 良 张延强 王丹丹 陈 栩 涂菲菲 刘 殷 戴 彧 宋心荣 舍日古楞 徐凌验 张 翼 李英浩特别鸣谢:清华大学 益企研究院参编单位:国家信息中心 信通院云大所 中科院计算所 清华大学 国家气象中心东数西算下新型算力基础设施发展白皮书 3东数西算下新型算力基础设施发展白皮书P04“东数西算”定义和解读P08 前言P09
2、第一章 东数西算对算力新基建的影响 P10数据中心布局向供需协调有序、综合能效优化演进P13东数西算向时延要求低、存算要求高类型应用场景拓展P15算力结构呈现多元算力协同、算网一体化发展态势 P16 产业链上下游集聚发展,生态体系逐步壮大完善P16绿色低碳技术推广应用,清洁能源供给不断加大P18新老节点加快有序衔接,强化算力网络智能调度P19数字技能水平要求提升,技能人才需求不断凸显P21 第二章 算力新基建呈现的 10 大挑战和实践P23算力基础设施化保障资源多元供给P32关键信息基础设施的安全性要求P36信创产业化:国产化、自主化P38算力设施整体能耗偏高,绿色低碳应用仍需持续推广P43高
3、密度机柜功率密度提升P46算力智能调度:跨区域、跨云、云边调度P50多元算力多样计算P52算力服务成为新业态P54原生应用:云原生、AI原生P57规模化和算网融合P63 第三章 展望面向 2030 年的算力基础设施P64数字文明时代加速到来,要求算力基础设施资源充沛、泛在普惠P65隐私计算为代表的技术为组织间数据流通提供解决方案P67可信隐私计算是未来数据要素化的理想技术方案之一P69Web3.0驱动规模化、泛在化的智能算力构建P71第五范式AIforScience对算力的需求P73大模型成为人工智能工程化重要方向,智能算力需求几何级增长P75边缘创新与新兴应用P76自动驾驶进入无人化新阶段,
4、云边端高效协同目录 CONTENTS 4“东数西算”定义和解读一、东数西算工程今年 2 月,国家发展改革委会同中央网信办、工业和信息化部、国家能源局等有关部门,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏 8 地启动建设国家算力枢纽,并设立 10 个国家数据中心集群,正式启动“东数西算”工程,构建全国一体化大数据中心协同创新体系。与“西气东输”“西电东送”“南水北调”等工程相似,“东数西算”是一个国家级算力资源跨域调配战略工程,针对我国东西部算力资源分布总体呈现出“东部不足、西部过剩”的不平衡局面,引导中西部利用能源优势建设算力基础设施,“数据向西,算力向东”,服务东部沿
5、海等算力紧缺区域,解决我国东西部算力资源供需不均衡的现状。“东数西算”定义和解读图片来源:https:/ 5东数西算下新型算力基础设施发展白皮书二、东数西算内涵“东数西算”是“全国一体化大数据中心协同创新体系”的一个下辖概念,而后者旨在推进技术、业务、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的数据协同管理和服务,其实现方式不是固定不变的。因此,不一定过度强调“东数西算”,面对不同应用场景,还可能有东数东算、南数北算等模式,应因地制宜。但无论哪种模式,都有着共同的目标:一是促进数据中心资源最大化共享、流通和利用,二是通过数据中心的系统化布局,促进国家碳达峰、碳中和战略实现。三、东数西
6、算与算力基础设施化 算力代表了对数据的处理能力,是数字化技术持续发展的衡量标准,也是数字经济时代的核心生产力。东数西算项目是促进算力、数据流通,激活数字经济活力的重要手段。东数西算首次将算力资源提升到水、电、燃气等基础资源的高度,统筹布局建设全国一体化算力网络国家枢纽节点,助力我国全面推进算力基础设施化。算力基础设施化并不简单等同于算力总量的拉升。算力的基础设施化并不是简单的算力堆砌,当前各类机构的算力总量测算方式都是将各行业、各公司的私有算力进行累加,甚至还会加上手机终端等移动端的算力,这些算力确实能够服务一定的群体,但算力资源并不能面向全社会提供统一一致的服务。6四、东数西算与绿色节能东数
7、西算是促进绿色节能,助力实现碳达峰、碳中和目标的重要手段。目前东部算力需求旺盛,但东部地区在气候、资源、环境等方面不利于低碳、绿色数据中心的建设。通过算力基础设施的西部迁移,可以充分发挥西部区域气候、能源、环境等方面的优势,引导数据中心向西部资源丰富地区聚集,扩大可再生能源的供给,促进可再生能源就近消纳,加强数据、算力和能源之间的协同联动,助力我国数据中心实现低碳、绿色、可持续发展,完成碳达峰、碳中和目标。“东数西算”工程聚焦创新节能,在集约化、规模化、绿色化方面着重发力,支持高效供配电技术、制冷技术、节能协同技术研发和应用,鼓励自发自用、微网直供、本地储能等手段提高可再生能源使用率,降低数据
8、中心电能利用率(PUE),引导其向清洁低碳、循环利用方向发展,推动数据中心与绿色低碳产业深度融合,建设绿色制造体系和服务体系,力争将绿色生产方式贯彻数据中心全行业全链条,助力我国在 2060 年前实现碳中和目标。五、“东数西算”工程“五个一体化”的目标建设东数西算把东部地区的非实时算力需求以及大量生产生活数据输送到西部地区的数据中心进行存储、计算并反馈。在其上则是希望构建更绿色、更平衡和更高效的国家算力网络体系,以满足新时代各行各业数字化转型、数字技术与生活场景加速融合所带来的海量计算、传输、存储需求,最大化实现数据中心产业绿色集约发展,推动资源统筹利用和西部数字经济建设。“东数西算”定义和解
9、读 7东数西算下新型算力基础设施发展白皮书 网络一体化 围绕集群建设数据中心直连网,建立合理网络结算机制,增大网络带宽,提高传输速度,降低传输费用。围绕集群稳妥有序推进新型互联网交换中心、互联网骨干直连点建设。能源一体化 从国家双碳战略整体规划出发,充分发掘西部丰富的风光等可再生资源,应对好可再生能源波动性问题,扩大清洁能源市场化交易范围,促进建立清洁能源消纳的市场化机制。从整体规划层面对数据中心集群进行统一能耗指标调配。算力一体化 在集群和城区内部的两级算力布局下,推动各行业数据中心加强一体化联通调度,促进多云之间、云和数据中心之间、云和网络之间的资源联动,构建算力服务资源池。数据一体化 建
10、设数据共享开放、政企数据融合应用等数据流通共性设施平台。试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可信流通环境。应用一体化 开展一体化城市数据大脑建设,选择公共卫生、自然灾害、市场监管等突发应急场景,试验开展“数据靶场”建设,探索不同应急状态下的数据利用规则和协同机制。关于“东数西算”工程“五个一体化目标”阐述来源:中国工程院院士、清华大学计算机科学与技术系教授郑纬民https:/ 8前言2022 年初,国家发展改革委、中央网信办、工业和信息化部、国家能源 局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵 州、甘肃、宁夏等 8 地启动建设国家算力枢纽节
11、点,并规划了 10 个国家 数据中心集群,标志着“东数西算”工程正式全面启动。数据中心不仅是算力的聚集地,也是数据应用的发祥地,更是企业数字化 转型的根据地。2022 年发布的“十四五”数字经济发展规划第一条支线即为底层信息网络基础设施建设领域,包括 5G、数据中心、光纤宽带等,可以理解为此前反复强调的“新基建”的延续。东数西算工程从国家战略、技术发展、能源政策等多方面综合考虑,将算力资源提升到水、电、燃气等基础资源的高度,统筹布局建设全国一体化算 力网络国家枢纽节点,在实现数据中心一体化协同创新的要求方面,给出了高质量的解决方案,助力我国全面推进算力基础设施化,其战略价值已经被大家认同。但在
12、具体实施落地过程中,需要解决诸多问题,诸如实现数据中心有效整合、优化算力布局,降低算力成本、完成算力调度、实现算网融合、政府作用与市场力量有机结合等关键问题。为此,中国智能计算产业联盟、益企研究院基于实践调查、探索研究后提 出了几个维度的洞察,并分析东数西算对新型算力基础设施发展的影 响、新型算力基础设施的技术架构的迭代和演进,以及如何通过技术驱动提升算力新基建的竞争力。9东数西算下新型算力基础设施发展白皮书CHAPTER1东数西算对算力新基建的影响东数西算下新型算力基础设施发展白皮书 10数据中心布局向供需协调有序、综合能效优化演进数据中心按照规模,分为超大型数据中心、大型数据中心和中小型数
13、据中心。按照主要处理的业务类型,又可分为边缘计算类、低时延类、中时延类和高时延类。数据中心建设作为资本密集、技术密集型投资,数据中心地理位置的选择与其投资规模、投资成本、数据中心类型、服务质量、经济效益等因素紧密相关。随着全国一体化大数据中心体系总体布局的实施,在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设 8 个国家算力枢纽节点,并规划了张家口集群、长三角生态绿色一体化发展示范区集群、芜湖集群、韶关集群、天府集群、重庆集群、贵安集群、和林格尔集群、庆阳集群、中卫集群等 10 个国家数据中心集群。重点从顶层设计层面加强数据中心布局、算力、数据、网络、电力、能耗等方面的全
14、国性统筹规划、一体化发展,数据中心的布局也将更加规范和优化。数据中心在选址布局时也将呈现如下变化。一是数据中心选址向算力需求中心聚集。当前我国数据中心分布以大湾区、长三角、京津冀经济人口等较发达地域为主,在用数据中心中约 80%集中在用户规模较大、应用需求强烈的互联网骨干节点所在省市及周边人口稠密、经济发达、总部企业密布一线城市。截至 2021 年底,北京及周边、上海及周边的数据中心机架数量排列分列一二。CHAPTER1 东数西算对算力新基建的影响图片来源:2021 中国云数据考察报告 11东数西算下新型算力基础设施发展白皮书但是随着北京、上海、广州等一线城市土地、能耗指标日益缩紧,对数据中心
15、的政策 约束愈加严格,已建数据中心已远远不能满足城市经济发展对算力的需求,一线城市 周边地区逐渐成为互联网数据中心的首要选择。例如,紧邻北京的张家口、廊坊,靠 近上海的南通、昆山,距离广深不远的韶关、云浮、清远等都是数据中心密集落户的地区。阿里云五大超级数据中心选址乌兰察布、张北、南通、杭州、河源,均位于在 中心城市周边。随着 10 个数据中心集群的规划建设,数据中心供给结构优化,扩展算力增长空间,政策方面也明确要求对于符合条件且纳入国家枢纽节点数据中心集群范围的建设项目,积极协调安排能耗指标予以适当支持,实现大规模算力部署与土地、用 能、水、电等资源的协调可持续。二是数据中心选址向综合能效最
16、优聚集。数据中心的主要运营成本包括土地、水、电、运 维等要素,运营成本因为区位的不同有显著的差异,其中,高能耗导致的高电力成本 是制约数据中心发展的主要因素之一。在土地、气候、政策、能源供给等优势加持下,数据中心建设选址向可再生能源丰富、气候适宜、数据中心绿色发展潜力较大、综合能 效最优的节点城市聚集,着重提升算力服务品质和利用效率,充分发挥资源优势,夯 实网络等基础保障,积极承接全国范围需后台加工、离线分析、存储备份等非实时算数据中心选址向算力需求中心聚集数据中心选址向综合能效最优聚集数据中心选址向用户终端靠近010203 12力需求,打造面向全国的非实时性算力保障基地。通信运营商、互联网企
17、业等也纷纷 将数据备份存储、大数据处理等对网络时延要求较低的业务向综合能效优势地区转移。例如,内蒙古乌兰察布“草原硅谷”,吸引了华为、阿里、快手等知名企业来此设立数据中心。西南地区的“云上贵州”吸引了苹果、腾讯、华为等企业,2021 年贵阳贵安成为全球集聚超大型数据中心最多的地区之一,数字经济占比达 34%。甘肃的“云天中卫”建成了亚马逊、美利云、中国移动、中国联通、天云网络、创客超算 6 个大型、超大型数据 中心,中国电信、炫我科技、爱特云翔、中国广电 4 个数据中心也在加快建设。三是数据中心选址向用户终端靠近。随着超高清视频、虚拟现实/增强现实(VR/AR)、金融支付、金融证券、自动驾驶、
18、工业制造、远程医疗等对网络时延要求较高的业务的广泛应用,靠近用户侧,作为算力“边缘”端的边缘计算型、中小型数据中心建设逐渐成为趋势。广东省 5G 基站和数据中心总体布局(2021-2025)提出,原则上只可建中型及以下的数据中心,承载边缘计算和低时延业务,中时延业务逐步迁移至粤东粤西粤北地区,高时延业务更要求迁移至省外。北京市数据中心统筹发展实施方案(2021-2023 年)提出,适度利用腾退后资源和空间改造建设边缘计算中心,支撑低时延业务应用,服务智慧城市、车联网等重点应用场景落地。除边缘计算中心外,东、西城区禁止新建或扩建数据中心。因此,数据中心选址时还会考虑数据CHAPTER1 东数西算
19、对算力新基建的影响 13东数西算下新型算力基础设施发展白皮书中心功能定位、数据处理要求、所承载业务的时延敏感性等因素合理选择新建数据中心的地理位置,例如自动驾驶(车联网)、工业制造(机器人)、远程医疗、金融证券等对时延非常敏感的网络应用的数据中心,可以选择在节点城市内部发展,服务后台加工、离线分析、冷数据存储备份等对时延不敏感的网络应用的数据中心,就可以优先向贵州、内蒙古、甘肃、宁夏节点转移,实现资源优化配置,提升资源使用效率。东数西算向时延要求低、存算要求高类型应用场景拓展带宽和时延是信息传输的两个关键指标,受限于物理规律,无论网络带宽多大,传输速度多快,传输时延都是客观存在的。因此,在“东
20、数西算”中,工业互联网、灾害预警、远程医疗、自动驾驶等需要被计算节点频繁访问、网络时延要求高的实时在线类“热数据”不适合“西算”,而离线分析、后台加工、存储备份等离线类访问频率低、网络时延要求不高的“冷数据”以及介于两者之间的“温数据”,则更适合“西算”。虽然“东数西算”在网络时延上的限制使其不适用于时效紧迫型的数据应用,但是“东数西存”“东数西渲”“东数西训”,以及未来的“东云西库”等对存力、算力要求高,但对数据实效性要求不高的应用场景将成为“东数西算”未来应用的重要支点。一是“东数西存”应用空间极其广阔。数字经济的发展推动海量数据的产生,这些数据的存储需要有强大的存力支持。从一般的统计来看
21、,社会运行所产生的数据中,冷、温、热数据的占比分别为 80%、15%、5%,其中冷数据是存量最多的数据1。对于冷数据来讲,计算不是常态,其最主要的需求还1.邬贺铨:东数西算实为“东数西存”如何处理冷热数据值得研究 https:/ 东数西算对算力新基建的影响 15东数西算下新型算力基础设施发展白皮书模拟、材料计算、生物信息等开始探索适用于“东数西算”场景。如格点量子色动力学的大规模数值模拟,涉及场景多、应用广,是最耗费计算资源的科研领域之一,其运算过程以及运算后海量组态数据分析,就适合于东数西算场景。又如材料基因组工程的各类高通量计算,每个计算任务之间无耦合,可以分配到任何可用节点,因此可以充分
22、利用超算互联网连接的各超算中心的闲置资源。目前,中西部地区新建的数据中心已经开始面向全国科研用户提供绿色普惠的高性能一体化算力服务。总的来说,“东数西存”“东数西渲”“东数西训”等应用场景是推动“东数西算”均衡发展的有效途径,通过对东西部算力、存力等资源供需关系的合理匹配,让“东数西算”融入到各个实际业务场景中,赋能千行百业的高质量发展。算力结构呈现多元算力协同、算网一体化发展态势一是算力设施多元化布局加快推进。一方面,“东数西算”工程布局空间跨度大,增加 了数据传输时延,为有效解决这一问题,不仅需要高效灵活的东西部算力资源调度机 制,也需要对东西部各类算力资源,包括通用算力、智算算力、超算算
23、力、边缘算力 等的配比进行优化,算力设施的异构化、多样化供给需求将明显增强。另一方面,智 能化正以前所未有的速度在我国重塑各行各业,人工智能应用场景呈现出多元化、规 模化发展趋势,除了通用算力,对智能算力的需求与日俱增。工信部新型数据中心 发展三年行动计划(2021-2023 年)提出,到 2023 年底,全国数据中心总算力超 过 200EFLOPS,高性能算力占比达到 10%。综上,我国算力基础设施迎来了大规模需求的繁荣期,结合不同应用场景需求的多元化布局将加快推进。二是算力网络一体化格局加速形成。全国一体化大数据中心协同创新体系算力枢纽 实施方案提出要构建一体化的新型算力网络体系,在通用算
24、力方面,工信部数据显 示,截至 2021 年底,我国在用数据中心机架总规模超过 520 万标准机架,平均上架 率超过 55%。在智算算力方面,公开资料显示,当前全国智算中心已超过 20 个,主 要分布在东部和中部地区。在边缘算力方面,我国还处于起步阶段,但在工信部公布的 2021 年国家新型数据中心典型案例名单中,已有 12 个边缘数据中心入选。随着“东数西算”工程的推进,以及多元算力适配与调度、算网融合等关键技术的突破,全国算力网络一体化格局将加速形成。16产业链上下游集聚发展,生态体系逐步壮大完善算力新基建产业链条长、覆盖门类广、投资规模大、带动效应强,“东数西算”工程将推动新建数据中心尤
25、其是大型、超大型数据中心向中西部地区以及北上广深等一线城市周边布局,同时带动相关产业有效转移集聚,促进东西部数据流动、价值传递。如中科曙光近年来在重庆、太原等地积极布局,探索实现了“以算促用”、“以算带动创新”。一方面,从中短期看将直接拉动产业链上游和中游发展。“东数西算”工程的启动实施,将直接拉动新一轮数据中心建设投资,IDC 基建率先受益。据统计,自 2022 年以来,全国 10 个数据中心集群中,新开工项目达到 25 个,数据中心规模达 54 万标准机架,带动各方面投资超过 1900 亿元2。网络建设是算力均衡布局的基础,符合“东数西算”需求的网络特别是西部网络建设将全面提速,加速光纤通
26、信向全光网演进。此外,在全球数据激增和“双碳”战略的大背景下,“东数西算”工程对数据中心建设标准更为严格,平均上架率至少要达到 65%以上,对 PUE 也提出了更高的要求,绿色、低能耗的数据中心基建设备、边缘计算等环节将迎来持续发展机遇,温控散热技术有望实现升级。另一方面,从长期看将逐步壮大完善产业生态体系。“东数西算”工程实施后将加速推动数据中心上游设备制造业和下游数据要素流通、数据创新型应用和新型消费产业等集聚发展,西部地区有望吸引数据加工、数据清洗、数据内容服务等偏劳动密集型产业落地。此外,随着数据规模和算力水平的提升,将有效激发数据要素创新活力,培育涌现出一批数据交易所、算力运营商、余
27、热利用经销商、绿色数据中心评价机构等新模式新业态。绿色低碳技术推广应用,清洁能源供给不断加大因此,不一定过度强调“东数西算”,面对不同应用场景,还可能有东数东算、南数北算等模式,应因地制宜。但无论哪种模式,都有着共同的目标,一是促进数据中心资源最大化共享、流通和利用,二是通过数据中心的系统化布局,促进国家碳达峰、碳中和战略实现。2.国家发展改革委高技术司负责同志就“东数西算”投资建设进展相关问题答记者问https:/ 东数西算对算力新基建的影响 17东数西算下新型算力基础设施发展白皮书一是数据中心绿色低碳发展。数据中心作为“东数西算”工程重要算力基础设施,高能 耗是其显著特征。面向“碳达峰”“
28、碳中和”发展目标,国家和地方持续出台一系列政策,进一步规范了数据中心的能耗管理和 PUE 值,如图所示,明确要求全国新建大型、超大型数据中心平均电能利用效率(PUE)降到 1.3 以下,国家枢纽节点进一步降到 1.25 以下,绿色低碳等级达到 4A 级以上。北京根据数据中心建设规模,将 PUE 准入水平分别设定为 1.3、1.25 和 1.15。上海数据中心新建项目 PUE 控制在 1.3 以下,改建项目控制在 1.4 以下,集聚区新建大型数据中心综合 PUE 降至 1.25 以下。旨在有序推动数据中心绿色高质量发展。二是推动清洁能源有效利用。据统计,2021年,我国数据中心年耗电量2161亿
29、千瓦时,约占全国总用电量的 2.6%。且我国当前在用数据中心机架主要分布在北上广及其周边地区,能源使用压力巨大。从一体化大数据中心算力枢纽节点来看,内蒙古、甘肃、宁夏、贵州等省份是我国清洁能源大省,除贵州拥有丰富的水电资源外,其他三地都是风光资源的“富集区”,“东数西算”工程实施,承接东部算力需求的潜力,将大幅提升绿色能源PUE值要求年份201720182019202020212022国家和地方政策对数据中心 PUE 值要求演变图 18的需求,提高西部地区的绿色能源消纳水平。三是节能减排实践加速涌现。液冷、蓄冷、高压直流、余热利用、蓄能电站等技术应用,以及太阳能,风能等可再生能源利用,进一步降
30、低数据中心能耗及碳排放。中科曙光经过十年研制成功的浸没式相变液体冷却技术可以将计算系统的 PUE 值降到 1.04,达到全球领先水平。建设运营绿色低碳数据中心实践不断涌现,百度云计算(阳泉)中心应用市直供+HVDC、自研“零功耗”置顶冷却单元及 AI 调优技术,年均达到 1.08。西部(重庆)科学城先进数据中心通过采用浸没液冷、光伏发电、微模块等技术,整体综合 PUE 低至 1.14。新老节点加快有序衔接,强化算力网络智能调度一方面,将加快新建算力设施和已有算力设施衔接配合。“东数西算”工程是一个让算力资源从过去的分散到相对集中,从个体运营到国家统筹的过程。“东数西算”不是单CHAPTER1
31、东数西算对算力新基建的影响图片来源:2021 中国云数据考察报告 19东数西算下新型算力基础设施发展白皮书纯的覆盖原有的算力设施,按照算力设施目前布局情况,除了“东数西算”要建设的节点集群外,原来各个地方已经有大量的数据中心、超算中心和智算中心,将促进新建和已有算力设施的有机融合。当前,京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏、山东等地出台了一体化算力网络建设方案,通过科学规划布局,使国家数据中心的集群和现有的各地各类型的算力设施统筹衔接和配合,从而形成合理分工、科学联动、高效协作的机制。另一方面,将推动东西部算力设施供需匹配和智能调度。“东数西算”要面临很多类型的数据处理
32、需求,以及多样化的业务需求,如何保证东数和西算形成有效的供需匹配成为一个重要难题。如果没有业务保障,算力设施就无法发挥应有作用,从而造成设施空置和能源空耗。算力设施供需匹配将会在国家层面、省市级层面、企业层面、业务层面等多个层级开展面向性能、面向价格、面向效益的多方面测算,从而形成真正的应用需求供给和可持续的劳动力机制。进一步地,作为“东数西算”未来的神经中枢,算力网络的集中化调度是重中之重,有利于将所有的网络资源包括带宽资源和云资源进行统一调度,实现算力网络的云网协同。数字技能水平要求提升,技能人才需求不断凸显一方面,算力基础设施规模化绿色化智能化趋势明显,数据中心运营人才短缺。数据中心是数
33、字技术创新的高地,随着数据中心绿色低碳、智能运营、算网调度等要求的不断升级,将加大对大数据、云计算和人工智能等相关高技术领域的人才需求。人社部中国就业培训技术指导中心的新职业在线学习平台发展报告指出,未来 5 年,大数据、云计算产业人才缺口将高达 150 万。掌握云架构、云配置管理、IT 基础设备管理、信息安全、数据中心综合管理以及节能减排等技能人员成为未来数据中心最为抢手的技术“东数西算”工程是一个让算力资源从过去的分散到相对集中,从个体运营到国家统筹的过程。20领域人才。目前,就业与招工难在数据中心行业同时并存,数据中心权威机构 Uptime Institute 的报告显示,调查的受访人当
34、中,有一半表示目前很难找到空缺职位,远远高于 2018 年的 38%;从企业端看,数据中心对复合人才需求巨大,很多求职者并不符合招聘职位的要求,高等院校目前难以培养出足够的技术人才。另一方面,算力设施普及将加速各领域数字化转型步伐,数字技能人才需求加大。“东数西算”不仅有助于改善数字基础设施不平衡的布局,而且有助于企业更好地提供云存储、云计算、数据工具、研发平台、AI 技术等服务,进一步降低上云用数成本,加快更多传统企业及中小企业实现数字化转型。数字化人才储备是数字化转型的关键,当前中国劳动力市场的数字化人才短缺。根据 IDC中国中小企业调查企业数字化挑战,2022报告显示,超 10%的企业不
35、具备数字化的 IT 能力,15%的企业不了解如何进行数字化转型,超 20%的企业存在员工 IT 技能不足的问题。数字经济就业影响研究报告指出,2020 年中国数字化人才缺口接近 1100 万。根据人社部发布的相关报告测算,我国人工智能人才目前存在较大缺口,国内供求比例为 1 10,供需比例严重失衡。10%15%20%超 10%的企业不具备数字化的 IT 能力超 20%的企业存在员工 IT 技能不足的问题15%的企业不了解如何进行数字化转型 IDC中国中小企业调查企业数字化挑战,2022CHAPTER1 东数西算对算力新基建的影响 21东数西算下新型算力基础设施发展白皮书CHAPTER2算力新基
36、建呈现的 10 大挑战和实践东数西算下新型算力基础设施发展白皮书 222021 年 12 月,国务院印发“十四五”数字经济发展规划提出,到 2025 年,数字经济迈向全面扩展期,数字经济核心产业增加值占 GDP 比重达到 10。发展数字经济,已经成为中国经济战略的重中之重。发展数字经济,算力又是重要支撑,算力作为核心生产力成为共识。2018 年,中国科 学院计算技术研究所研究员张云泉提出算力经济概念,指出以计算为核心的算力经济 将成为衡量一个地方数字经济发展程度的代表性指标和新旧动能转换的主要手段,算 力经济涵盖算力基础设施、算力资源、算力服务和算力应用等产业。从中国信通院发 布的数据来看,在
37、算力中每投入 1 元,带动 3-4 元经济产出;算力发展指数每提高 1 点,GDP 增长约 1293 亿元。数据来源:中国算力发展指数白皮书同样,将罗兰贝格算力估算结果同 IMD 智能化水平评估结果进行比对,发现国家分类结果基本吻合,从而证明人均算力与国家智能化水平正相关。算力在生产生活中的应用越来越多,数据潜力才会不断被挖掘,因此加快算力基础设施建设,优化算力资源布局、支持跨区域算力网络实时、灵活调度运营,提升算力应用强度至关重要。CHAPTER2 算力新基建呈现的 10 大挑战和实践 23东数西算下新型算力基础设施发展白皮书一、算力基础设施化 保障资源多元供给综合来看,算力是硬件和软件配合
38、共同执行某种计算需求的能力。算力服务是提供算力的一种商业模式,是包括算力生产者、算力调度者、算力服务商以及算力消费者在内的算力产业链上算力经济模式的统称。在加速算力服务核心技术创新发展方面,未来需要加强算力网络、基础设施化、开放应用模型、云边协同、云原生等算力服务核心技术布局,打造开放灵活的算力服务用户平台,推动算力经济供给侧改革,激发算力服务的范式创新。让算力像水、电资源一样随取随用,使算力服务成为一种公共服务,是 61 年前“人工智能之父”约翰麦卡锡的预测。但不同于标准化的电力,因为数据来源、结构存在多样性和复杂性,一些特定场景对计算能力的要求或者对计算特性的要求会越来越多,如 24云计算
39、的推广,使得算力得以普惠化。用户按需采购算力、存储、带宽即可开展业务,可以将精力集中在拓展、开发新的应用,专注于本行业的知识创新AI 服务、音视频服务等场景有足够的市场,显然通用计算无法满足其效率需求。与此同时,企业为寻求更加敏捷、灵活和高效的应用开发模式,以加速应用的创新和快速上市,如容器、微服务和 DevOps,这些应用开发模式拉近了业务和计算平台之间的联系,应用开发团队将定义基础设施的性能、可用性和规模,直接推动计算平台架构的变革和创新。算力基础设施化并非易事,随着多样性技术路线的引入和发展,以GPU、FPGA 为代表的异构计算与以 ARM 为代表 CPU 架构的兼容性问题更加突出,多样
40、性算力的标准化度量与输出成为挑战。不同算力平台(超级计算中心、云数据中心、智能计算中心)的技术方案、系统架构、软件平台、硬件设备、服务保障存在很大差异。要加快算力基础设施化进程,需要多类算力基础设施并行发展,保障算力资源的多元供给,围绕强化数字转型、智能升级、融合创新支撑来统筹布局云数据中心、智能计算中心,超级计算中心等算力基础设施建设。1)算力服务能力是云数据中心的基石云计算的推广,使得算力得以普惠化。用户按需采购算力、存储、带宽即 可开展业务,可以将精力集中在拓展、开发新的应用,专注于本行业的知 识创新,而不必在基础硬件、系统、网络、安全等需求上重复建设,也不用担心业务快速发展时受困于系统
41、瓶颈。自此,不论是大中小型企业,亦 或是个人,都可以通过不同形式的云(IaaS、PaaS、SaaS)获得需要的服务。我国的云数据中心作为数字化基础设施的核心节点,这几年飞速发展。云数据中心不仅是算力的聚集地,还是数据应用的发祥地,更是企业数字化CHAPTER2 算力新基建呈现的 10 大挑战和实践 25东数西算下新型算力基础设施发展白皮书转型的根据地。益企研究院在实地考察 8 个国家算力枢纽节点、7 个数据中心集群后发现,算力基础设施的使用效率,会直接影响到云服务商的创新能力和盈利能力。全方位的计算力服务能力是云服务商竞争力的基石,云服务商不断优化硬件基础设施提升算力效率,尤其在服务器产品层面
42、,通过高计算密度提供高算力和能效比,通过高速互联技术提升集群的扩展性,通过高度集成化设计、模块化和冗余设计简化交付部署流程,通过高效率散热系统打造绿色节能的集群系统。在数据中心内部,基于云数据中心规模化优势,云服务商通过规模化、定制化能力支撑各项新型业务,将新的技术应用于云服务器来适配云端业务场景,通过完善从底层到应用层的自研技术体系,不断优化硬件基础设施提升算力效率,快速灵活对市场做出反应。为通用算力输出单元的 CPU 也走向多元化:ARM 阵营百花齐放。对云服务商而言,一方面需要 CPU 有更强的核心和更多的核心数,另一方面需要不同的 CPU 满足客户多元化细分场景的需求,都与效率有着密不
43、可分的关系。最大的变化是,在自主可控的大潮推动下,中国“芯”力量正在崛起,国产 CPU 龙头海光信息成功登陆科创板,成为2022 年半导体领域知名的 IPO 事件,海光、龙芯、飞腾等产品的技术成熟度和应用范围正在追赶主流。26从数字中国万里行的洞察中发现,云数据中心完成多元算力的布局,但多元算力的多元的开发生态体系相对独立,应用的跨架构开发和迁移困难,亟需通过开源、开放的方式建立可屏蔽底层硬件差异的统一异构开发平台。在数据中心基础设施层面,新基建、双碳、东数西算,每年都有新热点,背后的指导思想则是一以贯之,兼顾效率与均衡、可持续的发展。从国家战略层面来说,希望通过建设高效集约、普适普惠的新型基
44、础设施,推动计算力向绿色化和集约化方向加速演进。2)智算中心成为新热点人工智能需要海量的计算资源和存储空间,再加上非结构化数据的大爆发以及 AI 算法的快速演进,对传统计算范式造成了巨大的冲击,很多特定计算任务开始涌现,且需要在并行度、吞吐量和时延上做到极致。无论是智慧城市还是智能制造、无人驾驶、数字孪生等场景,除了要有数据支撑以外,还要和各领域、各场景的知识模型、机理模型甚至物理模型相叠加,形成基于人工智能的新应用和场景实现。复杂模型、复杂场景势必需要面向 AI 的算力基础设施,即智算中心,智能计算中心。集约化成为“智算中心”算力基础设施的趋势,通过 AI 服务器把算力高密度地集中在一起,解
45、决了调度和有效利用计算资源、数据、算法等问题,同时减少闲置浪费,通过算力共享模式,大幅降低 AI 算力成本,支持更广泛的 AI 创新研究和应用。作为城市级公共算力平台,智算中心支撑类似大模型训练等大算力需求,满足区域内政府、企CHAPTER2 算力新基建呈现的 10 大挑战和实践 27东数西算下新型算力基础设施发展白皮书业、高校等各类用户的算力需求,以 AI 专用芯片为计算算力底座,使用算力单位略有不同,集约化成为“智算中心”算力基础设施的趋势,通过 AI 服务器把算力高密度地集中在一起,解决了调度和有效利用计算资源、数据、算法等问题,同时减少闲置浪费,通过算力共享模式,大幅降低 AI 算力成
46、本,支持更广泛的 AI 创新研究和应用。作为城市级公共算力平台,智算中心支撑类似大模型训练等大算力需求,满足区域内政府、企业、高校等各类用户的算力需求,需要配备多元融合算力。以曙光5A级智算中心为例,其通过分布式异构并行体系结构,搭载多类型芯片,实现全精度、多样性算力供应,满足包含数值模拟、AI 训练、AI 推理在内的不同应用场景需求。目前智算中心发展尚处于初期阶段却发展迅速,智算中心围绕模型算法来提供更好的数据和算力支持,需要将算法、模型、算力三者有机融合起来,输出 AI 的数据库、AI 的模型、AI 的开放平台等多种 AI 产品,让人工智能应用透明化,为政府、企业和科研院所提供普惠 AI
47、算力服务,真正支持数字经济的技术创新、平台创新、应用创新、生态创新和监管创新。3)超算 2.0:赋能产业超算算力是基于超级计算机等计算集群所提供的高性能计算能力,可进行普通计算机无法完成的工作,芯片以 CPU 为主,可含部分GPU加速器,以提供双精度浮点数(64位)计算能力为主。28截至目前,已批准建立的国家超级计算中心共有十所,分别是国家超级计算天津中心、广州中心、深圳中心、长沙中心、济南中心、无锡中心、郑州中心、昆山中心、成都中心。而从 2021 年 11 月发布的中国 TOP100 的行业应用领域趋势图和 Linpack 性能份额图来看,除了超算中心、人工智能、科学计算领域之外,高性能计
48、算逐渐在生物制药、基因测序、动漫渲染、数字电影、数据挖掘、金融分析以及互联网服务等领域中扩展。中国 TOP 100 行业应用领域机器 Linpack 市场份额图(2021.11)数据来源:2021 年中国高性能计算机发展现状分析与展望 在应用领域新增算力服务,充分反映了在大数据、人工智能算法和算力三驾马车协同配合时代中算力经济的发展,算力的多样化正成为高性能计算领域的发展趋势。目前,国家也重视超算互联网工程,整合多个超算中心包括云计算中心的软硬件资源,平衡算力的需求与供给,通过建设超算资源共享与交易平台,支持算力、数据、软件、应用等资源的共享与交易,同时向用户提供多样化的算力服务。金融2%科学
49、计算3%短视频4%云计算5%人工智能9%电信1%工业/制造1%政府1%电子商务1%能源/石油1%教育科研1%互联网1%算力服务46%超算中心24%CHAPTER2 算力新基建呈现的 10 大挑战和实践 29东数西算下新型算力基础设施发展白皮书4)云边融合 边缘暨核心边缘计算可代表一类场景,基础需求是算力尽量地靠近用户。通常情况下,这些需求可以通过固网、光纤等技术来满足,但很多场景无法用“有线”来解决,比如在工业互联网、物联网、车联网等领域。在不同场景下,人们对边缘的理解不同,就运营商而言,一是从行政区划角度,从全国到省一级,再到地市级、县乡级,越远就相对越边缘;另一个角度是从运营商组网层面,从
50、接入网到核心网,再到数据中心内部,靠近接入网的站点,就可定义为边缘站点。而从应用的角度,除了大型数据中心以及云计算中心节点之外,都可以称作边缘。比如从最接近用户侧的家用路由器或者工厂里的工控机,到园区的计算以及数据处理设备,以及一些区域数据中心,都可以称作边缘的数据中心。无论是 5G 还是边缘计算,主要目标就是为行业用户提供服务,尤其是算力服务。但中国的行业种类繁多,不同的应用场景必然导致不同的算力需求,边缘计算的业务差异性大,这些差异性的业务在一个相对规模不是很大的汇聚节点要去呈现,在一个资源相对有限的边缘数据中心去满足不同业务提出的算力需求,需要边缘数据中心的设备能够尽量通用、开放。这就需
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100