1、12030数据中心构建万物互联的智能世界2序言科技发展的速度远超我们的想象,就像一些学者提到的:指数型技术融合将打开下一个十年人类社会发展的新版图,人们生产生活的方方面面都将在这个新版图中变化和变革,最新的具备这一特征的指数型技术就是人工智能。预计我国在 2025 年人工智能产业规模将超过 4500 亿元,带动产业规模超过 1.6 万亿。人工智能产业的“三驾马车”分别是数据、算法和算力。最近大家都比较关注 GPT 系列 AI 大模型的创新,业界称为计算领域的“iPhone 时刻”。其背后主要依赖 AI 大集群算力基础设施,大模型的 AI训练集群NPU算力规模达几千张卡,甚至上万张卡。算力已经成
2、为人工智能、元宇宙的第一关键要素,在数字经济中扮演着越来越重要的角色。算力集群主要是 3 类,即高性能计算算力集群(HPC/超算计算中心)、人工智能计算算力集群(AI计算中心或智算中心)以及通用计算算力集群(云与大数据 数据中心),过去这 3 类算力集群以烟囱化建设模式为主,未来将走向融合建设的模式。比如:HPC+AI可以极大的提升传统HPC的计算效率,短期天气预报就是一个融合 AI、大数据和科学计算的典型实例。未来,新型数据中心将是提供多样性计算综合能力的算力集群,以满足千行百业智能化的需求。同时,未来数据中心的发展还要考虑不同地区能源结构的差异、同一地区不同行业的业务差异,提供更绿色的算力
3、,并满足实时应用的需求。算力的互联互通和统一调度是实现“东数西算”的一项基本条件,更是数据中心算力发展的必由之路。在当前的应用场景中,带宽不足导致的延迟是算力互联无从避免的局限性。按照目前的架构,举例来说,如果要将 4TB 的原始数据从北京传输到无锡,即使使用目前最快的网络,并保证网络无故障的情况下,数据传输时间将高达5天。中国创新的提出了“算力网络”的概念,旨在通过网络将全国各个算力中心连接起来,形成一台庞大的“网络计算机”。一方面要提高算力输送效率,通过并网实现高带宽、低延迟的算力互联;另一方面,需要团结领域内各大企业,可以屏蔽异构基础设施的差异,通过统一编程框架和编译的资源管理与调度软件
4、实现算力的互通和资源的统一调度和管理,稳步推进“东数西算”的发展与预后工作。实现全社会算力资源的使用最优、效率最高。郑纬民3本次,华为结合自身在 ICT 领域 30 多年的技术创新思考,以及 10 多年来帮助 IT 行业客户构建数字基础设施的实践,组织内外部的技术专家进行了多轮的讨论,编写了这份数据中心 2030研究报告。围绕 2030 年数据中心的应用场景及发展方向,系统性地阐述了未来数据中心的关键技术特征,并首次提出了未来数据中心是一台满足“能效、算效、数效、运效、人效”5 效的计算机,并指出了算、存、网融合创新的方向,最后还描绘了新一代数据中心的参考架构,对相关产业具有重要的参考意义!未
5、来十年,以大数据、AI、元宇宙等为代表的智能世界将加速到来,在迈向更美好的智能世界的征程中,数据中心基础设施的建设和发展将越发重要。从多样性算力的融合,到算力的互联互通,都需要全行业的持续探索与创新,汇众智、集众力,让我们大家齐心协力,助力全球计算产业的高质量发展和人类社会数字经济的腾飞!中国工程院院士4序言Joe Weinman人工智能(AI)指机器具备执行通常需要人类智慧才能完成的任务的能力,如推理、学习、决策和创意。AI 可能会颠覆人类社会的方方面面,比如经济、教育、健康、安全和文化等。上面这段话其实是由 AI 聊天机器人所写,佐证了上述观点。由此可见,人类的能力与新兴数字技术之间的界限
6、越来越模糊。但不仅是 AI,几乎所有技术的性价比似乎都在加速提高,亦或在数十年毫无进展或只有些许进展后,某项技术突然颠覆整个市场进化生物学家称这种现象为“间断平衡”。此类例子在信通技术行业不胜枚举,包括大语言模型(LLM)、扩散模型、区块链、Web3、量子计算、新通信协议、神经形态芯片、软体机器人、群体智能、同态加密等。这些技术通过新的方式联合应用,会变得更强大,而且会在现有的平台和生态系统(如云计算、移动设备和互联网)中加快普及应用。这些新兴技术的用途无穷无尽,但根据其战略性应用能创造的竞争优势,我们可以将这些技术大致分为四大类,我称其为“新动能,新法则”:信息优势、方案领袖、亲密联盟和加速
7、创新。信息优势指利用数字技术改进流程、资源利用和组织结构。例如,算法能规划和修订最优物流路线,基于 AI 的解决方案能更迅速、可靠且稳定地获取更准确的放射诊断结果。方案领袖将智慧化、数字化、互联的产品和服务在定制化和扩展性方面的潜能发挥到极致,应用到例如智慧家居、医院、港口和城市中。亲密联盟利用数百万或数万亿个数据点来创建高度个性化的服务。算法可以通过分析浏览数据来推荐内容,通过分析购买数据来推荐交叉销售,或通过分析诊断、遗传、表观遗传、微生物和药理学数据为病人定制专属疗法。加速创新则是通过数字技术让创新变得更快、更便宜、更好。例如,AI 能快速梳理几十万篇科研论文和实验结果,确定蛋白质结构和
8、动力学,从而加速药物研发。5然而,哪怕用最先进的算法处理最全面的数据集并用到最好的应用中,这个应用最终也必须在现实世界中执行。因此,架构集中型企业、云数据中心以及分布式边缘计算和设备(包括处理、存储、网络、安全和管理模块)必须协同工作,才能大规模高效运行这些应用。这些设施必须满足成本、性能、实施计划、可靠性、安全性、可视性、可管理性、隐私性和可持续性等一系列目标,并且必须具备灵活性和前后向兼容性,以适配目标的变动。当今世界竞争激烈,技术、产品和服务快速更新换代,各种经济和自然因素的干扰以及善变的客户都意味着企业必须不断进行战略评估并持续推进数字化转型。方方面面的市场动态研究都表明,企业不能安于
9、现状。有鉴于此,华为的数据中心 2030报告提供了未来十年技术与解决方案的宝贵路线图,列举了行业面临的关键问题,同时以清晰易懂的语言总结了可供 IT 经理或 CIO 选择的各种方案及其相关的权衡取舍。该报告涵盖了网络连接战略和分布式计算结构,从水下数据中心到未来的太空数据中心,同时探讨了绿色能源战略和动态微电网,重点介绍了云-边-端相关的选择,并涵盖了其他十几个主题,对规划当前或未来十年数据中心有重要的指导意义。虽然有些人可能会认为这些见解过于详细,但不可否认的是,小到在车库里成立的初创企业,大到整个国家,在经济上的成功几乎都与数字能力的成功实现和执行密不可分。今年,全球经济规模将超过100
10、万亿美元。尽管各国的数字化程度不同,“数字化”的标准也各异,但据估计,从巴西的灌溉传感器到尼日利亚的移动支付,从印度的鱼市到中国的超级计算机,数字化的比例达到了 10%、23%和 65%不等。为了在数字经济乃至全球经济中更好地生存和发展,任何管理决策者都有必要明确其公司的战略和竞争态势,专注于发展数字优势,并学习数据中心 2030报告,将这份报告的洞察付诸实践,以最优地实施并调整公司的战略、执行和路线图。如何迎接未来?有效的规划和迅速的调整是最好的准备。数字战略家云经济学、新动能 新法则作者XFORMA 首席执行官6序言Jerry Kaplan我初次邂逅云计算还是在 20 世纪 60 年代末的
11、一次夏令营。当时,其他一起参加夏令营的小伙伴们纷纷被多彩的活动吸引:各种体育运动、丛林远足、或者在清凉的湖水中游泳,我却被突然出现的 33 型电传打字机吸引住了。这台终端通过电话线连接到数百英里外一台运行达特茅斯分时系统(Dartmouth Time Sharing System)的中央计算机上。在简单了解了 BASIC 计算机语言的入门基础后,我对计算机的兴趣就一发不可收拾。那个暑假的大部分时间,我都呆在昏暗的地下室里,编写一个玩“21 点”纸牌游戏的程序。可惜当夏令营收到电脑和电话账单时,我的青少年程序员职业生涯便戛然而止了!我再次接触云计算已是大约 10 年后,那时我还是宾夕法尼亚大学计
12、算机科学专业的研究生。我当时的 Apple II 个人电脑处理文字和电子表格还行,却不具备高级人工智能程序(如我为写博士论文开发的自然语言查询系统)所需的处理能力。我的程序只能在大学里唯一的一台大型主机上运行,而且几乎占用了那台主机所有的 CPU 运行时间和内存。很快,学校里的 IT 人员开始接到其他用户的投诉,抱怨他们的程序运行太慢(或根本无法运行),于是我被迫只能在晚上工作,毕竟晚上机器还有可能是空闲着的!与那时相比,现在计算和数据存储的成本已经下降了一百万倍以上。(我现在的手表所拥有的计算能力和内存都超过当时整个大学的。)鉴于这一惊人的进步,你或许认为,在可预见的将来里,我们所拥有的算力
13、满足所有的客户需求根本不在话下,而且成本极低。然而,新一轮人工智能的浪潮再次提高了对计算基础设施的要求,给供应商们带来了巨大的挑战。据估计,训练一个生成式 AI 大模型(GPT-4)需要使用 2.5 万个 GPU,耗时 90100 天,耗费超过 1 亿美元。而这样的一个程序只是目前全球正在开发的众多此类程序的冰山一角!风趣的英格兰温莎公爵夫人华里丝辛普森(Wallace Simpson)在 1936 年时说过一句名言,“钱再多也不嫌多,人再瘦也不嫌瘦。”同理,我认为,计算资源永远都不嫌多。不管数据中心的效率再怎么提升,GPU 和云计算设施的数量再怎么增多,在日益数据化驱动的未来,算力依旧会供不
14、应求。7作为全球数据中心产业的领导者,华为已经做好充分准备,去抓住这一趋势带来的机遇。华为在技术创新、扩大容量和降低成本方面的不懈努力,堪称业界典范,充分彰显了一家企业如何通过开发可靠、即插即用的基础设施去赋能亟需算力的未来,从而服务社会。本报告的撰写基于与客户、多个研究机构及其他重要参与者的充分磋商,它提供了一份当下最迫切需要的路线图,确保数据中心计算能长期保持快速增长。无论您是从事商业、研究、娱乐、制造还是任何其他数据密集型行业的工作,我都鼓励您充分利用这次机会,了解华为的数据中心愿景,以助您所在的组织在大数据和 AI 时代笃定前行、脱颖而出。硅谷创新企业家作家人工智能专家8序言创新涌现,
15、拥抱智能时代汪涛在 AI 大模型训练过程中,当模型大到一定规模之后,性能会发生突变,开始呈现指数级快速增长,科学界称这个现象为“涌现”。正是这个性能的突变,让人工智能的发展阶段从感知理解世界到生成创造世界,这也造就了ChatGPT的火热,催生了面向行业的数百个AI大模型的出现。今天,“百模千态”正走向每一个行业、每一个场景、解决客户每一个问题,加速千行万业的智能化转型。人工智能的“涌现”时刻即将出现,人类社会也将迎来一个波澜壮阔的智能时代。迈入智能时代,最大的需求是算力,最关键的基础设施是数据中心。根据华为智能世界 2030报告预测,2030 年,人类将迎来 YB 数据时代,对比 2020 年
16、,通用算力将增长 10 倍、人工智能算力增长 500 倍,算力需求十年百倍的增长将成为常态。数据中心作为人工智能、云计算等新一代信息通信技术的重要载体,已经成为新型数字基础设施的算力底座,具有空前重要的战略地位,堪称“数字经济发动机”。一边是算力需求以远超摩尔定律的陡峭增长,而另一边却是多重的资源约束。单芯片摩尔定律的失效、以及全球可持续发展目标下对于碳减排的要求,将迫使未来的数据中心必须在更优的计算架构、以及更低的能耗下产生更大的算力。回顾信息通信技术产业的发展历史,每一次跃升都是矛盾驱动的结果。过去三十年,超大宽带与成本约束的矛盾推动了联接产业的高速发展,5G、F5G 等改变世界;未来三十
17、年,将是超强算力与资源约束的矛盾推动计算产业的高速发展,AI、云计算等重塑世界。可以预见,应对算力需求和资源约束的主矛盾,系统级和架构级的技术、产品和方案创新必将涌现,也将成为未来数据中心发展的主旋律。选择方向和路径已成为一种能力和智慧。站在 21 世纪第三个十年的起点,我们看到 ICT 产业正面临巨大的发展机会,世界正全面进入数字化和智能化,那么,2030 年的世界将是一番怎样的景象?2021 年 9 月份,华为发布了智能世界 2030主报告及相关系列报告,而数据中心 2030是最新的系列之一。基于对未来的不懈探索,过去三年间,与业界数百名学者、客户伙伴及研究院机构等9深入交流,集业界专家和
18、华为专家的智慧,输出了我们对数据中心下一个十年发展的思考数据中心 2030报告。该报告从算力需求与资源约束的核心矛盾出发,描绘了未来十年影响数据中心发展的五大未来场景,提出了围绕“数效、人效、算效、能效和运效”等五效提升的发展方向;同时,该报告在业界首次定义了未来数据中心的技术特征,系统性阐述了数据中心所涉及到云服务、计算、存储、网络、能源等全栈技术可能的挑战与创新方向,并明确提出了未来数据中心建设的参考架构。希望这份报告能为全球数据中心基础设施的建设与发展、为全球数字经济腾飞贡献出积极力量。从万物互联到万物智能、万智互联,一个更加美好的智能世界在向我们招手,但未来注定是不平凡的。吴军在智能时
19、代中提到,在历次技术革命中,一个人、一家企业、甚至一个国家,可以选择的道路只有两条,要么加入浪潮,成为前 2%的人;要么观望徘徊,被淘汰。毫无疑问,未来 10 年将充满根本性的突破和改变世界的惊喜,每一个主要行业很快将会被重塑。人们总是高估了未来一二年的变化,却低估了未来十年的变革,而低估未来变革的影响是因为没有“看见”,这正是数据中心 2030的意义所在。大胆假设和最好预测是创造未来的辩证关系,在迈向未来的道路上,仍有大量的挑战需要跨越,让我们携起手来,勇于探索、持续创新,共同拥抱智能时代!华为常务董事ICT 基础设施业务管理委员会主任企业 BG 总裁10目 录未来场景与创新方向1902产业
20、趋势1301AI for All,创造新生产力科研第四范式,以数据密集型计算探索未知空间互联网,带来多维虚实交互体验行业数字孪生,推动智能升级普惠云原生,消除企业数字鸿沟系统化多流协同,提升能效多级化软硬协同,提升算效无损化网业协同,提升运效社会化数据协同,提升数效智能化人机协同,提升人效20212222232324252527 11新型数据中心参考架构71发展与倡议810405愿景与关键技术特征2903新基础设施,供电制冷走向全天候绿色零碳新算力底座,构建以数据为中心多样算力系统新资源调度,应用为中心实现柔性调度新数据管理,数据全局可视助力高效流通新协同服务,开放架构融入社会化算力新智能管理
21、,AI 驱动实现 DC 自动运维愿景关键技术特征附:关键预测数据指标体系附:缩略语1.多样泛在1)大集群 2)轻边缘3)新型态4.柔性资源1)全池化 2)柔计算3)泛协作 31313234474750542.安全智慧1)高安全 2)高可靠 3)高智能 5.对等互联1)超融合2)高性能 3)光内生 36364041565657593.零碳节能1)绿供电 2)新储能 3)液制冷 6.系统摩尔1)大小芯 2)新算力 3)新存储 424243456363646673747476767730318486 1213产业趋势0114数据中心作为人工智能、云计算等新一代信息通信技术的重要载体,已经成为新型数字
22、基础设施的算力底座,具有空前重要的战略地位,堪称“数字经济发动机”。展望 2030,数据中心的未来发展将呈现如下几个趋势:根据华为智能世界 2030报告预测,2030 年,人类将迎来 YB 数据时代:对比 2020 年,通用算力增长 10 倍、人工智能算力增长 500 倍。全球数据中心产业正进入新一轮快速发展期,我们预测,未来三年内,全球超大型数据中心数量将如同农业经济的核心竞争力是建立在从劳动力人口到大规模水利设施再到机械化持续提升生产效率的基础上一样,算力的规模和效率也已经成为发展数字经济的核心竞争力。当前全球正处在千行万业智能化转型的新阶段,“百模千态”的 AI 大模型成为发展焦点,据预
23、测 GPT5.0(Generative Pre-trained Transformer)训练集群的算力需求将达到 GPT3.0 的 200-400倍。几乎所有的基础科学和大工业都朝着多维度、高精度的大规模数据分析方向发展:如石油算力需求十年百倍增长,算力分布进一步极化算力的规模和效率成为国家和企业的核心竞争力突破 1000 个,并将保持快速增长;同时,随着自动驾驶、智能制造、元宇宙等应用的普及,边缘数据中心将同步快速增长,根据第三方预测,2030 年部署在企业内的边缘计算节点将接近1000 万个。勘探领域深度偏移等场景下单位面积勘探区的算力需求将增长 10 倍以上。AI、区块链等技术支撑的行业
24、智能化场景也将带来算力需求的爆炸式增长,从数字化球拍每一次挥动的感知、记录和处理,到普惠金融每一次微型交易的客户画像、信用评估,都需要高效算力的支持。未来各行业在算力领域的投资占比将快速增长,以银行业为例,根据有关预测 2024 年中国银行业技术投入总规模将超过 4000 亿元,其中 AI 与云计算是重点投资领域,二者占比超过总投入的一半。15华为预测,到 2030 年全球 AI 计算算力将超过105 ZFLOPS(FP16):AI 计算算力成为数据中心发展的最大驱动力和决定性因素。未来 5 到10 年通用大模型的发展有可能使 AI 对文字、音乐、绘画、语音、图像、视频等领域的理解力超过人类平
25、均水平,并与互联网和智能设备深度融合,深度改变全社会的消费模式和行为。AI 技术与生产率之间显著的“扩散滞后”效应逐渐减弱,通用大模型能力将嵌入生产力和生产工具、AI 驱动数据中心发生全景式革命行业大模型和场景化 AI 等多路径融合,AI 技术创新对商业价值的影响将变得更加广泛和不可预测。通用大模型多模态泛化下的训练算力需求将保持远超摩尔定律的陡峭增长趋势,需要数据中心在算力规模、架构、算法优化、跨网协同等领域持续创新和快速迭代。展望未来,AI 的发展将加速平台型企业超级数据中心和国家级算力网络的建设。数据中心总耗电量在 ICT 行业占比超 80%,为保障数据中心行业的可持续发展,首先需要提升
26、能源使用效率、实现绿色低碳。多个国家、国际组织发布数据中心相关政策,如美国政府通过 DCOI 数据中心优化倡议,要求新建数据中心 PUE 低于 1.4,老旧改造数据中心 PUE 低于 1.5。欧洲数据中心运营商和行业协会在欧洲的气候中和数据中心公约中宣布 2030 年实现数据中心碳中和。中国出台全国一体化大数据中心协同创新体系算力枢纽实施方案推动构建全国一体化大数据中心,启动“东数西算”工程,促进数据中心绿色可持续发展,加快节能低碳技术的研发应用,要求到 2025 年新建大型数据中数据中心的产业标签从高耗能转变为绿色发展使能器心 PUE 低于 1.3。未来,随着各国相关政策的陆续出台和技术的持
27、续发展,越来越多的先进节能技术将更广泛地应用到数据中心,推动 PUE的进一步下降,预计到 2030 年,PUE 将进入1.0 x 时代。未来随着风光水等清洁能源占比的不断增加,通过数据中心微电网“源网荷储”的协同还可以进一步降低碳排放,实现数据中心的绿色零碳目标。其次除了自身降低碳排放之外,数据中心还可以为其他行业的智能化转型赋能,成为全社会降碳的使能器,据全球电子可持续性倡议组织(GeSI)预测,到 2030 年 ICT 技术通过使能其他行业,将帮助减少全球总碳排放的 20%,是自身排放量的 10 倍。16一方面,规模化、中长期需求预测困难、技术迭代加速等成为所有骨干数据中心运营企业和领先数
28、字化企业的共同挑战。数百万台服务器的云数据中心、数十万台服务器规模的行业数据中心将在 2030 年之前出现,ChatGPT 等突发的巨型超高密度任务涌现,土地、能耗获得的不确定性等因素使得基于超大单体、以 10 年为周期的数据中心规划模式难以为继。未来分阶段、模块化、集群化、服务化,逻辑上统一,物理上分布的数据中心新建设模式将逐渐普及。另一方面高性能计算的需求也随之不断提升,影视渲染、效果图超出物理数据中心边界,多流协同的数据中心普及化渲染等批量计算任务,基因测序、风机工况模拟等科学计算任务以及 AI 训练等可并行的计算任务,往往需要消耗大量的算力资源和运算时间。这类任务往往具有计算成本敏感、
29、实时性不敏感、计算规模可变动的特点,针对这类需求可以通过实时传递价格信号,激励用户选择电力价格较低的时间段进行整体运算;也可以通过断点续训、可续渲染技术,在计算任务执行的过程中暂停乃至对并行规模进行改变,来平移和升降电力负荷。通过任务流、信息流、能量流的精准关联和多流协同,构建绿色低碳、算效领先的数据中心。蚂蚁大脑一般只有 0.2 毫瓦的能耗,但是能够做很多复杂的事情:可以筑巢、寻找食物、养蚜虫等。相比之下,目前自动驾驶汽车还需要几十瓦甚至几百瓦来进行计算,在能效上与生物界相比还有很大的差距。应对十年百倍算力增长需求与能耗约束之间的矛盾,未来数据中心需要打破冯诺依曼架构,基于新架构、新部件发展
30、适应性与高效性的新计算模式。在信息计算领域,已经发展出了十几种广泛使用的计算模式,例如无线和光通信里大量使用基于快速傅里叶变换的蝶形计算模式;路由器里大量使用基于逻辑状态转移的有限状态机计算模式;在智能计算领域,除了统计计算之外,业界正在研究数理逻辑计算、几何流形计算、博弈计算等更高效的新计算模式,实现在特定场景下,计算能效的百倍提升。下一代数据中心还将构建“算存网安”多技术协同的全新系统,打破传统计算设备面临的功耗墙、I/O墙、存算墙的约束,从单设备到集群化、从单节点到系统级创新成为数据中心技术发展的主流网络化,通过系统级创新、软硬协同实现数据中心效率的大幅提升。17围绕算力供给和资源约束挑
31、战持续创新突破面向 2030,数字经济加速发展对于算力的需求将呈现十年百倍的指数级增长;而与此同时,单芯片摩尔定律的失效,以及全球可持续发展对于碳减排的硬性要求,将成为制约数据中心未来发展的主要因素。可以预见,围绕算力需求和资源约束挑战的创新将成为未来数据中心发展的主旋资源约束:摩尔定律,碳减排律。先进数字化企业和数字化国家,将在单个数据中心、数据中心集群、数据中心之间的“微中宏”观、多层次进行系统化创新,实现企业级或者国家级的“一台计算机”,通过整体效率的提升将算力供给和资源约束之间的剪刀差最大化,加速迈向智能世界。图 1-1 算力需求与资源约束挑战算力需求:十年百倍增长下一代数据中心181
32、9未来场景与创新方向0220过去,人类在科学的边界之内,不断发现万物规律,并创造生产工具,推动社会从农耕文明、工业文明进入到数字文明的数字化阶段。未来,AI以新的生产力形式出现,在人类定义的边界之内,以更高的效率和更快的速度进行分析和创造,将数字文明带入智能化阶段。人类善于分析,但 AI 可能做的更好。“分析型AI”已经得到广泛应用,可以分析一组数据,一组图片,并在其中找到模式,用于多种用途,无论是预防欺诈或是目标识别。人类擅长创造,但 AI 可能做的更快。随着“生成式 AI”的快速发展,AI 已经开始创造有意义和美丽的东西,如写诗、绘图,并且效率更高。生成式 AI 在图像生成领域的进展来自扩
33、散模型(Diffusion model)的应用,是一种从噪声中生成图像的深度学习技术。在自然语言处理(NLP)领域的进展来自于 ChatGPT,这是一种基于互联网可用数据训练的文本生成深度学习AI for All,创造新生产力模型,用于问答、文本摘要生成、机器翻译、分类、代码生成和对话的 AI。在代码生成领域的进展则来自代码生成系统 AlphaCode 和 Copilot。2022 年 2 月,DeepMind 推出了他们的最新研究成果 AlphaCode。它是一个可以自主编程的系统,在 Codeforces 举办的编程竞赛中,超过了 47%的人类工程师,这标志着 AI 代码生成系统,首次在编
34、程竞赛中,达到了具有竞争力的水平。数据中心几乎涉及信息生活的所有方面,从科学研究的突破创新到生产生活的智能高效,都需要数据中心提供更强大的算力,处理更多的数据,算力需求将呈现远超摩尔定律的陡峭增长。与此同时,为了应对算力需求和资源约束的主矛盾,围绕效率提升持续创新,必将成为未来数据中心发展的核心方向。21AI 技术正加速进入千行万业,如在气象行业,利用 AI 大模型能够在 10 秒内给出未来七天的天气预测结果,对比传统的 HPC 数值预报方法,在预测速度上提升了 10000 倍以上;在证券行业,某金融企业基于 AI 大模型实现了准确率达90%的企业财务智能预警,较传统机器学习模型准确率提升了
35、11。AI 大模型正逐步从智能对话、短文创作、图片生成等消费应用场景,扩展到办公、编程、营销、设计、搜索等商业应用场景,并将进一步扩展到金融风控、智能客服、辅助诊断、医疗咨询等企业应用场景,为千行万业注入新生产力。人类正在从分析型 AI 理解世界迈向生成式 AI 创造世界。面向 2030,具备认知能力的 AI 像我们熟悉的土地、植物、空气、阳光一样无处不在:“一辆会自己行驶的汽车、一个会自己做饭的机器人、一个会自己管理的通信网络、一个会自我优化的软件平台”将会成为人们日常生活的一部分,并支撑着人类文明的持续进化。几千年前科学以归纳为主,通过观测和实验来描述自然现象;过去数百年出现了理论研究分支
36、,利用数学模型进行分析;过去数十年出现了计算分支,针对复杂问题,使用计算机进行仿真分析;21 世纪初期,新的信息技术已促使新范式的诞生,即基于数据密集型科学研究的“第四范式”,通过将理论、实验和计算仿真统一起来,由仪器收集或仿真计算产生数据、由软件处理数据、由计算机存储信息和知识、科学家通过数据管理和统计方法分析数据和文档。数据密集型科学研究,将产生海量数据需要分析处理,如模拟脑神经网络,探索人脑上亿个科研第四范式,以数据密集型计算探索未知神经元之间如何连接与工作,将带来每秒高达100TB 的数据吞吐量;自动驾驶车辆每天将产生数十 TB 数据用于训练视觉识别算法;用电子显微镜重建大脑中的突触网
37、络,1 立方毫米大脑的图像数据就超过 1PB;而天文专家需要从数十 PB 海量数据中分析发现新天体。PB 级数据使我们可以做到没有模型和假设就可以分析数据,将数据丢进巨大的计算机集群中,只要有相互关系的数据,统计分析算法可以发现过去的科学方法发现不了的新模式、新知识甚至新规律。科学数据已成为科学研究的关键成果和重要的战略性资源,面对喷薄而出的数据需求和数据量,分类第一范式:经验科学18 世纪以前以归纳为主,带有较多盲目性的观测和实验以演绎法为主,不局限于经验事实对各个科学学科中的问题,进行计算机模拟和其他形式的计算利用数据管理和统计工具分析数据实验模型第二范式:理论科学19 世纪以前数学模型第
38、三范式:计算科学20 世纪中期计算机仿真模型第四范式:数据密集型科学21 世纪初期大数据挖掘模型时间模型研究方法22面向千行万业的数字孪生是数据中心的重要应用场景。根据第三方预测,全球数字孪生市场空间的年复合增长率将达到 40.1%,预计到 2030年将达到 1310.9 亿美元。数字孪生涉及建模、感知、仿真、渲染、大数据、人工智能等新一代信息技术的综合集成应用,是数字经济发展的重点领域之一。行业数字孪生,推动智能升级伴随各行业智能化的推进,城市、制造、交通、水利、能源的数字孪生应用需求快速增长,从端云两侧同时拉动数据中心算力需求。其中,基于WebGL 的数字孪生应用快速发展,带来终端的升级需
39、求;基于云渲染的数字孪生应用,带来云端算力的快速增长。应对算力快速发展的需求,应从加强算力供给、提升集约化利用水平、加强渲染算法研究等方面推动算力产业升级。如何存储、管理、共享这些科学数据,成了全球科学家关注的热点,也是下一代数据中心的重要应用场景。当这些规模计算的数据量超过 1PB时,传统的存储子系统已经难以满足海量数据处理的读写需要,数据传输 I/O 带宽的瓶颈愈发突出。而简单地将数据进行分块处理并不能满足数据密集型计算的需求,并与大数据分析的初衷相违背。目前许多具体科学研究中所面临的最大问题,不是缺少数据,而是面对太多的数据,却不知道如何处理。当前的超级计算机、计算集群、超级分布式数据库
40、、基于互联网的云计算等并没有完全解决这些矛盾,计算科学期待一次全新的革命!虚实融合是下一代互联网发展的主要方向,一个具有高沉浸式交互体验的虚实融合的多维空间,将极大地提高人与信息的交互体验和经济活动效率。虚实融合的发展包括两个方向:一是由实向虚,基于虚拟世界对于现实世界的模仿,通过构建沉浸式数字体验,增强现实生活的数字体验,强调实现真实体验的数字化。在移动互联网时代,主要通过文字、图片、视频等 2D形式建立虚拟世界,而未来在元宇宙时代,将真实物理世界在虚拟世界实现数字化重造,建立虚拟化,具备多维交互能力的虚拟世界。二是由虚向实,超脱对于现实世界的模仿,基于空间互联网,带来多维虚实交互体验虚拟世
41、界的自我创造,不但能够形成独立于现实世界的价值体系,还能够对现实世界产生影响,实现数字体验的真实化。如增强现实游戏通过设置与品牌联动特定地点发放限量购物券的方式,帮助品牌方吸引消费者关注,实现数字体验对真实消费的带动。从技术层面来看,虚实融合的多维互动体验离不开计算机图形图像的多维空间计算能力支持和低延迟网络服务。同时,它还需要强大的人工智能认知能力的辅助,以及泛在通达的数据连接,计算和网络的能力将直接决定了虚实融合的深度和广度。23过去 10 年内,智能手机和移动互联网重塑了人类生活方式和企业生产模式;今天,智能化和电气化正在重构汽车行业的核心竞争力和生态。重塑和重构的背后是强大的算力、算法
42、和数据构成的数据智能,是敏捷迭代、弹性伸缩、韧性自愈的云原生的 IT 系统。未来随着大模型 AI、万物互联、社会化数据协同和数字孪生的新技术推动,与现实世界结合更紧密的千行万业也将快步进入云原生为基础的智能世界。各行业的领先者和现有分工的颠覆者正在凭借前瞻性思维实现更深层次的智能化,推动云原生特征明显的信息技术和运营技术的融合,赋予产品、在全球积极应对气候变化目标下,绿色低碳成为数据中心的重要发展方向,大部分国家或地区均在单体数据中心领域相继发布了相应政策。中国在充分论证研究基础上,规划布局了 8 大算力网络国家枢纽节点,引导大规模数据中心适度集聚,通过实施“东数西算”工程,积极探索构建形成以
43、数据流为导向的新型算力网络格局。围绕绿色可持续发展,数据中心相关企业已经开普惠云原生,消除企业数字鸿沟系统化多流协同,提升能效流程、组织精细化、敏捷化的全新竞争力。随着数字系统越来越复杂、发布变更频度越来越高、算力越来越密集、分布越来越广泛,企业将越来越依赖平台能力,越来越多的企业将全面拥抱云原生技术。普惠化的云原生技术给传统的企业甚至个体带来将生产、经营活动现代化的机遇,消除数字化鸿沟,提供简单、经济而又专业、个性的智能化路径。当云端算力、数据服务 API、涂鸦化的 IOT控制流程设计、商品化的行业 AI 算法组合时,每个拥抱变化的企业获得与领先者同步的智能化能力。发了大量创新技术来实现基础
44、设施建设与运营过程中的高效化和低碳化,并且已经在现有或新建的数据中心中实施。如苹果公司在数据中心范围内部署分布式太阳能、风能、沼气等可再生能源发电设施,以及与可再生能源电站签署长期采购协议,为自有数据中心供电,通过一系列措施实现 数据中心使用 100%可再生能源。微软公司在智能云绿色数据中心建设时提出需要在选址、建设及运营的全流程将数据中心的“能源流”“数24据流”“业务流”有效协同起来,实现绿色高效。华为云贵安数据中心采用自然冷却技术,包括直通风制冷和部分高密度服务器就近利用湖水散热,并通过余热回收利用技术等将数据中心的热量进行采集,用于办公区取暖,在设计中既充分结合了贵州自然条件的优势,也
45、融入了绿色低碳算力的发展经历了单核、多核、网络化三大阶段。综合考虑技术和商业可行性,单核硅基芯片的计算能力将在 3 纳米达到极限。由于经济性原因,依靠增加核数换取算力提升的模式,也将在 128 核后迅速失效。这将推动算力架构从单设备多核向多设备网络化演进。此外,受网络技术发展及网络带宽成本约束,边缘的算力部署也将成为数据中心新的场景,最终形成云边泛在、多级化算力部署的新架构。过去半个世纪,集成电路产业在摩尔定律的指引下飞速发展,算力一直保持着大跨度提升。在硬件主导算力快速提升的时代,计算过于依赖底层算力,对架构和代码优化重视不足,高级语言不断出现,程序执行效率越来越低,而这恰恰为未多级化软硬协
46、同,提升算效来从“软硬协同”层面提升计算性能留下了优化空间。主流芯片和设备厂商已经纷纷开始通过软硬联合优化来提升整体计算性能。业界认为,硬件架构的每一个数量级的性能提升潜力,通过“软硬协同”能带来两个数量级的整体性能提升。华为云的异构计算服务,通过软件优化硬件直通能力,能够显著降低因计算资源虚拟化造成的性能损耗。图灵奖得主 David Patterson 曾提出,在计算领域,未来十年,我们将看到比过去 50 年更多的架构优化和性能提升的创新。面向 2030,通过中心集群软硬协同优化、云边多级算力资源协作等提升算效是数据中心未来的重要发展方向。的可持续发展理念。实现“能源流”、“数据流”和“业务
47、流”的多流协同,是面向 2030 年构建高能效数据中心的关键。25生产要素反映了人类社会不同发展阶段的生产力水平。数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产、生活和社会治理方式。数据的规模爆发式增长,不仅在数字经济发展中的地位和作用凸显,而且对传统生产方式变革具有重大影响:将催生新产业、新业态、新模式,成为驱动经济社会发展的关键生产要素。在产业数字化方面,社会化将打破企业边界,使获取数据、运用数据的能力成为业务创新和提升用户体验的关键。销售平台可以根据买家的浏览记录做出精准推送以提高销量;制造企业可以通过分析生
48、产流水线数据对生产情况及时做出调整社会化数据协同,提升数效以提高生产效率;家居公司可以通过分析客户的生活习惯数据创造“智慧家庭”以提高生活服务质量,种种应用展示出数据在被有效的挖掘、整合后可能产生巨大的价值。业界有观点认为,数未来数据中心的发展对网络将提出更高的要求。传统网络在业务配置和资源管理上不具备足够的灵活性,造成数据中心内和数据中心之间的算力资源利用率低,从而产生巨大的浪费。尤其是在AI 大模型训练的场景下,需要用到大量的数据,模型参数也会变得非常大,为了让训练效率更高,往往需要上百张 GPU 卡来放置一个大模型作为一个数据并行组,训练大模型的时候往往需要很多个这样的数据并行组来缩短训
49、练的时间。当 GPU 数量扩展到成千上万的时候,性能不仅取决于单一 GPU,也不仅取决于单一服务器,而是要取决于网络的性能。构建高性能网络,提高数据在计算、存储之间的搬运效率(运效),除了带宽和时延之外,最重无损化网业协同,提升运效要的是在数据包转发过程中实现无损化,即不允许出现数据包的丢失。业界实验发现,数据每丢失千分之一,计算性能就会下降 30%。为了实现网络无损化,网络和计算、存储业务系统之间的协同越来越重要。在数据中心内,业界已有厂家在分布式存储、集中式存储、高性能计算等场景下实践了“网存协同”和“网算协同”的创新方案。在数据中心之间,领先的电信运营商也提出了算力网络的方案,在感知应用
50、、感知算力需求的基础上,利用全光、端到端切片、弹性调度等技术,针对分布式存储、跨节点分布式计算等场景,提供零丢包的业务保障能力,为算力之间构建全程全网高效的无损网络。26据将逐渐成为与人、技术、流程同样重要的第四大核心竞争力。跨企业边界的数据共享和交换在当下已经比较流行,未来主要的变化是多领域数据汇聚、AI 集成、隐私保护和交易化。以普惠金融的农户贷款为例,风险分析数据包括家庭信息、政府征信信息、关联人信息、农田信息、农资信息,数据来源包括同行、政府、农资供应商、卫星遥感、互联网等,数据的交易将从点到点的原生数据交易向中介型的多阶数据交易转变。在政府和公共事业数字化方面,社会化可以加速社会治理