收藏 分销(赏)

全球算力十大趋势报告2026.pdf

上传人:宇*** 文档编号:13165160 上传时间:2026-01-28 格式:PDF 页数:62 大小:3.92MB 下载积分:20 金币
下载 相关 举报
全球算力十大趋势报告2026.pdf_第1页
第1页 / 共62页
全球算力十大趋势报告2026.pdf_第2页
第2页 / 共62页


点击查看更多>>
资源描述
全球算力十大趋势(2026)TopTop 1010 TrendsTrends inin GlobalGlobal ComputingComputing PowerPower DevelopmentDevelopment 20262026全球计算联盟编编写写单单位位GCC 全球计算联盟寄寄 语语人类文明的每一次跃迁,皆始于对未知的追问与探索从蒸汽驱动工业革命到算力支撑智能觉醒,探索精神始终是文明进阶的核心密码。如今,人工智能的浪潮正以超越历次科技革命的速度重塑世界。算力,正是托举这场智能变革的基石,成为驱动产业变革的“新质生产力核心”,算力的突破速度决定着智能文明的进阶高度。全球计算联盟秉持“开放协作”理念,推动新架构共识与生态繁荣,此次趋势报告正是产业协同的智慧结晶。它不仅洞察未来算力发展趋势,解码算力发展规律,更呼应了 AI 从使能工具向紧密伙伴演进的必然方向。探索未知,方能跃见未来。期待这份报告为算力产业链伙伴们提供未来发展参考方向;让算力创新更普惠、更可持续;也欢迎大家一起加入全球计算联盟共同推动计算产业开放创新,支撑数智社会可持续发展。全球计算联盟理事长 金海序序当数字浪潮席卷全球,算力已从技术底层跃升为重塑文明进程的核心力量,成为衡量国家竞争力的关键维度。从实验室的算法迭代到产业界的智能转型,从科学探索的前沿突破到日常生活的便捷体验,算力正以无形之网连接万物,推动人类社会迈入一个以智能为底色的全新纪元。人工智能引领的技术革命,仍在加速。全球算力规模呈指数级增长,各国竞逐算力高地,互联网巨头与科技企业纷纷加码布局,让算力竞赛进入白热化阶段。AI 大模型逐渐进化为支撑智能世界运行的“操作系统”,深度渗透制造业的智能工厂、医疗领域的辅助诊断、交通行业的自动驾驶,乃至农业的精准种植,让千行百业在智能赋能下焕发新活力。与此同时,计算架构本身也在经历深刻变革:从以 CPU 为中心的传统范式,走向异构平等、多样协同的新架构;以超节点为代表的新型算力底座,正突破单一节点算力的瓶颈;算力与网络深度融合,逐步实现“算力随需、即取即用”。这些系统级创新不仅是技术的跃迁,更是产业模式与价值创造方式的重构。站在 2025 年底的时间节点,回望过去,算力驱动创新的足迹清晰可见;展望未来,智能世界的图景徐徐展开。全球计算联盟 GCC 的报告所呈现的十大趋势,仅仅是我们对当下算力发展趋势的行业观察与研判,我们将汲取专家们的智慧,例行更新我们的研究报告。目目 录录趋势一趋势一:全球算力规模高速增长,算力竞赛白热化,算力成为全球科技竞争的战略制高点2趋势二:趋势二:AI 加速进入千行百业,大模型将成为未来智能世界的操作系统,创造价值将是第一要素7趋势三趋势三:跨越虚实边界,数字智能向具身智能演进,世界模型成为关键支撑13趋势四趋势四:超节点成为算力新底座,智算中心进入超节点时代18趋势五:趋势五:从以 CPU 为中心的计算架构,迈向多样化平等计算架构23趋势趋势六六:以网强算,建设毫秒级算力网,强化算力基础设施高质量发展28趋势趋势七七:超算与智算走向融合,构筑科学计算新范式34趋势趋势八八:智算时代需要更加开源开放的生态体系,加速产业创新39趋势趋势九九:算力中心向智算中心迈进,高密化、液冷化和集群化成为发展方向,能源成为关键要素 43趋势十趋势十:量子计算走向工程化阶段,未来 1-2 年将是量子计算从技术突破走向商业化应用的关键窗口期48-1-本文以“算力释放智能价值”为主线,采用从底层技术支撑到上层场景应用、从单点技术突破到产业变革作为思考脉络,通过聚焦产业趋势、AI 应用、开源框架、算力硬件、基础设施五大核心维度,梳理全球算力十大趋势。在产业趋势层面,全球算力竞赛持续升温,使其成为大国竞争的战略制高点;超算与智算的深度融合正突破传统科学计算的范式边界;而量子计算工程化的探索,则预示着新的计算范式处于从技术突破到商业验证的关键窗口期。算力不仅是经济增长的引擎,更是重塑国家核心竞争力的关键。在 AI 应用维度,大模型已升级为智能世界的“底层操作系统”,以泛化能力驱动 AI 深度渗透千行百业;数字智能向具身智能的演进进一步打破虚实边界,使智能从虚拟信息处理延伸至物理世界的实时交互,而价值创造能力则成为 AI应用从技术验证走向商业闭环的核心标尺。开源框架是算力生态的核心基石,通过全栈开源打破技术垄断、降低创新门槛,依托全球开发者协同加速技术迭代,为产业创新者,搭建起参与智算革命的桥梁,更有效破解产业链协同难题,为算力产业创新注入普惠性活力。在算力硬件层面,计算架构正从以 CPU 为中心走向多样化平等架构,GPU及各类 xPU 协同发力,以匹配多元算力需求。超节点作为智算中心新底座,通过平等互联技术突破“内存墙”瓶颈,支撑起万亿参数模型的高效低时延运行。基础设施则构建起算力高效运行的底层骨架,通过毫秒级算力网打通跨地域、跨集群的资源流动壁垒,智算中心的高密化、液冷化与集群化升级,更在全球能源约束背景下实现算力的绿色高效承载,为算力硬件的效能释放与 AI 应用的规模化落地提供高可靠、可持续的运行环境。-2-趋势一:全球算力规模高速增长,算力竞赛白热化趋势一:全球算力规模高速增长,算力竞赛白热化,算力成为全球科技竞争的战略制高点算力成为全球科技竞争的战略制高点-3-在数智文明加速发展的今天,算力已超越传统基础设施范畴,成为数字经济的底层基座与新质生产力的核心引擎。产业端,它重构智能制造、能源调度、金融创新的核心逻辑,让柔性生产、精准决策成为常态;生活端,它赋能智慧出行、远程医疗、普惠教育,让个性化服务触达每个角落。伴随着算力实现全域渗透,加速生产与生活全场景跃迁,将深刻推动社会发展进程。算力成为数字经济的底座算力成为数字经济的底座,对经济增长发展起到主导型对经济增长发展起到主导型作用作用算力不仅是承载数字经济发展的底层基础,更是核心驱动力。从要素看,算力将数据转化为价值;从工具看,算力是科技创新的加速器;从结果看,算力催生新产业、提升旧产业。数字经济成为全球经济发展引擎,算力成为创新的核心。根据相关权威机构的研究,算力是经济发展的倍增器。加大对算力等数字基础设施的投入,能够有效驱动各行各业的业务创新和经济效益增长。来源:综合相关研究算力赋能千行百业,驱动全要素生产率跃升。据哈佛大学研究显示,美国2025 年上半年,算力的投资在 GDP 增长中的贡献达约 92%,起到主导性的作用。-4-算力即国力,各国密集出台政策,加大对算力发展的政策扶持算力即国力,各国密集出台政策,加大对算力发展的政策扶持世界各国已将算力发展提升至国家战略高度,通过多种政策予以强力扶持,抢占新一轮科技革命与产业变革的制高点,筑牢国家数字竞争力与安全基石。中国中国:将人工智能纳入国家顶层战略,“十五五”规划将算力明确提升为数字经济时代的新质生产力核心要素,构建全国一体化、智能高效、绿色普惠的算力体系,以支撑人工智能、工业互联网等前沿领域发展;2025 年 8 月国务院印发关于深入实施“人工智能+”行动的意见,明确 2027 年新一代智能终端、智能体等应用普及率超 70%,2030 年这一比例突破 90%,工信部、发改委等部门同步推出配套产业政策,构建全链条支持体系。美国:美国:发布AI 行动计划,聚焦人工智能创新加速、基础设施建设与技术推广,简化数据中心审批流程,计划投入数千亿美元联合科技巨头推进半导体制造本土化,以监管松绑激发创新活力。欧盟欧盟:通过人工智能大陆行动计划,推动传统优势产业向人工智能创新引擎转型,目标打造全球人工智能领域领导者,规划建设 13 个 AI 工厂与 5 个超级工厂,以立法形式推动数据中心扩容与绿色转型,法国同步推出千亿欧元 AI投资计划抢占技术制高点。其他:其他:日本、韩国强化高性能计算部署以适配 AI 爆发式需求,东南亚与中东成为算力外溢核心区域,阿联酋 G42 集团联合微软与 OpenAI 打造中东最大AI 算力中心,新加坡、马来西亚通过政策红利吸引亚马逊、阿里云设立区域算力节点。算力是人工智能进步的核心算力是人工智能进步的核心,未来五年智算算力未来五年智算算力规模规模将增长将增长千千倍倍算力是驱动人工智能突破的核心,自从 2010 年深度学习开始快速发展以来,-5-AI 算力的增长就保持着每年 4 到 5 倍的速度,特别是 Transformer 架构自 2017年被提出以来,它强大的并行处理能力,使得构建拥有数千亿甚至万亿级别参数的超大规模模型成为可能,进而引爆算力的需求。根据华为、阿里等预测,2025年到 2030 年 AI 算力将增长千倍左右。全球头部互联网厂商在全球算力建设浪潮中起到引领性作用全球头部互联网厂商在全球算力建设浪潮中起到引领性作用,主主导性不可替代导性不可替代全球头部互联网厂商凭借技术积累与资本实力,成为算力基础设施建设的核心引领者,其布局力度直接影响全球算力格局与 AI 发展进程。尽管面临短期盈利压力,但头部厂商仍全力抢占算力制高点以定义未来 AI时代的技术标准与商业模式。美国科技四巨头微软、谷歌、亚马逊、Meta,2025年 AI 相关资本支出预计高达 3640 亿美元,远超市场预期,彰显对 AI 战略的空前投入。中国互联网龙头企业同步加速布局,阿里宣布未来三年投入超 3800亿元用于云计算及 AI 硬件基础设施,其中 80%定向投向 AI 服务器;腾讯2025 年预计投入近千亿元,重点聚焦大模型训练与推理资源扩容;字节跳动2025 年预计斥资 1600 亿元,构建 AI 成本与体验的核心竞争壁垒,全球算力建设的主导权正加速向头部厂商集中。据相关统计,超大规模云服务商和互联网厂商算力投资占据全球算力投资的 60%。AIAI 算力正从辅助资源演变为企业的核心战略资产算力正从辅助资源演变为企业的核心战略资产本报告来源于三个皮匠报告站(),由用户Id:87791下载,文档Id:1014545,下载日期:2025-12-31-6-据预测,到 2029 年全球 AI 支出将达 1.3 万亿美元,占 IT 总支出比重突破26%。企业 AI 算力投资占比正从当前的 5.9%向 15.9%跃升,推动企业资源分配范式重构:过去以人力资源为成本中心的模式,正让位于“算力优先”的新逻辑。行业案例显示,部分企业为保障算力投入已启动结构性调整,通过优化人力成本以支撑算力基础设施的扩容需求。当 AI 创造的价值数倍于其算力成本时,产业智能化将迎来爆发拐点。企业需重新定义资源战略,使人才组织与算力资源高效协同,方能在智能时代构建持续竞争力。人工智能的发展轨迹和未来前景远超我们的预期人工智能的发展轨迹和未来前景远超我们的预期算力的持续突破正推动人工智能产业进入高速扩张期。普华永道预测,到2030 年人工智能将为全球经济贡献 15.7 万亿美元,带动全球 GDP 增长 14%;其中中国将受益显著,人工智能预计拉动 GDP 增长 26%,贡献 30 万亿元人民币。未来几年,人工智能可能逼近 AGI,技术突破带来能力跃升,也放大了偏见、安全等系统性风险。构建“以人为本、AI 向善”的治理框架至关重要,需确保价值观对齐、系统稳健、决策透明、结果公平,并明确责任与隐私保护。人工智能的“可信可控”将是重要的议题,推动可解释 AI、隐私计算等关键技术发展。政府、企业需加速建立敏捷治理机制,唯有坚持伦理先行、安全为本,方能引领智能时代迈向可信、公平、可持续的未来。-7-趋势二趋势二:AIAI 加速进入千行百业加速进入千行百业,大模型将成为未来智大模型将成为未来智能世界的操作系统能世界的操作系统,创造价值将是第一要素创造价值将是第一要素-8-2025 年作为大模型应用落地元年,全球大模型技术正加速从“技术验证”迈向“商业闭环”。大模型已超越单纯工具属性,升级为承载智能世界应用的底层平台,“以大模型为核心、应用与智能体为外围”的生态体系,正逐步构建起智能时代的底层架构,推动 AI 全面渗透千行百业。大模型意图理解能力的突破,部署成本的大幅下降,加速大模型大模型意图理解能力的突破,部署成本的大幅下降,加速大模型在千行百业的落地在千行百业的落地技术层面,大模型实现关键能力突破。深度推理能力的跨越式提升,使其能应对多文档分析、长周期任务规划等复杂场景;自主决策与工具调用能力的进化,让单任务从“单次交互”升级为“多步骤协同”,例如工业智能体完成订单调度需联动生产、仓储、物流等多个模块,实现对复杂流程的深度赋能。成本层面,落地门槛大幅降低。训推一体机、模型蒸馏、微调技术、低精度量化技术快速成熟,让几十亿至百亿参数模型的本地化部署成为现实,显著降低企业应用成本;开源生态持续完善,Qwen 开源模型占据 Hugging Face 平台新增衍生模型的 40%以上,为中小企业参与 AI 创新打开通道。AIAI 应用规模爆发,应用规模爆发,激发更庞大的算力需求激发更庞大的算力需求杰文斯悖论指出,资源使用效率的提高会因使用成本降低刺激需求爆发,最终推动总消耗量增长。这一规律在 AI 领域同样适用:随着大模型技术迭代,推理能力每 7 个月翻一倍,推理成本呈指数级下降,直接刺激了各行业对 AI 应用的需求激增。需求爆发进一步带动算力需求持续增长,形成不可逆转的发展态势,推动 AI 从“选择性应用”向“普遍性依赖”转变。据 Sensor Tower2025 年 AI 应用报告数据,2025 年上半年,AI 应用在下载量、用户付费及使用时长等核心指标上均实现爆发式增长,下载量超 17 亿-9-次,较 2024 年下半年环比增长 67%,AI 应用的总使用时长突破 156 亿小时,总会话次数达 4260 亿次,相当于全球每人平均使用约 50 次。大模型效率提升与成本下降,正通过杰文斯悖论激发更庞大的 AI 应用需求,形成“效率提升需求爆发算力增长”的正向循环。智能体承担越来越复杂的任务,倒逼有泛化能力的大模型作为底智能体承担越来越复杂的任务,倒逼有泛化能力的大模型作为底层的引擎层的引擎OpenAI 预测人工智能正从“推理者”阶段向 Agentic AI 智能体跃迁,当前基于强化思考的模型正演进为能自主规划、执行复杂任务的智能体。智能体将承担的任务日益复杂,对底层算力与泛化能力的要求远超传统模型,倒逼大模型成为智能生态的核心引擎,重塑行业操作系统的定义。智能体对算力的需求呈量级提升,据相关研究,相同用户规模下,智能体模式相比传统大语言模型的算力需求高出几个数量级。金融领域,工商银行“商户智能审核助手”通过多模态技术处理准入材料,单批次审核的 Token 消耗-10-量是传统 OCR 技术的数十倍;工业场景中,西门子 Industrial Copilot 由多个AI Agent 组成,覆盖订单调度、生产管理全流程,单次完整生产周期的 Token 处理量达数亿级;用户端,腾讯元宝日均提问量已达年初一个月总和,交互频次提升直接带动 Token 需求激增。传统操作系统(如安卓、iOS)的核心是管理确定性硬件资源,而 AI 时代的核心需求是处理自然语言理解、多模态交互等不确定性任务。大模型作为“不确定性引擎”,能将人类意图转化为可执行操作,这是传统 OS 无法实现的核心价值。生态构建模式也随之革新:传统 OS 通过 App 搭建生态,而大模型通过智能应用与 Agent 形成新生态,成为智能世界的底层操作系统。TokenToken 需求的指数级增长,需要更经济的算力供给体系需求的指数级增长,需要更经济的算力供给体系Token 消耗规模爆发式扩张:2025 年 4 月数据显示,谷歌 AI 搜索模式日均 Token 消耗量达 27 万亿,国内头部 AI 产品 Token 调用量月均增长数倍;智能体执行单次任务平均消耗 Token 达数十亿量级,多模态内容生成成为增长最快的细分领域。高昂的算力成本成为核心瓶颈,倒逼算力体系升级:硬件层面,形成 CPU(复杂计算与调度)、GPU(高性能并行计算)、NPU/ASIC(低功耗推理)的多元算力协同供给模式;服务器技术突破,通过 PD 分离等-11-技术,推动 AI 推理进入百万 Token 低于 1 美元的时代。AI 推理算力需求的爆发式增长,推动全球芯片巨头加速布局专用推理芯片。2025 年 9 月,英伟达推出专为长上下文任务设计的 Rubin CPX 芯片,采用创新分离式架构,处理百万级 Token 任务时性能较前代提升6.5倍,预计 2026 年上市;华为在全联接大会发布昇腾 950PR 专用推理芯片,聚焦推理预填充阶段,FP8 算力达 1PFLOPs,搭载 128GB 自研 HBM 内存,计划 2026 年一季度上市。数据将决定模型智能的高度,成为驱动模型突破技术瓶颈、实现数据将决定模型智能的高度,成为驱动模型突破技术瓶颈、实现规模化赋能的关键支撑规模化赋能的关键支撑对于模型智能而言,数据的质量、标注精度与多样性直接决定其认知深度:高质量数据让模型突破浅层拟合,实现对复杂规律的深层理解;跨领域、多模态数据的融合,赋予模型更强的泛化能力与决策准确性,推动智能高度持续攀升。当前,从通用大模型到行业及场景大模型的精细化训练,无不依赖于高质量数据集的支撑,而高质量领域语料的构建,往往需要投入大量的专业领域知识。作为 AI 模型训练与迭代的核心要素,数据的质量、规模与多样性,直接定义了模型的认知边界、决策精度与泛化能力。高质量数据的持续输入,能让模型不断-12-习得复杂场景规律,从感知智能向认知智能跨越;而多维度、跨领域的数据融合,更能打破模型的应用局限,使其在工业、医疗、城市治理等场景中深度适配。未来的竞争未来的竞争,将不再是将不再是 TokenToken 消耗量消耗量这些表象这些表象,而是转向更根本而是转向更根本的维度的维度价值创造价值创造根据相关权威研究表明,虽然 AI 投资回报率(ROI)可观,但多数企业在实践中却难以兑现对等的商业价值。当下模型运算的 Token 消耗量与 AI 产品的用户规模被过多关注。未来的竞争中胜出的真正赢家,将是那些能运用更优的模型、更高效地组织并激励内外部资源,从而解决更真实、更迫切社会与商业问题的组织。评判标准将是解决实际问题的深度、提升产业效率的高度以及增进人类福祉的温度。-13-趋势三:跨越虚实边界,数字智能向具身智能演进,趋势三:跨越虚实边界,数字智能向具身智能演进,世界模型成为关键支撑世界模型成为关键支撑-14-人工智能领域正迎来深刻的范式转移:从专注于数字世界信息处理的“数字智能”,迈向能够在物理世界感知、理解、行动的“具身智能”(EmbodiedIntelligence)。世界模型作为核心支撑,推动虚实边界持续消融,重塑人类与物理世界的交互方式,开启智能应用的全新维度。虚实融合加速演进,物理世界需求驱动智能形态跃迁虚实融合加速演进,物理世界需求驱动智能形态跃迁物理世界中大量重复、危险、精细的劳动场景,构成自动化技术的蓝海市场。传统自动化设备受限于预设程序,缺乏适应性与泛化能力;而传统数字智能虽擅长处理文本、图像等虚拟数据,却因“离身”属性难以跨越虚实交互的天然鸿沟,无法满足物理世界的自动化需求。具身智能的出现填补了这一空白,它是数字智能在物理世界的“实体延伸”,以“拥有物理载体、具备执行能力、能够主动交互”为核心特征。其技术演进遵循“感知认知行动”的闭环优化路径:多模态感知融合视觉、听觉、触觉等传感器信息,实现环境全面理解;认知决策层面强化世界模型的推理预测能力;行动控制环节提升动作的精确性与适应性,最终实现智能体与物理世界的深度交互。具身智能是数字智能在物理世界的具身智能是数字智能在物理世界的 化身化身,将开启万亿赛道将开启万亿赛道-15-具身认知强调,智能并非抽象的计算过程,而是通过本体与环境的互动产生的。从纯粹的软件算法转向具身化系统,使智能体能够通过物理载体与环境交互,实现感知、学习和决策等智能行为。具身智能将构建涵盖核心零部件、软件平台、整机制造、应用服务的庞大产业链,其市场潜力持续释放。据预测,仅中国市场规模在 2030 年有望突破万亿元,成为数字经济与实体经济深度融合的核心增长极。从工业制造的智能巡检、仓储物流的自主搬运,到家庭服务的陪伴机器人、医疗康养的辅助护理,具身智能将渗透千行百业,重构生产流程与生活场景。它不仅能替代高危、重复劳动,更能创造全新服务模式与商业价值,推动社会生产力实现质的飞跃。世界模型作为具身智能的世界模型作为具身智能的“大脑大脑”,决定具身智能的决定具身智能的“认知上限认知上限”世界模型(World Models,WMs)作为具身智能的“大脑”,是其理解物理规律、实现高效交互的核心基础。它本质是生成式 AI 模型,通过构建内部表征捕捉真实世界的物理特性与空间属性,整合视频、文本、运动数据等多源输入,实现环境模拟、动作指导与决策优化。-16-世界模型以“感知-预测-决策”为核心闭环,具备三大关键能力:一是因果推理能力,可模拟假设性场景结果,如自动驾驶中不同避让策略的后果推演;二是时空一致性建模,通过长期记忆机制维持 3D 场景结构稳定与时间演化连贯,规避传统模型的“失真问题”;三是多模态物理规则融合,能精准模拟流体运动、物体碰撞等复杂物理现象,其性能可通过 FID(图像质量)、FVD(视频时空相似度)等指标量化。目前全球主流模型各具优势:谷歌 Genie3 擅长实时交互,英伟达 COSMOS 构建全栈开发平台,商汤“开悟”在高分辨率多视建模领域处于领先地位。具身智能系统作为能够理解并模拟物理世界动态规律的具身智能系统作为能够理解并模拟物理世界动态规律的 AIAI 系统系统,其核心优势在于对物理规律的把握其核心优势在于对物理规律的把握具身智能的落地需求,正倒逼 AI 技术栈、硬件体系与计算架构的全方位革新,形成从软件到硬件、从云端到终端的协同升级。多模态融合深化:需处理视觉、听觉、触觉、力觉等多维数据,推动多模态感知、融合与理解技术突破,构建更立体的物理世界认知。计算架构演进:从“云端大模型”为核心,转向“云-边-端”协同的分布式架构,云端负责训练复杂世界模型与通用大脑,边缘与终端部署轻量化模型,保障实时感知与快速响应。基础硬件创新:催生更高精度、低成本的传感器,更强劲、柔性的执行器(如灵巧手),以及专为具身智能设计的低功耗、高算力 AI 芯片。算力需求激增:处理多模态信息与动态模拟需海量算力,例如生成 60 帧 4K交互视频流每秒需处理超 10 万个 token,一小时持续交互的上下文 token量突破 1 亿,对计算与存储能力提出极高要求。-17-挑战与展望:迈向高级的具身智能,仍需关键技术突破挑战与展望:迈向高级的具身智能,仍需关键技术突破具身智能系统从概念到成熟面临多重挑战,需要从技术、数据和算力等多维度寻求突破。特别是在复杂动态环境中的泛化能力仍有待提高,包括物理规则模拟精度不足、因果反事实推理能力缺失、多模态数据融合困难。未来,随着世界模型的持续优化、硬件成本的下降与算力体系的升级,具身智能将逐步攻克技术瓶颈,实现从特定场景试点到规模化应用的跨越。它将彻底打破虚实边界,让智能真正融入物理世界,成为推动社会进步的核心力量。-18-趋势四:超节点成为算力新底座,智算中心进入超节趋势四:超节点成为算力新底座,智算中心进入超节点时代点时代-19-当 AI 大模型参数量突破十万亿级、智能体单任务 Token 消耗达数亿量级,全球算力需求呈指数级爆发。传统智算中心受限于芯片工艺物理极限与“内存墙”瓶颈,算力供给模式面临根本性变革,超节点作为系统级创新载体,正重塑算力基础设施格局,标志着智算中心正式迈入超节点时代。算力爆发倒逼计算架构革新算力爆发倒逼计算架构革新AI 商业化落地与技术迭代,催生了对高效能、低时延算力的刚性需求,传统算力供给模式已难以适配。大模型训练与推理对算力提出极致要求:万亿参数模型单次训练需消耗千亿级浮点运算能力,复杂任务智能体的 Token 消耗达数亿量级;多模态应用、科学模拟等场景则推动算力需求从通用计算向专用高性能计算延伸。而摩尔定律放缓导致芯片性能提升幅度下滑,2018-2022 年 AI 芯片性能年均提升 50%,2023-2025 年已降至 20%以下,单点芯片突破难以为继。传统架构存在天然瓶颈:冯诺依曼架构下,数据需在处理器与内存间频繁搬运,30%-50%算力消耗于数据传输,时延居高不下;“横向扩展”的传统计算集群,通过通用以太网连接标准化服务器,难以满足大模型分布式训练中高频次集合通信对带宽与时延的核心诉求,集群规模扩大后瓶颈愈发突出。在此背景下,通过超节点实现存储、计算、网络资源的系统级整合,成为提升算力效率的必然选择。当前,中国算力产业在高端芯片设计与制造环节仍面临显著差距。设计工具(EDA)受国际厂商主导,7 纳米及以下先进制程的制造能力受限,同时,核心材料如高端光刻胶、大硅片等对外依存度较高。这导致国产算力芯片在高端数据中心、智算中心等关键场景的市场占比偏低,90%以上的 AI 训练芯片依赖进口,制约了国家算力自主供给能力。在芯片先进工艺演进遭遇物理极限与成本约束的-20-背景下,以超节点架构补位芯片短板,成为中国突破算力效能瓶颈的重要路径选择。超节点打破传统服务器的硬件边界,通过超节点打破传统服务器的硬件边界,通过平等平等互联技术,重构算互联技术,重构算力供给形态力供给形态超节点并非简单的硬件堆砌,而是通过平等互联技术打破传统服务器边界,构建统一资源池,实现算力的高效协同与价值释放。其核心优势源于基础技术、系统能力与软硬协同的三方支撑:基础技术层面,依托超高带宽互联、内存统一编址等特征,将数百上千个 AI 处理器编织为逻辑统一的高密度计算体,提供底层支撑;系统能力层面,具备大规模组网、高可靠运行、多场景适配特性,突破单机硬件限制,化解故障风险,通过精细化调度满足多元业务需求;软硬协同层面,通过定制化软件框架释放硬件潜力。以华为 CloudMatrix384 超节点为例,其采用高速网络总线,实现 384 颗昇腾 NPU 与 192 颗鲲鹏 CPU 的平等互联,支持“一卡一专家”灵活部署模式,大幅提升 MoE 模型推理效率。超节点域内可实现百 GB/s 级通信带宽、纳秒级时延、TB 级超大内存,既能以极致吞吐支撑万亿参数训练,也能以低时延满足企业级大规模推理需求,实现集群能力跃迁。-21-新型计算总线成为突破计算瓶颈的关键新型计算总线成为突破计算瓶颈的关键新型计算总线作为突破计算瓶颈的核心,从芯片间、节点间到全域协同,构建全层级高效互联体系,重构算力能力边界。芯片间互联技术持续迭代:Scale Up 协议(NVLink、灵衢、UALink 等)提供百纳秒级时延,支撑多芯片协同;CXL 协议简化异构计算编程模型;UCIe 标准推动 Chiplet 互联标准化,促进产业链分工。节点间互联技术优化升级:ScaleOut(Infiniband、UEC、灵衢等)提供数百 Gbps 带宽与微秒级延迟,成为高性能计算首选;硅光互联技术为长距离、低功耗、高带宽互联提供新路径。全域协同层面,Scale Across 总线构建跨集群互联架构,让分散算力集群形成统一资源池,高效响应跨场景、跨地域弹性算力需求,为超大规模模型演进提供支撑。依托高速互联技术,超节点将大带宽互联范围从单台服务器扩展至整机柜及跨机柜大规模集群,彻底打破传统架构的连接限制。相较“服务器集群”,超节点代表的是弹性、池化、开放的系统能力:既能以极致吞吐支撑万亿参数训练,也能以低时延满足企业级大规模推理的刚性需求。随着超节点成为随着超节点成为 AIAI 基础设施的核心基础设施的核心,垂直整合和协议开放两种主垂直整合和协议开放两种主-22-流生态流生态模式角逐产业主导权模式角逐产业主导权垂直整合模式:通过端到端控制从 AI 芯片、互联技术到编程模型的全技术栈,追求最优性能与效率。但互联协议闭源,用户面临厂商锁定风险,选择灵活性受限,且成本高昂。协议开放模式:以“兼容性”和“选择权”对抗封闭性,构建基于开放标准的多元化生态,参与者包括 AMD、Intel、Meta、Microsoft、华为等。通过灵衢、“超级以太网联盟(UEC)”“超级加速器互联(UALink)”联盟推动技术标准化,但存在生态碎片化、性能优化难度大的核心挑战,且缺乏配套软件实现。超节点形态超节点形态将成为智算中心的主流基础设施将成为智算中心的主流基础设施根据 TrendForce 等咨询公司预估,2025 年 Blackwell GPU 将占英伟达高阶 GPU 出货比例 80%以上,其中 Blackwell GPU 主要应用于超节点(如NVL72,NVL36、GB200 Rack、HGX B200 等新平台产品)。根据相关的统计,超节点出货的 GPU 占其 50%左右,这清晰表明,通过先进互联技术将多个 GPU整合为统一计算资源的“超节点”形态,未来将成为高端智算中心的主流基础设施。可以预见超节点计算形态将是智算中心的主流。超节点的崛起,标志着智算中心从“硬件堆叠”向“系统创新”的质变,是应对算力指数级增长、突破技术瓶颈的必然选择。作为算力新底座,超节点将通过软硬件协同的架构优势,支撑 AI 技术持续迭代与产业深度赋能,引领全球算力基础设施进入全新发展阶段。-23-趋势五趋势五:从以从以 CPUCPU 为中心的计算架构为中心的计算架构,迈向多样化平迈向多样化平等计算架构等计算架构-24-延续半个多世纪的“CPU 为中心”主从计算范式正被打破。随着人工智能爆发式增长与能效瓶颈日益凸显,由 CPU、GPU、NPU、DPU 及 ASIC、FPGA等多样化处理器组成的平等协同架构,成为计算架构的核心演进方向,重塑数据中心算力供给逻辑。单一架构难以单一架构难以满足满足多样化算力需求多样化算力需求,驱动计算架构向多样驱动计算架构向多样化化发展发展传统 CPU 主从架构的通用性优势,已无法满足现代数据中心专业化、多样化的算力诉求,驱动架构向多样化、协同化转变。工作负载呈现极致分化:AI 训练需海量并行浮点运算能力,网络功能虚拟化依赖高速数据包处理,大数据查询侧重特定过滤与聚合操作,企业应用则追求稳定通用计算支持。单一通用 CPU 架构难以以最优能效应对所有场景,“用最佳工具做最佳事”的架构理念应运而生。能效瓶颈倒逼技术迭代:数据中心功耗与碳排放压力持续增大,CPU 处理专用任务时能效低下,而专用加速器通过精简架构、针对性优化,能以更高能效比完成任务,推动算力部署从“CPU 主导”转向“xPU 多算力混合部署”。算力调度走向精准匹配:通用计算由 CPU 承载,AI 训练依托 GPU/NPU的并行计算优势,推理优先采用低成本 ASIC。通过统一调度计算节点内的异构资源,结合上层业务负载特征匹配最优底层算力,实现资源利用率最大化。从从 CPUCPU 为中心的架构为中心的架构,走向走向平等平等新型计算架构新型计算架构,形成统一的计算形成统一的计算、通信、调度、协同的计算体系架构通信、调度、协同的计算体系架构-25-新架构以“高速互联总线”为核心,取代 CPU 成为算力协同的枢纽,构建起统一调度、高效协同的计算体系,彻底打破传统主从架构的瓶颈。传统主从架构的局限:以 CPU 为绝对中心,所有数据需经 CPU 内存子系统中转,大量 CPU 周期与内存带宽被消耗,导致 CPU 成为性能与延迟瓶颈,无法适配高并发、多样化计算需求。这一现状倒逼计算架构向协同化方向演进,单纯提升单个计算单元性能已无法解决效率与成本的平衡问题,唯有通过大规模计算单元的协同调度,优化算力分配与资源利用效率,才能从根本上降低 AI 模型运营的综合成本。平等架构的核心特征:以高速互联总线连接 CPU、内存、存储及各类加速器,形成资源池化的分布式系统。各计算单元地位平等,支持异构计算单元高效互连、内存池化访问、资源动态分配与高可靠传输,大幅提升系统灵活性、扩展性与资源利用效率。资源池化的核心价值:将 CPU、xPU、内存、存储等硬件资源分类为独立“资源池”,摆脱单台服务器的专属限制,实现抽象化、共享化管理。计算任务可按需从不同资源池组合算力、存储与内存,动态适配多元负载需求。算力的发展路线多样化算力的发展路线多样化多样化计算需求推动算力发展路径分化,通用计算与专用加速器形成互补,共同支撑算力生态升级。-26-通用计算领域:ARM 架构崛起成为全球通算领域主流力量。其从移动场景成功拓展至数据中心,凭借开放授权模式(指令集、软核、硬核授权),获得 AWS、谷歌 Cloud、微软 Azure、阿里云、华为云等大型云服务商及政企用户青睐,实现降本增效。据预测,ARM 在中国整体市场份额超 30%,国计民生领域占比高达 60%以上,未来仍将保持高速增长。带加速器的 AI 服务器中,ARM 架构已经超过 50%,CPU 与 GPU 的协同设计显著提升异构算力效能,使 ARM 在智算中心渐成主流。专用加速器领域:GPU 与 NPU/ASIC 呈现差异化发展。GPU 依托大规模并行处理能力,成为 AI 训练与高性能计算的主力,通过 Chiplet、CoWoS 等先进封装技术提升算力密度,借助 NVLink 等高速互联技术协同优化大规模任务效率。NPU/ASIC 走专用化路线,为 AI 推理、视觉处理等场景定制算法硬件,虽灵活性不及通用芯片,但能效比优势显著 专用 AI 推理 ASIC 的能效比可达传统 CPU 的 10 倍以上,成为边缘计算等功耗敏感场景的核心选择。价值链转移,价值链转移,CPUCPU 被弱化,被弱化,GPU/NPU/ASGPU/NPU/ASICIC 加速器重要性凸显加速器重要性凸显,价值链扩散化价值链扩散化计算架构变革推动产业价值链重构,CPU 的核心地位弱化,专用加速器与系统级解决方案的价值凸显。市场份额此消彼长:2023 年 CPU 在 AI 数据中心处理器市场的份额为20.5%,预计到 2030 年,CPU(x86+ARM 架构)在数据中心半导体总支出中的占比将降至 10%,而 GPU/AI 加速器占比将升至 60%,成为算力核心支柱。价值链全面扩散:产业价值从单一 CPU 硬件,向系统设计、互联技术、异构软件栈、编译器工具、云服务等上下游延伸。能够提供“硬件+软件+系统”-27-完整解决方案的厂商,将在行业竞争中占据主导地位。计算架构的范式变革,本质是算力供给对多样化需求的精准响应。从“CPU为中心的层级架构”到“高速互连为核心的平等架构”,不仅是技术形态的升级,更是算力价值释放模式的重构,将为数字经济发展提供更高效、灵活、可持续的算力支撑。-28-趋势趋势六六:以网强算:以网强算,建设毫秒级算力网,强化算力基建设毫秒级算力网,强化算力基础设施高质量发展础设施高质量发展-29-随着 AI 大模型、工业互联网、自动驾驶等新一代信息技术的迅猛发展,算力需求正以前所未有的速度和规模爆发。传统的以大型、集中式数据中心为核心的算力供给模式,在面对海量数据实时处理、超低时延交互等新兴业务场景时,日益显现出瓶颈。算力需求暴涨与资源错配的矛盾算力需求暴涨与资源错配的矛盾预计 2025 年中国智能算力规模将达 1037EFLOPS,同比增长超 40%,呈现出指数增长的趋势,但也带来了一定的供需矛盾。东部地区承载了全国近六成的算力需求,但面临能耗指标紧张、电力成本高企的压力;而西部地区虽拥有丰富的绿色能源禀赋,本地算力需求相对有限,其清洁能源潜力尚未充分转化为算力供给优势。以大规模集中式数据中心为代表的传统算力供给模式,在应对高并发、超低时延、强交互的新型业务场景(如具身智能物理交互、工业互联网多模态协同等)时,已日益暴露出系统性瓶颈。物理极限挑战:单一数据中心在能耗、散热、组网规模等方面逼近天花板;跨域协同效率低下:跨地域、集群的算力资源难以实现高效调度与任务协同;网络传输损耗显著:仅 0.1%的网络丢包率即可导致算力效率下降约 50%,成为低时延业务的关键瓶颈为破解算力资源的结构性错配,我国自 2022 年起启动“东数西算”国家战略工程,并于 2024 年加速推进全国一体化算力网建设。其核心路径是通过构建“云网边端”协同
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服