> **来源:[研报客](https://pc.yanbaoke.cn)** # 超节点行业深度总结 ## 核心内容 超节点是一种通过多设备物理与逻辑深度耦合,实现高密度、高性能 AI 算力的基础设施。它通过高速互联协议、统一内存和集中供电散热系统,解决了传统服务器集群在大模型训练中的通信、功耗与复杂度瓶颈,成为未来 AI 算力发展的主流架构。 ## 主要观点 - **超节点的优势**:相比传统 Scale-out 架构,超节点通过 Scale-up 通信域,实现 GPU/NPU 之间的高带宽、低延迟互联,提升算力利用率,降低能耗,简化部署。 - **超节点发展趋势**:未来超节点将逐步从封闭生态转向开放架构,通过标准化协议与硬件接口,推动多方协作,降低厂商锁定风险。 - **国产超节点崛起**:国内厂商如腾讯、华为、阿里、中科曙光等正加快布局超节点产品,推动国产算力规模化发展,打破海外 GPU 依赖,提升国内大模型训练能力。 - **市场前景广阔**:预计到2028年,我国超节点市场规模将达3414亿元,2026-2028年CAGR高达194%。 ## 关键信息 - **超节点定义**:由多台设备组成,逻辑上视为单一计算单元,支持数千颗芯片互联,提升训练效率。 - **通信墙问题**:传统集群使用以太网或 PCIe 连接,存在高延迟、低带宽问题,而超节点通过 NVLink、CXL、RoCE、Alink 等协议实现高效互联。 - **功耗墙与复杂度墙**:传统服务器集群因分散供电散热,导致功耗密度低,部署复杂。超节点通过集中供电与液冷技术,实现高效能与高稳定性。 - **国产算力挑战**:国内算力集群规模远低于海外,超节点成为实现“规模换算力”的关键手段,有助于提升国内大模型训练能力。 ## 超节点架构 超节点由以下主要组件构成: - **计算节点**:包含 GPU、CPU、PCIe Switch、内存、存储等,支持多种互联方式(如 NVLink、RoCE、Alink)。 - **交换节点**:用于连接多个计算节点,提供高带宽互连,支持多机柜扩展。 - **供电单元**:支持高功率(最大132kW),采用 Busbar 供电方式,具备 N+2 冗余。 - **散热系统**:采用风液混合方式,液冷为主,风冷为辅,未来可能发展为全液冷方案。 ## 主流超节点系统 ### 1. 英伟达 GB200 NVL72 - 单机架支持 72 卡,采用 NVLink 互联协议。 - 单链路带宽达 50 GB/s,单 GPU 双向带宽达 1800 GB/s。 - 支持大规模集群扩展,未来可扩展至 576 卡(NVL576)。 - 通过 NVLink-C2C 技术,实现芯片间直接互联,降低通信延迟。 ### 2. 谷歌 TPU Ironwood - 支持 9216 芯片互联,峰值性能达 4614 TFLOPS,是上一代的 10 倍。 - 引入 OCS(光交换机)技术,实现全光互联,提升网络吞吐量,降低能耗。 - 采用 MEMS 技术,通过镜面反射实现光束直接传输,减少信号转换。 ### 3. 亚马逊 Trainium2 - 单台服务器支持 64 芯片,采用 NeuronLink 互联技术,实现低延迟与高带宽。 - 通过无源铜缆(DAC)与有源铜缆(AEC)实现内部与机柜间互联。 - 支持 2U CPU 头柜与计算托盘组合,提升系统灵活性与扩展性。 ## 产业链影响 - **硬件需求增长**:超节点带动 GPU、交换芯片、高速线缆、液冷系统、高功率电源、UPS/HVDC、PCB 等需求。 - **软件生态发展**:超节点推动自研通信协议(如 ETH-X、Alink、LQC)与集合通信库(如 NCCL)的发展,提升算力调度与通信效率。 - **厂商竞争格局变化**:超节点将算力生态从 GPU 厂商主导转向下游客户主导,形成开放生态。 ## 核心增量环节 - **高速互联协议与硬件**:如 NVLink、RoCE、Alink、LQC、EthLink 等。 - **统一内存与缓存一致性**:实现多芯片间内存共享,提升数据访问效率。 - **液冷散热系统**:满足高功耗需求,提升系统稳定性与能效。 - **高功率电源与供电架构**:支持大规模集群,提升供电效率与冗余能力。 ## 相关公司 - **英伟达**:推出 GB200 NVL72、GB300 系列,主导 NVLink 技术。 - **华为**:推出 Atlas A3 900 SuperPod,支持 384-8192 卡,采用 LQC 协议。 - **腾讯**:联合中国信通院推出 ETH-X 超节点方案,基于以太网 RoCE 协议。 - **阿里**:推出磐久 AL128 超节点,采用自研 Alink 协议。 - **中科曙光**:发布 ScaleX40、ScaleX640,支持 40-640 卡,采用无线缆或高密机柜设计。 - **百度**:推出天池系列,支持 32-512 卡,采用自研天池协议。 - **字节跳动**:推出大禹超节点,支持 64-128 卡,采用 EthLink 协议。 - **海光**:推出 HSL 协议,支持开放架构与多厂商协同。 ## 发展趋势 - **从封闭到开放**:超节点协议与架构逐渐开放,推动多厂商协同。 - **从单机柜到多机柜级互联**:通过级联方式实现更大规模超节点,如 576 卡、8192 卡、甚至 15488 卡。 - **从 GPU 到 NPU 多元化**:超节点不仅适用于 GPU,也适用于 NPU,如华为昇腾系列。 - **从高密度到高能效**:随着技术发展,超节点将更注重能效比与系统稳定性。 - **从硬件到软件生态**:超节点推动软件生态发展,提升通信与调度效率,降低算力使用成本。 ## 参考研报 - 《超节点 Scale-Up 网络互联技术白皮书》(中国移动、天风证券) - 《UB-Mesh: a Hierarchically Localized nD-FullMesh Datacenter Network Architecture》 - 《超节点发展报告》(华为) - 《ETH-X超节点AI整机柜设计规范》(ODCC) - 《Mission Apollo: Landing Optical Circuit Switching at Datacenter Scale》(谷歌) --- **总结**:超节点作为新一代 AI 算力基础设施,正引领 AI 算力市场格局变化,通过高带宽、低延迟、集中供电散热等技术突破,解决大模型训练中的通信、功耗与复杂度瓶颈。未来,随着国产超节点生态的完善,以及开放协议与架构的推广,超节点将成为 AI 算力的主流形态,推动算力体系向更高效、更灵活、更开放的方向发展。