> **来源:[研报客](https://pc.yanbaoke.cn)** # 超节点:国产算力进攻的“矛” ## 核心内容 超节点是AI基础设施发展的必然趋势,是训练侧与推理侧算力扩展的必经之路。随着AI模型参数和复杂度的提升,超节点通过内部高速总线互连,能够有效支撑大规模并行计算任务,缩短大模型训练周期,同时在推理侧解决“内存墙”问题,提升推理性价比。未来百万卡集群的建设将依赖超节点作为其基础架构。 ## 主要观点 1. **训练侧**: - 随着模型参数提升和MoE架构的应用,传统单卡GPU已无法满足需求,需采用分布式训练方式。 - TP(张量并行)和EP(专家并行)带来高带宽、低时延的通信需求,超节点内部高速互联可有效解决这一问题。 2. **推理侧**: - 推理任务对KV Cache缓存要求高,超节点通过优化架构和高带宽互联,显著提升单W每秒生成Tokens的效率。 - “养龙虾”时代来临,Tokens消耗大幅增长,超节点在推理场景中具备更高性价比。 3. **百万卡集群**: - Scaleup(纵向扩展)是未来百万卡集群的首选方式,超节点作为其基础,可有效解决通信和内存瓶颈问题。 ## 关键信息 - **超节点结构**:包括计算节点、交换节点、TOR交换机、供电单元、液冷散热等,支持高密度、高性能、高能效。 - **Scaleup协议**:包括NVLink、SUE、UALink、UB、HSL、OISA、ALS、EthLink等,其中部分协议已逐步走向开源开放,推动超节点生态建设。 - **性能对比**:尽管国产芯片在制程上略有落后,但通过超节点的集群方式,整体性能可显著提升,如华为CloudMatrix384在BF16性能上达到NVL72的1.7倍。 - **趋势变化**:超节点带来五大变化趋势,包括交换芯片用量增加、PCB背板与光互连需求增长、液冷成为刚需、服务器ODM厂商价值重估、供电系统重构等。 ## 投资建议与标的 - **交换芯片**:盛科通信-U、万通发展、澜起科技 - **服务器整机**:华勤技术、浪潮信息、紫光股份、工业富联、联想集团、中兴通讯 - **PCB及光通信**:南亚新材、深南电路、华工科技、光迅科技、源杰科技、长光华芯、环旭电子 - **液冷设备**:英维克、申菱环境、领益智造、远东股份、高澜股份 - **供电设备**:欧陆通、英诺赛科、天岳先进、杰华特、纳芯微、芯联集成-U ## 风险提示 - AI发展不及预期 - 行业竞争加剧 - 地缘政治风险 ## 证券分析师 - 薛宏伟、荆剑、贾国瑞、雷星宇 ## 联系人 - 李晋杰 ## 相关报告 - “光之设备”新起点(2026-04-14) - AI存储需求强劲,关注CXL内存池方案(2026-04-14) - 海外AI迎新叙事(2026-04-08) ## 图表目录 - 图1:AI模型持续迭代,性能持续攀升 - 图2:AI基础设施进入超节点时代 - 图3:稠密模型和稀疏模型通信模式的差异 - 图4:AI大模型采取并行策略训练 - 图5:并行策略下TP、EP带来大量带宽需求 - 图6:超节点服务器对推理架构优化 - 图7:超节点集群Tokens per second/W吞吐量更高 - 图8:算力集群拓展方向Scaleup + Scaleout - 图9:Scaleup互联带宽更高 - 图10:超节点性能优于普通集群 - 图11:超节点类型分类 - 图12:超节点机柜正面外观示意图 - 图13:超节点机柜背面外观示意图 - 图14:计算节点拓扑结构 - 图15:计算节点各组成部件 - 图16:交换节点系统功能框图 - 图17:超节点通过Cable tray互联 - 图18:机柜功耗持续攀升带动PSU需求 - 图19:采用Busbar为各节点提供电源 - 图20:计算节点采用冷板散热设计 - 图21:机柜背板通过manifold供水 - 图22:各架构规模上限及网络时延对比 - 图23:NVL72超节点引入Switch tray互联 - 图24:Vera Rubin NVL72 - 图25:NVL576 2层Clos拓扑组网 - 图26:英伟达推出NVL576 - 图27:AMD MI350 Fullmesh互联 - 图28:华为柜内64卡采用2D fullmesh互联 - 图29:TPU3D Torus架构 - 图30:Dragonfly拓扑结构 - 图31:Dragonfly+拓扑结构 - 图32:超节点以量取胜,弯道超车 - 图33:开放Scaleup协议生态逐步丰富 - 图34:NVLink的演进 - 图35:MGX ETL机柜支持第三方芯片部署 - 图36:更加开放的以太网SUE架构 - 图37:博通发布Tomahawk Ultra支持HPC及Scaleup - 图38:UALink分层架构图 - 图39:AMD发布MI455X Helios超节点服务器 - 图40:计算单元通过UB完成全局同步 - 图41:海光双芯战略 - 图42:中科曙光发布scaleX640超节点 - 图43:OISA三层架构 - 图44:OISA生态丰富 - 图45:ALS支持UALink协议 - 图46:阿里发布磐久AL128超节点服务器 - 图47:字节EthLink协议栈 - 图48:火山引擎大禹超节点服务器 - 图49:ETH+ Scale-Up架构具备强兼容性和可扩展性 - 图50:Scaleup域持续扩张,交换芯片重要性愈发凸显 - 图51:3.2T GPU HBD互联拓扑 - 图52:12.8T GPU HBD互联拓扑图 - 图53:不同互连方案的成本对比(相对值对比) - 图54:不同互连架构对比 - 图55:各类别拓扑类型对比 - 图56:单机柜30KW以上时,液冷性价比凸显 - 图57:DPU、NIC网卡均配备液冷模组 - 图58:交换机芯片、CPO均采用液冷模组 - 图59:从L10到L11/L12整机柜交付 - 图60:中国移动776套超节点设备最高投标报价20.70亿元 - 图61:昆仑芯512超节点将于2026下半年上市,2030年上市百万卡集群 - 图62:超节点机柜采用集中供电 - 图63:超节点机柜功耗增长,带动PSU需求 - 图64:英伟达机柜功耗持续提升至MW级 - 图65:数据中心供电方式向HVDC、SST转变 - 图66:盛科通信参与OISA生态共建 - 图67:ETH-X原型机在华勤技术东莞智能制造基地点亮 - 图68:浪潮信息推出元脑SD200超节点 - 图69:Coolinside全链条、全场景、全周期液冷解决方案 - 图70:英维克Deschutes 52MW CDU - 图71:锐捷网络展示ETH128计算节点 - 图72:锐捷网络展示ETH128交换节点