> **来源:[研报客](https://pc.yanbaoke.cn)** # 广发电子 | AI的进击时刻25:英伟达发布 Vera Rubin POD 平台总结 ## 核心内容概述 2026年3月16日,英伟达在GTC大会上发布了**Vera Rubin POD平台**,该平台包含**5个专为Agentic AI工作负载打造的全新机架级系统**。此次发布旨在强化英伟达在Agent应用领域的算力和推理能力,通过异构计算架构提升整体性能和效率,满足AI推理对高吞吐量、低延迟和大内存存储的需求。 ## 主要观点 - **Vera Rubin POD平台**是英伟达针对**Agentic AI**(代理型AI)工作负载推出的系统级解决方案,包含多种机架类型,形成一个完整的异构计算生态。 - **Agentic AI**对算力、存储、网络和沙箱环境提出了更高的要求,尤其是对**低延迟、高吞吐量和密集计算**的需求,促使英伟达在多个方面进行技术升级。 - **Vera Rubin NVL72机架**作为核心计算单元,采用NVLink互连技术,负责**Prefill和Attention计算**。 - **Groq3 LPX机架**用于加速**Decode阶段的FFN计算**,配备高性能LPU处理器和大容量SRAM,显著提升吞吐量和效率。 - **Vera CPU机架**承担**强化学习(RL)和Agent沙箱环境**的支撑任务,支持大量并发环境,用于测试、执行和验证AI模型输出。 - 通过**异构协同架构**,Vera Rubin POD平台实现了性能和效率的显著提升,特别是在每兆瓦吞吐量方面,较NVIDIA GB200 NVL72提升了**35倍**。 - **投资建议**指出,AI产业链正处于快速发展阶段,建议关注**核心受益标的**,特别是在模型创新、算力基础设施和存储周期升级方面。 ## 关键信息 ### Vera Rubin POD平台组成 | 机架名称 | 数量 | 单机架TRAY层数 | 单TRAY芯片数 | 总计 | |------------------|------|----------------|--------------|------| | Vera Rubin RACK | 16 | 18 | 2*Vera Rubin | 1152 GPU | | Vera CPU RACK | 2 | 32 | 8*Vera CPU | 512 CPU | | LPU RACK | 10 | 32 | 8*Groq 3 LPU | 2560 LPU | | ICMS RACK | 2 | 16 | 160TB SSD | 19200TB | ### Groq3 LPX机架特性 - 集成**256个LPU处理器**。 - 配备**128GB片上SRAM**和**640TB/s带宽**。 - 与**Vera Rubin NVL72机架**协同,实现**Attention与FFN分离计算**,显著提升解码效率。 - 在每用户400 TPS的条件下,**Vera Rubin NVL72 + Groq3 LPX**组合较NVIDIA GB200 NVL72实现**35倍TPS提升**。 ### Vera CPU机架特性 - 集成**256个Vera CPU**。 - 采用**高密度液冷设计**。 - 支持**超过22500个并发强化学习(RL)或代理沙箱环境**,用于模型测试与验证。 ## 投资建议 - AI正处于**快速发展阶段**,模型创新与算力基础设施(CAPEX)建设并重。 - **AI推理需求**推动存储周期持续向上,**扩产与升级同步进行**。 - 建议关注**AI产业链核心受益标的**,尤其是**算力、存储、网络和沙箱环境**相关企业。 ## 风险提示 1. **AI产业发展及需求不及预期**:若AI模型和应用场景发展不如预期,可能影响服务器需求。 2. **AI服务器出货量不及预期**:受企业IT支出影响,特别是云计算厂商的CAPEX支出,若投入不足,将影响出货量。 3. **国产厂商技术进展不及预期**:若国内厂商在算力、数据或算法等方面支撑不足,可能影响其技术发展和产品竞争力。