> **来源:[研报客](https://pc.yanbaoke.cn)** # 英伟达引领AI基建时代,LPU拓展推理边界 ## 核心内容 2026年3月17日,英伟达在GTC大会上正式推出全新AI超算平台Vera Rubin,集成多款高性能芯片,标志着其在AI基础设施领域的进一步布局。该平台将作为Blackwell架构的继任者,全面采用台积电3nm工艺,性能和能效显著提升,预计将在2026年下半年量产。 ## 主要观点 1. **营收指引上调,彰显算力高景气** - 英伟达上调了2025-2027年AI算力芯片的累计营收指引至至少1万亿美元,较此前预测翻倍。 - 过去三年AI产业的重要里程碑包括ChatGPT开启AIGC时代、o1推理模型提升问题处理能力、Claude Code革新软件工程,推动AI计算需求激增。 - Rubin架构在NVFP4精度下,训练算力达35PFlops,推理算力达50PFlops,能效较Blackwell分别提升3.5倍和5倍。 2. **LPU技术拓展推理边界** - 英伟达与Groq达成200亿美元授权协议,整合其LPU技术。 - LPU采用基于SRAM的片上存储,显著降低时延,适合AI Agent、物理AI等即时处理应用。 - Groq LP30芯片已进入量产阶段,预计2026Q3出货;Groq3 LPU密度提升至256个,推动出货量大幅增长。 - LPU作为“Token加速器”集成至Vera Rubin平台,专攻解码任务,保障在高成本AI服务中的性能输出。 3. **液冷技术确定性加强** - Vera Rubin采用100%液冷设计,使用45°C温水冷却,安装时间大幅缩短。 - 黄仁勋预测传统IDC中液冷渗透率将超过50%,最终达到100%。 - 液冷组件价值量随着NVL 144的升级而提升。 4. **下一代架构Feynman与太空计算布局** - Feynman架构采用台积电1.6nm A16制程,引入芯片级光互联,带宽密度提升10倍,传输能耗下降90%。 - 英伟达推出Space-1 Vera Rubin模块,专为太空环境设计,性能较H100提升25倍,可用于轨道IDC、地理空间智能和自主空间操作。 ## 关键信息 - **产品发布**:Vera Rubin平台集成Vera CPU、Rubin GPU、NVLink 6交换机、BlueField-4 DPU、Spectrum-6以太网交换机、ConnectX-9超级网卡及Groq 3 LPU。 - **性能提升**:Rubin单GPU训练算力达35PFlops,推理算力达50PFlops;LPU每瓦推理Token吞吐量提升10倍。 - **液冷设计**:Vera Rubin采用100%液冷,安装时间缩短至2小时,未来液冷渗透率有望超过50%。 - **Feynman架构**:下一代架构采用1.6nm制程,引入光互联,性能和能效显著提升。 - **太空计算**:Space-1模块专为太空环境设计,性能较H100提升25倍,拓展边缘AI推理应用场景。 ## 风险提示 - AI技术迭代过快 - AI硬件产能释放缓慢 - 下游CSP大厂Capex不及预期 - 中美科技摩擦加剧 ## 相关报告 - 【银河海外算力】行业周报|OFC即将举办,重点聚焦硅光子学等板块 - 【银河通信赵良毕】行业周报|光纤价格增长显著,OpenClaw再增算力需求 - 【中国银河通信】新基建超前布局,“十五五”新质生产力蓬勃发展——“十五五”规划纲要点评 ## 研究团队介绍 - **赵良毕**:中国银河证券通信行业首席分析师,通信&中小盘团队负责人、科技组组长,拥有8年中国移动通信产业研究经验。 - **王思成**:通信&中小盘分析师,重点覆盖设备侧产业链。 - **洪烨**:通信&中小盘分析师,重点挖掘中小市值标的,兼顾通信设备侧产业链。 - **赵中兴**:通信&中小盘分析师,重点覆盖应用侧产业链。 - **刘璐**:分析师助理,金融工程和风险管理硕士,主要从事通信行业研究。 - **杨雨晴**:分析师助理,管理学硕士,主要从事通信行业研究。 ## 评级体系 - **行业评级**:推荐(相对基准指数涨幅10%以上)、中性(相对基准指数涨幅-5%~10%之间)、回避(相对基准指数跌幅5%以上)。 - **公司评级**:未明确,需参考具体公司表现。