算力芯片行业报告_大模型驱动算力变革_国产算力迎增量机遇_34页_3mb

> **来源：[研报客](https://pc.yanbaoke.cn)** # 算力芯片行业报告总结 ## 核心内容概览 - **大模型驱动算力变革**：大模型的快速发展推动算力需求从训练向推理扩散，行业进入“应用推理”阶段，对高吞吐、大并发和成本性能平衡的需求显著提升。 - **国产算力迎来增量机遇**：随着中美大模型竞争格局的形成，国产算力在信创需求的推动下加速适配，全栈效率成为关键。 - **AI计算异构化与系统级协同**：AI算力产业正从“单芯片性能提升”转向“系统级协同优化”，强调芯片、软件生态、服务器、网络互联、液冷和大规模集群的综合效率。 - **海外芯片平台化交付**：英伟达、谷歌、AWS等海外巨头已从单芯片竞争转向平台化交付，构建“芯片+网络+软件+系统”的综合解决方案。 - **算力需求持续增长**：全球AI算力资本开支保持年均20%的增速，训练与推理需求均呈上升趋势，其中推理侧增速更快。 ## 主要观点 - **算力需求外溢**：随着大模型应用的规模化落地，推理侧的算力投资规模已超越训练侧，预计2024-2028年推理收入CAGR为14.3%，高于训练侧的13.8%。 - **异构计算体系**：AI系统本质上是异构计算体系，CPU负责通用调度，GPU承担大规模并行加速，TPU/NPU等ASIC芯片则在特定模型和推理场景中具有效率优势。 - **芯片竞争转向系统效率**：算力竞争已从单芯片峰值性能转向“芯片+网络+软件+系统”的平台综合效率，系统级协同优化成为关键。 - **国产大模型加速追赶**：2025年，中国在知名大模型数量上已超越欧洲，成为全球大模型供给的第二大核心力量，与美国形成竞争格局。 - **AI芯片演进方向**：从通用计算到并行计算，再到矩阵加速，最终演进为系统级AI算力平台，涵盖更广的计算场景和更高性能需求。 ## 关键信息 - **算力需求预测**： - 2024年全球AI训练与推理算力市场规模分别为21000百万美元和23000百万美元。 - 预计2024-2028年，推理收入CAGR为14.3%，训练收入CAGR为13.8%。 - **大模型迭代趋势**： - **海外大模型**：自2023年起，保持每半年一代的高频迭代，追求智能化升级。 - **国产大模型**：2025年起迭代速度显著提速，代表产品如DeepSeek-R1、智谱GLM等，产品丰富度提升。 - **算力芯片技术演进**： - **英伟达**：从GPU通用计算走向AI数据中心整体效率提升，推出Blackwell系列，强化Tensor Core和HBM。 - **谷歌**：从内部推理ASIC发展为云端训练与推理兼顾的TPU平台，推出Ironwood等新一代产品。 - **AWS**：围绕云服务发展推理与训练芯片，Trainium3和Trn3 UltraServers强调3nm工艺和更高带宽。 - **国产算力适配与信创**： - 2026年5月，9款国产AI芯片被纳入信创体系，标志着国产算力进入新的发展阶段。 - 国产算力的焦点从单卡峰值转向“芯片 + HBM + 互联 + 服务器 + 编译器/算子库 + 推理引擎 + 模型适配”的全栈效率。 - **AI五层蛋糕**： - AI基础设施体系包括能源、芯片、基础设施、模型和应用，形成逐层链接的生态体系。 - 芯片作为底层资源，决定上层应用的性能与成本。 ## 算力芯片发展趋势 - **从单芯片性能到系统级效率**：算力竞争已从单芯片跑分演进为“系统交付能力”竞争，强调集群规模、能效、带宽和软件生态。 - **技术迭代方向**： - 更大的存储容量（如HBM3e、HBM4）。 - 更强的稠密算力（如FP8、FP4）。 - 更大的带宽速度（如NVLink、InfiniBand）。 - **应用扩展**：AI应用从云端扩展到边缘，从通用大模型扩展到行业模型，推动不同芯片路线在性能、成本、功耗、生态和可编程性方面形成差异化竞争。 ## 总结 算力芯片行业正经历由大模型驱动的深刻变革，从单芯片性能提升转向系统级协同优化。海外巨头如英伟达、谷歌和AWS已形成平台化交付能力，而国产算力在信创需求的推动下加速适配与放量。大模型的发展推动了AI算力需求从训练向推理扩散，推理侧成为新的增长点。未来，随着AI应用的不断扩展，计算芯片将呈现百花齐放的异构算力生态，CPU、GPU、TPU、NPU及各类AI ASIC将在不同场景中发挥各自优势。