> **来源:[研报客](https://pc.yanbaoke.cn)** # 算力芯片行业报告总结 ## 核心内容概览 - **大模型驱动算力变革**:大模型的快速发展推动算力需求从训练向推理扩散,行业进入“应用推理”阶段,对高吞吐、大并发和成本性能平衡的需求显著提升。 - **国产算力迎来增量机遇**:随着中美大模型竞争格局的形成,国产算力在信创需求的推动下加速适配,全栈效率成为关键。 - **AI计算异构化与系统级协同**:AI算力产业正从“单芯片性能提升”转向“系统级协同优化”,强调芯片、软件生态、服务器、网络互联、液冷和大规模集群的综合效率。 - **海外芯片平台化交付**:英伟达、谷歌、AWS等海外巨头已从单芯片竞争转向平台化交付,构建“芯片+网络+软件+系统”的综合解决方案。 - **算力需求持续增长**:全球AI算力资本开支保持年均20%的增速,训练与推理需求均呈上升趋势,其中推理侧增速更快。 ## 主要观点 - **算力需求外溢**:随着大模型应用的规模化落地,推理侧的算力投资规模已超越训练侧,预计2024-2028年推理收入CAGR为14.3%,高于训练侧的13.8%。 - **异构计算体系**:AI系统本质上是异构计算体系,CPU负责通用调度,GPU承担大规模并行加速,TPU/NPU等ASIC芯片则在特定模型和推理场景中具有效率优势。 - **芯片竞争转向系统效率**:算力竞争已从单芯片峰值性能转向“芯片+网络+软件+系统”的平台综合效率,系统级协同优化成为关键。 - **国产大模型加速追赶**:2025年,中国在知名大模型数量上已超越欧洲,成为全球大模型供给的第二大核心力量,与美国形成竞争格局。 - **AI芯片演进方向**:从通用计算到并行计算,再到矩阵加速,最终演进为系统级AI算力平台,涵盖更广的计算场景和更高性能需求。 ## 关键信息 - **算力需求预测**: - 2024年全球AI训练与推理算力市场规模分别为21000百万美元和23000百万美元。 - 预计2024-2028年,推理收入CAGR为14.3%,训练收入CAGR为13.8%。 - **大模型迭代趋势**: - **海外大模型**:自2023年起,保持每半年一代的高频迭代,追求智能化升级。 - **国产大模型**:2025年起迭代速度显著提速,代表产品如DeepSeek-R1、智谱GLM等,产品丰富度提升。 - **算力芯片技术演进**: - **英伟达**:从GPU通用计算走向AI数据中心整体效率提升,推出Blackwell系列,强化Tensor Core和HBM。 - **谷歌**:从内部推理ASIC发展为云端训练与推理兼顾的TPU平台,推出Ironwood等新一代产品。 - **AWS**:围绕云服务发展推理与训练芯片,Trainium3和Trn3 UltraServers强调3nm工艺和更高带宽。 - **国产算力适配与信创**: - 2026年5月,9款国产AI芯片被纳入信创体系,标志着国产算力进入新的发展阶段。 - 国产算力的焦点从单卡峰值转向“芯片 + HBM + 互联 + 服务器 + 编译器/算子库 + 推理引擎 + 模型适配”的全栈效率。 - **AI五层蛋糕**: - AI基础设施体系包括能源、芯片、基础设施、模型和应用,形成逐层链接的生态体系。 - 芯片作为底层资源,决定上层应用的性能与成本。 ## 算力芯片发展趋势 - **从单芯片性能到系统级效率**:算力竞争已从单芯片跑分演进为“系统交付能力”竞争,强调集群规模、能效、带宽和软件生态。 - **技术迭代方向**: - 更大的存储容量(如HBM3e、HBM4)。 - 更强的稠密算力(如FP8、FP4)。 - 更大的带宽速度(如NVLink、InfiniBand)。 - **应用扩展**:AI应用从云端扩展到边缘,从通用大模型扩展到行业模型,推动不同芯片路线在性能、成本、功耗、生态和可编程性方面形成差异化竞争。 ## 总结 算力芯片行业正经历由大模型驱动的深刻变革,从单芯片性能提升转向系统级协同优化。海外巨头如英伟达、谷歌和AWS已形成平台化交付能力,而国产算力在信创需求的推动下加速适配与放量。大模型的发展推动了AI算力需求从训练向推理扩散,推理侧成为新的增长点。未来,随着AI应用的不断扩展,计算芯片将呈现百花齐放的异构算力生态,CPU、GPU、TPU、NPU及各类AI ASIC将在不同场景中发挥各自优势。