> **来源:[研报客](https://pc.yanbaoke.cn)** # 算力芯片行业报告总结 ## 核心内容概述 本报告聚焦于算力芯片行业的发展趋势,重点分析大模型对算力需求的推动作用,以及国产算力在这一背景下所面临的机遇与挑战。随着大模型的快速发展,算力需求正从模型训练向推理侧扩散,同时算力竞争的核心也由单芯片性能提升转向系统级协同优化。 ## 主要观点与关键信息 ### 1. 大模型驱动算力需求从训练向推理扩散 - 大模型发展初期,行业主要关注训练侧算力,但随着模型应用的规模化落地,推理侧需求显著增长。 - 2024年起,推理侧投资规模超过训练侧,强调高吞吐、大并发和成本性能平衡。 - 推理芯片需求增速预计达14.3%(2024-2028年),高于训练侧的13.8%。 ### 2. AI计算异构化与系统级协同 - AI系统本质上是异构计算体系,CPU负责通用调度,GPU承担大规模并行加速,TPU/NPU等ASIC芯片在特定模型和推理场景中具备效率优势。 - 算力竞争不再局限于芯片峰值性能,而是围绕芯片、软件生态、服务器、网络互联、液冷及大规模集群的综合效率展开。 ### 3. 海外芯片龙头平台化交付 - 英伟达构建了“芯片+网络+软件+系统”的通用AI算力平台,通过CUDA生态、NVLink和Blackwell整柜系统提升整体效率。 - 谷歌以TPU为核心,服务自有模型和云客户,逐步从内部推理ASIC发展为训练与推理兼顾的云端TPU平台。 - AWS通过Inferentia和Trainium两条产品线,将训练和推理成本拆解,降低单位成本。 ### 4. 国产大模型与信创需求共振 - 国产大模型自2025年起加速迭代,如DeepSeek-R1、智谱GLM等,与信创需求形成共振。 - 国产算力厂商正从单卡峰值算力竞争转向全栈效率优化,包括芯片、HBM、互联、服务器、编译器/算子库、推理引擎、模型适配等。 - 2026年5月,国家首次在安全可靠测评中设立专门AI芯片品类,华为海思、平头哥、海光信息等9款国产芯片获得安全可靠等级Ⅰ级认证。 ### 5. 算力芯片演进方向 - 算力芯片的发展趋势包括更大存储、更稠密算力、更大带宽。 - 以英伟达为例,其芯片从A100到H100再到Blackwell系列,逐步提升矩阵运算效率和能效比。 - 亚马逊推出Trainium3和Trn3 UltraServers,强调3nm工艺、更大HBM、更高带宽及成本优势。 ### 6. 国产大模型加速追赶 - 国产大模型在2025年已进入“Agent化、长上下文、多模态、低成本推理”阶段,代表厂商包括智谱、MiniMax、DeepSeek等。 - 国产算力适配需关注模型-芯片-框架-集群协同优化,如提升显存容量、带宽和KV Cache管理,强化专家并行、跨节点通信和负载均衡,完善算子生态和兼容主流推理框架。 ### 7. 算力中心产业链 - AI加速芯片位于算力中心产业链上游,中游为算力中心服务商,下游应用于互联网、AI、金融等领域。 - 华为是国内AI算力产业链布局最完整的厂商之一,涵盖昇腾AI芯片、Atlas加速卡、AI服务器、AI集群,以及CANN软件栈、MindSpore/MindIE推理训练工具链和华为云ModelArts平台。 ## 未来展望 - 国产算力厂商若能深度绑定头部模型架构和应用场景,有望在私有化部署、行业Agent、低成本推理集群等方面实现突破。 - AI大模型的商业化不仅是模型能力的竞争,更是“模型+平台+算力生态”的系统工程。 - 随着AI应用从训练扩展到推理、从云端扩展到边缘、从通用大模型扩展到行业模型,不同芯片路线将在性能、成本、功耗、生态和可编程性之间形成差异化竞争,最终形成CPU、GPU、TPU、NPU及各类AI ASIC长期共存的异构算力生态。