20260616-国信证券-算力芯片行业报告_大模型驱动算力变革_国产算力迎增量机遇_34页_3mb

> **来源：[研报客](https://pc.yanbaoke.cn)** # 算力芯片行业报告总结 ## 核心内容概览 本报告聚焦于大模型驱动下的算力芯片行业变革，分析了算力需求从训练侧向推理侧扩散的趋势，以及AI计算异构化、系统级协同对芯片竞争格局的影响。同时，探讨了海外和国产算力芯片厂商的发展动态与未来趋势。 --- ## 主要观点 - **算力需求变化**：随着大模型的快速发展，算力需求正从模型训练向推理侧扩散，推理侧的高吞吐、大并发和成本性能平衡成为关注重点。 - **芯片竞争转向综合效率**：随着摩尔定律边际效应减弱，算力竞争已从单芯片性能提升转向芯片、软件生态、服务器、网络互联、液冷和大规模集群的综合效率。 - **海外芯片厂商平台化发展**：英伟达、谷歌、AWS等厂商已从单芯片竞争转向平台化交付，强调“芯片+网络+软件+系统”的协同优化。 - **国产算力迎来增量机遇**：国产大模型在2025年后加速迭代，与信创需求共振，推动国产算力芯片适配与放量，形成全栈效率优化。 --- ## 关键信息 ### 1. 大模型驱动算力需求扩散 - **算力需求从训练向推理扩散**：2024年起，推理侧投资规模超过训练侧，成为算力需求增长的主要方向。 - **推理侧需求特征**：强调高吞吐、大并发、低成本性能平衡，需求增速预计2024-2028年CAGR=14.3%，高于训练侧的13.8%。 - **算力五层结构**：AI算力体系由能源、芯片、基础设施、模型、应用五层构成，各层协同发展。 ### 2. AI计算异构化与系统级协同 - **异构计算体系**：AI系统由CPU、GPU、TPU、NPU等不同芯片组成，分工明确，形成长期共存格局。 - **系统级协同优化**：算力提升不仅依赖芯片性能，还需结合HBM、先进封装、互联技术、编译器、推理引擎、模型适配等技术进行综合优化。 ### 3. 海外芯片厂商平台化趋势 - **英伟达**：通过GPU、CUDA生态、NVLink和整柜系统构建通用AI算力平台，强调平台化交付。 - **谷歌**：以TPU为核心，服务自有模型和云客户，逐步发展为训练与推理兼顾的云端平台。 - **AWS**：推出Inferentia和Trainium两条ASIC产品线，降低云端AI训练与推理成本。 ### 4. 国产大模型与算力适配 - **国产大模型加速发展**：自2025年起，DeepSeek-R1、智谱GLM等国产大模型迭代显著提速，中美成为全球大模型供给的两大核心。 - **国产算力适配重点**：从单卡峰值算力竞争转向模型-芯片-框架-集群协同优化，提升显存容量、带宽、KV Cache管理、专家并行、跨节点通信、负载均衡等。 ### 5. 国产算力厂商布局 - **华为**：构建从昇腾AI芯片、Atlas加速卡、AI服务器、AI集群，到CANN软件栈、MindSpore/MindIE工具链及华为云ModelArts平台的全栈布局。 - **其他厂商**：包括平头哥、海光信息、壁仞科技、摩尔线程等，均在信创体系中获得认可，推动国产算力生态发展。 --- ## 算力芯片技术演进 ### 1. 算力芯片核心指标 | 芯片 | 显存大小 | 显存带宽 | FP16稠密算力 | INT8稠密算力 | FP8稠密算力 | FP6稠密算力 | NVLink宽带 | 功耗 | |------|----------|----------|--------------|--------------|-------------|-------------|-------------|------| | A100 | 80GB | 2TB/s | 312T | 624T | - | - | 600GB/s | 400W | | H100 | 80GB | 3.35TB/s | 1P | 2P | 2P | - | 900GB/s | 700W | | H200 | 141GB | 4.8TB/s | 1P | 2P | 2P | - | 900GB/s | 700W | | GH200 | 96/144GB | 4/4.9TB/s | 1P | 2P | 2P | - | 900GB/s | 1000W | | B100 | 180/192GB | 8TB/s | 1.75P | 3.5P | 3.5P | 7P | 1.8TB/s | 700W | | B200 | 180/192GB | 8TB/s | 2.25P | 4.5P | 4.5P | 9P | 1.8TB/s | 1000W | | Full B200 | 192GB | 8TB/s | 2.5P | 5P | 5P | 10P | 1.8TB/s | 1200W | | GB200 | 384GB | 16TB/s | 5P | 10P | 10P | 20P | 3.6TB/s | 2700W | ### 2. 算力芯片演进方向 - **通用计算 → 并行计算 → 矩阵加速 → 系统级算力** - **从单芯片性能提升 → 芯片、软件生态、系统级协同优化** - **从芯片制程升级 → 机柜级、集群级技术迭代** --- ## 算力需求与大模型发展 - **大模型发展推动算力需求**：模型训练和推理需求持续增长，推动算力芯片、HBM、互联技术等多方面的技术迭代。 - **算力需求增长速度**：超过传统摩尔定律，算力需求正以更快速度增长，2025年知名模型算力需求已上升多个数量级。 - **算力密集度**：美国大模型算力密集度高于中国，但中国大模型在数量和迭代速度上持续追赶。 --- ## 算力中心产业链 - **上游**：AI加速芯片、HBM、先进封装、液冷等。 - **中游**：算力中心服务商（电信运营商、云服务商、第三方算力中心）。 - **下游**：互联网、AI、金融等领域。 --- ## 未来展望 - **国产算力机遇**：随着大模型迭代和信创需求增长，国产算力芯片有望在推理侧和行业应用中持续放量。 - **技术趋势**：算力升级将聚焦于更大存储、更稠密算力、更大带宽，同时推动机柜级、集群级技术发展。 - **竞争格局**：未来算力竞争将围绕“芯片+软件+系统”的综合效率展开，形成百花齐放的异构算力生态。 --- ## 重要数据 - **2024年推理收入**：约23,000百万美元，已超越训练侧。 - **2025年推理收入**：预计达26,000百万美元。 - **2026年推理收入**：预计达31,000百万美元。 - **2027年推理收入**：预计达36,500百万美元。 - **2028年推理收入**：预计达41,500百万美元。 --- ## 总结 大模型的快速发展正在重塑算力需求结构，推动算力从训练侧向推理侧扩散。算力竞争已从单芯片性能提升转向系统级协同优化，强调综合效率。海外芯片厂商正通过平台化交付提升竞争力，而国产算力芯片在信创需求与大模型迭代的推动下，迎来加速适配与放量的机遇。未来，算力芯片将朝着更大存储、更稠密算力、更大带宽方向发展，同时推动机柜级和集群级技术升级，形成多元化的异构算力生态。