> **来源:[研报客](https://pc.yanbaoke.cn)** # 算力芯片行业报告总结 ## 核心内容概览 本报告聚焦于大模型驱动下的算力芯片行业变革,分析了算力需求从训练侧向推理侧扩散的趋势,以及AI计算异构化、系统级协同对芯片竞争格局的影响。同时,探讨了海外和国产算力芯片厂商的发展动态与未来趋势。 --- ## 主要观点 - **算力需求变化**:随着大模型的快速发展,算力需求正从模型训练向推理侧扩散,推理侧的高吞吐、大并发和成本性能平衡成为关注重点。 - **芯片竞争转向综合效率**:随着摩尔定律边际效应减弱,算力竞争已从单芯片性能提升转向芯片、软件生态、服务器、网络互联、液冷和大规模集群的综合效率。 - **海外芯片厂商平台化发展**:英伟达、谷歌、AWS等厂商已从单芯片竞争转向平台化交付,强调“芯片+网络+软件+系统”的协同优化。 - **国产算力迎来增量机遇**:国产大模型在2025年后加速迭代,与信创需求共振,推动国产算力芯片适配与放量,形成全栈效率优化。 --- ## 关键信息 ### 1. 大模型驱动算力需求扩散 - **算力需求从训练向推理扩散**:2024年起,推理侧投资规模超过训练侧,成为算力需求增长的主要方向。 - **推理侧需求特征**:强调高吞吐、大并发、低成本性能平衡,需求增速预计2024-2028年CAGR=14.3%,高于训练侧的13.8%。 - **算力五层结构**:AI算力体系由能源、芯片、基础设施、模型、应用五层构成,各层协同发展。 ### 2. AI计算异构化与系统级协同 - **异构计算体系**:AI系统由CPU、GPU、TPU、NPU等不同芯片组成,分工明确,形成长期共存格局。 - **系统级协同优化**:算力提升不仅依赖芯片性能,还需结合HBM、先进封装、互联技术、编译器、推理引擎、模型适配等技术进行综合优化。 ### 3. 海外芯片厂商平台化趋势 - **英伟达**:通过GPU、CUDA生态、NVLink和整柜系统构建通用AI算力平台,强调平台化交付。 - **谷歌**:以TPU为核心,服务自有模型和云客户,逐步发展为训练与推理兼顾的云端平台。 - **AWS**:推出Inferentia和Trainium两条ASIC产品线,降低云端AI训练与推理成本。 ### 4. 国产大模型与算力适配 - **国产大模型加速发展**:自2025年起,DeepSeek-R1、智谱GLM等国产大模型迭代显著提速,中美成为全球大模型供给的两大核心。 - **国产算力适配重点**:从单卡峰值算力竞争转向模型-芯片-框架-集群协同优化,提升显存容量、带宽、KV Cache管理、专家并行、跨节点通信、负载均衡等。 ### 5. 国产算力厂商布局 - **华为**:构建从昇腾AI芯片、Atlas加速卡、AI服务器、AI集群,到CANN软件栈、MindSpore/MindIE工具链及华为云ModelArts平台的全栈布局。 - **其他厂商**:包括平头哥、海光信息、壁仞科技、摩尔线程等,均在信创体系中获得认可,推动国产算力生态发展。 --- ## 算力芯片技术演进 ### 1. 算力芯片核心指标 | 芯片 | 显存大小 | 显存带宽 | FP16稠密算力 | INT8稠密算力 | FP8稠密算力 | FP6稠密算力 | NVLink宽带 | 功耗 | |------|----------|----------|--------------|--------------|-------------|-------------|-------------|------| | A100 | 80GB | 2TB/s | 312T | 624T | - | - | 600GB/s | 400W | | H100 | 80GB | 3.35TB/s | 1P | 2P | 2P | - | 900GB/s | 700W | | H200 | 141GB | 4.8TB/s | 1P | 2P | 2P | - | 900GB/s | 700W | | GH200 | 96/144GB | 4/4.9TB/s | 1P | 2P | 2P | - | 900GB/s | 1000W | | B100 | 180/192GB | 8TB/s | 1.75P | 3.5P | 3.5P | 7P | 1.8TB/s | 700W | | B200 | 180/192GB | 8TB/s | 2.25P | 4.5P | 4.5P | 9P | 1.8TB/s | 1000W | | Full B200 | 192GB | 8TB/s | 2.5P | 5P | 5P | 10P | 1.8TB/s | 1200W | | GB200 | 384GB | 16TB/s | 5P | 10P | 10P | 20P | 3.6TB/s | 2700W | ### 2. 算力芯片演进方向 - **通用计算 → 并行计算 → 矩阵加速 → 系统级算力** - **从单芯片性能提升 → 芯片、软件生态、系统级协同优化** - **从芯片制程升级 → 机柜级、集群级技术迭代** --- ## 算力需求与大模型发展 - **大模型发展推动算力需求**:模型训练和推理需求持续增长,推动算力芯片、HBM、互联技术等多方面的技术迭代。 - **算力需求增长速度**:超过传统摩尔定律,算力需求正以更快速度增长,2025年知名模型算力需求已上升多个数量级。 - **算力密集度**:美国大模型算力密集度高于中国,但中国大模型在数量和迭代速度上持续追赶。 --- ## 算力中心产业链 - **上游**:AI加速芯片、HBM、先进封装、液冷等。 - **中游**:算力中心服务商(电信运营商、云服务商、第三方算力中心)。 - **下游**:互联网、AI、金融等领域。 --- ## 未来展望 - **国产算力机遇**:随着大模型迭代和信创需求增长,国产算力芯片有望在推理侧和行业应用中持续放量。 - **技术趋势**:算力升级将聚焦于更大存储、更稠密算力、更大带宽,同时推动机柜级、集群级技术发展。 - **竞争格局**:未来算力竞争将围绕“芯片+软件+系统”的综合效率展开,形成百花齐放的异构算力生态。 --- ## 重要数据 - **2024年推理收入**:约23,000百万美元,已超越训练侧。 - **2025年推理收入**:预计达26,000百万美元。 - **2026年推理收入**:预计达31,000百万美元。 - **2027年推理收入**:预计达36,500百万美元。 - **2028年推理收入**:预计达41,500百万美元。 --- ## 总结 大模型的快速发展正在重塑算力需求结构,推动算力从训练侧向推理侧扩散。算力竞争已从单芯片性能提升转向系统级协同优化,强调综合效率。海外芯片厂商正通过平台化交付提升竞争力,而国产算力芯片在信创需求与大模型迭代的推动下,迎来加速适配与放量的机遇。未来,算力芯片将朝着更大存储、更稠密算力、更大带宽方向发展,同时推动机柜级和集群级技术升级,形成多元化的异构算力生态。