> **来源:[研报客](https://pc.yanbaoke.cn)** # 算力重构:从模型训练迈向推理主导的新时代 ## 核心内容 算力行业正经历从“模型训练”向“模型推理”的结构性转变,推理算力成为新的增长核心。随着大模型训练数据量增长放缓、边际效益递减,以及推理成本因技术优化出现断崖式下跌,推理需求迅速爆发。未来,多模态交互与Agent的普及将进一步推动推理算力的非线性增长,成为算力结构演进的主要驱动力。 ## 主要观点 - **算力重心转移**:当前算力需求正从训练端向推理端倾斜,预计2026年推理算力将占全球计算总量的三分之二,2025年将占一半,2023年约三分之一。 - **Agent驱动算力重构**:Agent的普及使得推理任务从单次问答演变为复杂流程与链式思考,从而推动算力需求结构化增长。Agent的执行过程高度依赖CPU的多核调度能力,CPU正从“幕后调度”角色转向“前台执行”核心。 - **GPU面临新挑战**:随着推理任务对显存带宽的依赖增强,GPU的性能瓶颈已从算力峰值转向显存带宽,中高端推理卡市场需求快速增长。 - **云服务模式转型**:云厂商正从传统的“资源租赁”模式向“MaaS(模型即服务)与Agent编排服务”模式转变,提供基于Token消耗或执行步数的精细化计费方式,同时构建更完善的工具链生态。 - **存储架构革新**:为应对推理阶段的KV缓存需求,存储架构正向更高容量、更高速度、更低成本演进,英伟达推出ICMS平台,结合G3.5闪存层与BlueField-4 DPU,提升存储效率与数据处理能力。 ## 关键信息 - **训练算力瓶颈**:模型训练数据量增长放缓,边际效益递减,训练成本与性能提升不成正比。 - **推理算力增长**:推理成本显著下降,Token调用量呈指数级增长,推动AI应用进入普惠时代。 - **多模态与Agent的影响**:多模态交互提升推理密度,Agent的复杂任务处理带来推理任务的爆发增长。 - **云厂商策略调整**:阿里云、百度云等头部厂商开始涨价,云服务模式转向“智能体生态集成商”。 - **存储架构升级**:英伟达推出ICMS平台,优化KV缓存管理,提升存储与数据处理效率。 - **技术趋势**:cuDF与cuVS等数据加速库被主流云平台采用,GPU数据库在金融等场景中展现优势。 ## 投资建议 ### 芯片端(GPU & CPU) - **推荐标的**:海光信息(688041,买入) - **未评级标的**:寒武纪(688256)、禾盛新材(002290) ### 云服务 & IDC - **推荐标的**:中科曙光(603019,买入)、华勤技术(603296,买入) - **未评级标的**:首都在线(300846)、东阳光(600673)、豫能控股(001896)、网宿科技(300017)、优刻得-W(688158) ### 数据库 - **推荐标的**:星环科技-U(688031) - **未评级标的**:达梦数据(688692) ## 风险提示 - **AI应用推进不及预期**:若AI应用落地速度不及预期,推理算力需求可能低于预期。 - **行业竞争加剧**:算力相关行业竞争可能加剧,影响企业利润空间与现金流稳定性。 ## 附录:分析师信息 - **浦俊懿**:执业证书编号 S0860514050004,邮箱 pujunyi@orientsec.com.cn,电话 021-63326320 - **陈超**:执业证书编号 S0860521050002,邮箱 chenchao3@orientsec.com.cn,电话 021-63326320