> **来源:[研报客](https://pc.yanbaoke.cn)** # 存储:AI推理带来需求爆发、驱动范式升级,周期能见度大幅拉长 ## 核心内容 存储作为AI推理的核心瓶颈,其需求随着AI模型的普及和复杂度提升而全面爆发。AI推理对存储的依赖远高于训练,尤其是在处理长上下文和多模态数据时,存储的带宽和容量成为制约系统性能的关键因素。随着大模型参数量和上下文长度的增加,存储体系正从单一层级向高带宽、大容量和分级管理的协同架构演进,存储与计算的关系也逐步从解耦走向协同优化。 ## 主要观点 - **存储需求爆发**:AI推理过程中,模型权重、KV Cache、激活值、RAG向量库和Token的长期落盘是核心存储负载,这些数据主要驻留于HBM和DRAM等高速存储层级,导致存储需求显著增长。 - **存储带宽与延迟成为瓶颈**:在传统冯·诺依曼架构下,存储与计算之间的数据搬运成为性能瓶颈,黄仁勋指出“GPU大部分时间都在等数据,而不是在计算”。 - **存储架构演进**:随着AI推理需求的增加,存储从单一介质向高带宽+大容量+分级管理的协同架构发展,包括HBM、DRAM、SSD、HDD等多层级存储的协同使用。 - **“以存代算”趋势明显**:提升存储带宽和容量有助于提高推理性能和降低推理成本,成为必然趋势。 - **硬件优化**:通过HBM升级、WOW 3D堆叠DRAM、HBF等技术提升存储带宽和容量,同时CXL内存池化技术实现存储与计算的协同优化。 ## 关键信息 ### 存储需求对比 | 阶段 | 存储需求 | 特点 | |------|----------|------| | 训练 | 极大 | 存储海量训练数据、模型参数、激活值、梯度、优化器状态等,通常需TB-PB级数据 | | 推理 | 中等 | 主要存储模型权重、KV Cache、激活值、RAG向量数据库等,通常需GB-TB级存储,但随着上下文长度增加,存储需求可能达到PB级 | ### 存储介质与用途 | 存储层级 | 存储介质 | 典型用途 | 带宽/延迟 | 单节点容量 | |----------|----------|----------|-----------|------------| | 热层 | HBM/GDDR | 模型参数、KV Cache、激活值 | 2-4 TB/s / <1μs | 80-192GB/GPU | | 热层 | DDR5/MRDIMM | 中间状态、微批数据、缓存热权重 | 200-800 GB/s / ~100ns | 512GB-4TB/节点 | | 温层 | NVMe SSD | 模型权重加载、Embedding索引、Session缓存 | 5-14 GB/s / 10-100μs | 8-64TB/节点 | | 冷层 | HDD | 日志、归档、语料原始数据 | 200 MB/s / 5-10ms | 10-20TB/盘 | ### 存储需求预测 | 年份 | 传统业务(EB) | AI训练(EB) | AI推理(EB) | |------|--------------|------------|------------| | 2025 | 160 | 40 | 80 | | 2026 | 210 | 50 | 210 | | 2027 | 260 | 60 | 390 | | 2028 | 270 | 65 | 530 | | 2029 | 300 | 70 | 750 | | 2030 | 330 | 80 | 1050 | ### 存储技术演进与性能提升 | 技术 | 带宽 | 容量 | 说明 | |------|------|------|------| | HBM | 80GB | 3.35 TB/s | 提升带宽和容量,如H200带宽提升43%,容量提升76% | | CXL | - | - | 实现内存池化,提升存储与计算协同效率 | | PagedAttention | - | - | 优化显存使用,提升吞吐量 | | HBM4 | 2TB/s以上 | 36-64GB | 提升带宽和容量,预计2025年量产 | | HBM4E | >3TB/s | 36-64GB | 预计2027年量产 | | HBM5 | 待定 | 待定 | 未来技术演进方向 | ### 存储与计算协同优化 - **Prefill与Decode分机柜部署**:Prefill使用高算力GPU,Decode使用高带宽/大容量GPU,实现资源优化。 - **HBM与GPU封装**:通过2.5D封装技术,提升HBM带宽和容量,降低功耗。 - **HBF技术**:通过堆叠NAND闪存,用于存储KV Cache,减轻GPU和HBM负担。 ## 投资建议 - **弹性模组及主控**:德明利、江波龙、佰维存储、大普微、联芸科技等。 - **存储芯片**:兆易创新、普冉股份、东芯股份、北京君正、澜起科技、聚辰股份、恒烁股份等。 - **设备**:微导纳米、拓荆科技、中微公司、精智达、华海清科、中科飞测、京仪装备、骄成超声、百傲化学、北方华创等。 - **光刻机产业链**:茂莱光学、汇成真空、波长光电、阿石创、联合化学、富创精密、永新光学等。 ## 风险提示 1. 长鑫长存产能释放加剧竞争的风险。 2. AI CAPEX不及预期的风险。 3. 数据更新不及时,模型测算偏差风险。 ## 结论 随着AI推理需求的指数级增长,存储需求也呈现爆发式增长。存储从单一层级向多层级、高带宽、大容量、分级管理的协同架构演进,成为AI硬件板块中短期业绩确定性最强、估值中枢有提升潜力的方向。