> **来源:[研报客](https://pc.yanbaoke.cn)** # 宏观专题 | 谷歌使存储行业暴跌?怎么回事? ## 核心内容 近期,谷歌发布了一篇关于AI存储优化的学术论文,引发了全球存储芯片行业的剧烈波动。美光、西部数据、闪迪等公司股价纷纷下跌,市场对谷歌技术的潜在影响表现出高度关注。这篇论文提出了一种名为**TurboQuant**的压缩算法,能够将AI运行时的“记忆”(即KV Cache)占用空间减少至原来的六分之一,同时保持完全相同的性能效果。这一技术突破被认为可能对存储行业产生深远影响。 ## 主要观点 - **技术突破**:谷歌通过**PolarQuant**方法,将数据从笛卡尔坐标转换为极坐标,简化了数据的存储和处理方式,从而显著降低内存占用。 - **应用场景**:该技术主要用于AI模型的推理阶段,特别是在处理长上下文任务时,能够有效减少KV Cache的显存需求。 - **行业影响**:市场对这一技术的反应表明,存储行业可能面临新的挑战,尤其是高带宽内存(HBM)的供需矛盾可能加剧。 - **技术动机**:模型厂商推动内存优化的动机更多是提升模型在推理阶段的能力,而非单纯降低内存需求。这有助于AI代理(Agent)处理更复杂、更长周期的任务。 - **技术路径**:行业正逐步聚焦于三种关键技术路径:**压缩**、**量化**、**访问优化**,以提升AI系统的整体效率。 ## 关键信息 - **TurboQuant**:谷歌提出的新型压缩算法,可将KV Cache内存占用减少至少6倍,并带来最高8倍的速度提升,且不损失精度。 - **KV Cache**:AI模型在推理过程中用于存储对话历史和上下文信息的缓存,是存储资源的主要消耗者。 - **行业瓶颈**:当前AI扩张过程中,存储芯片已成为仅次于电力的第二大瓶颈,尤其在推理阶段,对存储容量的需求呈指数级增长。 - **IDC预测**:随着AI代理任务复杂度的提升,全球年度Token消耗量将出现数量级跃迁,年复合增长率高达3418%。 - **市场反应**:存储行业股价下跌可能源于市场对技术前景的担忧,也可能反映了恐慌情绪的集中释放。 ## 技术背景与行业趋势 AI模型的推理成本远高于训练成本,尤其是在处理长上下文任务时,KV Cache的内存占用成为主要限制因素。谷歌的TurboQuant技术通过数据压缩,解决了这一问题,使得AI模型能够在不增加硬件成本的前提下处理更复杂的任务。这一技术的提出,标志着AI行业在优化内存使用方面的进一步探索,也推动了存储行业向更高效、更灵活的方向发展。 ## 结论 谷歌的TurboQuant技术虽引发市场震荡,但其核心价值在于提升AI模型的推理效率和处理能力。尽管市场反应可能受到情绪因素影响,但该技术代表了AI行业在存储优化上的重要进展,未来有望成为推动AI应用扩展的关键因素。存储行业需加快技术升级和产能扩张,以应对AI带来的新需求。