> **来源:[研报客](https://pc.yanbaoke.cn)** # DeepSeek V4 发布与国产算力协同生态分析 ## 核心内容概述 DeepSeek V4 的发布标志着国产大模型技术的进一步突破,其具备 1M 超长上下文能力,并在 Agent 交互、世界知识储备与推理性能等方面全面领先。该版本包含两款 MoE 模型:DeepSeek-V4-Pro 与 DeepSeek-V4-Flash,分别针对高性能研发与大规模推理场景。同时,华为昇腾、寒武纪、摩尔线程、沐曦股份、海光信息等国产算力厂商已完成对 DeepSeek-V4 的适配,推动 AI 大模型与国产算力产业链的协同发展。 --- ## 主要观点 ### 1. DeepSeek V4 技术亮点 - **1M 上下文能力**:DeepSeek-V4 是首个将 1M 上下文能力设为全系标配的开源大模型,显著提升长文本处理能力。 - **混合注意力架构**:创新融合 CSA(Compressed Sparse Attention)与 HCA(Heavily Compressed Attention)技术,大幅降低显存占用与计算复杂度。 - **推理效率提升**:在 1M 上下文长度下,DeepSeek-V4-Pro 单 Token 计算量仅为 V3.2 的 25%,KV 缓存占用降至 10%。 - **性能表现突出**:DeepSeek-V4-Pro 在多个基准测试中表现优异,其 Agent 能力、编程能力与世界知识储备均位居开源模型前列。 - **价格优势明显**:DeepSeek-V4-Pro 输入与输出价格分别为 1.74 美元/百万 Tokens 和 3.48 美元/百万 Tokens,显著优于同类闭源模型。 ### 2. 国产算力厂商的适配进展 - **寒武纪**:完成 DeepSeek-V4 模型的全栈优化,依托自研算子库和 vLLM 框架实现高效推理,2025 年营收同比增长 453.21%,毛利率稳定。 - **摩尔线程**:在 MTT S5000 GPU 上完成 DeepSeek-V4 的极速适配,支持 FP8 混合精度策略,降低显存带宽压力,理论算力提升。 - **沐曦股份**:联合 FlagOS 完成 DeepSeek-V4-Flash 的 Day 0 适配,实现推理加速 3.4 倍,提高适配效率。 - **海光信息**:依托 DTK 异构计算平台和 DAS 软件系统,完成 DeepSeek-V4 的全栈调优,显著提升推理效率,推动 DCU 商业化落地。 --- ## 关键信息 ### 1. DeepSeek V4 技术创新 - **CSA/HCA 架构**:通过 KV 压缩与稀疏注意力协同优化,显著提升推理效率与性能。 - **模型性能**:DeepSeek-V4-Pro 在多个基准测试中表现优异,其编程能力、推理性能与世界知识储备均领先开源模型。 - **价格优势**:DeepSeek-V4-Pro 输入与输出价格分别为 1.74 美元/百万 Tokens 和 3.48 美元/百万 Tokens,远低于同类闭源模型。 ### 2. 国产算力厂商表现 - **寒武纪**: - 2025 年营收 64.97 亿元,同比增长 453.21%。 - 毛利率稳定在 55% 左右,2025 年为 55.15%。 - **摩尔线程**: - 2025 年营收 15.06 亿元,同比增长 243.37%。 - 2025 年毛利率为 65.57%,较上年有所提升。 - **沐曦股份**: - 2025 年营收 16.44 亿元,同比增长 121.26%。 - 2025 年毛利率为 56.51%,同比提高 3.08%。 - **海光信息**: - 2025 年营收 143.7 亿元,同比增长 56.92%。 - 2025 年毛利率为 57.83%,尽管受成本上涨影响略有下降。 --- ## 投资建议 - **投资机会**:DeepSeek V4 的发布与国产算力厂商的适配,有望带动 AI 大模型及国产算力产业链需求加速释放。 - **关注重点**:建议关注国产 AI 芯片产业链的投资机会,尤其是寒武纪、摩尔线程、沐曦股份、海光信息等厂商。 - **风险提示**: 1. 技术迭代不及预期风险; 2. 商业化落地放缓风险; 3. 行业竞争加剧风险。 --- ## 图表目录 - 图表 1:DeepSeek 发展史梳理 - 图表 2:DeepSeek V4 包含 Pro、Flash 系列 - 图表 3:DeepSeek V4 采取 CSA/HCA 新架构 - 图表 4:DeepSeek V4 CSA 核心架构 - 图表 5:DeepSeek V4 HCA 核心架构 - 图表 6:DeepSeek-V4 和 DeepSeek-V3.2 的计算量和显存容量随上下文长度的变化 - 图表 7:DeepSeek V4 系列性能卓越 - 图表 8:DeepSeek 输入价格优势明显 - 图表 9:DeepSeek 输出价格优势明显 - 图表 10:DeepSeek EP 方案示意图 - 图表 11:昇腾 Day 0 支持 DeepSeek-V4 - 图表 12:2020-2026Q1 寒武纪营业收入及同比 - 图表 13:2020-2026Q1 寒武纪毛利率情况 - 图表 14:2022-2026 Q1 摩尔线程营业收入及同比 - 图表 15:2022-2026 Q1 摩尔线程毛利率情况 - 图表 16:摩尔线程产品线梳理 - 图表 17:2022-2026 Q1 沐曦股份营业收入及同比 - 图表 18:2022-2026 Q1 沐曦股份毛利率情况 - 图表 19:沐曦股份主要产品分类 - 图表 20:海光信息主要产品 - 图表 21:2020-2026 Q1 海光信息营业收入及同比 - 图表 22:2020-2026 Q1 海光信息毛利率情况 --- ## 结论 DeepSeek V4 的发布与国产算力厂商的协同适配,标志着 AI 大模型与国产算力生态的深度融合。其在性能、成本与适配能力上的全面领先,为 AI 大模型的规模化商用提供了坚实的技术基础。随着国产算力厂商在多个场景下的优化与部署,AI 芯片产业链将迎来新的增长机遇。