20260514-爱建证券-电子行业专题报告_DeepSeek_V4发布_国产算力乘风起航_15页_1mb

> **来源：[研报客](https://pc.yanbaoke.cn)** # DeepSeek V4 发布与国产算力协同生态分析 ## 核心内容概述 DeepSeek V4 的发布标志着国产大模型技术的进一步突破，其具备 1M 超长上下文能力，并在 Agent 交互、世界知识储备与推理性能等方面全面领先。该版本包含两款 MoE 模型：DeepSeek-V4-Pro 与 DeepSeek-V4-Flash，分别针对高性能研发与大规模推理场景。同时，华为昇腾、寒武纪、摩尔线程、沐曦股份、海光信息等国产算力厂商已完成对 DeepSeek-V4 的适配，推动 AI 大模型与国产算力产业链的协同发展。 --- ## 主要观点 ### 1. DeepSeek V4 技术亮点 - **1M 上下文能力**：DeepSeek-V4 是首个将 1M 上下文能力设为全系标配的开源大模型，显著提升长文本处理能力。 - **混合注意力架构**：创新融合 CSA（Compressed Sparse Attention）与 HCA（Heavily Compressed Attention）技术，大幅降低显存占用与计算复杂度。 - **推理效率提升**：在 1M 上下文长度下，DeepSeek-V4-Pro 单 Token 计算量仅为 V3.2 的 25%，KV 缓存占用降至 10%。 - **性能表现突出**：DeepSeek-V4-Pro 在多个基准测试中表现优异，其 Agent 能力、编程能力与世界知识储备均位居开源模型前列。 - **价格优势明显**：DeepSeek-V4-Pro 输入与输出价格分别为 1.74 美元/百万 Tokens 和 3.48 美元/百万 Tokens，显著优于同类闭源模型。 ### 2. 国产算力厂商的适配进展 - **寒武纪**：完成 DeepSeek-V4 模型的全栈优化，依托自研算子库和 vLLM 框架实现高效推理，2025 年营收同比增长 453.21%，毛利率稳定。 - **摩尔线程**：在 MTT S5000 GPU 上完成 DeepSeek-V4 的极速适配，支持 FP8 混合精度策略，降低显存带宽压力，理论算力提升。 - **沐曦股份**：联合 FlagOS 完成 DeepSeek-V4-Flash 的 Day 0 适配，实现推理加速 3.4 倍，提高适配效率。 - **海光信息**：依托 DTK 异构计算平台和 DAS 软件系统，完成 DeepSeek-V4 的全栈调优，显著提升推理效率，推动 DCU 商业化落地。 --- ## 关键信息 ### 1. DeepSeek V4 技术创新 - **CSA/HCA 架构**：通过 KV 压缩与稀疏注意力协同优化，显著提升推理效率与性能。 - **模型性能**：DeepSeek-V4-Pro 在多个基准测试中表现优异，其编程能力、推理性能与世界知识储备均领先开源模型。 - **价格优势**：DeepSeek-V4-Pro 输入与输出价格分别为 1.74 美元/百万 Tokens 和 3.48 美元/百万 Tokens，远低于同类闭源模型。 ### 2. 国产算力厂商表现 - **寒武纪**： - 2025 年营收 64.97 亿元，同比增长 453.21%。 - 毛利率稳定在 55% 左右，2025 年为 55.15%。 - **摩尔线程**： - 2025 年营收 15.06 亿元，同比增长 243.37%。 - 2025 年毛利率为 65.57%，较上年有所提升。 - **沐曦股份**： - 2025 年营收 16.44 亿元，同比增长 121.26%。 - 2025 年毛利率为 56.51%，同比提高 3.08%。 - **海光信息**： - 2025 年营收 143.7 亿元，同比增长 56.92%。 - 2025 年毛利率为 57.83%，尽管受成本上涨影响略有下降。 --- ## 投资建议 - **投资机会**：DeepSeek V4 的发布与国产算力厂商的适配，有望带动 AI 大模型及国产算力产业链需求加速释放。 - **关注重点**：建议关注国产 AI 芯片产业链的投资机会，尤其是寒武纪、摩尔线程、沐曦股份、海光信息等厂商。 - **风险提示**： 1. 技术迭代不及预期风险； 2. 商业化落地放缓风险； 3. 行业竞争加剧风险。 --- ## 图表目录 - 图表 1：DeepSeek 发展史梳理 - 图表 2：DeepSeek V4 包含 Pro、Flash 系列 - 图表 3：DeepSeek V4 采取 CSA/HCA 新架构 - 图表 4：DeepSeek V4 CSA 核心架构 - 图表 5：DeepSeek V4 HCA 核心架构 - 图表 6：DeepSeek-V4 和 DeepSeek-V3.2 的计算量和显存容量随上下文长度的变化 - 图表 7：DeepSeek V4 系列性能卓越 - 图表 8：DeepSeek 输入价格优势明显 - 图表 9：DeepSeek 输出价格优势明显 - 图表 10：DeepSeek EP 方案示意图 - 图表 11：昇腾 Day 0 支持 DeepSeek-V4 - 图表 12：2020-2026Q1 寒武纪营业收入及同比 - 图表 13：2020-2026Q1 寒武纪毛利率情况 - 图表 14：2022-2026 Q1 摩尔线程营业收入及同比 - 图表 15：2022-2026 Q1 摩尔线程毛利率情况 - 图表 16：摩尔线程产品线梳理 - 图表 17：2022-2026 Q1 沐曦股份营业收入及同比 - 图表 18：2022-2026 Q1 沐曦股份毛利率情况 - 图表 19：沐曦股份主要产品分类 - 图表 20：海光信息主要产品 - 图表 21：2020-2026 Q1 海光信息营业收入及同比 - 图表 22：2020-2026 Q1 海光信息毛利率情况 --- ## 结论 DeepSeek V4 的发布与国产算力厂商的协同适配，标志着 AI 大模型与国产算力生态的深度融合。其在性能、成本与适配能力上的全面领先，为 AI 大模型的规模化商用提供了坚实的技术基础。随着国产算力厂商在多个场景下的优化与部署，AI 芯片产业链将迎来新的增长机遇。