> **来源:[研报客](https://pc.yanbaoke.cn)** # 计算机行业深度报告总结 ## 核心内容 DeepSeek V4 是首个实现国产算力训练适配的顶级通用大模型,标志着国产算力在大模型训练环节的突破。该模型在知识储备、推理与代码能力、Agent 能力、长上下文能力以及中文创作能力等多个维度均实现了全球第一梯队的性能表现,成为开源模型的新标杆。 ## 主要观点 - **国产化适配的里程碑**:DeepSeek V4 首次在训练侧使用国产算力(如华为昇腾芯片),从模型内核到训练架构、推理全流程均实现国产算力适配,标志着国产算力从推理侧向训练侧的突破。 - **技术架构创新**:DeepSeek V4 通过 CSA+HCA 混合注意力架构、mHC 流形约束超连接以及创新后训练范式,从底层解决了超长上下文的算力瓶颈与深层模型的训练稳定性问题。 - **性能表现突出**:DeepSeek V4 在多项核心指标上优于主流开源模型,甚至部分指标超越国际顶级闭源模型,展现出强大的竞争力。 - **商用价值显著**:模型支持 1M token 上下文,且推理效率与显存占用显著降低,具备商用级的可行性,有望推动国产算力的广泛应用。 ## 关键信息 ### 1. 技术突破 - **MXFP4 量化感知训练**:通过细粒度缩放因子实现 FP4 到 FP8 的无损反量化,降低显存占用与计算量,支持国产算力训练。 - **TileLang 领域专用语言**:实现跨平台编译优化,降低国产芯片迁移成本,提升开发效率与运行性能。 - **MegaMoE2 融合内核**:实现细粒度通信-计算重叠,解决国产硬件 MoE 模型通信瓶颈,提升训练效率。 ### 2. 性能表现 - **知识储备**:DeepSeek-V4-Pro-Max 在 SimpleQA-Verified 上取得 57.9 分,中文 SimpleQA 得分达 84.4,接近 Gemini-3.1-Pro。 - **推理与代码能力**:Codeforces 评分达 3206,位列人类选手排行榜第 23 名;LiveCodeBench Pass@1 达 93.5,超越 Claude Opus 4.6。 - **Agent 能力**:SWE-bench Verified 任务解决分数达 80.6,与 Claude Opus 4.6 水平相当,Terminal Bench 2.0 得分 67.9,接近 GPT-5.4。 - **长上下文能力**:支持 1M token 上下文,MRCR 得分 83.5,超越 Gemini-3.1-Pro,实现商用级突破。 - **中文创作能力**:功能性写作胜率 62.7%,创意写作质量胜率 77.5%,在多数场景中优于国际竞品。 ### 3. 技术架构创新 - **CSA+HCA 混合注意力架构**:通过分层 KV 缓存压缩与稀疏注意力结合,将注意力计算复杂度从 O(n²) 降至 O(n),显著降低推理成本。 - **mHC 流形约束超连接**:解决万亿参数模型训练稳定性问题,确保信号传播的稳定性与表达能力。 - **后训练范式**:采用“领域专家独立训练+全词表在线蒸馏”,避免多能力融合导致的性能退化。 ### 4. 商用与生态价值 - **成本优势**:Flash 版本定价仅 0.2 元/输入百万 token、1 元/输出百万 token,Pro 版本相较闭源模型便宜约 60%。 - **生态意义**:DeepSeek V4 的发布标志着国产算力生态的构建,有助于推动国产大模型与国产算力的协同发展。 ## 投资建议 - **增持建议**:DeepSeek V4 是国产算力训练适配的重要里程碑,其战略意义远超性能表现,为国产算力产业创造了长期市场需求。 - **相关标的**:包括禾盛新材、寒武纪-U、海光信息、中科曙光、摩尔线程-U、沐曦股份-U、华丰科技、航天电器等。 ## 风险提示 - **技术迭代不及预期**:大模型技术发展节奏若慢于市场预期,可能影响行业应用与商用进展。 - **国产算力适配进度不足**:国产算力软硬件生态若未能快速完善,将限制 DeepSeek V4 的应用与推广。 - **市场竞争加剧**:大模型领域竞争激烈,可能导致价格战与盈利空间压缩。 - **政策监管趋严**:数据安全、内容合规等要求可能增加企业合规成本,限制业务拓展与创新。 ## 总结 DeepSeek V4 的发布标志着国产大模型在训练侧实现国产算力适配,具有重要的战略意义。其性能表现优异,特别是在知识储备、推理与代码能力、Agent 能力、长上下文与中文创作方面,均达到全球第一梯队水平。模型的技术架构创新为国产算力生态的成熟与规模化应用提供了坚实基础,同时也为国产算力产业链带来新的发展机遇。尽管存在一些短板,如多模态能力尚未完善,但其在商用落地与技术生态构建方面的表现,值得投资者重点关注。