> **来源:[研报客](https://pc.yanbaoke.cn)** # 大模型行业周报总结(2026.06.20—2026.06.26) ## 核心内容概述 本周大模型行业重点聚焦于**国内厂商**(尤其是字节跳动)的模型升级、企业服务布局、多模态能力拓展,以及**海外巨头**(如 OpenAI、Anthropic)在算力成本优化、企业级部署、技术合作和商业化路径上的进展。同时,头部厂商的**资本开支**和**盈利结构**成为关注焦点,部分厂商面临盈利压力与技术迭代的双重挑战。 --- ## 主要观点 ### 1. 国内厂商动态 #### 字节跳动 - **豆包大模型 2.1 系列发布**:在 Coding、Agent 和多模态三大核心能力实现生产级突破。 - **性能对标全球顶尖模型**:在多个权威基准测试中表现优异,部分指标超越 GPT-5.5、Claude Opus 4.7 和 Gemini 3.1 Pro。 - **成本优势显著**:在 Coding 和 Agent 场景下,豆包 2.1 Pro 和 Turbo 模型每百万 Tokens 成本分别为 1.96 元和 0.98 元,远低于 Claude Opus(8.08 元)。 - **企业服务加速落地**:日均 Tokens 使用量突破 180 万亿,企业用户达 200 家,半年翻倍;搭载超 7 亿智能终端,覆盖汽车、手机等多个领域。 - **推出专业版订阅服务**:采用三级阶梯定价,最高额度为免费版的 10 倍。 - **多模态模型持续升级**:Seedance 2.0 支持原生 4K 视频生成,Seedance 2.5 预计 7 月初上线,支持 30s 原生视频直出;Seedream 5.0 Pro 在交互式编辑、多图层分离等方面实现突破;豆包音频生成模型 1.0 支持多模态输入输出。 - **Agent 产品体系完善**:TRAE Work、扣子 3.0、HiAgent 3.0 等产品升级,构建开发-运行-管理三层闭环。 - **MaaS 服务定位清晰**:火山引擎 MaaS 被定位为“基础业务”,推动 AI 云原生服务落地。 #### 其他国内厂商 - **通义**:发布 Qwen-AgentWorld,覆盖文本与 GUI 环境,同步推出 AgentWorldBench 测试基准;推出“峰谷 Token”机制,提升夜间使用性价比。 - **智谱**:回应马斯克关于大模型追赶 Fable 的言论,认为无需等到 2027 年;7 月 8 日将迎首轮限售股解禁。 - **MiniMax**:7 月 9 日限售股解禁,战略股东表示长期看好。 - **Kimi**:海外付费用户增长 4 倍,API 收入增长 400%,B 端业务占比持续提升。 ### 2. 海外厂商动态 #### Anthropic - **与美光战略合作**:合作研发面向 AI 系统的内存与存储技术,美光将提供 HBM、DRAM 和数据中心 SSD。 - **Claude Desktop 体验开放**:通过 AWS、Google Cloud、Microsoft Foundry 提供完整桌面体验。 - **推出 Claude Tag**:集成到 Slack 中,实现 AI 团队成员功能。 - **收购生物 AI 初创公司**:Coefficient Bio,加强生命科学领域布局。 - **指控阿里违规蒸馏 Claude**:称阿里使用假账号进行非法蒸馏,影响其模型能力。 #### OpenAI - **与博通合作推出定制 AI 芯片 Jalapeno**:9 个月完成设计流片,成本节省约 50%。 - **上调收入预期**:2025/2026/2027 年收入分别为 131/300/620 亿美元。 - **推理成本与毛利率承压**:去年推理成本增长 4 倍,调整后毛利率降至 33%。 - **企业部署加速**:三星电子向全球员工部署 ChatGPT Enterprise 和 Codex,覆盖多个业务场景。 - **推出防御型安全模型 GPT-5.5-Cyber**:在 CyberGym 基准上表现优异。 - **启动开源漏洞修补计划**:与 Trail of Bits、HackerOne 等合作,推动漏洞修复流程。 - **升级 GPT-5.5 Instant**:聚焦对话质量,提升用户体验。 - **推迟 IPO 计划**:可能延后至 2027 年,反映盈利结构尚未完全验证。 #### Gemini - **Gemini 3.5 发布日期可能推迟至 7 月**。 - **推出 ARD 开放标准**:联合微软、Salesforce 等,推动智能体能力发现与共享。 - **集成 Computer Use 工具**:Gemini 3.5 Flash 原生支持,提升智能体执行能力。 - **与 A24 合作开发电影 AI 技术**:不涉及内容库或数据,专注技术研究。 --- ## 关键信息 ### 技术进展 - 字节豆包 2.1 系列在多个基准测试中表现优异,尤其在 Coding 和 Agent 场景下具有显著成本优势。 - OpenAI 推出定制 AI 芯片 Jalapeno,成本较传统 GPU 下降 50%。 - Anthropic 推出 Claude Desktop 完整体验,支持多云平台。 ### 商业化布局 - 字节推出三级阶梯订阅定价的豆包专业版,覆盖办公、开发、设计、金融分析等多类专业需求。 - 三星电子大规模部署 ChatGPT Enterprise 和 Codex,推动 AI 在企业场景落地。 - OpenAI 推出支出控制工具,优化企业级使用体验。 ### 盈利与资本开支 - OpenAI 预计 2030 年前现金消耗将增加 1110 亿美元,AI 运行和训练成本投入达 6650 亿美元。 - 资金体内循环与表外扩张特征明显,盈利结构仍待验证。 - 浙商证券维持“看好”行业评级,认为大模型行业具备长期增长潜力。 --- ## 风险提示 - 技术迭代不及预期,可能影响产品竞争力。 - 企业及生产力场景落地节奏不及预期,影响收入释放。 - 模型调用成本与商业化变现节奏错配,影响毛利率。 - 资本开支压力超预期,影响现金流与融资。 - 自研芯片进度不及预期,影响降本与供应链自主。 - 监管政策趋严,可能限制跨境业务与数据合规。 - 上市及融资进展不及预期,影响市场信心。 - 头部厂商竞争加剧,可能压缩利润空间。 --- ## 总结 本周大模型行业在技术突破、企业服务落地、多模态能力拓展和资本开支扩张等方面取得重要进展。字节跳动通过豆包大模型 2.1 系列实现性能与成本双突破,推动 MaaS 服务发展;OpenAI 与博通合作开发定制芯片,加速企业级部署,但盈利压力仍存;Anthropic 通过战略合作与产品升级增强供应链与技术布局。整体来看,大模型行业正进入规模化应用与商业化验证的关键阶段,但技术迭代、成本控制与监管环境仍是潜在风险。