> **来源:[研报客](https://pc.yanbaoke.cn)** # Gemma 4 12B 与 MiniMax M3 推动本地多模态 AI 发展 ## 核心内容概览 - **MiniMax M3 发布**:2026年6月1日,MiniMax 发布新一代旗舰大模型 MiniMax M3,支持 100 万上下文窗口,预填充与解码速度较上一代提升 9 倍和 15 倍以上。 - **Gemma 4 12B 发布**:2026年6月4日,谷歌发布轻量级多模态模型 Gemma 4 12B,能够在 16GB 内存的笔记本上离线运行,下载量突破 1.5 亿次。 - **AI 应用与算力动态**:Character.AI 周访问量环比增长 11.57%,腾讯云下调 DeepSeek-V4 价格,阿里云上线 Qwen3.7-Plus。 - **Ramp 融资**:完成 7.5 亿美元融资,投后估值达 440 亿美元,成为 AI 金融领域的重要参与者。 - **英伟达技术进展**:Spectrum-X 硅光技术全面量产,推动光通信行业进入技术迭代与需求爆发期。 --- ## 主要观点 ### 1. 算力与模型发布 - **MiniMax M3**:作为一款原生多模态模型,支持图片、视频输入及电脑操作,具备强大的多模态分析能力,在多模态测试集 OmniDocBench 中得分超越 Gemini 3.1 Pro,且在 Claw-Eval 中取得最高分。 - **Gemma 4 12B**:采用无编码器统一架构,支持文本、图像和音频输入,能够在普通笔记本上离线运行,显著降低计算资源需求。 - **性能对比**:在多个基准测试中,MiniMax M3 表现优异,接近 Claude Opus 4.7,且在后训练能力测试中展现了自主训练与优化能力。 ### 2. AI 应用动态 - **Character.AI**:访问量增长显著,成为 AI 应用领域的重要增长点。 - **Qwen3.7-Plus**:阿里云发布,具备视觉识别能力,支持多模态混合智能体,可深度推理、调用工具及自主迭代。 - **Gemma 4 12B 应用场景**:支持自动生成 Python 代码,构建图像处理工具,并具备深度视频理解能力。 ### 3. AI 融资动向 - **Ramp**:完成 7.5 亿美元融资,投后估值达 440 亿美元,成为 AI 金融领域的重要参与者。 - **融资背景**:公司提供 AI 驱动的企业信用卡及财务自动化平台,服务企业客户数量增长显著。 ### 4. 行情与市场表现 - **AI 应用指数**:上周涨幅最大为 1.76%,跌幅最大为 -1.21%。 - **AI 算力指数**:最大涨幅为 15.95%(民爆光电),最大跌幅为 -13.10%(天源迪科)。 - **行业表现**:计算机(申万)在 1M、3M 期间表现弱于沪深300,但在 12M 期间略有回升。 --- ## 关键信息 ### 1. MiniMax M3 技术亮点 - **稀疏注意力机制**:支持 100 万上下文窗口,预填充与解码速度分别提升 9 倍和 15 倍。 - **多模态能力**:支持图片、视频输入及操控电脑桌面。 - **API 价格**:分两档,512k 以内输入享 7 天限时五折优惠,标准模式输入价格为 2.1 元/百万 tokens,输出价格为 8.4 元/百万 tokens。 - **CUDA 内核优化**:将 Hopper 软件峰值利用率从 7.6% 提升至 71.3%,实现近 9.4 倍加速。 ### 2. Gemma 4 12B 技术亮点 - **无编码器架构**:直接处理原始图像像素块和音频信号,视觉信息通过 35M 嵌入模块流入模型核心网络。 - **性能表现**:在单张 RTX 4090 显卡上,推理速度为 80token/s,显存占用仅 9GB。 - **应用场景**:具备强大的 Agentic 能力,可生成 Python 代码并构建图像处理工具,支持复杂视频分析任务。 - **开源与适配性**:采用 Apache 2.0 协议,适配多种本地部署工具,便于开发者使用。 ### 3. Ramp 融资与业务发展 - **融资情况**:完成 7.5 亿美元融资,投后估值达 440 亿美元,累计融资达 30 亿美元。 - **业务扩展**:从费用报销扩展至企业支付、财务自动化及 AI 驱动的欺诈检测,服务约 7 万家企业客户。 - **AI 应用**:推出自主 AI 智能体,支持企业信用卡支付,未来将实现“智能体对智能体支付”。 ### 4. 英伟达技术进展与投资 - **Spectrum-X 技术**:全面量产,基于 CPO 架构,提升能效与 AI 集群运行时间 5 倍,部署效率提升 30%。 - **产业链投资**:对迈威尔科技、Lumentum、Coherent 等公司进行大规模投资,推动光互联技术发展。 - **光通信行业**:进入技术迭代与需求爆发共振期,AI 算力建设需求加速,带动光通信板块景气度提升。 --- ## 投资建议 - **重点关注公司**:罗博特科(300757.SZ)、唯科科技(301196.SZ)、能科科技(603859.SH)、合合信息(688615.SH)。 - **盈利预测**: - **罗博特科**:2025 年 EPS 为 -0.30,2026 年预测为 0.30,2027 年预测为 0.60,PE 预测为 2090.03。 - **唯科科技**:2025 年 EPS 为 2.53,2026 年预测为 3.34,2027 年预测为 3.98,PE 预测为 47.43。 - **能科科技**:2025 年 EPS 为 0.92,2026 年预测为 1.21,2027 年预测为 1.50,PE 预测为 43.76。 - **合合信息**:2025 年 EPS 为 3.24,2026 年预测为 4.22,2027 年预测为 5.25,PE 预测为 29.68。 --- ## 风险提示 1. AI 底层技术迭代速度不及预期。 2. 政策监管及版权风险。 3. AI 应用落地效果不及预期。 4. 推荐公司业绩不及预期风险。 --- ## 结论 Gemma 4 12B 和 MiniMax M3 的发布标志着本地多模态 AI 技术的突破,推动 AI 模型在消费级设备上的普及与应用。同时,AI 金融公司 Ramp 的融资进展表明市场对 AI 驱动企业服务的需求持续增长。英伟达在光通信领域的技术突破与投资,为 AI 算力建设提供了坚实的网络基础,进一步巩固其在全球 AI 产业中的领导地位。投资建议关注具备核心技术能力与成长潜力的 AI 相关企业,但需警惕潜在的行业风险。