20260521-海通国际-Google_I_O_2026_3.5_Flash模型更快更便宜_Spark_Search_Agent占据C端入口_3页_272kb

> **来源：[研报客](https://pc.yanbaoke.cn)** # Google I/O 2026 详细总结 ## 核心内容 Google I/O 2026开发者大会围绕**Models**、**Coding**、**Agents**三条主线发布了一系列重磅产品和技术，标志着Google在AI模型优化、编程平台创新以及智能体（Agent）商业化落地方面取得了重要进展。 ## 主要观点 ### 1. **Gemini 3.5 Flash模型发布** - **性能突破**：Gemini 3.5 Flash以Flash级成本，在几乎所有benchmark测试中超越了自家旗舰模型Gemini 3.1 Pro。 - **速度与价格优势**：输出速度达到289 tokens/秒，比GPT-5.5和Claude Opus 4.7快4倍以上；价格仅为同级前沿模型的一半。 - **应用场景**：成为Gemini App与Search AI Mode的默认模型，全量上线所有Google产品和API。 ### 2. **Antigravity 2.0编程平台** - **高效构建操作系统**：由前Windsurf创始人Varun Mohan主导，仅用12小时、不到USD1,000的API成本，构建了一个完整操作系统。 - **性能提升**：内部Token处理速度从3月的5,000亿/天提升至3万亿/天，两个月内增长6倍。 - **技术亮点**：通过专项优化实现12倍吞吐加速，93个子Agent并行处理，成功运行Doom游戏。 ### 3. **Agent层创新：Spark + Search Agents** - **Gemini Spark**：7x24小时托管在Google Cloud上的个人Agent，支持跨端实时同步、MCP协议、定时任务等。 - **Search Agents**：AI Mode搜索功能升级至Gemini 3.5，支持文本、图像、文件、视频混合输入，推出三大新功能： - **Information Agents**：24x7后台监控股票、租房、球鞋发售等信息。 - **Generative UI in Search**：搜索结果直接生成交互式mini-app。 - **UCP + AP2 + Universal Cart**：构建agentic commerce闭环。 - **商业化布局**：下半年将落地Chrome作为agentic browser，推出Android Halo；Shopping Graph收录600亿条商品。 ## 关键信息 ### 模型性能对比（部分Benchmark） | 类型 | 测试项 | Gemini 3.5 Flash | Gemini 3 Flash | Gemini 3.1 Pro | Claude Sonnet 4.6 | Claude Opus 4.7 | GPT-5.5 | |--------------|----------------------------------|------------------|----------------|----------------|------------------|----------------|---------| | **Coding** | Terminal-bench 2.1 (Agentic terminal coding) | 76.2% | 58.0% | 70.3% | - | 66.1% | 78.2% | | **Coding** | SWE-Bench Pro (Diverse agentic coding tasks) | 55.1% | 49.6% | 54.2% | - | 64.3% | 58.6% | | **Agentic** | MCP Atlas (Multi-step workflows using MCP) | 83.6% | 62.0% | 78.2% | 69.5% | 79.1% | 75.3% | | **Agentic** | Toolathlon (Real world general tool use) | 56.5% | 49.4% | - | - | - | 55.6% | | **Multimodal** | CharXiv Reasoning (Information synthesis from complex charts) | 84.2% | 80.3% | 83.3% | 72.4% | 82.1% | 84.1% | | **Multimodal** | MMMU-Pro (Multimodal understanding and reasoning) | 83.6% | 81.2% | 80.5% | 74.5% | 75.2% | 81.2% | | **Multimodal** | Blueprint-Bench 2 (Agentic spatial reasoning) | 33.6% | 0.0% | 26.5% | 6.7% | 24.5% | 36.2% | | **Longcontext** | MRCR v2 (Long context performance) | 77.3% (128k avg) | 67.2% (128k avg) | 84.9% (128k avg) | 84.9% (128k avg) | 59.3% (128k avg) | 94.8% (128k avg) | | **Reasoning** | Humanity's Last Exam (Academic reasoning) | 40.2% | 33.7% | 44.4% | 33.2% | 46.9% | 41.4% | | **Reasoning** | ARC-AGI-2 (Abstract reasoning puzzles) | 72.1% | 33.6% | 77.1% | 58.3% | 75.8% | 84.6% | ### 4. **AI商业化加速** - **C端分发优势**：利用Search 25亿月活、Gemini App、YouTube等平台，加速Agentic商业化。 - **成本效益**：头部客户每日处理约1万亿Token，若80%工作负载切换至Gemini 3.5 Flash，每年可节省超USD1bn API成本。 - **未来展望**：Gemini 3.5 Pro将在下月推出，Flash级模型将对行业API价格形成显著压力。 ### 5. **技术生态扩展** - **Gemini Omni**：实现AI从生成到编辑的跨越，支持音视频同步输出，编辑已有视频而不破坏人物表演。 - **SynthID水印**：已累计为1,000亿张图像和视频打上标记，增强内容真实性。 ### 6. **Token处理量增长** - **增长趋势**：Google每月处理的Token数量从9.7万亿增长至3.2千万亿，显示AI模型在实际应用中的规模化使用。 ## 风险提示 1. **AI需求不及预期**：市场对AI产品的接受度可能低于预期。 2. **地缘政治干扰供应链**：全球局势可能影响模型开发和部署。 3. **AI数据中心建设放缓**：数据中心建设进度可能影响模型的性能和扩展能力。 ## 本报告分析师 - **姚书桥**：SFC HK执业证书编号：BRZ136 - **吴叡霖**：SFC HK执业证书编号：BVA376 ## 免责声明 本报告内容仅供参考，不构成对任何证券的推荐或投资建议。相关信息可能因市场变化或其他不可预见因素而失效，海通国际不对因此产生的任何损失承担责任。完整研究报告请参见海通国际研究网站。