> **来源:[研报客](https://pc.yanbaoke.cn)** # Google I/O 2026 详细总结 ## 核心内容 Google I/O 2026开发者大会围绕**Models**、**Coding**、**Agents**三条主线发布了一系列重磅产品和技术,标志着Google在AI模型优化、编程平台创新以及智能体(Agent)商业化落地方面取得了重要进展。 ## 主要观点 ### 1. **Gemini 3.5 Flash模型发布** - **性能突破**:Gemini 3.5 Flash以Flash级成本,在几乎所有benchmark测试中超越了自家旗舰模型Gemini 3.1 Pro。 - **速度与价格优势**:输出速度达到289 tokens/秒,比GPT-5.5和Claude Opus 4.7快4倍以上;价格仅为同级前沿模型的一半。 - **应用场景**:成为Gemini App与Search AI Mode的默认模型,全量上线所有Google产品和API。 ### 2. **Antigravity 2.0编程平台** - **高效构建操作系统**:由前Windsurf创始人Varun Mohan主导,仅用12小时、不到USD1,000的API成本,构建了一个完整操作系统。 - **性能提升**:内部Token处理速度从3月的5,000亿/天提升至3万亿/天,两个月内增长6倍。 - **技术亮点**:通过专项优化实现12倍吞吐加速,93个子Agent并行处理,成功运行Doom游戏。 ### 3. **Agent层创新:Spark + Search Agents** - **Gemini Spark**:7x24小时托管在Google Cloud上的个人Agent,支持跨端实时同步、MCP协议、定时任务等。 - **Search Agents**:AI Mode搜索功能升级至Gemini 3.5,支持文本、图像、文件、视频混合输入,推出三大新功能: - **Information Agents**:24x7后台监控股票、租房、球鞋发售等信息。 - **Generative UI in Search**:搜索结果直接生成交互式mini-app。 - **UCP + AP2 + Universal Cart**:构建agentic commerce闭环。 - **商业化布局**:下半年将落地Chrome作为agentic browser,推出Android Halo;Shopping Graph收录600亿条商品。 ## 关键信息 ### 模型性能对比(部分Benchmark) | 类型 | 测试项 | Gemini 3.5 Flash | Gemini 3 Flash | Gemini 3.1 Pro | Claude Sonnet 4.6 | Claude Opus 4.7 | GPT-5.5 | |--------------|----------------------------------|------------------|----------------|----------------|------------------|----------------|---------| | **Coding** | Terminal-bench 2.1 (Agentic terminal coding) | 76.2% | 58.0% | 70.3% | - | 66.1% | 78.2% | | **Coding** | SWE-Bench Pro (Diverse agentic coding tasks) | 55.1% | 49.6% | 54.2% | - | 64.3% | 58.6% | | **Agentic** | MCP Atlas (Multi-step workflows using MCP) | 83.6% | 62.0% | 78.2% | 69.5% | 79.1% | 75.3% | | **Agentic** | Toolathlon (Real world general tool use) | 56.5% | 49.4% | - | - | - | 55.6% | | **Multimodal** | CharXiv Reasoning (Information synthesis from complex charts) | 84.2% | 80.3% | 83.3% | 72.4% | 82.1% | 84.1% | | **Multimodal** | MMMU-Pro (Multimodal understanding and reasoning) | 83.6% | 81.2% | 80.5% | 74.5% | 75.2% | 81.2% | | **Multimodal** | Blueprint-Bench 2 (Agentic spatial reasoning) | 33.6% | 0.0% | 26.5% | 6.7% | 24.5% | 36.2% | | **Longcontext** | MRCR v2 (Long context performance) | 77.3% (128k avg) | 67.2% (128k avg) | 84.9% (128k avg) | 84.9% (128k avg) | 59.3% (128k avg) | 94.8% (128k avg) | | **Reasoning** | Humanity's Last Exam (Academic reasoning) | 40.2% | 33.7% | 44.4% | 33.2% | 46.9% | 41.4% | | **Reasoning** | ARC-AGI-2 (Abstract reasoning puzzles) | 72.1% | 33.6% | 77.1% | 58.3% | 75.8% | 84.6% | ### 4. **AI商业化加速** - **C端分发优势**:利用Search 25亿月活、Gemini App、YouTube等平台,加速Agentic商业化。 - **成本效益**:头部客户每日处理约1万亿Token,若80%工作负载切换至Gemini 3.5 Flash,每年可节省超USD1bn API成本。 - **未来展望**:Gemini 3.5 Pro将在下月推出,Flash级模型将对行业API价格形成显著压力。 ### 5. **技术生态扩展** - **Gemini Omni**:实现AI从生成到编辑的跨越,支持音视频同步输出,编辑已有视频而不破坏人物表演。 - **SynthID水印**:已累计为1,000亿张图像和视频打上标记,增强内容真实性。 ### 6. **Token处理量增长** - **增长趋势**:Google每月处理的Token数量从9.7万亿增长至3.2千万亿,显示AI模型在实际应用中的规模化使用。 ## 风险提示 1. **AI需求不及预期**:市场对AI产品的接受度可能低于预期。 2. **地缘政治干扰供应链**:全球局势可能影响模型开发和部署。 3. **AI数据中心建设放缓**:数据中心建设进度可能影响模型的性能和扩展能力。 ## 本报告分析师 - **姚书桥**:SFC HK执业证书编号:BRZ136 - **吴叡霖**:SFC HK执业证书编号:BVA376 ## 免责声明 本报告内容仅供参考,不构成对任何证券的推荐或投资建议。相关信息可能因市场变化或其他不可预见因素而失效,海通国际不对因此产生的任何损失承担责任。完整研究报告请参见海通国际研究网站。