> **来源:[研报客](https://pc.yanbaoke.cn)** # 详细总结 ## 核心内容 本文围绕AI Agent的快速发展及其对Token消耗和算力需求的影响展开,重点分析了OpenClaw的市场表现、AI Agent的Token消耗增长趋势、算力供给缺口及投资建议。 ## 主要观点 - **AI Agent进入实际落地阶段**:火山引擎在2025年底预测AI Agent将在2026年爆发,带动国内大模型市场增长十倍。OpenClaw作为一款可在用户自有设备上运行的个人AI Agent助手,迅速成为市场焦点,Token消耗量在一个月内增长4倍以上。 - **Token消耗指数级增长**:AI Agent的多工具调用、长上下文和多流程工作的特性使其Token消耗显著高于传统模型。中国整体日均Token消耗从2024年初的1000亿增长至2025年中的30万亿,2026年2月已达到180万亿级别。预计到2031年,中国活跃智能体数量将突破3.5亿,Token消耗将年均增长超30倍。 - **算力供需错配显现**:随着Token消耗的激增,主流模型厂商如月之暗面和智谱面临算力缺口,部分厂商采取限售或寻求算力支持的策略。推理负载占比预计从2024年的65%提升至2028年的73%,推动算力产业链升级。 - **投资建议**:AI Agent的规模化落地将催生刚性算力需求,国产算力企业(如海光信息、寒武纪、摩尔线程、沐曦股份)及超节点厂商(如中科曙光、浪潮信息)有望受益。建议关注其在基础设施层的主导地位。 ## 关键信息 ### Token消耗与增长 - **OpenClaw表现突出**:在OpenRouter平台,OpenClaw的Token消耗量在2026年2月到3月期间增长4.4倍,成为消耗Token最多的应用。 - **中国Token消耗趋势**: - 2024年初:1000亿 - 2025年中:突破30万亿 - 2026年2月:主流大模型合计日均Token消耗达180万亿 - **未来预测**: - 2031年,中国活跃智能体数量将突破3.5亿,年复合增长率超135% - 2024-2028年,中国推理算力市场规模CAGR约为102%,预计2028年达2931.2亿元 ### AI Agent应用场景 - **HR校招场景**:Minimax Agent可自动整合北美20所名校的校园招聘会信息,包括时间、地点、费用、报名方式等,生成Excel表格。 - **电商图片管理**:Minimax Agent能够自动识别并分类500张商品图片,按照「品牌/性别/衣服种类/场景」的层级结构创建文件夹,提高运营效率。 ### 算力缺口与产业升级 - **推理算力需求上升**:随着AI从训练为重转向推理为主,推理负载占比将显著提升,推动算力需求向推理场景集中。 - **算力供给挑战**: - 月之暗面公开表示缺卡,并寻求算力支持 - 智谱因GLM5火爆采取每日限售措施 - **算力优化方向**: - **芯片端**:英伟达通过架构优化显著提升推理吞吐量与能效比,亚马逊Trainium芯片在推理任务中成本低于英伟达H100 GPU - **架构设计端**:PagedAttention、RadixAttention、动态批处理等技术可显著降低单Token算力消耗 - **系统协同端**:超节点技术通过协同优化资源利用率与能效,实现规模化部署下的综合成本下降 ## 投资建议 - **关注国产算力企业**:海光信息、寒武纪、摩尔线程、沐曦股份等具备成本优势和生态完善的国产算力厂商 - **关注超节点厂商**:中科曙光、浪潮信息等在系统性优化方面表现突出,有望在算力产业链中占据主导地位 ## 风险提示 - **AI技术迭代不及预期**:可能影响Agent的渗透率和功能实现 - **Agent产业落地不及预期**:可能影响算力需求的持续增长 - **宏观经济波动**:可能抑制下游支出意愿,对行业业绩造成压力 ## 总结 AI Agent的普及化与功能增强正在显著提升Token消耗,推动算力需求的快速增长。OpenClaw的爆发式增长验证了AI Agent的商业可行性,而算力供给缺口则促使产业链加速升级。国产算力企业及超节点厂商有望在这一趋势中受益,但需关注技术迭代、产业落地及宏观经济波动等潜在风险。