> **来源:[研报客](https://pc.yanbaoke.cn)** # 中金 | Agent Harness:模型之外、智能之内 ## 核心内容 Agent Harness 是在模型外围构建的一套系统层,用于提升模型在复杂任务中的执行效率与稳定性。它包括执行环境与沙箱、工具调用、上下文与记忆管理、生命周期与编排、可观测性、验证评估、治理安全等多个层级。随着模型能力的增强,Agent Harness 的作用也在从“外挂式”逐渐转向“原生化”,但其在系统层和产品层的复杂能力仍将是厂商的重要竞争壁垒。 ## 主要观点 1. **Agent Harness 的作用**: - **提升模型能力下限**:通过系统性优化,使模型在不改变其结构的前提下,实现更稳定、高效的执行能力。 - **加速模型迭代**:通过双向飞轮效应,模型与Harness相互促进,形成持续优化的闭环。 - **增强用户粘性**:记忆管理功能使Agent能够跨会话持续优化,形成用户专属数据资产,提升用户体验。 - **实现多Agent协作**:通过统一建模与任务分配,提高多个Agent之间的协作效率与稳定性。 - **保障安全性**:通过前置审查和运行隔离机制,确保模型在企业场景中的安全可控。 - **构建生态入口**:Harness 是连接模型、企业数据和工具的关键接口,可能形成新的商业形态。 2. **Agent Harness 的工程化演进**: - 从 **Prompt Engineering**(单次调用优化)到 **Context Engineering**(多步上下文优化)再到 **Harness Engineering**(系统级优化),Agent Harness 的工程化范畴不断外延。 - 代表性的实现包括 **Claude Code**、**OpenClaw**、**Hermes** 等,它们在不同层面展现了Harness的多样化应用。 3. **模型与Harness的互动**: - 随着模型训练呈现Agentic导向,越来越多的Harness功能被训练进模型中,实现“内生化”。 - 但更靠近产品层、企业层与多系统协同层的能力仍需Harness支持,形成厂商竞争壁垒。 ## 关键信息 - **七层分类法**:ETCLOVG 分类法涵盖了执行环境与沙箱、工具接口与协议、上下文与记忆管理、生命周期与编排、可观测性、验证评估、治理与安全等关键层级。 - **Claude Code 实践**:Claude Code 源码中约 98.4% 是围绕模型构建的各类约束和系统逻辑,实现了模型能力的结构化与可控制。 - **工具调用机制**:通过统一的工具对象和独立的 Tool Runtime 管控层,实现工具调用的标准化、可治理与高效执行。 - **记忆分层管理**:包括指令记忆、短期记忆、工作记忆和长期记忆,通过 LLM in the Loop 和 Auto Dream 机制实现精准筛选与动态更新。 - **安全与权限约束**:通过规则匹配、子Agent审查、权限裁决和沙箱执行,构建双层安全架构。 - **Agent 的多层级协作**:支持 Agent Team 和 Coordinator 模式,通过 Task 对象和异步通信机制实现多Agent协同任务处理。 ## 风险提示 - **Harness 空间被压缩**:随着模型能力增强,Harness 的功能可能逐渐被模型吸收,导致其作用空间缩小。 - **Agent 落地与商业化不及预期**:Agent Harness 的实际落地效果与商业价值仍需时间验证,存在不确定性。 ## 结论 Agent Harness 是模型能力落地与扩展的重要支撑,其作用不仅限于模型执行环境的优化,更涉及用户粘性、生态构建、安全性与多Agent协作等关键领域。随着模型训练的Agentic导向增强,Harness 会逐步被模型吸收,但其在高阶系统层与产品层的工程能力仍将是厂商竞争的核心。未来,具备自主Harness研发能力的模型厂商,以及在模型训练中系统性引入Agentic数据和强化学习机制的公司,将具有更大的竞争优势。