智能体应用研究系列_三_Harness筑基_Agent奔赴自主执行时代_31页_2mb

> **来源：[研报客](https://pc.yanbaoke.cn)** # 智能体应用研究系列（三）总结 ## 核心内容 本报告围绕智能体（Agent）工程及应用演进展开研究，重点分析了从提示词工程到驾驭工程的工程框架演进，以及从 Copilot、Coding Agent 到垂类流程 Agent 的产品形态发展路径。Agent 正从辅助功能快速发展为具备自主执行和完整工作流实现能力的智能系统，与基座大模型的技术迭代齐头并进，共同推动全球 AI 产业商业化提速。 ## 主要观点 - **Agent 工程框架演进**： - 提示词工程：优化指令表达，提升模型对任务的理解与输出准确性。 - 上下文工程：通过动态信息供给机制，解决模型“看到什么”的问题。 - 驾驭工程：设计环境与机制，使 Agent 能稳定运行，具备长周期任务交付能力。 - **Agent 产品形态发展**： - **Copilot 嵌入式助手**：如 GitHub Copilot、Microsoft 365 Copilot，嵌入已有软件，提供建议与辅助。 - **Coding Agent**：如 Claude Code、Codex、Cursor，具备代码理解、编辑、测试与部署能力，从辅助编程走向主导生产。 - **垂类流程 Agent**：如 Sierra（客服与销售）、Harvey（法律）、OpenEvidence（医疗）、AlphaSense（金融服务），具备专业领域自主执行能力，推动 Agent 转向“数字劳动力”。 - **Computer Use/GUI Agent**：实现类似人类的跨界面操作能力，提升非标准化任务处理能力，成为 Agent 能力突破的重要方向。 - **Agent 能力演进趋势**： - 从人机协同走向 Agent 自我迭代。 - 未来可能发展为 Multi-Agent 分工协作组织，构建 Agentic AI 基础设施。 ## 关键信息 ### 1. Agent 工程演进 - **提示词工程**：优化指令表达，提升模型对任务的响应能力。 - **上下文工程**：通过信息组织与管理，提升模型在复杂任务中的表现。 - **驾驭工程**：设计运行环境，提升 Agent 在长周期任务中的稳定性与可维护性。 ### 2. 驾驭工程六大核心能力 | 能力类别 | 核心内容 | 主要作用 | 典型工程手段 | |----------------|----------------------------------------|------------------------------|----------------------------------| | 持久存储 | 提供外部存储载体 | 支持跨会话任务延续与协作 | 文件系统、Git、进度文件 | | 通用执行能力 | 自主解决问题，无需人工设计工具 | 实现代码编写与执行能力 | Bash+Code | | 安全运行与验证 | 隔离、可控、带默认工具链的执行环境 | 保证任务安全执行与结果验证 | 沙箱、日志、测试运行器、钩子/中间件 | | 知识延展 | 通过上下文注入外部信息 | 更新并完善模型知识 | 记忆文件、网络搜索工具、MCP | | 上下文治理 | 控制进入模型上下文的信息规模与结构 | 缓解上下文腐化，提升推理稳定性 | 压缩、Skills、工具调用卸载 | | 长时程自主执行 | 支持复杂长链路任务中自主持续推进 | 防止任务漂移和跨上下文失序 | 文件系统、Git、Ralph Loops、任务规划、自验证 | ### 3. Agent 工程化落地案例 - **LangChain**：通过优化 Harness，使其 Coding Agent 在 Terminal Bench 2.0 评测中得分从 52.8% 跃升至 66.5%。 - **OpenAI**：利用 Codex 实现百万行代码产品开发，提升开发效率，实现软件全生命周期管理。 - **Anthropic**：通过优化 Harness，Claude 在 6 小时内完成复古游戏编辑器开发，相较单 Agent 架构提升效率与质量。 ### 4. Agent 商业化趋势 - **收费模式**：从按席位收费转向按任务量、结果收费，降低企业使用成本，提高 ROI。 - **行业应用**：Copilot 式产品在软件开发、办公软件、企业业务流程中广泛应用；垂类 Agent 在法律、医疗、金融服务等领域形成专业解决方案。 ### 5. 投资建议 - **投资方向**：关注 Agent 和基座大模型的技术迭代，AI 算力基础设施及 MaaS 云服务厂商将受益。 - **风险提示**：技术发展不及预期、安全合规风险、AI 基础设施供给不足。 ## 总结 Agent 从提示词、上下文到驾驭工程的演进，标志着其从辅助工具向自主执行系统的转变。随着基座大模型能力的提升，Harness 工程成为 Agent 能力落地的关键，提升其在复杂任务中的稳定性与可维护性。Agent 产品形态从 Copilot 嵌入式助手发展为 Coding Agent、垂类流程 Agent 和 Computer Use，实现从建议到执行的跃迁。未来 Agent 可能演进为 Multi-Agent 分工协作组织，推动 AI-native 数字组织的构建。投资建议关注 Agent 和基座大模型技术迭代及 AI 算力基础设施，同时需注意技术、安全和基础设施供给等风险。