> **来源:[研报客](https://pc.yanbaoke.cn)** # 驾驭工程(Harness Engineering)研究报告总结 ## 核心内容 驾驭工程被定义为操作系统层,与提示词工程(语言层)、智能体工程(工作流层)形成逐层上卷关系。它不仅关注模型如何执行任务,更强调构建一个可治理、可持续的制度化执行环境。该工程的核心目标是将高自治AI系统融入企业流程,使其具备明确的完成契约、知识管理系统、感知能力、状态恢复机制、外部评测与治理边界。 ## 主要观点 - **提示词工程**解决“怎么说清楚”,重点在于指令表达与格式控制。 - **上下文工程**解决“喂给模型什么”,关注状态供给与流程控制。 - **智能体工程**解决“怎么让模型动起来”,关注工作流设计与动态决策路径。 - **驾驭工程**是更高层次的系统设计,涉及组织能力、治理机制与制度化环境。 ## 关键信息 - 驾驭工程不是对提示词工程的替代,而是对其的上卷,将提示词、上下文、智能体等纳入制度化框架。 - 它要求构建六大负重部件,包括:机器可验证的完成契约、Durable Knowledge 的 System of Record、Agent 的感官与执行能力、状态恢复机制、外部评测系统、治理边界与安全机制。 - 驾驭工程的瓶颈从“生成更多”转向“让人只在高杠杆节点出手”,强调外部评测与回滚机制的重要性。 ## 六大研究方向 1. **AI大模型理论与哲学** 2. **AI文艺** 3. **AI应用** 4. **新媒体与网络舆论** 5. **大数据** 6. **XR应用** ## 术语状态 - **定义**:当前术语体系基本稳定,关键定义待进一步明确。 - **证据**:OpenAI与Anthropic等前沿团队已使用“Harness Engineering”一词。 - **结构**:从语言层到操作系统层,逐层上卷。 - **落地**:在中国政策与企业实践推动下,驾驭工程已进入落地阶段。 ## 四层链条 1. **语言层**:提示词工程,关注指令表达。 2. **状态层**:上下文工程,关注状态供给。 3. **工作流层**:智能体工程,关注动态决策与执行路径。 4. **制度层**:驾驭工程,关注系统级环境设计与治理。 ## 中国落地窗口 - **政策信号**:人工智能+已从口号进入任务书,中小企业数字化转型聚焦具体城市与场景。 - **实施路线**:通过五级成熟度模型,逐步推进从演示型使用到系统级生产。 - **落地场景**: - **软件与研发**:作为证据最强的起点。 - **客服与运营**:最容易算清ROI的入口。 - **销售运营**:适合“半自动驾驶”模式。 - **制造现场**:将Agent作为岗位能力单元。 - **财务与合规**:适合做强辅助,不宜全自动裁决。 - **企业知识运营**:作为System of Record的练兵场。 ## 实施步骤 1. **第一步**:定义机器可验证的完成契约。 2. **第二步**:将Durable Knowledge从长提示搬进版本化知识库。 3. **第三步**:给Agent配真正的感官(如UI、日志、指标)。 4. **第四步**:使用progress file、feature list、git与init script解决长时程失忆问题。 5. **第五步**:引入评测器、回归测试与生产监控。 6. **第六步**:将风格、架构与安全写入机械规则。 ## 指标体系 - **系统级经营指标**:完成率、异常率、人工接管率、恢复时长、单位任务成本。 - **高频场景指标**:吞吐量与夜间无人值守比例。 ## 治理清单 - **身份与授权**:统一身份管理,确保最小权限访问。 - **安全机制**:建立统一的安全基线,权限随需分配,动态调整。 - **审计与监控**:定期审计,确保系统可审计与可恢复。 ## 一句话结论 驾驭工程不是把提示词再写长一点,而是把模型周围整个制度化执行环境设计出来。