Harness这个单词的含义是缰绳,驾驭的意思。
Harness Engineering (驾驭工程) 是什么?
它和 Prompt Engineering(提示词工程),以及Context Engineering (上下文工程)有什么区别?
5分钟帮你搞明白~😇😇

一、核心定义
Harness = 模型之外的一切
公式:Agent = Model + Harness
- Model (LLM):提供智能、推理、生成能力(引擎)
- Harness:环境、约束、工具、验证、反馈、记忆、沙箱、编排的总和(方向盘+刹车+赛道+仪表盘)
OpenAI是这样定义Harness Engineering 的。
软件工程团队的主要工作不再是写代码,而是设计环境、明确意图、构建反馈循环,让 AI Agent 可靠地完成工作。
二、与提示工程/上下文工程区别
- Prompt Engineering:如何向模型提问 → 试图靠声音(驾驾驾,吁吁吁,向左转)驯服烈马
- Context Engineering:给模型看什么 → 用视觉指引(各种路标,旗帜,地图)驯服烈马
- Harness Engineering:给模型怎样的环境和约束规则 → 通过系统化方法(修跑道,建护栏,套缰绳,配马鞍等)驯服烈马

三、Harness四大核心动作
OpenAI 将 Harness 抽象为四个闭环动作:

1. Constrain (约束)
给 Agent 设定硬边界:架构规则、依赖白名单、权限隔离、禁止行为、沙箱。
例:Domain 层不能直接调用 DB;禁止删除生产数据。
2. Inform (告知)
提供精确、机器可读的上下文:AGENTS.md、架构地图、API 合约、知识库。
例:只给"目录索引",不给全文,防止注意力稀释。
3. Verify (验证)
自动质检:Lint 规则、单元测试、集成测试、格式校验、结果评审。
三层验证:格式 → 执行 → 质量。
4. Correct (纠正)
反馈闭环:错误即修复指南、自动回滚、自修复、人工介入兜底。
四、Harness核心组件
一个完整的 Agent Harness 包含:
- 系统提示与规则:固定的角色、目标、边界
- 工具集成层:API、代码执行、数据库、浏览器
- 沙箱与隔离:文件/网络/权限物理隔离
- 记忆与状态:短期/长期记忆、任务进度、上下文管理
- 编排逻辑:子Agent、任务拆分、执行流、重试、超时
- 确定性钩子:Linter、Pre-commit、架构测试
- 评估与监控:指标、日志、可观测性、告警
- 反馈与自愈:错误分析、自动修复、人工审核
五、Harness为什么重要
- Demo → 生产:解决 Agent "能跑不能用、能用不稳定"
- 环境 > 模型:同模型,Harness 差 → 12% 成功率;Harness 好 → 76% 成功率
- 人类角色转变:从码农 → 系统设计师/Agent 管理者
- 对抗熵增:AI 代码易混乱,Harness 内置"垃圾回收"、定期审计、文档一致性检查
六、一句话总结
Harness Engineering 不是优化 AI,而是优化 AI 工作的环境;不是让 AI 变聪明,而是让 AI 可观测、可信任、可修复。
4598

被折叠的 条评论
为什么被折叠?



