得物技术揭秘:AI Harness 工程化实践,从代码生成到目标生产的跃迁

一、从 AI Coding 到 AI Builder

AI 写代码已不稀奇,真正难的是让 AI 在复杂业务系统里按目标、按边界、按质量标准持续生产。得物推荐围绕 PDCA 全链路搭建 AI Harness,让需求可约束、执行不断点、效果可度量、经验可复用。过去一年,AI Coding 体验成熟,但在真实工程系统里,“能跑” 不等于 “按目标生产”。推荐系统链路长、模块多,AI 若只停留在 Do 阶段,只是更快的代码生成器,而非推动业务迭代的工程伙伴。核心变化是 AI 化整个周期闭环。

二、为什么只做 AI Coding 不够

传统工程迭代可抽象成 PDCA,AI Coding 主要解决 Do,但复杂系统失败不只在 Do。做 AI 的目标是让 AI 进入完整迭代飞轮,实现目标更清晰、执行不断点、效果可量化、经验可复用。

三、Harness 的本质:不是铁笼,而是环境

讲 Harness 前可联想《楚门的世界》,楚门受环境约束。好的 AI Harness 把目标等能力做进协作环境,让 AI 不易越界,每一步都在可验证、可回滚、可复用的工程上下文里。

七阶段护栏:把 PDCA 拆成可度量协作面

七阶段护栏全面覆盖 PDCA。

四、Plan:用 Contract 把需求变成护栏

很多需求失败源于理解错误,自然语言 PRD 对 AI 有歧义。Plan 阶段核心是把需求改造成 AI 能理解、执行、验证的结构化契约。得物推荐实践中,T - PRD 把需求拆成 EP 并绑定相关内容,以 “负反馈调权” 为例说明。

五、Do:让 AI 开发零等待

AI 自主开发怕 “等人”,写完代码跑不起来等情况会让它变成昂贵的自动补全。

六、Check:让推荐效果 7x24 可度量

推荐系统 Check 难,传统方式成本高、反馈慢。Axis 推荐 AI 评测平台引入 AI 评审员,不是替代线上实验,而是增加体验风险雷达。AI 全量评分,专家抽样复核并沉淀知识。AI 评测目的是暴露体验风险、沉淀评审口径。

七、Act:把 Bad Case 变成下一轮能力

线上出现异常,系统进入 Bad Case 捕获等流程,问题排查应留下可复用路径。

八、七阶段之后,还有三个深层痛点

流程护栏能解决问题,但 Agent 本身有知识丢失、行为漂移、路径不透明等局限,是工程化承载问题。

九、知识治理:文档给人看,Coding 给 AI 戴枷锁

程序员和 AI 都面临文档问题。得物推荐把知识分三层,L3 注释实验显示,补充后简单问题准确率从 52% 提升到 91%,复杂问题准确率达 100%,token 消耗下降,整体成本降低。

十、推查查:Highway 与 ATV 的混合 Agent 架构

推荐链路排查场景中,80% 问题高频可复现,20% 问题长尾复杂。两类问题不应使用同一种 Agent 路径解决。
Highway 原则是不脑补,把稳定路径写进代码,LLM 负责结果润色。
ATV 针对 20% 长尾问题,提供工具等让 Agent 自主探索,成功后沉淀为新的 Highway 能力。

十一、NOW:从单点提效到工程复利

当 Plan、Do、Check、Act 被 AI Harness 治理,收益是整个迭代系统运转。体系价值是让工程系统适合人和 AI 合作。

十二、尾声:碳硅梦蝶

庄子有梦蝶之惑,如今 AI 协作也有类似错觉。我们把 AI 当人用,也把人当 AI 用。Harness 是梦境边缘,保证 AI 和人类有规则和流程支撑。最终命题是把 AI 纳入可控、可度量、可复用的工程协作系统。

下篇预告:「得物推荐 AI Harness 工程化实践系列」(中篇)《推荐系统诊断 Agent:从 “调接口” 到 “会思考”|得物技术》将基于本文进一步拆解更多原理和工程落地细节。

往期回顾:
1. [从表单到 Agent:得物社区活动搭建的 AI 实践之路]
2. [从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流]
3. [让 Claude Code 拥有自我进化和记忆系统|得物技术]
4. [用 LLM Agent 重构告警排查流程|得物技术]
5. [HorizonVault 技术深潜:如何在 HDD 上做出 100GB/s + 级大吞吐分布式存储|得物技术]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值