当 Agent 开始调用工具、拆分任务并保留中间状态时,仅靠 Prompt 已经不够。它需要一个明确的 Harness 层,去规定整个执行循环如何运行、如何观测、以及何时被约束。
Harness 本质上是控制层
Harness 的作用,是把模型行为变成一个可依赖的系统。它管理工具契约、步骤边界、重试逻辑、追踪信息,以及在何时停止、何时请求人工干预、何时切回确定性软件。
- 把模型推理与工具执行明确分离
- 让每一步都可观测、可回放
- 把失败处理做成系统能力,而不是藏在 Prompt 里
- 把 Agent 循环当作软件基础设施来设计
对于认真做 Agent 的团队来说,Harness 往往就是质量分水岭。它是概率性模型输出与产业级执行体系之间真正的桥。