cron•loop•goal:AI 工程的智能循环进化论——从定时触发到目标驱动,Harness 如何驯服 AI 这匹野马
2026/6/17 5:41:29 网站建设 项目流程

"我们不是在写代码,而是在驯服一匹野马。"

2026 年 6 月,当你打开 OpenAI Codex 或 Claude Code,输入/goal "修复所有 CI 报错并提升测试覆盖率到 90%"然后转身去喝咖啡时,你正在见证一场静默的革命。这不是又一个新框架的发布,而是人类与机器协作方式的根本重构

让我们从三个看似无关的词汇——Cron、Goal、Loop——出发,追溯这场革命的技术脉络,并理解为什么 2026 年成为Harness Engineering从概念走向实践的关键年份。


第一章:Cron 的黄昏——当"定时"遇见"智能"

Cron 是 Unix 世界的活化石。那个0 21 * * *的表达式,自 1975 年诞生以来,已经让无数程序员在深夜 9 点收到过"每日报告已生成"的邮件。

在 2026 年的 AI Agent 语境中,Cron 完成了它的优雅降级

"Cron 只负责在固定时间点触发一个动作。它不知道任务做到了什么程度,不判断结果的质量,也不决定是否需要再来一轮。"

这不是贬低,而是定位的精确化。在 2026 年 6 月 2-3 日于旧金山举办的 Microsoft BUILD 2026 大会上发布的 Agent Harness 框架中,Cron 被归类为Level 0 触发器——与 Webhook、事件驱动、人工指令并列,共同构成 Agent 系统的"启动层"。

Cron 的新角色

  • 兜底机制:Kelly AI 每日用 Cron 检查 App Store 拒绝状态,确保没有遗漏

  • 心跳巡检:与 Heartbeat 机制配合,实现"到点就执行"的确定性调度

  • 成本锚点:在无限迭代的智能循环世界中,Cron 提供了"到此为止"的边界感

但 Cron 的局限也愈发明显:它无法回答"如果上次任务失败了怎么办",更无法理解"修复所有 Bug"这种结果导向的指令。

2026 年的关键洞察:Cron 是时间的奴隶,而 AI Agent 需要成为目标的猎手


第二章:从 /loop 到 /goal——工具的先行与方法的滞后

2026 年的技术演进有一个鲜明特征:具体命令的实现走在了方法论命名前面。但需要特别说明:这里的/loop命令(时间驱动的机械重复)与第三章将讨论的Loop Engineering(目标驱动的智能循环)是两个不同层次的概念,只是恰巧共享了同一个词。

2026 年 3 月:/loop 率先登场——一个轻量级定时器

2026 年 3 月 7 日,Anthropic 在 Claude Codev2.1.71中正式发布了/loop命令。它被描述为"周日 cron job 的更好版本"(le cron job du dimanche mais en mieux)——一个与终端会话绑定的轻量级定时器,让 AI 能够按固定时间间隔重复执行同一指令。

它的价值不在于"智能迭代",而在于让周期性任务不再需要离开对话去配置系统 cron。这是便利性改进,而非智能跃迁。

/loop的关键特性

  • 时间驱动:每次执行完全相同的指令,不根据结果调整

  • 与终端会话绑定,关闭终端即消失(3 天后过期)

  • 与 Desktop 任务(持久化、跨重启)形成互补

  • 支持灵活的时间间隔:秒(s)、分(m)、时(h)、天(d),默认 10 分钟

2026 年 4-5 月:/goal 紧随其后

2026 年 4 月 30 日,OpenAI Codex CLI 在 0.128.0+ 版本中加入/goal命令。约 11 天后,2026 年 5 月 12 日,Anthropic 在 Claude Code 2.1.139 版本中跟进发布了/goal命令。

/goal的革命性在于:它首次将"目标"作为原生原语(First-class Primitive)

传统自动化的范式是:

人类:打开 A 网站 → 搜索 B 产品 → 比较三家价格 → 下单 机器:执行步骤 1 → 执行步骤 2 → 执行步骤 3 → 执行步骤 4

Goal-driven 的范式是:

人类:Goal = "为 A 产品寻找三家报价最低且两周内交货的供应商并完成下单" 机器:自主分解 Goal → 选择工具 → 执行 → 验证 → 调整 → 达成

这不是交互方式的优化,而是权力结构的转移

Goal 的三种形态

形态

层级

示例

战略 Goal

最高层

"Q3 将用户留存率提升 15%"

战术 Goal

中间层

"优化推荐算法,提升 CTR 10%"

任务 Goal

执行层

"修复推荐服务内存泄漏"

Goal 的核心设计原则

  1. 结果可验证:必须有明确的完成标准("测试通过""覆盖率 90%")

  2. 路径不确定:允许 Agent 自主探索,而非预设步骤

  3. 可分解性:复杂 Goal 自动拆分为子 Goal,递归执行

但 Goal 本身不会动。它需要一种机制,将"目标"转化为"行动",将"一次性指令"转化为"持续迭代"。

这就是Loop Engineering登场的时刻。


第三章:Loop Engineering 的爆发——当 AI 学会"自我对话"

⚠️概念澄清:本章讨论的 Loop Engineering(循环工程)与第二章介绍的/loop命令不是同一回事

  • /loop命令:时间驱动的机械重复,一个具体功能

  • Loop Engineering:目标驱动的智能循环,一套方法论

两者共享 "loop" 一词,但层级和内涵完全不同。如果你感觉困惑——这很正常,2026 年 6 月的技术社区也花了很长时间才把这两个概念区分清楚。

2026 年 6 月,一场关于 Loop 的讨论席卷了整个技术圈。

导火索:OpenClaw 创始人Peter Steinberger在 6 月初发布了一条推文:

"别再给 coding agent 写提示词了。你应该设计循环来提示你的 agent。"

这条推文迅速走红,成为 Loop Engineering 讨论的引爆点

正式命名:Google 工程师Addy Osmani在 2026 年 6 月 7 日的博客文章中正式命名Loop Engineering,系统整理了 Boris Cherny(Claude Code 负责人)的实践经验和 Peter Steinberger 的设计理念。

Loop Engineering 的定义:

"Loop 是 AI 系统提示自己的模式。它让系统能够递归地追求目标,并根据结果调整行为。"

Loop 不是 while(true)。它是一个有灵魂的循环

┌─────────────────────────────────────────┐ │ Agent Loop 生命周期 │ ├─────────────────────────────────────────┤ │ 1. 感知(Perception) │ │ └── 读取环境状态、用户输入、工具返回 │ │ │ │ 2. 推理(Reasoning) │ │ └── 分解 Goal、选择工具、评估风险 │ │ │ │ 3. 行动(Action) │ │ └── 执行代码、调用 API、修改文件 │ │ │ │ 4. 反馈(Feedback) │ │ └── 分析结果、更新记忆、调整策略 │ │ │ │ 5. 验证(Verification) │ │ └── 独立模型检查:Goal 达成了吗? │ │ └── [未达成] → 回到步骤 1 │ │ └── [已达成] → 终止,输出结果 │ └─────────────────────────────────────────┘

Loop Engineering 的 2026 年关键变体

类型

特点

来源/实现

Ralph Loop

社区创造的术语(源自《辛普森一家》角色),指用 bash 脚本或 hook 手动实现的循环模式,强制持续迭代直到满足条件

社区开源项目(如ralph-claude-coderalph-loop

Self-Correction Loop

错误时自动退回修正,实现"自愈"

基于 Kumiho 等记忆系统的学术实践

Multi-Agent Loop

顶层 Goal 驱动,子 Agent 并行执行

多智能体协作框架

HITL Loop

高风险节点暂停,等待人工确认

金融/医疗等合规场景

Loop Engineering 的爆发并非偶然。2026 年 4 月,GitHub 发生多起服务降级事件(4 月 9 日序列化错误、4 月 22 日数据库连接问题、4 月 23 日 DNS 降级),暴露了无约束自动化的风险。业界意识到:没有 Harness 的智能 Loop 是失控的螺旋,有 Harness 的智能 Loop 才是可靠的引擎


第四章:Harness 的降临——驯服野马的"马具"

现在,让我们引入 2026 年备受关注的新概念:Harness Engineering

概念的诞生:2026 年 2 月

2026 年 2 月 5 日,HashiCorp 联合创始人Mitchell Hashimoto在个人博客首次系统提出 Harness Engineering 概念,给出核心公式:

Agent = Model + Harness

他的核心纪律:"每次 Agent 犯错时,花时间设计一个解决方案,让 Agent 永远不会再犯同样的错误。"

几天后(2026 年 2 月 11 日),OpenAI 工程师 Ryan Lopopolo 发布了实地报告,用1500 个自动化 PR、100 万行零人工代码的数据支撑了这一理念。

概念的推广:2026 年 3-4 月

  • 2026 年 3 月 6 日:Birgitta Böckeler 在 Martin Fowler 网站发表文章,推广 Harness Engineering 实践方法论

  • 2026 年 4 月:Martin Fowler 在播客中讨论 Harness 工程之道

  • 2026 年 4 月 24 日:nxcode.io 发布《What Is Harness Engineering? Complete Guide》

概念的系统化:2026 年 6 月

2026 年 6 月 2-3 日,Microsoft 在 BUILD 2026 大会上发布了Agent Harness作为 Microsoft Agent Framework (MAF) 的功能模块,包含 context compaction、file memory、tool approval 等具体能力。

这个比喻精妙绝伦:

  • 马(Horse)= AI 模型(强大、不可预测、可能失控)

  • Harness(马具)= 约束系统(缰绳、马鞍、马嚼子)

  • 骑手(Rider)= 工程师(提供方向,但不再控制每一步)

Harness 的核心模块(基于 Microsoft BUILD 2026 公开资料和业界实践归纳):

模块

功能

与 Cron/Goal/Loop 的关系

开发

Agent 模板、规则编辑器、权限配置

定义 Goal 的分解规则

测试

自动化测试、压力测试、安全扫描

验证智能 Loop 的收敛性

部署

部署编排、灰度发布、资源调度

决定 Cron 的触发策略

运行

行为拦截、风险引擎、合规校验

实时监控智能 Loop 的每一次迭代
可观测

链路追踪、指标采集、日志分析

记录 Goal 达成路径

迭代

反馈收集、自动优化、规则更新

优化智能 Loop 的效率

关键洞察:Harness 是舞台,Goal 是终点,智能 Loop 是引擎

Harness、Goal、Loop 的关系可以这样理解:

Harness 是舞台(环境):划定演员能活动的边界(沙箱)、提供道具(工具)、安排安全监督(权限管控)

Goal 是剧本的终点:定义演员需要达成的最终成果

Loop Engineering(智能循环)是演员的表演过程:感知 → 推理 → 行动 → 反馈 → 验证,直到抵达终点

需要区分的是/goal命令内部已经内置了这个智能 Loop。当你在 Claude Code 中输入/goal "修复 CI"时,智能循环会自动启动。而第二章提到的/loop命令(机械定时器)是一个完全独立的功能,与这个智能循环无关。

在狭义的 Agent 实现上,Harness 是智能 Loop 运行的基础设施(沙箱、工具、权限、观测);在广义的工程范式上,设计 Goal 和智能 Loop 是实践 Harness 的核心环节。

"Loop engineering is not a distinct era; it refers to the agent's execution cyclecontrolled bythe harness."

Harness 不是 Loop 的替代品,而是智能 Loop 的基础设施。就像 Kubernetes 不是容器的替代品,而是容器的编排层。


第五章:四者的协奏曲——一个生产级系统的解剖

让我们用"自动修复生产环境 Bug"这个真实场景,展示四者如何协作:

┌──────────────────────────────────────────────────────────────┐ │ 🏇 Harness Engineering │ │ (马具 = 约束系统 + 基础设施 + 可观测性) │ ├──────────────────────────────────────────────────────────────┤ │ │ │ ⏰ 1. Cron 触发层 │ │ └── 每 5 分钟运行健康检查(或 PagerDuty 告警触发) │ │ └── Harness 的"部署态"模块:决定何时启动 │ │ │ │ 🎯 2. Goal 定义层 │ │ └── 主 Goal:"恢复服务可用性" │ │ ├── 子 Goal 1:"定位根因" │ │ ├── 子 Goal 2:"生成修复补丁" │ │ └── 子 Goal 3:"验证修复并部署" │ │ └── Harness 的"开发态"模块:定义分解规则 │ │ │ │ 🔄 3. 智能 Loop 执行层 │ │ └── 迭代循环: │ │ 感知 → 推理 → 行动 → 反馈 → 验证 │ │ └── [未达成] → 继续迭代 │ │ └── 运行态 Harness 实时监控: │ │ ├── 拦截危险操作(如删除生产数据库) │ │ ├── 检查合规性(如代码审计规则) │ │ └── 成本管控(如 MAX_LOOPS=50) │ │ │ │ ✋ 4. 人在回路(HITL) │ │ └── 高风险操作(如部署到生产环境)暂停,等待人工确认 │ │ └── Harness 的"运行态"模块:决策拦截点 │ │ │ │ 📊 5. 可观测 Harness 记录 │ │ └── 完整链路:谁触发、做了什么、为什么、结果如何 │ │ └── 用于事后复盘和规则优化 │ │ │ └──────────────────────────────────────────────────────────────┘

这个系统的智能等级

  • Cron:Level 0(纯脚本触发)

  • Goal:Level 3-4(目标驱动,路径自主)

  • 智能 Loop:Level 3-5(推理循环,动态收敛)

  • Harness:Level 5(全生命周期管控,人在回路)


第六章:为什么不是"提示词工程"?

有人可能会问:这些用精心设计的提示词(Prompt)也能做到吗?

短期简单任务:是的。一个 10-shot 的提示词可以完成单次 LLM 调用。

中长期复杂任务绝对不行

以下能力无法通过提示词实现:

  • 状态持久化:跨多轮的记忆和上下文管理

  • 工具自主调用:根据中间结果动态选择工具

  • 错误自愈:失败时自动调整策略重试

  • 成本管控:设置预算上限和熔断机制

  • 合规审计:完整记录每一步决策路径

AI工程范式演进

阶段

时间

核心人物

核心问题

类比

Prompt Engineering

2022-2024

社区

"我该对模型说什么?"

写一封邮件

Context Engineering

2025 年中

Tobi Lütke / Andrej Karpathy

"该给模型看什么信息?"

准备会议资料

Harness Engineering

2026 年 2 月

Mitchell Hashimoto

"该围绕模型造什么系统?"

公司治理

Loop Engineering

2026 年 6 月

Addy Osmani

(命名)+ Boris Cherny / Peter Steinberger(实践)

"怎么让这个系统自己跑起来?"

项目管理

从 Level 2 到 Level 3 的跳跃,是架构复杂度的质变。低于此阈值可用提示工程解决,高于此阈值必须引入 Goal + Loop + Harness 架构。


终章:2026 年的工程师,应该站在哪一层?

让我们回到文章开头的比喻。

Cron 是驯马师的闹钟——它告诉你"该去马厩了",但不关心马的状态。

Goal 是驯马师的指令——"今天要让马学会跨越障碍",但不规定每一步。

智能 Loop(循环工程)是马的学习过程——尝试、失败、调整、再尝试,直到掌握。这是/goal命令内部自动运行的机制。

(需要说明的是:/loop命令——那个机械定时器——更像是驯马师手里的秒表,只是按固定间隔提醒你"再看一眼",并不参与学习过程。)

Harness 是马具——缰绳防止马狂奔,马鞍让骑手稳定,马嚼子让马听懂指令。

2026 年的工程师,不再是"写脚本的人",而是设计 Harness 的人。我们不再逐行编写代码,而是:

  • 定义 Goal 的分解规则

  • 设计智能 Loop 的终止条件

  • 配置 Harness 的约束策略

  • 在关键节点保留 Human-in-the-Loop 的权限

这不是失业的前奏,而是进化的契机

当 AI 能够自主迭代时,人类的价值从"执行"转向"定义"、从"编码"转向"约束"、从"解决问题"转向"定义什么是要解决的问题"。

正如 Addy Osmani 在 2026 年 6 月提出的 Loop Engineering 概念中所言:

"Prompting 是关于我们如何提问。Context engineering 是关于我们展示什么。Harness engineering 是决定模型工作的完整操作环境的更广泛学科。Loop engineering 是使该环境实现自动驾驶的特定模式。"


参考资料与延伸阅读

  • Claude Code/loop命令:2026 年 3 月 7 日,v2.1.71 版本

  • OpenAI Codex CLI/goal命令:2026 年 4 月 30 日,0.128.0+ 版本

  • Claude Code/goal命令:Anthropic 官方 GitHub Releases,2026 年 5 月 12 日,2.1.139 版本

  • Mitchell Hashimoto《Harness Engineering》:2026 年 2 月 5 日,个人博客

  • Ryan Lopopolo 实地报告:2026 年 2 月 11 日,1500 个自动化 PR 验证

  • Birgitta Böckeler《Harness Engineering》:2026 年 3 月 6 日,Martin Fowler 网站

  • Martin Fowler 播客讨论 Harness 工程之道:2026 年 4 月,CSDN 整理

  • nxcode.io《What Is Harness Engineering? Complete Guide》:2026 年 3 月

  • Microsoft BUILD 2026:2026 年 6 月 2-3 日,旧金山 Fort Mason Center,Agent Harness 框架发布

  • Peter Steinberger 推文:2026 年 6 月初,"别再给 coding agent 写提示词了"

  • Addy Osmani & Boris Cherny《Loop Engineering》:2026 年 6 月 7 日

  • GitHub 可用性报告 2026 年 4 月:官方事故复盘

  • Ralph Loop 社区实现:GitHub 开源项目ralph-claude-coderalph-loop


"未来已来,只是分布不均。而 Harness,是让它均匀分布的马具。"

创作不易,禁止抄袭,转载请附上原文链接及标题

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询