Loop Engineering
What it is
Loop Engineering(循环工程)是软件开发中一个新兴的范式转变:开发者不再直接向编码智能体(Coding Agents)发送提示(Prompt),而是设计一套自动化系统(即"循环"),由系统根据预定义的任务和目标自主驱动智能体。
原文作者:Addy Osmani,Google Chrome 团队工程主管,前端性能专家和开源贡献者。
Why it matters
Loop Engineering 标志着与编码智能体协作方式的根本性变革:
- 从"手持工具"到"设计工厂":过去是手动编写提示、提供上下文、阅读回复;现在是构建系统,负责寻找工作、分配任务、检查结果、决定下一步
- 递归目标:开发者定义目的,AI 不断迭代直至完成
- 工具一致性:Claude Code 和 Codex 已内置实现循环工程所需的全部组件
Loop Lineage
Loop 概念有真实的演进谱系,不是新造词。
| 阶段 | 时间 | 特征 |
|---|---|---|
| ReAct | 2022 | 模型推理 → 调用工具 → 读取结果 → 循环直到完成;单模型,单循环,人类监视 |
| AutoGPT | 2023 | 给定目标后自我提示,但容易空转;导致"agent 是玩具"的偏见 |
| Ralph Loop | 2025 | bash 单行循环,固定锚文件重置上下文,成本低至 $297 完成项目 |
| /goal | 2026 春 | 产品化 ralph:状态持久化 + 权限控制 + 强制自审,Codex 和 Claude Code 同时推出 |
| Orchestration | 2026 夏 | 循环成为工作单位,循环监督其他循环,并发调度,显式持久化 |
关键区分:单 agent 的 ralph 循环已是旧范式;多 agent 的编排循环才是新层。正如 Trash Panda 所说:"It's not ralph/goal loops, that's old hat by now. It's probably some kind of continuous orchestration loop that oversees other threads/agents."
Six Building Blocks
1. 自动化(Automations)— 循环的心跳
功能:使循环能够按计划持续运行,而非一次性执行。
实例:
- 每日扫描 CI 失败记录
- 总结提交简报
- 追踪上周引入的 Bug
实现:
- Claude Code:
/loop(按频率运行)或/goal(持续运行直至条件达成) - Codex:"自动化选项卡"设置
2. 工作树(Worktrees)— 解决并行冲突
问题:多个智能体同时工作时,文件冲突是主要障碍。
解决方案:
- 利用 Git Worktree 为每个智能体创建独立的运行目录和分支
- 确保不同智能体的编辑不会相互干扰
- 实现物理上的隔离
3. 技能(Skills)— 项目上下文的持久化
问题:智能体在每个会话中反复"重学"项目背景。
解决方案:
- 包含
SKILL.md的文件夹 - 记录特定的指令、构建步骤和约定
- 将"意图"固化
关键概念:意图债务(Intent Debt)
- 如果没有技能,智能体会根据猜测填补意图空白
- 有了技能,项目知识可以随时间累积
4. 插件与连接器(Plugins and Connectors)— 扩展操作边界
问题:循环如果只能访问文件系统,能力是有限的。
解决方案:
- 通过 MCP(模型上下文协议)连接外部工具
- 问题追踪器(Linear)、数据库、API、Slack
结果:智能体能够自主打开 PR、链接工单、CI 通过后发送通知。
5. 子智能体(Sub-agents)— 制衡机制
关键设计:将"执行者"与"检查者"分离。
原因:编写代码的模型通常对其自身的错误过于宽容。
配置方式:
- 不同的 TOML 或配置文件
- 定义具有不同职责的智能体:
- 一个负责实现
- 一个负责安全性审查
- 一个负责验证规范
6. 外部记忆(Memory)— 核心补充
问题:模型在不同运行之间会遗忘。
解决方案:
- Markdown 文件或项目看板(如 Linear)
- 在磁盘而非上下文窗口中记录已完成的工作和待办事项
- 确保长效运行的智能体不会丢失进度
Tool Comparison
| 特性 | Claude Code | Codex |
|---|---|---|
| 自动化 | /loop, /goal |
自动化选项卡 |
| Worktree | 内置支持 | 需手动配置 |
| Skills | .claude/skills/ |
Skills 市场 |
| MCP | 原生支持 | 原生支持 |
| Sub-agents | Agent teams / Workflows | Multi-agent |
| Memory | 检查点 / 压缩 | Checkpoint |
Risks and Responsibilities
1. 验证责任
- 循环生成的代码 ≠ 经过验证的代码
- 子智能体可以协助审查
- 最终确保代码运行正常的责任仍在人类工程师手中
2. 认知与理解债务
理解腐蚀(Understanding Erosion):
- 循环交付代码的速度越快
- 开发者对代码库的实际了解就越少
认知投降(Cognitive Surrender):
- 开发者可能会为了规避思考而完全接受循环产生的任何结果
- 与 Tony Fadell 警告的"认知投降"和 Addy Osmani 自己提到的"73% 参与者接受 AI 错误答案"的研究一致
3. 成本与质量平衡
代币成本(Token Cost):
- 子智能体的并行运作会消耗大量代币
- 需要根据预算调整使用模式
质量下滑(Slop):
- 必须警惕自动化导致的低质量代码堆积
- Peter Yang 观察到 agent 生成内容约 10% 是 slop
4. 杠杆的双向性
循环本身是中性的:
- 深度理解工作的开发者 → 利用它加速
- 试图逃避思考的人 → 利用它快速陷入更深的困境
5. 生产级 Hard Stops
2026 年的共识:没有 guardrails 的循环会无限运行并带来账单惊喜。
三个必须:
- 最大迭代次数:设定硬上限,防止空转
- 无进展检测:如果连续 N 轮没有实质性变化,自动暂停
- 预算天花板:Token 或美元预算上限,到达即停止
现实案例:Uber 为每位工程师的 Claude Code 和 Cursor 设置每月 $1,500 工具上限,因为四个月内烧完了全年 AI 预算。模型生成代码本身几乎免费,循环运行成本才是主要开销。
6. 成本结构转变
"The costliest thing in AI coding is no longer writing code, it's managing the agent loop."
成本从 token 生成转向了 loop 管理。Gartner 将 agentic AI 置于膨胀期望的峰值,实际部署率仅约 17%。时间线与收据之间的差距是真实状态。
Token 现实:Feisky 指出,自修正、验证子 agent、重试,每一步都在消耗 token。"你是 token 富人还是 token 穷人,直接决定了你对 loop 的态度。"
The New Role of Engineers
从"写提示词"到"设计控制系统"
正如 Anthropic 的 Claude Code 负责人 Boris Cherny 所言:
"我的工作是编写循环。"
正确的心态
- 像"设计工厂的人"一样去构建循环
- 不要做一个只会点击"开始"按钮的旁观者
- 只有在理解的基础上使用循环,才能在保持质量的同时实现效率的指数级增长
使用循环的前提
Feisky 提出一个朴素的判断标准:能不能把"做完了"写清楚。
- 能写清楚完成标准 → loop 能省掉大量重复劳动
- 连完成标准都说不清 → 还是老老实实一步步来
这与 Codex /goal 的设计一致:模型能宣布做完,但不能说预算快没了先撤。配上每轮注入的自审,强制逐项对照真实文件和测试结果。能戳穿它的只有独立的验证子 agent。Lance Martin 的测试里,Fable 5 最好的运行有 73% 的结论经过了独立验证,Opus 4.7 中位数只有 17%。
Related Concepts
| 概念 | 关系 |
|---|---|
| Prompt Engineering | Loop Engineering 的前身/基础技能 |
| Dynamic Workflows | Loop Engineering 的大规模并行版本(Thariq / Anthropic) |
| Ralph Loop | Loop Engineering 的具体实现框架之一 |
| Sloop Pattern | Boris Cherny 的 cron-based 循环实现,Loop Engineering 的调度层实例 |
| Compound Engineering | Loop Engineering 的"规划-执行-验证"高级形态(Every 团队) |
| Agent Harness | Loop Engineering 的底层基础设施 |
| Cognitive Surrender | Loop Engineering 的最大风险 |
TMA1 v2: Observability as Loop Feedback (2026-05-25)
来源:TMA1 v2 — 让 Coding Agent Loop 真的转起来
TMA1 是一个完全本地的 coding agent 可观测性工具,v2 版本将观测从"事后查看"推进到"实时注入"——把观测结果闭环回 agent 的下一轮 prompt。
Cross-Agent Context Sharing via /tma1-peer
TMA1 v2 在 Claude Code 和 Codex 之间实现了直接的上下文互通:
- 在 Codex 中运行
/tma1-peer cc 1即可读取 Claude Code 最近的 session 上下文 - 包含 tool call 历史、修改文件、build 结果、异常报告等
- 使 review → code 的循环无需人工复制粘贴评审意见
这验证了多 agent 协作中,跨 agent 的上下文共享不应依赖人类中转,而应通过结构化接口直接读取对方的会话状态。
<tma1-context> Automatic Injection
TMA1 在多个 hook 点(UserPromptSubmit、PostToolUse、SessionStart、Stop、PreCompact)自动注入 <tma1-context> 信息:
- 当前 session 信息(duration、tool calls、tokens)
- 最近修改文件和工具使用分布
- build 命令状态和最后一次错误
- 外部文件变化(被 human 或其他 agent 修改)
- 基于规则的异常信息
关键设计:这些信息不是让 agent "看着玩",而是直接提醒 agent 注意上下文变化并给出行动建议。例如:
human_modified_during_session→ 重新读取文件,不要假设内存中的副本仍然有效- build 失败 → 修复错误再继续
- context 超过 100k → 考虑 compaction 或开新 session
Build State Attribution: Human vs Agent
一个不算大但关键的细节:当 fsnotify 看到文件变化时,如何判断是"人改的"还是"agent 改的"?
TMA1 的归因策略:
- ±5 秒窗口内查 hook 事件:匹配 file_path 的 Edit/Write/MultiEdit
- 查 Bash 命令的 input:是否包含该文件的 basename(能抓到
mkdir、rm、git checkout等没有 file_path 字段的操作) - 两轮都没命中 → 归 human
原则:"宁可冤枉自己,也别替 agent 背锅。"
这代表了** agent 环境感知中的归因问题**——当多个 agent 和人类在同一个代码库上工作时,准确的变更归因是避免冲突和重复劳动的前提。
Anomaly Detection as Loop Guardrails
TMA1 内置的异常检测规则示例:
- 反复修改同一个文件,但报错信息一直没变 → 尝试其他策略
- Context 过长超过 100k → 触发 compaction 或新 session
- 这些规则在检测到 pattern 时,通过
<tma1-context>注入建议,使 agent 自动调整策略
Insight:Loop Engineering 中,guardrails 不应只是外部限制(如 max iterations),还应包括运行时 context 注入——让 agent 在循环中感知自己的状态并自主调整。
Fable 5 Self-Correction Loops(2026-06-11)
来源:RLanceMartin — Designing loops with Fable 5
Anthropic 工程师 RLanceMartin 通过 Parameter Golf 和 Continual Learning Bench 两项实验,验证了 Fable 5 在循环任务中的行为特征:
目标-评分循环(Goal/Rubric Loop)
- Fable 5 在 self-correcting loop 中表现显著优于 Opus 4.7:在 Parameter Golf 任务中,Fable 5 对训练管道的改进幅度约为 Opus 4.7 的 6 倍
- Fable 5 倾向于选择更大规模的结构性变更(structural changes),并在遇到量化回退(quantization regression)时展现出更强的恢复韧性
- Opus 4.7 的首个实验产生微小改进后,后续几乎复制同一模板:调整标量 → 测量 → 保留正值结果
- 关键设计:使用 verifier sub-agent(独立上下文窗口)进行评分,优于模型 self-critique
Outcomes in Claude Managed Agents
- CMA 的 Outcomes 功能自动 spawn grader sub-agent,在允许 agent 停止工作前确认所有实验标准已满足
- 为 Parameter Golf 提供九项可检查标准(运行基线、执行 20 次实验等)的 rubric 文件,由 Outcomes grader 逐项验证
提示设计原则
- 与其直接提示和引导 Fable 5,不如设计让模型响应环境反馈(goal/rubric)并自主管理上下文(memory)的循环
- 精心设计的 goal 或 rubric 为 Claude 运行的环境增加反馈,使其能够运行、收集反馈、self-correct、并在条件满足前持续迭代
Avi Chawla: Loop Engineering 实操指南(2026-06-14)
来源:AI Briefing 2026-06-14 (morning) — Avi Chawla (@_avichawla)
Avi Chawla 的指南将 Loop Engineering 从理论框架推进到可复制的六步实现:
- Schedule decides what to run next — 调度器决定下一步运行什么
- The loop (maker agent) produces the work — 循环(maker agent)产出工作
- A separate checker agent grades the output — 独立的检查器 agent 对输出评分
- Checker returns findings to the maker as the next instruction — 检查器将发现返回给 maker 作为下一步指令
- A file on disk holds state that both read and write — 磁盘上的文件保存状态,供双方读写
- Set exit conditions before the loop runs — 在循环运行前设置退出条件(最大迭代次数、预算或"所有测试通过")
关键实践:
- 为任何自动化循环实现独立的检查器 agent,以避免自我验证偏差
- 将所有循环状态移到磁盘(Markdown 文件或知识图谱),而非保留在上下文中
- 这使循环能在数天后恢复,不受模型上下文窗口限制
与 Addy Osmani 六组件的对应关系:
| Avi Chawla | Addy Osmani |
|---|---|
| Schedule | Automations |
| Maker agent | Loop 本身 |
| Checker agent | Sub-agents(执行者-检查者分离) |
| Disk state file | External Memory |
| Exit conditions | Guardrails / Budget |
这验证了 Loop Engineering 的核心组件在不同实践者之间存在共识,同时展示了从"框架描述"到"操作手册"的细化路径。
Loopcraft: The Art of Stacking Loops(2026-06-12)
来源:AINews 2026-06-12 — Loopcraft
本期 AINews 将 loop discourse 推向行业共识层面,多位领袖发出同一信号:不要再手动提示模型,而是设计能够自主提示模型的循环系统。
关键引述
- Steipete:「这是你每月一次的提醒:你不应该再提示编码 agent,而应该设计循环来提示你的 agent。」
- Boris:「我不再提示 Claude。我写循环,循环来做工作。」
- Andrej Karpathy:「要充分利用现在可用的工具,你必须把自己从瓶颈中移除。你不能在那里提示下一个东西。你需要把自己抽离出来。你必须安排事情使其完全自主,问题是你如何最大化 token 吞吐量而不在循环中。这就是现在的目标,游戏的名称是增加杠杆……我不想成为循环中的研究者查看结果等,我在拖慢系统。所以问题是我如何重构所有抽象,使我不必——我安排一次,然后按开始。」
Salty Lesson
- Rich Sutton 有模型层面的「苦涩教训」(Bitter Lesson)。AINews 提出 agent 层面的「咸味教训」:不要像历史上那样自己修复问题,而是专注于随更多 agent 扩展的系统,如目标和编排。
- 核心洞察:「如果你不知道怎么做,不要对那些知道的人 salty。」
递归 SI — 自动化开放式发现系统
- Richard Socher 和 Recursive SI 发布了一个早期「自动化开放式发现系统」,声称在三个公开任务上达到 SOTA:NVIDIA SOL-ExecBench、NanoGPT Speedrun 和 NanoChat autoresearch。
- 具体指标:NanoChat 上达到相同损失速度快 1.3 倍;NanoGPT Speedrun 上将运行时间从 79.7s 减少到 77.5s;SOL-ExecBench 上在 235 个内核上将平均分数从 0.699 提高到 0.754。
- 这与其说是「AGI 研究自动化」的证据,不如说是当前系统已经在狭窄、高反馈的系统优化任务上做出贡献的证据。
Microsoft Arbor — 长程自主研究 Agent
- Arbor 是一个微软研究院的自主研究 agent,使用持久的假设树细化。
- 声称在六个研究任务上击败 Codex 和 Claude Code,在 MLE-Bench Lite 上达到 86% Any-Medal。
- 与 Recursive 的结果一起,Arbor 暗示「研究用 agent」正在分化为:(1) 针对快速迭代系统调优优化的系统,和 (2) 针对长程假设管理优化的系统。
Benchmark 适应 AI-on-AI 改进
- PostTrainBench 定位为递归自我改进评估——AI 训练更弱的模型并直接测量循环进展。
- Agents' Last Exam (ALE) 是一个包含 55 个职业的 1,500 个专家来源任务的滚动基准;前沿 agent 解决了有意义的工作比例,但在最难级别所有测试系统得分 0%。
- SciConBench 包含来自 Cochrane 综述的 9.11k 个问题,发现前沿 agent 仍然无法可靠地综合科学结论。
- 模式:agent 在有界循环中越来越有用,但在专家综合和经济上有价值的长程任务上仍然脆弱。
Additional Loop Patterns(2026-06-12 Evening Briefing)
来源:AI Briefing 2026-06-12 (evening)
Fable 5 + real data + verification loop: 3D San Francisco map
- @nicbstme had Fable 5 build a fully detailed, self-contained 3D HTML map of San Francisco from real municipal data: 15,905 street segments, 9,672 buildings with lidar heights, 14,151 elevation contours, and real Muni/BART routes with animated trams.
- The output was a single 1.2 MB self-contained HTML file with a WebGL engine, running offline with no libraries or API calls.
- This demonstrates a loop pattern where the agent is given raw data, a verification constraint (offline, self-contained), and a long-running generation task.
Sid Bidasaria: unsupervised agent configuration
- Anthropic Claude Code engineer Sid Bidasaria demonstrated how to configure agents that run without supervision, with a setup that can be extended to mobile.
- The pattern: a 37-minute config demo for autonomous agent execution, then extend the same config to a phone for mobile monitoring.
- This signals that loop configuration is becoming portable across devices, not just desktop runtimes.
dax: "done" as loop completion criteria
- dax defined product completion as: implemented, not ugly, documented, discoverable, and marketable.
- For agent loops, this translates to exit conditions that include not just functional correctness but also reviewability, discoverability, and deliverability.
Key Quotes
- "从'手持工具'到'设计工厂'"
- "循环被视为一种递归目标"
- "意图债务:如果没有技能,智能体会根据猜测填补意图空白"
- "循环生成的代码并不等同于经过验证的代码"
- "理解腐蚀:循环交付代码的速度越快,开发者对代码库的实际了解就越少"
- "循环本身是中性的。深度理解工作的开发者利用它加速;试图逃避思考的人则利用它快速陷入更深的困境。"
- "我的工作是编写循环。" — Boris Cherny
- "像'设计工厂的人'一样去构建循环,而不是做一个只会点击'开始'按钮的旁观者。"
- "The loop is plumbing. The asset is the skill it calls."
- "The costliest thing in AI coding is no longer writing code, it's managing the agent loop."
- "能不能把'做完了'写清楚,是判断是否该上 loop 的朴素标准。" — Feisky
Evidence across sources
| Source | Key Claim | Relevance |
|---|---|---|
| Addy Osmani — Loop Engineering (英文原文) | 六个构建块(自动化、worktree、skills、MCP、sub-agents、memory)+ 意图债务概念 | Google Chrome 团队工程主管的系统化框架 |
| Addy Osmani — Loop Engineering EP111 (中文播客完整原文) | 同上,含 Boris Cherny "我的工作是编写循环"、理解腐蚀、认知投降等完整论述 | 第二来源验证,补充原文链接和播客上下文 |
| Boris Cherny | "我不再给 Claude 写提示词了。我运行的是能自己给 Claude 写提示词并决定怎么做的循环。" | 验证了从 prompt 到 loop 的范式转移 |
| Matt Van Horn — Compound Engineering | 80% 精力投入规划,代码成为最后才出现的产物 | Loop Engineering 的高级形态:规划-执行-验证分离 |
| Voxyz_ai | Skill 库会腐烂,需要主动修补 | Loop Engineering 中 skills 作为"外部记忆"需要维护 |
| Peter Yang | Agent 生成内容约 10% 是 slop | Loop Engineering 的质量风险量化 |
| Auto-Prompt Generation 实战指南 | 三种自动生成 Prompt 机制 + Codex /goal 三层保护 + 六个构建块实现 | Loop Engineering 从理论到实践的桥接:模板填充、状态驱动、反思进化 |
| Feisky — Loop Engineering 实践反思 | /goal 与 Ralph loop 对比;完成标准写清楚是 loop 前提;独立验证子 agent 的必要性;token 成本现实 | 中文实践者的落地检验,连接个人 workflow |
| Matt Van Horn — WTF Is a Loop? | 循环演进谱系(ReAct→AutoGPT→ralph→/goal→orchestration);成本结构转变;生产级 hard stops | 系统性梳理 loop 概念来源、争议与真实部署差距 |
| Mitchell Hashimoto | Fable 5 在目标导向循环中表现卓越(SwiftUI 解析器优化至纳秒级),但日常迭代任务中比 GPT-5.5/GLM-5.1 慢 20 倍且贵 6 倍;适合「后台运行数小时的深度优化」而非「交互式日常开发」 | 验证了 loop 的适用边界:高价值、可离线、验证标准明确的任务才值得承担循环成本 |
| enzo_gte | Fable 的最佳用法是「多代理竞争」:生成 N 个 agent 在不同 worktree 上解决同一难题,reviewer agent 选最优解;50+ 个 150 IQ 代理并行搜索,1/50 的突破即达成目标 | 将 loop 从「单 agent 迭代」扩展到「多 agent 搜索+选择」的进化形态 |
| Alex Finn | 从怀疑到 conviction:设置 /spec → /build → /review 技能循环,让 Fable 5 自主运行数小时完成全栈实现;关键是把 spec 持久化到 Linear 等第二大脑 | 提供了可复制的 loop 设置模板:spec 持久化 + 技能化阶段 + 高思考模式 |
| Nick Baumann | Codex 「home thread」上下文管理:一个线程管 todo list,一个线程管其他线程状态,heartbeat 定期更新;将 home thread 作为个人 context manager | Loop Engineering 在知识工作(非编码)中的落地:上下文管理即循环设计 |
| RLanceMartin — Designing loops with Fable 5 | Fable 5 在 self-correcting loop 中改进幅度约为 Opus 4.7 的 6 倍;verifier sub-agent 优于 self-critique;记忆五阶段递进(fail→investigate→verify→distill→consult) | Anthropic 工程师的第一手实验数据,验证了 loop 设计在模型能力差异中的关键作用 |
| AINews 2026-06-12 — Loopcraft | Steipete/Boris/Karpathy 的 loop 共识;Recursive SI 和 Arbor 的自主研究系统;PostTrainBench/ALE/SciConBench 的循环评估 | 将 loop engineering 从工具实践提升为行业范式 |
| [[raw/newsletters/AINews/2026-06-13 [AINews] Fable and Mythos officially too dangerous to release.md | AINews 2026-06-13 — Fable and Mythos officially too dangerous to release]] | Ponytail 插件「懒惰资深开发者」模式:将 293 行代码减至 47 行,token 减少 16%,速度提升 4 倍;Fable 5 解码 1989 DOS 游戏(602 函数标记地图,位级匹配输出);World of ClaudeCraft MMORPG 几天内 vibe coded |
| Every 2026-06-13 — The Moral of Fable | Dan Shipper 的「gardening and loops」隐喻:开发者创造条件让产品生长,而非直接种植;Cora 的 24 小时 bug 修复目标,中位修复时间 5 小时;「过程即产品」 | Loop Engineering 从编码工具到所有知识工作的范式扩散;循环作为「反向发条玩具」的隐喻 |
| AI Briefing 2026-06-14 morning | Avi Chawla 的六步 Loop Engineering 实操指南:调度器→maker agent→checker agent→磁盘状态→退出条件;强调独立检查器避免自我验证偏差,磁盘状态使循环可恢复 | 将 Loop Engineering 从理论框架推进到可复制的操作手册;验证了核心组件在不同实践者间的共识 |
| AI Briefing 2026-06-13 evening | Boris Cherny 的 loop 工程实践:不写提示,写循环;8x 代码发布增长;GitHub 上 4% 的代码来自 Claude Code。steipete 的 5 分钟循环编排:Codex 每 5 分钟唤醒一次维护代码仓库,通过编排技能将工作分配到线程,实现并行化和自主控制。 | 验证了 loop 在真实生产环境中的规模化应用,以及 cron-based 循环编排的具体实现模式 |
| AI Briefing 2026-06-12 (evening) | Fable 5 3D 旧金山地图(真实市政数据 + 自包含 HTML + 离线验证);Sid Bidasaria 无监督 agent 配置可扩展到手机;dax 将"完成"定义为 implemented/undocumented/discoverable/marketable | 将 loop 设计延伸到地理数据生成、移动无监督运行和产品级完成标准 |
Related
- Auto-Prompt Generation — 自动生成 Prompt 的三种机制与实战
- Ralph Harness Framework
- Long-Running Agent Harness
- Dynamic Workflows
- Wiring Skills Into Loops
- Cognitive Surrender
- Product Taste and System Thinking
Open Questions
- Loop Engineering 的"意图债务"如何量化?是否有自动化检测方法?
- Sub-agent 的"执行者-检查者"分离在不同项目类型中的最佳配置是什么?
- 如何设计 Loop 的"刹车机制"——当理解腐蚀达到临界点时自动暂停?
- Loop Engineering 与 Dynamic Workflows 的边界在哪里?何时用 Loop,何时用 Workflow?
- 循环的成本结构转变如何影响个人开发者 vs 企业的 agent 采用策略?
- 生产级 hard stops(最大迭代、无进展检测、预算天花板)的最佳配置是否有通用公式?
- "Skill 是资产,Loop 是管道"的框架下,Skill 的维护和版本化应该由谁负责?
- Fable 5 的「多代理竞争」模式是否适用于所有复杂任务,还是仅在优化/分析类问题中有效?
- Loop 的成本结构(Fable $9/40min vs GLM <$1/几分钟)如何影响个人开发者 vs 企业的工具选择?