Back/harness engineering

Agent 持续学习:三层框架

Updated 2026-04-20
1 min read
185 words

Agent 持续学习:三层框架

来源:hwchase17(LangChain),2026-04-05

三个层次

Agent 系统可以在三个不同层次上学习:

1. 模型层(Model)

更新模型权重本身。技术:SFT、RL(GRPO)等。

  • 核心挑战:灾难性遗忘 — 更新新数据时,模型会降级之前已知的内容
  • 通常在 agent 整体层面进行,而非用户粒度

2. Harness 层

更新驱动 agent 的代码、指令和工具。

  • Meta-Harness 论文的方法:运行 agent → 评估 → 把 traces 存入文件系统 → 运行 coding agent 分析 traces → 建议 harness 代码修改
  • 通常在 agent 层面进行

3. Context 层(记忆)

更新 harness 外部的配置:指令、skills、工具。

  • Agent 级别:agent 有持久记忆,随时间更新自己的配置(如 OpenClaw 的 SOUL.md)
  • 用户/组织级别:每个用户/团队有自己的 context(如 Hex Context Studio、Decagon Duet)
  • 更新方式:离线批处理(分析 traces 提取洞见)或热路径(agent 运行时实时更新)

映射到具体产品

产品 模型层 Harness 层 Context 层
Claude Code claude-sonnet 等 Claude Code 本身 CLAUDE.md、/skills、mcp.json
OpenClaw 多模型 Pi + 脚手架 SOUL.md、skills

关联

OpenAI 视角(2026-04-20)

来源:AI 简报 2026-04-20

OpenAI Chief Scientist Ako Paioki 确认 continual learning 是核心研究目标:

  • 当前模型预训练后基本停止学习,真正的智能系统需要持续适应
  • 关键障碍:灾难性遗忘、benchmark 设计困难、真实世界 reward signal 不清晰
  • AI for Science 被视为重要试验场:有可验证结果,但复杂度足够
  • 长期对齐挑战是 values generalization:模型在全新环境中会回退到什么价值观?

Sources

Linked from