Back/harness engineering

Claude Managed Agents Launch

Updated 2026-04-11
2 min read
332 words

Claude Managed Agents Launch

Summary

Claude Managed Agents 是 Anthropic 推出的预构建、可配置的 Agent Harness,运行在托管基础设施上。它将 Agent 配置(模板、工具、技能、文件/仓库等)与基础设施分离,设计目标是跟上 Claude 快速增长的智能并支持长时程任务。

Core Concepts

三大核心概念

  1. Agent — 版本化的配置容器

    • 模型选择
    • 系统提示词
    • 工具集
    • Skills
    • MCP 服务器
    • 创建一次,通过 ID 引用
  2. Environment — 沙箱配置模板

    • 运行时类型
    • 网络策略
    • 包配置
    • 描述 Agent 工具运行的沙箱环境
  3. Session — 有状态的执行实例

    • 使用预创建的 Agent 配置
    • 基于 Environment 模板配置全新沙箱
    • 挂载每次运行的资源(文件、GitHub 仓库)
    • 在安全 vault 中存储认证信息(MCP 凭证)

关系:一个 Agent 可以有多个 Session。Agent 是配置,Environment 是沙箱模板,Session 是具体执行。

Why Managed Agents

解决的挑战

  1. Harness 需要跟上 Claude 的进化

    • Agent Harness 编码了对"Claude 不能做什么"的假设
    • 随着 Claude 能力提升,这些假设会过时
    • 需要持续更新 Harness 以避免成为性能瓶颈
  2. Claude 运行时间越来越长

    • METR 基准测试显示已超过 10 人类小时的工作量
    • 对基础设施提出新要求:安全性、故障恢复、扩展性
    • 支持多 Agent 团队协作

设计哲学

"构建能够与 Claude 智能同步扩展的 Agent 是一个基础设施挑战,而不仅仅是 Harness 设计问题。"

Anthropic 采用了解耦架构:

  • 大脑(Brain):Claude 及其 Harness
  • (Hands):沙箱和工具
  • 会话(Session):事件日志

每个组件都是接口,彼此间做最少假设,可以独立失败或被替换。

Use Cases

四种常见模式

  1. 事件触发(Event-triggered)

    • 服务触发 Managed Agent 执行任务
    • 示例:系统标记 bug → Agent 编写补丁并提交 PR
    • 无需人类介入的完整工作流
  2. 定时执行(Scheduled)

    • 按计划执行任务
    • 示例:每日简报(X 活动、GitHub 动态、Agent 团队工作摘要)
  3. 即发即弃(Fire-and-forget)

    • 人类触发 Agent 任务
    • 示例:通过 Slack 或 Teams 分配任务,获取交付物(电子表格、幻灯片、应用)
  4. 长时程任务(Long-horizon tasks)

    • 特别适合 Managed Agents 的场景
    • 示例:探索研究项目、代码库重构

Getting Started

快速入门

使用 Claude Code 内置的 claude-api skill:

$ claude update
$ claude
/claude-api managed-agents-onboarding

开发接口

  • SDKs:6 种语言支持(Python、TypeScript、Java、Go、Ruby、PHP)
  • CLI:每个 API 资源都有子命令(agents、environments、sessions、vaults、skills、files)
  • Claude Console:原型设计和测试

推荐工作流

  • CLI 用于设置
  • SDK 用于运行时
  • Agent 模板持久化(YAML 格式存储在 git 中)
  • 在部署流水线中应用模板

Every Mini Vibe Check(2026-04-20)

来源:Every 2026-04-20,Marcus Moretti(Spiral GM)

Marcus Moretti 用 Claude Managed Agents 公测版,几小时内搭建了一个新 agent(专为 agent-to-agent API 调用设计)。

关键优势实测

  • 不需要在代码库中维护 agent 基础设施,大幅减少 bug 表面积
  • 更新 system prompt 只需在 dashboard 改完保存,无需代码部署
  • Dan Shipper 称之为 "oh shit 时刻"——既解放了精力,也让花几个月开发的技能变成了免费服务

战略含义:构建者的技能被商品化是新常态,不是意外。应对策略:接受它,把精力转向下一个尚未被商品化的层次。

Key Resources

Sources

Linked from