Agent-Computer Interface (ACI)
普林斯顿 NLP 小组 2024 年 SWE-agent 论文提出的概念。ACI 是位于语言模型 agent 与计算机环境之间的抽象层。
核心发现:同一个 GPT-4 模型,使用标准 bash shell 解决了 3.97% 的问题;使用专门设计的 ACI,解决了 12.47% 的问题。64% 的相对提升,完全来自接口设计。
四个核心组件
1. 搜索与导航
用专门构建的工具(find_file、search_file、search_dir)替代标准 grep。
- 结果限制在 50 条以内
- 超过限制时提示 agent 缩小查询范围
- 强制 agent 变得精确,而非模糊搜索
2. 文件查看器(有状态)
- 一次显示 100 行(Goldilocks 数字)
- 有状态:保持在文件中的位置
- 每行前添加明确行号(减少 agent 的认知负荷)
3. 带 Lint 检查的文件编辑器
- 每次编辑后自动运行 Linter
- 语法错误在引入瞬间被捕获
- 防止错误级联传播
4. 上下文管理
- 将较旧的观察结果(最后五轮之前)折叠成单行摘要
- 活跃上下文聚焦于最近的相关信息
核心洞察
"上下文窗口是 agent 在给定会话中的整个工作意识。噪音就在房间里,它会影响推理。"
人类的认知架构(视觉模式识别、空间记忆)与 LM 的认知架构(序列化 Token 处理、有限工作记忆)根本不同。好的 ACI 是围绕 LM 的约束构建的,而不是与其对抗。
关联
- harness-engineering/overview — Harness Engineering 总览
- 上下文管理 — 上下文管理的更多细节
- harness-engineering/self-verification-loops — Lint 检查是自我验证的一种形式
- claude-code/overview — Claude Code 是 ACI 原则的实现