Back/harness engineering

Agent-Computer Interface (ACI)

Updated 2026-04-08
1 min read
124 words

Agent-Computer Interface (ACI)

普林斯顿 NLP 小组 2024 年 SWE-agent 论文提出的概念。ACI 是位于语言模型 agent 与计算机环境之间的抽象层。

核心发现:同一个 GPT-4 模型,使用标准 bash shell 解决了 3.97% 的问题;使用专门设计的 ACI,解决了 12.47% 的问题。64% 的相对提升,完全来自接口设计。

四个核心组件

1. 搜索与导航

用专门构建的工具(find_filesearch_filesearch_dir)替代标准 grep

  • 结果限制在 50 条以内
  • 超过限制时提示 agent 缩小查询范围
  • 强制 agent 变得精确,而非模糊搜索

2. 文件查看器(有状态)

  • 一次显示 100 行(Goldilocks 数字)
  • 有状态:保持在文件中的位置
  • 每行前添加明确行号(减少 agent 的认知负荷)

3. 带 Lint 检查的文件编辑器

  • 每次编辑后自动运行 Linter
  • 语法错误在引入瞬间被捕获
  • 防止错误级联传播

4. 上下文管理

  • 将较旧的观察结果(最后五轮之前)折叠成单行摘要
  • 活跃上下文聚焦于最近的相关信息

核心洞察

"上下文窗口是 agent 在给定会话中的整个工作意识。噪音就在房间里,它会影响推理。"

人类的认知架构(视觉模式识别、空间记忆)与 LM 的认知架构(序列化 Token 处理、有限工作记忆)根本不同。好的 ACI 是围绕 LM 的约束构建的,而不是与其对抗。

关联

Sources

Linked from