Back/harness engineering

编程智能体的核心组件

Updated 2026-04-09
1 min read
180 words

编程智能体的核心组件

来源:Sebastian Raschka, PhD,2026-04

厘清概念

大语言模型 (LLM)

核心基础模型,预测「下一个词」。

推理模型 (Reasoning Model)

经过特殊训练或提示词引导的 LLM,会在生成答案时投入更多计算力(test-time compute),做中间步骤推理、自我验证、在候选答案中搜索最佳结果。

智能体 (Agent)

盖在模型上面的一层「控制循环」。围绕模型运转,决定:接下来检查什么?调用哪个工具?怎么更新状态?什么时候停止?

类比

  • LLM = 发动机
  • 推理模型 = 爆改后的强劲发动机(更费钱)
  • Agent harness = 整车系统,帮助我们更好地驾驭发动机

编程智能体的六大核心模块

1. 代码仓库上下文 (Repo Context)

智能体需要理解代码库的结构、依赖关系、编码规范。

关键能力

  • 代码导航(找到相关文件)
  • 依赖分析
  • 语义理解

2. 工具设计 (Tool Design)

智能体与外部环境交互的接口。

常见工具

  • 文件操作(读/写/搜索)
  • 代码执行(bash/REPL)
  • 测试运行
  • 版本控制

3. 提示词缓存 (Prompt Caching)

管理上下文窗口,优化成本和延迟。

策略

  • 静态前缀缓存
  • 动态内容选择
  • 渐进式披露

4. 记忆能力 (Memory)

跨 session 保持知识和经验。

类型

  • 短期记忆(当前对话)
  • 长期记忆(跨 session)
  • 技能记忆(可复用模式)

5. 长时间连贯性 (Long-running Coherence)

处理需要持续运行数小时的任务。

挑战

  • 上下文窗口限制
  • 方向漂移
  • 自我评估失真

解决方案

  • 定期 context reset
  • 独立 evaluator
  • 阶段性验证

6. 反馈循环 (Feedback Loops)

从执行结果中学习并改进。

类型

  • 即时反馈(测试失败/成功)
  • 延迟反馈(用户验收)
  • 元反馈(优化策略本身)

关键洞察

Coding harness 是 Agent harness 的「特化版」,专门针对软件工程量身定制:

  • 管理代码上下文
  • 开发工具集成
  • 代码执行和迭代反馈

更好的 LLM更强的推理模型优秀的 Harness 压榨到极致


关联

Sources

Linked from