编程智能体的核心组件

来源：Sebastian Raschka, PhD，2026-04

厘清概念

大语言模型 (LLM)

核心基础模型，预测「下一个词」。

推理模型 (Reasoning Model)

经过特殊训练或提示词引导的 LLM，会在生成答案时投入更多计算力（test-time compute），做中间步骤推理、自我验证、在候选答案中搜索最佳结果。

智能体 (Agent)

盖在模型上面的一层「控制循环」。围绕模型运转，决定：接下来检查什么？调用哪个工具？怎么更新状态？什么时候停止？

类比

LLM = 发动机
推理模型 = 爆改后的强劲发动机（更费钱）
Agent harness = 整车系统，帮助我们更好地驾驭发动机

编程智能体的六大核心模块

1. 代码仓库上下文 (Repo Context)

智能体需要理解代码库的结构、依赖关系、编码规范。

关键能力：

代码导航（找到相关文件）
依赖分析
语义理解

2. 工具设计 (Tool Design)

智能体与外部环境交互的接口。

常见工具：

文件操作（读/写/搜索）
代码执行（bash/REPL）
测试运行
版本控制

3. 提示词缓存 (Prompt Caching)

管理上下文窗口，优化成本和延迟。

策略：

静态前缀缓存
动态内容选择
渐进式披露

4. 记忆能力 (Memory)

跨 session 保持知识和经验。

类型：

短期记忆（当前对话）
长期记忆（跨 session）
技能记忆（可复用模式）

5. 长时间连贯性 (Long-running Coherence)

处理需要持续运行数小时的任务。

挑战：

上下文窗口限制
方向漂移
自我评估失真

解决方案：

定期 context reset
独立 evaluator
阶段性验证

6. 反馈循环 (Feedback Loops)

从执行结果中学习并改进。

类型：

即时反馈（测试失败/成功）
延迟反馈（用户验收）
元反馈（优化策略本身）

关键洞察

Coding harness 是 Agent harness 的「特化版」，专门针对软件工程量身定制：

管理代码上下文
开发工具集成
代码执行和迭代反馈

更好的 LLM → 更强的推理模型 → 优秀的 Harness 压榨到极致

关联

harness-engineering/overview — Harness Engineering 综述
harness-engineering/aci — Agent-Computer Interface
claude-code/overview — Claude Code

Sources

编程智能体的核心组件【译】