编程智能体的核心组件
来源:Sebastian Raschka, PhD,2026-04
厘清概念
大语言模型 (LLM)
核心基础模型,预测「下一个词」。
推理模型 (Reasoning Model)
经过特殊训练或提示词引导的 LLM,会在生成答案时投入更多计算力(test-time compute),做中间步骤推理、自我验证、在候选答案中搜索最佳结果。
智能体 (Agent)
盖在模型上面的一层「控制循环」。围绕模型运转,决定:接下来检查什么?调用哪个工具?怎么更新状态?什么时候停止?
类比
- LLM = 发动机
- 推理模型 = 爆改后的强劲发动机(更费钱)
- Agent harness = 整车系统,帮助我们更好地驾驭发动机
编程智能体的六大核心模块
1. 代码仓库上下文 (Repo Context)
智能体需要理解代码库的结构、依赖关系、编码规范。
关键能力:
- 代码导航(找到相关文件)
- 依赖分析
- 语义理解
2. 工具设计 (Tool Design)
智能体与外部环境交互的接口。
常见工具:
- 文件操作(读/写/搜索)
- 代码执行(bash/REPL)
- 测试运行
- 版本控制
3. 提示词缓存 (Prompt Caching)
管理上下文窗口,优化成本和延迟。
策略:
- 静态前缀缓存
- 动态内容选择
- 渐进式披露
4. 记忆能力 (Memory)
跨 session 保持知识和经验。
类型:
- 短期记忆(当前对话)
- 长期记忆(跨 session)
- 技能记忆(可复用模式)
5. 长时间连贯性 (Long-running Coherence)
处理需要持续运行数小时的任务。
挑战:
- 上下文窗口限制
- 方向漂移
- 自我评估失真
解决方案:
- 定期 context reset
- 独立 evaluator
- 阶段性验证
6. 反馈循环 (Feedback Loops)
从执行结果中学习并改进。
类型:
- 即时反馈(测试失败/成功)
- 延迟反馈(用户验收)
- 元反馈(优化策略本身)
关键洞察
Coding harness 是 Agent harness 的「特化版」,专门针对软件工程量身定制:
- 管理代码上下文
- 开发工具集成
- 代码执行和迭代反馈
更好的 LLM → 更强的推理模型 → 优秀的 Harness 压榨到极致
关联
- harness-engineering/overview — Harness Engineering 综述
- harness-engineering/aci — Agent-Computer Interface
- claude-code/overview — Claude Code