Claude Code 七层记忆架构解析
来源:Claude Code 源码泄露分析
核心设计哲学
Claude Code 为解决 LLM 固定上下文窗口(如 200K Token)易被耗尽的问题,设计了一个分层、渐进式的记忆管理系统——模拟人类大脑的记忆分层与巩固过程。
设计核心:不是简单扩大窗口,而是构建成本递增、能力递增的七层防御金字塔——"预防为主",尽可能用更便宜、更低层级的处理来避免触发更高层、更昂贵的操作。
七层记忆架构详解
| 层级 | 名称 | 触发条件 | 核心机制 | 成本 |
|---|---|---|---|---|
| L1 | 工具结果存储 | 大型工具输出 | 持久化到磁盘,上下文中仅保留预览 | 极低 |
| L2 | 微压缩 | 每轮对话前 | 基于时间、缓存状态清理旧工具结果 | 近乎零 |
| L3 | 会话记忆压缩 | 会话进行中 | 实时维护 session-memory.md |
几乎零API成本 |
| L4 | 全压缩 | 上下文接近满载 | 分支总结代理生成结构化摘要 | 高(完整API调用) |
| L5 | 自动记忆提取 | 单次任务结束 | 提取持久知识到 memory/ 目录 |
中 |
| L6 | 做梦机制 | 周期性(24h+5会话) | 后台回顾、合并、去重、清理矛盾 | 后台运行 |
| L7 | 跨代理通信 | 多Agent协作 | 分支代理模式,状态隔离,共享缓存 | 可控 |
各层详解
L3: 会话记忆压缩(最聪明的一层)
- 实时维护结构化的
session-memory.md - 记录:任务、文件、错误、学习要点等
- 需要压缩时,直接使用现成的笔记作为摘要
- 几乎无需额外的 API 调用成本
L4: 全压缩(紧急刹车)
- 分支出一个总结代理
- 生成包含 9 个部分的详细结构化摘要:
- 当前状态、任务说明、关键结果、待办事项等
- 重新注入关键上下文(如最近读取的文件)
L6: 做梦机制(最惊艳的一层)
- 模拟人脑睡眠时的记忆巩固
- 周期性触发(每 24 小时且积累至少 5 个会话后)
- 功能:
- 回顾历史会话记录
- 合并、去重长期记忆
- 清理矛盾信息
- 将相对日期转化为绝对日期
L7: 跨代理通信
- 多智能体协作的基础
- 通过
SendMessage工具实现进程间通信 - 代理可在用户、项目、本地三个范围维持各自的持久记忆
工程精妙之处
- 分层防御与成本控制:严格遵循先用最便宜层级的策略
- 提示缓存保护:冻结内容替换状态、分支代理共享缓存前缀,最大化缓存命中率
- 健壮性与可运维性:
- 失败重试机制
- 文件锁(防止竞争)
- 进程 ID 检测
- 通过 GrowthBook 进行远程功能开关
核心文件
整套复杂系统的关键实现逻辑,包含在一个大约 200 行的 MEMORY.md 相关文件中。
结论
Claude Code 的七层记忆架构不再是一个简单的代码补全工具,而更像一个会思考、会记忆、会"睡觉"巩固知识的真正编程伙伴,堪称当前 Agentic AI 的教科书级设计。
关联
- claude-code/source-leak-technical-analysis — 泄露源码技术深度分析
- claude-code/overview — Claude Code 概览
- harness-engineering/components-coding-agent-detailed — 编程智能体核心组件