OpenClaw Harness 设计——罗福莉深度访谈
"OpenClaw 是 AI 技术进化的巨大分水岭。原始且复杂的 Agent 框架设计确实能弥补很多模型能力的不足。"
小米 MiMo 负责人罗福莉在接受人生第一次长时间技术访谈时,系统阐述了对 OpenClaw、Agent Harness、持久化记忆和模型架构的深度思考。
OpenClaw 三次认知转变
| 阶段 | 认知 | 关键发现 |
|---|---|---|
| 1 月初见 | "不过是 Claude Code + IM 界面" | 表面判断 |
| 2 春节使用 | "它有灵魂、有温度" | "精细编排的上下文"——search.md、每轮对话拼入当前时间、等微设计累积出的体验 |
| 3 深度整合 | "推动了我的研究" | 用 OpenClaw 构建用户 Agent 生成 RL 训练数据,变成数字分身 |
持久化记忆是 Agent 基础设施
分层分级
"OpenClaw 的记忆系统非常耐用,体现在记忆的分层和分级上。我在用 Claude Code 时完全没有这种感觉。"
- OpenClaw 借鉴了 Claude Code 的记忆压缩思路(会话快满时压缩存入记忆)
- 但更进一步:任务完成后的记忆动作、跨会话上下文共享、端到端任务中当前模型的短板针对性设计
- 多模型协同利用——用户不需要知道哪个模型擅长什么,发个视频给 OpenClaw,它会自己找视频理解能力强的模型来处理
核心产品逻辑
"尽可能通过整套 Agent 编排来弥补模型的短板。"
3B 端侧模型放进 OpenClaw 后可以完成小模型原本做不到的任务。"原始且复杂的 Agent 框架设计确实能弥补很多模型能力的不足。" 这也是 OpenClaw 相比 Claude Code 的差异化优势。
模型与 Harness 同步演进
Agent 的"自学习"最可能的发生路径不是模型自己变强,而是:
- 模型能力提升 + Harness 适配度同步提升
- 静态信息(记忆、Skill 文件夹)在训练过程中应该改变
- 动态信息(整个 Agent 架构设计)需要随模型进步而调整
- 不同场景(软件工程 vs 金融分析)需要不同的 Agent 架构设计
"在提升模型能力的同时,需要提升 Agent 框架对该模型的适配度或泛化能力。"
Agent 框架 ≠ 产品
"产品是交互层能直接感知到的。Agent 框架在交互层之前,定义了如何与模型沟通。这一中间层可以做得很厚,前端 UI 成为最薄的一层。"
这与 Harness Engineering 的核心概念完全一致:Harness 是人与模型之间的中间层,是真正产生差异化的地方。
"Claude Code 一直是一个非常复杂的 Agent 框架,只是因为它是个黑盒。OpenClaw 是开源的,你知道它是如何设计的,可以去改变它。这种'可改变性'非常重要。"
MLA 不符合 Agent 范式
| MLA 的设计目标 | Agent 的实际需求 |
|---|---|
| 在 H 系列芯片上优化访存计算比 | KV Cache 和推理速度同样重要 |
| 减少 KV Cache 占用 | 需要稳定的多轮 KV Cache 复用 |
| 不适合 MTP(多 Token 预测) | 推理加速需要 MTP |
原因: MLA 已达到压缩与访存的完美临界点,再用 MTP 会被计算受限卡住。所有 MLA 结构的模型(GLM、Kimi)都没有使用 MTP。
MiMo 的替代方案: 滑动窗口 + 全量注意力以极端 1:7 比例混合。用滑动窗口节省的注意力算力去填充 MTP,在实际推理中访存和计算达到平衡。
关键引用
"OpenClaw 有一个更持久的记忆系统。这套记忆系统非常耐用,体现在记忆的分层和分级上。"
"尽可能通过整套 Agent 编排来弥补模型的短板。"
"Agent 框架能了解模型能力的优缺点,知道如何更好地调度。这一人与模型之间的中间层可以做得非常厚,而前端 UI 成为最薄的一层,不再是关键。"
"可改变性非常非常重要。"(指 OpenClaw 开源让用户可以修改 Harness 设计)
Related
- Harness Is Everything — 核心理念高度一致
- Persistent Memory Design(页面未创建) — 记忆分层的具体实现
- Model Routing — 多模型协同利用
- What Is Agent Harness — Agent 框架的定义边界
- Cursor 3 User Feedback — 用户也在要求更好的编排层
- MiMo-V2.5 — 本次同时开源的 MiMo 模型