Hermes Agent — 自进化个人 AI 智能体
来源:极客公园(连冉),2026-04-10;VirtualUncle 完整指南,2026-04-05 GitHub: hermes-agent.nousresearch
简介
Hermes Agent 是 Nous Research 开发的免费、MIT 许可的自主 AI 框架,核心定位是会随着使用不断成长的「自进化 Agent」。
核心数据(不同来源存在差异):
- 2 月底开源首月破 2.2 万星
- 4 月 8 日 v0.8.0 发布后单日新增 6400+ 星
- 不到两个月 GitHub 总星标突破 4.7 万(AINews,2026-04-16)
- 另有来源称已超 6.1 万星(VirtualUncle,2026-04-05)
- 持续霸榜全球开源榜单第一
核心特性
1. 持久化记忆
- 所有历史会话存储在本地 SQLite 数据库中
- 通过 FTS5 全文检索与 LLM 摘要进行二次组织
- 可回溯几周前的对话,提取具体细节应用到当前工作
- Honcho 用户建模:异步构建 progressively deeper understanding of how you work(默认关闭,需显式启用)
2. 技能自动生成与复用
- 完成复杂任务(通常 5+ 工具调用)后,自动抽象为结构化 Skill
- 技能遵循 open agentskills.io 标准,包含步骤、关键判断、潜在陷阱、验证方式
- 自改进:使用现有技能时发现更优路径,自动更新技能文档
- 社区报告:重复研究任务在 2 小时内生成 3 个 skill 后提速 40%
3. 自训练能力(Atropos RL)
- 运行过程中生成大量工具调用轨迹
- 可导出为 ShareGPT 格式,用于批量 trajectory generation
- 支持用生成的数据 fine-tune 更小、更便宜的模型
- 这是 research-grade infrastructure inside a consumer product
4. 多实例与多平台
- 同一环境中运行多个相互隔离的 Agent
- 每个都有独立的记忆、技能和配置
- Gateway:Telegram、Discord、Slack、WhatsApp、Signal、Email 统一接入
- 跨平台会话连续性:手机上 Telegram 发起,笔记本终端继续
5. MCP 支持
- 将自身的会话与记忆暴露给 IDE 工具
- 支持 Claude Desktop、Cursor、VS Code
- 打通"常驻 Agent"与"开发环境"的边界
学习闭环架构
Hermes 运行一个 closed learning loop,三个组件相互 feeding:
任务执行 → 经验抽象 → 技能沉淀 → 复用优化
↑ ↓
└──────────── 反馈改进 ←─────────────┘
- 持久化记忆 with real recall:FTS5 + LLM summarization,支持 "periodic nudges"(主动保存可能以后有用的信息)
- Autonomous skill creation:复杂任务完成后合成永久可复用 skill,下次加载 skill 而非从零解决
- Self-training pipeline:通过 Atropos 生成 batch trajectories,导出 fine-tune 数据
这与 Claude Code Skills 系统理念高度一致:从完成的任务中学习,而非每次从零开始。区别在于 Hermes 的技能由 agent 自己维护,OpenClaw 的技能由人类维护。
五层记忆系统拆解(2026-04-30 深度分析)
Hermes 把记忆拆成五个独立子系统,而非一套统一的记忆。核心设计原则:保持提示词稳定以便利用 缓存,其他繁杂信息交给工具。
第一层:固化提示词记忆(MEMORY.md + USER.md)
MEMORY.md:智能体笔记(环境、规范、工具怪癖、教训),上限 2,200 字符USER.md:用户画像(偏好、沟通风格、身份),上限 1,375 字符- 合计约 1,300 Token,刻意极小
- 会话开始时加载并固化快照,会话中途写入不改变已生成的系统提示词
- 字符限制而非 Token 限制 → 与模型无关
- 纯文本 § 分隔 → 无向量数据库、无自定义二进制存储
设计意图:"记忆是精选状态,而非日记。"
第二层:session_search 情景回溯
- SQLite 存储所有历史会话,全文搜索
- 工作流:搜索 → 分组 → 加载匹配会话 → 便宜模型摘要 → 返回主模型
- 比盲目塞历史进提示词更便宜高效
- 与 Agent Memory vs Context Substrate 的"冷热分离"原则一致
第三层:压缩与记忆冲刷
- 长对话压缩前先"记忆冲刷"
- 指令模型在压缩前保存用户偏好、修正建议、重复模式
- 牺牲任务细节,保留关键事实
第四层:技能即程序记忆
- 存储在
~/.hermes/skills/ - 只把技能索引放进提示词,需要时再加载具体技能
- 与 Claude Code Skills 系统 的 progressive disclosure 模式同构
第五层:Honcho 深层建模
- 跨设备、跨平台记忆连续性
- 集成方式:首轮织入系统提示词,后续附加在用户提问后面(不破坏缓存)
- 默认关闭,需显式启用
Hermes vs OpenClaw 记忆对比
| 维度 | OpenClaw | Hermes |
|---|---|---|
| 记忆模式 | Markdown 存储,日志和长效文件 | 提示词记忆严格限制,SQLite 检索 |
| 记忆内容 | 流水账式日志 | 精选状态(偏好/事实/规范) |
| 不记录 | — | 任务进度、会话结果、临时 TODO |
| 缓存策略 | 次要 | 核心设计原则 |
| 核心理念 | 文件即事实来源 | 不是所有东西都配住系统提示词 |
核心洞察
记忆应该让智能体变得更好用,而不是通过摧毁提示词的稳定性来换取博闻强识。真正的诀窍不是记住更多,而是在正确的层级、以正确的成本,记住正确的事情。
这一论述与 Your Harness, Your Memory 的"记忆即架构"主张相通——区别在于 Hermes 把"缓存稳定性"作为一等约束,而 OpenClaw 把"文件即事实"作为一等约束。两者代表 Agent 记忆设计的两种范式。
安装与部署
一键安装(推荐 VPS 自托管)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes setup # 连接 LLM provider
hermes # 启动交互式 TUI
hermes gateway setup # 连接 Telegram/Discord/Slack
hermes gateway install # 注册为 systemd 服务
支持平台:Linux VPS、Mac Mini(24GB 可跑 13B 本地模型)、Windows WSL2。
LLM Provider 选择
- 预算路径:OpenRouter + Claude Haiku / DeepSeek
- 隐私路径:Ollama 本地 13B/30B(
ollama launch hermes,v0.8+ 原生支持) - 性能路径:Claude Sonnet / Opus via Anthropic API
与 OpenClaw 的对比
| 维度 | Hermes Agent | OpenClaw |
|---|---|---|
| 核心定位 | 学习能力的深度 | 连接能力的广度 |
| 技能获取 | 经验涌现(自动抽象) | 人类预设(代码/Prompt) |
| 记忆机制 | 分层记忆 + "关于你的模型" | 显式记忆 + RAG 检索 |
| 适用场景 | 探索性编程、创意开发 | 批量数据处理、金融交易 |
| 安全策略 | 容器隔离、只读文件系统 | 权限控制严格、行为可预测 |
| 部署形态 | 常驻网关服务 | 本地 CLI + 可选网关 |
社区共识:两者互补而非替代
- OpenClaw 负责"干活"——多通道交互、团队工作流
- Hermes 负责"动脑"——持久化记忆、自动生成技能
迁移支持:hermes claw migrate 可一键迁移 OpenClaw 技能、记忆和设置
第三方实测:Peter Yang 的个人 Agent 横评(2026-05-06)
来源:Peter Yang — The Race to Build a Personal AI Agent
Peter Yang(Meta AI 产品负责人)在深度测试 OpenClaw、Hermes、Claude Code、Codex、Gemini 后,将 Hermes 作为日常主力:
| 维度 | Peter Yang 的观察 |
|---|---|
| 可靠性 | 比 OpenClaw 更稳定,甚至修好了 OpenClaw 在 GPT 5.5 上搞砸的 cron job |
| 透明度 | 会主动告知 cron job 完成状态和任务耗时 |
| 自主性 | 发现重复工作流时自动转成可复用 skill——控制欲强的人可能觉得过多 |
| vs OpenClaw | OpenClaw 因"透明心跳和记忆系统"感觉更"alive",但"我宁愿要可靠性也不要这些功能" |
结论:"如果 OpenClaw 的维护税让你疲惫,试试 Hermes。一周下来,它对我来说更可靠。"
这与 Garry Tan 的类比一致:OpenClaw 是改装车(灵活但常坏),Hermes 是量产车(没那么个性但稳定)。
团队背景
Nous Research 是一家去中心化 AI 研究实验室:
- 创始人:Jeffrey Quesnelle、Karan Malhotra、Teknium、Shivani Mitra(2023 年成立)
- CEO Jeffrey Quesnelle 曾是以太坊 MEV 基础设施项目 Eden Network 首席工程师
- 累计融资约 $65 million,$50M Series A led by Paradigm
- 约 20 名员工,总部位于 Austin, Texas
- 同时推进 Psyche 去中心化训练网络
团队背景是模型训练者而非产品公司, Hermes 3 model family + Atropos RL framework 均为自研。
争议与风险
Web3 背景带来的质疑
- 融资路径带有鲜明的 Web3 特征(代币计价而非股权)
- 社区讨论围绕"空投预期"
- 链上已出现非官方的 "NOUS" 代币
官方立场
- 目前未发行代币
- 未公布代币分发机制
- 技术路径与社区结构天然具备向"代币化激励体系"延展的可能性
开发者判断标准:Hermes Agent 的价值首先来自它作为 Agent 系统本身的能力。任何与"NOUS 代币"直接挂钩的交易、投资或承诺,都需要保持足够谨慎。
核心洞察
Hermes Agent 在尝试把「AI 能力」从一次性调用,变成可以持续积累的资产。
"从看它「当下能做什么」到看它「在时间里变成了什么」。谁能在时间里积累更多能力,谁就拥有更高的上限。"
设计哲学:开箱即用而非从零开始(2026-06-01)
Teknium(Nous Research 核心成员)明确阐述了 Hermes 的设计哲学:
- 目标用户:不想花费数周配置 agent 的普通人
- 与极简 agent 的区别:nanoclaw 或 pi 选择"从零开始,用户自己搞定",Hermes 选择"提供适度基线,用户按需裁剪"
- 可禁用:通过
hermes skills config或hermes tools关闭不需要的能力 - 可分享:支持将整个 Agent 配置上传为 GitHub repo,方便复用和迁移
- 可扩展:提供庞大的扩展接口,支持无限定制
这一设计选择反映了 Hermes 对"agent 工程门槛"的判断:大多数人不想成为 agent 工程师,他们想要一个立即可用、能力足够广泛的基线系统。
版本历史
2026-04-24:v0.11.0 — 大型贡献者版本
来源:[[raw/newsletters/AINews/2026-04-24 [AINews] GPT 5.5 and OpenAI Codex Superapp.md|AINews 2026-04-24]]
- 扩展提供商支持:新增多个 LLM 提供商
- 图像生成支持:集成图像生成功能
- GPT-5.5 即时支持:发布当天即支持 GPT-5.5(@Teknium)
- 几乎在 GPT-5.5 发布后立即完成适配
2026-04-18:Ollama 原生支持 + $25k 创意黑客马拉松
来源:[[raw/newsletters/AINews/2026-04-19 [AINews] The Two Sides of OpenClaw.md|2026-04-19 [AINews] The Two Sides of OpenClaw]]
- Ollama 原生支持:
ollama launch hermes直接启动 - $25k 创意黑客马拉松:Nous Research 与 Kimi 联合发起,重心扩展到创意 Agent 工作流
- 社区生态:衍生项目包括 Hermes Atlas、Hermes-Wiki、HUD 和控制仪表板
2026-04-16:v0.3.0
来源:raw/newsletters/AINews/2026-04-16 RIP Pull Requests (2005-2026)
/browser connect浏览器控制(@0xme66)- QQBot + AWS Bedrock 支持(@Teknium)
- 原生 Swift 桌面应用 alpha(@nesquena)
- artifact-preview 和 hermes-lcm v0.3.0
病毒式传播案例(@elder_plinius):
- 加载存储的技能
- 诊断 Gemma 4 的 NaN 不稳定性
- 修补底层库
- 重试多种方法
- 基准测试结果
- 生成模型卡
- 上传 artifacts 到 Hugging Face
实践案例:多 Agent 配置与成本优化 (2026-05-05)
来源:@vmiss33 — Hermes Agent 使用实践
一位用户运行多 Agent 设置的实战经验:
Agent 分工
| Agent | 用途 | 模型/提供商 |
|---|---|---|
| Tech Research | 研究简报 + 引用,教学而非代做 | Nous Portal / MiniMax M2.7 |
| Tech Task Master | 构建 skill、TUI 定制、通用执行 | GPT 5.5 (ChatGPT Plus 订阅) |
| Lifestyle | 喝水提醒、姿势检查、运动休息 | OpenRouter / NVIDIA Nemotron 3 Super (免费) |
| Lifestyle/Research | 医学研究、晚餐建议 | 本地 Qwen 3.5 9B quant (RTX 4070 8GB) |
成本控制策略
- OpenRouter 免费层:加 $10 获 1000 请求/天(非免费账户仅 50/天)
- Nous Portal:$10/月订阅,API 制,含 tool calling
- 本地模型:8GB VRAM surprisingly 够用,Qwen 3.5 9B quant + 64k 上下文
- ChatGPT Plus:$20/月,连接 GPT 5.5,"几乎 flawless"
- NVIDIA NIM:免费模型,适合实验
核心洞察
"最大的错误是从技术开始而非从问题开始。你不需要一堆 3090 才能起步。从你的生活、工作流、摩擦点开始。然后围绕这些构建 Agent。"
这与 Hermes 官方定位(学习能力深度)形成互补:官方强调自动 skill 生成和 Atropos RL,用户实践强调从具体问题出发的手工配置。
Computer Use 预览:支持任何模型的后台电脑控制(2026-05-12)
Hermes Agent 正在集成内置 Computer Use 预览,由 trycua 提供底层能力。核心特征:
- 模型无关:支持任何模型(不只是前沿模型)在后台控制电脑
- 不抢占用户输入:agent 在后台运行,不打断用户当前工作
- 学习能力:配合 Hermes 的 skill 自动生成,Computer Use 的操作可被抽象为可复用技能
这降低了 Computer Use 的门槛:不需要高端模型或专门配置,普通模型也能在后台执行 GUI 自动化任务。