Hermes Agent — 自进化个人 AI 智能体

来源：极客公园（连冉），2026-04-10；VirtualUncle 完整指南，2026-04-05 GitHub: hermes-agent.nousresearch

简介

Hermes Agent 是 Nous Research 开发的免费、MIT 许可的自主 AI 框架，核心定位是会随着使用不断成长的「自进化 Agent」。

核心数据（不同来源存在差异）：

2 月底开源首月破 2.2 万星
4 月 8 日 v0.8.0 发布后单日新增 6400+ 星
不到两个月 GitHub 总星标突破 4.7 万（AINews，2026-04-16）
另有来源称已超 6.1 万星（VirtualUncle，2026-04-05）
持续霸榜全球开源榜单第一

核心特性

1. 持久化记忆

所有历史会话存储在本地 SQLite 数据库中
通过 FTS5 全文检索与 LLM 摘要进行二次组织
可回溯几周前的对话，提取具体细节应用到当前工作
Honcho 用户建模：异步构建 progressively deeper understanding of how you work（默认关闭，需显式启用）

2. 技能自动生成与复用

完成复杂任务（通常 5+ 工具调用）后，自动抽象为结构化 Skill
技能遵循 open agentskills.io 标准，包含步骤、关键判断、潜在陷阱、验证方式
自改进：使用现有技能时发现更优路径，自动更新技能文档
社区报告：重复研究任务在 2 小时内生成 3 个 skill 后提速 40%

3. 自训练能力（Atropos RL）

运行过程中生成大量工具调用轨迹
可导出为 ShareGPT 格式，用于批量 trajectory generation
支持用生成的数据 fine-tune 更小、更便宜的模型
这是 research-grade infrastructure inside a consumer product

4. 多实例与多平台

同一环境中运行多个相互隔离的 Agent
每个都有独立的记忆、技能和配置
Gateway：Telegram、Discord、Slack、WhatsApp、Signal、Email 统一接入
跨平台会话连续性：手机上 Telegram 发起，笔记本终端继续

5. MCP 支持

将自身的会话与记忆暴露给 IDE 工具
支持 Claude Desktop、Cursor、VS Code
打通"常驻 Agent"与"开发环境"的边界

学习闭环架构

Hermes 运行一个 closed learning loop，三个组件相互 feeding：

任务执行 → 经验抽象 → 技能沉淀 → 复用优化
    ↑                                    ↓
    └──────────── 反馈改进 ←─────────────┘

持久化记忆 with real recall：FTS5 + LLM summarization，支持 "periodic nudges"（主动保存可能以后有用的信息）
Autonomous skill creation：复杂任务完成后合成永久可复用 skill，下次加载 skill 而非从零解决
Self-training pipeline：通过 Atropos 生成 batch trajectories，导出 fine-tune 数据

这与 Claude Code Skills 系统理念高度一致：从完成的任务中学习，而非每次从零开始。区别在于 Hermes 的技能由 agent 自己维护，OpenClaw 的技能由人类维护。

五层记忆系统拆解（2026-04-30 深度分析）

来源：宝玉xp 转译 Manthan Gupta

Hermes 把记忆拆成五个独立子系统，而非一套统一的记忆。核心设计原则：保持提示词稳定以便利用缓存，其他繁杂信息交给工具。

第一层：固化提示词记忆（MEMORY.md + USER.md）

MEMORY.md：智能体笔记（环境、规范、工具怪癖、教训），上限 2,200 字符
USER.md：用户画像（偏好、沟通风格、身份），上限 1,375 字符
合计约 1,300 Token，刻意极小
会话开始时加载并固化快照，会话中途写入不改变已生成的系统提示词
字符限制而非 Token 限制 → 与模型无关
纯文本 § 分隔 → 无向量数据库、无自定义二进制存储

设计意图："记忆是精选状态，而非日记。"

第二层：session_search 情景回溯

SQLite 存储所有历史会话，全文搜索
工作流：搜索 → 分组 → 加载匹配会话 → 便宜模型摘要 → 返回主模型
比盲目塞历史进提示词更便宜高效
与 Agent Memory vs Context Substrate 的"冷热分离"原则一致

第三层：压缩与记忆冲刷

长对话压缩前先"记忆冲刷"
指令模型在压缩前保存用户偏好、修正建议、重复模式
牺牲任务细节，保留关键事实

第四层：技能即程序记忆

存储在 ~/.hermes/skills/
只把技能索引放进提示词，需要时再加载具体技能
与 Claude Code Skills 系统的 progressive disclosure 模式同构

第五层：Honcho 深层建模

跨设备、跨平台记忆连续性
集成方式：首轮织入系统提示词，后续附加在用户提问后面（不破坏缓存）
默认关闭，需显式启用

Hermes vs OpenClaw 记忆对比

维度	OpenClaw	Hermes
记忆模式	Markdown 存储，日志和长效文件	提示词记忆严格限制，SQLite 检索
记忆内容	流水账式日志	精选状态（偏好/事实/规范）
不记录	—	任务进度、会话结果、临时 TODO
缓存策略	次要	核心设计原则
核心理念	文件即事实来源	不是所有东西都配住系统提示词

核心洞察

记忆应该让智能体变得更好用，而不是通过摧毁提示词的稳定性来换取博闻强识。真正的诀窍不是记住更多，而是在正确的层级、以正确的成本，记住正确的事情。

这一论述与 Your Harness, Your Memory 的"记忆即架构"主张相通——区别在于 Hermes 把"缓存稳定性"作为一等约束，而 OpenClaw 把"文件即事实"作为一等约束。两者代表 Agent 记忆设计的两种范式。

安装与部署

一键安装（推荐 VPS 自托管）

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes setup       # 连接 LLM provider
hermes             # 启动交互式 TUI
hermes gateway setup   # 连接 Telegram/Discord/Slack
hermes gateway install # 注册为 systemd 服务

支持平台：Linux VPS、Mac Mini（24GB 可跑 13B 本地模型）、Windows WSL2。

LLM Provider 选择

预算路径：OpenRouter + Claude Haiku / DeepSeek
隐私路径：Ollama 本地 13B/30B（ollama launch hermes，v0.8+ 原生支持）
性能路径：Claude Sonnet / Opus via Anthropic API

与 OpenClaw 的对比

维度	Hermes Agent	OpenClaw
核心定位	学习能力的深度	连接能力的广度
技能获取	经验涌现（自动抽象）	人类预设（代码/Prompt）
记忆机制	分层记忆 + "关于你的模型"	显式记忆 + RAG 检索
适用场景	探索性编程、创意开发	批量数据处理、金融交易
安全策略	容器隔离、只读文件系统	权限控制严格、行为可预测
部署形态	常驻网关服务	本地 CLI + 可选网关

社区共识：两者互补而非替代

OpenClaw 负责"干活"——多通道交互、团队工作流
Hermes 负责"动脑"——持久化记忆、自动生成技能

迁移支持：hermes claw migrate 可一键迁移 OpenClaw 技能、记忆和设置

第三方实测：Peter Yang 的个人 Agent 横评（2026-05-06）

来源：Peter Yang — The Race to Build a Personal AI Agent

Peter Yang（Meta AI 产品负责人）在深度测试 OpenClaw、Hermes、Claude Code、Codex、Gemini 后，将 Hermes 作为日常主力：

维度	Peter Yang 的观察
可靠性	比 OpenClaw 更稳定，甚至修好了 OpenClaw 在 GPT 5.5 上搞砸的 cron job
透明度	会主动告知 cron job 完成状态和任务耗时
自主性	发现重复工作流时自动转成可复用 skill——控制欲强的人可能觉得过多
vs OpenClaw	OpenClaw 因"透明心跳和记忆系统"感觉更"alive"，但"我宁愿要可靠性也不要这些功能"

结论："如果 OpenClaw 的维护税让你疲惫，试试 Hermes。一周下来，它对我来说更可靠。"

这与 Garry Tan 的类比一致：OpenClaw 是改装车（灵活但常坏），Hermes 是量产车（没那么个性但稳定）。

团队背景

Nous Research 是一家去中心化 AI 研究实验室：

创始人：Jeffrey Quesnelle、Karan Malhotra、Teknium、Shivani Mitra（2023 年成立）
CEO Jeffrey Quesnelle 曾是以太坊 MEV 基础设施项目 Eden Network 首席工程师
累计融资约 $65 million，$50M Series A led by Paradigm
约 20 名员工，总部位于 Austin, Texas
同时推进 Psyche 去中心化训练网络

团队背景是模型训练者而非产品公司， Hermes 3 model family + Atropos RL framework 均为自研。

争议与风险

Web3 背景带来的质疑

融资路径带有鲜明的 Web3 特征（代币计价而非股权）
社区讨论围绕"空投预期"
链上已出现非官方的 "NOUS" 代币

官方立场

目前未发行代币
未公布代币分发机制
技术路径与社区结构天然具备向"代币化激励体系"延展的可能性

开发者判断标准：Hermes Agent 的价值首先来自它作为 Agent 系统本身的能力。任何与"NOUS 代币"直接挂钩的交易、投资或承诺，都需要保持足够谨慎。

核心洞察

Hermes Agent 在尝试把「AI 能力」从一次性调用，变成可以持续积累的资产。

"从看它「当下能做什么」到看它「在时间里变成了什么」。谁能在时间里积累更多能力，谁就拥有更高的上限。"

设计哲学：开箱即用而非从零开始（2026-06-01）

来源：AI 简报 2026-06-01 Afternoon

Teknium（Nous Research 核心成员）明确阐述了 Hermes 的设计哲学：

目标用户：不想花费数周配置 agent 的普通人
与极简 agent 的区别：nanoclaw 或 pi 选择"从零开始，用户自己搞定"，Hermes 选择"提供适度基线，用户按需裁剪"
可禁用：通过 hermes skills config 或 hermes tools 关闭不需要的能力
可分享：支持将整个 Agent 配置上传为 GitHub repo，方便复用和迁移
可扩展：提供庞大的扩展接口，支持无限定制

这一设计选择反映了 Hermes 对"agent 工程门槛"的判断：大多数人不想成为 agent 工程师，他们想要一个立即可用、能力足够广泛的基线系统。

版本历史

2026-04-24：v0.11.0 — 大型贡献者版本

来源：[[raw/newsletters/AINews/2026-04-24 [AINews] GPT 5.5 and OpenAI Codex Superapp.md|AINews 2026-04-24]]

扩展提供商支持：新增多个 LLM 提供商
图像生成支持：集成图像生成功能
GPT-5.5 即时支持：发布当天即支持 GPT-5.5（@Teknium）
几乎在 GPT-5.5 发布后立即完成适配

2026-04-18：Ollama 原生支持 + $25k 创意黑客马拉松

来源：[[raw/newsletters/AINews/2026-04-19 [AINews] The Two Sides of OpenClaw.md|2026-04-19 [AINews] The Two Sides of OpenClaw]]

Ollama 原生支持：ollama launch hermes 直接启动
$25k 创意黑客马拉松：Nous Research 与 Kimi 联合发起，重心扩展到创意 Agent 工作流
社区生态：衍生项目包括 Hermes Atlas、Hermes-Wiki、HUD 和控制仪表板

2026-04-16：v0.3.0

来源：raw/newsletters/AINews/2026-04-16 RIP Pull Requests (2005-2026)

/browser connect 浏览器控制（@0xme66）
QQBot + AWS Bedrock 支持（@Teknium）
原生 Swift 桌面应用 alpha（@nesquena）
artifact-preview 和 hermes-lcm v0.3.0

病毒式传播案例（@elder_plinius）：

加载存储的技能
诊断 Gemma 4 的 NaN 不稳定性
修补底层库
重试多种方法
基准测试结果
生成模型卡
上传 artifacts 到 Hugging Face

实践案例：多 Agent 配置与成本优化 (2026-05-05)

来源：@vmiss33 — Hermes Agent 使用实践

一位用户运行多 Agent 设置的实战经验：

Agent 分工

Agent	用途	模型/提供商
Tech Research	研究简报 + 引用，教学而非代做	Nous Portal / MiniMax M2.7
Tech Task Master	构建 skill、TUI 定制、通用执行	GPT 5.5 (ChatGPT Plus 订阅)
Lifestyle	喝水提醒、姿势检查、运动休息	OpenRouter / NVIDIA Nemotron 3 Super (免费)
Lifestyle/Research	医学研究、晚餐建议	本地 Qwen 3.5 9B quant (RTX 4070 8GB)

成本控制策略

OpenRouter 免费层：加 $10 获 1000 请求/天（非免费账户仅 50/天）
Nous Portal：$10/月订阅，API 制，含 tool calling
本地模型：8GB VRAM surprisingly 够用，Qwen 3.5 9B quant + 64k 上下文
ChatGPT Plus：$20/月，连接 GPT 5.5，"几乎 flawless"
NVIDIA NIM：免费模型，适合实验

核心洞察

"最大的错误是从技术开始而非从问题开始。你不需要一堆 3090 才能起步。从你的生活、工作流、摩擦点开始。然后围绕这些构建 Agent。"

这与 Hermes 官方定位（学习能力深度）形成互补：官方强调自动 skill 生成和 Atropos RL，用户实践强调从具体问题出发的手工配置。

Computer Use 预览：支持任何模型的后台电脑控制（2026-05-12）

来源：AI 简报 2026-05-12 Evening

Hermes Agent 正在集成内置 Computer Use 预览，由 trycua 提供底层能力。核心特征：

模型无关：支持任何模型（不只是前沿模型）在后台控制电脑
不抢占用户输入：agent 在后台运行，不打断用户当前工作
学习能力：配合 Hermes 的 skill 自动生成，Computer Use 的操作可被抽象为可复用技能

这降低了 Computer Use 的门槛：不需要高端模型或专门配置，普通模型也能在后台执行 GUI 自动化任务。

Hermes Agent — 自进化个人 AI 智能体

简介

核心特性

1. 持久化记忆

2. 技能自动生成与复用

3. 自训练能力（Atropos RL）

4. 多实例与多平台

5. MCP 支持

学习闭环架构

五层记忆系统拆解（2026-04-30 深度分析）

第一层：固化提示词记忆（MEMORY.md + USER.md）

第二层：session_search 情景回溯

第三层：压缩与记忆冲刷

第四层：技能即程序记忆

第五层：Honcho 深层建模

Hermes vs OpenClaw 记忆对比

核心洞察

安装与部署

一键安装（推荐 VPS 自托管）

LLM Provider 选择

与 OpenClaw 的对比

第三方实测：Peter Yang 的个人 Agent 横评（2026-05-06）

团队背景

争议与风险

Web3 背景带来的质疑

官方立场

核心洞察

设计哲学：开箱即用而非从零开始（2026-06-01）

版本历史

2026-04-24：v0.11.0 — 大型贡献者版本

2026-04-18：Ollama 原生支持 + $25k 创意黑客马拉松

2026-04-16：v0.3.0

实践案例：多 Agent 配置与成本优化 (2026-05-05)

Agent 分工

成本控制策略

核心洞察

Computer Use 预览：支持任何模型的后台电脑控制（2026-05-12）

Sources

Evolution

Derived from source material

Linked from