全部文章
2026-04-08

认识 Hermes Agent:一个会跟着你成长的 AI

Nous Research 开源的自改进 Agent runtime——它是什么、怎么跨平台跟着你、为什么运行越久越有用。

现在 AI 工具很多,大部分是网页聊天机器人——关掉标签页就把你忘了。Hermes Agent 跟这类工具不一样。

它是 Nous Research 出的一个 Agent runtime。一句话概括——一个住在你在的地方、会记住学到的东西、运行越久越强的 AI。

听起来像营销话术,但看看它的设计决策,你会发现这不是同一种工具,而是另一种形态。

不是聊天机器人

要理解 Hermes,最重要的一点是,它是一个长期在后台跑着的进程,跑在你自己控制的机器上。不是浏览器里的标签页,不是某个网站上的对话框,而是一个进程。

一旦这个进程跑起来,它能做很多 AI 工具做不了的事。

  • 从十几个不同平台接收你的消息,然后用同一个"大脑"回你
  • 在真实的沙箱里跑真实的 shell 命令,包括跑在远程机器上
  • 记住你上周告诉它的东西,并在这周的对话里自己带出来
  • 自己安排将来的任务,到点自己醒过来干活
  • 把一个大任务拆成几块,派给隔离的子 agent 并行去做

这些不是理论上的能力,都是文档里明确支持的功能。

你在哪,它就在哪

Hermes 原生支持一长串消息平台:CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、钉钉、飞书、企业微信、BlueBubbles、Home Assistant,而且还在继续增加。消息网关的设计让一个 agent 进程同时出现在所有这些入口上

这在实际使用中是什么感觉?早上你在手机上用 Telegram 给它发一条消息,它回你一段语音。你换到电脑上,在终端里接着刚才的话题继续聊。过会儿再在 Slack 里看结果。整个过程中没有"我的 AI 现在在哪个 App 里"这种问题,是同一个 agent,在任何地方都用同一份记忆。

这挺少见的。大部分 AI 工具都绑在一个界面上,而 Hermes 把界面当成一个细节处理。

越用越懂你

Hermes 的第二个核心想法是,它会随时间自己变好,而且不是靠"我们发了新模型"这种方式。

这个能力的基础是一个闭环的学习循环

  • Agent 自己整理的 memory。Hermes 在一些小而精的 Markdown 文件里持续记录关于你环境和偏好的笔记。Agent 会定期"提醒"自己把值得记的东西写下来,而不是靠你开口。
  • 跨会话的全文检索。每次会话都存到本地 SQLite 里,基于 FTS5 建了全文索引。几周之后它能直接搜到你当时说过的某句话,必要时带回当前上下文,还会让 LLM 先做一步摘要。
  • Honcho 用户建模。一个对话式的用户画像系统,通过持续对话刻画你是谁——你的习惯、偏好、工作方式——而不是把你当成一个新面孔对待。
  • Skills 自己进化。一个 skill 就是一包可复用的指令,比如"我们团队怎么部署到 Kubernetes"、"我喜欢 commit message 怎么写"、"这个 repo 的 PR 评审流程"。Hermes 可以从 Skills Hub 装一个现成的,也可以在发现某个模式反复出现之后自己造一个,还会在使用过程中慢慢完善它。

Skills 兼容 agentskills.io 这个开放格式,可以跨机器携带,也可以分享给团队。

这一切加起来,你得到的是一个真的会认识你的工具。第一周它还比较通用,第三周它已经知道你在意哪几个 repo、你的 commit 风格长什么样、你偏好 pnpm 而不是 npm。到第十周,它在重复遇到的问题上已经能按你上次的解法直接解决了。

真·沙箱,不只是给个 shell

这部分通常会让人惊讶。Hermes 自带六种执行后端

  • Local —— 在本机跑命令
  • Docker —— 按需起隔离容器,带容器加固和命名空间隔离
  • SSH —— 在一台你授权的远程机器上跑 shell
  • Daytona —— 云端开发环境,支持无服务器休眠:空闲时自动冻结,下次被唤醒时恢复现场,几乎不花钱
  • Singularity —— HPC 环境用的
  • Modal —— 云端无服务器容器,同样支持休眠式持久化

按会话、按任务、按 toolset 选用哪一个。不想让 agent 碰你主机,就给它 Docker。想让它管一台远程服务器,就给它 SSH。在 HPC 集群上跑,用 Singularity。想要"它平时不花钱、你要用的时候一秒唤醒"的体验,给它 Daytona 或 Modal。Agent 不关心在哪里跑,它就是拿到一个 shell,然后开始干活。

这份灵活性让 Hermes 从 5 美元的 VPS 到 GPU 集群都能跑起来,也是它可以无人值守长期运行的前提。

真正会"派活"的 Agent

大部分 AI 工具都是你问一句、它答一句。Hermes 能派活给自己的子 agent 并行处理,每个子 agent 有自己的终端、自己的会话、自己的上下文。子任务跑完把结果汇总回主 agent。

更进一步,Hermes 有一个叫 Programmatic Tool Calling 的东西:通过 execute_code 工具,它可以把一个多步骤流水线塞进一次推理调用里。以前"调 A 工具、拿结果、再调 B 工具、拿结果、再调 C 工具"是三次往返,现在可以折叠成一次,几乎零上下文开销。对需要大量工具调用的任务(比如跨几十个文件做重构),这个差距是量级上的。

开箱即用的东西

装完 Hermes 你能直接用上的有这些。

  • 47 个内置工具:文件读写、网页搜索、浏览器自动化、shell 执行、代码执行、视觉、图像生成、语音合成,等等
  • MCP 支持:接任何 Model Context Protocol 服务器,Hermes 会自动捡起它暴露的工具
  • Cron 系统:你用人话描述一个定时任务,Hermes 自己跑起来
  • 子 Agent 派发:起带独立终端和会话的子 agent 并行干活
  • 语音模式:实时语音输入输出,在 CLI、Telegram、Discord 以及 Discord 语音频道里都能用
  • SOUL.md:一个你自己写的人格文件,定义 Hermes 说话和做事的风格
  • Provider 灵活:Nous Portal、OpenRouter、OpenAI,或者任何你指给它的兼容 endpoint

另外给做研究的人,还有 trajectory 导出、批量处理,以及和 Nous 自己的 Atropos 做强化学习训练的集成。

由模型训练团队做出来的工具

Hermes 不是一家做"AI 产品"的公司的副业,是 Nous Research 这家做开源模型训练的实验室出的工具——同一个团队出过 Hermes、Nomos、Psyche 这几个模型。他们做 Agent runtime,某种程度上是因为自己训练模型时真的需要这样一个东西。

这一点在产品上能感觉出来。它不是一个有着顺滑 onboarding 流程的消费级 App,是一件趁手的工具。

如果你习惯在终端里工作,想让 AI 跑在自己的基础设施上,以前有过"要是 AI 能直接帮我按下这个按钮就好了"的念头,你大概率会喜欢它。如果你找的是一键上手的体验,你可能会劝退——把 provider、gateway 和几个 skill 配齐大概要花一个下午。

对开发者、研究者,以及任何在搭自动化工作流的人,这个下午是一笔回报很快的投入。对其他人,网页版聊天机器人一直都在。

接下来去哪

要最快判断 Hermes 合不合你的工作流,装一个花二十分钟玩一下就知道了。安装是一条命令,不需要预先配 runtime,也不用纠结 Python 版本。

  • 终端快速上手:装、配 provider、打招呼,完整流程大概 15 分钟
  • 完整学习路径:一条结构化的路径,带你从零走到有记忆、有 skills、有消息网关接入的完整 agent
  • 官方文档:按主题组织的权威参考手册

大部分 AI 工具想成为"你打开的那个东西",Hermes 想成为"一直在那儿等你的那个东西",不管你在哪。这是不是对你来说的正确形态,取决于你要的是一个工具还是一个搭子。如果你要搭子,值得花一个下午。