认识 Hermes Agent：一个会跟着你成长的 AI

现在 AI 工具很多，大部分是网页聊天机器人——关掉标签页就把你忘了。Hermes Agent 跟这类工具不一样。

它是 Nous Research 出的一个 Agent runtime。一句话概括——一个住在你在的地方、会记住学到的东西、运行越久越强的 AI。

听起来像营销话术，但看看它的设计决策，你会发现这不是同一种工具，而是另一种形态。

不是聊天机器人

要理解 Hermes，最重要的一点是，它是一个长期在后台跑着的进程，跑在你自己控制的机器上。不是浏览器里的标签页，不是某个网站上的对话框，而是一个进程。

一旦这个进程跑起来，它能做很多 AI 工具做不了的事。

从十几个不同平台接收你的消息，然后用同一个"大脑"回你
在真实的沙箱里跑真实的 shell 命令，包括跑在远程机器上
记住你上周告诉它的东西，并在这周的对话里自己带出来
自己安排将来的任务，到点自己醒过来干活
把一个大任务拆成几块，派给隔离的子 agent 并行去做

这些不是理论上的能力，都是文档里明确支持的功能。

你在哪，它就在哪

Hermes 原生支持一长串消息平台：CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、钉钉、飞书、企业微信、BlueBubbles、Home Assistant，而且还在继续增加。消息网关的设计让一个 agent 进程同时出现在所有这些入口上。

这在实际使用中是什么感觉？早上你在手机上用 Telegram 给它发一条消息，它回你一段语音。你换到电脑上，在终端里接着刚才的话题继续聊。过会儿再在 Slack 里看结果。整个过程中没有"我的 AI 现在在哪个 App 里"这种问题，是同一个 agent，在任何地方都用同一份记忆。

这挺少见的。大部分 AI 工具都绑在一个界面上，而 Hermes 把界面当成一个细节处理。

越用越懂你

Hermes 的第二个核心想法是，它会随时间自己变好，而且不是靠"我们发了新模型"这种方式。

这个能力的基础是一个闭环的学习循环：

Agent 自己整理的 memory。Hermes 在一些小而精的 Markdown 文件里持续记录关于你环境和偏好的笔记。Agent 会定期"提醒"自己把值得记的东西写下来，而不是靠你开口。
跨会话的全文检索。每次会话都存到本地 SQLite 里，基于 FTS5 建了全文索引。几周之后它能直接搜到你当时说过的某句话，必要时带回当前上下文，还会让 LLM 先做一步摘要。
Honcho 用户建模。一个对话式的用户画像系统，通过持续对话刻画你是谁——你的习惯、偏好、工作方式——而不是把你当成一个新面孔对待。
Skills 自己进化。一个 skill 就是一包可复用的指令，比如"我们团队怎么部署到 Kubernetes"、"我喜欢 commit message 怎么写"、"这个 repo 的 PR 评审流程"。Hermes 可以从 Skills Hub 装一个现成的，也可以在发现某个模式反复出现之后自己造一个，还会在使用过程中慢慢完善它。

Skills 兼容 agentskills.io 这个开放格式，可以跨机器携带，也可以分享给团队。

这一切加起来，你得到的是一个真的会认识你的工具。第一周它还比较通用，第三周它已经知道你在意哪几个 repo、你的 commit 风格长什么样、你偏好 pnpm 而不是 npm。到第十周，它在重复遇到的问题上已经能按你上次的解法直接解决了。

真·沙箱，不只是给个 shell

这部分通常会让人惊讶。Hermes 自带六种执行后端。

Local —— 在本机跑命令
Docker —— 按需起隔离容器，带容器加固和命名空间隔离
SSH —— 在一台你授权的远程机器上跑 shell
Daytona —— 云端开发环境，支持无服务器休眠：空闲时自动冻结，下次被唤醒时恢复现场，几乎不花钱
Singularity —— HPC 环境用的
Modal —— 云端无服务器容器，同样支持休眠式持久化

按会话、按任务、按 toolset 选用哪一个。不想让 agent 碰你主机，就给它 Docker。想让它管一台远程服务器，就给它 SSH。在 HPC 集群上跑，用 Singularity。想要"它平时不花钱、你要用的时候一秒唤醒"的体验，给它 Daytona 或 Modal。Agent 不关心在哪里跑，它就是拿到一个 shell，然后开始干活。

这份灵活性让 Hermes 从 5 美元的 VPS 到 GPU 集群都能跑起来，也是它可以无人值守长期运行的前提。

真正会"派活"的 Agent

大部分 AI 工具都是你问一句、它答一句。Hermes 能派活给自己的子 agent 并行处理，每个子 agent 有自己的终端、自己的会话、自己的上下文。子任务跑完把结果汇总回主 agent。

更进一步，Hermes 有一个叫 Programmatic Tool Calling 的东西：通过 execute_code 工具，它可以把一个多步骤流水线塞进一次推理调用里。以前"调 A 工具、拿结果、再调 B 工具、拿结果、再调 C 工具"是三次往返，现在可以折叠成一次，几乎零上下文开销。对需要大量工具调用的任务（比如跨几十个文件做重构），这个差距是量级上的。

开箱即用的东西

装完 Hermes 你能直接用上的有这些。

47 个内置工具：文件读写、网页搜索、浏览器自动化、shell 执行、代码执行、视觉、图像生成、语音合成，等等
MCP 支持：接任何 Model Context Protocol 服务器，Hermes 会自动捡起它暴露的工具
Cron 系统：你用人话描述一个定时任务，Hermes 自己跑起来
子 Agent 派发：起带独立终端和会话的子 agent 并行干活
语音模式：实时语音输入输出，在 CLI、Telegram、Discord 以及 Discord 语音频道里都能用
SOUL.md：一个你自己写的人格文件，定义 Hermes 说话和做事的风格
Provider 灵活：Nous Portal、OpenRouter、OpenAI，或者任何你指给它的兼容 endpoint

另外给做研究的人，还有 trajectory 导出、批量处理，以及和 Nous 自己的 Atropos 做强化学习训练的集成。

由模型训练团队做出来的工具

Hermes 不是一家做"AI 产品"的公司的副业，是 Nous Research 这家做开源模型训练的实验室出的工具——同一个团队出过 Hermes、Nomos、Psyche 这几个模型。他们做 Agent runtime，某种程度上是因为自己训练模型时真的需要这样一个东西。

这一点在产品上能感觉出来。它不是一个有着顺滑 onboarding 流程的消费级 App，是一件趁手的工具。

如果你习惯在终端里工作，想让 AI 跑在自己的基础设施上，以前有过"要是 AI 能直接帮我按下这个按钮就好了"的念头，你大概率会喜欢它。如果你找的是一键上手的体验，你可能会劝退——把 provider、gateway 和几个 skill 配齐大概要花一个下午。

对开发者、研究者，以及任何在搭自动化工作流的人，这个下午是一笔回报很快的投入。对其他人，网页版聊天机器人一直都在。

接下来去哪

要最快判断 Hermes 合不合你的工作流，装一个花二十分钟玩一下就知道了。安装是一条命令，不需要预先配 runtime，也不用纠结 Python 版本。

终端快速上手：装、配 provider、打招呼，完整流程大概 15 分钟
完整学习路径：一条结构化的路径，带你从零走到有记忆、有 skills、有消息网关接入的完整 agent
官方文档：按主题组织的权威参考手册

大部分 AI 工具想成为"你打开的那个东西"，Hermes 想成为"一直在那儿等你的那个东西"，不管你在哪。这是不是对你来说的正确形态，取决于你要的是一个工具还是一个搭子。如果你要搭子，值得花一个下午。