Hermes v0.8.0 在 4 月 8 日发布。是个大版本——合并了 209 个 PR,关闭了 82 个 issue,18 个人参与贡献。要一条条看完不现实,这篇挑出真正值得关注的那几项。
后台任务自动通知
这是这次发版最核心的变化。长时间跑的任务——训练、测试、部署——跑完的一瞬间会主动通知你,不用你反复问"好了吗"。
旧的模式是:启动任务,agent 闲着等你回来,你回来,问一下状态。新的模式是:启动任务,关掉聊天窗口,去做别的事,事情干完 agent 主动在你用的那个平台上 ping 你。
如果你会跑任何耗时超过几分钟的任务,这一条就足够改变你和 Hermes 的协作方式。也是这次发版里最大的那个体验提升。
/model 中途换模型
现在你可以在对话进行中换 provider 和 model,不用退出会话。在任何聊天里敲 /model——CLI、Telegram、Discord 都行——选一个新模型,对话带着原来的上下文继续,只是换了个"大脑"。
这给了你真正可用的成本与智能之间的策略:便宜快速的模型处理套路活,遇到难题切到 Claude Sonnet 或者 GPT-4 解决,解完再切回去。v0.8.0 之前换模型意味着重开会话、丢掉上下文,现在一条命令就行。
自动 fallback 也加上了——选的模型报错,Hermes 会自动降级到下一个,不会直接挂掉。
按空闲超时
这种改动,你不会注意到,直到某天发现自己的长任务再也不会跑到一半被误杀了。
Hermes 以前按挂钟时间算超时——跑得太久就被砍。这对卡住的对话合理,但对任何真正在干活的任务就是灾难。v0.8.0 改成按活动状态算:agent 空闲就超时,agent 在干活就一直跑下去。
对任何跑训练、跑大编译、跑多步工作流的人来说,这个改动直接消除了一整类让人崩溃的问题。
消息平台原生审批按钮
Slack、Telegram 和飞书现在在需要审批的时候会直接渲染按钮,不再需要你打 /approve 或者 /deny。在手机上点一下按钮,审批通过,会话继续。
听起来是小事,代码层面可能也确实是。但对任何把 Hermes 当 gateway bot、主要在手机上用的人来说,这是个明显的体验跃升。触屏打命令本身就是一种税,按钮把这个税免了。
审批前后的 thread context 也会保留,所以多步骤工作流里审批一下不会丢掉现场。
hermes logs 集中日志
以前 debug 要翻好几个地方才能搞清楚 agent 到底在干什么。v0.8.0 把所有日志统一到了 ~/.hermes/logs/——分成 agent.log 和 errors.log 两份——还加了一条顶层命令来 tail:
hermes logs
再配合加强的 hermes doctor 诊断,你终于能在不满世界 grep 的前提下看清 runtime 内部发生了什么。
MCP 上了生产级:OAuth 2.1 + 恶意包扫描
MCP 这次有两项严肃的升级:
OAuth 2.1 带 PKCE。 Hermes 连接 MCP 服务器时现在支持标准的 OAuth 流程。这对把 MCP 接入企业环境、服务器背后有真正鉴权的场景很关键。
OSV 恶意包扫描。 装 MCP 服务器包时,Hermes 会自动拿它去 OSV 漏洞库扫一遍。包里有已知漏洞的话,在它跑到你机器上之前你就会收到警告。考虑到 MCP 服务器是作为子进程跑的、有你给它的所有权限,这个默认行为是对的。
这两个改动加起来,MCP 从"能用但得小心"变成了"可以放心指向一个生产集成"。
大输出 100 倍提速
修了一个 O(n²) 的正则回溯 bug,涉及大输出的操作快了大概一百倍。如果你遇到过 Hermes 卡在处理一个超大日志文件、几兆的 diff 或者长任务的输出上,这个补丁就是为你打的。
你不会在 changelog 里看到"现在变快了"这种条目,但你第一次往里扔一份真实世界的大文件时就会感觉到。
小一点但值得知道的改动
一些没有单独成段但值得留意的东西:
- Google AI Studio(Gemini)作为原生 provider。 Gemini 用户不用再绕 OpenRouter,上下文长度通过 models.dev 自动检测。
- Matrix 升到 Tier 1。 功能和 Telegram、Discord 对齐——表情反应、已读回执、端到端加密媒体。在意隐私的用户值得切过去看看。
- Nous Portal 送了个免费视觉模型。 Xiaomi MiMo v2 Pro,做辅助压缩和视觉任务不花钱。
- Skill hub 新增一批。 p5js 创意编程、manim 数学动画、llm-wiki(Karpathy 的 LLM 知识库)、research-paper-writing,还有几个其他的。
- 远程
execute_code。 代码执行工具现在能跑在 Docker、SSH 和 Modal 后端上,不只是本地。 - Supermemory provider。 一个新的 memory 后端,支持多容器,想玩的可以接一下。
"自己修自己"的彩蛋
有一个细节值得单独提一下,因为它很能体现 Hermes 想成为的东西。
Hermes 自动跑了一轮自己的 tool-calling 基准测试,识别出 GPT 和 Codex 模型在处理 tool calls 时的五种失败模式,然后自己打了补丁。Release notes 里叫它 "self-optimized tool-use guidance"。说人话就是:agent 看了看自己的弱点,自己修好了。
这是一句挺怪的描述。也是那种能撑起 "self-improving AI agent" 标语的改动。很多项目都会这么说,但 v0.8.0 真的做到了。
如果你要升级
没有什么特别需要当心的。跑:
hermes update
更新器会自动迁移配置。升级完如果哪里不对劲,hermes doctor 会告诉你要检查什么。Bundled skills 现在会在升级时自动同步,不用你再重装一遍。
接下来去哪
如果你没用过 Hermes,学习路径是从零到能用的最快方式。想看权威参考,官方文档全都在那里。想看完整的 changelog 和每一个 PR,GitHub 上的 release 页面都列了。
v0.8.0 不是一个噱头型的发版,但是一个实打实的发版。上面这七项大改动,是你在升级之后第一周就会真切感觉到的。