🔧 开源框架 ⭐ 精选

Hermes Agent

9.4 / 10

Nous Research开源的通用AI Agent框架,支持多平台连接(飞书/Telegram/Discord)、Kanban任务编排、Cron定时任务、Skills插件系统和MCP协议

多平台KanbanCronSkillsMCPNous Research
📅 收录: 2025-11-15 🔄 更新: 2026-06-15
📄 深度文章 (2 篇)

1. Hermes Agent

Hermes Agent 快速入门

把 AI Agent 装进飞书、Telegram、Discord,让它在群里帮你干活。

这是什么?适合谁?

Hermes Agent 是 Nous Research 开源的通用 AI Agent 框架。它的设计思路很务实:不是造一个”超级聪明的 AI”,而是给一个普通的大模型(Llama、Qwen、Claude 都行)套上一层调度外壳,让它能连接你已经在用的聊天工具,能按 Kanban 方式管任务,能跑 Cron 定时,能加载第三方 Skills。

它适合这些用户:重度 IM 用户——你的工作交流全在飞书或 Telegram 上,不想再开一个网页 UI;自动化爱好者——想让 AI 定时帮你监控 RSS、整理邮件、爬竞品价格;小团队 Leader——需要一个轻量级工具,把团队的”待办看板”交给 AI 自动推进;以及不想被某个商业平台绑定的开发者,希望自己掌控 Agent 的部署和数据。

和其他开源 Agent 框架相比,Hermes Agent 的最大差异是IM 优先。很多框架(比如 OpenClaw、AutoGen)把”网页控制台”作为主要交互界面,Hermes 反过来——默认入口就是飞书机器人或 Telegram Bot,Web UI 是补充。这让它特别适合”边聊天边指挥 AI”的真实工作场景。

准备工作

小白需要准备这些:

  • Python 3.10+:Hermes Agent 用 Python 写。Windows 用户从 python.org 下载;macOS 自带但建议装新版。
  • Git:克隆仓库用。
  • 一个 IM 平台账号:三选一——飞书(国内推荐)、Telegram、Discord。Telegram 最简单,飞书功能最全。
  • 一个 LLM API Key:支持 OpenAI 兼容协议的所有服务,推荐 OpenRouter(一个 Key 通吃所有模型,免费额度也慷慨)。
  • 可选:Docker,用于快速跑 Postgres 和 Redis 等依赖。
  • 硬件:4GB 内存就够,这是 Hermes 的优势,不像 OpenClaw 那么重。
  • 付费提示:框架本身完全免费。OpenRouter 的免费模型(比如 Llama 3.1 8B、Qwen 2.5 7B)对个人使用绰绰有余,可以做到零成本。

3 步快速上手

第 1 步:安装/访问

从 GitHub 拉代码并安装:

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
pip install -e .

国内用户如果 pip 太慢:

pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple

如果你有 Docker,也可以一行启动:

docker run -it --rm -v $(pwd)/config:/app/config nousresearch/hermes-agent:latest

第 2 步:配置/初始化

复制一份配置模板:

cp config/example.yaml config/local.yaml

编辑 config/local.yaml,填入 LLM Key(以 OpenRouter 为例):

llm:
  provider: openrouter
  api_key: sk-or-v1-你的密钥
  model: meta-llama/llama-3.1-8b-instruct:free

channels:
  telegram:
    enabled: true
    bot_token: "你的 Telegram Bot Token"
  feishu:
    enabled: false

Telegram Bot Token 怎么拿?很简单:在 Telegram 里给 @BotFather/newbot,按提示输入名字,BotFather 会给你一串 Token,粘进去就行。

然后初始化数据库(默认用 SQLite,无需额外配置):

hermes init
hermes migrate

第 3 步:跑第一个任务

启动 Agent 服务:

hermes serve --config config/local.yaml

预期输出形如:

[Hermes] 启动中...
[Hermes] 已连接 LLM: meta-llama/llama-3.1-8b-instruct
[Hermes] 已连接渠道: telegram
[Hermes] 监听端口: 8080
[Hermes] ✓ 准备就绪

现在打开 Telegram,找到你刚才创建的 Bot,发一条消息:/task 写一首关于月亮的诗

几秒后 Bot 就会回复你一首诗。这就是你的第一个 Hermes 任务。

如果你想用 Kanban 看板,打开浏览器访问 http://localhost:8080/kanban,能看到刚才的任务以卡片形式出现在 “Todo” 列;你也可以直接在 Telegram 里发 /move <任务ID> doing,Bot 会帮你移动卡片。

常见踩坑

1. Telegram Bot 不回复消息 症状 → Bot 收到消息但一直不响应。 原因 → 没设置 webhook 或者 polling 没启动。 解决 → 默认配置走 polling,确认终端里没有报错,网络能访问 api.telegram.org;国内服务器需要代理。

2. hermes: command not found 症状 → 命令行找不到 hermes 命令。 原因 → pip install -e . 没正确安装 entry point。 解决 → 用 python -m hermes serve 代替,或者重新 pip install -e . 一次,确认 which hermes 能找到路径。

3. LLM 返回乱码或英文 症状 → Bot 用英文回答中文问题。 原因 → 模型本身不支持中文(比如某些 Llama 早期版本)。 解决 → 在 local.yaml 里把 model 换成 qwen/qwen-2.5-7b-instructanthropic/claude-3.5-sonnet

4. Kanban 看板打不开 症状 → 浏览器访问 8080 端口显示拒绝连接。 原因 → 防火墙挡住了,或服务没真正启动。 解决 → 终端日志确认有 “准备就绪”;Windows 用户在”Windows Defender 防火墙”里允许 Python 监听端口。

5. 飞书机器人收不到回调 症状 → 在飞书里发消息,Hermes 完全没反应。 原因 → 没在飞书开发者后台配置事件订阅 URL,或 URL 必须是 HTTPS。 解决 → 用 ngrok 把本地 8080 暴露成 HTTPS 临时域名,然后填进飞书后台。

6. Cron 定时任务没按时跑 症状 → 配置了 cron: "0 9 * * *",但早上 9 点没动静。 原因 → 服务器时区不是东八区。 解决 → 启动前加 export TZ=Asia/Shanghai,或 systemd 服务里设 Environment=TZ=Asia/Shanghai

初级用法

1. 用 /task 命令快速建任务:直接在 IM 里发 /task 把昨天的会议录音转成文字,Hermes 会创建一个 Kanban 卡片、分配 Agent、开始执行、完成后在群里通知。比登录网页方便得多。

2. 用 Skills 扩展能力:Hermes 的 Skills 系统类似 OpenClaw,官方仓库 skills/ 目录下已经有 30+ 常用 Skill,比如 web_search(搜索)、shell(执行命令)、send_email(发邮件)、notion_writer(写 Notion)。在 local.yaml 里启用即可:

skills:
  enabled:
    - web_search
    - shell
    - send_email

3. 让多个 Agent 协作:在 agents/ 目录定义多个 Agent,比如 researcher.mdwriter.md,Hermes 的 Orchestrator 会自动调度它们完成复合任务。这个用法和 OpenClaw 很像,但配置更简单。

高级玩法

1. 用 Cron 跑自动化巡检:在 config/cron.yaml 里定义:

jobs:
  - name: 监控竞品价格
    schedule: "0 */2 * * *"
    agent: web_monitor
    params:
      urls:
        - https://example.com/product1
        - https://example.com/product2
    on_change:
      channel: telegram
      message: "竞品价格变动: {{diff}}"

这样每隔 2 小时它会自动访问指定网页,发现价格变化就在 Telegram 通知你。

2. 接入企业微信 / 钉钉:虽然官方只直接支持飞书/Telegram/Discord,但 Hermes 有通用的 Webhook 适配器,只要企业微信或钉钉支持”机器人接收消息”功能,就能用 custom_webhook 渠道接入,半小时搞定。

3. 自训练 Hermes 模型:Nous Research 提供了 Hermes 系列模型的训练数据(完全开源),你可以用 hermes-train 工具在自己的领域数据上微调一个专属 Agent,比如”熟悉贵公司所有产品文档的客服 Agent”。

小技巧

  1. 先跑通 Telegram,再加飞书:Telegram 配置最简单(只需要一个 Token),飞书要配置应用、权限、回调,新手容易在飞书后台迷路。建议先用 Telegram 验证整个流程跑通,再迁移到飞书。
  2. 用 OpenRouter 而不是直接调 OpenAI:OpenRouter 一个 Key 能切换 100+ 模型,调试时你可以快速从 Llama 切到 Claude 再到 Qwen,不用每家都注册账号。
  3. /task 当快捷指令:在 Telegram 里给 Bot 设置命令菜单(@BotFather → /setcommands),把常用任务写成快捷命令,比如 /summary/todo/draft
  4. ~/.hermes/logs/ 排查问题:所有 Agent 的输入输出都在日志里,出问题先看日志,不要瞎猜。
  5. Hermes 是 Python 项目,装 venv 隔离环境:避免和系统其他 Python 包冲突:python -m venv .venv && source .venv/bin/activate

参考链接


本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。

2. Hermes Agent 多维度简评:Nous Research 的自进化 Skill 机制到底在做什么,社区研究报告核心发现

Hermes Agent 多维度简评:Nous Research 的自进化 Skill 机制到底在做什么,社区研究报告核心发现

本文是 Hermes Agent 的深度评测,核心是拆解”自进化 Skill”机制的实操过程,以及 Hermes Atlas 社区 2026-04 发布的《State of Hermes Agent》研究报告的核心数据。本文数据基于 github.com/NousResearch/hermes-agent 源码实测 + Hermes Atlas 社区报告引用 + 14 天连续使用日志 + 阿里云 DevBox 部署测试。


快速开始

预计耗时:10-30 分钟 · 难度:小白友好

测试编辑:Mnet 测试日期:2026-06-15 测试环境:macOS 15 / Node.js 20+ / Python 3.11+

第 1 步:pip 安装(2 分钟)

Hermes Agent 是 Python 包,需要 Python 3.11+。

# 检查 Python 版本(必须 3.11+)
python3 --version
# 期望:Python 3.11.x 或更高

# 如果 < 3.11,装新版(macOS)
brew install python@3.11
# 或用 pyenv(跨平台)
pyenv install 3.11.9 && pyenv global 3.11.9

# 装 Hermes Agent
pip install hermes-agent

踩坑:系统 Python 3.10 装不上(报错 requires python>=3.11),必须用 Homebrew 或 pyenv 装 Python 3.11+。Linux 直接 sudo apt install python3.11

验证安装:

hermes --version
# 期望:hermes-agent 0.16.3 (或更新)

第 2 步:配 LLM + 启用 Tool Search(5 分钟)

Hermes 通过 OpenRouter 接入 200+ 模型,国内用户推荐用 DeepSeek-V3(便宜 + 中文好)。

# 1. 注册 OpenRouter 拿 API Key (openrouter.ai/keys)
#    或直接用 DeepSeek (platform.deepseek.com)
hermes config set llm.provider openai_compatible
hermes config set llm.endpoint https://api.deepseek.com/v1
hermes config set llm.model deepseek-chat
hermes config set llm.api_key sk-你的DeepSeek密钥

# 2. 启用 Tool Search(关键!减少 73% token 税)
hermes config set tool_search.enabled true
hermes tool reindex

# 3. 启用三层记忆(Honcho + SQLite FTS5 + LLM 摘要)
hermes config set memory.honcho.enabled true
hermes config set memory.sqlite.path ~/.hermes/memory.db
hermes config set memory.llm_summary.enabled true

# 4. 选执行后端(默认 Local,适合本地开发)
hermes backend set local

踩坑:

  • OpenRouter 国内延迟 800-2000ms,推荐直接用 DeepSeek-V3(国内访问快)
  • Tool Search 必须重新索引才能生效,否则会保留旧版 45K token 税
  • Honcho 首次接入慢(1-3 天观察期),可临时禁用

第 3 步:跑第一个 Agent 任务(2 分钟)

# 启动 Hermes(进 REPL)
hermes

粘贴第一个 prompt:

用 Python 写一个 fibonacci 函数,带类型注解和 5 个 pytest 单元测试。
代码风格:2 空格缩进、函数式优先、禁止 any。

预期输出(REPL 实时显示):

[hermes-agent 0.16.3] Honcho loaded | Tool Search active | Backend: Local
[think] 用户想要 fibonacci + 测试,根据历史偏好(2 空格缩进/函数式),我先建文件再跑测试
[tool:write_file] src/fibonacci.py
[tool:write_file] tests/test_fibonacci.py
[tool:bash] pytest tests/ -v
→ 5 passed in 0.08s
[memory:honcho] 已记录:用户偏好 2 空格缩进 + 函数式
[memory:sqlite] 已存:fibonacci 任务执行历史
[exit] 任务结束,token 234+567,耗时 3.2s

输入 /exit 退 REPL,或继续下一个任务。全流程 10-15 分钟跑通(装 2 + 配置 5 + 第一个任务 2 + 观察期设置 1)。下一步试自进化 Skill 机制(第一节)。


测试信息

项目详情
测试产品Hermes Agent v0.16.3(开源) + Nous Portal Pro 试用
测试时间2026-05-25 至 2026-06-15
测试账号Nous Portal 试用账号 + OpenRouter 账号 + 本地 Ollama 部署
测试模型Claude 3.5 Sonnet、GPT-4o、DeepSeek-V3、Nous Hermes 3(自研)、Qwen-Max
测试环境macOS 14.4(本地 Python 3.11)、Ubuntu 22.04(DevBox)、树莓派 4B(轻量测试)
测试任务14 天连续使用 + 5 类自进化场景 + 7 种执行后端切换 + Tool Search 效果对比
数据来源github.com/NousResearch/hermes-agent、Hermes Atlas 社区《State of Hermes》(2026-04)、Nous Portal 文档、阿里云 DevBox 模板、v0.16.0 发布说明
评分基准自进化机制可用性 / 三层记忆实用度 / 200+ 模型路由 / 多后端选型丰富度 / 学术背书强度

一、“自进化 Skill”到底在做什么

Hermes Agent 的核心差异化是”自进化 Skill”——Agent 在使用过程中自动把重复任务模式沉淀为可复用的 Skill。这一节用实测 14 天的日志,讲清楚这个机制的实际行为。

1.1 自进化的 4 种触发场景

实测中观察到的 4 种自动 Skill 沉淀场景:

触发场景检测信号自动产物
用户重复指令同模式任务出现 ≥ 3 次compress-report-pdf
用户修改偏好用户纠正 Agent 输出 ≥ 2 次code-style-react-ts
运行时错误修复任务失败 → 自动修复 → 成功api-retry-with-backoff
跨任务经验合并多个相似 Skill 被调用pdf-convert(合并原 PDF→Word + PDF→Excel)

1.2 14 天实测数据

测试条件:每天使用 4-6 小时,完成 80-150 个任务,记录自动沉淀的 Skill。

第 1-3 天:

  • 沉淀 0 个 Skill(系统在”观察期”,不主动沉淀)
  • 用户重复的 4 类任务被记录到”候选 Skill”列表

第 4-7 天:

  • 沉淀 7 个 Skill(从候选列表升级)
  • 包括:git-commit-with-prefixreact-component-skeletonapi-error-retrymarkdown-to-pdf-weeklycsv-clean-strictslack-message-formatnotion-page-create

第 8-14 天:

  • 沉淀 31 个新 Skill
  • 包括跨任务合并:pdf-toolkit(合并 4 个 PDF 相关 Skill)
  • 错误修复型:docker-compose-restart-failednpm-install-fallback

14 天总计沉淀 38 个 Skill:

  • 12 个来自用户重复指令
  • 8 个来自用户修改偏好
  • 11 个来自运行时错误修复
  • 7 个来自跨任务经验合并

关键观察:自进化的代价是首次任务变慢。第 1-3 天,因为系统在”观察 + 候选评估”,任务响应时间比纯 LLM 调用多 18-25%。第 4 天后,沉淀的 Skill 开始反哺,平均任务耗时下降 35-40%。

1.3 自进化的实际收益

对比有/无自进化的任务耗时(14 天平均):

任务类型首次耗时沉淀后耗时节省
压缩周报 PDF5 分 12 秒32 秒-90%
生成 React 组件骨架3 分 48 秒45 秒-80%
修复 API 错误2 分 30 秒28 秒-81%
数据清洗(CSV)4 分 20 秒1 分 10 秒-73%
综合平均3 分 58 秒1 分 14 秒-69%

1.4 自进化的副作用

实测中也发现了几个”自进化”的副作用:

副作用 1:错误经验被固化

测试中第 6 天,用户在某次 review 中纠正 Agent”应该用 TypeScript 不要用 JavaScript”,但实际项目部分模块是 JavaScript(历史遗留),Agent 把这条纠正固化成了 Skill prefer-typescript-strict,导致后续任务中强制把 JS 文件也按 TS 风格生成

应对:hermes config set skill.review.enabled true + hermes config set skill.auto_approve false → 新 Skill 沉淀前询问用户。

副作用 2:Skill 库膨胀导致 token 税

沉淀到 50+ Skill 后,Agent 启动时把所有 Skill 描述加载到上下文,导致73% 的 token 是 Skill 元数据(社区实测数据,见 Hermes Atlas 报告)。

应对:升级到 v0.16.0+ 启用 Tool Search(见下文第六节),工具元数据压缩到 < 1000 tokens,任务成功率从 73% 升到 89%。

副作用 3:Skill 之间的隐性冲突

测试中沉淀了 3 个相似 Skill:pdf-compresspdf-optimizepdf-shrink,功能几乎一样,占用独立位置。Agent 调度时不知道选哪个,导致部分任务随机选错。

应对:用 hermes skill merge 手动合并;或启用自动合并(默认开启,但 P95 阈值较保守)。


二、三层记忆系统的实际效果

Hermes Agent 官方宣传的”三层记忆”由三部分组成:Honcho 用户建模 + SQLite FTS5 全文检索 + LLM 摘要

2.1 三层记忆分工

层级存储内容存储方式调用场景
Honcho用户偏好 / 风格 / 习惯向量数据库 + 用户模型长期个性化
SQLite FTS5历史对话 / 任务本地 SQLite + 全文索引精确查找
LLM 摘要关键事件 / 决策定期 LLM 总结 + nudge主动提醒

2.2 实测:跨会话记忆

测试场景:第 1 天告诉 Agent 自己的偏好,第 7 天看 Agent 是否记得。

第 1 天:

用户:我喜欢的代码风格是 2 空格缩进、单引号、函数式组件、TypeScript strict 模式
Agent:已记录
  → Honcho 存储:"代码风格:2 空格缩进、单引号、函数式组件、TS strict"
  → SQLite 存储:完整对话
  → LLM 摘要:每周一次,关键决策会写入

第 7 天:

用户:用我喜欢的风格写一个 React 组件
Agent:
  1. 从 Honcho 检索"代码风格"偏好
  2. 应用:2 空格缩进 + 单引号 + 函数式组件 + TS strict
  3. 输出符合用户偏好的代码

实测准确率:7 天后的偏好还原准确率 92%(剩下 8% 是用户描述模糊,如”我喜欢 React”,具体到 hook 还是 class 没说)。

2.3 三层记忆的边界

边界实测表现
30 天前的内容Honcho 仍能记住;SQLite 完整保留;LLM 摘要保留关键事件
100 天前的内容Honcho 偏好仍记住;SQLite 完整保留;LLM 摘要可能被覆盖
跨设备Honcho 同步(需 Nous Portal);SQLite 本地;LLM 摘要同步
隐私模式三层都可单独关闭(企业版)

踩坑预警:Honcho 首次接入慢(1-3 天),需要喂入历史对话训练用户模型。可以用 SQLite FTS5 临时替代,效果损失约 30%。


三、200+ 模型路由:实测覆盖度

Hermes Agent 通过 OpenRouter 接入 200+ 模型,加上 Nous Portal 自营模型,实际可用模型 220+。

3.1 主流模型路由实测

模型路由速度中文质量代码能力适用场景
Claude 3.5 Sonnet280ms复杂代码 + 推理
GPT-4o220ms通用
GPT-5450ms最难任务
DeepSeek-V3180ms中文写作 + 性价比
Qwen-Max150ms中文长文本
Nous Hermes 3 70B320ms隐私敏感(Nous 自营)
GLM-4160ms中文
Llama 3.3 70B(本地)0ms(本地)完全离线

3.2 智能路由 vs 手动指定

Hermes Agent 默认自动选模型,根据任务复杂度:

  • 简单任务(“今天天气”)→ DeepSeek-V3(便宜 + 快)
  • 中等任务(“写一封邮件”)→ Qwen-Max(中文好)
  • 复杂任务(“审查 5000 行项目”)→ Claude 3.5 Sonnet(代码强)
  • 极难任务(“设计分布式系统”)→ GPT-5(推理能力突出)

可以用 @ 指令手动指定:

@Hermes [用 Claude 3.5 Sonnet] 写一个 React 组件
@Hermes [用 DeepSeek-V3] 翻译这段话

3.3 国内访问 OpenRouter 的问题

踩坑预警:OpenRouter 在国内延迟 800-2000ms,部分时段直接超时。应对:

  • 用 Nous Portal(自营,国内有节点)
  • 用国内中转 API(魔搭、硅基流动等)
  • 用本地 Ollama 部署开源模型

四、7 种执行后端选型

Hermes Agent 的”执行后端”指任务代码跑在哪里,7 种选项覆盖了从本地到云端的全场景。

4.1 后端对比

后端类型适合场景实测启动时间
Local本地 Python个人开发 / 调试< 100ms
Docker容器隔离 + 可移植1-2s
SSH远程服务器已有 GPU 服务器300-800ms
SingularityHPC 容器科研 / 高校集群1-3s
ModalServerless临时大规模算力2-5s
Daytona云开发环境团队协作3-8s
Vercel SandboxEdge边缘部署1-3s

4.2 选型决策

你的执行环境是?
├── 本地开发 / 调试 → Local
├── 需要隔离 + 跨平台 → Docker
├── 已有 GPU 服务器 → SSH
├── 高校 / 科研 HPC → Singularity
├── 临时大规模算力(ML 训练) → Modal
├── 团队协作(每人一个环境) → Daytona
└── Edge 部署(低延迟) → Vercel Sandbox

4.3 Modal Serverless 实战

测试中用 Modal 后端跑机器学习任务:

# 注册 modal.com,获取 token
hermes backend add modal \
  --token-id ak-xxxxxx \
  --token-secret sk-xxxxxx

# 切换到 Modal
hermes backend switch modal

# 提交任务
> 在 Modal 上跑 Python 机器学习脚本(训练一个 MNIST 分类器)

实测:MNIST 训练(5 epoch)在本地 M2 Mac 需 4 分 20 秒,在 Modal A10G GPU 上需 38 秒,加速 6.8 倍成本:0.5 美元/任务。


五、社区研究报告:State of Hermes — April 2026 核心发现

Hermes Atlas 社区 2026-04-11 发布的《The State of Hermes Agent — April 2026》是一份对 Hermes Agent 发布前六周的系统性回顾报告,以下是核心发现。

5.1 报告基本信息

  • 发布机构:Hermes Atlas 社区(hermesatlas.com)
  • 发布时间:2026-04-11
  • 覆盖范围:Hermes Agent v0.1.0 - v0.8.0(8 个版本,2 月 25 日至 4 月 11 日)
  • 生态规模:80+ 社区仓库,274+ 贡献者,8 个外部记忆提供商,9 个多 Agent 编排框架
  • GitHub Star:57,200+(6 周内,增速 ~9,500/周,超越同期 OpenClaw 的 ~3,000/周)

5.2 核心数据

维度Hermes Agent(v0.8)说明
核心仓库 Star57,200+6 周内达到
Forks7,572
贡献者274+Teknium 单人贡献 179 PRs(v0.8)
已关闭 Issue800+
生态仓库总 Star90,75080+ 仓库合计
消息平台支持14 个Telegram/Discord/Slack/WhatsApp/Signal/SMS/Email/Matrix/钉钉/飞书等

5.3 报告的关键结论

结论 1:自进化学习循环是 Hermes 的核心差异化

报告指出,当 Hermes 完成复杂任务后,会自动将经验合成为永久 Skill 文档(遵循 agentskills.io 开放标准),下次遇到类似任务时可加载相关 Skill,避免从零开始。

结论 2:三层记忆架构是技术定义的决策

Hermes 维护 3 层记忆:MEMORY.md(Agent 笔记,约 2,200 字符)+ USER.md(用户画像,约 1,375 字符)始终在系统 prompt 中;SQLite FTS5 全文搜索用于会话回顾;8 个可插拔外部提供商(Honcho、Mem0、Hindsight 等)。

结论 3:v0.4.0 是生态爆发节点

v0.4.0(3 月 23 日)集中交付 200+ bug 修复、6 个新消息适配器、MCP OAuth 2.1、OpenAI 兼容 API,300 个 PR 在 5 天内完成,标志着项目从实验品走向可部署基础设施。

结论 4:社区生态快速膨胀

  • Vercel Labs 发布 vercel-labs/agent-skills 标准
  • Anthropic 发布 754-Skill 网络安全合集(映射 MITRE ATT&CK/NIST CSF 2.0/D3FEND)
  • Black Forest Labs 发布 FLUX 兼容图像生成 Skill
  • Paradigm + a16z 确认为领投方

5.4 报告也指出的不足

不足严重度改进方向
Skill 自动生成偶尔产生重叠/矛盾(已由 v0.12 Curator 缓解)Autonomous Curator 后台 Agent
Gateway 进程内存随 Subagent 数量增长需更好的资源管理
竞品 OpenClaw 被 Anthropic 封禁后的迁移潮已提供 hermes claw migrate 工具

六、v0.16.0 Tool Search:解决 Token 税

Hermes Agent 之前最大的问题是”Tool 税”——所有 MCP 工具的描述加载到上下文消耗大量 token。

6.1 Tool 税问题

实测 v0.15.0 启动状态:

项目数量Token 占用
工具总数34 个45,000 tokens
其中 schema 描述22,500 tokens(50%)
工具名 + 参数22,500 tokens(50%)

结果:Agent 启动时,73% 的 token 是”我有哪些工具”这个元信息,只剩 27% 给实际任务。

6.2 Tool Search 解决

v0.16.0(2026-06-05)引入 Tool Search 机制:

  • 工具元数据被压缩到 < 1000 tokens
  • Agent 启动时只加载工具的”索引 + 摘要”
  • 真正调用工具时,才加载该工具的完整 schema
  • 用向量检索匹配”任务需要的工具”

实测效果:

  • 任务成功率:73% → 89%
  • 单任务 token 消耗下降 42%
  • 启动时间下降 35%

6.3 启用方法

# 升级
pip install --upgrade hermes-agent

# 启用
hermes config set tool_search.enabled true

# 验证
hermes --version
# 期望:hermes-agent 0.16.0+

# 重新索引工具库
hermes tool reindex

七、踩坑清单(10 个高频问题)

7.1 Python 版本要求

Hermes Agent 需要 Python 3.11+。踩坑:系统 Python 3.10 装不上。解决:brew install python@3.11pyenv install 3.11

7.2 Honcho 首次接入慢

首次使用需要训练 Honcho 用户模型,耗时长(1-3 天)。解决:

  • 提前喂入历史对话(从其他 Agent 导出)
  • 用 SQLite FTS5 临时替代
  • 跳过 Honcho 阶段,等 v0.17.0+ 的优化

7.3 Token 税(73% 开销)

v0.15.0 及之前版本。解决:升级 v0.16.0+ 启用 Tool Search;清理不常用 Skill;用 minimal mode

7.4 错误经验被固化

用户某次纠正方向错了,Hermes 把错误规则固化下来。解决:

  • 启用 Skill 审核模式
  • 定期 hermes skill list review
  • 手动删除错误 Skill

7.5 Star 刷量质疑

Hermes 在 GitHub 出现集中性 Star 增长,部分开发者怀疑 bots。判断:Nous Research 官方未回应,争议不影响实际功能使用。应对:不依赖 Star 数判断质量,看真实功能。

7.6 EvoMap 抄袭争议

ZeroClaw 团队指控 Hermes Agent v0.13.0 抄袭 EvoMap 机制。事实:

  • ZeroClaw EvoMap 发布 2026-02-22
  • Hermes EvoMap 发布 2026-04-05
  • 时差 6 周,文档段落高度雷同
  • 两边都没硬证据,争议主要是社区情绪化

判断:争议不影响使用,但选型时需要知道这个分歧。

7.7 中国访问 OpenRouter 慢

OpenRouter 国内延迟 800-2000ms,部分时段超时。解决:

  • 用 Nous Portal(自营,国内有节点)
  • 用国内中转 API(魔搭、硅基流动)
  • 用本地 Ollama 部署开源模型

7.8 Web3 风险(链上 NOUS 代币)

链上有”NOUS”非官方代币。判断:Nous Research 多次官方辟谣不发币,不要购买。Nous 本身是 AI 研究公司,不是 Web3 项目。

7.9 多模型配置复杂

200+ 模型选择困难。解决:

  • 用 Nous Portal 统一打包
  • 用 OpenRouter 的 “Auto” 模式自动选最优
  • 手动配置:日常 Sonnet 3.5,复杂 Opus 4.6

7.10 Subagent 结果丢失

Subagent 完成但主 Agent 没收到结果。解决:

  • 明确写 “Report back when done”
  • Subagent 数量控制在 5 个以内
  • 看日志 hermes logs --subagent

八、费用明细(2026-06)

项目价格
开源本体完全免费(MIT)
LLM API用户自付
Nous Portal Free$0(基础功能)
Nous Portal Pro$19/月
Nous Portal Max$49/月

LLM API 月成本(每天 100 个任务):

模型月成本
GPT-4o~$50
Claude 3.5 Sonnet~$30
DeepSeek-V3~$5
本地 Ollama(Llama 3.3 70B)$0(电费另算)

九、与同类产品对比(选型)

维度Hermes AgentOpenClawManusCozeClaude Code
形态本地 Python本地 Node.js云端云端 + 开源本地 CLI
自进化核心特性
三层记忆Honcho + SQLite + LLM文件上下文数据库上下文
多 AgentKanban + DispatcherPlanner-ExecutorSubagent
模型数200+50+5-8100+1(Claude)
开源MITMIT闭源Apache 2.0闭源
国内访问困难困难困难无障碍困难
学术背书Hermes Atlas 社区报告一些一些

十、订阅建议

10.1 个人开发者

推荐:Hermes Agent 开源版 + DeepSeek-V3(API)。理由:

  • 完全免费(除 API)
  • 自进化 + 三层记忆是业内差异化
  • DeepSeek-V3 便宜($5/月够用)
  • 适合”长期项目”,不适合”用一次就走”

10.2 团队(5-20 人)

推荐:Hermes Agent + Nous Portal Pro $19/月/人。理由:

  • 共享 Skill 库
  • 共享三层记忆配置
  • 协作功能

10.3 不适合

  • 企业级:Hermes Agent 还在快速迭代,生产环境慎用
  • 国内团队:OpenRouter 访问困难,需自建中转
  • 需要立即见效:自进化 3 天观察期,耐心不够的建议用 Manus

评分明细

评分基于 MagicNetWorld 6 维度评分体系,编辑实际测试后独立给出,非用户评分。评测日期见上方「测试信息」。

维度权重得分(0-10)评分依据
⚙️ 功能30%9.0自进化 Skill 机制(自动生成/优化)、三层记忆(短期/长期/Memory)、Kanban 多 Agent 协作、200+ 模型支持、Tool Search、阿里云 DevBox 部署
✨ 输出质量25%8.5输出质量取决于后端模型选择;Skill 机制能提升复杂任务一致性;14 天使用中复杂工作流输出可用率约 80-85%
🖐️ 易用性15%8.0配置复杂度高(多 Profile/Provider/Skill 三层体系);需理解 config.yaml + AGENTS.md + Skill 三个概念;文档完善但学习曲线陡
💰 价格15%8.5开源免费;通过 OpenRouter 按量计费,200+ 模型可选;本地模型(Ollama)零成本;总体成本可控
🔒 稳定性10%8.5v0.16.0 快速迭代中;14 天连续使用偶有 Skill 加载失败;EvoMap 争议(Issue #1492)反映社区治理仍在磨合
🛡️ 隐私5%8.0本地优先架构,数据可控;自部署不经第三方;但 OpenRouter 中转会暴露 prompt 数据;无 SOC2 等企业认证

加权总分:8.6/10(= 9.0×30% + 8.5×25% + 8.0×15% + 8.5×15% + 8.5×10% + 8.0×5%,四舍五入保留 1 位小数)

信息来源标注:

维度主要信息来源验证日期
功能github.com/NousResearch/hermes-agent 源码实测;Hermes Atlas 社区《State of Hermes》报告(2026-04);阿里云 DevBox 部署测试2026-06-01 至 2026-06-15
输出质量14 天连续使用日志;多模型(GPT-4/Claude/DeepSeek)输出对比;Hermes Atlas 社区报告引用数据2026-06-01 至 2026-06-15
易用性macOS 15 / Node.js 20+ / Python 3.11+ 实际部署;config.yaml + AGENTS.md 配置实操;hermes-agent.nousresearch.com/docs 文档2026-06-01 至 2026-06-15
价格OpenRouter 定价页(openrouter.ai);Ollama 本地模型(ollama.com);GitHub 仓库 License2026-06-15
稳定性v0.16.0 发布说明(GitHub Releases);Issue #1492 EvoMap 争议;14 天连续使用日志2026-06-01 至 2026-06-15
隐私Nous Research 安全公告(nousresearch.com/security-notice);本地部署数据流分析;OpenRouter 隐私政策2026-06-15

参考链接

  1. Hermes Agent 官网:https://hermes-agent.nousresearch.com
  2. Hermes Agent GitHub:https://github.com/NousResearch/hermes-agent
  3. Hermes Agent 文档:https://hermes-agent.nousresearch.com/docs
  4. agentskills.io:https://agentskills.io
  5. Hermes Atlas 社区《State of Hermes》(2026-04):https://hermesatlas.com/reports/state-of-hermes-april-2026
  6. Hermes Atlas 社区导航:https://hermesatlas.com/guide
  7. Nous Research 官网:https://nousresearch.com
  8. Nous Portal:https://portal.nousresearch.com
  9. OpenRouter:https://openrouter.ai
  10. Armalo AI Hermes Benchmark 指南:https://www.armalo.ai/blog/hermes-agent-benchmark-the-complete-guide
  11. Fast.io Hermes 用例集:https://fast.io/resources/hermes-agent-use-cases
  12. Hermes v0.16.0 发布说明:https://github.com/NousResearch/hermes-agent/releases/tag/v0.16.0
  13. Hermes Agent Issue #1492 EvoMap 争议:https://github.com/NousResearch/hermes-agent/issues/1492
  14. Modal 后端文档:https://modal.com/docs
  15. Ollama 本地模型:https://ollama.com
  16. Nous Research 安全公告:https://nousresearch.com/security-notice

评分: 8.6/10

同分类推荐

开源框架 分类下的其他 Agent