FEATUREDX · @dotey(宝玉)· x-apiZH17:02 · 04·29
Hermes Agent 的记忆系统拆解:它用四层设计避开了 OpenClaw 的坑
Hermes Agent 的记忆不是一套,而是四套:高度浓缩的提示词记忆(MEMORY.md 和 USER.md)、可搜索的 SQLite 历史会话存档、像程序记忆一样运作的技能管理,以及可选的 Honcho 深层用户建模。核心思路是冷热分离——把最常用的信息压进极小的提示词快照里(加起来约 1,300 个 Token),以保住大模型的提示词缓存、降低...
#Agent#Memory#Tools#Hermes Agent
精选理由
这篇文章不是产品发布,更像一篇技术拆解,把 Hermes Agent 的记忆系统讲得很清楚。我会先打个折:它来自单一信源,没有第三方验证,但给出的四层结构、字符限制和缓存优先思路对实际做 agent 的人有参考价值。正文没披露性能对比数据,所以别把它当评测看,当成一个设计思路的分享就好。
一句话点评
Hermes 把记忆拆成四层,核心就一句话:提示词里只放最常用的,其他全扔进工具按需查。这比 OpenClaw 的流水账聪明,但别指望它记住你上周聊过什么。
锐评
这篇拆解把 Hermes 的记忆设计讲得很透。它没搞什么花哨的向量数据库,就用两个加起来不到 1,300 Token 的纯文本文件当热记忆,剩下的历史会话全塞进 SQLite,靠搜索工具按需调取。这个冷热分离的思路直接冲着省钱去的——大模型的提示词缓存很贵,频繁改系统提示词会让缓存失效,延迟和成本都往上蹿。Hermes 的做法是把系统提示词前缀焊死,新记忆只在开新会话或触发压缩时才写入快照,中途不改。
压缩前的“记忆冲刷”是个好设计:先让模型把值得留的偏好和教训存进 MEMORY.md,再洗掉对话历史,避免摘要丢关键信息。技能层和可选的 Honcho 用户建模也补上了“怎么做事”和跨设备连续性的缺口。但正文没给出实际延迟或成本对比数据,也没说这套设计在复杂多轮任务里会不会因为记忆更新滞后而出错。另外,2,200 字符的硬上限对长期使用的智能体可能偏紧,这点得看实际场景。
HKR 分解
hook ✓knowledge ✓resonance ✓