AI 智能体有个致命缺陷:每次新会话都是白纸一张。你跟它聊了一周的项目背景、代码规范、用户偏好,关掉终端全没了。这不是体验问题,是架构缺陷。
Memory Sidecar 就是为了解决这个而生的。它不修改智能体代码,不引入 Docker 依赖,纯外挂——独立进程,共享数据目录。Hermes、Claude Code、Cursor、Codex,谁用都一样。
架构:三层,没一层是多余的
Agent 写会话 → state.db + 会话文件
↓
Sidecar 增量读取,处理新会话
↓
┌───────────┼───────────┐
│ │ │
▼ ▼ ▼
热层 温层 冷层
(memory (Hindsight (gbrain 图谱
tool, PostgreSQL) + FTS5 搜索)
5KB cap)
↓
分层上下文注入 → 注入到 agent system prompt
热层 — 当前用户画像 + 系统配置。0ms 延迟,5KB 硬上限。放的是"你是谁""正在做什么""别犯的错"这类高频上下文。
温层 — Hindsight 事实图谱(PostgreSQL)。~50ms。自动从每轮会话提取关键事实,按模式聚类。生产环境实际数据:42,481 个节点,21,629 条提取记忆。
冷层 — gbrain 知识图谱 + FTS5 全文搜索。~500ms–2s。10,885 个知识图谱页面,105,601 条可搜索消息。配合 pgvector 做 384 维语义搜索,中文查询也能命中英文内容。
三层结果是 Reciprocal Rank Fusion(RRF)融合后注入 agent 的 system prompt。不是"选一层",是"哪层有货就用哪层,都有就合并排序"。
不是给 Hermes 专供的
AGENT_HOME 环境变量指向哪,Sidecar 就服务哪。v3.5 的安装器支持中英双语交互,--noninteractive 模式适合 CI 批量部署:
git clone https://github.com/mage0535/hermes-memory-installer.git
cd hermes-memory-installer
export AGENT_HOME="$HOME/.claude"
./install.sh --noninteractive
装完跑一次验收:
# sidecar_acceptance_check.py — 生产验证套件(真实脚本节选)
def run_all_checks():
checks = [
("agent_home", AGENT_HOME.exists()),
("scripts_dir", SCRIPTS_DIR.exists()),
("maintenance_cycle", (SCRIPTS_DIR / "memory_maintenance_cycle.py").exists()),
("gbrain_reachable", curl_gbrain_health()),
("hindsight_reachable", curl_hindsight_health()),
]
for name, ok in checks:
print(f" {name}: {'✓' if ok else '✗'}")
return all(ok for _, ok in checks)
Focused Dossier:不是所有记忆都平等
v3.1 引入的功能,v3.5 已经过生产验证。某些东西——关键人物、长期项目、反复出现的故障——需要特别对待。Dossier 自带别名解析、关键词触发、保留优先级和时间线追踪。第一个投产的 dossier 管理着数百个会话、数千条提取事实、含时间线感知的召回。
加一个新 dossier 只需要在 memory_family_registry.py 里加一条配置,格式自解释。
脏话:干掉过度的中间层
v3.0 有四层,中间挂了一个 agentmemory Docker 桥接层。实际数据只有 13 条过期记录,还多了个 Docker 依赖。v3.1 直接砍了,顺便清理了半成品 memory_index.db。
v3.5 在此基础上加了更完善的 embedding 模型选择——6 个模型从 96MB(纯中文轻量)到 2GB(极致精度),不用 embedding 服务也行,FTS5 文本检索本身够用。
生产数据(不是画饼)
截至 v3.5 发布,这套栈在某生产部署上持续运行:
- 10,885 gbrain 页面
- 42,481 Hindsight 节点
- 105,601 条可搜索消息
- brain score 73(gbrain 内容质量评分)
不是 prototype。是从四月份就跑在生产线上的东西。
适合谁用
你如果:
- 每天跟 AI 智能体交互 50+ 次
- 厌倦了反复交代同样的上下文
- 跑 Hermes、Claude Code 或 Codex 做正经项目
- 不想改智能体核心代码,也不想上 Docker
那 Memory Sidecar 值得花十分钟装上。项目在 github.com/mage0535/hermes-memory-installer,MIT 协议,中英文双语文档都有。
Top comments (0)