知识库/LLM 学习

Agent Memory

两相系统:对话时抽取写入用户事实、查询时读回个性化——管'用户知识',与管'领域知识'的 wiki 正交互补

置信度·高创建 2026-07-03更新 2026-07-03依据 2 份原始资料

Agent Memory

两份独立来源(Vishal Mysore 的三方对比 + Anthropic 的 context engineering)相互印证的模式:agent 把信息持久化到上下文窗口之外、稍后读回,以获得跨会话连续性。

两相系统(区别于 RAG 的关键)

  • 写相(对话时):从用户话语中抽取事实(偏好、历史、约束)写入记忆存储——抽取与存储本身就是推理操作(决定什么值得留、怎么存)。
  • 读相(查询时):取回存储的上下文,与查询一起注入,个性化响应。

成熟系统会跨会话总结、聚类相关事实、推导偏好、构建结构化用户模型。Anthropic 的 structured note-taking(NOTES.md、Claude 玩 Pokémon 跨数千步维持策略)是同一机制在任务场景的形态。

边界与盲区

  • 知道用户,不知道领域:记住“用户偏好 Python”但没有文档知识的 agent 依然帮不上技术支持——记忆与领域知识是正交问题,需要分别解决。
  • 稀疏且有噪:只知道用户明说过的东西。

与 wiki / RAG 的三角关系

管什么 写入时机
LLM Wiki 领域知识 ingest 时编译
Agent Memory 用户知识 对话时抽取
RAG 大规模文档检索 默认无状态

三者不是竞争者,生产系统日益并用。wiki 的“图书馆没有图书管理员”缺口(不知道谁在读、为什么读),恰好由 agent memory 补位。

关联

  • context engineering 的长任务三技术之一(structured note-taking)
  • 知识复利:wiki 与 memory 的同源性分析
  • RAG vs 编译式 Wiki:三角关系的对比视角
  • 本知识库对维护它的 agent 而言就是 agent memory(跨会话状态),对人而言是 LLM Wiki——一体两面。