概
Agent Memory
两相系统:对话时抽取写入用户事实、查询时读回个性化——管'用户知识',与管'领域知识'的 wiki 正交互补
Agent Memory
两份独立来源(Vishal Mysore 的三方对比 + Anthropic 的 context engineering)相互印证的模式:agent 把信息持久化到上下文窗口之外、稍后读回,以获得跨会话连续性。
两相系统(区别于 RAG 的关键)
- 写相(对话时):从用户话语中抽取事实(偏好、历史、约束)写入记忆存储——抽取与存储本身就是推理操作(决定什么值得留、怎么存)。
- 读相(查询时):取回存储的上下文,与查询一起注入,个性化响应。
成熟系统会跨会话总结、聚类相关事实、推导偏好、构建结构化用户模型。Anthropic 的 structured note-taking(NOTES.md、Claude 玩 Pokémon 跨数千步维持策略)是同一机制在任务场景的形态。
边界与盲区
- 知道用户,不知道领域:记住“用户偏好 Python”但没有文档知识的 agent 依然帮不上技术支持——记忆与领域知识是正交问题,需要分别解决。
- 稀疏且有噪:只知道用户明说过的东西。
与 wiki / RAG 的三角关系
| 管什么 | 写入时机 | |
|---|---|---|
| LLM Wiki | 领域知识 | ingest 时编译 |
| Agent Memory | 用户知识 | 对话时抽取 |
| RAG | 大规模文档检索 | 默认无状态 |
三者不是竞争者,生产系统日益并用。wiki 的“图书馆没有图书管理员”缺口(不知道谁在读、为什么读),恰好由 agent memory 补位。
关联
- context engineering 的长任务三技术之一(structured note-taking)
- 知识复利:wiki 与 memory 的同源性分析
- RAG vs 编译式 Wiki:三角关系的对比视角
- 本知识库对维护它的 agent 而言就是 agent memory(跨会话状态),对人而言是 LLM Wiki——一体两面。