知识库/LLM 学习

LLM Wiki 模式

让 LLM 把原始资料编译成持久互链 wiki 的知识管理模式:三层架构 + 三操作,知识越用越厚

置信度·高创建 2026-07-03更新 2026-07-03依据 1 份原始资料

LLM Wiki 模式

Karpathy 提出的个人知识库模式:不做“查询时检索”,而是让 LLM 把原始资料编译成一个持久化、互相链接、持续维护的 wiki。知识结构化一次,之后随每份新资料保持新鲜——与 RAG 的关键差异见 RAG vs 编译式 wiki

三层架构

所有权 性质
raw sources 人策展 不可变,source of truth
wiki LLM 全权拥有 摘要、实体页、概念页、对比、综述——人读 LLM 写
schema 人和 LLM 共同演化 结构约定与工作流配置,“让 LLM 成为有纪律的维护者而非通用聊天机器人”

三操作

  • ingest:读资料 → 讨论要点 → 写摘要页 → 更新索引和相关页面 → 记日志。一份资料可能触及 10-15 个页面。
  • query:先读 index.md 定位,再深入页面,带引用作答。好答案归档回 wiki——探索本身也复利。
  • lint:周期性体检——矛盾、被新资料淘汰的过时论断、孤儿页、缺页概念、缺失交叉引用。

为什么可行

知识库最累的是记账而非阅读思考;人类放弃 wiki 是因为维护负担增长快于价值,而 LLM 做维护的成本趋近于零。中等规模(~100 份资料)下用 index.md 导航即可,无需 embedding 检索设施。思想谱系上承 Vannevar Bush 的 Memex(1945)。

本知识库的实例化

本项目在此模式上融合了多主题隔离、purpose 文件、两步式 ingest、来源溯源(支持级联清理)、置信度评分与显式发布层。它与 Anthropic 所述 agentic memory 的关系,参见 知识复利综合页。