因提出“Vibe Coding”概念而受到关注的OpenAI联合创始人Andrej Karpathy,近日公开分享了利用AI搭建个人知识库的方法。
Andrej Karpathy在社交平台X(原Twitter)表示,这套方法不依赖专用软件或数据库,核心在于尽量简化结构:只需3个文件夹,加上一份文本形式的指引文件,就可以搭起一套可持续迭代的个人AI知识库。
具体来看,首先需要在项目目录下建立raw、wiki和outputs三个子文件夹。其中,raw用于存放原始资料,包括文章、随手笔记、截图、会议纪要、研究论文等内容,基本无需额外改名或预处理。文字材料可保存为Markdown(.md)或文本(.txt)文件,截图和图表则可直接以图片形式归档。
wiki文件夹用于存放AI基于raw资料重写、整理后的结构化内容,outputs则用于保存AI生成的回答、报告和分析结果。完成这一基础结构后,还需要再建立一份指引文件。
按照Andrej Karpathy的做法,可在项目根目录新建一个名为CLAUDE.md或AGENTS.md的文本文件,用来说明这套知识库的定义方式和整理规则,相当于AI执行任务时的操作说明。
这份指引文件本身不需要复杂,重点是明确各文件夹的用途、wiki的写作规则以及关注的主题范围。例如,可以规定wiki目录下按主题分别建文件、每篇文档以摘要开头、相关主题之间加入交叉链接等。
在此基础上,AI即可按照既定规则处理raw中的资料。Andrej Karpathy提到,可以将Claude Code、Cursor等AI编程工具连接至项目目录,让AI读取raw中的内容,并按主题生成整理后的wiki条目,同时自动建立索引文件。
在这一流程中,用户通常不直接修改wiki,而是以阅读和提问为主,修订和更新则交由AI完成。待wiki积累到10篇以上文档后,这套知识库的价值会更明显。比如,用户可以提出“这个主题里我最不了解的3点是什么”“A资料与B资料在这一概念上的差异是什么”等问题,AI会结合整个wiki进行回答。相关回答如果继续保存到outputs中,也能成为下一轮提问的输入材料。
随着资料和提问不断增多,知识库内容会逐步完善,但潜在问题也会随之叠加。如果AI在整理阶段出现偏差并写入wiki,后续回答就可能继续建立在错误信息之上。Andrej Karpathy帖子的评论区中,也有人提出了类似担忧。
对此,Andrej Karpathy给出的建议是定期复核,例如每月进行一次检查,让AI通读整个wiki,找出相互矛盾的内容、缺乏出处支撑的判断,以及解释不完整的主题。
虽然评论区中有不少人推荐结合Obsidian插件使用,但Andrej Karpathy的态度很明确:这套方法的本质,“只是把Markdown文件放进文件夹”。在他看来,AI并不在意文件由哪款应用打开,真正重要的是文件夹结构和指引文件本身。与其把时间花在复杂的工具配置上,不如把重点放在资料积累和问题提出上。