前几天 Karpathy 分享了他最新的工作流:使用 LLM 构建个人知识库(Personal Knowledge Base),这条推文一发布,引发大量关注和点赞,两天后,他把这套方法论写成了一份 gist 发到 GitHub(llm-wiki)上,开源给所有人。

我最近也看到很多介绍这个构建知识库的帖子,但是很少有如何实战构建自己的知识库的操作步骤,所以开始也是很迷茫,到底该如何构建自己的知识库,正好今天没事找到一篇介绍如何使用的,我本地也实战了一下,记录一下操作步骤。

知识收集、整理是非常耗费时间的,我做开发十多年也整理了很多知识,放到 github,博客,公众号,但是没有一个非常好的管理方式,正好这个方法能够解决我的问题,可能也会解决很多人管理知识的问题。

下面我介绍下我的操作步骤。

准备工具

  • Obsidianhttps://obsidian.md/:下载安装,这个是一个读取显示 md 文件的软件,具有很强大的功能,由于我也是刚开接触,因此很多还不熟悉,因此还在摸索阶段。
  • obsidian web clipperhttps://obsidian.md/clipper:这是一款浏览器插件,用来快速收藏你需要放到知识库的网页。

先将如上两个软件安装。

创建项目

安装完成后,在你的电脑本地新建一个项目文件夹,例如:obsidian,然后在下面新建 raw 文件夹和 wiki 文件夹,如果你已经有了知识库,可以拷贝过来放到 raw 目录下,直接放置就行不用整理。

然后打开 Obsidian,点击菜单中的 File -> Open Vault,然后选择打开本地仓库,选择你创建的这个文件夹(obsidian)即可,选择后,Obsidian 会扫描里面的内容并构建索引,然后点击左侧菜单中的查看关系图谱可以看到如下图:

有图可以放大缩小,点击可以跳转,不过这个不是今天的重点。

收藏知识点

先用 Obsidian 打开你的项目。

然后在浏览器中查看到需要收藏的网页时,点击上面安装的 obsidian web clipper 插件,会弹出弹窗。

可以修改 tags,以及最下面的 Clippings,这个是保存文件夹,我们改为 raw,这样就会直接保存到你这个查看的内容到 raw 的文件夹下,方便快速收藏。

开始编译

准备工作

Obsidian 的 skill:

  • kepano/obsidian-skills:Agent skills for Obsidian。如果是使用 claude-code,直接安装即可;如果是使用 codex,需要手动下载复制到 .codex/skill 文件夹中。

编译是需要 skill 的,我在网上找了几个:

还需要 Karpathy 开源的 llm-wiki,这个可以好好读一下,毕竟是大神写的。

这里我使用的是 codex + lewislulu/llm-wiki-skill(这是个 skill、模板、脚本),也可以参考这个自己写一个。

全量编译

执行 codex,然后输入:

Learn this skill(https://github.com/lewislulu/llm-wiki-skill) and, based on the content at
https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f#file-llm-wiki-md, construct a complete wiki under the wiki folder by reading all the details in the raw folder. Make it a well-structured and clean wiki. Ensure that log.md and index.md are preserved.

中文:

学习该 skill(https://github.com/lewislulu/llm-wiki-skill),并基于
https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f#file-llm-wiki-md 的内容,
通过读取 raw 目录中的所有细节,在 wiki 目录下构建一个完整的 wiki。
将其整理为结构清晰、规范良好的知识库。确保保留 log.md 和 index.md。

编译开始后,等待编译结束。可以看到编译产物已经生成完成。

然后就可以使用 Obsidian 查看了,也可以使用 AI 进行搜索。

增量编译

当有新的资料要加入时,执行 codex,输入:

Please ingest the latest materials I placed in the raw folder into my wiki.

中文:

请 ingest 我最新放入 raw 里的资料到我的 wiki

执行上面命令即可。

最后

这样一个自己的知识库就构建好了,核心就是你要去收集你要的知识,然后直接放到 raw 下面即可,不用整理。如果需要同步,可以使用 github 进行保存,也可以使用其他方式。