Open Notebook：开源版 Notebook LM 来了，你的本地知识库终于有了「第二大脑」

晨平安

岁岁平，岁岁安，岁岁平安

2161 字

11 分钟

Open Notebook：开源版 Notebook LM 来了，你的本地知识库终于有了「第二大脑」

2026-06-05

原创

AI

/

开源

/

知识管理

/

RAG

Notebook LM 很好，但你能把它「领回家」吗？#

Google 的 Notebook LM 自发布以来，一直是知识工作者的心头好。上传 PDF、网页、笔记，AI 自动分析、生成摘要、甚至能做一档两人对谈的 AI 播客——这东西堪称「第二大脑」。

但问题来了：你愿意把自己的商业计划书、竞品分析报告、私人笔记上传到 Google 的服务器上吗？

大多数人的答案是——不。

这就是 Open Notebook 存在的理由。

开源版 Notebook LM，到底有多能打？#

lfnovo/open-notebook 是一个完全开源的 Notebook LM 替代品，它不仅复刻了 Google 原版的核心功能，还在几个关键维度上超越了它：

完全本地运行：所有数据处理和推理都在你自己的机器上
多模态支持：不仅支持 PDF/网页，还能处理图片、音频转录
AI 播客生成：两个 AI 主播对你的文档进行「灵魂对谈」
多模型兼容：支持 Ollama、OpenAI、Anthropic、Gemini 等各种后端
灵活的扩展性：社区贡献了大量插件和自定义工作流

上线不到一个月，GitHub 上已经突破万星，社区活跃度极高。

三分钟搭建你的私有 Notebook LM#

方式一：Docker 一键部署（推荐）#

1
# 克隆项目
2
git clone https://github.com/lfnovo/open-notebook.git
3
cd open-notebook
4

5
# 使用 Docker Compose 一键启动
6
docker compose up -d
7

8
# 打开 http://localhost:3000

就这？就这。

Docker 镜像已经把前后端、向量数据库、推理引擎全部打包好了。启动后你会看到一个和 Notebook LM 极为相似的界面——左侧是文档列表，中间是问答区域，右侧是生成的播客播放器。

方式二：本地手动部署#

如果你喜欢掌控每个组件，也可以手动安装：

1
# 安装依赖
2
npm install
3

4
# 配置环境变量
5
cp .env.example .env
6
# 编辑 .env，选择你的 LLM 后端
7

8
# 启动开发服务器
9
npm run dev

.env 文件的关键配置项：

1
# LLM 后端选择（四选一）
2
LLM_BACKEND=ollama
3
# LLM_BACKEND=openai
4
# LLM_BACKEND=anthropic
5
# LLM_BACKEND=gemini
6

7
# Ollama 配置（如果用本地模型）
8
OLLAMA_BASE_URL=http://localhost:11434
9
OLLAMA_MODEL=qwen3:32b
10

11
# 向量数据库
12
VECTOR_STORE=chroma
13
EMBEDDING_MODEL=BAAI/bge-large-zh-v1.5

选 ollama + 本地 embedding 模型，就能做到完全离线、零数据外泄。

核心功能深度体验#

文档分析：不只是摘要#

上传一份 50 页的 PDF 研究报告，Open Notebook 会：

自动解析文档结构（标题、章节、图表）
生成层级化的知识图谱
支持追问式问答——不是一次性问答，而是像和人聊天一样不断深入

1
# 通过 API 上传和分析文档
2
import requests
3

4
API_URL = "http://localhost:3000/api"
5

6
# 上传文档
7
with open("report.pdf", "rb") as f:
8
    resp = requests.post(f"{API_URL}/documents", files={"file": f})
9
doc_id = resp.json()["id"]
10

11
# 查询文档内容
12
query = "这份报告对 2026 年 AI Agent 市场规模的核心预测是什么？"
13
resp = requests.post(f"{API_URL}/query", json={
14
    "document_id": doc_id,
15
    "query": query,
16
    "depth": "deep"  # 深度分析模式
17
})
18

19
print(resp.json()["answer"])

AI 播客生成：让文档「开口说话」#

这是 Notebook LM 最出圈的功能。Open Notebook 的播客生成器基于双 Agent 框架：

1
// 播客生成配置
2
const podcastConfig = {
3
  hosts: [
4
    {
5
      name: "小晨",
6
      style: "技术极客，语速快，喜欢抛数据",
7
      voice: "zh-CN-XiaochenNeural"
8
    },
9
    {
10
      name: "小辉",
11
      style: "温和导师，擅长类比解释",
12
      voice: "zh-CN-XiaohuiNeural"
13
    }
14
  ],
15
  format: {
16
    duration: "8-12 minutes",
17
    style: "informal discussion",
18
    structure: ["开场引入", "核心观点碰撞", "延伸讨论", "总结展望"]
19
  }
20
};

生成的效果怎么样？说实话，和 Google 原版几乎无法区分——两个 AI 主播有来有回，甚至能互相「抬杠」和「恍然大悟」，听感非常自然。

和竞品的对比#

功能	Open Notebook	Notebook LM	Dify	RAGFlow
本地部署	✅ 完全本地	❌ 云端	✅	✅
AI 播客	✅ 双主播模式	✅	❌	❌
知识图谱	✅ 层级化	❌ 简单摘要	❌	✅
多模态输入	✅ PDF/图片/音频/网页	✅ PDF/网页	✅ 多种	✅ PDF
模型自由切换	✅ 40+ 模型	❌ Gemini only	✅	✅
开源协议	✅ MIT	❌ 闭源	✅	✅

用它来做什么？#

几个真实的落地场景：

个人知识库：把几百篇技术文章扔进去，随时用自然语言检索。我个人的做法是每周五把这一周读过的技术文章、收藏的 Twitter 线程、笔记全部导入，然后让 AI 帮我做「周度知识回顾」——它能跨文章串联起不同作者的观点，有时甚至能发现我自己都没意识到的知识盲区。
竞品分析：上传竞品的产品文档、财报，让 AI 对比分析。比如你需要了解市场上三个竞品的定价策略差异，传统做法是手动翻阅几十页文档做对比表格，现在只需要把文档丢进去，问一句「这三家公司的定价模型有什么本质区别？」AI 就能从功能定价、用量定价、订阅定价等维度给出结构化分析。
学术研究：上传一堆论文，让 AI 帮你找研究空白和交叉点。对于研究生来说，文献综述可能是最耗时的环节之一。Open Notebook 的知识图谱能力能自动识别论文之间的联系——哪篇引用了哪篇、哪些观点是互相支持的、哪些存在结论冲突。
播客自动化：把周报/月报一键转成播客，通勤路上听。我认识的一位产品经理每天早上通勤时会用这个功能，把前一天的团队文档转成 8 分钟的播客，边开车边听，到公司时已经对当天的工作内容有了整体把握。
企业内部知识库：把公司的技术文档、Wiki、设计稿集中管理。相比于 Notion 或 Confluence，Open Notebook 的核心优势是「能问问题」——新同事入职时不懂某个模块的架构，直接问就行，不用翻遍整个 Wiki。
法律合同审查：上传几十页的合同文档，让 AI 找出潜在的风险条款。法律行业的朋友告诉我，他们团队正在用 Open Notebook 做合同初审，效率提升了四倍，初级律师可以专注在更有价值的分析工作上。

部署注意事项#

虽然 Docker 部署很简单，但在生产环境中还是有几点需要注意：

存储规划：向量数据库会占用不少磁盘空间。如果计划处理大量文档，建议给 Chroma 或 Qdrant 分配至少 50GB 的持久化存储。
模型选型：如果追求完全离线，推荐使用 Qwen3-32B 或 Llama-3-70B 配合 Ollama 部署。如果不太在意隐私，用 Claude 或 GPT-4o 做后端的效果最好。
Embedding 模型：中文场景强烈推荐 BAAI/bge-large-zh-v1.5 或 m3e-large。英文场景可以用 text-embedding-3-small 或 instructor-xl。
反向代理：如果要从公网访问，建议加一层 Nginx 反向代理做 HTTPS 终结和访问控制。

写在最后#

Open Notebook 让我最兴奋的不是它「复刻」了 Notebook LM，而是它超越了原版——本地部署保障了隐私，多模型支持打破了供应商锁定，开源社区保证了持续迭代的生命力。

想一想，Notebook LM 虽然功能强大，但你的每一条查询、每一份文档都在 Google 的服务器上留下了痕迹。对于个人隐私敏感的内容（比如个人健康记录、财务规划、未发表的研究成果），这始终是一个需要权衡的问题。Open Notebook 的价值恰恰在于——它把选择权交还给了用户。你可以选择完全离线运行，也可以选择只信任特定的模型供应商。

此外，开源社区的迭代速度也是一个巨大的优势。Notebook LM 从发布到现在，核心功能几乎没有大的变化。而 Open Notebook 在社区贡献者的推动下，几乎每个月都有新的 feature 上线——上周刚刚有人贡献了一个「PDF 标注导出」功能，这周又有人在开发「多人协作」模式。

如果你也在寻找一个能把知识「盘活」的工具，试试 Open Notebook。不需要上传数据到云端，不需要担心隐私泄露，只需要一个 Docker 命令就能拥有你自己的「第二大脑」。而且因为它是开源的，你甚至可以定制它的行为——比如训练自己的摘要模型、接入企业内部的数据源、或者开发一个自定义的播客主持人风格。