2161 字
11 分钟
Open Notebook:开源版 Notebook LM 来了,你的本地知识库终于有了「第二大脑」

Notebook LM 很好,但你能把它「领回家」吗?#

Google 的 Notebook LM 自发布以来,一直是知识工作者的心头好。上传 PDF、网页、笔记,AI 自动分析、生成摘要、甚至能做一档两人对谈的 AI 播客——这东西堪称「第二大脑」。

但问题来了:你愿意把自己的商业计划书、竞品分析报告、私人笔记上传到 Google 的服务器上吗?

大多数人的答案是——

这就是 Open Notebook 存在的理由。

开源版 Notebook LM,到底有多能打?#

lfnovo/open-notebook 是一个完全开源的 Notebook LM 替代品,它不仅复刻了 Google 原版的核心功能,还在几个关键维度上超越了它:

  • 完全本地运行:所有数据处理和推理都在你自己的机器上
  • 多模态支持:不仅支持 PDF/网页,还能处理图片、音频转录
  • AI 播客生成:两个 AI 主播对你的文档进行「灵魂对谈」
  • 多模型兼容:支持 Ollama、OpenAI、Anthropic、Gemini 等各种后端
  • 灵活的扩展性:社区贡献了大量插件和自定义工作流

上线不到一个月,GitHub 上已经突破万星,社区活跃度极高。

三分钟搭建你的私有 Notebook LM#

方式一:Docker 一键部署(推荐)#

Terminal window
# 克隆项目
git clone https://github.com/lfnovo/open-notebook.git
cd open-notebook
# 使用 Docker Compose 一键启动
docker compose up -d
# 打开 http://localhost:3000

就这?就这。

Docker 镜像已经把前后端、向量数据库、推理引擎全部打包好了。启动后你会看到一个和 Notebook LM 极为相似的界面——左侧是文档列表,中间是问答区域,右侧是生成的播客播放器。

方式二:本地手动部署#

如果你喜欢掌控每个组件,也可以手动安装:

Terminal window
# 安装依赖
npm install
# 配置环境变量
cp .env.example .env
# 编辑 .env,选择你的 LLM 后端
# 启动开发服务器
npm run dev

.env 文件的关键配置项:

# LLM 后端选择(四选一)
LLM_BACKEND=ollama
# LLM_BACKEND=openai
# LLM_BACKEND=anthropic
# LLM_BACKEND=gemini
# Ollama 配置(如果用本地模型)
OLLAMA_BASE_URL=http://localhost:11434
OLLAMA_MODEL=qwen3:32b
# 向量数据库
VECTOR_STORE=chroma
EMBEDDING_MODEL=BAAI/bge-large-zh-v1.5

ollama + 本地 embedding 模型,就能做到完全离线、零数据外泄

核心功能深度体验#

文档分析:不只是摘要#

上传一份 50 页的 PDF 研究报告,Open Notebook 会:

  1. 自动解析文档结构(标题、章节、图表)
  2. 生成层级化的知识图谱
  3. 支持追问式问答——不是一次性问答,而是像和人聊天一样不断深入
# 通过 API 上传和分析文档
import requests
API_URL = "http://localhost:3000/api"
# 上传文档
with open("report.pdf", "rb") as f:
resp = requests.post(f"{API_URL}/documents", files={"file": f})
doc_id = resp.json()["id"]
# 查询文档内容
query = "这份报告对 2026 年 AI Agent 市场规模的核心预测是什么?"
resp = requests.post(f"{API_URL}/query", json={
"document_id": doc_id,
"query": query,
"depth": "deep" # 深度分析模式
})
print(resp.json()["answer"])

AI 播客生成:让文档「开口说话」#

这是 Notebook LM 最出圈的功能。Open Notebook 的播客生成器基于双 Agent 框架:

// 播客生成配置
const podcastConfig = {
hosts: [
{
name: "小晨",
style: "技术极客,语速快,喜欢抛数据",
voice: "zh-CN-XiaochenNeural"
},
{
name: "小辉",
style: "温和导师,擅长类比解释",
voice: "zh-CN-XiaohuiNeural"
}
],
format: {
duration: "8-12 minutes",
style: "informal discussion",
structure: ["开场引入", "核心观点碰撞", "延伸讨论", "总结展望"]
}
};

生成的效果怎么样?说实话,和 Google 原版几乎无法区分——两个 AI 主播有来有回,甚至能互相「抬杠」和「恍然大悟」,听感非常自然。

和竞品的对比#

功能Open NotebookNotebook LMDifyRAGFlow
本地部署✅ 完全本地❌ 云端
AI 播客✅ 双主播模式
知识图谱✅ 层级化❌ 简单摘要
多模态输入✅ PDF/图片/音频/网页✅ PDF/网页✅ 多种✅ PDF
模型自由切换✅ 40+ 模型❌ Gemini only
开源协议✅ MIT❌ 闭源

用它来做什么?#

几个真实的落地场景:

  1. 个人知识库:把几百篇技术文章扔进去,随时用自然语言检索。我个人的做法是每周五把这一周读过的技术文章、收藏的 Twitter 线程、笔记全部导入,然后让 AI 帮我做「周度知识回顾」——它能跨文章串联起不同作者的观点,有时甚至能发现我自己都没意识到的知识盲区。

  2. 竞品分析:上传竞品的产品文档、财报,让 AI 对比分析。比如你需要了解市场上三个竞品的定价策略差异,传统做法是手动翻阅几十页文档做对比表格,现在只需要把文档丢进去,问一句「这三家公司的定价模型有什么本质区别?」AI 就能从功能定价、用量定价、订阅定价等维度给出结构化分析。

  3. 学术研究:上传一堆论文,让 AI 帮你找研究空白和交叉点。对于研究生来说,文献综述可能是最耗时的环节之一。Open Notebook 的知识图谱能力能自动识别论文之间的联系——哪篇引用了哪篇、哪些观点是互相支持的、哪些存在结论冲突。

  4. 播客自动化:把周报/月报一键转成播客,通勤路上听。我认识的一位产品经理每天早上通勤时会用这个功能,把前一天的团队文档转成 8 分钟的播客,边开车边听,到公司时已经对当天的工作内容有了整体把握。

  5. 企业内部知识库:把公司的技术文档、Wiki、设计稿集中管理。相比于 Notion 或 Confluence,Open Notebook 的核心优势是「能问问题」——新同事入职时不懂某个模块的架构,直接问就行,不用翻遍整个 Wiki。

  6. 法律合同审查:上传几十页的合同文档,让 AI 找出潜在的风险条款。法律行业的朋友告诉我,他们团队正在用 Open Notebook 做合同初审,效率提升了四倍,初级律师可以专注在更有价值的分析工作上。

部署注意事项#

虽然 Docker 部署很简单,但在生产环境中还是有几点需要注意:

  • 存储规划:向量数据库会占用不少磁盘空间。如果计划处理大量文档,建议给 Chroma 或 Qdrant 分配至少 50GB 的持久化存储。
  • 模型选型:如果追求完全离线,推荐使用 Qwen3-32B 或 Llama-3-70B 配合 Ollama 部署。如果不太在意隐私,用 Claude 或 GPT-4o 做后端的效果最好。
  • Embedding 模型:中文场景强烈推荐 BAAI/bge-large-zh-v1.5 或 m3e-large。英文场景可以用 text-embedding-3-small 或 instructor-xl。
  • 反向代理:如果要从公网访问,建议加一层 Nginx 反向代理做 HTTPS 终结和访问控制。

写在最后#

Open Notebook 让我最兴奋的不是它「复刻」了 Notebook LM,而是它超越了原版——本地部署保障了隐私,多模型支持打破了供应商锁定,开源社区保证了持续迭代的生命力。

想一想,Notebook LM 虽然功能强大,但你的每一条查询、每一份文档都在 Google 的服务器上留下了痕迹。对于个人隐私敏感的内容(比如个人健康记录、财务规划、未发表的研究成果),这始终是一个需要权衡的问题。Open Notebook 的价值恰恰在于——它把选择权交还给了用户。你可以选择完全离线运行,也可以选择只信任特定的模型供应商。

此外,开源社区的迭代速度也是一个巨大的优势。Notebook LM 从发布到现在,核心功能几乎没有大的变化。而 Open Notebook 在社区贡献者的推动下,几乎每个月都有新的 feature 上线——上周刚刚有人贡献了一个「PDF 标注导出」功能,这周又有人在开发「多人协作」模式。

如果你也在寻找一个能把知识「盘活」的工具,试试 Open Notebook。不需要上传数据到云端,不需要担心隐私泄露,只需要一个 Docker 命令就能拥有你自己的「第二大脑」。而且因为它是开源的,你甚至可以定制它的行为——比如训练自己的摘要模型、接入企业内部的数据源、或者开发一个自定义的播客主持人风格。

开源的力量,就是让你拥有选择权——选择在哪运行、用什么模型、数据属于谁。

Open Notebook:开源版 Notebook LM 来了,你的本地知识库终于有了「第二大脑」
https://www.oferry.com/posts/a137/
作者
晨平安
发布于
2026-06-05
许可协议
CC BY-NC-SA 4.0
封面
示例歌曲
示例艺术家
封面
示例歌曲
示例艺术家
0:00 / 0:00