Notebook LM 很好,但你能把它「领回家」吗?
Google 的 Notebook LM 自发布以来,一直是知识工作者的心头好。上传 PDF、网页、笔记,AI 自动分析、生成摘要、甚至能做一档两人对谈的 AI 播客——这东西堪称「第二大脑」。
但问题来了:你愿意把自己的商业计划书、竞品分析报告、私人笔记上传到 Google 的服务器上吗?
大多数人的答案是——不。
这就是 Open Notebook 存在的理由。
开源版 Notebook LM,到底有多能打?
lfnovo/open-notebook 是一个完全开源的 Notebook LM 替代品,它不仅复刻了 Google 原版的核心功能,还在几个关键维度上超越了它:
- 完全本地运行:所有数据处理和推理都在你自己的机器上
- 多模态支持:不仅支持 PDF/网页,还能处理图片、音频转录
- AI 播客生成:两个 AI 主播对你的文档进行「灵魂对谈」
- 多模型兼容:支持 Ollama、OpenAI、Anthropic、Gemini 等各种后端
- 灵活的扩展性:社区贡献了大量插件和自定义工作流
上线不到一个月,GitHub 上已经突破万星,社区活跃度极高。
三分钟搭建你的私有 Notebook LM
方式一:Docker 一键部署(推荐)
# 克隆项目git clone https://github.com/lfnovo/open-notebook.gitcd open-notebook
# 使用 Docker Compose 一键启动docker compose up -d
# 打开 http://localhost:3000就这?就这。
Docker 镜像已经把前后端、向量数据库、推理引擎全部打包好了。启动后你会看到一个和 Notebook LM 极为相似的界面——左侧是文档列表,中间是问答区域,右侧是生成的播客播放器。
方式二:本地手动部署
如果你喜欢掌控每个组件,也可以手动安装:
# 安装依赖npm install
# 配置环境变量cp .env.example .env# 编辑 .env,选择你的 LLM 后端
# 启动开发服务器npm run dev.env 文件的关键配置项:
# LLM 后端选择(四选一)LLM_BACKEND=ollama# LLM_BACKEND=openai# LLM_BACKEND=anthropic# LLM_BACKEND=gemini
# Ollama 配置(如果用本地模型)OLLAMA_BASE_URL=http://localhost:11434OLLAMA_MODEL=qwen3:32b
# 向量数据库VECTOR_STORE=chromaEMBEDDING_MODEL=BAAI/bge-large-zh-v1.5选 ollama + 本地 embedding 模型,就能做到完全离线、零数据外泄。
核心功能深度体验
文档分析:不只是摘要
上传一份 50 页的 PDF 研究报告,Open Notebook 会:
- 自动解析文档结构(标题、章节、图表)
- 生成层级化的知识图谱
- 支持追问式问答——不是一次性问答,而是像和人聊天一样不断深入
# 通过 API 上传和分析文档import requests
API_URL = "http://localhost:3000/api"
# 上传文档with open("report.pdf", "rb") as f: resp = requests.post(f"{API_URL}/documents", files={"file": f})doc_id = resp.json()["id"]
# 查询文档内容query = "这份报告对 2026 年 AI Agent 市场规模的核心预测是什么?"resp = requests.post(f"{API_URL}/query", json={ "document_id": doc_id, "query": query, "depth": "deep" # 深度分析模式})
print(resp.json()["answer"])AI 播客生成:让文档「开口说话」
这是 Notebook LM 最出圈的功能。Open Notebook 的播客生成器基于双 Agent 框架:
// 播客生成配置const podcastConfig = { hosts: [ { name: "小晨", style: "技术极客,语速快,喜欢抛数据", voice: "zh-CN-XiaochenNeural" }, { name: "小辉", style: "温和导师,擅长类比解释", voice: "zh-CN-XiaohuiNeural" } ], format: { duration: "8-12 minutes", style: "informal discussion", structure: ["开场引入", "核心观点碰撞", "延伸讨论", "总结展望"] }};生成的效果怎么样?说实话,和 Google 原版几乎无法区分——两个 AI 主播有来有回,甚至能互相「抬杠」和「恍然大悟」,听感非常自然。
和竞品的对比
| 功能 | Open Notebook | Notebook LM | Dify | RAGFlow |
|---|---|---|---|---|
| 本地部署 | ✅ 完全本地 | ❌ 云端 | ✅ | ✅ |
| AI 播客 | ✅ 双主播模式 | ✅ | ❌ | ❌ |
| 知识图谱 | ✅ 层级化 | ❌ 简单摘要 | ❌ | ✅ |
| 多模态输入 | ✅ PDF/图片/音频/网页 | ✅ PDF/网页 | ✅ 多种 | |
| 模型自由切换 | ✅ 40+ 模型 | ❌ Gemini only | ✅ | ✅ |
| 开源协议 | ✅ MIT | ❌ 闭源 | ✅ | ✅ |
用它来做什么?
几个真实的落地场景:
-
个人知识库:把几百篇技术文章扔进去,随时用自然语言检索。我个人的做法是每周五把这一周读过的技术文章、收藏的 Twitter 线程、笔记全部导入,然后让 AI 帮我做「周度知识回顾」——它能跨文章串联起不同作者的观点,有时甚至能发现我自己都没意识到的知识盲区。
-
竞品分析:上传竞品的产品文档、财报,让 AI 对比分析。比如你需要了解市场上三个竞品的定价策略差异,传统做法是手动翻阅几十页文档做对比表格,现在只需要把文档丢进去,问一句「这三家公司的定价模型有什么本质区别?」AI 就能从功能定价、用量定价、订阅定价等维度给出结构化分析。
-
学术研究:上传一堆论文,让 AI 帮你找研究空白和交叉点。对于研究生来说,文献综述可能是最耗时的环节之一。Open Notebook 的知识图谱能力能自动识别论文之间的联系——哪篇引用了哪篇、哪些观点是互相支持的、哪些存在结论冲突。
-
播客自动化:把周报/月报一键转成播客,通勤路上听。我认识的一位产品经理每天早上通勤时会用这个功能,把前一天的团队文档转成 8 分钟的播客,边开车边听,到公司时已经对当天的工作内容有了整体把握。
-
企业内部知识库:把公司的技术文档、Wiki、设计稿集中管理。相比于 Notion 或 Confluence,Open Notebook 的核心优势是「能问问题」——新同事入职时不懂某个模块的架构,直接问就行,不用翻遍整个 Wiki。
-
法律合同审查:上传几十页的合同文档,让 AI 找出潜在的风险条款。法律行业的朋友告诉我,他们团队正在用 Open Notebook 做合同初审,效率提升了四倍,初级律师可以专注在更有价值的分析工作上。
部署注意事项
虽然 Docker 部署很简单,但在生产环境中还是有几点需要注意:
- 存储规划:向量数据库会占用不少磁盘空间。如果计划处理大量文档,建议给 Chroma 或 Qdrant 分配至少 50GB 的持久化存储。
- 模型选型:如果追求完全离线,推荐使用 Qwen3-32B 或 Llama-3-70B 配合 Ollama 部署。如果不太在意隐私,用 Claude 或 GPT-4o 做后端的效果最好。
- Embedding 模型:中文场景强烈推荐 BAAI/bge-large-zh-v1.5 或 m3e-large。英文场景可以用 text-embedding-3-small 或 instructor-xl。
- 反向代理:如果要从公网访问,建议加一层 Nginx 反向代理做 HTTPS 终结和访问控制。
写在最后
Open Notebook 让我最兴奋的不是它「复刻」了 Notebook LM,而是它超越了原版——本地部署保障了隐私,多模型支持打破了供应商锁定,开源社区保证了持续迭代的生命力。
想一想,Notebook LM 虽然功能强大,但你的每一条查询、每一份文档都在 Google 的服务器上留下了痕迹。对于个人隐私敏感的内容(比如个人健康记录、财务规划、未发表的研究成果),这始终是一个需要权衡的问题。Open Notebook 的价值恰恰在于——它把选择权交还给了用户。你可以选择完全离线运行,也可以选择只信任特定的模型供应商。
此外,开源社区的迭代速度也是一个巨大的优势。Notebook LM 从发布到现在,核心功能几乎没有大的变化。而 Open Notebook 在社区贡献者的推动下,几乎每个月都有新的 feature 上线——上周刚刚有人贡献了一个「PDF 标注导出」功能,这周又有人在开发「多人协作」模式。
如果你也在寻找一个能把知识「盘活」的工具,试试 Open Notebook。不需要上传数据到云端,不需要担心隐私泄露,只需要一个 Docker 命令就能拥有你自己的「第二大脑」。而且因为它是开源的,你甚至可以定制它的行为——比如训练自己的摘要模型、接入企业内部的数据源、或者开发一个自定义的播客主持人风格。
开源的力量,就是让你拥有选择权——选择在哪运行、用什么模型、数据属于谁。