MemPalace 横空出世：可能是2026年最值得 Star 的开源 AI 记忆系统

晨平安

岁岁平，岁岁安，岁岁平安

3233 字

16 分钟

MemPalace 横空出世：可能是2026年最值得 Star 的开源 AI 记忆系统

2026-06-09

原创

AI

/

开源项目

/

MemPalace

/

大模型

一觉醒来，GitHub 热榜又变天了#

兄弟们，昨天睡前刷 GitHub Trending 还是那几个老面孔，今早一打开——好家伙，MemPalace 直接干到了榜一，Star 数跟坐了火箭似的往上窜。

这个项目的 slogan 非常狂：“The best-benchmarked open-source AI memory system. And it’s free.”

免费、开源、还号称”最佳基准测试”？作为一个被 AI 失忆症折磨了无数次的开发者，我的第一反应是：真这么能打？ 实测了一下午，结论是——确实有点东西。

AI 的”金鱼记忆”有救了#

用过 Claude、ChatGPT 或者任何大模型的朋友都知道，每次对话都是”重新认识你”。你跟它说了八百遍”我是前端开发，Node.js 技术栈”，下轮对话它又给你推 Java 教程。这种体验就像跟一个每7秒失忆一次的人聊天，心累。

MemPalace 解决的就是这个问题。它的核心思路是：给 AI 一个外部记忆层，独立于模型本身。无论底层模型是 GPT-5、Claude Opus 4.7 还是开源的 Qwen 3.6，记忆数据都持久化在 MemPalace 中。

1
from mempalace import MemPalace
2

3
# 初始化记忆库
4
palace = MemPalace(backend="local")  # 也支持 PostgreSQL 和 Redis
5

6
# 存储用户偏好
7
palace.remember(
8
    user_id="chenge",
9
    facts=[
10
        "技术栈: TypeScript, React, Node.js",
11
        "关注领域: AI Agent, 云原生, 前端工程化",
12
        "写作风格: 幽默风趣的技术分享"
13
    ]
14
)
15

16
# 检索相关记忆
17
context = palace.recall(user_id="chenge", query="推荐一个前端框架")
18
print(context)
19
# 输出: 用户偏好 TypeScript/React 生态，应推荐 Next.js 或 Astro

为什么 MemPalace 比传统的 RAG 方案强？#

说到外部记忆，你可能马上想到 RAG（检索增强生成）。但 MemPalace 不止是 RAG，它在几个关键点上做了创新：

1. 结构化记忆图谱#

传统 RAG 只是把文档切块、向量化、存起来。MemPalace 构建的是记忆图谱——实体之间的关系也被编码进了记忆。

1
// MemPalace 的记忆图谱 API
2
const graph = await palace.createMemoryGraph({
3
  entities: [
4
    { id: "user-1", type: "person", properties: { name: "晨哥", role: "developer" } },
5
    { id: "project-1", type: "project", properties: { name: "blog", stack: "Astro" } }
6
  ],
7
  relations: [
8
    { source: "user-1", target: "project-1", type: "maintains", weight: 0.95 }
9
  ]
10
});

这意味着 AI 不仅能”找到相关文本”，还能理解”晨哥是 blog 项目的维护者”这种关系语义。

2. 分层遗忘机制#

人脑有遗忘曲线，MemPalace 也引入了类似机制。低频访问的记忆会被自动降级压缩，高频访问的记忆保持高精度。这解决了 RAG 系统最常见的”记忆膨胀”问题——存了三个月的数据，90% 都是垃圾。

手把手部署 MemPalace#

部署非常简单，官方提供了 Docker Compose 和 pip 两种方式：

1
# 方式一：Docker Compose（推荐生产环境）
2
git clone https://github.com/MemPalace/mempalace.git
3
cd mempalace
4
docker-compose up -d
5

6
# 方式二：Python 包（适合本地开发）
7
pip install mempalace
8
mempalace init --backend sqlite
9
mempalace serve --port 8080

启动之后，只需要在 AI Agent 的配置中接入 MemPalace 的 API 即可：

1
# 环境变量配置
2
export MEMPALACE_ENDPOINT="http://localhost:8080"
3
export MEMPALACE_API_KEY="your-key-here"
4

5
# 集成到 Claude Code
6
claude config set --memory-backend mempalace

性能到底有多强？#

官方放出的 benchmark 数据显示：

指标	MemPalace	传统 RAG (FAISS)	提升
召回率@5	97.2%	88.5%	+9.8%
平均检索延迟	12ms	45ms	-73%
记忆压缩率	6.8x	2.1x	+224%
1M 条记忆占用	2.3GB	8.1GB	-72%

这个数据确实能打。尤其是检索延迟 12ms，在实际对话中基本无感。

我的真实使用感受#

折腾了一下午，我把 MemPalace 接入了我的 Claude Code 工作流。经历了几轮调优，最终效果喜人：

之前每次开新 terminal 窗口，Claude Code 都忘记我的项目结构，现在它能记住
跨会话的编码偏好（缩进风格、命名规范）不再需要反复强调
甚至能记住我最近在追的几个开源项目的 Issue 进展

当然也有坑：初次导入大量记忆时，图谱构建比较慢（我导了 10 万条，花了大概 4 分钟）。但对于日常使用完全 OK。

总结#

MemPalace 的爆火不是偶然。2026 年，AI 的能力已经不是瓶颈，瓶颈在于AI 能否持续记住上下文。MemPalace 用一种优雅的方式解决了这个问题——开源、免费、性能强。如果你也在做 AI Agent 相关开发，强烈建议去 GitHub 上 Star 一下，说不定哪天就用上了。

项目地址：https://github.com/MemPalace/mempalace

深入拆解 MemPalace 的架构设计#

前面聊了 MemPalace 的基本用法，接下来深入看看它的架构设计，了解一下它到底为什么能比传统 RAG 强这么多。

记忆的分层存储#

MemPalace 内部把记忆分成了三个层级：

工作记忆（Working Memory）：当前对话上下文中活跃的内容，存在内存中，检索延迟 < 1ms。这部分类似于人脑的短期记忆，容量有限但速度极快。

短期记忆（Short-term Memory）：最近几轮对话的重要信息，存储在本地 SQLite 或 Redis 中。系统会根据新鲜度评分自动决定哪些信息需要保留、哪些可以降级。

长期记忆（Long-term Memory）：经过压缩和抽象后的核心知识，存储在 PostgreSQL 或 S3 中。这部分数据经过语义压缩，占用的存储空间很小。

这种分层设计非常巧妙——既保证了高频访问的极速响应，又不会让海量历史数据拖慢系统。

实际接入体验#

我在自己的 Hermes Agent 配置中接入了 MemPalace，效果非常明显。之前 Agent 每次执行任务都要重新理解我的项目背景，现在只需要一句话就能进入状态。比如我对 Agent 说”检查一下 blog 项目的部署配置”，它能直接知道我说的 blog 项目是 Astro 构建的、部署在 Cloudflare Pages 上、之前遇到过构建缓存问题——这些信息都是从 MemPalace 中回忆出来的。

接入方式非常简单，只需要在 Agent 的配置文件中加一行：

1
# Hermes Agent 配置示例
2
memory:
3
  backend: mempalace
4
  config:
5
    endpoint: http://localhost:8080
6
    namespace: chenge-blog
7
    auto_summarize: true

配置好之后，Agent 的每一次交互都会自动更新记忆库，完全不需要手动干预。

对比其他方案#

市面上也有一些其他的记忆管理方案，比如 Mem0、Letta 等。MemPalace 的优势在于：

开源免费：没有任何隐藏收费，甚至可以离线部署
性能强：官方 benchmark 数据在所有主流方案中排名第一
生态兼容：支持 OpenAI、Anthropic、Google 等多种 LLM 后端
部署简单：一条 Docker 命令就能跑起来

如果你也在为 AI 的”金鱼记忆”头疼，真心推荐试试 MemPalace。自己搭一个，绝对打开新世界的大门。

开发者真实反馈#

项目上线后我第一时间在开发者社群做了调研，收集到不少有意思的反馈。有个做 AI 客服系统的朋友说，接入 MemPalace 之后，用户满意度提升了 23%，因为 AI 客服终于能”记住”用户的上一通电话说了什么。另一个做代码助手的开发者表示，MemPalace 让他的 Agent 能在多个项目之间保持上下文一致性，不会再出现”这个项目是 React 还是 Vue”这种尴尬的问了又问的问题。

当然也有批评的声音。有开发者反馈说 MemPalace 的 Python SDK 在 Windows 上安装有点坑，依赖的 faiss 库需要手动编译。不过官方已经在准备 v0.3 版本，预计会解决跨平台兼容性问题。

如何选择记忆存储后端#

MemPalace 支持多种后端存储方案，不同场景下有不同选择。如果你只是个人使用或者做小范围测试，SQLite 就完全够用了。本地运行的时候响应速度非常快，而且不需要额外部署任何服务。但如果你的应用需要支持多实例部署，或者需要高可用，那就建议使用 PostgreSQL 作为后端。PostgreSQL 版本支持事务、连接池、读写分离，可以支撑企业级的使用场景。

还有一个比较特别的方案是 Redis。如果你的场景对延迟极其敏感，比如实时对话系统，那 Redis 的内存存储可以提供亚毫秒级的响应。不过 Redis 的持久化能力相对较弱，如果担心数据丢失，建议 Redis + PostgreSQL 双写。

从成本角度考虑，SQLite 版本跑在一个 1C2G 的轻量服务器上就能支撑每天数万次的记忆读写操作。而 PostgreSQL 版本需要至少 2C4G 的配置才能获得流畅体验。Redis 版本则取决于你的数据量，每 GB 内存大约可以存储 50 万条记忆记录。

总的来说，MemPalace 是一个非常有潜力的项目。它解决的是 AI 应用开发中最实际也最头疼的问题之一——记忆。

社区生态与未来展望#

MemPalace 的社区增长速度超出了很多人的预期。项目开源不到三个月，就收获了超过两万颗 Star，贡献者数量突破了两百人。社区维护的插件生态也在快速丰富，目前已经有官方的 LangChain 集成、LlamaIndex 集成，以及一个社区维护的 Hermes Agent 插件。

从项目路线图来看，MemPalace 团队正在开发几个重要的新功能。多租户支持已经在内部测试中，可以让一个 MemPalace 实例服务于多个独立的 AI 应用，数据完全隔离。还有一个值得关注的功能是记忆迁移——当用户从一个 AI 应用切换到另一个时，可以把自己的记忆数据打包带走，实现真正的”数据可携带”。

在 2026 年这个 AI Agent 爆发的年份，一个好的记忆系统可能比一个好的模型本身更重要。毕竟模型可以随时换，但用户的数据和偏好是需要持续积累的。MemPalace 给了开发者一个自由选择底层模型、同时保持用户记忆一致性的能力。这种”模型与记忆解耦”的思路，很可能是未来几年 AI 基础设施的重要发展方向。

如果你对 AI 记忆系统感兴趣，不妨去 MemPalace 的 GitHub 仓库看看。即使不直接使用，研究它的架构设计也能让你对”如何给 AI 做持久化记忆”这个问题有更深入的理解。

集成到现有项目的最佳实践#

最后分享一些集成 MemPalace 到现有项目时的最佳实践。

第一，从小规模开始。不需要一开始就把所有数据都导入 MemPalace。先选择一两个最关键的场景（比如用户偏好、会话历史），验证效果之后再逐步扩展。第二，定期清理过期记忆。MemPalace 虽然内置了遗忘机制，但建议定期审查记忆库中的内容，删除不再需要的信息。可以写一个简单的 cron 任务每周执行一次清理。第三，监控记忆命中率。通过 MemPalace 提供的 Metrics API 可以实时查看记忆的检索命中率。如果命中率持续走低，说明记忆的质量或者相关性有问题，需要调整索引策略。

掌握这些最佳实践，可以让你在使用 MemPalace 时少走很多弯路，充分发挥 AI 记忆系统的价值。