独立的智能体记忆系统梳理

发布时间：2026/6/30 6:44:38

顺序Mem0 → Graphiti → Cognee → Letta → LangMem → Memary → agentmemory。每个项目押六块设计哲学 / 记忆模型内部机制 / 关键算法 / 工程取舍 / 反模式 / 与同类差异。1. Mem0设计哲学做AI 的记忆层不碰 Agent 运行时不碰知识图谱的复杂玩法目标就是让任何现有 Agent 用几行代码挂上一层记住用户说过什么的能力。克制是它的核心竞争力——也因此成了 YC S24 以来该赛道星数断层第一~60k。记忆模型内部机制Mem0 的本质是扁平事实集合向量语义去重合并。存储是三层混合这是新版细节容易被漏掉向量嵌入做语义相似、Property Graph 做实体关系、KV 做结构化事实——但Property Graph 那层只在 Pro 及以上套餐开放Hobby/Starter 只能用到向量KV 。也就是说开源版Apache-2.0的图能力是有限的多跳推理弱。写入四步流水线ExtractLLM 从对话抽原子事实“用户喜欢 Python”“用户住杭州”Match新事实向量化与存量做相似度搜索默认阈值 0.8DecideLLM 对每对新旧事实判 ADD / UPDATE / DELETE / NOOP——这是 Mem0 的核心专利级设计不是简单覆盖Persist异步写入memory.add()可在抽取完成前就 return批量刷向量库关键算法冲突消解是语义级 LLM judge不是时间戳盖帽。这带来灵活性也带来不确定性——LLM 判错就会出脏数据。异步写入批处理是它 p95 延迟能压 91% 的关键。工程取舍写入 LLM 调用 2 次/条抽取决策高频场景下写入成本会累积但检索 token 极省top-5~10 事实插 context无原生时间轴只靠updated_at做近因衰减问去年他喜欢什么答不准LOCOMO 66.9%OpenAI Memory 52.9%LongMemEval 整体 ~85%、时态子集仅 ~49%反模式需要事实变更追溯合规/审计、需要多跳用户的上级的部门、需要多模态——这三样都别用 Mem0。与同类差异比 LangMem 功能全冲突消解更智能、生态大得多比 Graphiti/Cognee 轻得多但时态和多跳都弱。是通用对话记忆的默认解不是最优解。2. GraphitiZep 开源核心设计哲学事实随时间变记忆必须能精确记录什么时候有效、什么时候观察到。这是 Zep 团队做商业化长期记忆平台的那家开源的引擎主仓库getzep/graphitigetzep/zep只是示例集合。记忆模型内部机制双时态知识图谱——每条边带valid_from/valid_to事实在现实世界的生效区间observed_at系统观察到的时间。这是七家里唯一把双时态做成一等公民的。工作流程事件流入对话/日志/API 调用带时间戳LLM 抽实体关系时间标注建图时若新边与旧边在同实体同区间冲突 →旧边valid_to切到新边valid_from新边插入不覆盖完整保留变更链检索分两种当前状态取valid_to ∞和历史回溯指定 t取valid_from ≤ t valid_to存储依赖图数据库Neo4j / FalkorDB / Memgraph / Neptune 均可向量索引外接做语义初筛再图内做时间过滤多跳扩展。关键算法增量更新不重建全图每次只动局部子图单实体邻域通过边时间区间切分实现。这是它能在高频更新下仍保持 ~300-800ms p50 写入延迟的原因。工程取舍需维护图数据库Neo4j 社区版免费但企业版收费抽取质量敏感开源版需自配 promptZep Cloud 有专门抽取模型引擎开源但 UI/多租户/监控在 Zep Cloud自托管要自己补LongMemEval 时态子集 63.8%Mem0 仅 49%——时态赛道它第一反模式闲聊偏好记忆杀鸡用牛刀且强制结构化三元组让闲聊不自然、快速原型、资源受限环境。与同类差异Cognee 也有图时间属性但不是双时态区间语义Letta 有时间戳但非区间Mem0/LangMem/Memary/agentmemory 连区间都没有。要答截至 2022 年底张三在哪只有 Graphiti 不打折扣。3. Cognee设计哲学企业级全栈记忆平台——把文档/对话/音频/图像等非结构化数据沉淀成向量图本体三层可推理知识并能长期演化。野心比 Mem0/Graphiti 都大代价也最大。记忆模型内部机制三层叠加——向量层Milvus/Qdrant存文档片段实体嵌入图层Neo4j存实体关系支持多跳本体层可选RDF/OWL定义域约束“员工⊆人”就职于的 domain人、range公司核心管线ECLExtractLLM 从多模态输入抽实体/关系/属性图像走 caption→抽音频走 ASR→抽Cognify归一化Apple Inc.“≡苹果公司”、消歧同名实体、冲突处理、建图Load写入向量库图库Memify模块定期对整个知识库做高层摘要生成这人最近关注什么项目里程碑类摘要节点。检索Hybrid Retrieval向量 top-k → 实体锚点在图里扩 1-2 跳 → 融合摘要节点重排。关键算法本体推理是它独有的——张三隶属市场部市场部属销售体系 → 张三属销售体系这种不需要 LLM靠图论本体约束推。工程取舍部署最重向量库图库可选本体服务器Docker Compose 能起但生产调优需专业ECL 管线 LLM 调用 4-6 次/条抽取归一化消歧建图写入成本七家最高延迟秒级——不适合在线高频适合离线批量HotPotQA 多跳 Correctness 0.815baseline 0.476内置多租户隔离反模式实时对话记忆太慢、个人轻量项目太重、不需要多跳的场景浪费。与同类差异唯一同时有向量图本体多模态的四合一。Graphiti 只有图双时态但无本体无多模态Mem0 只有向量弱图Cognee 是企业知识大脑定位别的都不是。4. Letta原 MemGPT设计哲学Agent 应像 OS 管物理内存一样自主管自己的记忆。它不是记忆层是完整 Agent 运行时——这点跟其他六家根本不同。源自 UC Berkeley 研究项目 MemGPT后商业化 Letta Inc. 。记忆模型内部机制三层文本块——Core Memory常驻上下文的固定长度文本块如 2048 tokensAgent 通过core_memory_append/core_memory_replace工具自编辑始终在 context 里Recall Memory历史对话向量的索引Agent 通过recall_query语义搜Archival Memory更大的外部知识向量索引运行循环每轮用户消息 → LLM 生成响应可选调记忆工具把重要信息写 Core或把过时 Core 内容挪 Recall 存档。Agent 自主决定记什么、忘什么——这是 Letta 的灵魂。多 Agent 可共享同一 Archival Memory实现记忆池协作。关键算法自主管理的可靠性问题——LLM 判错会破坏记忆。Letta 加了记忆编辑验证Core Memory 修改前用另一个 LLM 调用来校验合理性但增加成本延迟。工程取舍需跑 Letta ServerDocker PG运维比纯库重调试难自主决策黑盒出问题难定位是 LLM 还是逻辑不是纯记忆层想嵌现有 Agent 得改架构虽提供 LangGraph 适配可作节点写入 p50 ~150-400ms同步 Core 更新LongMemEval 整体 ~83%但自主管理方差大反模式只要纯记忆层嵌入现有 Agent、要精确事实变更追踪、资源受限——这三样别用 Letta。与同类差异七家里唯一让 Agent 自管记忆的其余六家都是开发者/系统被动写入。好处是灵活拟人坏处是不可预测调试难。没有图谱多跳。5. LangMem设计哲学LangChain/LangGraph 生态内最小摩擦记忆库。假设你已经在用 LangChain 全家桶那 LangMem 就是最自然的插法。不追求功能全追求集成顺。记忆模型内部机制纯向量语义检索按User / Session / Thread三级命名空间隔离。关键特性是后台 consolidation——Agent 空闲时启动后台进程对用户全量记忆做摘要合并去重类似 Mem0 异步摘要但更绑 LangGraph 执行框架。关键算法无图谱无时态consolidation 策略可自定义。存储后端用 LangChain VectorStore 接口可插拔。工程取舍强绑 LangChain——非 LangChain 项目基本不用考虑功能相对基础~1.8k ⭐较新社区和生态远小于 Mem0部署难度低LangGraph 内嵌但写入 LLM 调用类似 Mem0抽取合并反模式非 LangChain 栈、复杂推理、企业级生产功能未成熟。与同类差异与 Mem0 最像但 Mem0 框架无关且生态大得多LangMem 胜在 LangGraph 深度集成节点可直接读写 LangGraph State可被其他节点监听触发。已用 LangGraph 则 LangMem 更顺否则 Mem0。6. Memary设计哲学对话→知识图谱的最轻量实现在 Mem0 的简洁和 Cognee 的图谱之间取平衡点但更偏能跑就行的原型级。记忆模型内部机制LLM 从对话抽三元组 → 追加到图默认 NetworkX 内存图可换 Neo4j。无双时态冲突处理简单覆盖或并存。跟踪实体活跃度做隐式近因——近期高频提及的实体权重升高。工程取舍最轻量可零外部依赖用 NetworkX适合黑客松/教育社区小~3k ⭐文档有限生产不合适无本体、无时间轴、无复杂冲突消解——图谱本质是关系化事实列表不是真知识图谱检索实体名精确匹配嵌入语义匹配无多跳优化反模式生产环境、大规模、需要时态/多跳——三样都别用。与同类差异是所有图谱方案里最轻但最弱的。Graphiti 双时态、Cognee 三层本体Memary 在中间但偏玩具验证。真要生产图谱选 Graphiti 或 CogneeMemary 是学习和原型用的。7. agentmemory设计哲学Coding Agent 行为记忆专用——通用对话记忆“用户喜欢猫”和 Coding Agent 记忆“上次用 npm 装的 jose 不是 jsonwebtoken装失败了”是两种东西后者才是 agentmemory 要解决的。记忆模型内部机制4 层记忆巩固管线工作记忆原始观察工具调用、文件变更情景记忆压缩的会话摘要语义记忆提取的事实和模式“用户偏好 jose”程序记忆工作流和决策模式“N1 查询用 include 解决”存储SQLiteBM25 向量简单图关系零外部依赖。关键算法12 个 Claude Code hooks 自动捕获SessionStart / UserPromptSubmit / PreToolUse / PostToolUse / PreCompact / Stop / SubagentStart/Stop / SessionEnd 等Codex 6 个 hooks ——这是它与其他六家最大不同写入不靠 LLM 抽取靠 Hook 自动抓工具调用链所以写入 0 次 LLM 调用检索BM25关键词向量语义知识图谱实体关系三者融合LongMemEval-SR5 95.2%BM25-only 才 86.2%年 token 从 ~1950 万压到 ~17 万成本从 ~$500 压到 ~$10工程取舍领域专用Coding Agent不适通用对话单用户为主多租户需自扩支持 MCP / REST / Native 三种接入兼容 Claude Code、Codex CLI、Cursor、Gemini CLI、OpenCode、Hermes 等~14.3k ⭐月增显著反模式通用对话记忆、多租户企业场景、需要复杂多跳推理。与同类差异记忆单元是行为记录不是事实陈述写入靠 Hook 不是 LLM 抽取——这两点让它和其他六家不可比只能看场景匹不匹配。Coding Agent 场景下它比 Mem0 更对口Mem0 记用户喜欢猫agentmemory 记上次 npm 装 jose 失败了。二、七个项目画像卡片表字段Mem0GraphitiCogneeLettaLangMemMemaryagentmemory定位轻量对话事实记忆层双时态知识图谱引擎全栈图向量本体记忆平台有状态 Agent 运行时自主记忆LangGraph 原生记忆库对话驱动轻量图谱Coding Agent 行为记忆出身YC S24 / mem0.aiZep 团队getzeptopoteretesUC Berkeley → Letta Inc.LangChain 团队kingjulio8238rohitg00协议Apache-2.0Apache-2.0Apache-2.0Apache-2.0MITMITApache-2.0主语言Python TSPythonPythonPythonPythonPythonPython最新版本(2026.6)v2.0.8 (6/24)v0.29.2 (6/8)v1.2.2 (6/26)0.16.8 (5/14)v0.2.x 活跃未明示v0.9.22 (5/22)GitHub ⭐~60k~28k~24k~23.5k~1.8k~3k~14.3k存储向量KVPro图图库向量外接向量图本体向量Server 状态VectorStore 可插拔NetworkX/Neo4jSQLiteBM25向量简图记忆模型扁平事实语义合并双时态图谱ECL 管线三层Core/Recall/Archival 分层向量命名空间对话→三元组图4 层行为巩固时态无仅 updated_at双时态valid/from/toobserved节点时间属性时间戳检索无无时间戳多跳弱Pro 图强图时间过滤最强含本体推理无无弱弱多模态否否是文/音/图否否否否部署难度⭐ 最低⭐⭐⭐ 中图 DB⭐⭐⭐⭐ 重多存储⭐⭐⭐⭐需 Server⭐⭐LangGraph 内⭐ 最低⭐ 最低零依赖写入 LLM 调用2 次/条1 次抽取图更新4-6 次/条ECL中自决可选验证低-中1 次抽取0 次Hook 抓写入 p50~80-200ms 异步~300-800ms秒级~150-400ms 同步类似 Mem0轻量Hook 级极低托管云Mem0 PlatformZep Cloud企业版Letta Cloud无无无MCP 支持是是是是未内置未内置是原生版本与星数口径GitHub API 2026-06-27 前后 agentmemory ⭐ 采 6 月初 ~14.3k 近期仍在涨写入延迟采 LongMemEval 采。三、全维度细粒度对比拆四张子表子表 A记忆模型与算法维维度Mem0GraphitiCogneeLettaLangMemMemaryagentmemory核心抽象抽取事实向量双时态边ECL 管线三层自编辑文本块向量consolidation对话→三元组4 层行为巩固时态机制无原生区间valid/from/to observed_at节点时间属性时间戳检索无无时间戳冲突消解LLM judgeADD/UPD/DEL/NOOP边时间区间切分自动失效新建Cognify归一化消歧Agent 自编辑可选验证后台合并摘要简单覆盖/并存追加为主记忆压缩异步 per-user 摘要图演化即压缩Memify 深度摘要节点Core/Archival 分层Agent 自管后台 consolidation无4 层管线自动压缩多跳能力弱Pro 属性图强图遍历时间过滤最强图本体推理无无弱基础三元组弱简单关联检索混合方式向量语义 top-k向量初筛→图时间过滤多跳向量 top-k→图扩→摘要融合Core 常驻Recall 向量搜向量 top-k命名空间实体精确嵌入BM25向量简图子表 B工程与部署维维度Mem0GraphitiCogneeLettaLangMemMemaryagentmemory存储依赖向量库可插拔最轻Neo4j/FalkorDB/Memgraph 向量向量库图库可选本体向量库Letta Server(PG)LangChain VectorStoreNetworkX(可Neo4j)SQLite 零依赖外部服务无图 DB 服务向量图本体服务Letta Server无LangGraph 内可无无部署难度⭐ 最低⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐写入 LLM 调用/条2抽取决策1图更新4-6ECL 多次中自决可选验证 LLM低-中1抽取0Hook 自动写入 p50~80-200ms 异步~300-800ms秒级~150-400ms 同步类似 Mem0轻量Hook 级极低多租户原生 User/Org需自实现内置内置多 AgentLangGraph namespace需自实现单用户为主自托管完整度完全Apache引擎开源UI 在 Zep Cloud完全Apache完全Apache完全MIT 库完全完全子表 C生态与集成维维度Mem0GraphitiCogneeLettaLangMemMemaryagentmemoryGitHub ⭐~60k~28k~24k~23.5k~1.8k~3k~14.3k维护活跃当天有推送活跃当天有推送活跃较新迭代中独立维护活跃月增显著框架集成LangGraph/CrewAI/AutoGen/Vercel 等 21 个LangGraph/CrewAI/LlamaIndexLangGraph/CrewAILangGraph 自有LangGraph 原生深度少MCP/REST/NativeMCP 支持是是是是未内置未内置是原生12 hooks云托管Mem0 PlatformZep Cloud企业版Letta Cloud无无无生态绑定框架无关需图 DB需多存储需接受 Server强绑 LangChain无偏 Claude Code/Codex/Cursor商业背书YCS24, $24M Series AZep 商业化topoteretesLetta Inc.伯克利系LangChain 团队独立独立子表 D性能与 Benchmark 维维度Mem0GraphitiCogneeLettaLangMemMemaryagentmemoryLOCOMO 准确率66.9%OpenAI 52.9%——————LongMemEval 整体~85%——~83%无独立公开无—LongMemEval 时态子集~49%63.8%时态最强——无无—HotPotQA 多跳——0.815baseline 0.476—无无—LongMemEval-S R5————无无95.2%BM25-only 86.2%Token 节省降 ~90%——Core 常驻极小类似 Mem0轻量年 $500→$10p95 延迟改善降 91%——————四、场景选型对比按场景倒推每个场景给「首推 / 备选 / 选型原因」。场景首推备选选型原因对话 Bot / 客服 / 角色扮演快速加偏好记忆Mem0LangMem若已用 LangGraph接入最短、生态最大、token 最省、异步写入不拖响应LangChain/LangGraph 栈项目要原生记忆巩固LangMemMem0LangMem 与 LangGraph State 深度集成可监听触发非 LangChain 栈则换 Mem0需要什么时候知道的、事实怎么变的——CRM/审计/合规Graphiti无同级替代七家里唯一双时态边区间切分保留完整变更链别家用快照/日志绕会很痛企业文档→多跳 QA要本体推理“张三上级的部门预算”CogneeGraphiti若只需时态不需本体唯一向量图本体三层ECL 多模态摄入Memify 压缩但部署重、写入贵从零搭有状态自主 Agent要它自己管记忆、长期进化Letta无同级替代唯一 Agent 自编辑 Core MemoryOS 式三层但不可预测调试难要接受 Server多 Agent 共享记忆池协作LettaArchival 共享Cognee多 Agent 读写同实例Letta 的共享 Archival 是设计内特性Cognee 靠多租户图共享也行但更偏知识库黑客松 / 教育 / 想快速看对话→图谱概念验证MemaryMem0若不要图最轻量图谱NetworkX 零依赖但生产别用本地 Coding Agent 记行为Claude Code/Codex/Cursor…agentmemoryMem0但领域不对口12 hooks 自动抓工具调用4 层巩固BM25向量图融合R5 95.2%年成本 $10Mem0 记不了上次 npm 装 jose 失败这种操作记忆快速原型验证记忆概念不想装任何数据库agentmemory 或 MemaryMem0要向量库agentmemorySQLite和 MemaryNetworkX都是零/极低外部依赖agentmemory 偏 Coding、Memary 偏对话图谱组合配方没有银弹时的常见搭法三个实战中常见的混用思路解决单一系统覆盖不到的边界Mem0 GraphitiMem0 管日常对话偏好快、省 token、异步Graphiti 管关键事实变更客户地址变更史、合同状态流转、人员任职链——写双路按场景读。适合 SaaS 客服CRM 混合。Letta CogneeLetta 当 Agent 运行时Core/Recall 管短期交互Agent 自管理Cognee 当外部 Archival 知识库企业文档→图谱多跳推理——Letta 的 Archival 后端换成 Cognee。适合企业级有状态 Agent。LangMem GraphitiLangGraph 工作流内LangMem 管简单用户偏好User/Session 命名空间Graphiti 作为 LangGraph 节点专门答时态查询“上季度他的负责人是谁”——同工作流内两路记忆并存。适合已用 LangGraph 又需要时态的中型项目。

文章详情

独立的智能体记忆系统梳理

相关新闻

最新新闻

日新闻

周新闻

月新闻