LangChain揭示代理构建平台背后的记忆架构

Joerg Hiller
2026年2月22日 04:38

LangChain详细介绍了其Agent Builder记忆系统如何使用文件系统隐喻和COALA框架来创建持久化、可学习的AI代理，无需编写代码。

LangChain揭开了为其LangSmith Agent Builder提供动力的记忆架构的面纱，展示了一种基于文件系统的方法，让AI代理能够跨会话学习和适应，而无需用户编写代码。

该公司做出了一个非常规的选择：从第一天起就优先考虑记忆功能，而不是像大多数AI产品那样后期添加。他们的理由是什么？Agent Builder创建的是特定任务的代理，而不是通用聊天机器人。当代理重复处理相同的工作流程时，周二会话中的经验应该自动应用到周三。

文件即记忆

LangChain团队没有构建自定义记忆基础设施，而是利用了LLM已经很好理解的东西——文件系统。该系统将代理记忆表示为文件集合，尽管它们实际上存储在Postgres中，并以虚拟文件系统的形式暴露给代理。

该架构直接映射到COALA研究论文的三种记忆类别。程序性记忆——驱动代理行为的规则——存储在AGENTS.md文件和tools.json配置中。语义记忆，涵盖事实和专业知识，存储在技能文件中。团队在初始版本中故意跳过了情景记忆（过去行为的记录），认为它对他们的用例来说不那么重要。

在可能的情况下采用标准格式：核心指令使用AGENTS.md，专业任务使用代理技能，子代理使用受Claude Code启发的格式。唯一的例外？使用自定义tools.json文件而不是标准mcp.json，允许用户仅从MCP服务器暴露特定工具，避免上下文溢出。

实际结果是：代理通过纠正而非配置来改进。LangChain演示了一个会议摘要器示例，用户简单的"改用项目符号"反馈会自动更新代理的AGENTS.md文件。到第三个月，代理已经积累了格式偏好、会议类型处理规则和参与者特定指令——所有这些都无需手动配置。

构建这个系统并非易事。团队专门安排一个人全职负责与记忆相关的提示工程，解决诸如代理在不该记忆时记忆或写入错误文件类型等问题。一个关键教训是：代理擅长添加信息，但难以整合。一个电子邮件助手开始列出每个要忽略的供应商，而不是概括为"忽略所有冷联系"。

默认情况下，所有记忆编辑都需要明确的人工批准——这是针对提示注入攻击的安全措施。如果用户不太担心对抗性输入，可以禁用这种"yolo模式"。

文件系统方法实现了锁定DSL无法匹配的可移植性。在Agent Builder中构建的代理理论上可以在Deep Agents CLI、Claude Code或OpenCode上运行，几乎没有摩擦。

LangChain概述了几项计划改进：通过将对话历史暴露为文件来实现情景记忆、每天运行的后台记忆进程以捕获遗漏的学习、明确的/remember命令、超越基本grep的语义搜索，以及用户级或组织级记忆层次结构。

对于构建AI代理的开发人员来说，这里的技术选择很重要。文件系统隐喻避开了自定义记忆API的复杂性，同时保持LLM原生。当代理处理更复杂、更长期运行的任务时，这种方法是否可扩展仍然是一个悬而未决的问题——但LangChain押注文件在无代码代理构建中胜过框架。

图片来源：Shutterstock

来源：https://blockchain.news/news/langchain-agent-builder-memory-system-architecture