Joerg Hiller
2026年2月22日 04:38
LangChain详细介绍了其Agent Builder记忆系统如何使用文件系统隐喻和COALA框架来创建持久化、可学习的AI代理,无需编写代码。
LangChain揭开了为其LangSmith Agent Builder提供动力的记忆架构的面纱,展示了一种基于文件系统的方法,让AI代理能够跨会话学习和适应,而无需用户编写代码。
该公司做出了一个非常规的选择:从第一天起就优先考虑记忆功能,而不是像大多数AI产品那样后期添加。他们的理由是什么?Agent Builder创建的是特定任务的代理,而不是通用聊天机器人。当代理重复处理相同的工作流程时,周二会话中的经验应该自动应用到周三。
文件即记忆
LangChain团队没有构建自定义记忆基础设施,而是利用了LLM已经很好理解的东西——文件系统。该系统将代理记忆表示为文件集合,尽管它们实际上存储在Postgres中,并以虚拟文件系统的形式暴露给代理。
该架构直接映射到COALA研究论文的三种记忆类别。程序性记忆——驱动代理行为的规则——存储在AGENTS.md文件和tools.json配置中。语义记忆,涵盖事实和专业知识,存储在技能文件中。团队在初始版本中故意跳过了情景记忆(过去行为的记录),认为它对他们的用例来说不那么重要。
在可能的情况下采用标准格式:核心指令使用AGENTS.md,专业任务使用代理技能,子代理使用受Claude Code启发的格式。唯一的例外?使用自定义tools.json文件而不是标准mcp.json,允许用户仅从MCP服务器暴露特定工具,避免上下文溢出。
自我构建的记忆
实际结果是:代理通过纠正而非配置来改进。LangChain演示了一个会议摘要器示例,用户简单的"改用项目符号"反馈会自动更新代理的AGENTS.md文件。到第三个月,代理已经积累了格式偏好、会议类型处理规则和参与者特定指令——所有这些都无需手动配置。
构建这个系统并非易事。团队专门安排一个人全职负责与记忆相关的提示工程,解决诸如代理在不该记忆时记忆或写入错误文件类型等问题。一个关键教训是:代理擅长添加信息,但难以整合。一个电子邮件助手开始列出每个要忽略的供应商,而不是概括为"忽略所有冷联系"。
需要人工批准
默认情况下,所有记忆编辑都需要明确的人工批准——这是针对提示注入攻击的安全措施。如果用户不太担心对抗性输入,可以禁用这种"yolo模式"。
文件系统方法实现了锁定DSL无法匹配的可移植性。在Agent Builder中构建的代理理论上可以在Deep Agents CLI、Claude Code或OpenCode上运行,几乎没有摩擦。
未来计划
LangChain概述了几项计划改进:通过将对话历史暴露为文件来实现情景记忆、每天运行的后台记忆进程以捕获遗漏的学习、明确的/remember命令、超越基本grep的语义搜索,以及用户级或组织级记忆层次结构。
对于构建AI代理的开发人员来说,这里的技术选择很重要。文件系统隐喻避开了自定义记忆API的复杂性,同时保持LLM原生。当代理处理更复杂、更长期运行的任务时,这种方法是否可扩展仍然是一个悬而未决的问题——但LangChain押注文件在无代码代理构建中胜过框架。
图片来源:Shutterstock
来源:https://blockchain.news/news/langchain-agent-builder-memory-system-architecture


