Lawrence Jengar
2025年12月09日 16:49
代理工程正在成为开发可靠人工智能系统的关键学科。了解它如何将产品思维、工程和数据科学结合起来,用于非确定性系统。
根据LangChain最近的一篇博客文章,代理工程正被认为是开发可靠人工智能系统的重要学科。这一新兴领域解决了从开发到生产的过渡挑战,特别是对于依赖大型语言模型(LLMs)并表现出非确定性行为的系统。
什么是代理工程?
代理工程被定义为将非确定性LLM系统精炼为可靠生产体验的迭代过程。这个过程是循环的,包括构建、测试、部署、观察、改进和重复的阶段。目标不仅仅是推出产品,而是通过从生产环境中的表现获取见解来持续改进它。
这一新学科结合了三个关键技能集:
- 产品思维:涉及定义范围和塑造代理行为。它需要编写引导代理行动的提示,并理解代理应该执行的工作。
- 工程:专注于构建代理在生产中运行所需的基础设施。这包括开发用户界面以及管理内存和执行。
- 数据科学:随时间测量和改进代理性能,使用A/B测试和错误分析等工具来优化代理行为。
代理工程的出现和必要性
代理工程的必要性源于两个重大转变。首先,LLMs已经能够处理复杂的多步骤工作流程,正如LinkedIn和Clay等公司所展示的那样,它们使用代理执行从CRM更新到人才库扫描等任务。其次,LLMs固有的不可预测性需要一种新方法来确保在生产环境中的可靠性。
代理与传统软件不同,因为它们可以以各种方式解释输入并根据上下文进行调整。这种灵活性意味着每个用户输入都可能是一个边缘情况,传统的调试方法通常无效。因此,代理工程强调观察真实世界的行为并基于这些观察来改进系统。
代理工程的实际应用
在实践中,代理工程涉及构建、测试和改进的循环。最初,工程师必须建立代理的基础架构,无论是涉及简单的LLM调用还是更复杂的系统。针对假设场景进行测试有助于发现初始问题,但真实世界的部署对于理解实际用户交互是必要的。
在生产中持续观察和评估代理性能允许系统性改进。这种方法确保代理不仅功能正确,而且能提供有意义的商业价值。正如LangChain所指出的,成功的团队是那些接受快速迭代并将生产视为持续学习过程的团队。
工程的新标准
代理工程有望成为人工智能开发中的标准实践,这是由需要可靠处理需要人类般判断任务的系统所驱动的。该学科强调从生产中学习的重要性,并快速迭代以提高代理的可靠性和功能性。
随着组织越来越依赖代理处理复杂工作流程,采用代理工程实践将对充分发挥LLMs的潜力至关重要,同时确保在生产环境中的信任和可靠性。
图片来源:Shutterstock
来源:https://blockchain.news/news/agent-engineering-bridging-development-production


