谷歌正式定义生产级AI Agent：5级分类、5步循环、A2A交互与Agent Ops运维

今天先来大致了解一下这份新的Agent白皮书里有哪些内容。

1.什么是AI Agent： Agent被定义为一个完整的应用程序，它结合了四个要素：

模型：核心的推理引擎。

工具：连接世界、执行操作的机制（如API、数据库）。

编排层：管理操作循环（如规划、记忆）。

部署：使其成为可靠服务的生产环境。

（通用Agent架构和组件）

2.Agent解决问题的过程：Agent通过一个五步循环来工作：

第一步，获取任务 (Get the Mission)：收到一个高层目标。

第二步，扫描场景 (Scan the Scene)：收集环境和记忆中的上下文。

思考 (Think It Through)：制定或调整一个多步骤计划。

采取行动 (Take Action)：执行计划中的一步（例如调用一个工具）。

观察与迭代 (Observe and Iterate)：观察行动结果，更新记忆，然后重复思考步骤。

3.Agent系统分类法：这份白皮书提出了一个5级分类法来界定代理的能力：

级别 0：核心推理系统（单独的LM，没有工具）。

级别 1：互联的问题解决者（能使用工具获取实时信息）。

级别 2：战略性的问题解决者（能为复杂的多步骤目标制定计划）。

级别 3：协作式多代理系统（由“专家”代理组成的团队协同工作）。

级别 4：自我进化的系统（能动态创造新工具或新代理来填补能力空白）。

4.Multi-Agent 系统

解决复杂任务的最佳方式不是构建一个Super Agent，而是采用专家团队的模式。包括使用“协调器”模式（一个“Manage” Agent分配任务）或“迭代优化”模式（一个“Generator Agent”和一个“Critic Agent”）。

5.Agent部署

这份白皮书里讨论了如何将代理部署到服务器上，例如使用Vertex AI Agent Engine或Cloud Run/GKE等容器化服务。

6.Agent Ops（Agent运维）

这是管理Agent系统“不可预测性”的结构化方法，是DevOps和MLOps的演进。

7.Agent评估

确定Agent评估指标：如目标完成率、成本。

评估方式LM-as-Judge：由于代理的输出是概率性的，不能用简单的“通过/失败”测试，而是使用一个强大的模型根据预定义的标准来评估输出质量。

8.Agent交互性

Agent与人的交互：通过聊天界面、动态UI或实时的“实时模式”进行多模态通信。

Agent之间的交互：使用 A2A（Agent2Agent）协议，代理可以通过发布“代理卡”（Agent Card）来被发现，并通过异步任务进行通信。

Agent与Money的交互: 讨论了新兴的支付协议（如AP2），以实现安全的代理交易。

9.Agent安全性

对于单个Agent，安全性是在效用和风险之间进行权衡。这份白皮书推荐采用混合方法：

确定性护栏：硬编码的规则（例如，阻止超过100美元的购买）。

基于推理的防御：使用专门的“护卫模型”来审查Agent的计划。

对于企业级安全性：

Agent身份： Agent是继人类用户和服务账户之后的第三类主体。它们需要自己可验证的身份（如SPIFFE），以实现最小权限的精细化控制。

治理：为防止“Agent sprawl”（代理泛滥），企业需要一个中央网关或控制平面来管理所有Agent的流量、身份验证和策略执行。

10. Agent学习和进化

Agent通过运行时经验（如日志、人类反馈）和外部信号（如更新的公司政策）进行学习。通过增强上下文工程（优化提示）或工具优化（动态创建新工具）来进化。

示例：

AlphaEvolve Agent：一个使用进化过程来发现和优化算法的AI Agent。

本文由公众号“草莓派”授权转载｜ https://mp.weixin.qq.com/s/bHj_YLtzGWtQguUHrP_tvA ｜（编辑：ZN）

⬆ 扫码加入AI产品交流社群，你有机会得到：

- 最值得关注的AI产品；

- 最新鲜的 AI 产品资讯；最实用的AI产品使用经验；

- 还有不定期赠送热门新品的邀请码、会员码。

评论 (0)