Meta 与 Hugging Face 联手推出 OpenEnv Hub

指南Hugging Face2025年10月23日3 分钟阅读
Meta 与 Hugging Face 联手推出 OpenEnv Hub
Meta 和 Hugging Face 合作推出 OpenEnv Hub,一个共享开放的智能体环境社区中心。智能体环境(Agentic Environment)定义了智能体执行任务所需的一切:工具、API、凭证和执行上下文,为智能体行为带来清晰度、安全性和沙盒控制。

借助 TRL、TorchForge 和 verl 等工具,开源社区已经展示了如何在复杂计算基础设施上扩展 AI。但计算只是硬币的一面,另一面是开发者社区——正是这些人和工具让智能体系统成为可能。这就是为什么 Meta 和 Hugging Face 合作推出 OpenEnv Hub:一个共享开放的智能体环境社区中心。

智能体环境(Agentic Environment)定义了智能体执行任务所需的一切:工具、API、凭证、执行上下文,仅此而已。它们为智能体行为带来了清晰度、安全性和沙盒控制。

这些环境既可用于训练,也可用于部署,是可扩展智能体开发的基础。

问题所在

现代 AI 智能体可以自主执行数千项任务。然而,仅靠大语言模型不足以让这些任务真正运行——它需要访问正确的工具。将数百万工具直接暴露给模型既不现实也不安全。相反,我们需要智能体环境:安全、语义清晰的沙盒,明确定义任务所需内容,仅此而已。这些环境处理关键细节:

  • 明确任务所需的语义
  • 沙盒执行和安全保证
  • 无缝访问经过身份验证的工具和 API

解决方案

为了推动下一波智能体开发浪潮,Meta-PyTorch 和 Hugging Face 合作推出 环境中心:一个共享空间,开发者可以构建、分享和探索兼容 OpenEnv 的环境,用于训练和部署。下图展示了 OpenEnv 如何融入 Meta 正在开发的新后训练堆栈,并与 TRL、SkyRL 和 Unsloth 等其他库集成:

rl_stack

从下周开始,开发者可以:

  • 访问 Hugging Face 上的新环境中心,我们将提供一些初始环境
  • 直接作为人类智能体与环境交互
  • 调用模型在环境中解决任务
  • 检查环境暴露了哪些工具以及如何定义其观察结果
  • 每个上传到 Hub 并符合 OpenEnv 规范的环境都会自动获得这些功能——使得在运行完整 RL 训练之前能够快速轻松地验证和迭代

与此同时,我们发布了 OpenEnv 0.1 规范(RFC),以收集社区反馈并帮助塑造标准。

RFC 进展

在仓库的当前状态下,环境创建者可以使用 step()reset()close() API(属于以下 RFC)创建环境。如何创建此类环境的示例可以在这里看到。环境用户可以为仓库中已有的所有环境使用基于本地 Docker 的环境。以下 RFC 正在审查中:

  • RFC 001: 建立核心组件(如环境、智能体、任务等)如何关联的架构
  • RFC 002: 提出基本环境接口、打包、隔离以及与环境的通信
  • RFC 003: 提出通过环境抽象和隔离边界封装 MCP 工具

使用场景

  • RL 后训练:从集合中拉取环境,并使用它们通过 TRL、TorchForge+Monarch、VeRL 等训练 RL 智能体
  • 环境创建:构建环境并确保其与生态系统中的流行 RL 工具互操作,与协作者分享等
  • 复制 SOTA 方法:通过集成用于智能体编码和软件工程的环境,轻松复制 FAIR 的代码世界模型等方法
  • 部署:用户可以创建环境,在同一环境上训练,然后也用于推理(完整流程)

下一步计划

这只是开始。我们正在将 OpenEnv Hub 与 Meta 的新 TorchForge RL 库集成,并与 verl、TRL 和 SkyRL 等其他开源 RL 项目合作以扩展兼容性。10 月 23 日加入 PyTorch 大会,观看规范的现场演示和演练,并关注我们即将举行的关于环境、RL 后训练和智能体开发的社区聚会。

👉 探索 Hugging Face 上的 OpenEnv Hub,开始构建将驱动下一代智能体的环境。

👉 查看 0.1 规范,可在 OpenEnv 项目中找到实现 → 我们欢迎改进它的想法和贡献!

👉 在 Discord 上参与讨论,与社区交流 RL、环境和智能体开发

👉 亲自尝试 - 我们创建了一个全面的笔记本,引导你完成端到端示例,当然你也可以通过 PyPI 轻松 pip 安装包。这个笔记本介绍了我们构建的抽象,以及如何使用现有集成和添加你自己的示例 - 在 Google Colab 中试试吧!

👉 查看支持平台 - UnslothTRLLightning.AI

让我们一次一个环境,共同构建开放智能体的未来 🔥!

本文编译自 Building the Open Agent Ecosystem Together: Introducing OpenEnv,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论