Meta 与 Hugging Face 联手推出 OpenEnv Hub
借助 TRL、TorchForge 和 verl 等工具,开源社区已经展示了如何在复杂计算基础设施上扩展 AI。但计算只是硬币的一面,另一面是开发者社区——正是这些人和工具让智能体系统成为可能。这就是为什么 Meta 和 Hugging Face 合作推出 OpenEnv Hub:一个共享开放的智能体环境社区中心。
智能体环境(Agentic Environment)定义了智能体执行任务所需的一切:工具、API、凭证、执行上下文,仅此而已。它们为智能体行为带来了清晰度、安全性和沙盒控制。
这些环境既可用于训练,也可用于部署,是可扩展智能体开发的基础。
问题所在
现代 AI 智能体可以自主执行数千项任务。然而,仅靠大语言模型不足以让这些任务真正运行——它需要访问正确的工具。将数百万工具直接暴露给模型既不现实也不安全。相反,我们需要智能体环境:安全、语义清晰的沙盒,明确定义任务所需内容,仅此而已。这些环境处理关键细节:
- 明确任务所需的语义
- 沙盒执行和安全保证
- 无缝访问经过身份验证的工具和 API
解决方案
为了推动下一波智能体开发浪潮,Meta-PyTorch 和 Hugging Face 合作推出 环境中心:一个共享空间,开发者可以构建、分享和探索兼容 OpenEnv 的环境,用于训练和部署。下图展示了 OpenEnv 如何融入 Meta 正在开发的新后训练堆栈,并与 TRL、SkyRL 和 Unsloth 等其他库集成:

从下周开始,开发者可以:
- 访问 Hugging Face 上的新环境中心,我们将提供一些初始环境
- 直接作为人类智能体与环境交互
- 调用模型在环境中解决任务
- 检查环境暴露了哪些工具以及如何定义其观察结果
- 每个上传到 Hub 并符合 OpenEnv 规范的环境都会自动获得这些功能——使得在运行完整 RL 训练之前能够快速轻松地验证和迭代
与此同时,我们发布了 OpenEnv 0.1 规范(RFC),以收集社区反馈并帮助塑造标准。
RFC 进展
在仓库的当前状态下,环境创建者可以使用 step()、reset()、close() API(属于以下 RFC)创建环境。如何创建此类环境的示例可以在这里看到。环境用户可以为仓库中已有的所有环境使用基于本地 Docker 的环境。以下 RFC 正在审查中:
使用场景
- RL 后训练:从集合中拉取环境,并使用它们通过 TRL、TorchForge+Monarch、VeRL 等训练 RL 智能体
- 环境创建:构建环境并确保其与生态系统中的流行 RL 工具互操作,与协作者分享等
- 复制 SOTA 方法:通过集成用于智能体编码和软件工程的环境,轻松复制 FAIR 的代码世界模型等方法
- 部署:用户可以创建环境,在同一环境上训练,然后也用于推理(完整流程)
下一步计划
这只是开始。我们正在将 OpenEnv Hub 与 Meta 的新 TorchForge RL 库集成,并与 verl、TRL 和 SkyRL 等其他开源 RL 项目合作以扩展兼容性。10 月 23 日加入 PyTorch 大会,观看规范的现场演示和演练,并关注我们即将举行的关于环境、RL 后训练和智能体开发的社区聚会。
👉 探索 Hugging Face 上的 OpenEnv Hub,开始构建将驱动下一代智能体的环境。
👉 查看 0.1 规范,可在 OpenEnv 项目中找到实现 → 我们欢迎改进它的想法和贡献!
👉 在 Discord 上参与讨论,与社区交流 RL、环境和智能体开发
👉 亲自尝试 - 我们创建了一个全面的笔记本,引导你完成端到端示例,当然你也可以通过 PyPI 轻松 pip 安装包。这个笔记本介绍了我们构建的抽象,以及如何使用现有集成和添加你自己的示例 - 在 Google Colab 中试试吧!
👉 查看支持平台 - Unsloth、TRL、Lightning.AI
让我们一次一个环境,共同构建开放智能体的未来 🔥!
觉得有用?分享给更多人