Gaia2 与 ARE:开源智能体研究新框架
深度Hugging Face2025年9月22日5 分钟阅读
Hugging Face 团队推出 Gaia2 智能体评测基准和 ARE 执行框架,模拟真实世界复杂条件,让开发者能更深入地研究和调试智能体行为。Gaia2 包含 1000 个全新人类创建的场景,覆盖执行、搜索、模糊处理等七类任务。
本文编译自 Gaia2 and ARE: Empowering the community to study agents ,版权归原作者所有。
觉得有用?分享给更多人