GRASP:长时域世界模型的梯度规划器

深度2026年4月20日6 分钟阅读
GRASP:长时域世界模型的梯度规划器
BAIR 团队提出 GRASP,一种基于梯度的规划器,专门解决在大型学习世界模型中进行长时域规划的难题。通过引入虚拟状态并行优化、状态迭代随机化和梯度重塑,让梯度规划在高维视觉模型中变得稳定可行。
本文编译自 Gradient-based Planning for World Models at Longer Horizons,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Cloudflare 在 Agents Week 2026 上推出了面向智能体(Agent)的完整基础设施栈,涵盖计算环境、安全工具和智能体工具箱。这些更新包括 Artifacts 存储、Sandboxes 隔离环境、Cloudflare Mesh 私有网络等,旨在支持大规模智能体部署。

深度·4月20日·8 分钟

华为 HiFloat4 格式在昇腾芯片上训练大语言模型时,其相对损失误差(≈1.0%)低于 MXFP4(≈1.5%)。Anthropic 利用自动化对齐研究员(AAR)在弱到强监督任务上,以约 18,000 美元的成本,实现了 0.97 的性能差距恢复率(PGR),远超人类基准。

深度·4月20日·5 分钟

评论