何时信任想象:世界动作模型的适应性执行
深度2026年5月9日27 分钟阅读
机器人该执行多少个预测动作?本文发现,固定动作块的大小存在效率与鲁棒性的矛盾:块太大易偏离现实,块太小频繁重规划。研究者提出一种轻量验证器FFDC,能感知预测与现实的偏差,动态调整执行长度,在接触密集或困难阶段自动缩短块。机器人、具身智能、控制领域的研究者值得关注。
觉得有用?分享给更多人
觉得有用?分享给更多人
Cognition 的 Devin Desktop、微软的 Rayfin 和 Augment Code 的 Cosmos 在六月初相继发布,分别从团队控制台、企业治理和代理编排三个层面推动编码代理成为团队基础设施。这些工具解决了代理协调、管理和治理问题,但也带来了厂商锁定风险。
ServiceNow构建了包含HR和IT服务场景的语码转换语音数据集,评测7款ASR系统在WER、语义WER和答案错误率三个维度的表现。结果显示语码转换的“成本”因语言对和模型而异,Whisper V3 Turbo因默认翻译而非转录表现垫底。