KnowU-Bench:迈向交互式、主动化、个性化移动智能体评估
深度2026年4月13日27 分钟阅读
最有趣的发现是:智能体在明确任务执行中表现出色,但在需要推断用户偏好或校准干预的模糊场景下性能骤降,核心瓶颈并非GUI导航,而是偏好获取与干预决策。本文适合移动智能体研究者、人机交互开发者和个性化AI系统设计者阅读。
本文编译自 KnowU-Bench: Towards Interactive, Proactive, and Personalized Mobile Agent Evaluation,版权归原作者所有。
觉得有用?分享给更多人