CoInteract:基于空间结构协同生成的人-物交互视频合成框架
深度2026年4月21日28 分钟阅读
最有趣的发现是:通过空间监督路由将令牌分配给轻量级区域专家,结合RGB外观流与HOI结构流的协同训练,实现了零开销的物理一致交互视频生成。推荐计算机视觉、人机交互、多媒体生成领域的研究人员和工程师阅读本文。
本文编译自 CoInteract: Physically-Consistent Human-Object Interaction Video Synthesis via Spatially-Structured Co-Generation,版权归原作者所有。
觉得有用?分享给更多人