SANA-WM:高效分钟级世界模型
深度2026年5月20日28 分钟阅读
最有趣的是SANA-WM能以极低计算资源实现分钟级高质量视频生成,通过混合线性注意力与双分支相机控制等创新设计,显著降低了世界模型的门槛。本文适合对高效视频生成、世界模型及自动驾驶等领域的AI研究者和工程师阅读。
本文编译自 SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer,版权归原作者所有。
觉得有用?分享给更多人