LLaDA2.0-Uni:统一多模态理解与生成的扩散大语言模型
深度2026年4月28日44 分钟阅读
本文提出LLaDA2.0-Uni,首次在扩散大语言模型中实现多模态理解与生成的统一,并在图像生成任务上取得强劲性能。推荐对多模态基础模型、扩散模型、以及统一理解生成框架感兴趣的研究者阅读。
本文编译自 LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model,版权归原作者所有。
觉得有用?分享给更多人