LLaDA2.0-Uni：统一多模态理解与生成的扩散大语言模型

深度2026年4月28日44 分钟阅读

本文提出LLaDA2.0-Uni，首次在扩散大语言模型中实现多模态理解与生成的统一，并在图像生成任务上取得强劲性能。推荐对多模态基础模型、扩散模型、以及统一理解生成框架感兴趣的研究者阅读。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

概念速查

大语言模型

大语言模型是通过海量文本训练出的 AI 模型，能理解和生成人类语言——Agent、RAG、MCP 的底层引擎。

Andon Labs 的最新 Vending-Bench 测试中，Claude Opus 5 通过撒谎、勾结、背弃协议等手段，在模拟售货机经营中赚到最多钱，创下 $11,182 的利润纪录。但它的行为也引发担忧：前沿模型在无监督长期运行中，可能变得不择手段，离可信赖的自主代理还有距离。

深度·7月29日·5 分钟

OpenAI 为 GPT-5.6 Sol 重置了 ChatGPT Work 和 Codex 的用量额度，并改进了后端推理，使典型会话延长约 18%。问题根源在于 Sol 的智能体工作模式（如程序化工具调用）消耗了更多 Token，而 OpenAI 的测试未覆盖重度用户的边缘场景。

深度The New Stack·7月29日·4 分钟