DiffusionGemma：4倍生成速度的开放实验模型

指南2026年6月10日7 分钟阅读

Google 推出 DiffusionGemma，采用文本扩散技术实现并行生成，在专用 GPU 上推理速度可达传统自回归模型的 4 倍。这款 26B MoE 模型专注于速度敏感型本地交互场景，如行内编辑和快速迭代。

本文编译自 DiffusionGemma: 4x faster text generation，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

直接调用 API 适合需要自定义提示、检索、路由、日志和安全控制的场景；而 Copilot 提供的是围绕软件开发全流程的集成工具链，包括编辑器、仓库、终端和组织策略。BYOK 功能让你保留现有工作流的同时更换模型提供商。

指南GitHub·7月22日·7 分钟

Buzz 由 Block 公司开发，是一个开源、去中心化的团队聊天平台，支持人类和 AI 智能体共同协作。它整合了聊天和 GitHub 项目管理，开发者可以自行定制和部署。目前处于早期阶段，免费桌面版已上线。

指南·7月21日·3 分钟

相关文章