Together AI 上线 NVIDIA Nemotron 3 Nano Omni 多模态模型
指南2026年4月28日4 分钟阅读

NVIDIA 的 Nemotron 3 Nano Omni 模型今日登陆 Together AI 平台。这款仅 30B 参数的开源模型能同时推理视频、图像、音频和文本,为智能体应用提供了更简洁的部署路径。
觉得有用?分享给更多人

觉得有用?分享给更多人
Simon Willison 升级了他的 OpenAI WebRTC 音频会话工具,支持最新的 GPT-Realtime-2 模型和文档上下文功能。用户可以在浏览器中粘贴文本,让语音对话围绕指定内容进行。
DiffusionGemma 是 Google 发布的实验性开放模型,使用文本扩散而非逐 token 生成,在 NVIDIA H100 上达到 1000+ tokens/s。模型激活参数仅 3.8B,量化后适配 18GB VRAM 消费级 GPU。输出质量低于 Gemma 4,但适合速度优先的本地工作流。