NVIDIA Nemotron 3 Nano Omni:多模态长上下文模型,文、音、视全能

深度Hugging Face2026年4月28日6 分钟阅读
NVIDIA Nemotron 3 Nano Omni:多模态长上下文模型,文、音、视全能
NVIDIA 发布 Nemotron 3 Nano Omni,一款支持文本、图像、视频和音频的全模态理解模型。该模型在文档分析、GUI 智能体、视频理解等多个基准测试上领先,同时推理速度提升最高 9 倍。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

OpenAI 与微软修改协议取消独家授权后,AWS 火速在 Bedrock 上架 OpenAI 最新模型、Codex 和全新智能体服务 Bedrock Managed Agents。亚马逊称这标志着“更深层次合作的开始”,而微软则转向 Anthropic 和 Claude 驱动的智能体产品。

深度·4月28日·2 分钟

SAS 发布 Viya MCP Server,通过 Model Context Protocol 将分析能力开放给 Claude、Copilot 等任意 AI Agent。同时推出的还有 Agentic AI Accelerator、营销多智能体系统及供应链智能体,背后是行业专有模型和治理平台 AI Navigator。

深度The New Stack·4月28日·4 分钟

评论