Holotron-12B:专为高吞吐量计算机使用智能体设计

指南Hugging Face2026年3月17日3 分钟阅读
Holotron-12B:专为高吞吐量计算机使用智能体设计
H 公司发布 Holotron-12B,这是一个基于 NVIDIA Nemotron-Nano-2 VL 模型微调的多模态计算机使用模型。在 WebVoyager 基准测试中,其吞吐量比前代 Holo2-8B 高出 2 倍以上,专为生产环境中的规模化交互智能体优化。
本文编译自 Holotron-12B - High Throughput Computer Use Agent,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Simon Willison 升级了他的 OpenAI WebRTC 音频会话工具,支持最新的 GPT-Realtime-2 模型和文档上下文功能。用户可以在浏览器中粘贴文本,让语音对话围绕指定内容进行。

指南Simon Willison·6月12日·2 分钟

DiffusionGemma 是 Google 发布的实验性开放模型,使用文本扩散而非逐 token 生成,在 NVIDIA H100 上达到 1000+ tokens/s。模型激活参数仅 3.8B,量化后适配 18GB VRAM 消费级 GPU。输出质量低于 Gemma 4,但适合速度优先的本地工作流。

指南·6月10日·7 分钟

评论