用深度剪枝草稿模型在 Intel® Core™ Ultra 加速 Qwen3-8B 智能体

指南Hugging Face2025年9月29日4 分钟阅读

通过 OpenVINO.GenAI 的推测解码技术，Qwen3-8B 在 Intel® Core™ Ultra 上的生成速度提升了约 1.3 倍。进一步对草稿模型进行深度剪枝后，加速比提升至约 1.4 倍。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

概念速查

AI 智能体

AI Agent 是能自主感知环境、制定计划并采取行动来完成目标的智能程序——不只是聊天，而是帮你干活。

Google 搜索推出 AI 信息智能体功能，用户可创建多个智能体在后台 24/7 监控股市、航班、新闻等话题，并在有重大变化时主动推送摘要和链接。该功能将于今夏面向 AI Pro 和 Ultra 订阅用户首发。

指南·5月19日·3 分钟

Google 在 I/O 大会上宣布 Android Studio 支持 GPT 和 Claude 模型，开发者可选用不同模型构建应用。Android CLI 发布 1.0 稳定版，支持 AI 智能体操作。

指南The New Stack·5月19日·3 分钟