IBM Granite 4.1 技术拆解:5 阶段预训练 + 强化学习

深度Hugging Face2026年4月29日12 分钟阅读
IBM Granite 4.1 技术拆解:5 阶段预训练 + 强化学习
IBM 发布 Granite 4.1 系列密集 LLM(3B/8B/30B),在约 15T token 上采用五阶段预训练,并扩展至 512K 上下文窗口。8B 指令模型以更少的参数超越了前代 32B MoE 模型,背后是严格的数据筛选和强化学习策略。
本文编译自 Granite 4.1 LLMs: How They’re Built,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Fable 5 性能强劲但使用限制和成本引发争议。用户称赞其编程和推理能力超越 Opus 4.8,但抱怨使用额度快速耗尽、护栏频繁误判,以及不可选的数据留存政策。

深度The New Stack·6月10日·5 分钟

循环工程(Loop Engineering)是一种将编码代理从交互式助手转变为长期运行执行系统的编排模式。它利用调度、隔离工作区、验证代理和持久记忆等基础组件,让开发者从手动提示中解放出来。

深度The New Stack·6月10日·6 分钟

评论