IBM Granite 4.1 技术拆解:5 阶段预训练 + 强化学习
深度Hugging Face2026年4月29日12 分钟阅读
IBM 发布 Granite 4.1 系列密集 LLM(3B/8B/30B),在约 15T token 上采用五阶段预训练,并扩展至 512K 上下文窗口。8B 指令模型以更少的参数超越了前代 32B MoE 模型,背后是严格的数据筛选和强化学习策略。
本文编译自 Granite 4.1 LLMs: How They’re Built,版权归原作者所有。
觉得有用?分享给更多人