DeepSeek V4 发布:1.6T 参数、华为昇腾适配

深度Latent Space2026年4月25日5 分钟阅读
DeepSeek V4 发布:1.6T 参数、华为昇腾适配
DeepSeek 正式发布 V4 系列,包括 Pro(1.6T/49B 激活)和 Flash(284B/13B 激活)两个模型,支持 1M token 上下文,采用 MIT 许可。新模型引入了 CSA/HCA 注意力机制,显著降低 KV 缓存,并首次实现对华为昇腾芯片的原生支持,被视为中国 AI 芯片自主化的重要里程碑。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

DeepSeek 发布 V4 系列预览模型,包括 1.6 万亿参数的 Pro 版本和 2840 亿参数的 Flash 版本。在推理和编程基准上接近领先模型,但知识测试有差距。价格显著低于同类前沿模型。

深度·4月24日·3 分钟

开发者早期体验显示 GPT-5.5 在编码和安全测试中进步显著,但 API 暂未开放、成本翻倍、推理耗时增加,限制了它的实用性。基准测试与实际表现的差距仍然存在,AI 能力的“锯齿状前沿”并未消失。

深度The New Stack·4月24日·6 分钟

评论