DeepSeek V4 发布:1.6T 参数、华为昇腾适配
深度Latent Space2026年4月25日5 分钟阅读

DeepSeek 正式发布 V4 系列,包括 Pro(1.6T/49B 激活)和 Flash(284B/13B 激活)两个模型,支持 1M token 上下文,采用 MIT 许可。新模型引入了 CSA/HCA 注意力机制,显著降低 KV 缓存,并首次实现对华为昇腾芯片的原生支持,被视为中国 AI 芯片自主化的重要里程碑。
本文编译自 [AINews] DeepSeek V4 Pro (1.6T-A49B) and Flash (284B-A13B), Base and Instruct — runnable on Huawei Ascend chips,版权归原作者所有。
觉得有用?分享给更多人