DeepSeek V4 发布:1.6T 参数、华为昇腾适配

深度Latent Space2026年4月25日5 分钟阅读
DeepSeek V4 发布:1.6T 参数、华为昇腾适配
DeepSeek 正式发布 V4 系列,包括 Pro(1.6T/49B 激活)和 Flash(284B/13B 激活)两个模型,支持 1M token 上下文,采用 MIT 许可。新模型引入了 CSA/HCA 注意力机制,显著降低 KV 缓存,并首次实现对华为昇腾芯片的原生支持,被视为中国 AI 芯片自主化的重要里程碑。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

每个 Gradio Space 都公开了 agents.md 文件,Agent 可据此自动调用 API。本文将 ideogram-ai/ideogram4 图像生成 Space 与 VAST-AI/TripoSplat 单图转 3D Space 串联,Agent 自主完成了图像生成、3D 重建、坐标修正、文件压缩以及 Three.js 前端部署,展现了模型即模块的新型开发模式。

深度Hugging Face·6月9日·5 分钟

本文指出机器人通用智能的瓶颈不仅在于策略学习,更缺乏将非结构化行为数据转化为机器人可用监督信号的机制。作者识别出四个缺失组件:数据接口、具身接口、世界模型接口和奖励接口,并提出从更广泛的物理世界学习的研发议程。

深度·6月9日·55 分钟

评论