ATLAS:运行时自学习加速器让 LLM 推理越用越快
深度2025年10月10日5 分钟阅读

Together AI 推出自适应学习推测系统(ATLAS),LLM 推理速度最高提升 4 倍。在 DeepSeek-V3.1 上实现 500 TPS,无需手动调优,性能随使用自动提升。
本文编译自 AdapTive-LeArning Speculator System (ATLAS): A New Paradigm in LLM Inference via Runtime-Learning Accelerators,版权归原作者所有。
觉得有用?分享给更多人