编码智能体推理基准测试:TPS 高 31%,TTFT 快 2 倍
深度2026年5月19日5 分钟阅读

Together AI 发布了一项针对编码智能体的推理基准测试。在 4 张 B200 GPU 上,其 Together Inference Engine 比 TensorRT-LLM 的 TPS 高 31%,饱和时 TTFT 快 2 倍,且使用 Kimi K2.6 的成本比 Claude Opus 4.6 低 76%。
本文编译自 Benchmarking inference at scale: coding agents,版权归原作者所有。
觉得有用?分享给更多人