小米MiMo Code宣称200步任务超越Claude Code

深度The New Stack2026年6月14日8 分钟阅读

编程Agent在演示中表现亮眼，但在长任务中往往撑不过30步便崩溃。小米开源了MiMo Code，声称在超长任务（200步以上）中超越Claude Code；伯克利新基准测试则显示，即便最强配置通过率也不足50%。

本文编译自 Xiaomi’s MiMo Code claims it beats Claude Code past 200 steps，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

关注 @skillnav_dev →阅读周刊

AWS FinOps Agent 上线：用自然语言查云账单

AWS FinOps Agent 进入公开预览，可通过自然语言查询成本、自动调查异常并创建 Jira 工单或 Slack 通知。权限以只读为主，构建于 Bedrock 之上，目前仅在美国东部区域可用。

深度The New Stack·6月16日·4 分钟

Anthropic 叫停 Agent SDK 单独计费

Anthropic 暂停了 Claude Agent SDK 的计费变更，该变更原定于 6 月 15 日生效，旨在将 Agent SDK 使用量从通用订阅额度中分离出来并单独计费。此举是在美国政府要求 Anthropic 撤下 Fable 5 和 Mythos 5 模型之后做出的，意在安抚开发者群体。

深度The New Stack·6月16日·3 分钟

小米MiMo Code宣称200步任务超越Claude Code

相关文章

AWS FinOps Agent 上线：用自然语言查云账单

Anthropic 叫停 Agent SDK 单独计费

评论