Opus 4.8 工具调用反不如旧模型

深度2026年7月4日12 分钟阅读

Armin Ronacher 发现新版 Claude 模型（Opus 4.8、Sonnet 5）在 Pi 编辑工具上频繁生成不符合 schema 的额外字段，而旧模型表现却更稳定。他认为这是后训练阶段过度适配 Claude Code 容错机制导致的副作用——模型越智能，反而越难适应非标准的工具 schema。

本文编译自 Better Models: Worse Tools，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

关注 @skillnav_dev →阅读周刊

概念速查

工具调用

工具调用让大模型不再只会说话——它可以搜索网页、读写文件、调用 API，把「想法」变成「行动」。

阿里巴巴7月10日起内部禁用Claude Code

阿里巴巴报告将禁止员工使用 Anthropic 的 Claude Code 编程工具，自7月10日起生效。该工具被列为高风险软件，员工将被要求使用阿里自研的 Qoder 替代。此前 Anthropic 已禁止中国公司使用其模型，并曾通过实验性代码识别中国用户以防止滥用。

深度·7月4日·2 分钟

省钱别只盯着模型，token消耗才是大头

随着智能体式AI规模化，token消耗——而非模型选择——正成为真正的成本驱动因素，团队应转向更智能的上下文管理和路由。

深度The New Stack·7月4日·5 分钟

Opus 4.8 工具调用反不如旧模型

概念速查

相关文章

阿里巴巴7月10日起内部禁用Claude Code

省钱别只盯着模型，token消耗才是大头

评论