Opus 4.8 工具调用反不如旧模型
深度2026年7月4日12 分钟阅读

Armin Ronacher 发现新版 Claude 模型(Opus 4.8、Sonnet 5)在 Pi 编辑工具上频繁生成不符合 schema 的额外字段,而旧模型表现却更稳定。他认为这是后训练阶段过度适配 Claude Code 容错机制导致的副作用——模型越智能,反而越难适应非标准的工具 schema。
本文编译自 Better Models: Worse Tools,版权归原作者所有。
觉得有用?分享给更多人

觉得有用?分享给更多人
阿里巴巴报告将禁止员工使用 Anthropic 的 Claude Code 编程工具,自7月10日起生效。该工具被列为高风险软件,员工将被要求使用阿里自研的 Qoder 替代。此前 Anthropic 已禁止中国公司使用其模型,并曾通过实验性代码识别中国用户以防止滥用。
随着智能体式AI规模化,token消耗——而非模型选择——正成为真正的成本驱动因素,团队应转向更智能的上下文管理和路由。