Opus 4.8 工具调用反不如旧模型

深度2026年7月4日12 分钟阅读
Opus 4.8 工具调用反不如旧模型
Armin Ronacher 发现新版 Claude 模型(Opus 4.8、Sonnet 5)在 Pi 编辑工具上频繁生成不符合 schema 的额外字段,而旧模型表现却更稳定。他认为这是后训练阶段过度适配 Claude Code 容错机制导致的副作用——模型越智能,反而越难适应非标准的工具 schema。
本文编译自 Better Models: Worse Tools,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

阿里巴巴报告将禁止员工使用 Anthropic 的 Claude Code 编程工具,自7月10日起生效。该工具被列为高风险软件,员工将被要求使用阿里自研的 Qoder 替代。此前 Anthropic 已禁止中国公司使用其模型,并曾通过实验性代码识别中国用户以防止滥用。

深度·7月4日·2 分钟

随着智能体式AI规模化,token消耗——而非模型选择——正成为真正的成本驱动因素,团队应转向更智能的上下文管理和路由。

深度The New Stack·7月4日·5 分钟

评论