Claude Code 质量下降查明:三个 Harness 漏洞

深度Simon Willison2026年4月24日3 分钟阅读
过去两个月大量用户抱怨 Claude Code 质量下降,Anthropic 发布事后分析(Postmortem)确认问题真实存在——但并非模型本身变差,而是 Claude Code 执行框架中的三个 Bug 所致。其中“清除旧思考”功能的 Bug,导致模型在长时间会话中表现得健忘且重复。
本文编译自 An update on recent Claude Code quality reports,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

DeepSeek 推出 V4-Pro 和 V4-Flash 两款预览模型。Pro 总参数 1.6T,百万 token 上下文;Flash 仅 284B 总参数,定价极低。两款模型均采用 MIT 许可证。基准测试显示 Pro 接近前沿模型水平,但落后约 3-6 个月。效率大幅提升,长上下文场景下 FLOPs 仅为 V3.2 的 10%-27%。

深度Simon Willison·4月24日·5 分钟

OpenAI 发布 GPT-5.5 模型,在智能指数上与 Claude Opus 4.7 持平,成本仅为其四分之一。同时,Codex 迎来重大更新,加入浏览器控制、文档编辑等功能,成为 OpenAI 超级应用战略的核心。DeepSeek 迅速回击,发布 V4 预览版,开源 1.6T 参数模型,定价极具竞争力。

深度Latent Space·4月24日·8 分钟

评论