Anthropic 撤回 Claude 隐藏限制策略

深度Simon Willison2026年6月11日2 分钟阅读

Anthropic 在 Claude Fable 5 中隐藏了一项限制——拒绝协助“前沿大语言模型开发”且不告知用户。引发研究者强烈抗议后，Anthropic 道歉并承诺改为可见安全警示。

本文编译自 Anthropic Walks Back Policy That Could Have ‘Sabotaged’ AI Researchers Using Claude，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

关注 @skillnav_dev →阅读周刊

SonarSweep：清洗训练数据让AI生成代码缺陷降低41%

SonarSweep 通过静态分析、示例合成、自动修复和严格筛选四个阶段，清洗 AI 训练数据中的劣质代码，使模型产出更安全、更可靠的代码，并降低 Agent 开发中的 token 消耗。

深度The New Stack·6月11日·8 分钟

Sarah Guo：模型实验室与智能体实验室的分野

Sarah Guo 的文章提出一个框架，区分了模型能力（可训练/可基准测试）与应用价值（不可训练/需深度集成）。她强调，真正的竞争壁垒来自“不可训练”的领域：客户现场集成、领域专业知识、以及判断该构建什么的能力。这也呼应了 Latent Space 此前关于开源模型、智能体实验室 vs 模型实验室的讨论。

深度Latent Space·6月11日·12 分钟

Anthropic 撤回 Claude 隐藏限制策略

相关文章

SonarSweep：清洗训练数据让AI生成代码缺陷降低41%

Sarah Guo：模型实验室与智能体实验室的分野

评论