Anthropic 撤回 Claude 隐藏限制策略

深度Simon Willison2026年6月11日2 分钟阅读
Anthropic 在 Claude Fable 5 中隐藏了一项限制——拒绝协助“前沿大语言模型开发”且不告知用户。引发研究者强烈抗议后,Anthropic 道歉并承诺改为可见安全警示。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

SonarSweep 通过静态分析、示例合成、自动修复和严格筛选四个阶段,清洗 AI 训练数据中的劣质代码,使模型产出更安全、更可靠的代码,并降低 Agent 开发中的 token 消耗。

深度The New Stack·6月11日·8 分钟

Sarah Guo 的文章提出一个框架,区分了模型能力(可训练/可基准测试)与应用价值(不可训练/需深度集成)。她强调,真正的竞争壁垒来自“不可训练”的领域:客户现场集成、领域专业知识、以及判断该构建什么的能力。这也呼应了 Latent Space 此前关于开源模型、智能体实验室 vs 模型实验室的讨论。

深度Latent Space·6月11日·12 分钟

评论