Anthropic 疯狂三月:14+ 新功能、5 次宕机与意外泄露的 Claude Mythos

深度The New Stack2026年3月28日5 分钟阅读
Anthropic 疯狂三月:14+ 新功能、5 次宕机与意外泄露的 Claude Mythos
Anthropic 在 2026 年 3 月发布了超过 14 项 Claude 重要更新,从 Opus 4.6 到计算机使用功能,同时 MCP 月安装量突破 9700 万。但快速迭代也带来了至少 5 次服务中断,下一代模型 Claude Mythos 的细节更因配置失误意外泄露。

我是 Matt Burns,Insight Media Group 的内容主管。每周我都会汇总最重要的 AI 进展,并解释它们对实际使用这项技术的人意味着什么。核心理念很简单:学会使用 AI 的从业者将定义各自行业的下一阶段。这份通讯就是为了帮你成为其中一员。

先打个预防针:本周的汇总会高度聚焦 Anthropic。这不是偏心——只是新闻热点都在这里。Anthropic 目前势头正猛,发布新功能的速度和力度远超业内其他公司,本周大部分重大新闻都和他们有关。

Anthropic 的三月堪称疯狂

我报道科技初创公司和项目已有 20 年,真的不记得有哪家公司像 Anthropic 在二、三月这样密集发布。几乎每隔一两天,Claude 就会迎来新功能和能力升级。

以下是主要发布内容:

  • Claude Opus 4.6 于 2 月 5 日发布,拥有 100 万 token 的上下文窗口(Context Window)和 12.8 万 token 的输出长度——这是 Anthropic 迄今为止能力最强的模型,《The New Stack》称其为企业应用带来了阶跃式变化
  • Claude Sonnet 4.6 于 2 月 17 日跟进,成为免费版和 Pro 版的新默认模型,在编码、计算机使用和智能体规划(Agent Planning)方面均有升级,价格仍为 Sonnet 4.5 的定价(每百万 token 3/15 美元)。
  • 交互式可视化于 3 月 12 日上线——Claude 现在可以使用 HTML 和 SVG 内联构建图表、图示和交互式小组件,并已向所有计划类型(包括免费版) 推出。
  • 免费用户的记忆功能于 3 月 2 日到来,完成了为期八个月的逐步推广,并增加了 ChatGPT/Gemini 导入工具,让切换更容易。
  • Claude Marketplace 于 3 月 6 日上线,允许企业将现有的 Anthropic 消费额度用于 Replit、GitLab、Harvey、Snowflake 和 Lovable 等公司提供的 Claude 驱动工具——Anthropic 不收取任何分成。
  • Claude Code 多智能体代码审查于 3 月 9 日推出,可并行派遣多个智能体(Agent)在人工审查员看到代码前捕捉错误——现在 54% 的 PR 能得到实质性评论,而之前是 16%。
  • Excel 和 PowerPoint 集成于 3 月 11 日获得了跨应用的共享上下文支持,并通过 Bedrock、Vertex AI 和 Foundry 提供可复用的技能(Skills)和 LLM 网关支持。
  • Claude Partner Network 于 3 月 12 日正式成立,承诺投入 1 亿美元——埃森哲正在培训 3 万名专业人员使用 Claude,Cognizant 向其全部 35 万名员工开放了访问权限。
  • 100 万 token 上下文于 3 月 14 日对 Opus 4.6 和 Sonnet 4.6 全面上市,按标准定价收费,取消了之前超过 20 万 token 部分 2 倍的输入附加费。
  • Claude Dispatch 于 3 月 17 日作为 Cowork 中的持久智能体线程推出——你可以从手机分配任务,当 Claude 在你的 Mac 上完成任务时,你会收到推送通知。
  • Claude Code 登陆网页和移动端,让开发者可以从 Claude.ai 在 Anthropic 托管的实例上启动并行编码工作流。
  • 计算机使用于 3 月 23 日作为研究预览版向 Pro 和 Max 用户推出——Claude 可以打开应用、点击、打字并导航你的 Mac 屏幕,在没有直接集成时会回退到屏幕控制。
  • 非高峰时段使用限制在 3 月 13 日至 28 日期间,在免费版、Pro、Max 和团队计划中翻倍。
  • Claude Code 使用量自 Claude 4 模型发布以来增长了 300%,经常性收入增长了 5.5 倍,Anthropic 还推出了企业分析仪表板来跟踪支出和代码接受率。

除了这些头条功能,还有持续不断的小更新:仅过去一周,Claude Code 就在五个点版本中增加了 Windows 上的 PowerShell 支持、转录搜索、MCP 去重和空闲返回提示。Cowork 也增加了插件支持并改进了文件管理。《The New Stack》对此进行了全面报道。如果你想跟上节奏,可以从我们关于多智能体代码审查发布和 Claude Code 扩展到网页和移动端的报道开始看起。

但服务器撑不住了

发布这么快也有另一面:Anthropic 的基础设施似乎难以跟上。仅三月,Claude 就至少宕机了五次,包括本周两次长时间的故障。在我周五早上写这篇文章时,Opus 4.6 正经历错误率升高,不过 Sonnet 4.6 似乎还好。

这并非 Anthropic 独有。随着使用量激增,OpenAI、谷歌等公司都面临过类似的成长阵痛。但当一家公司像 Anthropic 现在这样激进发布时,问题就更显眼了。你可以拥有世界上最好的模型,但如果开发者无法依赖它的可用性,他们就会构建备用方案,而其中一些备用方案可能会变成永久方案。可靠性本身就是产品特性,而目前这可能是 Anthropic 最需要“发布”的一项。

Claude Mythos 意外泄露

周四,《财富》杂志爆出消息,称 Anthropic 正在测试一款名为 Claude Mythos 的新模型——内部代号“Capybara”——这是一款下一代模型,该公司称其在能力上是一次“阶跃式变化”,是“我们迄今为止构建的最强大的模型”。

这次曝光并非计划之中。Anthropic 由于在 CMS 配置中的“人为错误”,意外将大约 3000 个未发布的资产留在了可公开访问的数据缓存中——其中包括一篇博客草稿。安全研究人员发现了它。《财富》杂志在 Anthropic 锁定访问权限前审阅了这些内容。

据称的能力提升显著:与 Opus 4.6 相比,在编码、学术推理和网络安全基准测试(Benchmark)上得分大幅提高。Anthropic 表示该模型“在网络安全能力上远超任何其他 AI 模型”,并补充说它“预示着即将到来的一波模型,它们利用漏洞的能力将远超防御者的努力。”这是 Anthropic 在警告自己的模型。该公司表示正在与一小部分早期访问客户测试 Claude Mythos,并对发布持“审慎”态度。

在三月的功能轰炸、可靠性问题以及现在等待亮相的下一代模型之间,Anthropic 目前的故事是一家公司试图同时以三种不同的速度奔跑。

MCP 安装量突破 9700 万

Anthropic 的模型上下文协议(Model Context Protocol, MCP)在三月达到了每月 9700 万次 SDK 下载量。这比 2025 年 11 月推出时的大约 200 万次增长了 4750%。该生态系统现在包含超过 5800 个社区和企业服务器,涵盖数据库、CRM、云提供商、开发者工具等。当 OpenAI 去年承诺支持 MCP 时,它就不再只是 Anthropic 的协议,而开始成为行业的协议。Anthropic 在 12 月通过将 MCP 捐赠给 Linux 基金会旗下的智能体 AI 基金会(Agentic AI Foundation) 正式确认了这一转变,该基金会是与 Block 和 OpenAI 共同创立的。

《The New Stack》对 MCP 的故事进行了密切报道。Richard MacManus 写了一篇关于MCP 为何胜出的好文章,我们关于2026 年路线图的报道则深入探讨了维护者现在正试图弥合的生产就绪性差距——身份验证、可观测性、大规模服务器管理。该协议显然正在赢得采用,但正如我们的一篇文章所言,MCP 与生产就绪之间仍有一座陡峭的山峰。对于构建智能体工作流(Agentic Workflows)的开发者来说,MCP 已是标准。现在的问题是,围绕它的工具能否跟上需求。

如果你想和我们深入探讨,我们将参加 4 月 2 日至 3 日在纽约市举行的 MCP 开发者峰会。我的好朋友 Alex Wilhelm(他出版了优秀的《Cautious Optimism》通讯)将在那里为《The New Stack》进行采访。

AI 沙皇卸任

David Sacks 周四告诉彭博社,他已用完作为政府特殊雇员的 130 天任期,并将卸任特朗普的 AI 和加密货币沙皇一职。他将与 Michael Kratsios 共同担任总统科技顾问委员会(PCAST)的联合主席。这给了 Sacks 更广泛的监督职责,但或许直接权力会大大减少。

作为 AI 沙皇,Sacks 可以直接联系特朗普并参与政策制定。作为 PCAST 联合主席,他将提出建议。Axios 报道称,白宫不打算任命新的 AI 沙皇,这意味着华盛顿最引人注目的 AI 政策职位空缺且无人接替。

在离任前,Sacks 告诉彭博社,国会可能在几个月内通过两党 AI 立法,该框架将儿童安全措施与联邦对州 AI 法律的优先权相结合。Sacks 说:“我们在国会山得到了非常好的反响。在这个领域,我认为我们愿意并且乐于与民主党人合作。”这种乐观情绪在他离开日常职务后能否持续是个问题。AI 政策目前可能是少数真正具有两党共识的议题之一,但没有倡导者的两党势头往往会消退。

对于采用 AI 的组织来说,监管前景很重要。联邦对州法律的优先权将大大简化合规性。各州法规拼凑而成的局面是企业在美国各地部署 AI 的最大摩擦点之一。如果 Sacks 关于法案可能在几个月内出台的说法是正确的,那就值得关注。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Simon Willison 正在重构 LLM Python 库的抽象层,以支持服务器端工具执行等新功能。他利用 Claude Code 分析了四大 LLM 提供商的客户端库,生成了用于测试的 curl 命令和 JSON 输出。这些调研材料已开源,旨在帮助设计更通用的 API 抽象。

深度Simon Willison·4月5日·1 分钟

智能体技能——包含程序性知识和可执行资源的结构化包,供智能体在推理时动态加载——已成为增强 LLM 智能体的可靠机制。然而,推理时技能增强存在根本性限制:检索噪声引入无关指导,注入的技能内容带来大量 token 开销,而模型从未真正习得它所遵循的知识。我们提出一个问题:技能是否可以被内化到模型参数中,使其在无需任何运行时技能检索的情况下实现零样本自主行为?我们提出 Skill0,一个专为技能内化设计的上下文强化学习框架。Skill0 引入了一种训练时课程,从提供完整技能上下文开始,逐步撤除。技能按类别离线分组,并与交互历史一起渲染为紧凑的视觉上下文,教授模型工具调用和多轮任务完成。动态课程机制…

深度·4月5日·17 分钟

评论