Claude Mythos Preview 的网络安全能力评估

深度2026年4月7日5 分钟阅读
Claude Mythos Preview 的网络安全能力评估
Anthropic 团队评估了 Claude Mythos Preview 在网络安全任务上的表现,发现它能自主发现并利用零日漏洞,包括在 OpenBSD 等安全导向的操作系统中找到 27 年前的旧漏洞。模型在漏洞利用成功率上相比前代 Opus 4.6 有数量级提升。
本文编译自 Assessing Claude Mythos Preview’s cybersecurity capabilities,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

本文提出Mega-ASR框架,通过构建包含54种复合声学场景的Voices-in-the-Wild-2M数据集,结合渐进式声学到语义优化和双粒度WER门控策略,在复杂噪声环境下相对词错误率降低超30%。该方法突破了现有模型在真实世界中的声学鲁棒性瓶颈。

深度·5月23日·26 分钟

本文发现RLVR训练的权重轨迹是低秩且可预测的,秩一近似即可捕获大部分性能增益。基于此提出RELEX方法,通过短窗口观测估计秩一子空间,并用线性回归外推未来检查点,仅需15%的训练步数即可匹配或超越完整RLVR性能。该方法能外推到观测窗口的10-20倍以上,且无需学习模型,归功于秩一投影的降噪效应。

深度·5月23日·25 分钟

评论