LLM 配网络攻击工具包,可攻破企业级网络

深度Anthropic2026年3月24日4 分钟阅读
LLM 配网络攻击工具包,可攻破企业级网络
卡内基梅隆大学与 Anthropic 的研究显示,未经网络安全微调的大语言模型(LLM),在配备名为 Incalmo 的新型工具包后,能在包含数十台主机的网络上成功执行多阶段攻击。在十组模拟网络中,LLM 使用 Incalmo 完全攻破了 5 个,部分攻破了 4 个。

卡内基梅隆大学 CyLab 与 Anthropic 的研究人员发现,未经网络安全微调的大语言模型(LLM),在配备名为 Incalmo 的新型网络攻击工具包后,能在包含 25 至 50 台主机的企业级网络上成功执行多阶段攻击。这项研究揭示了 LLM 如何降低复杂网络攻击的门槛,同时为自动化当前网络防御工作流提供了可能路径。

研究人员开发了 Incalmo 工具包来帮助 LLM 规划和执行复杂攻击。Incalmo 就像一个翻译器——它将 AI 关于如何攻击的思考,转换成执行攻击所需的特定计算机命令。

攻击成功率显著提升

  • 使用 Incalmo 的 LLM 在 10 个测试网络中完全攻破了 5 个,部分攻破了 4 个。相比之下,没有 Incalmo 工具包时,攻击几乎完全失败。
  • 成功的攻击需要编排复杂的步骤序列,包括获得初始网络访问权限、在系统间横向移动以及跨网络进行数据窃取。
  • 本次评估的场景比之前 LLM 在基础网络安全挑战上的测试更为真实和复杂,但攻击仍依赖于已知漏洞,而非发现和利用新漏洞。此外,Incalmo 中的部分工具是专门为这些研究场景构建的;要威胁真实网络,还需要添加新工具。

图 1. 没有 Incalmo 时,所有测试的 LLM 在十个环境中均未实现端到端的多阶段攻击,只有 Claude Sonnet 3.5 在 4 层链式环境中窃取了一个文件。

图 2. 配备 Incalmo 后,LLM 能在十分之九的环境中成功且自主地执行多阶段攻击,这些环境包含 25 到 50 台主机。

模拟真实历史攻击场景

研究人员在十个模拟网络上测试了六个 LLM,其中包括对历史上代价最高的网络攻击之一——Equifax 数据泄露事件的高保真模拟。 所有测试模型在配备 Incalmo 后,都在 Equifax 模拟中取得了至少部分成功。

  • 除一个 LLM 外,其他模型在模拟 Colonial Pipeline 攻击时都表现出完全或部分成功。在其他包含企业常见网络拓扑的虚构场景中,LLM 的表现则好坏参半。
  • 这些成果是在极少人工干预下取得的。提示仅限于介绍 Incalmo、场景和目标,攻击则由 LLM 自主执行。
  • 研究设置的一个局限性是模拟网络缺乏主动防御,这使得它们更容易被攻破。

图 3. 无辅助 LLM 与配备 Incalmo 的 LLM 差异示意图。

对攻防研究的启示

这些结果表明了 LLM 如何降低实施复杂网络攻击的门槛,凸显了投资研究 LLM 攻防能力的重要性。 LLM 的正常规模扩展、Incalmo 等工具的改进以及网络攻击微调的潜力,都是这些能力快速发展的途径。这是我们积极研究的领域。

  • 作为通用扩展作用的一个例子,Claude Sonnet 3.5 尽管并非专门为提高网络攻击能力而设计,但在模拟网络攻击场景中(双方均无法使用 Incalmo 时),其表现优于较小的模型 Claude Haiku 3.5。
  • 随着能力提升和使用 LLM 的成本下降,恶意行为者可能更容易发起多阶段网络攻击,这需要加大对防御性研究的投入。
  • 需要更多研究来了解通过微调可实现的性能提升,以及 LLM 网络攻击者在面对主动防御网络时的有效性。
  • 在防御方面,配备网络工具包的 LLM 模拟人类网络攻击模式的能力持续改进,为自动化渗透测试创造了有前景的机会,这可以加速识别网络漏洞。

更多细节请参阅完整研究论文(Singer et al. 2025

脚注

[1] Brian Singer et al., "On the Feasibility of Using LLMs to Execute Multistage Network Attacks," arXiv preprint arXiv:2501.16466 (2025), https://arxiv.org/abs/2501.16466.

[2] 参见上述引用的 Singer et al. (2025),了解相关工作回顾。

相关内容

Anthropic 经济指数报告:学习曲线

Anthropic 的第五份经济指数报告研究了 2026 年 2 月 Claude 的使用情况,建立在我们上一份报告中引入的经济原语框架之上。

阅读更多

介绍我们的科学博客

我们正在推出一个关于 AI 和科学的新博客。我们将分享 Anthropic 及其他地方的研究,与外部研究人员和实验室的合作,并讨论科学家在自己工作中使用 AI 的实用工作流。

阅读更多

用于科学计算的长时间运行 Claude

运行 Claude Code 处理多日科学任务的实用指南——测试预言、持久化内存和编排模式。

阅读更多

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Simon Willison 正在重构 LLM Python 库的抽象层,以支持服务器端工具执行等新功能。他利用 Claude Code 分析了四大 LLM 提供商的客户端库,生成了用于测试的 curl 命令和 JSON 输出。这些调研材料已开源,旨在帮助设计更通用的 API 抽象。

深度Simon Willison·4月5日·1 分钟

智能体技能——包含程序性知识和可执行资源的结构化包,供智能体在推理时动态加载——已成为增强 LLM 智能体的可靠机制。然而,推理时技能增强存在根本性限制:检索噪声引入无关指导,注入的技能内容带来大量 token 开销,而模型从未真正习得它所遵循的知识。我们提出一个问题:技能是否可以被内化到模型参数中,使其在无需任何运行时技能检索的情况下实现零样本自主行为?我们提出 Skill0,一个专为技能内化设计的上下文强化学习框架。Skill0 引入了一种训练时课程,从提供完整技能上下文开始,逐步撤除。技能按类别离线分组,并与交互历史一起渲染为紧凑的视觉上下文,教授模型工具调用和多轮任务完成。动态课程机制…

深度·4月5日·17 分钟

评论