OpenAI 持续加固 ChatGPT Atlas,应对 Prompt Injection 攻击
资讯OpenAI2025-12-22T00:00:00+00:001 分钟阅读
OpenAI 正在加强 ChatGPT Atlas 对 Prompt Injection 攻击的防御能力,方法是采用经过强化学习训练的自动化红队。这个主动的“发现—修补”闭环有助于及早识别新型利用方式,并在 AI 日益 Agent 化的背景下,持续加固该浏览器 Agent 的防御体系。
原文链接:https://openai.com/index/hardening-atlas-against-prompt-injection