MosaicLeaks:研究型Agent如何避免泄露隐私信息

深度Hugging Face2026年6月18日10 分钟阅读
MosaicLeaks:研究型Agent如何避免泄露隐私信息
ServiceNow 的研究提出了 MosaicLeaks 基准测试,用于评估深度研究型 Agent 在结合本地文档和网络检索时的隐私泄露风险。他们发现,仅提升任务表现会让泄露更严重,而一种感知隐私的强化学习方法 PA-DR 能将信息泄露率从 34.0% 降至 9.9%,同时几乎不牺牲任务成功率。
本文编译自 MosaicLeaks: Can your research agent keep a secret?,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Anthropic 推出 Claude Tag,将 Claude 深度集成到 Slack 中,支持异步委托、跨频道协同、代码库接入和自动化工作流。产品处于 beta 阶段,面向 Claude Enterprise 和 Team 用户。

深度Latent Space·6月24日·6 分钟

Anthropic 推出 Claude Tag,将 Claude 嵌入 Slack 作为永久、共享的团队成员。Claude 拥有自己的身份和权限,可以跨频道工作,支持多人协作,并允许管理员设置 token 消费上限。

深度The New Stack·6月23日·4 分钟

评论