MosaicLeaks:研究型Agent如何避免泄露隐私信息
深度Hugging Face2026年6月18日10 分钟阅读

ServiceNow 的研究提出了 MosaicLeaks 基准测试,用于评估深度研究型 Agent 在结合本地文档和网络检索时的隐私泄露风险。他们发现,仅提升任务表现会让泄露更严重,而一种感知隐私的强化学习方法 PA-DR 能将信息泄露率从 34.0% 降至 9.9%,同时几乎不牺牲任务成功率。
本文编译自 MosaicLeaks: Can your research agent keep a secret?,版权归原作者所有。
觉得有用?分享给更多人