S
SkillNav

gpt-oss-safeguard 技术报告:两款开源权重推理模型的能力与安全基线评估

深度OpenAI2025-10-29T00:00:00+00:001 分钟阅读

gpt-oss-safeguard-120b 与 gpt-oss-safeguard-20b 是两款基于 gpt-oss 模型进行后训练(post-trained)的开源权重推理模型,能够根据提供的策略进行推理,并在该策略框架下对内容进行标注。

在本报告中,我们将介绍 gpt-oss-safeguard 的能力,并给出对 gpt-oss-safeguard 模型的基线安全评估;评估过程中以其底层 gpt-oss 模型作为基线对照。

如需进一步了解底层 gpt-oss 模型的开发过程与架构信息,请参阅原始 gpt-oss 模型的 model card。

原文链接:https://openai.com/index/gpt-oss-safeguard-technical-report

相关文章

资讯OpenAI·3月4日
OpenAI 推出学习成果测量套件,评估 AI 对教育成效的长期影响

OpenAI 发布了 Learning Outcomes Measurement Suite,用于系统评估 AI 在教育场景中的实际学习成效。该套件强调跨不同教学环境、并在更长时间周期内跟踪学生学习结果,帮助更准确判断 AI 的教育价值。

1 分钟
深度OpenAI·3月4日
Axios 如何用 AI 放大本地新闻影响力

Axios 首席运营官 Allison Murphy 介绍了公司如何将 AI 用于本地新闻生产。核心做法是借助 AI 支持一线本地记者、优化新闻编辑部流程,并以更高效率扩大高影响力本地报道的覆盖规模。

1 分钟