gpt-oss-safeguard 技术报告:基于策略推理的内容标注模型
深度OpenAI2025年10月29日2 分钟阅读
gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 是两个开源的推理模型,它们基于 gpt-oss 模型进行后训练,能够根据提供的策略对内容进行标注。这份报告详细介绍了这两个模型的能力,并以原始 gpt-oss 模型为基准,提供了初步的安全评估结果。
本文编译自 gpt-oss-safeguard technical report,版权归原作者所有。
觉得有用?分享给更多人