OpenAI发布思维链可监控性评测框架
深度OpenAI2025-12-18T12:00:00+00:001 分钟阅读
OpenAI 推出了一个新的思维链(chain-of-thought)可监控性框架与评测套件,覆盖 24 个环境中的 13 项评估。我们的研究发现,与仅监控模型输出相比,监控模型内部推理过程要有效得多,这为在 AI 系统能力不断增强的情况下实现可扩展控制提供了一条很有前景的路径。
原文链接:https://openai.com/index/evaluating-chain-of-thought-monitorability