FACTS Grounding:大语言模型事实性评估新基准
深度2024年12月17日4 分钟阅读
Google DeepMind 发布 FACTS Grounding 基准,用 1,719 个长文档示例评估 LLM 的响应是否基于给定材料且无幻觉。同时上线 Kaggle 排行榜,已测试主流模型并公布初始分数。
本文编译自 FACTS Grounding: A new benchmark for evaluating the factuality of large language models,版权归原作者所有。
觉得有用?分享给更多人