OpenAI 与 Paradigm 推出 EVMbench,评测 AI Agent 智能合约漏洞能力
资讯OpenAI2026-02-18T00:00:00+00:001 分钟阅读
OpenAI 与 Paradigm 发布了 EVMbench,这是一套用于评估 AI Agent 在高严重性智能合约漏洞上的检测、修复与利用能力的基准测试。
OpenAI 与 Paradigm 发布了 EVMbench,这是一套用于评估 AI Agent 在高严重性智能合约漏洞上的检测、修复与利用能力的基准测试。
OpenAI 发布了 Learning Outcomes Measurement Suite,用于系统评估 AI 在教育场景中的实际学习成效。该套件强调跨不同教学环境、并在更长时间周期内跟踪学生学习结果,帮助更准确判断 AI 的教育价值。
Axios 首席运营官 Allison Murphy 介绍了公司如何将 AI 用于本地新闻生产。核心做法是借助 AI 支持一线本地记者、优化新闻编辑部流程,并以更高效率扩大高影响力本地报道的覆盖规模。