Pipevals:可视化评估流水线,为LLM应用打分
指南2026年3月31日3 分钟阅读
Pipevals 是一个可视化流水线构建工具,专为 AI 系统评估设计。只需在现有 LLM 代码后加一个 API 调用,就能自动评估每个响应,无需 SDK 或包装器。
本文编译自 Pipevals: Evaluation pipelines for every LLM application,版权归原作者所有。
觉得有用?分享给更多人
觉得有用?分享给更多人
Datasette Agent 是一个可扩展的 AI 助手,提供对话式数据查询接口。支持通过插件生成图表、图片和代码执行。可运行本地模型,并已为 Datasette Cloud 用户准备。
datasette-agent-sprites 0.1a0 是 Simon Willison 发布的一个 beats,为 Datasette Agent 增加了与 Fly Sprites 交互的工具。