monday Service 如何用 LangSmith 构建评估优先开发框架

指南LangChain2026年2月18日5 分钟阅读

monday Service 团队将评估作为 Day 0 要求，而非事后检查。他们通过 LangSmith 集成 Vitest，构建了评估驱动开发框架，将反馈循环速度提升了 8.7 倍。

本文编译自 monday Service + LangSmith: Building a Code-First Evaluation Strategy from Day 1，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

关注 @skillnav_dev →阅读周刊

Claude Code 漏洞可致 CI/CD 凭证泄露

这篇文章梳理了 Claude Code 中被归为 CVE-2026-35022 的三处高危命令注入问题，影响 CLI 0.2.87 和 Claude Code 2.1.87。给出的直接建议很明确：立刻升级、停用 authentication helpers、改为直接设置 ANTHROPIC_API_KEY，并且不要在 CI/CD 里对不受信任的 PR 运行这个 CLI。

指南·4月19日·4 分钟

Anthropic 发布 Claude Design，剑指 Figma 和 Canva

Claude Design 是 Anthropic 推出的设计工具，可基于代码库或设计文件生成设计系统，并允许用户实时调整元素。它支持导出为 PDF、PPT 或 HTML，并能与 Canva 或 Claude Code 集成。不过，其 token 消耗较高，且目前处于研究预览阶段。

指南The New Stack·4月17日·3 分钟

monday Service 如何用 LangSmith 构建评估优先开发框架

相关文章

Claude Code 漏洞可致 CI/CD 凭证泄露

Anthropic 发布 Claude Design，剑指 Figma 和 Canva

评论