S
SkillNav

LangChain 发布首批 Skills,让 Claude Code 相关任务通过率升至 95%

资讯LangChain2026-03-04T18:00:19+00:004 分钟阅读
LangChain 发布首批 Skills,让 Claude Code 相关任务通过率升至 95%

LangChain Skills

2 分钟阅读|2026 年 3 月 4 日

我们正在发布首批 Skills,帮助 AI 编码 Agent 在开源 LangChain 生态中获得更强的专业能力。其覆盖内容包括如何基于 LangChainLangGraphDeep Agents 构建 Agent。在我们的评测集中,Claude Code 在这些任务上的表现从 29% 提升到了 95%。

什么是 Skills?

Skills 是一套经过整理的指令、脚本和资源,用于提升编码 Agent 在特定领域任务中的表现。更关键的是,Skills 通过“渐进式披露”动态加载——Agent 只会在当前任务相关时才拉取对应 Skill。这能显著增强 Agent 能力,因为历史经验表明,给 Agent 配置过多工具反而会导致性能下降

Skills 具备可移植、可共享特性——它们由 markdown 文件和脚本组成,可按需检索。我们正在分享一组 LangChain Skills,它可以迁移到任何支持 skill 功能的编码 Agent 上。

LangChain Skills

langchain-skills repo 中,我们维护了 11 个 Skills,大体分为 3 类:

  • LangChain: 指导如何使用 LangChain 的 create_agent()、middleware 与 tool 模式,这是使用经典 tool calling Agent 循环的基础。
  • LangGraph: 指导如何使用 LangGraph 的基础原语(primitives),并利用其对 Human In the Loop、durable execution 等能力的原生支持。
  • Deep Agents: 指导如何使用我们的开源 Deep Agents package,并利用其预构建 middleware 和 FileSystem

Skill 带来的效果

使用 Skills 后,我们观察到 Claude Code 在 LangChain、LangGraph 和 Deep Agent 基础任务上的表现显著提升。

Test

Model

Pass Rate

Claude Code without Skills

Sonnet 4.6

25%

Claude Code with Skills

Sonnet 4.6

95%

通过率由 LangSmith evaluations 计算得出。我们计划将此次使用的测试基准开源。

如果你想直观看到这些 Skills 如何让构建 Agent 变得更简单,请查看下方视频:

安装

你可以使用 npx skills 安装这些 Skills:

本地(当前项目):

code
npx skills add langchain-ai/langchain-skills --skill '*' --yes

全局(所有项目):

code
npx skills add langchain-ai/langchain-skills --skill '*' --yes --global

将 Skills 绑定到特定 Agent(例如 Claude Code):

code
npx skills add langchain-ai/langchain-skills --agent claude-code --skill '*' --yes --global

结语

我们很期待社区通过 LangChain 和 LangSmith 改善你在我们生态中的构建体验。随着 Open Source 与 LangSmith 新能力持续推出,我们也会不断补充新的 Skills 内容。除了这批面向 LangChain 开源生态的 Skills,我们今天也同步发布了一组 LangSmith skills。如果你有更多 Skill 想法或改进建议,欢迎告诉我们!

订阅我们的新闻通讯

来自 LangChain 团队和社区的更新

输入你的邮箱

正在处理你的申请……

成功!请检查你的邮箱,并点击链接确认订阅。

抱歉,出了点问题。请重试。

查看原文 ↗

相关文章

资讯Simon Willison·3月6日
Clinejection 攻击披露:仅靠 Issue 分诊提示词即可攻陷 Cline 生产发布流程

研究者 Adnan Khan 披露了一条针对 Cline GitHub 仓库的完整攻击链:攻击者先通过 Issue 标题中的 prompt injection 控制 AI 分诊流程,再借助 GitHub Actions 缓存投毒影响夜间发布任务。尽管分诊工作流本身不含高价值密钥,但因与发布工作流共享缓存键,最终仍导致 NPM 发布凭据可被窃取。事件后 `cline@2.3.0` 曾被匿名攻击者发布(现已撤回),所幸未造成更严重后果。

3 分钟
Copilot 代码审查突破 6000 万次,GitHub 详解 Agent 架构演进
资讯GitHub·3月5日
Copilot 代码审查突破 6000 万次,GitHub 详解 Agent 架构演进

GitHub 表示,自 2025 年 4 月推出 Copilot code review 以来,使用量已增长 10 倍,如今占 GitHub 全站代码审查的五分之一以上。团队通过持续评估闭环与 Agent 化架构优化,将“好审查”聚焦在准确性、信号强度与速度三项核心指标,并在真实生产环境中用开发者反馈和问题修复率衡量效果。当前已有超过 1.2 万家组织在每个 pull request 上自动运行该能力,GitHub 下一步将推进更深度个性化与双向交互审查体验。

8 分钟