LangSmith 沙盒发布:智能体安全执行代码

指南LangChain2026年3月17日3 分钟阅读
LangSmith 沙盒发布:智能体安全执行代码
LangSmith 推出沙盒功能,用一行代码就能启动隔离环境,让智能体安全运行代码。现已开放私有预览,支持 Python 和 JavaScript SDK。

Introducing LangSmith Sandboxes

用 LangSmith SDK 一行代码就能启动沙盒。现已开放私有预览。

3 分钟阅读 2026 年 3 月 17 日

今天,我们推出 LangSmith Sandboxes 的私有预览版:这是一个安全、可扩展的环境,专门用来运行不可信代码。

智能体如果能执行代码,用处就大多了。它们可以分析数据、调用 API、从头构建应用。但让大语言模型随意运行代码,不隔离你的基础设施,风险太高。沙盒提供临时的、锁定的环境,智能体可以在里面安全运行代码,你能控制它们能访问什么、消耗多少资源。

用 LangSmith Sandboxes,你只需一行代码就能启动沙盒。加上 API 密钥,引入 SDK,马上就能用。

我们内部一直在用沙盒来支持像 Open SWE 这样的项目,现在开放出来,让你也能用同样的基础构件来开发。

加入等待列表

为什么需要沙盒?

像 Cursor、Claude Code、OpenClaw 这样的编程智能体,展示了让智能体写代码、跑代码有多实用。但没有隔离,智能体可能在你的本地环境执行破坏性或恶意操作。

传统容器是为运行已知的、经过审查的应用代码设计的。智能体生成的代码不一样:它不可信、不可预测。Web 服务器处理的是已知的操作集合。智能体可能尝试任何事,包括恶意命令。

自己构建安全的代码执行环境,通常意味着启动容器、锁定网络访问、把输出传回智能体、用完后清理一切。然后还得处理资源限制,因为智能体跑代码如果不加约束,会快速消耗 CPU、内存和磁盘。随着更多智能体变成编程智能体,这个问题会越来越严重。

需要这种环境的工作负载例子:

  • 编程助手:在回复前运行并验证自己的输出
  • CI 风格智能体:克隆仓库、安装依赖、运行测试套件,然后才开 PR(比如 Open SWE)
  • 数据分析智能体:对数据集执行 Python 脚本并返回结果

LangSmith 平台的一部分

LangSmith Sandboxes 使用和 LangSmith 其他部分相同的 SDK 和基础设施。如果你已经在用 Python 或 JavaScript 客户端做追踪或部署,启动沙盒不需要加任何新东西。

沙盒还直接集成 LangSmith Deployment,你可以把沙盒挂到智能体线程上。它们原生集成 LangChain 的 Deep Agents 开源框架,以及 Open SWE。

现已发布的功能

运行时配置

  • 自带 Docker 镜像:用我们的默认镜像,或者指向你自己的私有仓库。每次启动沙盒都带上你需要的文件系统和工具。
  • 沙盒模板:定义一次镜像、CPU 和内存配置,之后每次启动沙盒都能复用。结合自带镜像,打造完全自定义的环境。
  • 共享访问:让多个智能体访问同一个沙盒,这样就不用在隔离环境间传输工件。
  • 池化和自动扩缩:预置一个热沙盒池,智能体不用等冷启动。需求增加时,额外沙盒会自动启动。

执行

  • 长时会话:耗时几分钟或几小时的智能体任务不会超时。沙盒支持通过 WebSocket 的持久命令,实时流式输出,让你能看到运行过程。
  • 跨交互的持久状态:你的智能体可以在多个线程中使用同一个沙盒,不丢失上下文。文件、安装的包、环境状态在多次运行间保留。
  • 隧道:把沙盒端口暴露到本地机器,让你在部署前预览智能体的输出。

SDK 和集成

  • 框架无关:可以用 LangChain OSS、其他框架,或者不用框架
  • Python 和 JavaScript SDK:两种语言都有首选的客户端,集成在 LangSmith SDK 里
  • Deep Agents 集成:用最简配置把沙盒直接插到智能体工作流里

安全性

  • 认证代理:沙盒通过认证代理访问外部服务,密钥不接触运行时。凭证完全不在沙盒里。
  • 微虚拟机隔离:每个沙盒运行在硬件虚拟化的微虚拟机里,不只是 Linux 命名空间。沙盒之间有内核级隔离。

后续计划

我们正在积极开发沙盒的更多功能。一些正在探索的方向:

  • 共享卷:让智能体能在沙盒间共享状态。智能体 1 写入卷,智能体 2 接着处理。
  • 二进制授权:控制沙盒里能运行哪些二进制文件。智能体容易有意外行为,比如安装包、导出凭证、把算力消耗在非预期任务上。二进制授权让你可以像管理企业笔记本电脑一样限制执行,控制哪些程序能跑、哪些域名可访问、允许哪些网络调用。
  • 完整执行追踪:现在,沙盒调用会跟智能体运行一起追踪。我们正在努力追踪虚拟机里发生的所有事,包括每个进程和网络调用。这同时作为审计日志,给你一份沙盒做了什么、何时做的完整记录。

我们很想知道哪些功能对你的工作流最重要。加入我们的 Slack 社区分享想法。

开始使用

LangSmith Sandboxes 现已开放私有预览。如果你在构建需要安全代码执行的智能体,可以注册试用。

加入等待列表

订阅我们的通讯

获取 LangChain 团队和社区的更新

输入你的邮箱

处理中...

成功!请检查收件箱并点击链接确认订阅。

抱歉,出错了。请重试。

本文编译自 Introducing LangSmith Sandboxes: Secure Code Execution for Agents,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论