LangSmith 沙盒发布:智能体安全执行代码


用 LangSmith SDK 一行代码就能启动沙盒。现已开放私有预览。
3 分钟阅读 2026 年 3 月 17 日
今天,我们推出 LangSmith Sandboxes 的私有预览版:这是一个安全、可扩展的环境,专门用来运行不可信代码。
智能体如果能执行代码,用处就大多了。它们可以分析数据、调用 API、从头构建应用。但让大语言模型随意运行代码,不隔离你的基础设施,风险太高。沙盒提供临时的、锁定的环境,智能体可以在里面安全运行代码,你能控制它们能访问什么、消耗多少资源。
用 LangSmith Sandboxes,你只需一行代码就能启动沙盒。加上 API 密钥,引入 SDK,马上就能用。
我们内部一直在用沙盒来支持像 Open SWE 这样的项目,现在开放出来,让你也能用同样的基础构件来开发。
为什么需要沙盒?
像 Cursor、Claude Code、OpenClaw 这样的编程智能体,展示了让智能体写代码、跑代码有多实用。但没有隔离,智能体可能在你的本地环境执行破坏性或恶意操作。
传统容器是为运行已知的、经过审查的应用代码设计的。智能体生成的代码不一样:它不可信、不可预测。Web 服务器处理的是已知的操作集合。智能体可能尝试任何事,包括恶意命令。
自己构建安全的代码执行环境,通常意味着启动容器、锁定网络访问、把输出传回智能体、用完后清理一切。然后还得处理资源限制,因为智能体跑代码如果不加约束,会快速消耗 CPU、内存和磁盘。随着更多智能体变成编程智能体,这个问题会越来越严重。
需要这种环境的工作负载例子:
- 编程助手:在回复前运行并验证自己的输出
- CI 风格智能体:克隆仓库、安装依赖、运行测试套件,然后才开 PR(比如 Open SWE)
- 数据分析智能体:对数据集执行 Python 脚本并返回结果
LangSmith 平台的一部分
LangSmith Sandboxes 使用和 LangSmith 其他部分相同的 SDK 和基础设施。如果你已经在用 Python 或 JavaScript 客户端做追踪或部署,启动沙盒不需要加任何新东西。
沙盒还直接集成 LangSmith Deployment,你可以把沙盒挂到智能体线程上。它们原生集成 LangChain 的 Deep Agents 开源框架,以及 Open SWE。
现已发布的功能
运行时配置
- 自带 Docker 镜像:用我们的默认镜像,或者指向你自己的私有仓库。每次启动沙盒都带上你需要的文件系统和工具。
- 沙盒模板:定义一次镜像、CPU 和内存配置,之后每次启动沙盒都能复用。结合自带镜像,打造完全自定义的环境。
- 共享访问:让多个智能体访问同一个沙盒,这样就不用在隔离环境间传输工件。
- 池化和自动扩缩:预置一个热沙盒池,智能体不用等冷启动。需求增加时,额外沙盒会自动启动。
执行
- 长时会话:耗时几分钟或几小时的智能体任务不会超时。沙盒支持通过 WebSocket 的持久命令,实时流式输出,让你能看到运行过程。
- 跨交互的持久状态:你的智能体可以在多个线程中使用同一个沙盒,不丢失上下文。文件、安装的包、环境状态在多次运行间保留。
- 隧道:把沙盒端口暴露到本地机器,让你在部署前预览智能体的输出。
SDK 和集成
- 框架无关:可以用 LangChain OSS、其他框架,或者不用框架
- Python 和 JavaScript SDK:两种语言都有首选的客户端,集成在 LangSmith SDK 里
- Deep Agents 集成:用最简配置把沙盒直接插到智能体工作流里
安全性
- 认证代理:沙盒通过认证代理访问外部服务,密钥不接触运行时。凭证完全不在沙盒里。
- 微虚拟机隔离:每个沙盒运行在硬件虚拟化的微虚拟机里,不只是 Linux 命名空间。沙盒之间有内核级隔离。
后续计划
我们正在积极开发沙盒的更多功能。一些正在探索的方向:
- 共享卷:让智能体能在沙盒间共享状态。智能体 1 写入卷,智能体 2 接着处理。
- 二进制授权:控制沙盒里能运行哪些二进制文件。智能体容易有意外行为,比如安装包、导出凭证、把算力消耗在非预期任务上。二进制授权让你可以像管理企业笔记本电脑一样限制执行,控制哪些程序能跑、哪些域名可访问、允许哪些网络调用。
- 完整执行追踪:现在,沙盒调用会跟智能体运行一起追踪。我们正在努力追踪虚拟机里发生的所有事,包括每个进程和网络调用。这同时作为审计日志,给你一份沙盒做了什么、何时做的完整记录。
我们很想知道哪些功能对你的工作流最重要。加入我们的 Slack 社区分享想法。
开始使用
LangSmith Sandboxes 现已开放私有预览。如果你在构建需要安全代码执行的智能体,可以注册试用。
订阅我们的通讯
获取 LangChain 团队和社区的更新
输入你的邮箱
处理中...
成功!请检查收件箱并点击链接确认订阅。
抱歉,出错了。请重试。
觉得有用?分享给更多人