Together Code Interpreter:API 调用执行 LLM 生成代码

指南2025年5月20日4 分钟阅读
Together Code Interpreter:API 调用执行 LLM 生成代码
Together 推出 Code Interpreter API,让 LLM 生成的代码能直接执行并返回结果。这简化了智能体工作流开发,还能加速强化学习训练。

今天,我们发布了 Together Code Interpreter(TCI):一个 API,让你能运行 LLM 生成的代码,并立即获得响应。有了 TCI,你可以构建更智能的应用,提供更丰富的回复。

数百万开发者和企业正在用 LLM 生成代码、配置智能体工作流。但 LLM 擅长生成代码,却无法执行它,开发者得手动测试、调试,再把代码部署到独立环境。

Together Code Interpreter 解决了这个短板。它用简单的方式安全、大规模地执行 LLM 生成的代码,简化了智能体工作流开发,并为强化学习操作打开了新可能。

在这篇深度博客中,我们将探讨如何用我们的 Python 库 启动会话执行 Python 代码,并讨论 TCI 的关键应用场景。

大规模配置智能体工作流

随着智能体工作流开发成为企业利用自主任务管理优势的重点,这些 AI 先行者需要一种快速运行 LLM 生成代码的方法,而无需为高级沙箱工具做大量底层工作。所以我们把 Together Code Interpreter 做成了一个简单的 API:

  1. 接收 LLM 生成的代码作为输入。
  2. 创建一个会话,在安全、快速的沙箱环境中执行代码。
  3. 输出代码执行结果(stdout、stderr)。

输出结果可以反馈给 LLM,在闭环智能体工作流系统中持续迭代,最终让 LLM 能向用户输出更丰富的回复。

一个好例子是让 Qwen Coder 32B 这样的 LLM 画图表。LLM 会尽力用纯文本表示图表,但它无法执行代码输出实际图表。当我们允许 LLM 使用 Together Code Interpreter 时,它就能生成 Python 代码,执行它,并向用户输出图表图片。

你的浏览器不支持视频标签。

增强强化学习

由于能快速执行代码并输出结果,Together Code Interpreter 引起了大量用强化学习(RL)训练模型的机器学习团队的兴趣。

TCI 通过在执行训练期间执行模型生成的代码,发挥关键作用,实现通过严格单元测试的自动化评估。每次 RL 迭代中,批次会在广泛的问题集上评估——通常涉及超过一千个独立单元测试同时执行。TCI 轻松扩展到处理数百个并发沙箱执行,提供安全环境隔离执行,暴露标准输入/输出接口(stdin、stdout 和评估输出),并无缝集成到现有 RL 工作流中。

{{custom-cta-1}}

我们特别自豪能与 Agentica 合作,这是一个来自伯克利 AI 研究和 Sky Computing Lab 的开源项目,将 TCI 集成到他们的强化学习操作中。Agentica 利用 TCI 在 1024 个编码问题批次上同时运行单元测试,以每个问题 3 美分的低成本显著加速了训练周期,同时通过严格的稀疏结果奖励模型提高模型准确性——该模型仅在所有 15 个采样单元测试通过时给予全额奖励,如果有一个测试失败或输出格式错误则不给奖励。

最终模型 DeepCoder-14B-Preview 在 LiveCodeBench 上取得了令人印象深刻的 60.6% Pass@1 准确率,仅用 140 亿参数就匹配了 o3-mini-2025-01-031(低)和 o1-2024-12-17 的性能——这充分证明了代码解释在 RL 操作中的巨大影响。

“Together Code Interpreter 极大地加速了我们的 RL 后训练周期,让我们能可靠地扩展到超过 100 个并发编码沙箱,每分钟运行数千次代码评估。其可靠且可扩展的基础设施已被证明非常宝贵。” — Michael Luo & Sijun Tan,Agentica 项目负责人

我们很高兴能继续支持像 Agentica 这样推动高级 LLM 编码前沿的机器学习团队。详细集成说明,请查看 Agentica 的 开源仓库

为规模做好准备

为了让开发者更容易大规模利用 TCI,无论其用例如何,我们引入了“会话”作为 TCI 使用和计量的单位。一个会话代表一个活跃的代码执行环境,可被调用来执行代码。每个会话有 60 分钟的生命周期,可被多次调用执行多个不同的代码执行任务。为简化计费,我们将 TCI 使用定价为 0.03 美元/会话。

会话允许用户基于先前的执行构建。通过在请求中引用会话 ID,你可以在多个请求中引用相同的变量。

有关会话、TCI 计费和速率限制的更多信息,请查看我们的 文档

支持 MCP

我们还推出了 MCP 支持!Together Code Interpreter MCP 服务器可在 Smithery 上访问。这让你能为任何 MCP 客户端(如 Cursor、Windsurf 或你自己的聊天应用)添加代码解释能力。

开始使用

你可以立即开始使用 Together Code Interpreter,通过我们的 Python SDKAPI

别忘了查看我们的 文档cookbook,几分钟内就能启动你的第一个 TCI 实例!

开始使用 Together Code Interpreter

为你的智能体工作流带来复杂逻辑、代码执行、数据分析等功能。

8S

DeepSeek R1

具有原生音频和逼真物理效果的高级电影视频生成。

DeepSeek R1

8S

音频名称

音频描述

0:00

支持原生音频和逼真物理效果的高品质电影级视频生成。

8S

DeepSeek R1

支持原生音频和逼真物理效果的高品质电影级视频生成。

性能与规模

正文内容占位符,Lorem ipsum dolor sit amet

  • 要点占位符,Lorem ipsum
  • 要点占位符,Lorem ipsum
  • 要点占位符,Lorem ipsum

基础设施

适用场景

  • 处理速度更快(整体查询延迟更低),运营成本更低
  • 执行定义清晰、直接的任务
  • 函数调用(Function Calling)、JSON 模式或其他结构化良好的任务

列表项 #1

  • Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
  • Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
  • Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.

列表项 #1

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

构建

包含的福利:

  • ✔ 最高 1.5 万美元的免费平台积分*
  • ✔ 3 小时免费的前置部署工程时间。

融资情况:少于 500 万美元

构建

包含的福利:

  • ✔ 最高 1.5 万美元的免费平台积分*
  • ✔ 3 小时免费的前置部署工程时间。

融资情况:少于 500 万美元

构建

包含的福利:

  • ✔ 最高 1.5 万美元的免费平台积分*
  • ✔ 3 小时免费的前置部署工程时间。

融资情况:少于 500 万美元

开始使用 Together Code Interpreter

将复杂逻辑、代码执行、数据分析等功能集成到你的智能体工作流中。

8S

DeepSeek R1

支持原生音频和逼真物理效果的高品质电影级视频生成。

DeepSeek R1

8S

音频名称

音频描述

0:00

支持原生音频和逼真物理效果的高品质电影级视频生成。

8S

DeepSeek R1

支持原生音频和逼真物理效果的高品质电影级视频生成。

性能与规模

正文内容占位符,Lorem ipsum dolor sit amet

  • 要点占位符,Lorem ipsum
  • 要点占位符,Lorem ipsum
  • 要点占位符,Lorem ipsum

基础设施

适用场景

  • 处理速度更快(整体查询延迟更低),运营成本更低
  • 执行定义清晰、直接的任务
  • 函数调用(Function Calling)、JSON 模式或其他结构化良好的任务

列表项 #1

  • Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
  • Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
  • Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.

列表项 #1

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

构建

包含的福利:

  • ✔ 最高 1.5 万美元的免费平台积分*
  • ✔ 3 小时免费的前置部署工程时间。

融资情况:少于 500 万美元

构建

包含的福利:

  • ✔ 最高 1.5 万美元的免费平台积分*
  • ✔ 3 小时免费的前置部署工程时间。

融资情况:少于 500 万美元

构建

包含的福利:

  • ✔ 最高 1.5 万美元的免费平台积分*
  • ✔ 3 小时免费的前置部署工程时间。

融资情况:少于 500 万美元

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论