Together AI 联手 Meta,PyTorch 强化学习上云

指南2025年12月3日3 分钟阅读
Together AI 联手 Meta,PyTorch 强化学习上云
Together AI 与 Meta 的 PyTorch 团队合作,正在构建一个用于训练智能体(Agentic)AI 系统的开源强化学习框架。该集成将提供一个完整的平台,用于构建、训练和部署下一代 AI 智能体。

Together AI 与 Meta 的 PyTorch 团队正在合作,共同构建一个用于训练智能体(Agentic)AI 系统的开源强化学习(Reinforcement Learning)框架。这一集成旨在提供一个完整的平台,用于构建、训练和部署下一代 AI 智能体。

强化学习赋能现代智能体系统

强化学习正成为现代智能体模型训练流程中的一项强大能力。随着新的智能体用例不断涌现,模型越来越需要在更长的时间跨度内运行,与动态环境交互,并在多步骤工作流中执行推理和工具调用(Tool Use)等任务。强化学习提供了满足这些需求的机制——最终产出具有更好策略、更强推理能力、且行为更有效对齐目标(Goal Alignment)的模型。

携手解锁高性能强化学习

我们很高兴宣布 Together AI 与 Meta PyTorch 团队之间的合作,双方将整合以下优势:

Together AI Research 作为 AI 原生云(AI Native Cloud)提供商,专注于为现代智能体系统构建、训练和部署大规模 AI 模型。

Meta 的 PyTorch 团队 作为 PyTorch 的创建者和主要维护者,PyTorch 是全球应用最广泛的开源训练框架。

对开源的承诺 赋能 AI 社区构建、实验并推进下一代智能体系统的发展。

通过这次合作,我们将在 PyTorch 技术栈上构建一个强大的开源 RL 框架,将复杂的高性能强化学习集成到 Together AI 平台中。这项 RL 服务将补充 Together 现有的平台服务套件——包括监督微调(Supervised Fine-Tuning)、沙盒环境、评估工具、模型优化和高性能推理——为下一代智能体系统提供高级能力。最终形成一个完整的平台,团队无需拼凑零散的工具,即可构建、训练和部署前沿的智能体系统。

参与进来!

我们正在积极与构建下一代 AI 模型和应用的团队合作。如果你正在探索现代训练技术的可能性——无论是为了下一代 AI 应用、高级智能体系统,还是前沿模型开发——我们很乐意与你联系,探讨这次合作如何加速你的工作。

这篇博客文章中阅读我们与 TorchForge 在即时集群(Instant Clusters)上的首次合作详情——并立即亲自尝试!

code
![](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/6994e2f1daa0c6879cc689b2_google.svg)

8S

DeepSeek R1

![](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/6991c1d480f968c7e77a08d1_illustration-block.avif)

Premium cinematic video generation with native audio and lifelike physics.

DeepSeek R1

8S

## Audio Name

Audio Description

0:00

Premium cinematic video generation with native audio and lifelike physics.

![](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/6994e2f1daa0c6879cc689b2_google.svg)

8S

DeepSeek R1

![](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/6991c1d480f968c7e77a08d1_illustration-block.avif)

Premium cinematic video generation with native audio and lifelike physics.

Performance & Scale

Body copy goes here lorem ipsum dolor sit amet

*   Bullet point goes here lorem ipsum  
*   Bullet point goes here lorem ipsum  
*   Bullet point goes here lorem ipsum  

Infrastructure

Best for

*   Faster processing speed (lower overall query latency) and lower operational costs
    
*   Execution of clearly defined, straightforward tasks
    
*   Function calling, JSON mode or other well structured tasks
    

List Item  #1

*   Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
*   Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
*   Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.

List Item  #1

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

Build

Benefits included:

*   ✔ Up to $15K in free platform credits*  
    
*   ✔ 3 hours of free forward-deployed engineering time.  
    

Funding: Less than $5M

Build

Benefits included:

*   ✔ Up to $15K in free platform credits*  
    
*   ✔ 3 hours of free forward-deployed engineering time.  
    

Funding: Less than $5M

Build

Benefits included:

*   ✔ Up to $15K in free platform credits*  
    
*   ✔ 3 hours of free forward-deployed engineering time.  
    

Funding: Less than $5M

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论