Together AI 联手 Meta,PyTorch 强化学习上云
.png)
Together AI 与 Meta 的 PyTorch 团队正在合作,共同构建一个用于训练智能体(Agentic)AI 系统的开源强化学习(Reinforcement Learning)框架。这一集成旨在提供一个完整的平台,用于构建、训练和部署下一代 AI 智能体。
强化学习赋能现代智能体系统
强化学习正成为现代智能体模型训练流程中的一项强大能力。随着新的智能体用例不断涌现,模型越来越需要在更长的时间跨度内运行,与动态环境交互,并在多步骤工作流中执行推理和工具调用(Tool Use)等任务。强化学习提供了满足这些需求的机制——最终产出具有更好策略、更强推理能力、且行为更有效对齐目标(Goal Alignment)的模型。
携手解锁高性能强化学习
我们很高兴宣布 Together AI 与 Meta PyTorch 团队之间的合作,双方将整合以下优势:
Together AI Research 作为 AI 原生云(AI Native Cloud)提供商,专注于为现代智能体系统构建、训练和部署大规模 AI 模型。
Meta 的 PyTorch 团队 作为 PyTorch 的创建者和主要维护者,PyTorch 是全球应用最广泛的开源训练框架。
对开源的承诺 赋能 AI 社区构建、实验并推进下一代智能体系统的发展。
通过这次合作,我们将在 PyTorch 技术栈上构建一个强大的开源 RL 框架,将复杂的高性能强化学习集成到 Together AI 平台中。这项 RL 服务将补充 Together 现有的平台服务套件——包括监督微调(Supervised Fine-Tuning)、沙盒环境、评估工具、模型优化和高性能推理——为下一代智能体系统提供高级能力。最终形成一个完整的平台,团队无需拼凑零散的工具,即可构建、训练和部署前沿的智能体系统。
参与进来!
我们正在积极与构建下一代 AI 模型和应用的团队合作。如果你正在探索现代训练技术的可能性——无论是为了下一代 AI 应用、高级智能体系统,还是前沿模型开发——我们很乐意与你联系,探讨这次合作如何加速你的工作。
在这篇博客文章中阅读我们与 TorchForge 在即时集群(Instant Clusters)上的首次合作详情——并立即亲自尝试!

8S
DeepSeek R1

Premium cinematic video generation with native audio and lifelike physics.
DeepSeek R1
8S
## Audio Name
Audio Description
0:00
Premium cinematic video generation with native audio and lifelike physics.

8S
DeepSeek R1

Premium cinematic video generation with native audio and lifelike physics.
Performance & Scale
Body copy goes here lorem ipsum dolor sit amet
* Bullet point goes here lorem ipsum
* Bullet point goes here lorem ipsum
* Bullet point goes here lorem ipsum
Infrastructure
Best for
* Faster processing speed (lower overall query latency) and lower operational costs
* Execution of clearly defined, straightforward tasks
* Function calling, JSON mode or other well structured tasks
List Item #1
* Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
* Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
* Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
List Item #1
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Build
Benefits included:
* ✔ Up to $15K in free platform credits*
* ✔ 3 hours of free forward-deployed engineering time.
Funding: Less than $5M
Build
Benefits included:
* ✔ Up to $15K in free platform credits*
* ✔ 3 hours of free forward-deployed engineering time.
Funding: Less than $5M
Build
Benefits included:
* ✔ Up to $15K in free platform credits*
* ✔ 3 hours of free forward-deployed engineering time.
Funding: Less than $5M
觉得有用?分享给更多人