Together AI 新增 40+ 图像视频模型

指南2025年10月21日4 分钟阅读
Together AI 新增 40+ 图像视频模型
Together AI 模型库新增 40 余款图像与视频生成模型,包括 OpenAI Sora 2、Google Veo 3.0 等。开发者现在可以通过统一的 OpenAI 兼容 API,在一个平台上构建端到端的多模态应用。

现在,你可以通过统一的 API 构建完整的多模态应用,实现视频、图像和文本生成。

新增内容

  • 新的视频生成 API:提供 OpenAI Sora 2Google Veo 3.0Minimax Hailuo 等模型,用于高质量视频创作。
  • 40 多款新的图像和视频模型:包括 Google 的 Imagen、Nano BananaByteDance SeeDream 以及专门的编辑工具。
  • 完整的工作流:在单一应用中组合文本、图像和视频生成,无需切换供应商。
  • 你熟悉的相同 API:OpenAI 兼容的端点、统一的认证、透明的按模型定价。
  • 现已可用:提供无服务器端点,并为企业级规模提供选项。

生成式媒体正成为一系列 AI 原生应用的核心,从 AI 驱动的视频编辑器、个性化游戏体验到自动化营销内容。但构建这些应用一直很复杂,开发者不得不为文本、图像和视频分别对接不同的供应商——每个都有新的 SDK、认证、速率限制和计费方式。这种碎片化拖慢了团队进度,使 SLA 复杂化,也让扩展变得头疼。

今天,AI 原生云服务商 Together AI 正在扩展其模型库,使其成为你的完整生成式媒体基础设施。通过与 Runware 的战略合作,我们整合了来自六个供应商的 20 多款视频模型(包括 Google Veo 3.0、OpenAI Sora 2 和 ByteDance Seedream),以及 15 款以上的图像模型,同时还包括领先的大语言模型和语音模型——覆盖了实际应用所需的质量-速度-成本全谱系,所有这些都可通过你用于文本生成的相同快速、可靠的 API 访问。

为生产工作流精选的 40+ 模型

新的视频生成模型

视频生成是 Together AI 的新功能。我们从能创建 4-30 秒、不同分辨率和风格视频的模型开始。每个模型针对不同需求进行了优化——真实性、运动一致性或更长的时长。从使用 Minimax Hailuo 快速生成 10 秒片段,到使用 Kling v2.1 生成长达 30 秒的序列,再到使用 SeeDance 进行专门的运动生成。这种多样性确保了开发者可以根据其特定的视频生成需求选择正确的工具,从快速原型设计到生产质量的内容创作。

Sora 2 Pro

8s

您的浏览器不支持视频标签。

具有原生音频和逼真物理效果的高级电影级视频生成。

Google Veo 3

8s

您的浏览器不支持视频标签。

具有高级摄像机运动和场景控制的高质量视频创作。

PixVerse V5

5s

您的浏览器不支持视频标签。

快速、经济的视频生成,具有流畅的运动和多种艺术风格。

ByteDance Seedance 1.0 Pro

5s

您的浏览器不支持视频标签。

具有多镜头叙事和电影级质量的顶级视频生成模型。

新的图像生成与编辑模型

Together AI 的图像生成能力涵盖了从创意到生产的全谱系需求。从使用 Google 的 Imagen 进行照片级真实感生成,到使用 Nano Banana 等模型进行艺术控制,开发者无需研究单个供应商或管理单独的集成,即可获得针对不同用例优化的专业工具。

Gemini Flash Image 2.5 (Nano Banana)

具有自然语言控制功能的通用图像创建和编辑。

Google Imagen 4.0 Ultra

具有卓越细节和文本渲染能力的高级图像生成。

Qwen Image

具有完美文本集成和海报设计功能的高质量图像生成。

34+ 更多模型

涵盖每个创意和生产用例的完整专业模型系列。

在一个平台构建完整工作流

在单一代码库中组合文本、图像和视频生成,无需管理多个供应商。你现有的 Together 集成将获得图像编辑、创意生成和视频制作能力。

这使得构建以下三类应用变得切实可行:

🎮 游戏中的媒体生成

技术能力:游戏工作室根据游戏数据,以编程方式生成环境资产、角色变体和过场动画。

平台优势:从游戏状态到视觉资产的单一 API 调用链,无需管理多个推理供应商即可实现实时内容生成。

🛍️ 动态广告创意

技术能力:电子商务平台根据用户偏好、季节趋势和库存数据生成个性化产品图片、生活场景照片和视频广告。

平台优势:从用户数据到个性化视觉效果的实时创意生成,无需协调独立的图像和视频供应商即可实现动态广告优化。

🧠 交互式学习平台

技术能力:教育应用根据学生问题和进度创建自定义视觉解释、交互式图表和个性化视频内容。

平台优势:使用相同的推理基础设施进行实时多模态响应,无需因供应商切换而产生延迟损失即可实现复杂的个性化。

生产部署选项

Together AI 的生成式媒体功能已具备生产就绪性,提供企业级基础设施和面向开发者的工具。

性能与规模

  • ✔ 40+ 图像和视频模型
  • ✔ 最长 30 秒视频生成
  • ✔ 多种分辨率选项
  • ✔ 透明的按模型定价

基础设施

  • ✔ 生产级速率限制
  • ✔ 无服务器自动扩展
  • ✔ 全球基础设施
  • ✔ 企业级可靠性

开发者体验

  • ✔ OpenAI 兼容 API
  • ✔ 与文本模型相同的 SDK
  • ✔ 统一认证
  • ✔ 单一计费平台

立即试用

如果你已经在使用 Together AI 进行文本推理,添加图像和视频生成的方式完全相同。相同的认证、相同的 SDK、相同的计费仪表板。所有使用情况都显示在一个地方,并具有透明的按模型定价。

python
import time
from together import Together

client = Together()

# 创建视频生成任务
job = client.videos.create(
    prompt="A serene sunset over the ocean with gentle waves",
    model="minimax/video-01-director",
    width=1366,
    height=768,
)

print(f"Job ID: {job.id}")

# 轮询直到完成
while True:
    status = client.videos.retrieve(job.id)
    print(f"Status: {status.status}")

    if status.status == "completed":
        print(f"Video URL: {status.outputs.video_url}")
        break
    elif status.status == "failed":
        print("Video generation failed")
        break

    # 再次检查前等待
    time.sleep(5)

试用平台:

部署到生产环境:

  • 从用于开发和测试的无服务器端点开始
  • 对于企业部署和最大控制权,请联系我们的销售团队

你用于文本推理的同一个 Together AI 平台,现在可以处理你完整的生成式 AI 技术栈。无需额外集成,无需供应商管理开销,无需学习新 API——只是在你已经熟悉的相同开发者体验中扩展了能力。

准备好开始了吗?

按照我们的分步快速入门指南,在几分钟内完成安装、认证并运行你的第一个视频推理。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论