Together AI 批量 API 发布:成本减半,处理万级请求
指南2025年6月11日3 分钟阅读
Together AI 推出批量 API,专门处理非实时大语言模型请求,成本比实时推理低 50%。单批次最多支持 5 万条请求,适合数据清洗、内容生成等离线任务。
本文编译自 Introducing the Together AI Batch API: Process Thousands of LLM Requests at 50% Lower Cost,版权归原作者所有。
觉得有用?分享给更多人