Gemini API 新增 Flex 与 Priority 推理层级
指南2026年4月2日3 分钟阅读

Google 为 Gemini API 引入 Flex 和 Priority 两个新的推理层级,让开发者能在单一接口中精细控制成本与可靠性。Flex 针对延迟容忍型任务,价格比标准 API 便宜 50%;Priority 则为关键应用提供最高级别的保障。
本文编译自 New ways to balance cost and reliability in the Gemini API,版权归原作者所有。
觉得有用?分享给更多人