OpenAI API 新增语音智能功能

深度2026年5月7日3 分钟阅读

OpenAI API 新增语音智能功能

OpenAI 周四宣布，其 API 将新增多项语音智能功能，包括基于 GPT-5 推理能力的 GPT-Realtime-2 模型、实时翻译模型 GPT-Realtime-Translate（支持 70+ 输入语言和 13 输出语言），以及实时转录模型 GPT-Realtime-Whisper。这些功能旨在帮助开发者构建能对话、转写和翻译的语音应用。

本文编译自 OpenAI launches new voice intelligence features in its API，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

关注 @skillnav_dev →阅读周刊

相关文章

别再改AI代码了，改系统

软件工程师的核心工作正从编写代码转向构建和管理上下文（Context）。Patrick Debois认为，开发者应停止修正AI生成的代码，转而改进支撑智能体的系统。上下文开发生命周期正在取代传统软件开发生命周期，而执行框架（Harness）工程将成为下一阶段的关键。

深度The New Stack·7月25日·5 分钟

Claude Opus 5：Fable级性能，Opus价格

Claude Opus 5 在官方基准上接近但略低于 Fable，但独立评测显示其性能更强、成本更低。用户反馈称赞其编码和浏览器控制能力，但基准测试的不一致性引发了对评估方法的讨论。

深度Latent Space·7月25日·6 分钟

评论