Codex 智能体工作流提速 40%:WebSocket 连接与缓存优化

深度OpenAI2026年4月22日5 分钟阅读
Codex 智能体工作流提速 40%:WebSocket 连接与缓存优化
Codex 团队通过 WebSocket 持久连接和连接范围内的缓存,将智能体工作流的端到端延迟降低了 40%。这项优化让 GPT-5.3-Codex-Spark 模型的推理速度从 65 TPS 提升至近 1000 TPS,并已在 Vercel、Cline 等开发工具中落地。
本文编译自 Speeding up agentic workflows with WebSockets in the Responses API,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

Claude Fable 的强大能力与高昂成本,使得模型选择和分类成为区分高效与高成本 AI 用户的关键技能。专家建议仅将 Fable 用于规划、协调和审查,而将常规任务交给更便宜的模型。随着价格战和 token 定价变化,这一技能将变得对所有人都至关重要。

深度The New Stack·6月13日·4 分钟

美国政府下令 Anthropic 停用 Claude Fable 5 和 Claude Mythos 5,理由是国家安全。Anthropic 表示不满,称政府依据的是一项“狭窄、非通用的潜在越狱”证据,且相关能力已存在于其他公开模型。

深度·6月13日·4 分钟

评论