Codex 智能体工作流提速 40%:WebSocket 连接与缓存优化
深度OpenAI2026年4月22日5 分钟阅读

Codex 团队通过 WebSocket 持久连接和连接范围内的缓存,将智能体工作流的端到端延迟降低了 40%。这项优化让 GPT-5.3-Codex-Spark 模型的推理速度从 65 TPS 提升至近 1000 TPS,并已在 Vercel、Cline 等开发工具中落地。
觉得有用?分享给更多人

觉得有用?分享给更多人
Claude Fable 的强大能力与高昂成本,使得模型选择和分类成为区分高效与高成本 AI 用户的关键技能。专家建议仅将 Fable 用于规划、协调和审查,而将常规任务交给更便宜的模型。随着价格战和 token 定价变化,这一技能将变得对所有人都至关重要。
美国政府下令 Anthropic 停用 Claude Fable 5 和 Claude Mythos 5,理由是国家安全。Anthropic 表示不满,称政府依据的是一项“狭窄、非通用的潜在越狱”证据,且相关能力已存在于其他公开模型。