OpenAI WebRTC 音频对话工具升级，支持文档上下文

指南Simon Willison2026年6月12日2 分钟阅读

Simon Willison 去年底用 OpenAI WebRTC API 做了个音频对话测试工具，如今升级支持 GPT-Realtime-2 模型，还能粘贴文档上下文，让语音对话围绕你的资料展开。

本文编译自 OpenAI WebRTC Audio Session, now with document context，版权归原作者所有。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

关注 @skillnav_dev →阅读周刊

DiffusionGemma：4倍生成速度的开放实验模型

DiffusionGemma 是 Google 发布的实验性开放模型，使用文本扩散而非逐 token 生成，在 NVIDIA H100 上达到 1000+ tokens/s。模型激活参数仅 3.8B，量化后适配 18GB VRAM 消费级 GPU。输出质量低于 Gemma 4，但适合速度优先的本地工作流。

指南·6月10日·7 分钟

给 Copilot CLI 装上语言服务器，代码理解不再靠猜

LSP Setup 技能通过七步工作流自动安装和配置语言服务器，支持 14 种语言，使 GitHub Copilot CLI 获得真正的代码智能，不再依赖文本搜索猜测。

指南GitHub·6月10日·6 分钟

OpenAI WebRTC 音频对话工具升级，支持文档上下文

相关文章

DiffusionGemma：4倍生成速度的开放实验模型

给 Copilot CLI 装上语言服务器，代码理解不再靠猜

评论