OpenAI WebRTC 音频对话工具升级,支持文档上下文
指南Simon Willison2026年6月12日2 分钟阅读

Simon Willison 去年底用 OpenAI WebRTC API 做了个音频对话测试工具,如今升级支持 GPT-Realtime-2 模型,还能粘贴文档上下文,让语音对话围绕你的资料展开。
本文编译自 OpenAI WebRTC Audio Session, now with document context,版权归原作者所有。
觉得有用?分享给更多人

觉得有用?分享给更多人
DiffusionGemma 是 Google 发布的实验性开放模型,使用文本扩散而非逐 token 生成,在 NVIDIA H100 上达到 1000+ tokens/s。模型激活参数仅 3.8B,量化后适配 18GB VRAM 消费级 GPU。输出质量低于 Gemma 4,但适合速度优先的本地工作流。
LSP Setup 技能通过七步工作流自动安装和配置语言服务器,支持 14 种语言,使 GitHub Copilot CLI 获得真正的代码智能,不再依赖文本搜索猜测。