llm-openrouter 0.6 新增模型刷新命令
指南Simon Willison2026年4月20日2 分钟阅读

Simon Willison 为 llm-openrouter 插件添加了 `llm openrouter refresh` 命令,能立即刷新可用模型列表,无需等待缓存过期。他用这个功能第一时间在 OpenRouter 上试用了刚上线的 Kimi 2.6 模型。
本文编译自 llm-openrouter 0.6,版权归原作者所有。
觉得有用?分享给更多人

觉得有用?分享给更多人
Simon Willison 升级了他的 OpenAI WebRTC 音频会话工具,支持最新的 GPT-Realtime-2 模型和文档上下文功能。用户可以在浏览器中粘贴文本,让语音对话围绕指定内容进行。
DiffusionGemma 是 Google 发布的实验性开放模型,使用文本扩散而非逐 token 生成,在 NVIDIA H100 上达到 1000+ tokens/s。模型激活参数仅 3.8B,量化后适配 18GB VRAM 消费级 GPU。输出质量低于 Gemma 4,但适合速度优先的本地工作流。