Gemini 2.5 Flash-Lite 正式版发布
指南2025年10月25日3 分钟阅读

谷歌宣布 Gemini 2.5 Flash-Lite 结束预览,进入稳定可用阶段。这款模型在成本、速度和功能上均有提升,输入 token 每百万 0.1 美元,输出每百万 0.4 美元,比 2.0 系列快约 1.5 倍。
本文编译自 Gemini 2.5 Flash-Lite is now ready for scaled production use,版权归原作者所有。
觉得有用?分享给更多人

觉得有用?分享给更多人
DiffusionGemma 是 Google 发布的实验性开放模型,使用文本扩散而非逐 token 生成,在 NVIDIA H100 上达到 1000+ tokens/s。模型激活参数仅 3.8B,量化后适配 18GB VRAM 消费级 GPU。输出质量低于 Gemma 4,但适合速度优先的本地工作流。
LSP Setup 技能通过七步工作流自动安装和配置语言服务器,支持 14 种语言,使 GitHub Copilot CLI 获得真正的代码智能,不再依赖文本搜索猜测。