Gemini 音频模型升级，支持实时语音翻译

指南2025年12月12日3 分钟阅读

Google 升级了 Gemini 2.5 Flash Native Audio 模型，提升了实时语音智能体（Voice Agent）的指令遵循和对话流畅度。同时，Google Translate 应用推出实时语音翻译测试版，支持超过 70 种语言，并能保留说话人的语调。

觉得有用？分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察，每周更新。

GitHub Copilot 应用为开发者提供了项目连接、多 Agent 会话、画布交互和 Agent Merge 等功能，旨在提升从编码到合并的整个工作流效率。

指南GitHub·7月27日·5 分钟

直接调用 API 适合需要自定义提示、检索、路由、日志和安全控制的场景；而 Copilot 提供的是围绕软件开发全流程的集成工具链，包括编辑器、仓库、终端和组织策略。BYOK 功能让你保留现有工作流的同时更换模型提供商。

指南GitHub·7月22日·7 分钟

相关文章