Gemini 音频模型升级,支持实时语音翻译
指南2025年12月12日3 分钟阅读

Google 升级了 Gemini 2.5 Flash Native Audio 模型,提升了实时语音智能体(Voice Agent)的指令遵循和对话流畅度。同时,Google Translate 应用推出实时语音翻译测试版,支持超过 70 种语言,并能保留说话人的语调。
本文编译自 Improved Gemini audio models for powerful voice experiences,版权归原作者所有。
觉得有用?分享给更多人