Lyria 3 音乐生成模型开放公测

Google DeepMind 的最新音乐生成模型 Lyria 3 和 Lyria 3 Pro 现已面向开发者开放公测,可通过 Gemini API 和 Google AI Studio 的新音频体验进行测试。
Lyria 3 的设计结合了深度音乐理解与结构连贯性,让开发者能构建出高保真度的音乐应用,生成的曲目包含人声、主歌和副歌,且从第一个音符到最后一个音符都保持音乐一致性。
专业品质与速度选择
开发者现在可以根据生产需求和延迟要求,选择两种不同的模型变体:
- Lyria 3 Pro(lyria-3-pro-preview):这是生成完整歌曲的旗舰模型,可创作长达约三分钟的曲目。这些曲目具备专业级的结构感知能力,是工作室品质、高端输出的标准选择。
- Lyria 3 Clip(lyria-3-clip-preview):此变体针对速度和高并发请求进行了优化,可生成高质量的 30 秒片段。它是快速原型设计、背景循环和社交媒体素材的理想选择。
两个模型都支持富有表现力细节的真实人声,并提升了声音清晰度,听起来更自然。开发者还可以探索全球语言和音乐风格,用不同语言生成人声,创作从流行、放克到摩城等多种流派的音乐。
精准控制与多模态输入
Lyria 3 引入了精细的控制功能,让你可以通过自然语言提示词(Prompt)精准引导模型:
- 节奏控制(Tempo Conditioning):可以高精度设定特定节奏(例如快、慢),确保音乐符合应用的节拍需求。
- 时间对齐歌词(Time-Aligned Lyrics):你可以在提示词中勾勒歌曲的进展,并控制歌词在曲目中的开始和结束时间。
- 多模态图像转音乐输入(Multimodal Image-to-Music Input):除了文本,Lyria 3 还支持多模态输入。你可以提供一张图片来影响音频的情绪、风格和氛围。
Lyria 3 实战演示
为了展示如何将此模型集成到应用中,我们在 Google AI Studio 构建了一些示例应用:
- 视频背景音乐:这个演示应用允许用户上传视频,由 Gemini 3 Flash 分析并生成描述性提示词,用于定制配乐。Lyria 随后使用该提示词创作匹配的器乐,作为视频的同步背景音乐。
- 闹钟:这个演示应用每天早晨用一首新歌唤醒你,歌曲内容涵盖天气、你的位置、时间日期以及日历事件等相关信息。
在 Google AI Studio 中试用 Lyria 3
为了让你能立即开始实验,我们还在 AI Studio 中推出了新的音乐生成体验。使用付费 API 密钥,这个专用工作区提供了一个一流的环境,让你可以用 Lyria 3 进行创作,并探索其图像转音乐等高级功能。
在 Playground 中,你可以探索两种强大的音乐创作模式:
- 文本模式(Text Mode):使用自然语言描述你想听的音乐,包括节奏(Tempo)或调性(Key)等参数。
- 作曲模式(Composer Mode):从引子到主歌、再到桥段等,逐段构建你的歌曲。此模式让你能精细控制每个部分的时长、强度和描述。
立即开始创作
Lyria 3 Clip 和 Lyria 3 Pro 现已面向全球开发者开放公测。
我们一直与行业专家密切合作开发音乐生成工具,以确保 AI 成为人类创造力的辅助力量。此外,Lyria 3 生成的每段音频都包含一个 SynthID 数字水印。这项技术通过允许任何人识别和验证由 Google AI 生成的音频(即使在音频被修改后)来保持透明度和信任。
- 在 Google AI Studio 中试用:使用模型选择下拉菜单选择 Lyria 3(30秒)或 Lyria 3 Pro(完整歌曲),开始在 Playground 中实验。
- 查阅文档:访问音乐生成指南获取提示词指南、API 参考和代码片段,快速启动集成。
- 通过 Cookbook 开始编码:查看 Cookbook 指南开始使用 API。
- 试用演示应用:Lyria Studio, Lyria Rhythm, Alarm Clock, Background music for Videos
觉得有用?分享给更多人