Lyria 3 音乐生成模型开放公测

指南2026年3月25日3 分钟阅读
Lyria 3 音乐生成模型开放公测
Google DeepMind 发布 Lyria 3 和 Lyria 3 Pro 音乐生成模型,现已通过 Gemini API 和 Google AI Studio 向开发者开放公测。新模型支持精准节奏控制、时间对齐歌词和多模态图像输入,可生成带人声的完整歌曲或 30 秒片段。

Google DeepMind 的最新音乐生成模型 Lyria 3 和 Lyria 3 Pro 现已面向开发者开放公测,可通过 Gemini API 和 Google AI Studio 的新音频体验进行测试。

Lyria 3 的设计结合了深度音乐理解与结构连贯性,让开发者能构建出高保真度的音乐应用,生成的曲目包含人声、主歌和副歌,且从第一个音符到最后一个音符都保持音乐一致性。

专业品质与速度选择

开发者现在可以根据生产需求和延迟要求,选择两种不同的模型变体:

  • Lyria 3 Pro(lyria-3-pro-preview):这是生成完整歌曲的旗舰模型,可创作长达约三分钟的曲目。这些曲目具备专业级的结构感知能力,是工作室品质、高端输出的标准选择。
  • Lyria 3 Clip(lyria-3-clip-preview):此变体针对速度和高并发请求进行了优化,可生成高质量的 30 秒片段。它是快速原型设计、背景循环和社交媒体素材的理想选择。

两个模型都支持富有表现力细节的真实人声,并提升了声音清晰度,听起来更自然。开发者还可以探索全球语言和音乐风格,用不同语言生成人声,创作从流行、放克到摩城等多种流派的音乐。

精准控制与多模态输入

Lyria 3 引入了精细的控制功能,让你可以通过自然语言提示词(Prompt)精准引导模型:

  • 节奏控制(Tempo Conditioning):可以高精度设定特定节奏(例如快、慢),确保音乐符合应用的节拍需求。
  • 时间对齐歌词(Time-Aligned Lyrics):你可以在提示词中勾勒歌曲的进展,并控制歌词在曲目中的开始和结束时间。
  • 多模态图像转音乐输入(Multimodal Image-to-Music Input):除了文本,Lyria 3 还支持多模态输入。你可以提供一张图片来影响音频的情绪、风格和氛围。

Lyria 3 实战演示

为了展示如何将此模型集成到应用中,我们在 Google AI Studio 构建了一些示例应用:

  • 视频背景音乐:这个演示应用允许用户上传视频,由 Gemini 3 Flash 分析并生成描述性提示词,用于定制配乐。Lyria 随后使用该提示词创作匹配的器乐,作为视频的同步背景音乐。
  • 闹钟:这个演示应用每天早晨用一首新歌唤醒你,歌曲内容涵盖天气、你的位置、时间日期以及日历事件等相关信息。

在 Google AI Studio 中试用 Lyria 3

为了让你能立即开始实验,我们还在 AI Studio 中推出了新的音乐生成体验。使用付费 API 密钥,这个专用工作区提供了一个一流的环境,让你可以用 Lyria 3 进行创作,并探索其图像转音乐等高级功能。

在 Playground 中,你可以探索两种强大的音乐创作模式:

  1. 文本模式(Text Mode):使用自然语言描述你想听的音乐,包括节奏(Tempo)或调性(Key)等参数。
  2. 作曲模式(Composer Mode):从引子到主歌、再到桥段等,逐段构建你的歌曲。此模式让你能精细控制每个部分的时长、强度和描述。

立即开始创作

Lyria 3 Clip 和 Lyria 3 Pro 现已面向全球开发者开放公测。

我们一直与行业专家密切合作开发音乐生成工具,以确保 AI 成为人类创造力的辅助力量。此外,Lyria 3 生成的每段音频都包含一个 SynthID 数字水印。这项技术通过允许任何人识别和验证由 Google AI 生成的音频(即使在音频被修改后)来保持透明度和信任。

本文编译自 Build with Lyria 3, our newest music generation model,版权归原作者所有。

觉得有用?分享给更多人

获取每周 AI 工具精选

工具推荐、实战教程和生态洞察,每周更新。

相关文章

pgEdge 推出开源 MCP Server for Postgres,支持 AI 智能体通过模型上下文协议(MCP)而非传统 API 方式访问数据库。服务强调数据源无关性、完整模式自省和 token 优化,适用于 Claude Code、Cursor 等主流 AI 开发工具。

指南The New Stack·4月2日·4 分钟

Google 推出 Flex 和 Priority 两个新的推理层级,帮助开发者平衡成本与可靠性。Flex 是成本优化层级,适合后台任务,价格便宜一半;Priority 是最高保障层级,适合用户交互型应用。两者都通过同步接口调用,简化了架构管理。

指南·4月2日·3 分钟

评论