Gemini 上线音乐生成功能:Lyria 3 可用文本和图片创作 30 秒歌曲

您的浏览器不支持 audio 元素。
收听本文
本内容由 Google AI 生成。生成式 AI 仍处于实验阶段
[[duration]] 分钟
自 Gemini 应用上线以来,我们一直在打造工具,鼓励用户通过图像和视频进行创意表达。今天,我们更进一步:推出自定义音乐生成能力。Google DeepMind 最新的生成式音乐模型 Lyria 3 今日开始在 Gemini 应用中以 Beta 版逐步上线。你只需描述一个想法或上传一张照片,例如“来一首搞笑风格的 R&B 慢歌,主题是袜子找到了它的另一半”,几秒钟内,Gemini 就能将其转化为高质量、朗朗上口的音乐。为了进一步拓展创作边界,你甚至可以让 Gemini 基于你上传的内容汲取灵感。
Lyria 3 在音频生成方面相较此前的 Lyria 模型有三项重要提升:
- 无需自己写歌词:系统会根据你的提示词自动生成。
- 你可以对风格、人声、节奏等元素进行更细致的创作控制。
- 可以生成更真实、音乐结构更复杂的作品。
以下是它的使用方式:
- Text to track: 描述一个具体流派、情绪、内部梗或回忆,即可生成符合你氛围的独特歌曲(可带歌词或纯音乐)。“我现在很怀旧。请为我妈妈创作一首歌,讲讲我们小时候的美好时光,以及她做的炸大蕉带来的回忆。做成一首轻松有趣、充满非洲气息的 afrobeat。”
- From photos and videos to track: 上传照片或视频,Gemini 会根据内容创作一首与画面情绪高度契合、并带有歌词的歌曲。“用这些照片创作一首歌,主题是我的狗 Duncan 在森林徒步。”
Gemini 应用会生成 30 秒曲目,并配有由 Nano Banana 生成的自定义封面图。你可以下载或直接点击分享链接,快速发给朋友。这些曲目的目标并不是打造音乐“神作”,而是为你提供一种有趣、独特的自我表达方式。
您的浏览器不支持 audio 元素。
Sweet Like Plantain
创作者也可以在 YouTube 的 Dream Track 中体验 Lyria 3。该功能目前已在美国可用,并正向其他国家的 YouTube 创作者逐步开放。Lyria 3 将提升每一条 Shorts 专属配乐的质量。无论是生成一段歌词,还是制作有氛围感的伴奏,更高的配乐定制能力都将把创作者的 Shorts 带到新层次。
全新的音频验证能力
在 Gemini 应用中生成的所有曲目都嵌入了 SynthID——这是我们用于识别 Google AI 生成内容的不可感知水印。我们也在提供更多识别 AI 内容的工具:Gemini 应用中的验证能力现已从图像和视频扩展到音频。你只需上传文件并询问其是否由 Google AI 生成,Gemini 就会检测 SynthID,并结合自身推理给出回答。
我们对负责任发展生成式 AI 的承诺
自 2023 年首次推出 Lyria 以来,我们一直与音乐社区协作,推动这项技术的负责任发展。通过这些合作以及 Music AI Sandbox 等实验,我们积累了大量经验;在训练 Lyria 3 的过程中,也始终高度重视版权与合作伙伴协议。
基于 Lyria 3 的音乐生成功能旨在支持原创表达,而非模仿现有艺术家。如果你的提示词中包含某位具体艺术家,Gemini 会将其视为宽泛的创作灵感,并生成风格或情绪相近的曲目。我们还部署了过滤机制,用于将输出内容与现有作品进行比对。我们也认识到这套方案并非万无一失,因此你可以举报可能侵犯你或他人权利的内容。此外,用户在使用产品时必须遵守我们的服务条款和生成式 AI 禁止使用政策,其中明确禁止侵犯他人知识产权与隐私权的行为。
Lyria 3 已在 Gemini 应用中向所有 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语。Google 计划继续扩展更多语言的质量与覆盖范围。桌面端今日开始上线,移动端将在未来几天内陆续推出。Google AI Plus、Pro 和 Ultra 订阅用户还将享有更高使用上限。
我们在 Gemini 应用中推出音乐生成功能的目标,是为你的日常生活加入一条有趣、专属的配乐。现在就前往 gemini.google.com 体验。
