S
SkillNav

Gemini 上线音乐生成功能:Lyria 3 可用文本和图片创作 30 秒歌曲

资讯Google2026-02-18T16:00:00+00:006 分钟阅读
Gemini 上线音乐生成功能:Lyria 3 可用文本和图片创作 30 秒歌曲

您的浏览器不支持 audio 元素。

收听本文

本内容由 Google AI 生成。生成式 AI 仍处于实验阶段

[[duration]] 分钟

自 Gemini 应用上线以来,我们一直在打造工具,鼓励用户通过图像和视频进行创意表达。今天,我们更进一步:推出自定义音乐生成能力。Google DeepMind 最新的生成式音乐模型 Lyria 3 今日开始在 Gemini 应用中以 Beta 版逐步上线。你只需描述一个想法或上传一张照片,例如“来一首搞笑风格的 R&B 慢歌,主题是袜子找到了它的另一半”,几秒钟内,Gemini 就能将其转化为高质量、朗朗上口的音乐。为了进一步拓展创作边界,你甚至可以让 Gemini 基于你上传的内容汲取灵感。

Lyria 3 在音频生成方面相较此前的 Lyria 模型有三项重要提升:

  1. 无需自己写歌词:系统会根据你的提示词自动生成。
  2. 你可以对风格、人声、节奏等元素进行更细致的创作控制。
  3. 可以生成更真实、音乐结构更复杂的作品。

以下是它的使用方式:

  • Text to track: 描述一个具体流派、情绪、内部梗或回忆,即可生成符合你氛围的独特歌曲(可带歌词或纯音乐)。“我现在很怀旧。请为我妈妈创作一首歌,讲讲我们小时候的美好时光,以及她做的炸大蕉带来的回忆。做成一首轻松有趣、充满非洲气息的 afrobeat。”
  • From photos and videos to track: 上传照片或视频,Gemini 会根据内容创作一首与画面情绪高度契合、并带有歌词的歌曲。“用这些照片创作一首歌,主题是我的狗 Duncan 在森林徒步。”

Gemini 应用会生成 30 秒曲目,并配有由 Nano Banana 生成的自定义封面图。你可以下载或直接点击分享链接,快速发给朋友。这些曲目的目标并不是打造音乐“神作”,而是为你提供一种有趣、独特的自我表达方式。

您的浏览器不支持 audio 元素。

Sweet Like Plantain

创作者也可以在 YouTube 的 Dream Track 中体验 Lyria 3。该功能目前已在美国可用,并正向其他国家的 YouTube 创作者逐步开放。Lyria 3 将提升每一条 Shorts 专属配乐的质量。无论是生成一段歌词,还是制作有氛围感的伴奏,更高的配乐定制能力都将把创作者的 Shorts 带到新层次。

全新的音频验证能力

在 Gemini 应用中生成的所有曲目都嵌入了 SynthID——这是我们用于识别 Google AI 生成内容的不可感知水印。我们也在提供更多识别 AI 内容的工具:Gemini 应用中的验证能力现已从图像和视频扩展到音频。你只需上传文件并询问其是否由 Google AI 生成,Gemini 就会检测 SynthID,并结合自身推理给出回答。

我们对负责任发展生成式 AI 的承诺

自 2023 年首次推出 Lyria 以来,我们一直与音乐社区协作,推动这项技术的负责任发展。通过这些合作以及 Music AI Sandbox 等实验,我们积累了大量经验;在训练 Lyria 3 的过程中,也始终高度重视版权与合作伙伴协议。

基于 Lyria 3 的音乐生成功能旨在支持原创表达,而非模仿现有艺术家。如果你的提示词中包含某位具体艺术家,Gemini 会将其视为宽泛的创作灵感,并生成风格或情绪相近的曲目。我们还部署了过滤机制,用于将输出内容与现有作品进行比对。我们也认识到这套方案并非万无一失,因此你可以举报可能侵犯你或他人权利的内容。此外,用户在使用产品时必须遵守我们的服务条款生成式 AI 禁止使用政策,其中明确禁止侵犯他人知识产权与隐私权的行为。

Lyria 3 已在 Gemini 应用中向所有 18 岁以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语。Google 计划继续扩展更多语言的质量与覆盖范围。桌面端今日开始上线,移动端将在未来几天内陆续推出。Google AI Plus、Pro 和 Ultra 订阅用户还将享有更高使用上限。

我们在 Gemini 应用中推出音乐生成功能的目标,是为你的日常生活加入一条有趣、专属的配乐。现在就前往 gemini.google.com 体验。

查看原文 ↗

相关文章

资讯Simon Willison·3月6日
Clinejection 攻击披露:仅靠 Issue 分诊提示词即可攻陷 Cline 生产发布流程

研究者 Adnan Khan 披露了一条针对 Cline GitHub 仓库的完整攻击链:攻击者先通过 Issue 标题中的 prompt injection 控制 AI 分诊流程,再借助 GitHub Actions 缓存投毒影响夜间发布任务。尽管分诊工作流本身不含高价值密钥,但因与发布工作流共享缓存键,最终仍导致 NPM 发布凭据可被窃取。事件后 `cline@2.3.0` 曾被匿名攻击者发布(现已撤回),所幸未造成更严重后果。

3 分钟
Copilot 代码审查突破 6000 万次,GitHub 详解 Agent 架构演进
资讯GitHub·3月5日
Copilot 代码审查突破 6000 万次,GitHub 详解 Agent 架构演进

GitHub 表示,自 2025 年 4 月推出 Copilot code review 以来,使用量已增长 10 倍,如今占 GitHub 全站代码审查的五分之一以上。团队通过持续评估闭环与 Agent 化架构优化,将“好审查”聚焦在准确性、信号强度与速度三项核心指标,并在真实生产环境中用开发者反馈和问题修复率衡量效果。当前已有超过 1.2 万家组织在每个 pull request 上自动运行该能力,GitHub 下一步将推进更深度个性化与双向交互审查体验。

8 分钟