S
SkillNav

Gemini 3 Deep Think 重大升级:面向科研与工程难题开放

资讯Google2026-02-12T16:13:00+00:006 分钟阅读
Gemini 3 Deep Think 重大升级:面向科研与工程难题开放

2026 年 2 月 12 日

我们最专业的推理模式现已更新,以应对现代科学、研究与工程挑战。

Deep Think 团队

概要

Gemini 3 Deep Think 迎来重大升级,旨在帮助解决科学、研究与工程难题。Google AI Ultra 订阅用户现可在 Gemini 应用中使用更新后的 Deep Think。研究人员、工程师和企业也可通过 Gemini API 申请早期访问,测试 Deep Think。

摘要由 Google AI 生成。生成式 AI 仍处于实验阶段。

Gemini 3 Deep Think logo

您的浏览器不支持 audio 元素。

收听文章

该内容由 Google AI 生成。生成式 AI 仍处于实验阶段

[[duration]] 分钟

今天,我们发布 Gemini 3 Deep Think 的一次重大升级。这一专业推理模式旨在推动智能前沿,并解决科学、研究和工程领域的现代挑战。

我们与科学家和研究人员紧密合作,更新了 Gemini 3 Deep Think,以应对高难度研究问题——这类问题通常缺乏清晰边界或唯一正确答案,且数据往往杂乱或不完整。通过融合深层科学知识与日常工程实用性,Deep Think 不再停留于抽象理论,而是推动实际应用落地。

新版 Deep Think 现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放;同时,我们也首次通过 Gemini API 向部分研究人员、工程师和企业开放 Deep Think。可在此处申请早期访问

以下是早期测试者已在使用新版 Deep Think 的方式:

罗格斯大学数学家 Lisa Carbone 研究高能物理领域所需的数学结构,目标是弥合爱因斯坦引力理论与量子力学之间的鸿沟。在训练数据极其有限的领域中,她使用 Deep Think 审阅一篇高度技术化的数学论文。Deep Think 成功识别出一个此前经过人工同行评审却未被发现的细微逻辑缺陷。

在杜克大学,Wang Lab 使用 Deep Think 优化复杂晶体生长的制备方法,以探索潜在的半导体材料。Deep Think 成功设计出可生长超过 100 μm 薄膜的工艺配方,达到此前方法难以稳定命中的精确目标。

Google Platforms and Devices 部门研发负责人、Liftware 前 CEO Anupam Pathak 也测试了新版 Deep Think,以加速物理组件设计。

以数学与算法严谨性提升推理能力

去年,我们展示了 Deep Think 的专项版本如何应对最具挑战性的推理任务,并在数学编程世界级赛事中达到金牌标准。最近,Deep Think 还使专项 agents 能开展研究级数学探索。

更新后的 Deep Think 模式继续推动智能前沿,在最严苛的学术基准上达到新高度,包括:

  • 在 Humanity’s Last Exam(用于测试现代前沿模型能力极限的基准)上创下新标准:48.4%(不使用工具)
  • 在 ARC-AGI-2 上取得前所未有的 84.6%,并由 ARC Prize Foundation 验证
  • 在由竞赛编程挑战构成的基准 Codeforces 上达到 3455 Elo 的惊人成绩
  • 在 2025 年国际数学奥林匹克达到金牌级表现

Gemini 3 Deep Think evaluations charts

应对复杂科学领域

除数学和竞赛编程外,Gemini 3 Deep Think 现也在化学、物理等广泛科学领域表现突出。更新后的 Deep Think 模式在 2025 年国际物理奥林匹克与国际化学奥林匹克笔试部分展现金牌级结果。同时,它在高阶理论物理方面也表现出熟练能力,在 CMT-Benchmark 上取得 50.5% 的分数。

Gemini 3 Deep Think evaluation table

加速真实世界工程应用

除最先进性能外,Deep Think 的设计目标还包括驱动实际应用,帮助研究人员解读复杂数据,并帮助工程师通过代码对物理系统建模。更重要的是,我们正努力将 Deep Think 带到研究者与实践者最需要的地方——首先从 Gemini API 等入口开始。

借助更新后的 Deep Think,你可以把草图转化为可 3D 打印的现实物体。Deep Think 会分析图纸、建模复杂形状,并生成用于 3D 打印创建实体对象的文件。

面向 Google AI Ultra 订阅用户开放,并通过早期访问计划接入 Gemini API

从今天起,Google AI Ultra 订阅用户即可在 Gemini 应用中使用更新后的 Deep Think 模式。科学家、工程师和企业现在也可提交意向,加入早期访问计划,通过 Gemini API 测试 Deep Think。

我们迫不及待想看到你的新发现。

相关新闻

.

查看原文 ↗

相关文章

资讯Simon Willison·3月6日
Clinejection 攻击披露:仅靠 Issue 分诊提示词即可攻陷 Cline 生产发布流程

研究者 Adnan Khan 披露了一条针对 Cline GitHub 仓库的完整攻击链:攻击者先通过 Issue 标题中的 prompt injection 控制 AI 分诊流程,再借助 GitHub Actions 缓存投毒影响夜间发布任务。尽管分诊工作流本身不含高价值密钥,但因与发布工作流共享缓存键,最终仍导致 NPM 发布凭据可被窃取。事件后 `cline@2.3.0` 曾被匿名攻击者发布(现已撤回),所幸未造成更严重后果。

3 分钟
Copilot 代码审查突破 6000 万次,GitHub 详解 Agent 架构演进
资讯GitHub·3月5日
Copilot 代码审查突破 6000 万次,GitHub 详解 Agent 架构演进

GitHub 表示,自 2025 年 4 月推出 Copilot code review 以来,使用量已增长 10 倍,如今占 GitHub 全站代码审查的五分之一以上。团队通过持续评估闭环与 Agent 化架构优化,将“好审查”聚焦在准确性、信号强度与速度三项核心指标,并在真实生产环境中用开发者反馈和问题修复率衡量效果。当前已有超过 1.2 万家组织在每个 pull request 上自动运行该能力,GitHub 下一步将推进更深度个性化与双向交互审查体验。

8 分钟