探索“所有可能材料”的空间:CuspAI 的 Max Welling 谈 AI for Science

Title: 🔬搜索所有可能材料的空间 —— CuspAI 的 Max Welling 教授
Summary: 编者按:CuspAI 在 9 月完成了 1 亿美元 A 轮融资,且据传估值已达到独角兽级别。其顾问阵容堪称豪华,从 Geoff Hinton 到 Yann Lecun,并拥有一支深度领域专家团队。
Content: 编者按: CuspAI 在 9 月完成了 1 亿美元 A 轮融资,并且据传已经达到独角兽估值。他们拥有从 Geoff Hinton 到 Yann Lecun 的全明星顾问阵容,以及一支由资深领域专家组成的团队,正面攻克 AI 应用的下一前沿。
在这一期节目中,Max Welling 串联起量子引力、等变神经网络、扩散模型,以及面向气候问题的材料发现(没错,它们确实是同一条线!!!)。
[

我们从一个颇具冲击力的框架出发:把实验视为计算。Welling 描述了“Physics Processing Unit(物理处理单元)”这一设想——在这个世界里,数字模型与物理实验协同工作,而自然本身就像一种处理器。这是一个立足现实但雄心勃勃的科学 AI 愿景:不是替代化学家,而是让他们更快地推进发现。
在对话中,我们还讨论了:
-
为什么对称性与等变性在深度学习中至关重要
-
规模与归纳偏置之间的权衡
-
扩散模型与随机热力学之间深层的数学联系
-
为什么真正限制 AI 与能源转型的,可能不是软件而是材料
-
构建一个 AI 驱动材料平台到底需要什么
Max 回顾了自己如何从“好奇心驱动”的理论物理(包括与 Gerard ‘t Hooft 的合作)转向“影响力驱动”的气候与能源研究。最终,这场对话聚焦于一种“汇合”:物理与机器学习、数字模型与实验室实验、长期雄心与渐进进展的汇合。
-
00:00:00 – Physics Processing Unit (PPU):把自然当作终极计算机
-
Max 提出 Physics Processing Unit 的概念——将现实世界实验作为计算过程。
-
00:00:44 – 从量子引力到材料 AI
-
Brandon 梳理 Max 的职业路径:VAE 先驱 → 等变 GNN → 材料科技创业者。
-
00:01:34 – 好奇心 vs 影响力:他的动机如何演化
-
Max 解释了自己从纯理论好奇转向气候导向影响的过程。
-
00:02:43 – CaspAI 为何存在:把技术当作气候战略
-
当政治机制推进艰难,技术更容易规模化;这也是他聚焦材料创新的原因。
-
00:03:39 – 主线:物理 → 对称性 → 机器学习
-
规范对称、群论与相对论如何启发等变神经网络。
-
00:06:52 – AI for Science 正在爆发(而非刚刚萌芽)
-
资本快速涌入,以及为何 AI for Science 像是新的工业时代。
-
00:07:53 – 为什么是现在?AI for Science 的两大催化剂
-
蛋白质折叠、ML force fields,以及拐点时刻的到来。
-
00:10:12 – 工程师如何进入 AI for Science
-
实践路径:课程体系、workshop、跨学科训练。
-
00:11:28 – 为什么材料比软件更关键
-
核心观点:包括 LLM 在内的一切,最终都建立在材料创新之上。
-
00:13:02 – 把材料当作搜索引擎
-
愿景:像查询 Google 一样自动探索化学空间。
-
01:14:48 – CuspAI 平台架构内部
-
生成模型 + 多尺度 digital twin + 实验闭环。
-
00:21:17 – 化学自动化:先 Human-in-the-Loop
-
路径是手工起步 → 模块化工具 → agents → 逐步提升自治。
-
00:25:04 – Moonshots 与渐进式成果的平衡
-
在灯塔级材料目标与付费合作之间寻找平衡。
-
00:26:22 – 为什么突破仍然需要人类
-
自动化具有垂直领域属性,且需要迭代推进。
-
00:29:01 – 什么是等变性(通俗解释)?
-
用“瓶子”示例解释神经网络中的对称性。
-
00:30:01 – 为什么不能只靠数据增强?
-
归纳偏置与数据规模之间的优化权衡。
-
00:31:55 – 生成式 AI 遇上随机热力学
-
他即将出版的新书,以及扩散模型与物理的统一视角。
-
00:33:44 – 新书何时发布(ICLR?)
Max:我更愿意把它理解为我所说的 physics processing unit,也就是 PPU。你有 digital processing units,也会有 physics processing units。换句话说,就是让自然为你计算。它可能是已知最快的“计算机”。只是它不太容易编程,因为你必须做大量实验。这些实验很笨重,往往是非常庞大的系统工程。但从本质上说,它是一种计算,这就是我看待它的方式。你可以在数据中心做一部分计算,再让自然去做另一部分计算。你与自然之间的接口会更复杂一些。但为了得到你想要的新材料,这两类计算最终必须无缝协同。
[01:00:44:14 - 01:01:34:08]
Brandon:今天很高兴请到 Max Woehling(注:原文如此)做客。Max 的职业生涯中有太多让我兴奋的工作。若你在深度学习社区,你大概知道他在 variational autocoders 方面的贡献,这些工作经受住了时间检验。若你是科学家,你可能了解他在等变图神经网络方面的开创性工作。若你来自材料科学领域,你可能因为他的新创业公司 CASPAI 而认识他。Max 长期在很多酷问题上持续深耕。你最初做的是量子引力,我认为这和你后来的方向非常不同。给 AI 工程师和科学家的第一个问题是:你思考问题的主线是什么?真正让你兴奋的“问题类型”是什么?你又如何判断下一件值得投入的大事?
[01:01:34:08 - 01:02:41:13]
Max:这条主线其实演化了很多。年轻时,说实话,我只会追随自己觉得“超级有趣”的东西。我有一种“传感器”,我想很多人都有,只是未必会经常使用:当你对某个问题突然极度兴奋时,你能感受到它。比如黑洞内部是什么、宇宙边界之外是什么、量子力学到底在讲什么。我的职业生涯很长时间都在追随这种感觉。但我必须说,随着年龄增长,这件事会有变化,因为会多出一个新维度:影响力。做二维量子引力,基本可以保证你的工作对现实世界几乎没有直接影响,最多是多几篇论文,而不会改变这个世界或这个能量尺度上的现实。随着我逐渐接近退休(幸运的是大约还有 10 年),我确实希望能对世界产生积极影响。我也对气候变化越来越担忧。
[01:02:43:15 - 01:03:19:11]
Max:我认为政治系统在解决这个问题上一直很艰难,尤其是这些年。所以我想,不如从技术侧去推动。这就是我们创立 CaspAI 的原因。同时,材料科学里也有大量非常有意思的科学问题。于是它就把两件事结合起来:一方面是现实影响力,另一方面是科学上的趣味深度。可以说是两个维度:一是做那些你觉得“这里有很深层规律”的问题;二是构建真正能在现实世界产生作用的工具。
[01:03:19:11 - 01:03:39:23]
RJ:我回看你做过的方向,会发现其中一些确实很连贯,比如从物理到等变性,再到(图)网络,可能也与 Casp 有联系。你自己会把它们看成一条线吗?
[01:03:39:23 - 01:06:52:16]
Max:会。主线就是物理。因为我在理论物理上花了很多时间,我认为那里面既有最基础、最令人兴奋的问题——比如量子引力中仍未解决的问题,那确实是前沿;也有大量可迁移的数学工具。比如在粒子物理和广义相对论里,对称性空间都扮演极其重要的角色,一直延伸到规范对称。把这类对称性思想引入机器学习,在我看来是一个非常深刻且有趣的数学问题。我和 Taco Cohen 一起做过这件事,Taco 是主要推动者之一:从简单的旋转对称一路走到球面上的规范对称等更复杂场景。还有 Maurice Weiler(他也在这里),他读博时是我非常优秀的学生,他写了一整本关于对称性在 AI 和机器学习中作用的书,我很推荐。
我最近走的是另一条路径:扩散模型与随机热力学之间的关系。随机热力学本质上是“非平衡系统中的热力学理论”。结果我们发现,扩散模型中使用的数学,甚至包括 reinforcement learning、Schrodinger bridges、MCMC sampling 等方法,和这套非平衡物理理论共享同一套数学结构。这让我非常兴奋。后来我在南非开普敦附近的 Mauschenberg、African Institute for Mathematical Sciences(AIMS)授课,并把课程内容写成了书。两年后书稿完成并已交出版社。它讲的是自由能、扩散模型(也就是 generative AI)与随机热力学之间的深层联系。
所以一直以来都像是某种……我也说不好,我就是觉得物理非常深。我也一直在思考量子力学——它是一个非常“怪”的理论,实际上没人真正理解它。有个很有意思的故事,也许能把我的博士阶段和现在串起来。我博士导师是诺奖得主 Gerard ’t Hooft。他是我见过最聪明的人。就我观察,他几乎从不判断失误。现在他认为量子力学是错的,并提出了新理论。尽管他写下的数学并不复杂,但几乎没人真正理解他在说什么;他是在正面解决“量子力学可理解性”这个问题。我觉得这非常勇敢,也让我着迷。所以我也在想:我们能否用一种更“日常”的方式理解量子力学,而不必依赖多重宇宙、波函数坍缩之类诡异设定?总之,物理一直是这条主线,而我在尝试把物理用于机器学习,以构建更好的算法。
[01:06:52:16 - 01:07:05:15]
Brandon:你现在依然深度参与对物理与世界本质的理解,不只是把形式化工具“应用”到机器学习。这很酷。
[01:07:05:15 - 01:07:18:02]
Max:是的。我会说自己对物理本身贡献不算多,但我在推动物理与科学之间的接口。这就是所谓 AI for Science,或者 Science for AI ——它正在成为一个新的学科。
[01:07:18:02 - 01:07:18:19]
Speaker 5:嗯。
[01:07:18:19 - 01:07:45:14]
Max:而且它不只是“新兴”,我会说它在“爆发”。这个词更准确。你看投资规模,已经从数亿美元走到数十亿美元。现在 Jeff Bezos 支持的一家 startup 融资轮达到 62 亿美元。很疯狂。我猜这可能是史上最大规模的 startup 融资之一,而且就发生在 AI for Science 这个领域。这说明我们正在形成一个新的浪潮,甚至可能是一个新泡沫。
[01:07:46:15 - 01:07:53:28]
Brandon:那你觉得为什么是现在?到底是什么变化推动大家涌向 AI for Science?
[01:07:53:28 - 01:08:49:17]
Max:其实有两个原因。第一,人们开始把新一代 AI 工具自然地应用到科学问题上。这里有两个非常典型的成功案例:蛋白质折叠,以及 machine learning force fields(也叫 machine learning inter-atomic potentials)。这两者都很成功,而且都和对称性有点关系,这也挺有意思。AI 科学圈的人看到了机会:把原本用于广告投放或多媒体应用的工具,迁移到真正能对社会产生积极影响的方向,比如医疗、药物开发、能源转型材料、碳捕集,这些都是很有价值、影响很大的应用。
[01:08:50:19 - 01:09:42:14]
Max:除此之外,科学本身也非常有趣。我会说,正是这两个领域的汇合,加上我们终于到了“能够有效建模并真正推动科学方法前进”的阶段,构成了一个非常独特的历史时点。人们意识到:我们正站在某个新阶段的边缘(cusp)——公司名也是这么来的。站在新边缘,天然会激发巨大能量。就像一片尚未被开垦的绿地,大家都会想冲进去、率先耕耘并收获。我想这也是……
[... content truncated ...]

