AI和量子:谁将主宰未来计算?
在物理和化学领域,这种期望尤为强烈,因为量子力学的奇异效应在其中起着关键作用。从理论上讲,这是量子计算机相较传统计算机拥有巨大优势的领域。
然而,当量子硬件面临复杂技术难题而步履维艰时,另一个挑战者正在这些最具潜力的应用领域取得突破。人工智能(AI)如今被应用于基础物理、化学和材料科学,这种趋势表明量子计算被认为的“主场优势”或许并不牢固。
瑞士联邦理工学院(EPFL)计算物理学教授 Giuseppe Carleo 表示,AI 模拟量子系统的规模和复杂性正在迅速提高。上个月,他与人合作在 Science 上发表了一篇论文,指出基于神经网络的方法正迅速成为模拟具有强量子属性材料的领先技术。Meta 公司最近也发布了一个 AI 模型,该模型基于一个大规模材料新数据集进行训练,在材料发现的机器学习排行榜中跃居榜首。
鉴于近年来的快速进展,越来越多的研究人员开始思考:在大规模量子计算机真正问世之前,AI 是否已经能够解决化学和材料科学中大部分最有趣的问题。
“这些机器学习新技术的出现对量子计算机潜在应用构成了严重打击,”Carleo 说,“在我看来,这些公司迟早会发现,他们的投资并不合理。”
量子计算机的潜力在于其能够比传统计算机更快地完成某些计算。然而,要实现这一潜力,需要比现有规模更大的量子处理器。目前最先进的设备刚刚突破 1000 量子比特,但要达到对经典计算机的压倒性优势,可能需要数万甚至数百万量子比特。一旦这种硬件得以实现,一些量子算法,例如破解加密的 Shor 算法,将能够以指数级的速度解决问题,这远非经典算法可以企及。
然而,在许多具有明显商业应用的量子算法中,例如数据库搜索、优化问题求解或驱动人工智能,其速度优势相对较小。去年,微软量子计算负责人 Matthias Troyer 联合发表的一篇论文表明,当考虑到量子硬件运行速度比现代计算机芯片慢几个数量级时,这些理论上的速度优势可能会消失。此外,将大量经典数据输入和输出量子计算机的难度也是一个主要障碍。
因此,Troyer 及其同事得出结论,量子计算机应更多地关注化学和材料科学中的问题,这些问题需要对量子效应占主导地位的系统进行模拟。从理论上讲,基于这些系统的量子原理运行的计算机在这里应该具有天然优势。事实上,自著名物理学家理查德·费曼首次提出这一概念以来,这一直是量子计算的核心推动力之一。
量子力学规则主导着许多具有巨大实际和商业价值的事物,例如蛋白质、药物和材料。它们的性质由其组成粒子之间的相互作用决定,尤其是电子之间的相互作用。在计算机中模拟这些相互作用,应该能够预测分子会表现出何种特性。例如,这对发现新药物或开发更高效的电池化学具有巨大的价值。
然而,量子力学那些令人费解的规则——特别是使遥远粒子的量子态可以本质上相互关联的纠缠现象——会使这些相互作用变得极其复杂。精确追踪这些相互作用需要极其复杂的数学运算,而当粒子数量增加时,运算的难度会呈指数级增长。这使得在经典计算机上模拟大型量子系统几乎变得不可行。
这正是量子计算机大展拳脚的地方。由于量子计算机同样基于量子原理运行,它们能够比经典计算机更高效地表示量子态,同时可以利用量子效应加速计算。
然而,并非所有量子系统都是相同的。其复杂性取决于粒子之间的相互作用或关联程度。在相互作用强的系统中,追踪所有这些关系所需的计算量可能会迅速增加。而对于化学家和材料科学家感兴趣的大多数系统,关联通常较弱。Giuseppe Carleo 指出,这意味着这些系统中的粒子对彼此行为的影响不显著,从而使得这些系统更容易被建模。
Carleo 总结道,对于化学和材料科学中的大多数问题,量子计算机可能不会提供任何优势。经典工具已经能够精确建模弱关联系统,其中最为显著的是密度泛函理论(DFT)。DFT 的核心思想是,只需了解系统的电子密度(即电子在空间中的分布),就可以理解其关键特性。这种方法大大简化了计算,同时仍能为弱关联系统提供准确结果。
使用这些方法模拟大型系统需要相当大的计算能力。然而,近年来,基于 DFT 的研究激增,生成了大量化学、生物分子和材料数据,这些数据可用于训练神经网络。AI 模型通过学习这些数据中的模式,可以预测特定化学结构可能具有的特性,而其运行成本比传统的 DFT 计算低几个数量级。
这种方法大幅扩展了可模拟系统的规模——一次可以模拟多达 10 万个原子——以及模拟运行的时间范围。卢森堡大学物理学教授 Alexandre Tkatchenko 表示:“这简直太棒了。你几乎可以完成大多数化学问题。”
卡内基梅隆大学化学教授 Olexandr Isayev 也表示,这些技术已经被广泛应用于化学和生命科学领域的公司。而对于研究人员而言,此前无法触及的问题,例如优化化学反应、开发新型电池材料和理解蛋白质结合等,如今都变得可行。
“与大多数 AI 应用一样,数据是最大的瓶颈。”Isayev 指出。Meta 最近发布的材料数据集包含对 1.18 亿种分子的 DFT 计算结果。用这些数据训练的模型实现了最先进的性能,但生成这些训练材料耗费了庞大的计算资源,远超大多数研究团队的能力。这意味着要完全实现这一方法的潜力,需要巨额投资。
然而,用 DFT 模拟弱关联系统并不是一个指数级增长的问题。这表明,只要拥有更多数据和计算资源,基于 AI 的经典方法甚至可以模拟这些系统中最大的部分。Tkatchenko 补充道,考虑到能与之竞争的量子计算机可能仍需数十年时间,AI 当前的发展轨迹表明,它或许能更早实现一些重要的里程碑,例如精确模拟药物与蛋白质的结合过程。
在模拟强关联量子系统时(即粒子之间相互作用较强的系统),像 DFT 这样的传统方法很快就会失去效用。这类系统虽然更加复杂,但包括了一些具有潜在变革能力的材料,例如高温超导体或超精密传感器。然而,即便在这一领域,人工智能也正在取得显著进展。
2017 年,瑞士联邦理工学院(EPFL)的 Giuseppe Carleo 与微软的 Matthias Troyer在 Science 上发表了一篇开创性论文,展示了神经网络可以用于模拟强关联量子系统。这种方法并不像传统意义上的机器学习那样从数据中学习。相反,Carleo 解释,这种方法与 DeepMind 的 AlphaZero 模型类似。AlphaZero 通过掌握围棋、国际象棋和将棋的规则并进行自我对弈实现了卓越的表现。
在量子系统的模拟中,“游戏规则”由薛定谔方程提供,它可以精确描述系统的量子态或波函数。模型通过将粒子排列成某种配置,并测量系统的能量水平来进行“对弈”。目标是找到最低能量配置(即基态),这是系统性质的决定因素。模型不断重复这一过程,直到能量水平不再下降,表明已经接近或达到基态。
这些模型的强大之处在于它们能够压缩信息。Carleo 表示:“波函数是一个非常复杂的数学对象。现在,多个研究已经表明,神经网络可以以经典计算机能够处理的方式捕捉这一对象的复杂性。”
自 2017 年那篇论文以来,这种方法已经扩展到更广泛的强关联系统。Carleo 指出,结果令人印象深刻。他与同事上个月在 Science 上发表的论文中,将这一方法应用于多种复杂的量子模拟问题,并对当前领先的经典模拟技术进行了测试,旨在为经典方法和量子方法的进展提供基准。
这些研究表明,神经网络不仅能够有效模拟强关联系统,还在处理这些复杂问题方面树立了新的技术标准。这种能力让 AI 在模拟最棘手的量子系统方面展现出极大的潜力。
Carleo 表示,基于神经网络的技术现已成为模拟他们测试的许多最复杂量子系统的最佳方法。“机器学习在这些问题中确实占据了领先地位,”他说。
这些技术吸引了科技行业一些大玩家的注意。今年 8 月,DeepMind 的研究人员在 Science 上发表论文,展示了他们能够精确模拟量子系统中的激发态,这一能力未来可能用于预测太阳能电池、传感器和激光器的行为。微软研究团队也开发了一套开源软件套件,帮助更多研究人员利用神经网络进行模拟。
法国 École Polytechnique 的人工智能与凝聚态物理学教授 Filippo Vicentini(也是 Science 基准测试论文的合著者)表示,这种方法的一个主要优势在于,它可以利用人工智能软件和硬件领域的巨大投资。“能够利用这些技术进步为我们提供了巨大的优势,”他说。
需要注意的是,由于基态是通过试错而非明确计算获得的,这些方法提供的只是近似解。然而,正因如此,这一方法在看似无法解决的问题上取得了进展。ETH Zurich 研究员 Juan Carrasquilla(也是 Science 基准测试论文的合著者)指出,如果目标是准确追踪强关联系统中的所有相互作用,随着系统规模的扩大,所需的计算量将呈指数级增长。但如果仅需要一个“足够好”的答案,那么利用一些捷径就有很大余地。
“或许要精确模拟它是不可能的,”Carrasquilla 说,“但我们可以捕捉足够多的信息,涵盖物理学家关心的所有方面。如果我们做到了这一点,它实际上与真实解几乎没有区别。”
尽管大多数强关联系统对经典方法来说过于复杂,但某些系统却不在此列。例如,根据 2023 年发表在 Nature Communications 上的一篇论文,有些系统对于高温超导体的建模是相关的,而经典方法可以胜任。
微软研究团队的负责人 Frank Noe 指出,“由于指数复杂性,你总会找到一些问题,无法找到捷径。”但他补充道,“我认为,无法找到良好捷径的系统数量将变得越来越少。”
渥太华大学物理学助理教授 Stefanie Czischek 表示,目前尚难预测神经网络究竟可以解决哪些问题。在某些复杂系统中,神经网络表现出色,但在看似简单的系统中,其计算成本却可能意外飙升。她指出:“我们并不真正了解它们的局限性。没有人确切知道哪些条件会让这些神经网络难以表示系统。”
与此同时,其他经典量子模拟技术也取得了重要进展。纽约 Flatiron Institute 计算量子物理中心主任 Antoine Georges(也是 Science 基准测试论文的合著者)表示:“每种方法都有其成功之处,而且它们相辅相成。因此,我不认为这些机器学习方法会完全取代其他方法。”
IonQ 量子解决方案高级总监 Martin Roetteler 认为,量子计算机也会找到自己的优势领域。他同意经典方法可能足以应对弱关联系统的模拟,但坚信某些大型强关联系统会超出经典方法的能力范围。“指数级复杂性最终会成为障碍,”他说,“对于某些强关联系统,我们无法用经典方法解决。我对此深信不疑。”
相比之下,他认为未来具备容错能力、量子比特数量远超现有设备的量子计算机将能够模拟这些系统。这可能帮助发现新型催化剂,或提高对人体代谢过程的理解——这是制药行业的关键领域。
IBM 量子计算项目负责人 Jay Gambetta 认为,神经网络可能会扩展能够解决的问题范围,但他并不认为它们能解决企业最关心的最难问题。“这就是为什么许多以化学为核心需求的公司仍在研究量子计算,因为它们非常清楚这些近似方法的局限性。”
Gambetta 还否认了这些技术是竞争关系的观点。他认为,未来的计算很可能采用一种混合模式,将量子和经典子程序结合起来解决问题。“我不认为它们在竞争。我认为它们实际上是互补的,”他说。
但德克萨斯大学量子信息中心主任 Scott Aaronson 指出,在量子化学和凝聚态物理等领域,机器学习方法确实直接与量子计算机竞争。他预测,机器学习和量子模拟的结合将在许多情况下优于纯粹的经典方法,但这一点可能需要等到更大规模、更可靠的量子计算机出现后才会明确。
“从一开始,我就将量子计算视为首先是一个科学探索,而任何工业应用只是锦上添花,”Aaronson 说,“因此,如果量子模拟仅偶尔超过经典机器学习,我不会像某些同事那样感到特别失望。”
EPFL 的 Carleo 指出,量子计算机很可能在模拟复杂量子系统如何随时间演化方面具有明显优势。这可能为统计力学和高能物理等领域的科学家提供宝贵的洞察,但在短期内似乎不太可能带来实际应用。他补充道:“这些更多是利基应用,在我看来,并不足以证明巨额投资和巨大的炒作是合理的。”
尽管如此,MIT Technology Review 采访的专家表示,缺乏商业应用并不是停止追求量子计算的理由,它在长期内可能带来基础科学的突破。
“科学就像一组嵌套的盒子——你解决了一个问题,却发现了另外五个问题,”Filippo Vicentini 总结道,“我们研究的事物复杂性会随着时间的推移不断增加,因此我们始终需要更强大的工具。”
原文链接:
https://www.technologyreview.com/2024/11/07/1106730/why-ai-could-eat-quantum-computings-lunch/
更新于:1天前