科学人工智能能够识别复杂数据集中的模式 并将其表述为物理理论

摘要:

新理论的发展通常与物理学大师有关。例如,你可能会想到艾萨克-牛顿或阿尔伯特-爱因斯坦。许多诺贝尔奖都是为新理论而颁发的。现在,Forschungszentrum Jülich(尤利希研究中心)的研究人员编写了一个人工智能程序,它也掌握了这一创举。他们的人工智能能够识别复杂数据集中的模式,并将其表述为物理理论。

large.png

从数据中学习行动观察一个由相互作用的自由度组成的物理系统(灰点),其精确的相互作用是未知的(阴影区域)。通过对系统的测量来训练神经网络。该网络以无监督的方式学习对训练数据分布的估计。使用图解语言逐层从网络参数中提取动作。最终的动作系数 A (k)代表学习到的交互作用(粉色节点)。

在下面的访谈中,来自尤利希研究中心高级模拟研究所(IAS-6)的莫里茨-海利亚斯(Moritz Helias)教授解释了"人工智能物理学"的内涵,以及它与传统方法的不同之处。

物理学家如何提出新理论?

通常情况下,首先要对系统进行观察,然后再尝试提出不同系统组件之间如何相互作用,以解释观察到的行为。然后从中得出新的预测,并付诸实践。一个著名的例子是艾萨克-牛顿的万有引力定律。它不仅描述了地球上的引力,还可以用来相当准确地预测行星、卫星和彗星的运动,以及现代卫星的轨道。

然而,得出这些假设的方式总是不同的。我们可以从物理学的一般原理和基本方程入手,从中推导出假设;也可以选择现象学方法,仅限于尽可能准确地描述观察结果,而不解释其原因。困难在于从众多可能的方法中选择一种好的方法,必要时对其进行调整和简化。

研究人员采取了什么方法?

一般来说,这涉及一种被称为"机器学习物理学"的方法。工作小组中使用物理学方法来分析和理解人工智能的复杂功能。

研究小组的克劳迪娅-梅尔格(Claudia Merger)提出的重要新想法是,首先使用一个神经网络,学会将观察到的复杂行为准确映射到一个更简单的系统中。换句话说,人工智能旨在简化我们观察到的系统组件之间的所有复杂互动。然后,使用简化后的系统,用训练有素的人工智能创建反映射。从简化的系统返回到复杂的系统再发展新的理论。在返回的过程中,复杂的交互作用是由简化的交互作用逐一建立起来的。因此,这种方法最终与物理学家的方法并无太大区别,不同之处在于,现在是从人工智能的参数中读取相互作用的组合方式。这种看待世界的视角--从遵循一定规律的各部分之间的相互作用来解释世界--是物理学的基础,因此被称为"人工智能物理学"。

在哪些应用中使用了人工智能?

例如,开发过程中使用了一个黑白手写数字图像数据集,这是研究神经网络时经常使用的数据集。作为博士论文的一部分,克劳迪娅-梅尔格研究了图像中的小型子结构(如数字的边缘)是如何由像素之间的相互作用构成的。研究发现,一组像素往往一起变亮,从而形成了数字边缘的形状。

计算工作量有多大?

人工智能的使用首先是一种使计算成为可能的技巧。很快就可以计算出大量可能的相互作用。如果不使用这个技巧的话,只能研究非常小的系统。尽管如此,所需的计算量仍然很大,这是因为即使在有许多组件的系统中,也存在许多可能的相互作用。不过,我们可以有效地对这些相互作用进行参数化,因此我们现在可以查看大约有 1000 个相互作用成分的系统,即最多有 1000 个像素的图像区域。未来,通过进一步的优化后还可以看到更大的系统。

这种方法与 ChatGPT 等其他人工智能有何不同?

许多人工智能旨在学习用于训练人工智能的数据理论。然而,人工智能学习的理论通常无法解释。相反,它们隐含在训练好的人工智能参数中。与此相反,新的方法提取了所学理论,并用系统组件之间的交互语言将其表述出来,而这正是物理学的基础。因此,它属于可解释的人工智能领域,特别是"人工智能物理学",因为我们使用物理学语言来解释人工智能所学到的知识。我们可以使用交互语言在人工智能复杂的内部运作与人类可以理解的理论之间架起一座桥梁。

参考文献:《从数据中学习相互作用理论》,作者:Claudia Merger、Alexandre René、Kirsten Fischer、Peter Bouss、Sandra Nestler、David Dahmen、Carsten Honerkamp 和 Moritz Helias,2023 年 11 月 20 日,《物理评论 X》。

DOI: 10.1103/PhysRevX.13.041033

编译自:ScitechDaily

查看评论
created by ceallan