DeepMind 的最新人工智能可以解决几何问题
Google人工智能研发实验室DeepMind认为,提高人工智能系统能力的关键可能在于发现解决具有挑战性的几何问题的新方法。为此,DeepMind 今天发布了 AlphaGeometry--该实验室声称该系统能够解决的几何问题与国际数学奥林匹克金牌得主的平均水平相当。
AlphaGeometry 的代码已于今天上午开源,它能在标准时限内解决 25 个奥数几何问题,超过了之前最先进系统的 10 个。
Google人工智能研究科学家Trieu Trinh和Thang Luong在今天上午发表的一篇博文中写道:"解决奥林匹克级的几何问题是开发深度数学推理的一个重要里程碑,是迈向更先进、更通用的人工智能系统的必经之路。[我们]希望......AlphaGeometry 能够帮助我们在数学、科学和人工智能领域开辟新的可能性"。
为什么关注几何?DeepMind 断言,证明数学定理,或从逻辑上解释为什么一个定理(如勾股定理)是真的,既需要推理,也需要从一系列可能的步骤中选择解决方案的能力。如果 DeepMind 的想法是正确的,那么这种解决问题的方法有朝一日会在通用人工智能系统中大显身手。
DeepMind在新闻稿资料中写道:"证明某个猜想的真假,即使是当今最先进的人工智能系统也力不从心。朝着这个目标,能够证明数学定理......是一个重要的里程碑,因为它展示了对逻辑推理的掌握和发现新知识的能力。"
但是,训练人工智能系统解决几何问题带来了独特的挑战。
由于将证明转化为机器能够理解的格式非常复杂,因此可用的几何训练数据非常匮乏。而当今许多尖端的生成式人工智能模型虽然在识别数据中的模式和关系方面表现出色,但却缺乏通过定理进行逻辑推理的能力。
在设计 AlphaGeometry 的过程中,该实验室将"神经语言"模型(一种在架构上与 ChatGPT 类似的模型)与"符号推导引擎"(一种利用规则 - 如数学规则来推断问题解决方案的引擎)配对使用。符号引擎可能不够灵活且速度较慢,尤其是在处理大型或复杂的数据集时。但 DeepMind 通过让神经模型"引导"推理引擎找出给定几何问题的可能答案,缓解了这些问题。
为了代替训练数据,DeepMind 创建了自己的合成数据,生成了 1 亿条"合成定理"和不同复杂程度的证明。然后,实验室在合成数据上从头开始训练 AlphaGeometry,并在奥林匹克几何问题上对其进行评估。
奥林匹克几何问题以图表为基础,在解题前需要添加"构造",如点、线或圆。应用于这些问题时,AlphaGeometry 的神经模型会预测哪些构造可能需要添加--AlphaGeometry 的符号引擎会利用这些预测对图表进行推理,从而找出类似的解决方案。
Trinh和Luong写道:"有了这么多这些构造如何导致证明的例子,AlphaGeometry的语言模型就能在遇到奥林匹克几何问题时为新的构造提出好的建议。一个系统提供快速、'直观'的想法,而另一个系统则提供更深思熟虑、理性的决策。"
AlphaGeometry的解题结果发表在本周的《自然》(Nature)杂志上,它很可能会引发一场旷日持久的争论:人工智能系统应该建立在符号操作(即使用规则操作代表知识的符号)的基础上,还是建立在表面看来更像大脑的神经网络的基础上。
神经网络方法的支持者认为,智能行为--从语音识别到图像生成时可以从海量数据和计算中产生。与符号系统相比,神经网络试图通过统计近似和从实例中学习来解决任务,而符号系统则是通过定义专门用于特定工作的符号操纵规则集来解决任务(如在文字处理软件中编辑一行)。
神经网络是 OpenAI 的 DALL-E 3 和 GPT-4 等强大人工智能系统的基石。但是,符号人工智能的支持者认为,神经网络并不是万能的;这些支持者认为,符号人工智能可能更适合高效地编码世界上的知识,在复杂的场景中进行推理,并"解释"它们是如何得出答案的。
作为一个类似于 DeepMind 的 AlphaFold 2 和 AlphaGo 的符号-神经网络混合系统,AlphaGeometry 或许证明,将符号操作和神经网络这两种方法结合起来,是寻找可通用人工智能的最佳途径。
"我们的长期目标仍然是建立能够在数学领域通用的人工智能系统,开发通用人工智能系统所依赖的复杂问题解决和推理能力,同时拓展人类知识的前沿,"Trinh 和 Luong 写道。"这种方法可以塑造未来的人工智能系统如何发现数学及其他领域的新知识"。