OpenAI近日表示,其最新通用推理模型自主给出了一条原创数学证明,推翻了一项自1946年由著名数学家保罗·埃尔德什(Paul Erdős)提出、悬而未决的几何猜想。 OpenAI称,这是人工智能首次自主解决一项在某一数学领域中居于核心地位的著名公开难题,而参与背书的多位数学家也认为,这一次并非虚惊一场。

值得注意的是,这并非OpenAI首次在“AI攻克埃尔德什难题”上高调发声。 大约七个月前,该公司时任副总裁凯文·维尔(Kevin Weil)曾在社交平台X上发文称,“GPT‑5找到了10个此前未解的埃尔德什问题的解,并在另外11个问题上取得进展”。 但很快有人指出,模型所谓的“解”其实早已存在于数学文献之中,GPT‑5只是从已有成果中“翻找”出来,而非真正发现新解。 在GoogleDeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)以及Yann LeCun等竞争对手的嘲讽声中,维尔最终删除了这条被批评为“夸大其词”的帖子。
或许正因有这段前车之鉴,OpenAI在此次发布中明显更加谨慎。 公司在宣布成果的同时,公开了一份由多位数学家撰写的“补充评述”文件,以论证这项几何猜想被推翻的严谨性。 这些联名数学家包括诺加·阿隆(Noga Alon)、梅兰妮·伍德(Melanie Wood)以及托马斯·布卢姆(Thomas Bloom)等人。 布卢姆维护着“Erdos Problems”网站,曾在上一轮风波中把维尔的言论批评为“一种极具戏剧性的误导”,此次则站在了OpenAI这一边,为新证明背书。
OpenAI在X上发文总结了这一突破的核心意义:近80年来,数学界普遍认为,这类问题的最优构造大体应类似于“方形网格”;而该公司的新推理模型则给出了完全不同的一族构造,在性能上优于传统方格方案,从而推翻了长期占主导地位的直觉。 按照OpenAI的说法,这一成果出自一个通用推理模型,而非专门为解题而设计的数学系统,也不是为这道几何难题“定制训练”的算法。
OpenAI认为,这一结果的意义已超出单一命题本身,更在于体现了当前AI系统在“长链条推理”和“跨领域概念连接”上的能力提升。 通过在复杂空间中探索人类研究者尚未尝试或未系统化挖掘的构造方式,此类模型有望在生物学、物理学、工程学以及医学等多个领域带来新发现。 换言之,AI不再只是验证既有证明或搜索既有文献,而是开始在“提出全新结构和思路”方面扮演更积极的角色。
布卢姆在一份声明中表示,人工智能正在帮助人类“更充分地探索我们几百年来共同建造的数学大教堂”。 他提出发问:“还有多少未被看见的奇迹,正静静等待登场?” 在“AI能否真正做出原创科学发现”的讨论尚未平息之际,这次经数学界审查后仍获得认可的几何猜想反例,或许会成为后续争论的一个重要参照点。