DeepMind新AI系统AlphaGeometry2:超越国际数学奥林匹克金牌得主

谷歌 DeepMind 研究实验室最新推出的 AI 系统 AlphaGeometry2,在解决几何问题方面表现出色,超越了国际数学奥林匹克(IMO)比赛中的平均金牌得主。 该系统被认为是 AlphaGeometry 的改进版本,研究人员表示,AlphaGeometry2能够解决过去25年 IMO 中84% 的几何问题。 为什么 DeepMind 会关注这样的高中数学竞赛呢?他们认为,寻找解决复杂几何问题的新方法,特别是欧几里得几何,可能是提升 AI 能力的关键。

谷歌 DeepMind 研究实验室最新推出的 AI 系统 AlphaGeometry2,在解决几何问题方面表现出色,超越了国际数学奥林匹克(IMO)比赛中的平均金牌得主。该系统被认为是 AlphaGeometry 的改进版本,研究人员表示,AlphaGeometry2能够解决过去25年 IMO 中84% 的几何问题。

image.png

为什么 DeepMind 会关注这样的高中数学竞赛呢?他们认为,寻找解决复杂几何问题的新方法,特别是欧几里得几何,可能是提升 AI 能力的关键。证明数学定理或解释定理(如勾股定理)为何成立,需要逻辑推理和选择多个可能步骤的能力。如果 DeepMind 的理论成立,这些问题解决能力将对未来的通用 AI 模型非常重要。

今年夏天,DeepMind 展示了结合了 AlphaGeometry2与数学推理 AI 模型 AlphaProof 的系统,该系统在2024年 IMO 的六个问题中解决了四个。除了几何问题,这种方法还可以扩展到其他数学和科学领域,例如复杂的工程计算。

AlphaGeometry2的核心组成部分包括来自谷歌 Gemini 系列的语言模型和一个 “符号引擎”。Gemini 模型帮助符号引擎通过数学规则推导出问题的可行解。IMO 的几何问题通常基于需要添加 “构造” 的图形,例如点、线或圆。AlphaGeometry2的 Gemini 模型能够预测哪些构造可能对解决问题有帮助。

值得注意的是,AlphaGeometry2在解决 IMO 问题时,使用了 DeepMind 自己生成的超过3亿个定理和证明的合成数据进行训练。研究团队选择了过去25年中 IMO 的45个几何问题,并进行了扩展,最终形成了50个问题集。AlphaGeometry2成功解决了其中的42个,超越了金牌得主的平均得分。

不过,AlphaGeometry2仍存在一些局限性,例如它无法解决具有可变数量点、非线性方程和不等式的问题。尽管如此,这项研究仍然引发了关于 AI 系统应该基于符号操作还是神经网络的讨论。AlphaGeometry2采用了一种混合方法,结合了神经网络和基于规则的符号引擎。

AlphaGeometry2的成功为通用 AI 的未来发展提供了新的方向。尽管目前尚未完全自给自足,但 DeepMind 团队的研究表明,未来可能会有更多自足的 AI 模型问世。

论文入口:https://arxiv.org/pdf/2502.03544

划重点:

📊 AlphaGeometry2能够解决过去25年 IMO 中84% 的几何问题,超越了金牌得主的平均得分。  

🔍 该系统结合了神经网络和符号引擎,采用混合方法解决复杂数学问题。  

📈 DeepMind 希望通过解决几何问题,推动更强大通用 AI 的研究进展。

相关资讯

DeepMind 新AI系统超越国际数学奥林匹克金牌选手,解题能力显著提升

近日,谷歌 DeepMind 开发的一款 AI 系统 ——AlphaGeometry2,成功超越了国际数学奥林匹克(IMO)金牌选手的平均水平,在几何问题解答上表现优异。 AlphaGeometry2是 DeepMind 在去年发布的 AlphaGeometry 系统的升级版,研究团队在最新的研究中指出,该系统能解决过去25年间 IMO 的84% 几何问题。 那么,为什么 DeepMind 会关注这样一个高中的数学竞赛呢?研究人员认为,解决复杂几何问题的新方法可能是提升 AI 能力的关键,尤其是在欧几里得几何方面。

谷歌 DeepMind 发布 WebLI-100B:千亿级数据集解锁 AI 视觉语言模型的文化多样性

科技媒体 marktechpost 昨日(2 月 13 日)发布博文,报道称谷歌 DeepMind 团队发布了 WebLI-100B 千亿级数据集,并通过增强文化多样性和多语言性,以及减少子组之间的性能差异来提高包容性。

目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资

又有谷歌大模型核心成员出来创业了。 3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Reflection AI 的公司,旨在开发超级智能。 该公司一亮相,就已宣布获得 1.3 亿美元融资,估值更是高达 5.55 亿美元。