银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道

IT 之家 7 月 26 日消息,谷歌 DeepMind 团队昨日(7 月 25 日)发布博文,表示其研发的 AlphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题,在解答国际数学奥林匹克竞赛难题方面达到银牌标准。AI 模型简介AlphaProof:基于强化学习的全新数学形式推理系统。AlphaGeometry 2:几何解题系统的改进版。DeepMind 团队结合两个 AI 模型,协作解决了今年国际数学奥林匹克(IMO)6 道题目中的 4 道,首次在竞赛中取得与银牌得主同等的成绩

IT 之家 7 月 26 日消息,谷歌 DeepMind 团队昨日(7 月 25 日)发布博文,表示其研发的 AlphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题,在解答国际数学奥林匹克竞赛难题方面达到银牌标准。

AI 模型简介

AlphaProof:基于强化学习的全新数学形式推理系统。

AlphaGeometry 2:几何解题系统的改进版。

DeepMind 团队结合两个 AI 模型,协作解决了今年国际数学奥林匹克(IMO)6 道题目中的 4 道,首次在竞赛中取得与银牌得主同等的成绩。

评分团队

DeepMind 团队两位专家,根据 IMO 的评分规则进行评分,这两位专家分别为:

蒂莫西・高尔斯教授(Prof Sir Timothy Gowers):著名数学家、IMO 金牌得主和菲尔兹奖得主。

约瑟夫-迈尔斯博士(Dr Joseph Myers):两届 IMO 金牌得主、IMO 2024 年问题遴选委员会主席

AI 模型推理

AI 会将 IMO 的 6 道题目翻译成为模型可以理解的数学语言。

AlphaProof 通过确定答案并证明其正确性,解决了两个代数问题和一个数论问题,而其中解决的 1 个问题是比赛中最难的,在今年的 IMO 中只有 5 位选手解决了这一问题。

银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道

AlphaGeometry 2 证明了几何问题,没有解决 2 个组合问题。

银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道

AI 模型结果

按照 IMO 规则,6 道题目每道题可获得 7 分,总分最高为 42 分。

DeepMind 系统最终获得了 28 分,每个问题都得到了满分,相当于银牌组的最高分。

银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道

2024 年的金奖门槛从 29 分开始,在正式比赛中,609 名参赛者中有 58 人获得了金奖。

IT 之家附上参考地址

AI achieves silver-medal standard solving International Mathematical Olympiad problems

相关资讯

谷歌AI拿下IMO奥数银牌,数学推理模型AlphaProof面世,强化学习 is so back

对于 AI 来说,奥数不再是问题了。本周四,谷歌 DeepMind 的人工智能完成了一项壮举:用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,并且距拿金牌仅一步之遥。上周刚刚结束的 IMO 竞赛共有六道赛题,涉及代数、组合学、几何和数论。谷歌提出的混合 AI 系统做对了四道,获得 28 分,达到了银牌水平。本月初,UCLA 终身教授陶哲轩刚刚宣传了百万美元奖金的 AI 数学奥林匹克竞赛(AIMO 进步奖),没想到 7 月还没过,AI 的做题水平就进步到了这种水平。IMO 上同步做题,做对了最难题IMO 是

陶哲轩点评谷歌AlphaProof:AI在数学竞赛中展现「超凡智慧」

在奥数问题面前,AI 的「智商」往往不太够用。不过,这已经是过去式了。谷歌 DeepMind 用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,并且距拿金牌仅一步之遥。对于 AI 来说,奥数不再是问题了。IMO 2024 中六个问题的每一个问题满分为 7 分,总分最高 42 分。DeepMind 的系统最终得分为 28 分,意味着解决的 4 个问题都获得了满分 —— 相当于银牌类别的最高分。DeepMind 文章连接: AI 辅助证明的数学家陶哲轩近期正处在出差的忙碌中,对问题求解引擎 AlphaProof

中国队喜提六枚金牌,实现IMO团队三连冠:王一川拿下全场唯一满分

在 IMO 2021 的赛场上,中国队又一次实现了「全员金牌」并喜提冠军,来自华师大二附中的选手王一川更是获得了全场唯一的满分成绩。