陶哲轩支持！AI数学奥林匹克角逐进步奖公布，奖金100多万美元

应用
7月4日
编辑

机器之心

大模型做数学题到底如何，不妨让它参与一下这种级别的角逐。「AI 数学奥林匹克角逐（AIMO 进步奖）的初步结果已公布。根据排行榜的数据，目前看来，获胜的程序在私人尝试中正确回答了 29/50 道题，这一结果比预期的要高。」刚刚，陶哲轩在个人博客中公布了这一消息。AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起，主要是让参与者使用 AI 模型办理国内数学困难，而本次进步奖的目标是创建能够办理用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能

大模型做数学题到底如何，不妨让它参与一下这种级别的角逐。

「AI 数学奥林匹克角逐（AIMO 进步奖）的初步结果已公布。根据排行榜的数据，目前看来，获胜的程序在私人尝试中正确回答了 29/50 道题，这一结果比预期的要高。」刚刚，陶哲轩在个人博客中公布了这一消息。

陶哲轩支持！AI数学奥林匹克角逐进步奖公布，奖金100多万美元

AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起，主要是让参与者使用 AI 模型办理国内数学困难，而本次进步奖的目标是创建能够办理用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能力，并推动前沿知识的发展。

值得一提的是，此次进步奖是首次颁发，获奖队伍将角逐 104.8 万美元的奖金。

参赛标题问题囊括中级高中数学角逐的标题问题，但难度没有达到国内数学奥林匹克（IMO）的水平。

获奖资格要求团队公开发布其代码、方法、数据和模型参数。

根据排名，我们可以看出，获得第一名的是 Numina 的团队，CMU_MATH 位列第二，after exams 暂居第三，codeinter、Conor #2 团队分别拿到第四、第五的结果。

根据规则，参赛小组最多 5 人，排名前五的就有两位是单人作战。

陶哲轩支持！AI数学奥林匹克角逐进步奖公布，奖金100多万美元

大家使用的模型也是各不相同，囊括 Mixtral・8x7b、Gemma、Llama 3 等。

陶哲轩支持！AI数学奥林匹克角逐进步奖公布，奖金100多万美元

一直以来，IMO 国内奥林匹克数学角逐都是由专门研究数学的爱好者们直接参与，但随着大模型能力的不断提升，其在数学中的施展阐发受到越来越多的关注。

大家尝试的重点也逐渐从类似的高考题转战到奥林匹克竞技场上，此前，来自 Google DeepMind 的 AlphaGeometry 登上 Nature，该研究办理了 30 个奥林匹克级别问题中的 25 个，接近国内数学奥林匹克角逐金牌选手的平均施展阐发。

在大模型爆发的当下，已经不止一家开始挑战奥赛困难，让他们之间一较高下结果会怎样呢？

去年 11 月，专门为 AI 设立的数学角逐来了，奖金为 1000 万美元，旨在激励开放式的人工智能模型开发，使其能够在国内数学奥林匹克（IMO）中施展阐发得与顶尖人类参赛者一样出色。此次进步奖是作为 AIMO 大奖的一部分进行评选。

陶哲轩支持！AI数学奥林匹克角逐进步奖公布，奖金100多万美元

AIMO 顾问委员都是数学界的大牛，囊括菲尔兹奖得主 Timothy Gowers 和陶哲轩（Terence Tao），与他们一同任职的还有 Po-Shen Loh、Dan Roberts 和 Geoff Smith。

陶哲轩支持！AI数学奥林匹克角逐进步奖公布，奖金100多万美元

参考链接：

https://aimoprize.com/participate

给TA打赏

共{{data.count}}人

人已打赏

AIMO 进步奖陶哲轩

全新TextGrad框架：用GPT-4o作引擎，主动优化端到端任务

2024-7-4 18:07:00

8人小团队单挑OpenAI，半年仿出GPT-4o，还开源了

2024-7-4 18:18:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview
11月20日
TOP2

AI自动操作VS Code，自然语言搞定各种配置，来自阿里通义智能计算实验室 | 开源
11月20日
TOP3

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊
11月20日
SU 哈佛亚马逊最新研究：量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了
11月16日
微软在东京开设其日本首个研发中心，专注于将机器人技术与 AI 相结合
11月18日
AI 助力脑瘤手术：10 秒内精准识别残留肿瘤
11月14日
闲鱼注册用户突破 6 亿，AI 技术已应用于闲置交易全链路
11月18日
讯飞星火多模态交互大模型上线，数字人、语音、视觉支持一键调用
11月14日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部