陶哲轩支持！AI数学奥林匹克竞赛进步奖公布，奖金100多万美元

作者：机器之心

2024-07-04 06:09

大模型做数学题到底如何，不妨让它参与一下这种级别的比赛。「AI 数学奥林匹克竞赛（AIMO 进步奖）的初步成绩已公布。根据排行榜的数据，目前看来，获胜的程序在私人测试中正确回答了 29/50 道题，这一成绩比预期的要高。」刚刚，陶哲轩在个人博客中公布了这一消息。AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起，主要是让参与者使用 AI 模型解决国际数学难题，而本次进步奖的目标是创建能够解决用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能

大模型做数学题到底如何，不妨让它参与一下这种级别的比赛。

「AI 数学奥林匹克竞赛（AIMO 进步奖）的初步成绩已公布。根据排行榜的数据，目前看来，获胜的程序在私人测试中正确回答了 29/50 道题，这一成绩比预期的要高。」刚刚，陶哲轩在个人博客中公布了这一消息。

AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起，主要是让参与者使用 AI 模型解决国际数学难题，而本次进步奖的目标是创建能够解决用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能力，并推动前沿知识的发展。

值得一提的是，此次进步奖是首次颁发，获奖队伍将角逐 104.8 万美元的奖金。

参赛题目包括中级高中数学竞赛的题目，但难度没有达到国际数学奥林匹克（IMO）的水平。

获奖资格要求团队公开发布其代码、方法、数据和模型参数。

根据排名，我们可以看出，获得第一名的是 Numina 的团队，CMU_MATH 位列第二，after exams 暂居第三，codeinter、Conor #2 团队分别拿到第四、第五的成绩。

根据规则，参赛小组最多 5 人，排名前五的就有两位是单人作战。

大家使用的模型也是各不相同，包括 Mixtral・8x7b、Gemma、Llama 3 等。

一直以来，IMO 国际奥林匹克数学竞赛都是由专门研究数学的爱好者们直接参与，但随着大模型能力的不断提升，其在数学中的表现受到越来越多的关注。

大家测试的重点也逐渐从类似的高考题转战到奥林匹克竞技场上，此前，来自 Google DeepMind 的 AlphaGeometry 登上 Nature，该研究解决了 30 个奥林匹克级别问题中的 25 个，接近国际数学奥林匹克竞赛金牌选手的平均表现。

在大模型爆发的当下，已经不止一家开始挑战奥赛难题，让他们之间一较高下结果会怎样呢？

去年 11 月，专门为 AI 设立的数学比赛来了，奖金为 1000 万美元，旨在激励开放式的人工智能模型开发，使其能够在国际数学奥林匹克（IMO）中表现得与顶尖人类参赛者一样出色。此次进步奖是作为 AIMO 大奖的一部分进行评选。

AIMO 顾问委员都是数学界的大牛，包括菲尔兹奖得主 Timothy Gowers 和陶哲轩（Terence Tao），与他们一同任职的还有 Po-Shen Loh、Dan Roberts 和 Geoff Smith。

参考链接：

https://aimoprize.com/participate

相关标签：

陶哲轩 AIMO 进步奖

相关资讯

陶哲轩：通义千问QwQ奥数真厉害，开源大模型顶流

陶哲轩：通义千问QwQ奥数真厉害，开源大模型顶流

QwQ 具有神奇的推理能力。一个刚发布两天的开源模型，正在 AI 数学奥林匹克竞赛 AIMO 上创造新纪录。本周五，知名数学家、加州大学洛杉矶分校教授、菲尔茨奖得主陶哲轩（Terence Tao）介绍了第二届 AIMO 竞赛的最新进展。

11/30/2024 1:48:00 PM

机器之心

陶哲轩用大模型辅助解决数学问题：生成代码、编辑LaTeX公式都很好用

陶哲轩用大模型辅助解决数学问题：生成代码、编辑LaTeX公式都很好用

数学研究工具可以随 AI 模型的进展更新一波了。

9/5/2023 6:42:00 PM

机器之心

陶哲轩：初学者不宜用AI工具做专家级任务，GPT对专家帮助不大

陶哲轩：初学者不宜用AI工具做专家级任务，GPT对专家帮助不大

对于不同技能水平的人，使用 GPT 等 AI 工具收获的成效也大不一样。

9/11/2023 7:24:00 AM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部