陶哲轩支持!AI数学奥林匹克角逐进步奖公布,奖金100多万美元

大模型做数学题到底如何,不妨让它参与一下这种级别的角逐。 「AI 数学奥林匹克角逐(AIMO 进步奖)的初步结果已公布。根据排行榜的数据,目前看来,获胜的程序在私人尝试中正确回答了 29/50 道题,这一结果比预期的要高。」刚刚,陶哲轩在个人博客中公布了这一消息。AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起,主要是让参与者使用 AI 模型办理国内数学困难,而本次进步奖的目标是创建能够办理用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能

大模型做数学题到底如何,不妨让它参与一下这种级别的角逐。

 「AI 数学奥林匹克角逐(AIMO 进步奖)的初步结果已公布。根据排行榜的数据,目前看来,获胜的程序在私人尝试中正确回答了 29/50 道题,这一结果比预期的要高。」刚刚,陶哲轩在个人博客中公布了这一消息。

陶哲轩支持!AI数学奥林匹克角逐进步奖公布,奖金100多万美元

AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起,主要是让参与者使用 AI 模型办理国内数学困难,而本次进步奖的目标是创建能够办理用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能力,并推动前沿知识的发展。 

值得一提的是,此次进步奖是首次颁发,获奖队伍将角逐 104.8 万美元的奖金。

参赛标题问题囊括中级高中数学角逐的标题问题,但难度没有达到国内数学奥林匹克(IMO)的水平。

 获奖资格要求团队公开发布其代码、方法、数据和模型参数。 

根据排名,我们可以看出,获得第一名的是 Numina 的团队,CMU_MATH 位列第二,after exams 暂居第三,codeinter、Conor #2 团队分别拿到第四、第五的结果。

根据规则,参赛小组最多 5 人,排名前五的就有两位是单人作战。

陶哲轩支持!AI数学奥林匹克角逐进步奖公布,奖金100多万美元

大家使用的模型也是各不相同,囊括 Mixtral・8x7b、Gemma、Llama 3 等。

陶哲轩支持!AI数学奥林匹克角逐进步奖公布,奖金100多万美元

一直以来,IMO 国内奥林匹克数学角逐都是由专门研究数学的爱好者们直接参与,但随着大模型能力的不断提升,其在数学中的施展阐发受到越来越多的关注。

大家尝试的重点也逐渐从类似的高考题转战到奥林匹克竞技场上,此前,来自 Google DeepMind 的 AlphaGeometry 登上 Nature,该研究办理了 30 个奥林匹克级别问题中的 25 个,接近国内数学奥林匹克角逐金牌选手的平均施展阐发。

在大模型爆发的当下,已经不止一家开始挑战奥赛困难,让他们之间一较高下结果会怎样呢?

去年 11 月,专门为 AI 设立的数学角逐来了,奖金为 1000 万美元,旨在激励开放式的人工智能模型开发,使其能够在国内数学奥林匹克(IMO)中施展阐发得与顶尖人类参赛者一样出色。此次进步奖是作为 AIMO 大奖的一部分进行评选。

陶哲轩支持!AI数学奥林匹克角逐进步奖公布,奖金100多万美元

AIMO 顾问委员都是数学界的大牛,囊括菲尔兹奖得主 Timothy Gowers 和陶哲轩(Terence Tao),与他们一同任职的还有 Po-Shen Loh、Dan Roberts 和 Geoff Smith。

陶哲轩支持!AI数学奥林匹克角逐进步奖公布,奖金100多万美元

参考链接:

https://aimoprize.com/participate

给TA打赏
共{{data.count}}人
人已打赏
应用

全新TextGrad框架:用GPT-4o作引擎,主动优化端到端任务

2024-7-4 18:07:00

应用

AI 搜索热潮背后:注定要逾越场景的门槛

2024-7-4 18:11:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索