AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

在 AI 的帮忙下,越来越多的数学题目得到了办理。AI在数学领域的应用对大家来说并不陌生了。数学家陶哲轩作为倡导者,一直走在应用AI辅助注明的前沿。他倡导应用像Lean和Coq这样的注明帮忙对象。这些对象可以形式化和验证复杂的数学注明,减少人为错误的可能性。也有不少数学家在他的启发下有了新成果,例如利用AI形式化费马大定理的注明。他参与了由Talia Ringer发起的AI在数学中资源列表的推广和编辑工作。这个资源列表专注于 AI for Math,为那些希望进入数学 AI 领域的人提供帮忙。陶哲轩在推进项目研讨进

在 AI 的帮忙下,越来越多的数学题目得到了办理。

AI在数学领域的应用对大家来说并不陌生了。数学家陶哲轩作为倡导者,一直走在应用AI辅助注明的前沿。他倡导应用像Lean和Coq这样的注明帮忙对象。这些对象可以形式化和验证复杂的数学注明,减少人为错误的可能性。也有不少数学家在他的启发下有了新成果,例如利用AI形式化费马大定理的注明。他参与了由Talia Ringer发起的AI在数学中资源列表的推广和编辑工作。这个资源列表专注于 AI for Math,为那些希望进入数学 AI 领域的人提供帮忙。

陶哲轩在推进项目研讨进展的同时,还试着学习如何创建动画图表,他决定对零密度估计进行文献回顾 。他讲到,自己一直很好奇为什么没有一份全面的综述来涵盖这些年来建立的整个零密度定理,现在他清楚了,是因为文献太过复杂,尤其在3/4≤σ<1的这个范围, 应用了多种方法。界限通常是逐段的,主要是因为这些方法依赖于控制整数矩而不是分数矩。然而,这些界限虽然以人类可读形式陈述时显得杂乱,但对计算机来说却很容易处理。 

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

陶哲轩将整个的界限汇总到一个Python文件中,并用它创建了附带的动画。 

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

在这一博客的评论中,陶哲轩补充道:

不得不说,我确实应用了一些AI辅助来帮忙编写代码。在某种程度上,我将AI辅助视为一种心理支持——当我知道除了传统的调试和搜索方法外,还有AI对象可以提供初始代码并自动完成部分代码时,更容易说服自己花时间编程。不过,我发现这些对象在调试方面并不是特别有用。不过,GPT能够快速创建一个简单的动画测试函数,并且在第一次尝试时就成功编译了。尽管如此,我仍花了大部分时间来调整和调试,才得到了我想要的动画。

显然,这次尝试的结果还不错。后续陶哲轩还转发了一篇文章,生动地展示了数学智能帮忙如何帮忙一群「菜鸟数学家」办理了数学界最难解的题目。

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

原文链接:https://www.quantamagazine.org/amateur-mathematicians-find-fifth-busy-beaver-turing-machine-20240702/

程序员通常希望最大程度减少代码运转所需要的时间,繁忙海狸函数(BB(n))这个计算机科学中的经典题目却在探寻,一个简单的计算机程序在终止之前可以运转多长时间,即图灵机在特定状态和符号数量限制下所能达到的最大运转步数。 

最近的研讨表明,寻找长时间运转的计算机程序可以揭示数学知识的现状,甚至告诉我们哪些是可知的。繁忙海狸游戏为评估某些题目的难度提供了一个具体的基准,例如未办理的哥德巴赫猜想和黎曼假设。它甚至提供了一个探索数学逻辑计算极限的视角。 

那要怎么理解繁忙海狸函数呢?想象一个小机器人(图灵机),它有一套指令(对应图灵机的状态),可以在一条无限长的纸带上移动和写字。纸带最开始是空白的。这个机器人的目标是尽可能多地在纸带上写字,然后停下来。繁忙海狸题目就是要找到这样的机器人,在给定状态数量下可以写最多字的情况。

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

                                   由ChatGPT-4o生成

这个题目由匈牙利裔数学家蒂博尔·拉多(Tibor Radó)在1962年提出,由于其复杂性和递增的计算需求,繁忙海狸函数(BB(n))的值在n较小时可以规定,但随着n的增加,题目变得极其困难,目前只有前几个BB(n)值被规定。

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

                                1962年,蒂博尔·拉多重新描述了关于图灵机行为的著名不可解题目,提出了繁忙海狸应战。

单法则的情况很简单,因为实际上只有两种可能性。如果法则规定图灵机在看到 0 时中断计算,它将在第一步中断。有了两条法则,就有超过 6,000 个不同的图灵机需要考虑;有了三条法则,这个数字就会膨胀到数百万,有了四条法则,这个数字就会膨胀到数十亿。手工计算整个这些情况是不可能的。

这意味着这个题目只能借助计算机来办理。一个简单的程序可以算出 BB(2) = 6。但 BB(3) 已经很难找到了。而更棘手的是无限循环题目。有的时候图灵机并没有真正停机,而是陷入了无限循环。研讨人员需要找到一种判断图灵机是否真正停机的判断方法。

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

                                    陷入无限循环的图灵机

拉多推出繁忙海狸应战后不久,一些研讨人员就开始了搜寻。从1964年到1974年, Allen Brady花了十年,证出了BB(4) 的数值。研讨启动时,他还是俄勒冈州立大学数学系研讨生,发表时,他已然成为内华达大学雷诺分校的计算机科学教授。

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

                                                              Allen Brady在整个 20 世纪 60 年代开发了「繁忙海狸」算法,并于 1974 年规定了第四个繁忙海狸函数的值。

此后40年,研讨者们前赴后继,但始终无法捕获第五个繁忙海狸函数的身影。如果图灵机需要遵守五条法则,潜在符合可能的图灵机数量接近 17 万亿台——即使以每毫秒一台的速度列出整个图灵机,也需要 500 多年的时间。狩猎「海狸」的猎手们,将图灵机的范围不断缩小。1989年,德国程序员Heiner Marxen 发现了一个在47,176,870 步后中断的图灵机,但是他还需注明整个剩余的机器在此时仍未停机,要算出进一步的结果,还需要30年。

21世纪初,痴迷于研讨BB(5) 的保加利亚计算机科学家Georgi Ivanov Geogiev,将17亿万台图灵机的名单精简到了只剩43个。在一封电子邮件中,Geogiev表示,研讨繁忙海狸函数题目让他疲惫不堪。对于「繁忙海狸」的「猎手」们,这是常见的结果。几十年来,他们独自或结对工作,却没有得到学术界的广泛认可。需要集体努力才能完成这项工作。

2015年,一位名叫Code Golf Addict的匿名GitHub用户发布了一个27法则图灵机的代码,该机器只有在哥德巴赫猜想为假时才会中断。其工作原理是通过整个大于4的偶数进行计数;对于每一个偶数,它会遍历整个可能的两数之和,检查这对数是否为素数。当找到合适的一对素数时,它会移动到下一个偶数并重复这一过程。如果找到一个不能由一对素数之和组成的偶数,它就会中断。 

运转这种无脑机器并不是办理猜想的实际方法,因为我们无法知道它是否会中断。但是,繁忙海狸游戏可以对这一题目提供一些见解。如果能够计算出BB(27),就可以规定自动办理哥德巴赫猜想所需的最长时间。这是因为BB(27)对应的是这台27法则图灵机为了中断所需执行的最大步数。如果我们知道这个数,我们可以运转这台图灵机恰好那么多步。如果它在这期间中断了,我们就知道哥德巴赫猜想是假的。但如果它在这么多步内没有中断,我们就能规定它永远不会中断,从而注明猜想为真。 

题目在于,BB(27)是一个无法理解的大数,甚至将其写下来都不可能,更不用说让哥德巴赫反例机运转这么多步了。 

2016年,类似的结果得出了,这次是 Aaronson等人做出的成果。他们发现了一台744法则的图灵机,只有在黎曼假设为假的情况下才会中断。黎曼假设涉及素数的分布题目,是Clay数学研讨所的「千禧年题目」之一,奖金为100万美元。Aaronson的图灵机将在BB(744)步内自动得出解答。 

当然,BB(744)是一个比BB(27)更难以企及的大数。Aaronson表示,致力于规定更简单的数值,比如BB(5),可能会发现一些新的、有趣的数论题目。最近,Aaronson应用繁忙海狸衍生的尺度来衡量他称之为「不可知阈值」的数学系统整体。 

受Aaronson论文的启发,来自Tristan Stérin在Discord上发起了「繁忙的海狸应战」。随着时间推移,在线社区逐渐壮大,来自世界各地的20多名参与者因为验证BB(5)的真实值相聚。

一位名为Maja Kądziołka波兰程序员在日常的编程工作中经常用到Coq智能注明帮忙。Coq是一款强大的对象,用于帮忙数学家和程序员进行形式化的数学注明和验证。它通过Gallina编程语言,让用户定义数学对象、陈述定理,并一步步构建注明。用户可以与Coq进行交互,逐步验证每一步的正确性。Coq还提供了多种自动化对象,帮忙简化注明过程。广泛应用于数学研讨、程序验证和软件开发,Coq提高了注明和代码的准确性和可靠性。 

在学习了Coq之后,Maja开始寻找一个开放性的题目,就在这时,她刷到了「繁忙的海狸应战」,并开始将社区内的几个注明用Coq来办理。和「繁忙的海狸应战」应用的其他计算机程序不同,在 Coq 注明中,除非每一行都符合逻辑,否则代码将无法运转,因此几乎不可能出错。因此,社区里的成员渐渐对应用Coq「上瘾」了。于是,在接下来的几个月里,Coq接手了社区内未完成的对BB(5)的注明。

2024年5月10日,「繁忙的海狸应战」社区中一位神秘的成员发了一条消息,称「BB(5) 的 Coq 注明已完成。」结果注明,30多年前,德国程序员Heiner Marxen和他的搭档Buntrock发现的那台图灵机在走了 4700 万步之后就停了下来,这其实就是第五只繁忙的海狸——BB(5)的真实值。

AI助攻「菜鸟数学家」办理繁忙海狸题目,陶哲轩转发分享

伊利诺伊大学厄巴纳-香槟分校计算机科学系的助理教授Talia在看完用Coq办理BB(5)的真实值的故事后表示,她喜欢这些数学注明帮忙的原因之一,是它们能让更多的人参与到数学研讨当中。

AI正如陶哲轩所说的那样,帮忙数学家们处理更多题目,让数学之谜逐渐解开。

参考链接:

https://mathstodon.xyz/@TaliaRinger/112719444060361451

https://mathstodon.xyz/@tao

https://www.quantamagazine.org/how-the-slowest-computer-programs-illuminate-maths-fundamental-limits-20201210/

给TA打赏
共{{data.count}}人
人已打赏
理论

13瓦功耗处理10亿参数,接近大脑效率,消除LLM中的矩阵乘法来颠覆AI现状

2024-7-4 15:42:00

理论

上海AI Lab主任、首席科学家周伯文亮相WAIC,人工智能45°均衡律主张首次曝光

2024-7-4 18:36:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索