陶哲轩青睐的注明助手Lean，用上了大模型

工程
23年12月18日
编辑

机器之心

现在，数学辅助注明东西都用上了大模型。「我预计，如果利用得当，到 2026 年，AI 将成为数学钻研和许多其他领域值得信赖的合著者。」数学家陶哲轩在之前的一篇博客中说道。陶哲轩这样说了，也这样做了。他最近一直在用 GPT-4、Copilot、Lean 等东西从事数学钻研，并且还在 AI 的帮助下发现了自己论文中的一处隐藏 bug。不仅如此，前几天，陶哲轩表示：对多项式 Freiman-Ruzsa 想象（PFR）的注明从事形式化的 Lean4 项目成功完成，并且耗时仅三周时间。Lean 编译器也报告该想象符合标准公理

现在，数学辅助注明东西都用上了大模型。

「我预计，如果利用得当，到 2026 年，AI 将成为数学钻研和许多其他领域值得信赖的合著者。」数学家陶哲轩在之前的一篇博客中说道。

陶哲轩这样说了，也这样做了。

他最近一直在用 GPT-4、Copilot、Lean 等东西从事数学钻研，并且还在 AI 的帮助下发现了自己论文中的一处隐藏 bug。

陶哲轩青睐的注明助手Lean，用上了大模型

不仅如此，前几天，陶哲轩表示：对多项式 Freiman-Ruzsa 想象（PFR）的注明从事形式化的 Lean4 项目成功完成，并且耗时仅三周时间。Lean 编译器也报告该想象符合标准公理，可以说这是计算机和 AI 辅助注明的一项巨大成功。

陶哲轩青睐的注明助手Lean，用上了大模型

关于上述钻研的更多内容，感兴趣的读者可以参照《陶哲轩用 AI 形式化的注明究竟是什么？一文看懂 PFR 想象的前世今生》。

看到这，细心的读者可能已经发现了端倪，陶大神在从事数学钻研时，多次都提到过 Lean。简单来讲，Lean 是一种可帮助数学家考证定理的编程语言，用户可以在其中编写和考证注明。相比初代 Lean，现在最新的 Lean 4 版本从事了多项优化，包括更快的编译器、改进的错误处理和更好的与外部东西集成的能力等。

在数学领域被广泛利用的 Lean，在大模型（LLM）刷屏的今天，两者有没有更好的结合方式呢？

现在已经有人实现了，开放平台 LeanDojo 团队（关于 LeanDojo，可参照「AI 大模型帮陶哲轩解题，还能注明数学定理了？」）和加州理工学院的钻研者推出了 Lean Copilot，这是一款专为 LLM 与人类交互而设计的协调东西，旨在通过人机协调给出 100% 准确的形式化数学注明。

陶哲轩青睐的注明助手Lean，用上了大模型

值得注意的是，LeanDojo 团队的钻研主要集中在利用 LLM 自动化定理注明方面，从这点也不难看出，他们推出的 Lean Copilot 和 LLM 相关也不会令人吃惊。

陶哲轩青睐的注明助手Lean，用上了大模型

项目地址：https://github.com/lean-dojo/LeanCopilot

对于这项钻研，大家除了说 Cool，就是 very cool，评价还是很高的。

陶哲轩青睐的注明助手Lean，用上了大模型

在 Lean 中利用 LLM，加快数学注明速度

一直以来，自动化定理注明面临重重困难，传统上，数学注明依赖于手工推导，需要细致的考证。现在随着 AI 的进步，钻研者开始借助人工智能从事深入探索，但又免不了出现这种问题，即 LLM 在数学和推理任务中有时不是很靠谱，容易出现错误和幻觉。

Lean Copilot 允许用户在 Lean 中利用大型语言模型来自动化注明过程，从而显着加快注明合成的速度，在必要时还允许人类无缝介入和修改，从而在机器和人类智力之间提供平衡的协调。

Lean Copilot 允许在 Lean 中利用 LLM 来使注明自动化，如战略倡议（suggesting tactics）、条件（premises）以及搜寻注明（searching for proofs）。

用户可以采用利用 LeanDojo 提供的内置模型，或者导入自己的模型。这些模型可以在内地运转（无论是否有 GPU），或者在云端运转。

简而言之，Lean Copilot 为用户提供了一个灵活的方式，通过引入 LLM 来增强和优化在 Lean 中从事定理注明的过程。

Lean Copilot 的主要特点可总结为：

LLM 能够提出注明步骤，搜寻注明，并从大型数学库中采用有用的引理。

Lean Copilot 可作为 Lean 包从事设置，并且能够无缝地在 Lean 的 VS Code 工作流中运转。

用户可以利用 LeanDojo 中的内置模型，或者利用自己的模型，这些模型可以在内地（有或没有 GPU）或云端运转。

该东西可在各种平台上运转，包括 Linux、macOS 和 Windows WSL。

为了使 LLM 更易于 Lean 用户利用，Lean Copilot 希望能够启动一个正反馈循环：注明自动化将带来更好的数据，并最终提高 LLM 在数学上的性能。

Lean Copilot 效果展示

大家可以根据官方教程配置 Lean Copilot，配置好后就可以从事实验了。项目作者也给出了一些官方示例。陶哲轩青睐的注明助手Lean，用上了大模型

战略倡议。导入 LeanCopilot 后，你可以利用 suggest_tactics 生成战略倡议。利用过程中，你也可以点击倡议的战略，并在注明中利用它（参照下图）。

陶哲轩青睐的注明助手Lean，用上了大模型

你可以提供一个前缀如 simp 来约束生成的战略。

陶哲轩青睐的注明助手Lean，用上了大模型

注明搜寻。如下图所示 search_proof 将 LLM 生成的战略与 aesop （用于 Lean 4 的白盒自动化项目）相结合，来搜寻多战略注明。找到注明后，你可以单击该战略以将其插入编辑器中。

陶哲轩青睐的注明助手Lean，用上了大模型

条件采用。该战略用于检索潜在有用条件（premises）的列表。目前，Lean Copilot 利用 LeanDojo 中的检索器从 Lean 和 mathlib4 （Lean 4 数学库）的固定 snapshot 中采用条件。

陶哲轩青睐的注明助手Lean，用上了大模型

运转 LLM。你还可以运转 Lean 中的任何 LLM 推理，不限于定理注明。在内地或远程运转任意模型（请参阅自带模型）。

陶哲轩青睐的注明助手Lean，用上了大模型

项目中还提到了一些高级用法，感兴趣的读者，可以去原项目了解更多内容。

参照链接：https://analyticsindiamag.com/lean-co-pilot-lets-you-use-llms-as-copilots-in-lean/

给TA打赏

共{{data.count}}人

人已打赏

Lean Copilot 陶哲轩

GPT-2能监视GPT-4，Ilya带头OpenAI超等对齐首篇论文来了：AI对齐AI取得实证结果

2023-12-15 15:00:00

源代码is all you need！7B代码小模型同尺寸无敌，性能媲美ChatGPT和谷歌Gemini

2023-12-18 15:36:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果
12月19日
TOP2

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物
12月19日
TOP3

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
2024年AI 编程现在可以做到什么程度？
12月18日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日
抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩
12月12日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部