AI在线 AI在线

OpenAI 研究负责人:某些形式的“推理”AI模型本可以提前20年出现

作者:AI在线
2025-03-20 09:56
OpenAI人工智能推理研究主管Noam Brown近日在英伟达GTC大会的小组讨论中表示,某些形式的“推理”AI模型本可以提前20年出现,如果研究人员当时“知道正确的方法和算法”的话。 他指出,这个研究方向之所以被忽视,存在多种原因。 Brown回忆起他在卡内基梅隆大学从事博弈AI研究的经历,包括曾击败顶级人类扑克职业选手的Pluribus。

OpenAI人工智能推理研究主管Noam Brown近日在英伟达GTC大会的小组讨论中表示,某些形式的“推理”AI模型本可以提前20年出现,如果研究人员当时“知道正确的方法和算法”的话。他指出,这个研究方向之所以被忽视,存在多种原因。

OpenAI

Brown回忆起他在卡内基梅隆大学从事博弈AI研究的经历,包括曾击败顶级人类扑克职业选手的Pluribus。他表示,当时他帮助创建的AI的独特之处在于,它能够“推理”解决问题,而不是依赖纯粹的暴力计算。Brown提到,人类在棘手的情况下会花费大量时间思考,这或许对人工智能非常有益。

Brown也是OpenAI的AI模型o1的架构师之一。该模型采用了一种名为“测试时推理”的技术,使其在响应查询之前进行“思考”。测试时推理通过对运行中的模型应用额外的计算来驱动某种形式的“推理”。一般来说,所谓的推理模型比传统模型更准确、更可靠,尤其是在数学和科学等领域。

在小组讨论中,当被问及鉴于高校普遍缺乏计算资源,学术界是否还有可能进行像OpenAI这样规模的实验时,Brown承认,近年来随着模型对计算资源的需求越来越高,这变得更加困难。但他同时指出,学术界可以通过探索对计算要求较低的领域,例如模型架构设计,来发挥重要作用。

Brown强调,前沿实验室和学术界之间存在合作的机会。他表示,前沿实验室会关注学术出版物,认真评估其提出的论点是否具有足够的说服力,即如果进一步扩大规模,相关研究是否会非常有效。如果论文提出了令人信服的论点,这些实验室将会对此进行深入研究。

此外,Brown还特别提到了AI基准测试领域,认为学术界可以在其中发挥重要影响。他批评当前AI基准测试的现状“非常糟糕”,指出这些基准测试往往考察的是深奥的知识,其得分与大多数人关心的任务的熟练程度相关性较差,从而导致了对模型能力和改进的广泛误解。Brown认为,改进AI基准测试不需要大量的计算资源。

值得注意的是,在本次讨论中,Brown最初的言论指的是他在加入OpenAI之前从事博弈AI的研究工作,例如Pluribus,而不是像o1这样的推理模型。

划重点:

  • 🤔 OpenAI的Noam Brown认为,如果更早发现正确方法,“推理”AI本可提前20年出现,此前的研究方向存在被忽视的情况。
  • 🤝 Brown强调学术界和前沿AI实验室之间存在合作机会,学术界可在模型架构设计和AI基准测试等低计算需求领域发挥重要作用。
  • 📈 采用“测试时推理”等技术的推理模型比传统模型更准确可靠,尤其在数学和科学领域。

相关资讯

Hugging Face研究人员构建OpenAI深度研究工具“开放”版本

人工智能开发平台 Hugging Face 最近宣布,他们已成功构建了OpenAI 深度研究工具的“开放”版本,旨在与 OpenAI 最近发布的深度研究工具进行竞争。 OpenAI 在一次活动中展示了其深度研究工具,这一工具能够通过爬取互联网信息,自动编制有关各种主题的研究报告。 但遗憾的是,该工具目前仅对订阅了 OpenAI 每月200美元的 ChatGPT Pro 计划的用户提供有限的使用权限。
2/5/2025 11:20:00 AM
AI在线

OpenAI推出具有图像上传和分析功能的完整o1模型,并首次推出ChatGPT Pro

OpenAI已正式推出其o1模型,该模型已从预览版过渡成为ChatGPT平台的核心功能。 现在,它还可以分析图像——这是一个极为有用的功能升级,因为用户现在可以上传照片,AI聊天机器人会对其做出响应,例如,根据一张清晰的鸟屋照片,为用户提供如何完全从零开始搭建鸟屋的详细计划,非常有趣。 在另一个可能更为严肃且令人印象深刻的例子中,o1现在能够根据草图帮助设计数据中心。
12/6/2024 2:17:41 PM
Carl Franzen

DeepSeek、OpenAI、Kimi 视觉推理哪家强,港中文 MMLab 推出推理基准 MME-COT

OpenAI o1 和 DeepSeek-R1 靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?
2/22/2025 5:57:19 PM
汪淼