游戏结束了?OpenAI可能已经突破,跨过起飞的最后临界阈值

刚刚,X 上的一则帖子爆火,浏览量达到 30 多万。 该推文涉及引领 AI 潮流的 OpenAI。 内容显示「OpenAI 递归式自我改进目前在一个盒子里,准确的说是在一个无法破解的盒子!

刚刚,X 上的一则帖子爆火,浏览量达到 30 多万。

该推文涉及引领 AI 潮流的 OpenAI。内容显示「OpenAI 递归式自我改进目前在一个盒子里,准确的说是在一个无法破解的盒子!」

图片

我们不难看出,帖子内容突出了 OpenAI 的发展态势,AI可以自我改进,并且很难有人短期内破解。还有一则帖子表示:

「OpenAI 可能已经获得了突破,并最终跨越了临界点,达到一个起飞状态 —— 即智能达到了可以自我递归改进的程度,o4 或 o5 将能够自动化 AI 研发并完成其余工作。

像 o1 这样的模型的大部分意义不在于部署它,而在于为下一个模型生成训练数据。o1 解决的每一个问题现在都是 o3 的训练数据点。

实际上我们有点惊讶于 OpenAI 竟然费心的部署了 o1-pro,而不是将其保持私密并投资计算资源进行更多的 o3 训练等。这显然与 Anthropic 和 Claude-3.6-opus 的开发不同,这个模型没有研发失败,只是 Anthropic 选择将其保持私密,并将其蒸馏成一个小而便宜但很智能的 Claude-3.6-sonnet。

如果你想知道为什么 OpenAI 的人突然在 X 上变得几乎是狂喜地乐观,认真观察从原始 4o 模型到 o3 的改进可能就是原因。

这就像观看 AlphaGo 的 Elo 曲线:它只是不断 up……up……up……

这给我们一种感觉,他们已经获得突破,终于跨越了临界点,即从仅仅是尖端 AI 工作(其他机构将在几年内才能复制),到起飞(破解智能),以至于 o4 或 o5 将能够自动化 AI 研发并完成其余工作。」

游戏结束了?OpenAI可能已经突破,跨过起飞的最后临界阈值

图片

在这条推文下,大家的讨论格外热烈。

有人表示「如果这是真的,如果模型不需要人类进行训练,那么《黑客帝国》的结果就不再有效了。」

图片

「我一直是这么想的,OpenAI 没有向公众发布他们最新的优秀模型,他们总是在内部领先 1 或 2 代,因为这为他们提供了开发优势。」

图片

「也许最可怕的不是上述观点是否正确,而是我们无法判断他是否错误。」

图片

就连 OpenAI 研究员 Jason Wei 也跑到评论区发言:魔法,就是当一个不可阻挡的强化学习(RL)优化算法,在充足的计算资源驱动下,遇到一个无法被攻破的强化学习环境时,奇迹就发生了。

图片

Andrej Karpathy 也发表了自己的观点:魔法就是当优化技巧破解了那个环境时,就会出现。

图片

相关资讯

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o

LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI  。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更

OpenAI o1 推理模型 API 上线,仅面向特定开发者开放

“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。