确认了!o3-mini几周内发布,奥特曼表示AGI只需872兆瓦计算功率

昨天,我们报道了一个行业猜想,说是 OpenAI 和 Anthropic 等前沿大模型公司可能已经训练出了下一代大模型,但由于它们的使用成本过高,所以短时间内根本不会被放出来。 但是,为了响应用户期待,OpenAI 和 Anthropic 等公司会不断放出一些基于下一代大模型蒸馏得到的较小模型。 更多分析请参阅文章《GPT-5、 Opus 3.5 为何迟迟不发?

昨天,我们报道了一个行业猜想,说是 OpenAI 和 Anthropic 等前沿大模型公司可能已经训练出了下一代大模型,但由于它们的使用成本过高,所以短时间内根本不会被放出来。但是,为了响应用户期待,OpenAI 和 Anthropic 等公司会不断放出一些基于下一代大模型蒸馏得到的较小模型。更多分析请参阅文章《GPT-5、 Opus 3.5 为何迟迟不发?新猜想:已诞生,被蒸馏成小模型来卖》。

有意思的是,就在这篇文章发布后不久,OpenAI CEO 山姆・奥特曼就在 𝕏 上宣布将在「周内」发布 o3-mini,并且这一次会同时发布 API 与网页端。从名字也能看出来,o3-mini 应该就是某个大模型的蒸馏版,这似乎也映证了上面的猜想。

图片

另据 OpenAI 研究科学家 Hongyu Ren 透露,他们会同时发布 o3-mini 的 high、medium、low 三个版本

图片

当然,严格来说,这并不算是一个新闻。早在上个月 21 日,OpenAI 十二天连发的最后一天,奥特曼就提到过计划在一月底左右推出 o3-mini,并在不久后推出完整的 o3 模型。更多详情可访问《刚刚,OpenAI 放出最后大惊喜 o3,高计算模式每任务花费数千美元》。

这条推文之后,奥特曼又积极地回答了许多网友的提问,为我们揭示了更多细节。

首先,奥特曼证实 o3-mini 的性能表现会逊于 o1-pro,但速度会更快

图片

这一点着实让不少网友失望,因为从这个描述看,o3-mini 可能也就比 o1-mini 强一点。

图片

但其实,OpenAI 此前就已经公布过相关基准数据了,所以这一点倒并不让人惊讶。比如在 Codeforces 编程基准上,o3-mini (low) 性能不及 o1,high 版本会好一些,但整体都更具成本效益,这使其非常适合用来编程

图片

OpenAI 的 Dylan Hunn 也强调了 o3-mini 在编程速度上的优势。

图片

或许是为了安抚大家的情绪,奥特曼又抬出了 o3,表示这个版本会比 o1-pro 聪明得多,更别提 o3-pro 了。同时,他也表示 o3-pro 的定价不会是一个月 2000 美元起,200 美元的 Pro 订阅者应该就能获得一定的使用额度

图片

至于 o3-mini 的使用额度,奥特曼只是说「真的高」,从上下文看应该会比 o1 系列的高一些。

图片

奥特曼也表示 o3-mini 会向 ChatGPT Plus 订阅者提供,并不限于 200 美元月供的 Pro 用户。

图片

另外,奥特曼也谈到了 GPT 系列与 o 系列模型品牌融合的问题。看起来,这个融合行动就将在今年发生!

图片

AGI 需要 872 兆瓦的计算功率

除了与 o3-mini 相关的问题,奥特曼也解答了一个与 AGI 相关的提问。当然,他的答复已经不是第一次出现了:AGI 可以实现,并且需要 872 兆瓦的计算功率。作为参考,美国目前最大的核电站 Alvin W. Vogtle 发电站的装机容量为 4536 兆瓦,理想情况下也顶多仅能供养 5 个这样的 AGI。不过话也说回来,872 兆瓦这个数据着实精确得让人惊讶。

图片

那我们目前实际上已经到哪一步了呢?根据 situational-awareness.ai 的估算,目前 AI 的功率应该差不多就在这个水平。

图片

看起来,OpenAI 确实很有可能已经开发出了下一代模型,甚至有可能达到了 AGI 等级 —— 当然,这得取决于 OpenAI 对 AGI 的具体定义。事实上,已经有人根据所谓的内部消息在暗示这一点了。

图片

对此,你有什么看法呢?

参考链接

https://x.com/sama/with_replies

https://en.wikipedia.org/wiki/List_of_largest_power_stations_in_the_United_States

https://situational-awareness.ai/racing-to-the-trillion-dollar-cluster/

相关资讯

AI掌控编码人类狂按Tab,软件工程自主时代来临!OpenAI董事长Taylor重磅长文

2024年额度几近用完。 这一年,你认为AI对软件工程师最大的影响是什么? 今年3月,世界首个AI程序员Devin一出世,全网惊呼一切完结了!

降低门槛,全平台应用,昇腾还会手把手地教你如何用AI

机器之心报道作者:泽南如何才能做到 AI 应用一次开发,全场景部署?昇腾给出了答案。如今的大多数 AI 应用程序都需要跑在多种类型的处理器上,覆盖数十个版本的操作系统,运行在从端侧到云计算集群的各种设备上。这样复杂的环境,对软件的适应性和模型的可裁剪、可伸缩性提出了极高要求。AI 开源框架也在顺应这股潮流,昇腾发布的 CANN、MindSpore、MindX 等工具,可以让开发者实现「统一端边云,全端自动部署」,开启了机器学习开发的新时代,一直被人们寄予厚望。昇腾的 AI 全栈软件平台。其中,基础架构作为连接硬件与

院士、委员、专家共议“双智建设”:场景驱动、标准协同、以人为本

智能网联汽车和智慧城市基础设施,已经成为日常生活中随处可见的元素。2021年,住建部和工信部将16个城市列为双智试点城市,探索智慧城市基础设施与智能网联汽车协同发展。试点城市提供了哪些思路?双智的未来该走向何处?这些问题成为当前双智行业关注的重点。近日,由腾讯智慧交通、腾讯研究院联合举办了“双智建设专家研讨会“,共同探讨双智建设的新思路、新机遇。中国工程院院士郭仁忠、全国政协委员、交通运输部科学研究院副院长兼总工程师王先进、中国电动汽车百人会秘书长兼首席专家张永伟、中国信息通信研究院副院长王志勤、中国城市规划设计研