豪掷20万块GPU训练Grok-3,马斯克“大力出奇迹”了吗?

当时间周一,埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。 这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。 这背后,到底是真正的技术突破,还是一场“大力出奇迹”的豪赌呢?

豪掷20万块GPU训练Grok-3,马斯克“大力出奇迹”了吗?

当时间周一,埃隆·马斯克旗下的xAI公司正式发布了最新大模型Grok-3。这次,马斯克不仅带来了性能更强的AI,还秀了一把“肌肉”——20万块GPU组成的超级计算集群。这背后,到底是真正的技术突破,还是一场“大力出奇迹”的豪赌呢?

Grok-3确实很强,但很难算突破

从性能上看,Grok-3确实很能打。在标准AI基准测试中,它在数学(AIME)、科学(GPOA)和编程(LCB)测试中稳居榜首,盲测表现也相当出色。此前代号为“Chocolate”的测试版曾在LLM Arena平台上获得最高ELO评分,这意味着用户更喜欢Grok-3的回答,而不是其他模型的输出。

更厉害的是,Grok-3的“推理测试版”在AIME 2025基准测试中拿到了93分,其他顶尖模型的得分都在87分以下。这说明,Grok-3在数学推理上确实有独到之处。

下载.jpg下载.jpg

尽管Grok-3的性能很强,但现场演示时,它更像是在“追赶”而不是“超越”。xAI展示了Grok-3解决物理问题和从头编写游戏代码的能力,但这些功能,ChatGPT、Claude和谷歌的Gemini早就实现了。

换句话说,Grok-3更像是在用更强的算力,把别人已经做过的事情做得更好,而不是开辟了一条全新的道路。

20万块GPU集群,比模型还出圈

不过,相比Grok-3模型的表现,业界对马斯克搭建的20万块GPU集群更感兴趣——尤其是在DeepSeek掀起低成本模型训练的浪潮之下。

想象一下,20万块GPU堆在一起,这得是个多么庞大的“钢铁巨兽”!xAI的这个超级计算集群被命名为“巨像”(Colossus),名字霸气,实力也不容小觑。

这个系统分两个阶段训练:先在10万块GPU上训练了122天,然后又花了92天扩展到20万块。xAI团队直言,搭建这个集群比开发模型本身还难,可以说是“硬件先行,软件跟上”的典型范例。

先跟随再创新,马斯克还有“大招”

不过,xAI的野心显然不止于此。他们计划在未来几周内推出语音交互功能,马斯克强调这不是普通的TTS,而是真正的AI语音模型。

此外,开发者还将获得API访问权限和音频转录功能,这意味着Grok-3将成为第三方应用的强大工具。

更有趣的是,xAI还计划成立一个AI游戏工作室,让开发者利用Grok-3构建游戏。这或许会成为Grok-3的一个新亮点,毕竟,用AI开发游戏,这事儿本身就挺酷的。

小结:

20万块GPU的投入,让Grok-3在性能上确实有了质的飞跃。但技术突破的本质,不仅仅是“堆料”,更在于创新。Grok-3目前的表现更像是“大力出奇迹”的结果,但未来能否真正开辟新天地,还得看它在预告的语音、游戏和API等新领域的表现。

相关资讯

马斯克发布Grok 3:20万GPU激发全球竞争新动力

2025年2月,埃隆·马斯克旗下的人工智能初创企业 xAI 正式发布了其最新大模型——Grok 3。 此次发布不仅标志着 xAI 在算力和推理能力上的重大突破,也预示着全球人工智能领域竞争格局的进一步洗牌。 颠覆性的算力升级据报道,Grok 3 的训练得益于其庞大的数据中心“Colossus”,该中心拥有约20万块英伟达 H100 GPU,相较于上一代 Grok 2,Grok 3 在计算资源上实现了10倍的飞跃。

Grok 3两周内发布,要夺回大模型王座;DeepSeek现象后,AI会改变方向…蔡崇信、李彦宏、马斯克,大佬们在迪拜峰会说了啥

出品 | 51CTO技术栈(微信号:blog51cto)2025年世界政府峰会于2月11日在阿联酋迪拜开幕,不少科技大佬都参与了峰会,并表达了自己的真知灼见。 在这个关口谈论科技创新,AI无可避免地成为了绝对的主角。 马斯克吹捧Grok 3将成为有史以来最聪明的AI,“这(指新模型发布之前)可能是其他模型最后一次超过Grok”。

Grok 3冲击诺奖级突破,成证明「黎曼猜想」关键!AI与数学家打出终极组合拳

困扰人类一个多世纪的「黎曼猜想」,如今可能正站在被破解的边缘。 这周发布的Grok 3异军突起,不仅横扫各大排行榜,更将目光投向了这个「猜想界的皇冠」。 风投机构IBC Group创始人Mario Nawfal发文称,破解黎曼猜想的竞赛正在升温,而Grok 3可能正是关键所在!