突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

作者：新智元

2025-02-20 01:44

世界首个20万块GPU（另有说法是10万）训出的Grok-3，官宣人人可用了！ DeepSearch、Think两大模式，同时上线。唯独遗憾的是，Big Brain还在雪藏。

世界首个20万块GPU（另有说法是10万）训出的Grok-3，官宣人人可用了！

DeepSearch、Think两大模式，同时上线。唯独遗憾的是，Big Brain还在雪藏。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

Grok 3全部免费开放，直到服务器崩溃为止

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

一边，AI科技圈开发者激动地奔走相告，另一边，OpenAI和xAI直接打起来了。

先是本科辍学的OpenAI研究员Aidan McLaughlin，谴责Grok-3在评测中用基于64个样本进行多数投票刷分。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

灰色阴影区域表示在64个样本下的多数投票一致性表现

随后，OpenAI应用研究主管Boris Power更是丝毫不留情面，「看到Grok团队在评估中作弊和欺骗的动机，真令人失望。简而言之，o3-mini在每个评估中都优于Grok-3。Grok-3确实是一个不错的模型，但没有必要过度宣传」。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

对此，xAI高级工程师Igor Babuschkin，「完全不对。我们只是用了和你们一样的方法」。

从下图中不难看出，o1-preview和o1确实有同款「阴影」。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

不过，根据McLaughlin的解释道，OpenAI o3-mini并没有使用这种方法。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

OpenAI与xAI针锋相对，也不是一天两天了，好在他们的竞争，利好所有人。

话不多说，直接上实测吧。

一波实测来了

就在昨天，「Grok-3答错9.11和9.9哪个大」这个话题，还一度冲到热搜话题前几。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

我们实测发现，果然，如果用同样的方式问，Grok-3还是会答错。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

而在开启Think模式后，它只思考了4秒就轻松做对了！

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

有趣的是，如果把prompt换成「9.11和9.9谁大」，Grok-3在普通模式下也能给出正确答案了。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

然而，在开启Think模式之后，Grok-3却为了这个prompt想了足足34秒……

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

有网友实测Grok-3 二十四小时后，发现它的几大优点——

对代码真的很好；
上下文窗口非常非常长；
能充分利用上下文；
擅长遵循指令；
而且有一个非常令人愉快的性格。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

在代码工作流中，Grok-3表现得十分丝滑。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

有人用Grok-3做了个带声音的视频游戏，主题是马斯克使用激光、火箭和婴儿来摧毁美国政府。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

耗时一个小时后，Grok-3成功做出了这个游戏。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

网友只用5分钟，就写出了一款大战小行星的游戏。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

另一种形式的游戏如下。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

甚至有人只在几分钟内，就用Grok-3和Imagen 3、tripoai等工具，创建了下面这些逼真的3D模型。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

有人总结了一份Grok-3全部潜能的完整速查表，因为它「强大到疯狂」，但大多数人还不知道该如何有效使用。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

照片级真实的图像

Grok-3是不是世界上最聪明的AI还有待考察，但它现在确实可以生成照片级真实的图像。

X网友Min Choi分享了10个案例。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

在海滩上的随意自拍
疯狂的细节，你可以看到每根羽毛
SpaceX的火箭
图像细节程度简直令人惊异的眼睛特写
月球网络探测车
在纽约地铁上的自拍
走秀的猫咪
微型小熊猫的微距镜头
一位年轻白化男子手持绿色小狗的文艺复兴风格肖像
水池边的自拍

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

对此，有网友说，我们现在已经很难分清图片上的是不是现实了。

「我们已经跨越了那个门槛！」，Min说。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

不过也有网友发现了它的一些缺点，比如生成正在倒立的人物时，依然会出现匪夷所思的问题。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

网友实测，Grok-3在2024麻省理工积分大赛中，直接干掉o1 Pro和人类选手，并在1分02秒内解决了这个问题！

就连马斯克称赞道，简直太酷了。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

高级语音模式，期待住了

下一步，Grok-3或许还会推出高级语音模式，一些拿到灰度测试的网友晒出了自己的实测。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

它不仅支持联网模式，还支持自定义语音模式、语音转录、音频分享等功能。

目前，默认的是Sal男性声音。此外，还有一个Ara女性声音可选。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

用户界面底部有三个键：关闭退出语音模式；静音；分享

如下是转录功能的展示。

突发，Grok-3免费上线！答对9.11和9.9谁大，1分攻克MIT积分难题

下面视频中，Grok-3不仅会唱生日快乐歌，还会笑。

相关标签：

AI 模型 Grok-3

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布：地球上最聪明的人工智能

马斯克称 Grok 3 将于 2 月 18 日发布：地球上最聪明的人工智能

马斯克在社交平台 X 上表示，Grok 3 大模型将于太平洋时间周一晚上 8 点（IT之家注：北京时间 2 月 17 日 12 点）发布，届时将进行现场演示，马斯克称其为地球上最聪明的人工智能。

“地表最强”Grok 3震撼登场，马斯克演示却“小翻车”，网友调侃：加上擎天柱才是AGI！几个月后还将开源！

“地表最强”Grok 3震撼登场，马斯克演示却“小翻车”，网友调侃：加上擎天柱才是AGI！几个月后还将开源！

出品 | 51CTO技术栈（微信号：blog51cto）编辑 | 伊风、言征跳票多次！ Grok 3终于来了！此前，DeepSeek创造的破圈奇迹，把硅谷的大模型公司全部笼罩在阴影之下。

马斯克发布Grok 3：20万GPU激发全球竞争新动力

马斯克发布Grok 3：20万GPU激发全球竞争新动力

2025年2月，埃隆·马斯克旗下的人工智能初创企业 xAI 正式发布了其最新大模型——Grok 3。此次发布不仅标志着 xAI 在算力和推理能力上的重大突破，也预示着全球人工智能领域竞争格局的进一步洗牌。颠覆性的算力升级据报道，Grok 3 的训练得益于其庞大的数据中心“Colossus”，该中心拥有约20万块英伟达 H100 GPU，相较于上一代 Grok 2，Grok 3 在计算资源上实现了10倍的飞跃。

资讯热榜

AI编程实战！零基础小白如何用Cursor独立开发网站？星辰与代码：DeepSeek的发展历程 OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击腾讯元宝电脑版/网页版再次更新：支持实时预览 HTML 代码活性提升65倍，山大新AI工具定向进化高活性酶，外部数据集验证成功率达80% Cline现已支持Gemini 2.5 Pro：AI开发迎来新助力 ChatGPT 新图像生成器上线，吉卜力风格图片刷屏引版权争议 GPT-4o的P图全家桶有多强？连Midjourney CEO都坐不住了

标签云

评论