号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大

2025-02-19 12:07

昨天马斯克及其 xAI 团队在直播中正式发布了 Grok 3，此前马斯克通过持续的预热宣传，将外界对 Grok3 的期待值推向了前所未有的高度。马斯克称 Grok 3 为，然而其实际表现似乎对不起这个名号。

感谢昨天马斯克及其 xAI 团队在直播中正式发布了 Grok 3，此前马斯克通过持续的预热宣传，将外界对 Grok3 的期待值推向了前所未有的高度。马斯克称 Grok 3 为，然而其实际表现似乎对不起这个名号。

AI在线注意到，在发布会上，马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型，并计划将其应用于 SpaceX 的火星任务计算，甚至预测未来三年内将实现诺贝尔奖级别的突破。

但 Grok 3 的实际测试表现却让人大跌眼镜。发布后，一些媒体测试了最新的 Beta 版 Grok 3，并提出了那个经典的用来刁难大模型的问题：“9.11 与 9.9 哪个大？”遗憾的是，号称目前最聪明的 Grok 3，仍然无法正确回答这个问题，被网友戏称为“天才不愿意回答简单问题”。

号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大

此外，在 xAI 发布会直播中，在分析游戏《流放之路 2》的职业与升华效果时，Grok 3 也给出了大量错误答案，并且马斯克也没有看出这些明显的错误。

尽管在官方 PPT 中，Grok3 在大模型竞技场 Chatbot Arena 中看似“遥遥领先”，但实际上其与 DeepSeek R1 和 GPT4.0 的差距仅为 1% 到 2%。

号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大

马斯克在发布会上透露，Grok 3 使用了超过 20 万张 H100 芯片，总训练小时数达到两亿小时。作为对比，DeepSeek V3 仅使用 2000 张 H800 芯片训练两个月，其性能却与 Grok 3 相差无几。这表明，随着模型规模的不断扩大，性能提升的边际效应已经显现。

号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大

值得一提的是，马斯克在社交媒体上表示，当前的 Grok 3 仅是测试版，完整版将在未来几个月推出，并邀请用户反馈使用问题。

马斯克称 Grok 3 将于 2 月 18 日发布：地球上最聪明的人工智能

马斯克在社交平台 X 上表示，Grok 3 大模型将于太平洋时间周一晚上 8 点（IT之家注：北京时间 2 月 17 日 12 点）发布，届时将进行现场演示，马斯克称其为地球上最聪明的人工智能。

2/16/2025 11:23:49 AM

远洋

马斯克宣布 Grok 3 语音模式早期测试版已上线

马斯克宣布Grok 3语音模式早期测试版已上线，用户可通过自然语言与AI对话，提供两种声音和自定义功能。#Grok3 #AI语音模式#

2/23/2025 12:24:04 PM

远洋

感谢特斯拉 CEO 埃隆・马斯克（Elon Musk）周一预测，AI 在明年或 2026 年就能超越最聪明的人类。马斯克当地时间周一在社交媒体平台 X（以前称为推特）语音空间上接受了挪威主权财富基金首席执行官 Nicolai Tangen 的采访。当被问及 AGI（通用人工智能）的发展时间表时，马斯克表示，如果你将 AGI 定义为比最聪明的人更聪明，我想可能是明年，或者两年内。AGI 为 Artificial General Intelligence 的首字母缩写，意为人工通用智能。通用人工智能是一个人工智能理论研

4/9/2024 11:44:05 AM

沛霖（实习）

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布：地球上最聪明的人工智能

马斯克宣布 Grok 3 语音模式早期测试版已上线

马斯克预测 AI 在两年内能超越最聪明的人类