从编码到创意写作 xAI Grok-3 击败 GPT4.5全能登顶大模型竞技场

xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。 这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。  xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。

xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。

 xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。Grok-3获得了超过3,000票,并总体上与第一名并列。它在困难提示、编码任务、数学问题、创意写作、指令遵循以及处理较长查询方面表现尤为出色。Chatbot Arena 是一个通过人类偏好进行大规模语言模型(LLM)评估的众包平台,使用 Elo 评级系统为模型排名,提供全面的性能衡量。

QQ20250304-093515.png

这一成就标志着 xAI 和其创始人埃隆·马斯克在 AI 发展领域的显著进展。马斯克一直倡导开发强大且与人类价值观相符的 AI。Grok-3在这一基准测试中的成功凸显了模型的能力,以及 xAI 在竞争激烈的 AI 领域的进步。

值得注意的是,“grok-3preview-02-24”被描述为最新生产模型,但名称中包含“preview”,这可能表明它仍处于测试阶段,这一细节可能引发对其完全生产就绪性的讨论。

相关资讯

Figure 02 人形机器人明日发布,创始人放豪言称其“地表最强”

北京时间 8 月 2 日晚间,由 OpenAI 等公司支持的 Figure AI 发布了旗下新一代人形机器人 Figure 02 的预告片,并宣布将于 8 月 6(明)日正式发布。 预告片的重点在于这款机器人的硬件。其展示了 Figure 02 的关节、肢体细节,手指运动相当灵活,关节活动度可达 195°、扭矩额定值高达 150N・m。Figure AI 创始人 Brett Adcock 更是宣称,Figure 02 将是地球上最先进的人形机器人。该公司曾在今年 3 月展示了 Figure 01 的技能和参数。据A

Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定

这是Karpathy「Neural Networks:zero to hero」系列视频的最新内容。AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。视频主题为「让我们来复现 GPT-2(1.24 亿参数)」。Karpathy 表示,此次视频之所以这么长,是因为它很全面:从空文件开始,最后得到一个 GPT-2(124M)模型。具体实现步骤包括如下:首先构建 GPT-2 网络。然后对其进行优化,以便快速训练。然后通过参考 GPT-2 和 GPT-3 论文来设置训练运行优化和

Figure AI把「终结者」造出来了

能语音对话,VLM 视觉,每天工作 20 小时。总会有这一天,但我们没想到来的居然这么快。北京时间 8 月 6 日晚,硅谷著名具身智能创业公司 Figure 正式发布了自己的新一代人形机器人 Figure 02。除了样子够科幻,这种机器人也有着足够通用的智能,它可以与人类实时对话,自动学习如何装配零件。事实上,Figure 02 正在宝马位于 Spartanburg 的工厂实习工作,我们仿佛已经进入了未来。Figure 工程和设计团队完成了对 Figure 02 硬件和软件的彻底重新设计。在人工智能、视觉、电池、电