人工智能基准测试

OpenAI 员工公开质疑 xAI:Grok 3 基准测试结果存在误导

近期,关于人工智能基准测试的争论在公众视野中愈演愈烈。 OpenAI 的一名员工指责马斯克创办的 AI 公司 xAI 发布了误导性的 Grok3基准测试结果,而 xAI 的联合创始人伊戈尔・巴布申金则坚称公司没有问题。 事件的起因是 xAI 在其博客上发布了一张图表,展示了 Grok3在 AIME2025测试中的表现。
  • 1