ARC-AGI - AI在线

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩，属实给人类带来了不少震撼。但有人专门研究了它不会做的题之后，有了更有趣的发现——o3之所以不会做这些题，原因可能不是因为太难，而是题目的规模太大了。来自英国的ML工程师Mikel Bober-Irizar（不妨叫他米哥），对ARC题目进行了细致观察。

OpenAI公布下一代模型，o1之后直接o3！ “双12”直播活动最后一天，终于来了个大的，奥特曼本人也再次现身直播间。 o3相比o1最突出的成绩，一是顶尖程序员竞赛CodeForces分数超过2700，人类超过这个分数的目前只有不到200个。