Humanity&#39

DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页

随着 AI 大模型在一个又一个的任务上达到乃至超越人类水平,人类文明似乎已经进入了与 AI 共生的时代。  为了跟踪 AI 的发展进度,适当的基准必不可少。 但现在,由于 AI 发展的速度实在太快,已有的基准已经开始不够用了。
  • 1