Papailiopoulos

啊！DeepSeek-R1、o3-mini能解奥数题却算不了多位数乘法？

我们都知道，普通大模型的数学能力并不好，甚至可能会搞不清楚 9.8 和 9.11 哪个大。但随着 o1、o3 以及 DeepSeek-R1 等推理模型的到来，情况正在发生变化。比如 DeepSeek-R1 在竞赛数学基准 AIME 2024 上达到了 79.8% 的准确度，成就了自己头号开源推理模型的地位。

资讯热榜

AI编程实战！零基础小白如何用Cursor独立开发网站？ OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击星辰与代码：DeepSeek的发展历程 ChatGPT 新图像生成器上线，吉卜力风格图片刷屏引版权争议 Cline现已支持Gemini 2.5 Pro：AI开发迎来新助力 ChatGPT“生成吉卜力风格 AI 图”海外潮流引发版权争议，CEO Sam Altman 回应将施以限制 GPT-4o整活！3个小时、6个镜头重现吉卜力版《甄嬛传》名场面深度测评+保姆级教程！号称最好的AI图像模型：Reve Image

标签云