基准测试显示,Kimi k0-math数学能力可对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
感谢IT之家网友 西窗旧事 的线索投递!
IT之家 11 月 16 日消息,综合第一财经,新浪科技消息,月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型:o1-mini 和 o1-preview。
月之暗面创始人杨植麟认为,最适合让 AI 去锻炼思考能力的场景就是数学场景。IT之家获悉,在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。
杨植麟表示,k0-math 模型和更强大的 Kimi 探索版,未来几周将会分批在 Kimi 网页版和 Kimi 智能助手 App 端陆续上线。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。