月之暗面发布 k0-math 数学推理模型,能力对标 OpenAI o1

基准测试显示,Kimi k0-math数学能力可对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
感谢IT之家网友 西窗旧事 的线索投递!

IT之家 11 月 16 日消息,综合第一财经,新浪科技消息,月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型:o1-mini 和 o1-preview

月之暗面创始人杨植麟认为,最适合让 AI 去锻炼思考能力的场景就是数学场景。IT之家获悉,在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%

杨植麟表示,k0-math 模型和更强大的 Kimi 探索版,未来几周将会分批在 Kimi 网页版和 Kimi 智能助手 App 端陆续上线。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关资讯

一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测

半年时间,月之暗面把 AI 模型支持的上下文长度提升了一个数量级,实现了 200 万字上下文的「无损压缩」。一个能读 200 万字的 AI 助手是什么概念?这意味着,它可以一口气读完整个《甄嬛传》剧本,然后和你讨论剧情。或者一口气读完一本厚厚的中医诊疗手册,给你提出诊疗建议。对于人类来说,成为某个领域的专家可能需要 10000 个小时的学习,但对于这个 AI 来说,只需要 10 分钟就够了。将甄嬛传全集几十万字的剧本传给 AI 助手,然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。它能在不同时间段、各个场景的故事

AI在用| 又是一年毕业季,给你找了个论文搭子Kimi+

机器之能报道编辑:山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。近日,月之暗面的 Kimi 迎来大更新,不仅 Logo 变得更卡通俏皮,还上线了「Kimi 」功能。所谓「Kimi 」,就是一个 AI 私人助理,有点类似于 OpenAI 的 GPTs,可以为用户提供更多个性化的 AI 服务,例

月之暗面创始人杨植麟:AI 的下一个重要方向是具备“思考能力”

据新浪科技报道,杨植麟认为,接下来AI发展的很重要的一个方向是使AI能够具备思考的能力,数学产品则最适合让AI得到锻炼。