月之暗面发布 k0-math 数学推理模型，能力对标 OpenAI o1

作者：清源

2024-11-16 04:15

基准测试显示，Kimi k0-math数学能力可对标OpenAI o1系列可公开使用的两个模型：o1-mini和o1-preview。

感谢IT之家网友西窗旧事的线索投递！

IT之家 11 月 16 日消息，综合第一财经，新浪科技消息，月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示，Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型：o1-mini 和 o1-preview。

月之暗面创始人杨植麟认为，最适合让 AI 去锻炼思考能力的场景就是数学场景。IT之家获悉，在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中，k0-math 初代模型成绩超过 o1-mini 和 o1-preview。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中，k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。

杨植麟表示，k0-math 模型和更强大的 Kimi 探索版，未来几周将会分批在 Kimi 网页版和 Kimi 智能助手 App 端陆续上线。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

相关标签：

Kimi 月之暗面

相关资讯

一口气读完甄嬛传剧本、大部头医书：月之暗面200万字上下文Kimi开启内测

一口气读完甄嬛传剧本、大部头医书：月之暗面200万字上下文Kimi开启内测

半年时间，月之暗面把 AI 模型支持的上下文长度提升了一个数量级，实现了 200 万字上下文的「无损压缩」。一个能读 200 万字的 AI 助手是什么概念？这意味着，它可以一口气读完整个《甄嬛传》剧本，然后和你讨论剧情。或者一口气读完一本厚厚的中医诊疗手册，给你提出诊疗建议。对于人类来说，成为某个领域的专家可能需要 10000 个小时的学习，但对于这个 AI 来说，只需要 10 分钟就够了。将甄嬛传全集几十万字的剧本传给 AI 助手，然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。它能在不同时间段、各个场景的故事

AI在用| 又是一年毕业季，给你找了个论文搭子Kimi+

AI在用| 又是一年毕业季，给你找了个论文搭子Kimi+

机器之能报道编辑：山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。近日，月之暗面的 Kimi 迎来大更新，不仅 Logo 变得更卡通俏皮，还上线了「Kimi 」功能。所谓「Kimi 」，就是一个 AI 私人助理，有点类似于 OpenAI 的 GPTs，可以为用户提供更多个性化的 AI 服务，例

月之暗面创始人杨植麟：AI 的下一个重要方向是具备“思考能力”

月之暗面创始人杨植麟：AI 的下一个重要方向是具备“思考能力”

据新浪科技报道，杨植麟认为，接下来AI发展的很重要的一个方向是使AI能够具备思考的能力，数学产品则最适合让AI得到锻炼。

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架阿里云与黑芝麻智能完成大模型车载芯片级适配类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手 AI模拟细胞，走向全新虚拟生命，斯坦福团队呼吁是时候走出全新的一步了

标签云