月之暗面发布 k0-math 数学推理模型，能力对标 OpenAI o1

基准测试显示，Kimi k0-math数学能力可对标OpenAI o1系列可公开使用的两个模型：o1-mini和o1-preview。

感谢IT之家网友西窗旧事的线索投递！

IT之家 11 月 16 日消息，综合第一财经，新浪科技消息，月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示，Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型：o1-mini 和 o1-preview。

月之暗面创始人杨植麟认为，最适合让 AI 去锻炼思考能力的场景就是数学场景。IT之家获悉，在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中，k0-math 初代模型成绩超过 o1-mini 和 o1-preview。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中，k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。

杨植麟表示，k0-math 模型和更强大的 Kimi 探索版，未来几周将会分批在 Kimi 网页版和 Kimi 智能助手 App 端陆续上线。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

{{userData.name}}已认证

月之暗面发布 k0-math 数学推理模型，能力对标 OpenAI o1

SU 哈佛亚马逊最新研究：量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了

月之暗面创始人杨植麟：AI 的下一个重要方向是具备“思考能力”

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

平安人寿ChatBI：大模型智能化报表的深度实践

ChatGPT遇到这些人名开始自闭，OpenAI回应了

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！