Kimi 最新模型 k1.6 登顶,编程能力超越 GPT o3mini、o1

月之暗面联合创始人张予彤在朋友圈表示,“k1.6 还没有发布,但看到 LiveCodeBench 的成绩感到开心,期待智能模型的持续进化。”
感谢Kimi 最新模型 k1.6 今日曝光。据全球动态基准测试平台 LiveCodeBench,Kimi k1.6 超过 GPT o3mini、o1 等模型,在代码生成测试中实现登顶。

Kimi 最新模型 k1.6 登顶,编程能力超越 GPT o3mini、o1

月之暗面研究员 Flood 在社交平台表示,k1.6 是基于 k1.5 做的训练,性能还在提升中

月之暗面联合创始人张予彤在朋友圈表示,“k1.6 还没有发布,但看到 LiveCodeBench 的成绩感到开心,期待智能模型的持续进化。”

月之暗面旗下 Kimi 是 DeepSeek 崛起之前,国内话题度最高的来自创业公司的 AI 产品之一。然而 DeepSeek 以开源低成本高性能爆火后,消息称月之暗面决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。

知情人士表示,DeepSeek 的爆火对月之暗面内部而言是一番不小的刺激。团队复盘后认为还是要坚持基础模型 SOTA(AI在线注:State-of-the-art,当前最佳)。接下来,团队可能会重新训练基础模型,同时抓紧应用层的机会,内部选中的一个产品方向是 DeepResearch,这是 OpenAI 在 2 月发布的一款面向深度研究领域的智能体产品。

相关资讯

DeepSeek R1 Preview 模型亮相,代码能力与 OpenAI o1 相当且确认开源

还未正式发布,已在代码基准测试 LiveCodeBench 霸榜前三,表现与 OpenAI o1 的中档推理设置相当。

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术

2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。

微软官宣 All in 智能体、Copilot SWE Agent 首曝光,阿尔特曼预警 2025 编程巨变

2025 年,软件工程要彻底变天了。先有奥特曼预言,后有微软下场 All in 智能体。刚刚,首个自主 SWE 智能体面世,不仅会主动改 bug 修复错误,还能自主提交 PR 评论。