月之暗面解密o1:Long-CoT是关键,模型思考需要"放长线"

月之暗面研究员Flood Sung近日发表万字长文,首次详细披露了k1.5模型的研发思路,并就OpenAI o1模型带来的技术启示进行深度反思。 据Flood Sung介绍,Long-CoT(长链条思维)的重要性其实早在一年多前就已被月之暗面联合创始人Tim周昕宇验证。 通过使用小型模型训练多位数运算,并将细粒度运算过程转化为长链条思维数据进行SFT(有监督微调),就能获得显著效果。

月之暗面研究员Flood Sung近日发表万字长文,首次详细披露了k1.5模型的研发思路,并就OpenAI o1模型带来的技术启示进行深度反思。

据Flood Sung介绍,Long-CoT(长链条思维)的重要性其实早在一年多前就已被月之暗面联合创始人Tim周昕宇验证。通过使用小型模型训练多位数运算,并将细粒度运算过程转化为长链条思维数据进行SFT(有监督微调),就能获得显著效果。

QQ20250217-143705.png

然而,受限于成本考虑,月之暗面此前将重点放在了Long Context(长文本输入)的优化上。Flood Sung解释道,Long Context主要处理输入端,借助Prefill预填充和Mooncake技术,可以较好地控制成本和速度。相比之下,Long-CoT侧重输出端,需要更高的成本和更长的处理时间。

但OpenAI o1的发布让团队重新思考了技术方向的优先级。"性能才是最重要的,"Flood Sung表示,"成本和速度会随着技术进步不断优化,关键是要先实现突破性能。"基于这一认识,月之暗面已开始全面推进Long-CoT研究,致力于让模型实现更接近人类的自由思考能力。

此次技术解密文章的发布,标志着月之暗面已开始系统性地对标o1模型,并在相关领域展开实质性研究。

解密o1破解过程的万字长文:https://mp.weixin.qq.com/s/sJmT-tM3A-mglZ1d4OI80A

相关资讯

可灵1.5模型新升级!行业首发人脸定制模型

出品 | 51CTO技术栈(微信号:blog51cto)近日,可灵1.5模型也迎来再次升级,支持在图生视频高品质模式下,使用多达六种运镜控制方式和运动笔刷功能。 最新数据显示,可灵AI用户已累计生成超5100万个视频和1.5亿张图片。 图片11月25日消息,快手可灵AI在全球上线业内首个视频模型定制功能,解决了AI视频生成中人物IP(知识产权)稳定性难题。

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术

2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧! ”一时间,Kimi k1.5 成了话题王者。 但在一个月后的 2 月 24 日,X 上出现了一篇关于 Kimi k1.5 的技术爆料帖,博主直言 k1.5 所用到的强化学习算法,其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。

Kimi k1.6模型曝光:编程能力超越GPT-3,引领AI新风潮

最近,来自全球知名动态基准测试平台 LiveCodeBench 的信息显示,Kimi 最新发布的 k1.6模型在编程能力方面表现卓越,已经超越了 OpenAI 的 GPT-3(包括 o3mini 和 o1等版本),登上了性能排行榜的第一名。 这一消息无疑为科技界带来了激动与期待。 据月之暗面的研究员 Flood 透露,k1.6是在 k1.5的基础上进行训练和优化的,目前其性能仍在不断提升中。