月之暗面解密o1:Long-CoT是关键，模型思考需要"放长线"

2025-02-17 02:37

月之暗面研究员Flood Sung近日发表万字长文，首次详细披露了k1.5模型的研发思路，并就OpenAI o1模型带来的技术启示进行深度反思。据Flood Sung介绍，Long-CoT（长链条思维）的重要性其实早在一年多前就已被月之暗面联合创始人Tim周昕宇验证。通过使用小型模型训练多位数运算，并将细粒度运算过程转化为长链条思维数据进行SFT(有监督微调)，就能获得显著效果。

月之暗面研究员Flood Sung近日发表万字长文，首次详细披露了k1.5模型的研发思路，并就OpenAI o1模型带来的技术启示进行深度反思。

据Flood Sung介绍，Long-CoT（长链条思维）的重要性其实早在一年多前就已被月之暗面联合创始人Tim周昕宇验证。通过使用小型模型训练多位数运算，并将细粒度运算过程转化为长链条思维数据进行SFT(有监督微调)，就能获得显著效果。

然而，受限于成本考虑，月之暗面此前将重点放在了Long Context（长文本输入）的优化上。Flood Sung解释道，Long Context主要处理输入端，借助Prefill预填充和Mooncake技术，可以较好地控制成本和速度。相比之下，Long-CoT侧重输出端，需要更高的成本和更长的处理时间。

但OpenAI o1的发布让团队重新思考了技术方向的优先级。"性能才是最重要的，"Flood Sung表示，"成本和速度会随着技术进步不断优化，关键是要先实现突破性能。"基于这一认识，月之暗面已开始全面推进Long-CoT研究，致力于让模型实现更接近人类的自由思考能力。

此次技术解密文章的发布，标志着月之暗面已开始系统性地对标o1模型，并在相关领域展开实质性研究。

解密o1破解过程的万字长文:https://mp.weixin.qq.com/s/sJmT-tM3A-mglZ1d4OI80A

可灵1.5模型新升级！行业首发人脸定制模型

出品 | 51CTO技术栈（微信号：blog51cto）近日，可灵1.5模型也迎来再次升级，支持在图生视频高品质模式下，使用多达六种运镜控制方式和运动笔刷功能。最新数据显示，可灵AI用户已累计生成超5100万个视频和1.5亿张图片。图片11月25日消息，快手可灵AI在全球上线业内首个视频模型定制功能，解决了AI视频生成中人物IP（知识产权）稳定性难题。

11/26/2024 5:56:38 PM

推特热帖：k1.5 很牛，因为借鉴了 UCLA 与 CMU 合作团队的这项技术

2025 年 1 月 20 日 Kimi k1.5 正式发布，伴随着技术报告的公布，有网友表示：“这应该是全球范围内，除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧！ ”一时间，Kimi k1.5 成了话题王者。但在一个月后的 2 月 24 日，X 上出现了一篇关于 Kimi k1.5 的技术爆料帖，博主直言 k1.5 所用到的强化学习算法，其实是借鉴了自己在 24 年 5 月提出的一种名为 SPPO 的技术。

2/27/2025 2:22:00 PM

郑佳美

Kimi k1.6模型曝光：编程能力超越GPT-3，引领AI新风潮

最近，来自全球知名动态基准测试平台 LiveCodeBench 的信息显示，Kimi 最新发布的 k1.6模型在编程能力方面表现卓越，已经超越了 OpenAI 的 GPT-3（包括 o3mini 和 o1等版本），登上了性能排行榜的第一名。这一消息无疑为科技界带来了激动与期待。据月之暗面的研究员 Flood 透露，k1.6是在 k1.5的基础上进行训练和优化的，目前其性能仍在不断提升中。

2/27/2025 5:07:00 PM

AI在线

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发本地部署DeepSeek+DiFy平台构建智能体应用击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

月之暗面解密o1:Long-CoT是关键，模型思考需要"放长线"

相关资讯

可灵1.5模型新升级！行业首发人脸定制模型

推特热帖：k1.5 很牛，因为借鉴了 UCLA 与 CMU 合作团队的这项技术

Kimi k1.6模型曝光：编程能力超越GPT-3，引领AI新风潮