k1.5模型

月之暗面解密o1:Long-CoT是关键,模型思考需要"放长线"

月之暗面研究员Flood Sung近日发表万字长文,首次详细披露了k1.5模型的研发思路,并就OpenAI o1模型带来的技术启示进行深度反思。 据Flood Sung介绍,Long-CoT(长链条思维)的重要性其实早在一年多前就已被月之暗面联合创始人Tim周昕宇验证。 通过使用小型模型训练多位数运算,并将细粒度运算过程转化为长链条思维数据进行SFT(有监督微调),就能获得显著效果。
  • 1