AI推理模型
360智脑发布Tiny-R1-32B:5%参数逼近Deepseek-R1满血性能
2月24日,360智脑团队与北京大学联合研发的中等量级推理模型 Tiny-R1-32B-Preview 正式发布。 这一模型仅以5%的参数量,成功逼近了 Deepseek-R1-671B 的满血性能,展现了小模型在高效推理领域的巨大潜力。 该模型在多个关键领域的表现尤为突出。
成本不足50美元!研究人员训练出AI推理模型s1,媲美OpenAI的o1
近期,斯坦福大学和华盛顿大学的 AI 研究人员成功训练出了一款名为 s1的 AI 推理模型,训练成本不足50美元,所需的云计算信用额度也非常低。 这项研究成果于上周五发布,表明 s1在数学和编程能力测试上表现不逊于 OpenAI 的 o1模型和 DeepSeek 的 R1模型。 s1的代码和数据已在 GitHub 上公开,供其他研究者使用。
- 1