AI在线 AI在线

昆仑万维开源Skywork-OR1系列模型 数学代码能力出色

作者:AI在线
2025-04-14 09:00
4月13日,昆仑万维天工团队宣布推出全新升级的Skywork-OR1(Open Reasoner1)系列模型,这是继2025年2月发布首款中文逻辑推理大模型Skywork-o1之后的又一力作。 该系列模型在同等参数规模下实现了业界领先的推理性能,进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。 此次开源的Skywork-OR1系列模型包括三款高性能模型:Skywork-OR1-Math-7B聚焦数学领域的专项模型,同时也具备较强的代码能力;Skywork-OR1-7B-Preview融合数学与代码能力,兼具通用性与专业性;Skywork-OR1-32B-Preview则是面向更高复杂度任务、具备更强推理能力的旗舰版本。

4月13日,昆仑万维天工团队宣布推出全新升级的Skywork-OR1(Open Reasoner1)系列模型,这是继2025年2月发布首款中文逻辑推理大模型Skywork-o1之后的又一力作。该系列模型在同等参数规模下实现了业界领先的推理性能,进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。

此次开源的Skywork-OR1系列模型包括三款高性能模型:Skywork-OR1-Math-7B聚焦数学领域的专项模型,同时也具备较强的代码能力;Skywork-OR1-7B-Preview融合数学与代码能力,兼具通用性与专业性;Skywork-OR1-32B-Preview则是面向更高复杂度任务、具备更强推理能力的旗舰版本。

微信截图_20250414084641.png

在竞赛编程任务中,通用模型Skywork-OR1-7B-Preview与Skywork-OR1-32B-Preview在LiveCodeBench数据集上均取得了同等参数规模下的最优性能。Skywork-OR1-32B-Preview表现尤为突出,其代码生成与问题求解能力已接近DeepSeek-R1(参数规模高达671B),在大幅压缩模型体量的同时实现了卓越的性价比,充分展现出天工团队训练策略的先进性。

Skywork-OR1系列模型的显著性能突破离不开天工团队在模型后训练阶段的长期自研积累与技术深耕。在数据选择和预处理方面,Skywork-OR1构建了一个高质量数学和代码数据集,用于强化学习以提升模型在数学和代码领域的推理能力。团队根据可验证性、正确性与挑战性三个标准进行初步数据筛选,剔除无法自动验证的证明类题目、有误题目和缺少unit test的代码问题。在数据过滤方面,为避免“全对”或“全错”现象对策略学习无效,每道题进行了多轮采样并验证答案,并基于模型表现过滤难度极端的题目。

此外,Skywork-OR1采用了Group Relative Policy Optimization (GRPO)进行模型训练,并引入了训练时数据优化、训练Pipeline优化、训练时模型探索和训练Loss优化等多项优化措施。

Skywork-OR1系列开源地址:https://github.com/SkyworkAI/Skywork-OR1

相关资讯

昆仑万维「天工4.0」携超强o1/4o霸气上线!强推理+实时语音,免费无限体验

2024 年 12 月中旬,前 OpenAI 首席科学家 Ilya Sutskever 在 NeurIPS 大会上发表了一个惊人的观点:Scaling law 正在放缓,预训练时代即将结束,未来的研究方向将更加注重推理能力的提升。 如果 Ilya 的预测为真,那我们现在其实正在经历一场大模型发展路线的范式转移。 在国内,不少从业者也观察到了类似趋势。
1/6/2025 1:01:00 PM
机器之心

开启多模态思考新时代:昆仑万维开源 R1V 视觉思维链推理模型

昆仑万维今日正式开源首款工业界多模态思维链推理模型 Skywork R1V,成为中国第一个开源「多模态推理模型」的企业,即日起开源模型权重和技术报告。
3/18/2025 5:04:46 PM
归泷(实习)

昆仑万维宣布 4 月 17 日发布并开源“天工大模型 3.0”:4000 亿参数,号称性能超 Grok 1.0

感谢昆仑万维集团日前通过官方公众号宣布,在“天工”大模型发布一周年之际,天工大模型 3.0 将于 4 月 17 日正式开启公测,并将同步选择开源。“天工 3.0”采用 4000 亿级参数 MoE(混合专家模型),官方称是全球模型参数最大、性能最强的 MoE 模型之一,性能超过 Grok 1.0。据介绍,相较于上一代“天工 2.0”MoE 大模型,“天工 3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有“惊人的”性能提升,其模型技术知识能力提升超过 20%,数学 / 推理 / 代
4/2/2024 9:08:47 AM
清源