再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型

Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。

自从 DeepSeek 发布了与 OpenAI o1 竞争的开源推理模型 R1 以来,已经过去了大约一周,引发全球关注。

现在,AI 大模型社区 Hugging Face 宣布了 Open-R1 项目,计划填补 DeepSeek R1 未开源的部分组件,为这个全球热潮“再加一把火”。

再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型

根据 Hugging Face 的说法,虽然 DeepSeek 使用的权重是已知的,但用于训练模型的数据集和代码是未知的。通过 Open-R1,Hugging Face 希望填补这些空白

Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。

Hugging Face 表示,它计划建立的合成数据集将不仅关注数学,还将探索其他领域,为科学等其他领域提供帮助。

AI在线附 Open-R1 项目地址如下:

https://github.com/huggingface/open-r1

相关资讯

DeepSeek R1 Preview 模型亮相,代码能力与 OpenAI o1 相当且确认开源

还未正式发布,已在代码基准测试 LiveCodeBench 霸榜前三,表现与 OpenAI o1 的中档推理设置相当。

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。 从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。