消息称 Meta 成立 4 个小组研究 DeepSeek,基于此来改进自家 Llama

据 Information 网站,Facebook 母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。
感谢据 Information 网站,Facebook 母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。

消息称 Meta 成立 4 个小组研究 DeepSeek,基于此来改进自家 Llama

其中两个小组正在试图了解幻方量化如何降低训练和运行 DeepSeek 的成本;第三个研究小组则正在研究幻方量化可能使用了哪些数据来训练其模型;第四个小组正在考虑基于 DeepSeek 模型属性重构 Meta 模型的新技术。

1 月 20 日,DeepSeek-R1 推理大模型正式发布。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

AI在线注意到,今日 Deepseek 应用已登顶苹果中国地区和美国地区应用商店免费 App 下载排行榜,在美区下载榜上超越了 ChatGPT。

相关资讯

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。 」DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。 最先陷入恐慌的,似乎是同样推崇开源的 Meta。

Meta 首席科学家杨立昆谈 DeepSeek 震撼硅谷:这就是开源的力量

他表示:“他们提出了新想法,并基于其他人的工作进行创新。由于他们的工作是公开和开源的,所有人都能从中获益。这就是开源研究和开源技术的力量。”