历史时刻：DeepSeek GitHub星数超越OpenAI，仅用时两个月

作者：机器之心

2025-02-07 05:39

开源 AI 世界的里程碑事件！我们正在见证历史：DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。截至本周五下午两点，DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万，超越了同平台中 OpenAI 最热门项目。

我们正在见证历史：DeepSeek 项目在 GitHub 上的 Star 量超过了 OpenAI。

截至本周五下午两点，DeepSeek-V3 的 Star 量已达 7.77 万，超越 OpenAI 最热门项目。

DeepSeek 星数增长

DeepSeek-V3：性能标杆的 MoE 大模型

2023 年 12 月 26 日，DeepSeek AI 发布了其最新的 MoE（混合专家）大语言模型 DeepSeek-V3，成为开源 AI 领域的新标杆，引发全球热议。

该模型采用动态注意力机制（Dynamic Attention Mechanism），有效优化文本生成质量。其 6710 亿参数的 MoE 架构仅激活 370 亿参数，大幅降低计算成本。

训练成本仅为同类闭源模型的 1/20，总计花费 278.8 万 H800 GPU 小时（训练成本 557.6 万美元），远低于 Llama 3 的 3930 万 H100 GPU 小时。

DeepSeek V3 训练成本对比

DeepSeek-R1：强化学习驱动 AI 革命

2024 年 1 月 23 日，DeepSeek 在 V3 的基础上，结合强化学习（Reinforcement Learning），发布了 DeepSeek-R1，彻底改变了 AI 研究方向。

DeepSeek R1 性能媲美 OpenAI o1，且无需大量监督微调，仅靠强化学习就能赋予 LLM 强推理能力，引起 AI 业界广泛关注。

DeepSeek-R1 强化学习模型

DeepSeek 生态扩展：云平台纷纷接入

虽然 OpenAI 未开源其最新基础模型，目前其热门项目仍是 Whisper 语音识别和 openai-cookbook。

其他开源大模型 Star 数对比：

Llama 最高 5.75 万 Star
阿里云 Qwen2.5：1.49 万 Star
零一万物 Yi：7800 Star

开源大模型 Star 对比

全球 AI 生态的未来：DeepSeek 的影响

DeepSeek-V3 和 R1 促进了 AI 研究的新方向，尤其是强化学习方法 GRPO 的应用前景广受关注。

目前，DeepSeek 已被多家云服务提供商集成：

国内：阿里云、华为云、腾讯云、百度智能云、360 数字安全等
海外：英伟达、亚马逊、微软云服务

随着 DeepSeek 开源生态的扩大，我们或将见证生成式 AI 更快的发展！

历史时刻：DeepSeek GitHub星数超越OpenAI，仅用时两个月

DeepSeek-V3：性能标杆的 MoE 大模型

DeepSeek-R1：强化学习驱动 AI 革命

DeepSeek 生态扩展：云平台纷纷接入

全球 AI 生态的未来：DeepSeek 的影响

相关资讯

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

爆肝48小时！学会这8招，让DeepSeek变得超好用！

评论

历史时刻：DeepSeek GitHub星数超越OpenAI，仅用时两个月

DeepSeek-V3：性能标杆的 MoE 大模型

DeepSeek-R1：强化学习驱动 AI 革命

DeepSeek 生态扩展：云平台纷纷接入

全球 AI 生态的未来：DeepSeek 的影响

相关资讯

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

爆肝48小时！学会这8招，让DeepSeek变得超好用！

评论

分享