DeepSeek

软件工程师购得“OGOpenAI.com”域名，将其重定向至 DeepSeek 官网

一位软件工程师购得了“OGOpenAI.com”域名，并将其重定向至中国人工智能实验室 DeepSeek 的官网。DeepSeek 近期在开源 AI 领域引起了大量关注，其发布的先进开源 AI 模型获得广泛赞誉。

1/23/2025 2:32:09 PM

远洋

DeepSeek-R1 最新发布，剑指 OpenAI o1

昨日 1 月20 号，DeepSeek 团队推出了全新开源模型 DeepSeek-R1，一夜之间模型就在 Github 上收获了 4k star，引爆大模型领域。而这次的 R1 模型一出，不仅反驳了之前蒸馏 OpenAI o1 的说法，官方更是直接下场表示：“我们可以和开源版的 o1 打成平手”。值得一提的是， R1 突破了以往的模型训练形式，完全没有使用任何 SFT 数据，仅通过纯粹的 RL 来训练模型，这一点说明 R1 已经学会了自己思考问题——这实则更符合人类的思维规则。

1/22/2025 10:48:00 AM

郑佳美

DeepSeek-R1 模型发布，性能对标 OpenAI o1 正式版

幻方量化旗下 AI 公司深度求索（DeepSeek）今日正式发布 DeepSeek-R1 模型，并同步开源模型权重。据官方介绍，DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

1/20/2025 9:37:38 PM

远洋

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

还未正式发布，已在代码基准测试 LiveCodeBench 霸榜前三，表现与 OpenAI o1 的中档推理设置相当。

1/19/2025 10:19:33 PM

汪淼

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队？

1/6/2025 7:45:00 AM

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

在AI技术日新月异的今天，大型语言模型已成为推动AI发展的重要力量。 2024年12月26日，DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。这款开源模型采用了高达6710亿参数的混合专家（MoE）架构，每秒能够处理60个token，比V2快了3倍。

1/3/2025 7:38:33 PM

张诚

DeepSeek的V3，爆火了

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）上周四，12月26日那个晚上非常不平凡，一件大事注定要被AI界写进里程碑。一夜之间，全球开源界最强模型不再是Llama了，而是中国开源界的新星DeepSeek最新研发的前言模型V3，甚至可以比肩世界顶尖的闭源模型。根据DeeSeek披露的基准测试分数，简单来讲，八个字：开源最强，闭源比肩。

12/30/2024 8:32:36 PM

言征

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流信息不实

据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。

12/30/2024 5:03:59 PM

浩渺

国产大模型 DeepSeek-V3 开源：6710 亿参数自研 MoE，性能和 GPT-4o 不分伯仲

“深度求索”官方公众号昨日（12 月 26 日）发布博文，宣布上线并同步开源 DeepSeek-V3 模型，用户可以登录官网 chat.deepseek.com，与最新版 V3 模型对话。

12/27/2024 8:02:05 AM

故渊

雷军在线挖人，传年薪千万级！DeepSeek 关键骨干罗福莉已离职加入小米，或领军小米大模型团队；小米将在大模型上奋起直追！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）AI圈的大新闻，雷总在线挖人，小米要发力大模型了！知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。而且雷总已经初战告捷——帮小米赢得了DeepSeek的关键骨干罗福莉。

12/23/2024 12:33:42 PM

伊风

消息称雷军重金招募大模型领军人才，DeepSeek 罗福莉将加入小米

知情人士称，雷军认为小米在大模型领域发力太晚，于是亲自挖人，重金招募能够领军小米大模型的人才，支付的薪酬水平在千万元级别。（第一财经新皮层）

12/20/2024 10:48:21 PM

沛霖（实习）

DeepSeek-VL2 AI 视觉模型开源：支持动态分辨率、处理科研图表、解析各种梗图等

DeepSeek 官方公众号昨日（12 月 13 日）发布博文，宣布开源 DeepSeek-VL2 模型，在各项评测指标上均取得了极具优势的成绩，官方称其视觉模型正式迈入混合专家模型（Mixture of Experts，简称 MoE）时代。

12/14/2024 10:20:38 AM

故渊

DeepSeek V2 系列 AI 模型收官，联网搜索上线

DeepSeek 官方公众号昨日（12 月 10 日）发布博文，宣布 DeepSeek V2 系列收官，推出 DeepSeek V2.5 的最终版微调模型 DeepSeek-V2.5-1210，主要支持联网搜索功能，全面提升各项能力。

12/11/2024 11:53:59 AM

故渊

DeepSeek首发国产类o1模型！人人可以免费使用！

20日晚8点，DeepSeek在自己官方公众号上放出了一个大杀器：全新自研的DeepSeek-R1-Lite 预览版正式上线。据介绍，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

11/25/2024 5:23:10 PM

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

DeepSeek 又出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型，有三项成绩还领先于 OpenAI o1-preview。

11/21/2024 1:20:00 PM

机器之心

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview

官方表示，该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

11/20/2024 11:02:11 PM

沛霖（实习）

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

硬件发展速度跟不上 AI 需求，就需要精妙的架构和算法。根据摩尔定律，计算机的速度平均每两年就会翻一倍，但深度学习的发展速度还要更快，如图 1 和 2 所示。可以看到，AI 对算力的需求每年都以 10 倍幅度增长，而硬件速度每两年增长 3 倍、DRAM 带宽增长 1.6 倍、互连带宽则仅有 1.4 倍。而大模型是大数据大计算的产物，其参数量可达千亿乃至万亿规模，需要成千上万台 GPU 才能有效完成训练。这些实际情况提升了人们对高性能计算（HPC）的需求。为了获得更多计算资源，人们不得不扩展更多计算节点。这就导

9/6/2024 5:57:00 PM

机器之心

Deepseek AI 模型升级推出 2.5 版：合并 Coder 和 Chat，对齐人类偏好、优化写作任务和指令跟随等

DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型已经合并升级，升级后的新模型为 DeepSeek V2.5。图源：Linux.do 论坛网友截图DeepSeek 官方昨日（9 月 5 日）更新 API 支持文档，宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型，升级推出全新的 DeepSeek V2.5 新模型。官方表示为向前兼容，API 用户通过 deepseek-coder 或 deepseek-chat 均可以访问新的模型。新模型在

9/6/2024 8:37:33 AM

故渊

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型