DeepSeek

DeepSeek 突围奥秘曝光：一招 MLA 让全世界抄作业，150 + 天才集结，开出千万年薪

外媒 SemiAnalysis 的一篇深度长文，全面分析了 DeepSeek 背后的秘密 —— 不是「副业」项目、实际投入的训练成本远超 600 万美金、150 多位高校人才千万年薪，攻克 MLA 直接让推理成本暴降......

2/1/2025 3:06:04 PM

清源

硅基流动 x 华为云推出基于昇腾云的 DeepSeek R1&V3 推理服务

硅基流动今日宣布，经过公司和华为云团队连日攻坚，为国内用户献上春节礼物：大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1，得到了 DeepSeek 与华为云的大力支持。

2/1/2025 1:44:57 PM

浩渺

OpenAI 紧急发布 o3-mini，CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”

阿尔特曼罕见地承认了自己的错误，并表示 OpenAI 正在讨论一个新的开源策略。“我个人认为，在这个问题上我们站错了队，需要想出一个不同的开源策略；不是 OpenAI 的每个人都持有这种观点，而且这也不是我们目前的最高优先级。”阿尔特曼表示。（新浪科技）

2/1/2025 1:22:15 PM

英特尔酷睿 Ultra 支持 DeepSeek 运行，可在 AI PC 上实现离线使用

英特尔 AI PC 合作伙伴 Flowy 在最新版的 AI PC 助手（英特尔酷睿 Ultra 独享版）上，率先在端侧支持了 DeepSeek-R1 模型，支持翻译、会议纪要、文档撰写等功能。

2/1/2025 10:12:54 AM

浩渺

英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

近日，DeepSeek 发布 Janus Pro 模型，英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化，为 AI 应用的落地和规模化发展提供的支持。

2/1/2025 10:01:18 AM

浩渺

DeepSeek-R1 模型全面上线亚马逊云科技

今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。

1/31/2025 10:57:11 PM

清源

进击的DeepSeek，一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

春节假期未过半，DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。今天一觉醒来， DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录，开发人员可以快速地进行实验、迭代，并将这款热门模型集成到他们的工作流程中。这让大家感慨：没有永恒的竞争对手，也没有永恒的合作伙伴，每家公司都应该快速拥抱变化。

1/31/2025 10:35:00 PM

机器之心

2025 年的春节无疑已被 DeepSeek 霸屏。过去三年每年的春节都有一次重磅的 AI 讨论：2023 年是 ChatGPT、2024 年是 Sora，这两股风潮都是由 OpenAI 掀起，而 2025 年则是 DeepSeek 的 V3 与 R1。除夕当天 1 月 28 日，DeepSeek 更是趁热发布了文生图模型 Janus-Pro，但后者没有 V3 与 R1 吸引的关注大，原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源：算力。

1/31/2025 8:57:00 PM

陈彩娴

郭明錤：DeepSeek 加速生成式 AI 产业迈入新阶段

郭明錤称，就算没有DeepSeek-R1，这两个趋势终将显著浮现，但DeepSeek-R1的出现加速了趋势发生。

1/31/2025 5:21:29 PM

清源

英伟达：DeepSeek-R1 模型现已上线 NIM 微服务平台

英伟达今日宣布，DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。

1/31/2025 8:46:46 AM

浩渺

为什么说DeepSeek的R1-Zero比R1更值得关注？

R1-Zero 等模型正在打破人类数据瓶颈，开启 AI 自我进化新范式？「比起 R1，DeepSeek 同一时间发布的 R1-Zero 更值得关注。」这是 ARC Prize 联合创始人 Mike Knoop 在一篇新博客中发表的观点。

1/30/2025 7:58:00 PM

机器之心

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

一线 AI 洞察，智者深度思考深入产业变革，共创 AI 未来2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划，Meta 在建规模超 130 万 GPU 的数据中心时，这个来自中国的团队打破了大模型军备竞赛的既定逻辑：用 2048 张 H800 GPU，两个月训练出了一个媲美全球顶尖水平的模型。这一突破不仅撼动了英伟达万亿市值，更引发了整个行业的反思：在通往 AGI 的征程上，我们是否过于盲信算力规模，而忽视了一条更加务实且充满创新可能的路径？

1/30/2025 7:56:00 PM

机器之心

DeepSeek R1有没有赶上OpenAI o1？八大场景测评结果出炉

经过一系列测试 —— 从创意写作到复杂的教学，DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。原来用对方法，性价比路线也能玩转 AI 竞技场！ DeepSeek 发布其开放权重的 R1 推理模型仅一周时间，多次震惊海内外。

1/30/2025 7:51:00 PM

机器之心

DeepSeek 应用在意大利应用商店下架，此前曾被该国隐私监管机构盯上

DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知，但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。

1/29/2025 9:50:43 PM

远洋

阿斯麦 CEO：DeepSeek 的出现是好消息

荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯（Christophe Fouquet）在周三的新闻发布会上表示，对于 ASML 而言，任何能够降低成本的消息都是好消息。此前，中国初创公司 DeepSeek 推出的低成本聊天机器人在市场上引发了波动，但福凯认为，这反而为 ASML 带来了更多机遇。

1/29/2025 8:04:00 PM

远洋

能思考会搜索的国产大模型，全网疯测的 DeepSeek 牛在哪？

一家来自杭州的“小公司” DeepSeek，却给整个 AI 行业带来了新思路，这两天可以说是火遍了全网。

1/29/2025 8:02:20 PM

泓澄

OpenAI：有证据表明 DeepSeek 使用了我们的模型进行训练

OpenAI 向《金融时报》表示，他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段，开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本，高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中，但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。

1/29/2025 7:07:03 PM

远洋

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

成本打下来了，需求更多才对？春节这几天，国内外 AI 圈都被 DeepSeek 刷了屏。英伟达的股市震荡更是让全世界看得目瞪口呆（参见《英伟达市值蒸发近 6000 亿美元，而 DeepSeek 刚刚又开源新模型》）。

1/29/2025 6:43:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

DeepSeek

DeepSeek 突围奥秘曝光：一招 MLA 让全世界抄作业，150 + 天才集结，开出千万年薪

硅基流动 x 华为云推出基于昇腾云的 DeepSeek R1&V3 推理服务

OpenAI 紧急发布 o3-mini，CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”

英特尔酷睿 Ultra 支持 DeepSeek 运行，可在 AI PC 上实现离线使用

英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

DeepSeek-R1 模型全面上线亚马逊云科技

进击的DeepSeek，一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

硅谷巨头要学会接受：「DeepSeek 现象」只是开始

郭明錤：DeepSeek 加速生成式 AI 产业迈入新阶段

英伟达：DeepSeek-R1 模型现已上线 NIM 微服务平台

为什么说DeepSeek的R1-Zero比R1更值得关注？

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

DeepSeek R1有没有赶上OpenAI o1？ 八大场景测评结果出炉

DeepSeek 应用在意大利应用商店下架，此前曾被该国隐私监管机构盯上

阿斯麦 CEO：DeepSeek 的出现是好消息

能思考会搜索的国产大模型，全网疯测的 DeepSeek 牛在哪？

OpenAI：有证据表明 DeepSeek 使用了我们的模型进行训练

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

DeepSeek R1有没有赶上OpenAI o1？八大场景测评结果出炉