DeepSeek 频道:探索人工智能前沿,洞见未来科技 - AI在线
欢迎访问我们的 DeepSeek 频道页面,这里汇聚了关于 DeepSeek 技术、应用和最新动态的专业文章。DeepSeek 是一种先进的大语言模型,基于深度学习技术,通过强大的自然语言处理能力,提供精准的语义理解和智能搜索功能。无论您是对大语言模型的基础原理感兴趣,还是希望了解其在各行各业中的应用,我们的文章将为您提供全面的解读。
DeepSeek 突围奥秘曝光:一招 MLA 让全世界抄作业,150 + 天才集结,开出千万年薪
外媒 SemiAnalysis 的一篇深度长文,全面分析了 DeepSeek 背后的秘密 —— 不是「副业」项目、实际投入的训练成本远超 600 万美金、150 多位高校人才千万年薪,攻克 MLA 直接让推理成本暴降......
硅基流动 x 华为云推出基于昇腾云的 DeepSeek R1&V3 推理服务
硅基流动今日宣布,经过公司和华为云团队连日攻坚,为国内用户献上春节礼物:大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,得到了 DeepSeek 与华为云的大力支持。
OpenAI 紧急发布 o3-mini,CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”
阿尔特曼罕见地承认了自己的错误,并表示 OpenAI 正在讨论一个新的开源策略。“我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是 OpenAI 的每个人都持有这种观点,而且这也不是我们目前的最高优先级。”阿尔特曼表示。(新浪科技)
英特尔酷睿 Ultra 支持 DeepSeek 运行,可在 AI PC 上实现离线使用
英特尔 AI PC 合作伙伴 Flowy 在最新版的 AI PC 助手(英特尔酷睿 Ultra 独享版)上,率先在端侧支持了 DeepSeek-R1 模型,支持翻译、会议纪要、文档撰写等功能。
英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化
近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。
DeepSeek-R1 模型全面上线亚马逊云科技
今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。
进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock
春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。 这让大家感慨:没有永恒的竞争对手,也没有永恒的合作伙伴,每家公司都应该快速拥抱变化。
硅谷巨头要学会接受:「DeepSeek 现象」只是开始
2025 年的春节无疑已被 DeepSeek 霸屏。 过去三年每年的春节都有一次重磅的 AI 讨论:2023 年是 ChatGPT、2024 年是 Sora,这两股风潮都是由 OpenAI 掀起,而 2025 年则是 DeepSeek 的 V3 与 R1。 除夕当天 1 月 28 日,DeepSeek 更是趁热发布了文生图模型 Janus-Pro,但后者没有 V3 与 R1 吸引的关注大,原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源:算力。
郭明錤:DeepSeek 加速生成式 AI 产业迈入新阶段
郭明錤称,就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现加速了趋势发生。
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
英伟达今日宣布,DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。
为什么说DeepSeek的R1-Zero比R1更值得关注?
R1-Zero 等模型正在打破人类数据瓶颈,开启 AI 自我进化新范式? 「比起 R1,DeepSeek 同一时间发布的 R1-Zero 更值得关注。 」这是 ARC Prize 联合创始人 Mike Knoop 在一篇新博客中发表的观点。
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
一线 AI 洞察,智者深度思考 深入产业变革,共创 AI 未来2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。 当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。 这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?
DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
经过一系列测试 —— 从创意写作到复杂的教学,DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。 原来用对方法,性价比路线也能玩转 AI 竞技场! DeepSeek 发布其开放权重的 R1 推理模型仅一周时间,多次震惊海内外。
DeepSeek 应用在意大利应用商店下架,此前曾被该国隐私监管机构盯上
DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。
阿斯麦 CEO:DeepSeek 的出现是好消息
荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯(Christophe Fouquet)在周三的新闻发布会上表示,对于 ASML 而言,任何能够降低成本的消息都是好消息。此前,中国初创公司 DeepSeek 推出的低成本聊天机器人在市场上引发了波动,但福凯认为,这反而为 ASML 带来了更多机遇。
能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?
一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。
OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练
OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。
OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。