DeepSeek 频道:探索人工智能前沿,洞见未来科技 - AI在线

欢迎访问我们的 DeepSeek 频道页面,这里汇聚了关于 DeepSeek 技术、应用和最新动态的专业文章。DeepSeek 是一种先进的大语言模型,基于深度学习技术,通过强大的自然语言处理能力,提供精准的语义理解和智能搜索功能。无论您是对大语言模型的基础原理感兴趣,还是希望了解其在各行各业中的应用,我们的文章将为您提供全面的解读。

英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。

DeepSeek-R1 模型全面上线亚马逊云科技

今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。

进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。 这让大家感慨:没有永恒的竞争对手,也没有永恒的合作伙伴,每家公司都应该快速拥抱变化。

硅谷巨头要学会接受:「DeepSeek 现象」只是开始

2025 年的春节无疑已被 DeepSeek 霸屏。 过去三年每年的春节都有一次重磅的 AI 讨论:2023 年是 ChatGPT、2024 年是 Sora,这两股风潮都是由 OpenAI 掀起,而 2025 年则是 DeepSeek 的 V3 与 R1。 除夕当天 1 月 28 日,DeepSeek 更是趁热发布了文生图模型 Janus-Pro,但后者没有 V3 与 R1 吸引的关注大,原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源:算力。

郭明錤:DeepSeek 加速生成式 AI 产业迈入新阶段

郭明錤称,就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现加速了趋势发生。

英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台

英伟达今日宣布,DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。

为什么说DeepSeek的R1-Zero比R1更值得关注?

R1-Zero 等模型正在打破人类数据瓶颈,开启 AI 自我进化新范式? 「比起 R1,DeepSeek 同一时间发布的 R1-Zero 更值得关注。 」这是 ARC Prize 联合创始人 Mike Knoop 在一篇新博客中发表的观点。

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

一线 AI 洞察,智者深度思考                                                 深入产业变革,共创 AI 未来2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。 当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。 这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?

DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉

经过一系列测试 —— 从创意写作到复杂的教学,DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。 原来用对方法,性价比路线也能玩转 AI 竞技场! DeepSeek 发布其开放权重的 R1 推理模型仅一周时间,多次震惊海内外。

DeepSeek 应用在意大利应用商店下架,此前曾被该国隐私监管机构盯上

DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。

阿斯麦 CEO:DeepSeek 的出现是好消息

荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯(Christophe Fouquet)在周三的新闻发布会上表示,对于 ASML 而言,任何能够降低成本的消息都是好消息。此前,中国初创公司 DeepSeek 推出的低成本聊天机器人在市场上引发了波动,但福凯认为,这反而为 ASML 带来了更多机遇。

能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?

一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。

OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练

OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。

意大利机构要求 DeepSeek 提供数据保护相关信息

据 Techcrunch 报道,欧洲消费者组织(Euroconsumers)与意大利数据保护机构(Italian Data Protection Authority,DPA)联合对 DeepSeek 提出投诉。这是自 DeepSeek 迅速走红以来,首次有数据保护机构对其采取重大行动。投诉的核心问题是 DeepSeek 在处理个人数据时是否符合欧洲的《通用数据保护条例》(GDPR)。

DeepSeek 梁文锋回应冯骥赞誉(更新:回答真实性存疑)

昨日游戏科学创始人、黑神话悟空制作人冯骥力推 DeepSeek 大模型,其认为 DeepSeek 可能是国运级别的科技成果。冯骥在发文中详细列举了 DeepSeek 的六大卓越特性,每一项都堪称业界突破。

再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型

Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。

英特尔前 CEO 基辛格力挺 DeepSeek:将推动 AI 普及

基辛格认为,DeepSeek 的出现应该让科技行业牢记三个最重要的教训:降低成本意味着更广泛的采用;在限制条件下,创造力会蓬勃发展;“开放即胜利”。他指出,DeepSeek 将有助于打破基础 AI 模型工作日益封闭的局面。