DeepSeek
DeepSeek 突围奥秘曝光:一招 MLA 让全世界抄作业,150 + 天才集结,开出千万年薪
外媒 SemiAnalysis 的一篇深度长文,全面分析了 DeepSeek 背后的秘密 —— 不是「副业」项目、实际投入的训练成本远超 600 万美金、150 多位高校人才千万年薪,攻克 MLA 直接让推理成本暴降......
2/1/2025 3:06:04 PM
清源
硅基流动 x 华为云推出基于昇腾云的 DeepSeek R1&V3 推理服务
硅基流动今日宣布,经过公司和华为云团队连日攻坚,为国内用户献上春节礼物:大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,得到了 DeepSeek 与华为云的大力支持。
2/1/2025 1:44:57 PM
浩渺
OpenAI 紧急发布 o3-mini,CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”
阿尔特曼罕见地承认了自己的错误,并表示 OpenAI 正在讨论一个新的开源策略。“我个人认为,在这个问题上我们站错了队,需要想出一个不同的开源策略;不是 OpenAI 的每个人都持有这种观点,而且这也不是我们目前的最高优先级。”阿尔特曼表示。(新浪科技)
2/1/2025 1:22:15 PM
-
英特尔酷睿 Ultra 支持 DeepSeek 运行,可在 AI PC 上实现离线使用
英特尔 AI PC 合作伙伴 Flowy 在最新版的 AI PC 助手(英特尔酷睿 Ultra 独享版)上,率先在端侧支持了 DeepSeek-R1 模型,支持翻译、会议纪要、文档撰写等功能。
2/1/2025 10:12:54 AM
浩渺
英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化
近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。
2/1/2025 10:01:18 AM
浩渺
DeepSeek-R1 模型全面上线亚马逊云科技
今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。
1/31/2025 10:57:11 PM
清源
进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock
春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。 这让大家感慨:没有永恒的竞争对手,也没有永恒的合作伙伴,每家公司都应该快速拥抱变化。
1/31/2025 10:35:00 PM
机器之心
硅谷巨头要学会接受:「DeepSeek 现象」只是开始
2025 年的春节无疑已被 DeepSeek 霸屏。 过去三年每年的春节都有一次重磅的 AI 讨论:2023 年是 ChatGPT、2024 年是 Sora,这两股风潮都是由 OpenAI 掀起,而 2025 年则是 DeepSeek 的 V3 与 R1。 除夕当天 1 月 28 日,DeepSeek 更是趁热发布了文生图模型 Janus-Pro,但后者没有 V3 与 R1 吸引的关注大,原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源:算力。
1/31/2025 8:57:00 PM
陈彩娴
郭明錤:DeepSeek 加速生成式 AI 产业迈入新阶段
郭明錤称,就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现加速了趋势发生。
1/31/2025 5:21:29 PM
清源
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
英伟达今日宣布,DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。
1/31/2025 8:46:46 AM
浩渺
为什么说DeepSeek的R1-Zero比R1更值得关注?
R1-Zero 等模型正在打破人类数据瓶颈,开启 AI 自我进化新范式? 「比起 R1,DeepSeek 同一时间发布的 R1-Zero 更值得关注。 」这是 ARC Prize 联合创始人 Mike Knoop 在一篇新博客中发表的观点。
1/30/2025 7:58:00 PM
机器之心
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
一线 AI 洞察,智者深度思考 深入产业变革,共创 AI 未来2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。 当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。 这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?
1/30/2025 7:56:00 PM
机器之心
DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
经过一系列测试 —— 从创意写作到复杂的教学,DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。 原来用对方法,性价比路线也能玩转 AI 竞技场! DeepSeek 发布其开放权重的 R1 推理模型仅一周时间,多次震惊海内外。
1/30/2025 7:51:00 PM
机器之心
DeepSeek 应用在意大利应用商店下架,此前曾被该国隐私监管机构盯上
DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。
1/29/2025 9:50:43 PM
远洋
阿斯麦 CEO:DeepSeek 的出现是好消息
荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯(Christophe Fouquet)在周三的新闻发布会上表示,对于 ASML 而言,任何能够降低成本的消息都是好消息。此前,中国初创公司 DeepSeek 推出的低成本聊天机器人在市场上引发了波动,但福凯认为,这反而为 ASML 带来了更多机遇。
1/29/2025 8:04:00 PM
远洋
能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?
一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。
1/29/2025 8:02:20 PM
泓澄
OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练
OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。
1/29/2025 7:07:03 PM
远洋
OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。
1/29/2025 6:43:00 PM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
xAI
驾驶
字节跳动
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
大型语言模型