DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

作者：汪淼

2025-01-19 10:19

还未正式发布，已在代码基准测试 LiveCodeBench 霸榜前三，表现与 OpenAI o1 的中档推理设置相当。

DeepSeek 版 o1，有消息了。

还未正式发布，已在代码基准测试 LiveCodeBench 霸榜前三，表现与 OpenAI o1 的中档推理设置相当。

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

注意了，这不是在 DeepSeek 官方 App 已经能试玩的 DeepSeek-R1-Lite-Preview（轻量预览版）。

而是摘掉了轻量版的帽子，称为 DeepSeek-R1-Preview（预览版），意味着替换了规模更大的基础模型。

LiveCodeBench 团队透露，他们正在与 DeepSeek 合作评估新模型的能力，在合作过程中，DeepSeek 团队还帮他们找出并解决了评分系统的一些 bug。

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

与此同时，他们还晒出了目前仅有的一张 DeepSeek-R1-Preview 的思考过程。

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

鉴于 DeepSeek 此前已宣布 R1 模型将开源，有网友表示，与 OpenAI o1 编程能力相当的开源模型即将发布，2025 年的编程就只剩下按 Tab 键了。

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

DeepSeek 推理大模型满血版

两个月前，DeepSeek 在官网上线 DeepSeek-R1-Lite-Preview 时曾透露：

DeepSeek-R1-Lite-Preview 使用强化学习训练，推理含大量反思和验证，遵循新的 Scaling Laws—— 推理越长，表现越强。

在 AIME 测试基准中，随着推理长度的增加，DeepSeek-R1-Lite-Preview 表现出稳定的得分提升。

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

DeepSeek-R1-Lite 推理的特点在网友们的后续测试中也得到了验证：

在某些情况下，模型似乎能够在生成推理步骤时自我纠正，表现出类似原生“自我反思”的能力。不过，没有训练数据、模型架构和技术报告 / 论文的细节，很难确认这一点。
期待未来的开源模型和 API！

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

摘掉 Lite 的帽子，变成 DeepSeek-R1-Preview，意味着换了更大的基础模型。

之前 Lite 版就在难度较高数学和代码任务上超越 o1-preview，大幅领先 GPT-4o。

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

这次在 LiveCodeBench 上，这次的 DeepSeek-R1-Preview 的表现又与 OpenAI o1-Medium 相当，网友们更加期待开源模型和 API 了。

LiveCodeBench 由 UC 伯克利、MIT 和康奈尔大学团队推出，旨在对大模型的代码能力进行全面且无污染的评估。

具体避免测试数据泄露的方法，是随着时间的推移不断从人类的编程竞赛平台收集新的题目。

除了代码生成，还会评估模型在代码自修复、执行和测试输出预测等方面的能力。这样实时更新、确保公平性和可靠性的测试方法，获得了开发者社区的认可。

还有程序猿喊话 Cursor 直接把 R1-Preview 集成到 Agent mode 里：

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

One More Thing

赶在春节前，许多还在做训练的国产大模型团队，都把自家模型更新了一遍。OpenAI 似乎要趁这边放假开始搞事情了（狗头），阿尔特曼发帖透露：

o3-mini 完成外部合作测试，已确定最终版，将在几周内推出，会同时上线 API 和 ChatGPT。

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

在后续对话中，阿尔特曼还确认了未来模型更多基本情况：

o3-mini 的速度会非常快
o3-mini 大多数情况下不如 o1-pro
o3 pro 收费从 $200 / 月起步
OpenAI 正在关注如何让 AI 一次性输出更多内容
2025 年计划把 GPT 系列和 o 系列合并

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

本文来自微信公众号：量子位（ID：QbitAI），作者：梦晨、西风，原标题《DeepSeek 新模型霸榜，代码能力与 OpenAI o1 相当且确认开源，网友：今年编程只剩 Tab 键》

Kimi 最新模型 k1.6 登顶，编程能力超越 GPT o3mini、o1

月之暗面联合创始人张予彤在朋友圈表示，“k1.6 还没有发布，但看到 LiveCodeBench 的成绩感到开心，期待智能模型的持续进化。”

2/27/2025 4:51:00 PM

汪淼

再加一把火、造福全人类，Hugging Face 号召打造完全开源版 DeepSeek R1 大模型

Hugging Face 称这项工作非常重要，因为 DeepSeek R1 非常高效，可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。

1/28/2025 9:33:49 PM

汪淼

DeepSeek-R1 成 Hugging Face 最受欢迎大模型，力压近 150 万个“对手”

Clement Delangue今日凌晨发文宣布：DeepSeek-R1在Hugging Face上获得了超过10000个赞，成为该平台近150万个模型之中最受欢迎的大模型，“太令人震惊了！”

2/24/2025 7:59:13 AM

清源

资讯热榜

Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna AI视频资讯早读！7个产品更新+8个案例精选纳米AI发布MCP万能工具箱，简化AI工具集成与调用即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级白板+代码编辑器组合工具pad.ws：开发者可在同一界面画图编程，实现边画边写代码

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion Gemini 马斯克算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动大语言模型 Claude 搜索驾驶神器推荐文本具身智能 Copilot LLaMA 算力安全视觉视频生成干货合集应用训练大型语言模型科技亚马逊特斯拉 AGI DeepMind

顶部

DeepSeek R1 Preview 模型亮相，代码能力与 OpenAI o1 相当且确认开源

DeepSeek 推理大模型满血版

One More Thing

相关资讯

Kimi 最新模型 k1.6 登顶，编程能力超越 GPT o3mini、o1

再加一把火、造福全人类，Hugging Face 号召打造完全开源版 DeepSeek R1 大模型

DeepSeek-R1 成 Hugging Face 最受欢迎大模型，力压近 150 万个“对手”