DeepSeek首发国产类o1模型！人人可以免费使用！

2024-11-25 05:23

20日晚8点，DeepSeek在自己官方公众号上放出了一个大杀器：全新自研的DeepSeek-R1-Lite 预览版正式上线。据介绍，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

20日晚8点，DeepSeek在自己官方公众号上放出了一个大杀器：

全新自研的DeepSeek-R1-Lite 预览版正式上线。据介绍，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。

该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

图片

等不及看下文的朋友，大家可以自行登录DeepSeek官网（chat.deepseek.com），前往体验与国产版的o1模型的深度对话。

不过，这次的深度推理，DeepSeek选择的只有数学竞赛和编程方面的测评，虽然没有其他领域的测评数据，但这两项的难度也足以说明这个模型的厉害了！

在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek的表现大幅超越了 GPT-4o 等知名模型，前者L1获得了91.6的成绩，而o1仅有85.5分，Qwen2.5表现也不错83.1。

值得注意的是，所有测评的最大推理长度是有限制的，是32k。

图片

为什么说这一点值得注意，因为据介绍，DeepSeek-R1-Lite 的推理过程包含了大量的反思和验证。模型在数学竞赛上的得分与测试所允许思考的长度紧密正相关。

即，允许思考过程的token越长，所获得推理结果得分越高。

图片

小遗憾地是，DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型，无法完全释放长思维链的潜力。

不过DeepSeek表示模型还会持续进行迭代，正式版 DeepSeek-R1 模型将完全开源，而相关的技术报告也会公开，同时也会部署 API 服务。

小编实测了一道高中奥数题，DeepSeek-R1 全程只用了15s就给了正确的思考过程，不过可惜的是，输在了最后一个合并同类项的数学错误上。

图片

唉，不得不说，功亏一篑呀，大模型的数学能力的确有待提升，推理层还得加油！

想了解更多AIGC的内容，请访问：

51CTO AI.x社区

https://www.51cto.com/aigc/

相关标签：

模型 o1 DeepSeek

相关资讯

一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

开源大模型领域，又迎来一位强有力的竞争者。近日，探索通用人工智能（AGI）本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2，主打训练成本更低、推理更加高效。项目地址：：DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ModelDeepSeek-V2 参数量达 236B，其中每个 token 激活 21B 参数，支持 128K token 的上下文长度。与

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索，显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展，正前所未有地交织在一起。前段时间，著名数学家陶哲轩在牛津数学公开讲座中做了主题为「AI 在科学和数学中的潜力」的主题分享。他指出，将 AI 整合到数学领域将使形式化证明的编写速度超过人类证明（人类证明容易出错）。这将成为一个关键转折点，意味着形式化证明的使用将不仅限于验证现有的证明，还将用于创造新的数学知识。这将通过广泛的人类数学家与 AI 数学家之间的协作来实现。我们将迎来一个

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

DeepSeek 又出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型，有三项成绩还领先于 OpenAI o1-preview。

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手从DeepSeek-V3发布谈大模型的技术突破与未来机遇别再将LLM当成数据库了 3 到 5 秒即可同声传译 40 余种语言，时空壶推出 W4 Pro 实时翻译耳机

标签云