推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview

官方表示,该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。

感谢DeepSeek 宣布,全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。

官方表示,DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 OpenAI o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等评测中,超越了 GPT-4o 等知名模型

推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview

DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。

推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview

▲ 红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关

AI在线注意到,DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。

官方称正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。

给TA打赏
共{{data.count}}人
人已打赏
应用

“成都造”天行者人形机器人 12 月 30 日发布:将“入职”柔性产品制造业企业

2024-11-20 22:48:47

应用

消息称 AI 创企边塞科技被蚂蚁集团收购:公司会独立运营,投资人已退出

2024-11-21 10:03:37

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索