OpenAI公开了大模型o3-mini的推理思维链

2025-02-08 05:00

2月8日消息，据外媒报道，OpenAI更新了o3-mini AI模型的“思维链”功能，让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的，DeepSeek-R1是一个竞争对手的推理模型，也显示了其反应背后的思维过程。推理模型旨在逐步分解其决策过程，因此需要更长的时间来生成响应。

2月8日消息，据外媒报道，OpenAI更新了o3-mini AI模型的“思维链”功能，让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的，DeepSeek-R1是一个竞争对手的推理模型，也显示了其反应背后的思维过程。

推理模型旨在逐步分解其决策过程，因此需要更长的时间来生成响应。这样的解释可以更容易地理解为什么给出了特定的响应，允许用户看到为什么他们的提示可能会或可能不会产生期望的答案。它们还允许人工智能研究人员识别潜在的偏见或错误，并提高其推理能力。

OpenAI在一篇文章中表示，该公司已经为免费和付费用户发布了“更新的OpenAI o3-mini思维链”，并为付费用户发布了o3-mini-high思维链。“o3-mini-high是o3-mini的付费版本，具有更深入的推理能力和更详细的思维过程，但代价是反应时间较慢。

在此更新之前，OpenAI模型o3-mini、o1和o1-mini只能让用户访问思想链摘要，而不是完整的推理;该公司表示，这是为了“在速度和准确性之间提供一个平衡的权衡”，尽管它过去也提到“竞争优势”是决定的一个因素。

然而，由于DeepSeek的开源R1展示了其反应背后的整个过程，OpenAI决定将该过程公布。在更新中，“模型的原始(思维链)仍然隐藏，因为它很难理解”，但以一种“易于阅读”的方式呈现。

新的、更深入的推理总结将经过后处理步骤，简化任何过于复杂的解释，删除任何“不安全”的推理解释，并将其翻译成用户的母语。

OpenAI的首席产品官Kevin Weil表示：“展示所有的思维链会带来竞争的升华，但我们也知道人们需要它，所以我们会找到平衡它的正确方法。”这就是这种平衡的结果。

GPT未竟的革命，由o1接棒：或是LLM研究最重要的发现

天下武功唯快不破，但 OpenAI 不走寻常路，新出的 o1 系列宣告天下：我们更慢，但更强了。 o1 要花更多的时间思考问题，再做出反应，但在复杂推理层面直接窜了几个档位。在国际数学奥林匹克 (IMO) 资格考试中，GPT-4o 仅正确解决了 13% 的问题，而 o1 得分为 83%。

9/13/2024 3:50:00 PM

刘洁

大模型界「摩尔定律」Densing Law 来了！盲目Scaling将过时！清华刘知远团队发现：大模型能力密度约100天翻倍！

整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）Scaling Law会失效吗？虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。但是，OpenAI的最近的发布也没有那么炸了，尤其是 o1 Pro 比满血版在编程能力上仅高出一分，似乎更让人相信了“墙”的存在。

12/9/2024 5:20:29 PM

伊风

OpenAI被曝自研人形机器人，四年前因缺数据解散团队，如今要用机器人数据反哺大模型了

o3之后，OpenAI下一个项目曝光了：人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司，也不只是算法团队搞机器人强化学习。而是自己涉足硬件，研发有双臂、双腿的实体人形机器人。 Information的消息称，两位直接了解这个项目的人透露了这个消息。

12/25/2024 10:58:29 AM

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

OpenAI公开了大模型o3-mini的推理思维链

相关资讯

GPT未竟的革命，由o1接棒：或是LLM研究最重要的发现

大模型界「摩尔定律」Densing Law 来了！盲目Scaling将过时！清华刘知远团队发现：大模型能力密度约100天翻倍！

OpenAI被曝自研人形机器人，四年前因缺数据解散团队，如今要用机器人数据反哺大模型了