AI在线 AI在线

OpenAI公开了大模型o3-mini的推理思维链

作者:Yu
2025-02-08 05:00
2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。 这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。 推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。

OpenAI公开了大模型o3-mini的推理思维链

2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。

推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。这样的解释可以更容易地理解为什么给出了特定的响应,允许用户看到为什么他们的提示可能会或可能不会产生期望的答案。它们还允许人工智能研究人员识别潜在的偏见或错误,并提高其推理能力。

OpenAI在一篇文章中表示,该公司已经为免费和付费用户发布了“更新的OpenAI o3-mini思维链”,并为付费用户发布了o3-mini-high思维链。“o3-mini-high是o3-mini的付费版本,具有更深入的推理能力和更详细的思维过程,但代价是反应时间较慢。

在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能让用户访问思想链摘要,而不是完整的推理;该公司表示,这是为了“在速度和准确性之间提供一个平衡的权衡”,尽管它过去也提到“竞争优势”是决定的一个因素。

然而,由于DeepSeek的开源R1展示了其反应背后的整个过程,OpenAI决定将该过程公布。在更新中,“模型的原始(思维链)仍然隐藏,因为它很难理解”,但以一种“易于阅读”的方式呈现。

新的、更深入的推理总结将经过后处理步骤,简化任何过于复杂的解释,删除任何“不安全”的推理解释,并将其翻译成用户的母语。

OpenAI的首席产品官Kevin Weil表示:“展示所有的思维链会带来竞争的升华,但我们也知道人们需要它,所以我们会找到平衡它的正确方法。”这就是这种平衡的结果。

相关标签:

相关资讯

GPT未竟的革命,由o1接棒:或是LLM研究最重要的发现

天下武功唯快不破,但 OpenAI 不走寻常路,新出的 o1 系列宣告天下:我们更慢,但更强了。 o1 要花更多的时间思考问题,再做出反应,但在复杂推理层面直接窜了几个档位。 在国际数学奥林匹克 (IMO) 资格考试中,GPT-4o 仅正确解决了 13% 的问题,而 o1 得分为 83%。
9/13/2024 3:50:00 PM
刘洁

大模型界「摩尔定律」Densing Law 来了!盲目Scaling将过时!清华刘知远团队发现:大模型能力密度约100天翻倍!

整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Scaling Law会失效吗? 虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。 但是,OpenAI的最近的发布也没有那么炸了,尤其是 o1 Pro 比满血版在编程能力上仅高出一分,似乎更让人相信了“墙”的存在。
12/9/2024 5:20:29 PM
伊风

OpenAI被曝自研人形机器人,四年前因缺数据解散团队,如今要用机器人数据反哺大模型了

o3之后,OpenAI下一个项目曝光了:人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司,也不只是算法团队搞机器人强化学习。 而是自己涉足硬件,研发有双臂、双腿的实体人形机器人。 Information的消息称,两位直接了解这个项目的人透露了这个消息。
12/25/2024 10:58:29 AM