OpenAI公开了大模型o3-mini的推理思维链

2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。 这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。 推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。

OpenAI公开了大模型o3-mini的推理思维链

2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。

推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。这样的解释可以更容易地理解为什么给出了特定的响应,允许用户看到为什么他们的提示可能会或可能不会产生期望的答案。它们还允许人工智能研究人员识别潜在的偏见或错误,并提高其推理能力。

OpenAI在一篇文章中表示,该公司已经为免费和付费用户发布了“更新的OpenAI o3-mini思维链”,并为付费用户发布了o3-mini-high思维链。“o3-mini-high是o3-mini的付费版本,具有更深入的推理能力和更详细的思维过程,但代价是反应时间较慢。

在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能让用户访问思想链摘要,而不是完整的推理;该公司表示,这是为了“在速度和准确性之间提供一个平衡的权衡”,尽管它过去也提到“竞争优势”是决定的一个因素。

然而,由于DeepSeek的开源R1展示了其反应背后的整个过程,OpenAI决定将该过程公布。在更新中,“模型的原始(思维链)仍然隐藏,因为它很难理解”,但以一种“易于阅读”的方式呈现。

新的、更深入的推理总结将经过后处理步骤,简化任何过于复杂的解释,删除任何“不安全”的推理解释,并将其翻译成用户的母语。

OpenAI的首席产品官Kevin Weil表示:“展示所有的思维链会带来竞争的升华,但我们也知道人们需要它,所以我们会找到平衡它的正确方法。”这就是这种平衡的结果。

相关资讯

几个开发大模型应用常用的 Python 库

一、应用层开发1. FastAPIFastAPI是构建API的优选。 顾名思义,它快速、简单,并能与Pydantic完美集成,实现无缝数据验证。

在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)

概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。

OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

刚刚,OpenAI把o3-mini的推理思维链公开了。 从今日起,免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。 图片评论区网友纷纷:让我们谢谢DeepSeek。