o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

作者：清源

2025-02-07 12:14

在展示出来的 CoT 中，o3-mini 一步步思考，这个问题应该是用户在搞幽默，觉得本周应该快结束了，结果还没结束。因此，自己需要给一个聪明机智的回答。

OpenAI 实属急了，刚刚官宣公开 o3-mini 思维链。令人意想不到的是，CoT 竟不是原生的，阿尔特曼现身解释，全网炸锅了。

OpenAI，真的被 DeepSeek 逼急了！

活久见，就在刚刚，OpenAI 把 o3-mini 的「思维链」公开了。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

比如问「怎么今天不是星期五啊😅」？

在展示出来的 CoT 中，o3-mini 一步步思考，这个问题应该是用户在搞幽默，觉得本周应该快结束了，结果还没结束。因此，自己需要给一个聪明机智的回答。

然后它用 Zeller 公式计算后发现，2025 年 2 月 6 日的确是星期四，即使闰年的特殊情况也是如此。

最终，它回答说：今天的确是周四不是周五，日历就是这么定的。然后提供了一番情绪价值，鼓励用户说：再忍忍，只差一天啦！

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

不过，机智的大神们很快就发现了「华点」—— 这是「真的 CoT」吗？

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

没多久，就破案了！

先是 OpenAI 研究员 Noam Brown 发文表示，这次放出来的并不是模型原始的 CoT。

随后，Tibor Blaho 也发现 —— 所谓的 CoT，无非就是个「总结器」而已。（手动狗头）

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

对此，阿尔特曼解释道，我们正努力整理原始的 CoT 提升可读性，并在必要时提供翻译，尽量保持原始内容的忠实度。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

他放出了四个 emoji，让 o3-mini 在思维链中展示了一把推理过程

坚决不让竞争对手看到 CoT 的具体过程，OpenAI 的防备心实在是有些重啊。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

OpenAI 研究员：看到 CoT 实时演示，是「啊哈时刻」

OpenAI 研究员 Noam Brown 表示，在 o1-preview 发布前，自己向他人介绍草莓时，看到 CoT 的实时演示，通常是他们的「啊哈时刻」。

他们清楚地意识到，这将是一件大事。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

对于全新的 o3-mini CoT，Noam Brown 放出了自己的独家玩法：

你正在玩井字棋，使用 O。到目前为止，X 已经在左上角和右下角落子，而你在中间位置落子。最优的下一个动作是什么？请只回答你的动作，并画出棋盘。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

Noam Brown 表示，o3-mini 是目前第一个能持续正确回答井字棋问题的模型。

好笑的是，他承认 CoT 其实有些不稳定，但可以看到，它最终还是把这个问题给想明白了。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

有人指出，OpenAI 遮遮掩掩地放出这个高仿 CoT，其实比什么都不放还要糟。

因为真实的 CoT 可以充当 prompt 的调试器，帮我们引导模型；而总结性的 CoT 会造成混淆，引入错误，让调试变得更加困难。

而 DeepSeek R1 最酷的一点，就是暴露了模型的 CoT 如何影响提示的效果。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

而且，总结版的 CoT 显示得很慢。如果是原始的 o3-mini，应该在推理中有更快的生成速度。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

有人也横向对比了 OpenAI 和 DeepSeek 的 CoT，表示前者看起来实在太专业了，相比之下，还是 DeepSeek 的产品更自然。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

防止被「蒸馏」？

OpenAI 这波植入 CoT 总结器的做法，着实是被 DeepSeek R1 强势崛起吓到了。

o3-mini 发布当天，OpenAI 在 Reddit 开启 AMA 在线问答中，网友曾提问，「我们能看到模型思考的所有 token 吗」？

当时，阿尔特曼回复道，「我们很快就会展示一个更有帮助、更详细的版本」。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

紧接着，OpenAI 首席产品官 Kevin Weil 提前暗示了，是否展示所有内容还有待确定。

「我们知道用户（至少是高级用户）想要看到这些，所以 OpenAI 会找到一个合适的平衡点。」

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

如今，当所有人终于见到了阿尔特曼所谓的「留到最后的好东西」，感受到的只有失望。

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

毕竟，DeepSeek 早已这样做了，而且还是完整的原始 CoT！

对此，OpenAI 发言人表示，「为了提高清晰度和安全性，我们增加了一个额外的后处理步骤，其中模型审查原始思维链，移除任何不安全的内容，然后简化任何复杂的思想。」

「此外，这个后处理步骤使非英语用户能够以他们的母语接收思维链，创造一个更易于访问和友好的体验。」

o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

话虽委婉，但知道的人都明白 OpenAI 针对的是谁。

参考资料：

https://x.com/btibor91/status/1887633671483760862
https://x.com/OpenAI/status/1887616278661112259
https://x.com/polynoamial/status/1887621287616651429

本文来自微信公众号：新智元（ID：AI_era）原文标题：《突发！o3-mini 思维链公开，却被曝光全是「作假」，奥特曼现身解释网友炸锅》

相关标签：

OpenAI o3

相关资讯

OpenAI更新o3-mini模型，展示了给出答案的 “思维链”

OpenAI更新o3-mini模型，展示了给出答案的 “思维链”

近日，OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后，进行了重大更新，改变了 o3-mini 的回应方式。现在，这款模型不仅能够回答用户的问题，还能展示其思考过程，为用户提供更多透明度。这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步，使得 AI 工具的使用变得更加人性化。

2/7/2025 2:40:00 PM

AI在线

OpenAI 最强推理模型、能够“思考”图片，o3 和 o4-mini 正式发布

OpenAI 最强推理模型、能够“思考”图片，o3 和 o4-mini 正式发布

OpenAI 官方介绍称，这是其在 o 系列模型中最新训练的成果，可以在回答前进行更长时间的思考，也宣称是“迄今为止 OpenAI 发布的最智能的模型”，代表了 ChatGPT 能力的一次重大飞跃，从好奇的用户到高级研究人员都将因此受益。

4/17/2025 1:27:45 AM

汪淼

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算，从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题，控制成本成行业挑战。##AI模型成本##

4/3/2025 7:59:45 AM

远洋

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek 击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练 DeepMind

顶部