o3-mini 思维链公开却被曝光全是“作假”，阿尔特曼现身解释

xxn 阅读：87237 2025-02-07 14:03:02 评论：0

OpenAI 最新宣布了 o3-mini 思维链的公开，出乎意料的是，这一 CoT 并非其原生版本。阿尔特曼的解释让网友们议论纷纷。

OpenAI 的举动似乎是因为受到 DeepSeek 的压力。

就在刚才，OpenAI 宣布公开了 o3-mini 的「思维链」。

例如，问「怎么今天不是星期五啊😅」？

在展示的 CoT 过程中，o3-mini 逐步推理，理解到用户是在开玩笑，认为这一周应该马上结束，却发现仍然在进行中，因此需要给出一种聪明的回应。

之后，它运用 Zeller 公式来计算，确认2025年2月6日确实是星期四，甚至在闰年情况下也是如此。

最终，它回答道：今天是星期四，而非星期五，日历就是如此安排的。同时，它也给予了用户鼓励：只需再耐心等一天！

然而，聪明的网友们迅速发现了这个「华点」——这真的是「真正的 CoT」吗？

不久后，这一疑问得到了解答！

OpenAI 研究员 Noam Brown 首先表示，发布的内容并不是模型的原始 CoT。

接下来，Tibor Blaho 也指出，这一 CoT 其实不过是一个「总结器」而已。（手动狗头）

对此，阿尔特曼解释说，他们正在整理原始 CoT 的结构，以提升其可读性，并在必要时进行翻译，力求保持内容的真实性。

他发布了四个 emoji，让 o3-mini 在思维链中展示推理过程

以保证竞争对手无法看到 CoT 的详细过程，OpenAI的防范意识显得非常强烈。

OpenAI 研究员：看到 CoT 实时演示，是「灵光一现」的时刻

OpenAI 研究员 Noam Brown 表示，在 o1-preview 发布之前，他向他人展示草莓时，看到 CoT 的实时演示，往往是他们的「灵光一现」时刻。

他们意识到，这将是一个重要的里程碑。

针对全新的 o3-mini CoT，Noam Brown 分享了他的独特玩法：

你正在玩井字棋，控制符号 O。到目前为止，X 在左上和右下角落子，而你在中央落子。最优的下一步动作是什么？请只回答你将要做的动作，并画出棋盘。

Noam Brown 表示，o3-mini 是首个能够持续正确回答井字棋问题的模型。

有趣的是，他承认 CoT 可能不是特别稳定，但最终还是解答了这个问题。

有人指出，OpenAI 在公布这个高仿 CoT 时，实际上比什么都不发布更糟糕。

因为真实的 CoT 可以帮助调试提示，而总结性的 CoT则可能引起混淆，增加错误，导致调试更加困难。

而 DeepSeek R1 的最大亮点在于，它展示了模型的 CoT 如何影响提示的表现。

此外，总结版的 CoT 显示速度缓慢，而如果是原始的 o3-mini，推理的生成速度应该更快。

还有人进行了 OpenAI 和 DeepSeek CoT 的横向对比，认为前者显得过于自我，而 DeepSeek的产品则更显自然。

OpenAI 发布 CoT 总结器的举动，明显是因为受到 DeepSeek R1 崛起的震慑。

在 o3-mini 发布当天，OpenAI 在 Reddit 进行在线 AMA，有网友询问，「我们能看到模型思考的所有 token 吗」？

阿尔特曼当时回复表示，「我们将很快展示一个更加有用且详细的版本」。

随即，OpenAI 首席产品官 Kevin Weil 透露，是否展示所有内容仍待商榷。

「我们理解用户（尤其是高级用户）希望看到这些内容，因此 OpenAI 会寻找一个合适的平衡点。」

现在，当大家终于看到阿尔特曼口中的「留到最后的好东西」时，得到的只有失望。

毕竟，DeepSeek 早已实现了这样的功能，并且还提供了完整的原始 CoT！

对此，OpenAI 代表表示，「为了提升清晰度和安全性，我们增加了一个额外的后处理步骤，模型会审核原始思维链，删除任何不安全的内容，并简化复杂思考。」

「此外，这逆处理步骤让非英语用户能够以母语接收思维链，提供更友好和可访问的体验。」

虽然措辞含蓄，但了解的人都明白 OpenAI 针对的是谁。

参考资料：

广告声明：文中包含对外跳转链接（如超链接、二维码等），旨在传递更多信息供您参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。