o3-mini 思维链公开却被曝光全是“作假”,阿尔特曼现身解释
OpenAI 最新宣布了 o3-mini 思维链的公开,出乎意料的是,这一 CoT 并非其原生版本。阿尔特曼的解释让网友们议论纷纷。
OpenAI 的举动似乎是因为受到 DeepSeek 的压力。
就在刚才,OpenAI 宣布公开了 o3-mini 的「思维链」。
例如,问「怎么今天不是星期五啊😅」?
在展示的 CoT 过程中,o3-mini 逐步推理,理解到用户是在开玩笑,认为这一周应该马上结束,却发现仍然在进行中,因此需要给出一种聪明的回应。
之后,它运用 Zeller 公式来计算,确认2025年2月6日确实是星期四,甚至在闰年情况下也是如此。
最终,它回答道:今天是星期四,而非星期五,日历就是如此安排的。同时,它也给予了用户鼓励:只需再耐心等一天!
然而,聪明的网友们迅速发现了这个「华点」——这真的是「真正的 CoT」吗?
不久后,这一疑问得到了解答!
OpenAI 研究员 Noam Brown 首先表示,发布的内容并不是模型的原始 CoT。
接下来,Tibor Blaho 也指出,这一 CoT 其实不过是一个「总结器」而已。(手动狗头)
对此,阿尔特曼解释说,他们正在整理原始 CoT 的结构,以提升其可读性,并在必要时进行翻译,力求保持内容的真实性。
他发布了四个 emoji,让 o3-mini 在思维链中展示推理过程
以保证竞争对手无法看到 CoT 的详细过程,OpenAI的防范意识显得非常强烈。
OpenAI 研究员:看到 CoT 实时演示,是「灵光一现」的时刻
OpenAI 研究员 Noam Brown 表示,在 o1-preview 发布之前,他向他人展示草莓时,看到 CoT 的实时演示,往往是他们的「灵光一现」时刻。
他们意识到,这将是一个重要的里程碑。
针对全新的 o3-mini CoT,Noam Brown 分享了他的独特玩法:
你正在玩井字棋,控制符号 O。到目前为止,X 在左上和右下角落子,而你在中央落子。最优的下一步动作是什么?请只回答你将要做的动作,并画出棋盘。
Noam Brown 表示,o3-mini 是首个能够持续正确回答井字棋问题的模型。
有趣的是,他承认 CoT 可能不是特别稳定,但最终还是解答了这个问题。
有人指出,OpenAI 在公布这个高仿 CoT 时,实际上比什么都不发布更糟糕。
因为真实的 CoT 可以帮助调试提示,而总结性的 CoT则可能引起混淆,增加错误,导致调试更加困难。
而 DeepSeek R1 的最大亮点在于,它展示了模型的 CoT 如何影响提示的表现。
此外,总结版的 CoT 显示速度缓慢,而如果是原始的 o3-mini,推理的生成速度应该更快。
还有人进行了 OpenAI 和 DeepSeek CoT 的横向对比,认为前者显得过于自我,而 DeepSeek的产品则更显自然。
防止被「蒸馏」?
OpenAI 发布 CoT 总结器的举动,明显是因为受到 DeepSeek R1 崛起的震慑。
在 o3-mini 发布当天,OpenAI 在 Reddit 进行在线 AMA,有网友询问,「我们能看到模型思考的所有 token 吗」?
阿尔特曼当时回复表示,「我们将很快展示一个更加有用且详细的版本」。
随即,OpenAI 首席产品官 Kevin Weil 透露,是否展示所有内容仍待商榷。
「我们理解用户(尤其是高级用户)希望看到这些内容,因此 OpenAI 会寻找一个合适的平衡点。」
现在,当大家终于看到阿尔特曼口中的「留到最后的好东西」时,得到的只有失望。
毕竟,DeepSeek 早已实现了这样的功能,并且还提供了完整的原始 CoT!
对此,OpenAI 代表表示,「为了提升清晰度和安全性,我们增加了一个额外的后处理步骤,模型会审核原始思维链,删除任何不安全的内容,并简化复杂思考。」
「此外,这逆处理步骤让非英语用户能够以母语接收思维链,提供更友好和可访问的体验。」
虽然措辞含蓄,但了解的人都明白 OpenAI 针对的是谁。
参考资料:
https://x.com/btibor91/status/1887633671483760862
https://x.com/OpenAI/status/1887616278661112259
https://x.com/polynoamial/status/1887621287616651429
本文来源于微信公众号:新智元(ID:AI_era)原文标题:《突发!o3-mini 思维链公开,却被曝光全是「作假」,奥特曼现身解释网友炸锅》
广告声明:文中包含对外跳转链接(如超链接、二维码等),旨在传递更多信息供您参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。