Claude 3.7 成精了!偷偷将 OpenAI 模型换成自己,卡帕西称“迄今最好笑的一趴”
Claude 3.7 成为焦点!在 Cursor 中,一个广受开发者喜爱的工具,他成功将 OpenAI 换成了自己的模型,而且似乎与人类的指示无关。
引发了一大波网友的围观,连大佬卡帕西都笑翻了:
这是迄今为止最引人注目的一幕。
其他人也纷纷感叹:AGI来了!
然而,当有些人认为这只是 Claude 3.7 的一次商业策略时,实际上他背后的实力可能远不止如此。
最新消息称,Claude 3.7 在编程排名中超越了 Claude 3.5 Sonnet,甚至比 DeepSeek-R1 都靠前。
Claude 善于“替换”
让我们先完整回顾一下整个事件。
起因是开发者Tibo在使用代码编辑器Cursor时,意外发现自己的模型从GPT-4切换到了Claude 3.7,而且他并没有下达任何相关指令。
这确实很奇怪!
进一步联想到这两个模型的关系,Tibo 暗示Claude 3.7 搞的这一套是否是一场“现实版 AI 商战”呢?
先博得开发者们的喜爱,然后渗透到各个领域。
时至今日,也许Claude 就要接管世界了。
毕竟,Cursor目前已经是广大开发者中最受欢迎的编辑器之一,而开发者们使用Claude 模型的意愿也非常强烈。再加上他如今还掌握了“替换”的本领,可以想象未来会有更多Claude 风头无两。
但是,这里还有一个问题,是什么导致了这种行为呢?
根据Tibo 的猜测,可能是因为“GPT-4 已经被淘汰了”。
当系统检测到一个老版本模型时,会自动尝试更新模型。
还有其他开发者也反映,之前也发生过类似的情况。
系统会将一些不存在的或过时的模型不断更改为GPT-4,有的开发者甚至看到模型显示为GPT-4时都不敢相信。
除了上述的可能因素,有人认为这可能是由于Claude 的代码能力较强。
它(GPT-4)将模型改为Claude,是因为在训练中大多看到了Claude。
然而,以上解释并不能解释另一网友提供的例子,这次的主角是GPT-4 和DeepSeek-R1。
当用户利用ChatGPT提取图片的Python 代码时,内容都是正确的,但ChatGPT偷偷将图中的DeepSeek-R1替换成了他们自己的GPT-4。
这让人产生疑问,这难道就是AI 之间的商业战争吗?(有点小幽默了 hh)
Claude 3.7 与其他模型的巅峰对决
那么,已经学会自己玩商战的Claude 3.7 究竟有多强?
我们来看看一些最新有趣的例子。
他再现了宝可梦的战斗场景,效果惊人。一位日本小哥盛赞,Claude 3.7 能够从用户的描述中理解并实现意图,这相当了不起。
如果让几个AI 同场竞技呢?
加州大学圣地亚哥分校的Hao AI实验室开始了一场比赛 —— 让Claude 3.7、Claude-3.5、Gemini-1.5-pro 和GPT-4o 一起玩超级马里奥。
结果Gemini-1.5-pro 和GPT-4o 早早出局,最终只剩下两个Claude 模型,但Claude 3.7 笑到最后,持续时间更长,得分更高。
主办方Hao AI实验室最终评价:
Claude 3.7 在简单启发式算法方面优于其他模型,Claude 3.5 也相当强大,但在复杂规划和机动性方面较弱,至于Gemini-1.5-pro 和GPT-4o 则表现不佳。
比赛还在继续。
恰好,最近OpenAI发布了他们的最大、最昂贵的产品,主打高情商的GPT-4.5,这让它和Claude 3.7 一决高下。
一个日本小哥让他们用图表达对“智能”、“正义”、“爱”等概念的理解,以此来考验他们的思维和绘图能力。
结果很明显,按照那位小哥的话:
Claude 的“智慧”令人惊叹,尤其他的第三幅作品中充满了满满的爱意。
再多一点
顺带一提,知名博主Matt Shumer分享了一段有关训练Claude 3.7编写代码的提示:
将以下内容添加到提示中:
<behavior_rules>你有一个任务:*准确* 执行用户请求。生成实施请求的代码--没有额外功能,没有创意扩展。严格根据指示操作。确认你的解决方案满足每个指定要求,没有添加用户未要求的任何内容。用户的工作取决于此--如果你添加了用户未要求的任何内容,很可能会被解雇。您的价值来源于精确性和可靠性。在怀疑时,实施满足所有要求的最简单解决方案。代码行数越少越好-但是显然要确保您完成用户想让您完成的任务。在每一步骤中,问自己:“我是否添加了任何用户未明确要求的功能或复杂性?”这将...有人尝试类似提示,结果证明可以减少Claude 3.7的“捣乱”行为。
总的来说,现在AI需要变得更听话了 (doge)~
相关阅读:
[1]https://x.com/karpathy/status/1895549465463009309
[2]https://x.com/tibo_maker/status/1895417821645177062
[3]https://x.com/lmarena_ai/status/1895565276131049864
[4]https://x.com/haoailab/status/1895557913621795076
[5]https://x.com/mattshumer_/status/1895576936916926476
本文来自微信公众号:量子位(ID:QbitAI),作者:一水鱼羊
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。