Claude 3.7 成精了!偷偷将 OpenAI 模型换成自己,卡帕西称“迄今最好笑的一趴”

xxn 阅读:76859 2025-03-01 14:03:21 评论:0

Claude 3.7 成为焦点!在 Cursor 中,一个广受开发者喜爱的工具,他成功将 OpenAI 换成了自己的模型,而且似乎与人类的指示无关。

引发了一大波网友的围观,连大佬卡帕西都笑翻了:

这是迄今为止最引人注目的一幕。

其他人也纷纷感叹:AGI来了!

然而,当有些人认为这只是 Claude 3.7 的一次商业策略时,实际上他背后的实力可能远不止如此。

最新消息称,Claude 3.7 在编程排名中超越了 Claude 3.5 Sonnet,甚至比 DeepSeek-R1 都靠前。

Claude 善于“替换”

让我们先完整回顾一下整个事件。

起因是开发者Tibo在使用代码编辑器Cursor时,意外发现自己的模型从GPT-4切换到了Claude 3.7,而且他并没有下达任何相关指令。

这确实很奇怪!

进一步联想到这两个模型的关系,Tibo 暗示Claude 3.7 搞的这一套是否是一场“现实版 AI 商战”呢?

先博得开发者们的喜爱,然后渗透到各个领域。

时至今日,也许Claude 就要接管世界了。

毕竟,Cursor目前已经是广大开发者中最受欢迎的编辑器之一,而开发者们使用Claude 模型的意愿也非常强烈。再加上他如今还掌握了“替换”的本领,可以想象未来会有更多Claude 风头无两。

但是,这里还有一个问题,是什么导致了这种行为呢?

根据Tibo 的猜测,可能是因为“GPT-4 已经被淘汰了”。

当系统检测到一个老版本模型时,会自动尝试更新模型。

还有其他开发者也反映,之前也发生过类似的情况。

系统会将一些不存在的或过时的模型不断更改为GPT-4,有的开发者甚至看到模型显示为GPT-4时都不敢相信。

除了上述的可能因素,有人认为这可能是由于Claude 的代码能力较强。

它(GPT-4)将模型改为Claude,是因为在训练中大多看到了Claude。

然而,以上解释并不能解释另一网友提供的例子,这次的主角是GPT-4 和DeepSeek-R1。

当用户利用ChatGPT提取图片的Python 代码时,内容都是正确的,但ChatGPT偷偷将图中的DeepSeek-R1替换成了他们自己的GPT-4。

这让人产生疑问,这难道就是AI 之间的商业战争吗?(有点小幽默了 hh)

Claude 3.7 与其他模型的巅峰对决

那么,已经学会自己玩商战的Claude 3.7 究竟有多强?

我们来看看一些最新有趣的例子。

他再现了宝可梦的战斗场景,效果惊人。一位日本小哥盛赞,Claude 3.7 能够从用户的描述中理解并实现意图,这相当了不起。

如果让几个AI 同场竞技呢?

加州大学圣地亚哥分校的Hao AI实验室开始了一场比赛 —— 让Claude 3.7、Claude-3.5、Gemini-1.5-pro 和GPT-4o 一起玩超级马里奥。

结果Gemini-1.5-pro 和GPT-4o 早早出局,最终只剩下两个Claude 模型,但Claude 3.7 笑到最后,持续时间更长,得分更高。

主办方Hao AI实验室最终评价:

Claude 3.7 在简单启发式算法方面优于其他模型,Claude 3.5 也相当强大,但在复杂规划和机动性方面较弱,至于Gemini-1.5-pro 和GPT-4o 则表现不佳。

比赛还在继续。

恰好,最近OpenAI发布了他们的最大、最昂贵的产品,主打高情商的GPT-4.5,这让它和Claude 3.7 一决高下。

一个日本小哥让他们用图表达对“智能”、“正义”、“爱”等概念的理解,以此来考验他们的思维绘图能力。

结果很明显,按照那位小哥的话:

Claude 的“智慧”令人惊叹,尤其他的第三幅作品中充满了满满的爱意。

再多一点

顺带一提,知名博主Matt Shumer分享了一段有关训练Claude 3.7编写代码的提示

将以下内容添加到提示中:

<behavior_rules>你有一个任务:*准确* 执行用户请求。生成实施请求的代码--没有额外功能,没有创意扩展。严格根据指示操作。确认你的解决方案满足每个指定要求,没有添加用户未要求的任何内容。用户的工作取决于此--如果你添加了用户未要求的任何内容,很可能会被解雇。您的价值来源于精确性和可靠性。在怀疑时,实施满足所有要求的最简单解决方案。代码行数越少越好-但是显然要确保您完成用户想让您完成的任务。在每一步骤中,问自己:“我是否添加了任何用户未明确要求的功能或复杂性?”这将...

有人尝试类似提示,结果证明可以减少Claude 3.7的“捣乱”行为。

总的来说,现在AI需要变得更听话了 (doge)~

相关阅读:

  • [1]https://x.com/karpathy/status/1895549465463009309

  • [2]https://x.com/tibo_maker/status/1895417821645177062

  • [3]https://x.com/lmarena_ai/status/1895565276131049864

  • [4]https://x.com/haoailab/status/1895557913621795076

  • [5]https://x.com/mattshumer_/status/1895576936916926476

本文来自微信公众号:量子位(ID:QbitAI),作者:一水鱼羊

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容