Meta 工程师自曝疯狂熬夜复制 DeepSeek,天价高管也心虚

xxn 阅读:3793 2025-01-24 16:09:04 评论:0

团队Blind上的Meta员工爆出的爆料,给整个行业都带来了巨大的冲击。Meta自称是开源先锋,但却被中国公司DeepSeek击败得措手不及。工程师们不仅争分夺秒地复制DeepSeek的模型,而且高管们的年薪甚至超过了DeepSeek的训练成本,这让他们感到有些尴尬。

一篇关于Meta员工在匿名社区TeamBlind上发帖的帖子,正在业内传播。

DeepSeek以一个令美国人触目惊心的方式震撼了世界。

DeepSeek R1是世界上第一个与OpenAI o1媲美的AI模型,而且与o1不同,R1是一个开源模型,比OpenAI还要"Open"!

更有消息称,DeepSeek甚至是一个"副项目",他们的主营业务根本不是建造大型模型!

现在,OpenAI还没有反应过来,Meta就已经紧张了!

毕竟Meta一直自诩为开源领军者,但DeepSeek这种程度的开源行动,直接让他们感到羞愧。

更糟糕的是,DeepSeek的成本非常低廉,相比之下,Meta手握高昂预算的团队显得很尴尬。

那些高管们每年的薪资,甚至超过了整个DeepSeek V3的训练成本(仅550万美元),这让他们感到不安。

根据Meta内部人士的爆料,去年DeepSeek的V3已经给他们带来了压力。

现在,Meta的工程师们正在竭尽全力,争分夺秒地分析DeepSeek,试图复制其中的所有可能技术。

以前全世界都在追随美国的大型模型,并用放大镜研究,如今情况竟然发生了逆转,美国人也开始反向工程了。局势正在发展到何种地步?

中国大型模型的崛起,让我们真切地感受到了神奇现实主义的味道。

Meta工程师感到惊恐

TeamBlind上的帖子曝光了全文内容:

一切源于DeepSeek V3的出现,它已经让Llama 4相形见绌。更让人尴尬的是,一家"仅用550万美元训练预算的中国公司"就做到了这一点。

工程师们正在紧密分析DeepSeek,试图复制其中的所有可能技术。这不是夸大其词。

管理层正在为如何证明GenAI研发部门的巨额投入而发愁。当一个高管的薪资已经超过了训练整个DeepSeek V3的成本,而且这样的高管数量还有几十人,他们如何向高层解释?

随着DeepSeek R1的出现,情况变得更加严峻。具体细节属于机密,无法透露,不过很快将会公之于众。

本应该是一个以工程为导向的小部门,但由于太多人想要分一杯羹,导致不自然地扩大招聘规模,最终每个人都为此付出代价。

无论如何,"一个高管等于DeepSeek V3"在成本上,这对那些为高管们开出天价年薪的硅谷大公司来说,无疑是一个巨大的打击。

有网友感到震惊:"DeepSeek R1在OpenAI、Meta、Grok和谷歌之后点燃了一把火,就像OpenAI在推出ChatGPT时那样震撼。如果去除人力瓶颈,实现o1级性能真的不需要花费太多资金!!"

一些网友认为,在这场AI浪潮中,Meta确实落后了。

但是,也有网友为Meta辩护,毕竟Meta已经开始采取行动,尽管在GenAI领域确实存在"人员过剩"的现象。

甚至,这家来自中国的AI已经登上美国新闻头条。报道极度夸张——"中国初创企业DeepSeek威胁了美国AI的主导地位。"

"否认、愤怒、绝望、接受,美国人正在进行艰难的心理建设。这是他们历史上从未面对过的最强劲对手。"

不到600万美元的成本,就能够训练出如此强大的模型,这让美国在金融业上的遮羞布变得非常明显。AI产业真的需要投资数万亿美元吗?

与此同时,特朗普和阿尔特曼所推出的5000亿美元星际之门项目,也变得可疑起来。

DeepSeek-R1有多强大?

"花小钱办大事"这个例子清楚地展示了DeepSeek团队拥有的独特技巧,技术方面恐怕甚至超过了OpenAI。

DeepSeek还发表了相关论文,介绍了DeepSeek-R1的大规模强化学习(RL)训练、未经监督的微调(SFT)作为预处理步骤等技术细节。

论文链接:https://arxiV.org/ pdf/2501.12948

这种技术自信让一些美国网友开始反思。

为什么AI界如此畏惧DeepSeek?

VB最新一篇独家文章详细分析了AI领域黑马DeepSeek引发的一场轰动。

就在几天前,只有最专业的极客们才听说过DeepSeek。

这家公司成立于2015年,是幻方量化公司,背后有高飞资本管理者的支持。

然而,在过去几天里,这家公司迅速成为硅谷最令人关注的挑战者,这主要归功于DeepSeek R1的问世。

仅凭强化学习,不使用SFT,使模型的推理能力堪比o1,在多个基准测试中,R1甚至超越了o1。

面对这样一个强大的模型,仅需500万美元的训练成本,所使用的GPU数量也远低于OpenAI。

此外,他们开源了该模型,Hugging Face的下载量和活跃度都飙升了。

开发者可以自由调整训练,该API的成本比同类o1模型低90%。

与OpenAI只提供低性能模型网页搜索的做法不同,DeepSeek直接将R1与搜索功能深度整合。

在逐步推进的策略中,这家中国公司击败了OpenAI。

第一个,但不是最后一个

这绝不是最后一个挑战硅谷巨头地位的中国AI模型。

最近,字节推出了"Dou Package 1.5 Pro",在第三方基准测试中,其性能与GPT-4o模型相当,但成本仅为后者的1/50。

中国模型的快速发展已经引起国际社会的关注:

《经济学人》杂志最近发表了一篇关于DeepSeek和其他中国企业成功的文章。

政治评论员Matt Bruenig的亲身经历更加证实了中国AI模型的实力。

总的来说,中国的AI呈现蓬勃发展,美国还需适应这种变化。

参考资料:

  • https://x.com/ClaudiuDP/status/1882460975661781376

  • https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

  • https://x.com/MatthewBerman/status/1882488222896521396

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容