Meta 工程师自曝疯狂熬夜复制 DeepSeek，天价高管也心虚

xxn 阅读：3916 2025-01-24 16:09:04 评论：0

团队Blind上的Meta员工爆出的爆料，给整个行业都带来了巨大的冲击。Meta自称是开源先锋，但却被中国公司DeepSeek击败得措手不及。工程师们不仅争分夺秒地复制DeepSeek的模型，而且高管们的年薪甚至超过了DeepSeek的训练成本，这让他们感到有些尴尬。

一篇关于Meta员工在匿名社区TeamBlind上发帖的帖子，正在业内传播。

DeepSeek以一个令美国人触目惊心的方式震撼了世界。

DeepSeek R1是世界上第一个与OpenAI o1媲美的AI模型，而且与o1不同，R1是一个开源模型，比OpenAI还要"Open"！

更有消息称，DeepSeek甚至是一个"副项目"，他们的主营业务根本不是建造大型模型！

现在，OpenAI还没有反应过来，Meta就已经紧张了！

毕竟Meta一直自诩为开源领军者，但DeepSeek这种程度的开源行动，直接让他们感到羞愧。

更糟糕的是，DeepSeek的成本非常低廉，相比之下，Meta手握高昂预算的团队显得很尴尬。

那些高管们每年的薪资，甚至超过了整个DeepSeek V3的训练成本（仅550万美元），这让他们感到不安。

根据Meta内部人士的爆料，去年DeepSeek的V3已经给他们带来了压力。

现在，Meta的工程师们正在竭尽全力，争分夺秒地分析DeepSeek，试图复制其中的所有可能技术。

以前全世界都在追随美国的大型模型，并用放大镜研究，如今情况竟然发生了逆转，美国人也开始反向工程了。局势正在发展到何种地步？

中国大型模型的崛起，让我们真切地感受到了神奇现实主义的味道。

Meta工程师感到惊恐

TeamBlind上的帖子曝光了全文内容：

一切源于DeepSeek V3的出现，它已经让Llama 4相形见绌。更让人尴尬的是，一家"仅用550万美元训练预算的中国公司"就做到了这一点。
工程师们正在紧密分析DeepSeek，试图复制其中的所有可能技术。这不是夸大其词。
管理层正在为如何证明GenAI研发部门的巨额投入而发愁。当一个高管的薪资已经超过了训练整个DeepSeek V3的成本，而且这样的高管数量还有几十人，他们如何向高层解释？
随着DeepSeek R1的出现，情况变得更加严峻。具体细节属于机密，无法透露，不过很快将会公之于众。
本应该是一个以工程为导向的小部门，但由于太多人想要分一杯羹，导致不自然地扩大招聘规模，最终每个人都为此付出代价。

无论如何，"一个高管等于DeepSeek V3"在成本上，这对那些为高管们开出天价年薪的硅谷大公司来说，无疑是一个巨大的打击。

有网友感到震惊："DeepSeek R1在OpenAI、Meta、Grok和谷歌之后点燃了一把火，就像OpenAI在推出ChatGPT时那样震撼。如果去除人力瓶颈，实现o1级性能真的不需要花费太多资金！！"

一些网友认为，在这场AI浪潮中，Meta确实落后了。

但是，也有网友为Meta辩护，毕竟Meta已经开始采取行动，尽管在GenAI领域确实存在"人员过剩"的现象。

甚至，这家来自中国的AI已经登上美国新闻头条。报道极度夸张——"中国初创企业DeepSeek威胁了美国AI的主导地位。"

"否认、愤怒、绝望、接受，美国人正在进行艰难的心理建设。这是他们历史上从未面对过的最强劲对手。"

不到600万美元的成本，就能够训练出如此强大的模型，这让美国在金融业上的遮羞布变得非常明显。AI产业真的需要投资数万亿美元吗？

与此同时，特朗普和阿尔特曼所推出的5000亿美元星际之门项目，也变得可疑起来。

DeepSeek-R1有多强大？

"花小钱办大事"这个例子清楚地展示了DeepSeek团队拥有的独特技巧，技术方面恐怕甚至超过了OpenAI。

DeepSeek还发表了相关论文，介绍了DeepSeek-R1的大规模强化学习（RL）训练、未经监督的微调（SFT）作为预处理步骤等技术细节。

论文链接：https://arxiV.org/ pdf/2501.12948

这种技术自信让一些美国网友开始反思。

为什么AI界如此畏惧DeepSeek？

VB最新一篇独家文章详细分析了AI领域黑马DeepSeek引发的一场轰动。

就在几天前，只有最专业的极客们才听说过DeepSeek。

这家公司成立于2015年，是幻方量化公司，背后有高飞资本管理者的支持。

然而，在过去几天里，这家公司迅速成为硅谷最令人关注的挑战者，这主要归功于DeepSeek R1的问世。

仅凭强化学习，不使用SFT，使模型的推理能力堪比o1，在多个基准测试中，R1甚至超越了o1。

面对这样一个强大的模型，仅需500万美元的训练成本，所使用的GPU数量也远低于OpenAI。

此外，他们开源了该模型，Hugging Face的下载量和活跃度都飙升了。

开发者可以自由调整训练，该API的成本比同类o1模型低90%。

与OpenAI只提供低性能模型网页搜索的做法不同，DeepSeek直接将R1与搜索功能深度整合。

在逐步推进的策略中，这家中国公司击败了OpenAI。

第一个，但不是最后一个

这绝不是最后一个挑战硅谷巨头地位的中国AI模型。

最近，字节推出了"Dou Package 1.5 Pro"，在第三方基准测试中，其性能与GPT-4o模型相当，但成本仅为后者的1/50。

中国模型的快速发展已经引起国际社会的关注：

《经济学人》杂志最近发表了一篇关于DeepSeek和其他中国企业成功的文章。

政治评论员Matt Bruenig的亲身经历更加证实了中国AI模型的实力。

总的来说，中国的AI呈现蓬勃发展，美国还需适应这种变化。

参考资料：

https://x.com/ClaudiuDP/status/1882460975661781376
https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n
https://x.com/MatthewBerman/status/1882488222896521396

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。