DeepSeek-R1 持续震撼硅谷：跻身竞技榜前三，创始人梁文锋采访被“拿放大镜”看

xxn 阅读：60272 2025-01-25 16:02:36 评论：0

深受“神秘东方力量”DeepSeek影响的硅谷，正在经历着持续的震荡 ——

最新消息显示，DeepSeek-R1在大型模型竞争榜上跻身前三名。其开源、价格仅为ChatGPT-4o（2024.11.20）的五分之一。

在复杂提示词/风格控制榜单上，R1夺得首席。

目前综合看来，DeepSeek-R1在各个方面保持领先地位。

关于模型编程开发能力的WebDev排行榜上，R1名列第二，仅落后于闭源的Claude 3.5 Sonnet大约40分。

网友的实际体验显示，R1在30场对决中只输了4、5次。

另一方面，硅谷对DeepSeek仍持浓厚兴趣。

毕竟，这被视为一项重要的“副业”。

DeepSeek创始人梁文锋的中文采访被翻译成英文，深入挖掘每个字的含义。

他的观点被总结成箴言，在网络上传播。

真正的不同之处在于原创与模仿，而不在于1年还是2年。

图灵奖得主LeCun也对DeepSeek做出了中肯评价：

它代表着开源的影响力。
这说明开源模型正在超越专有模型。

值得注意的是，另一开源领域代表Meta刚刚发布了2025年在AI领域的布局计划：650亿美元，以算力和人才为投资重点。

据爆料，Meta内部因DeepSeek而感到紧张。

“他们让OpenAI一次又一次看清自己”

因此，硅谷更加关注DeepSeek的哪些信息？

最关键的问题可能是DeepSeek如何盈利。

一些信息显示，或许DeepSeek并没有考虑赚钱。

幻方量化掌控DeepSeek，其团队拥有一批顶尖科学家和充足的计算资源，DeepSeek实际上是一种“副产品”。
在2023年底，我就听说他们在研发DeepSeek。当时甚至在中国，还没有人把他们当回事。

其次，DeepSeek能够成功的原因何在。梁文锋在2023年5月和2024年7月接受了暗涌两次采访，这也被外界发现。

他们最感兴趣的五个方面包括：

1、创新至上原则：DeepSeek专注于基础的AGI研究和创新，与其他中国AI企业专注于快速商业化有所不同。他们认为，中国应该从全球人工智能"搭便车者"转变为"贡献者"。梁文锋说，创新不仅仅是商业推动的，还需要好奇心和创造欲。

2、颠覆性架构：DeepSeek V2采用新型MLA（多头潜在注意力机制）架构，将显存占用率降低到过去流行的MHA架构的5%-13%，从而实现了成本大幅降低。其推理成本只有Llama 370B的1/7、GPT-4 Turbo的1/70。

这并非为了引发价格战 ——他们只是在成本上稍微盈利来定价。这种创新架构持续应用于V3和R1模型中。

3、独特的企业文化和人才战略：DeepSeek保持一种完全自下而上的组织结构，为研究员提供充足的计算资源，优先考虑创造热情而非证书。他们的突破性创新源自于中国本土年轻人才 —— 应届毕业生和年轻技术人才，而非海外招聘。

4、致力于开源：尽管行业趋向于闭源模型（如OpenAI和Mistral），DeepSeek仍然坚持开源，并认为开源对于构筑强大的技术生态系统至关重要。梁文锋认为，在面临颠覆性技术时，闭源所形成的壁垒是短暂的。

他们真正的价值在于打造一个富有创新能力的组织。

5、底层计算挑战：尽管拥有充裕的资金和技术，DeepSeek依然面临来自底层计算的挑战和压力。目前公司并无新的融资计划。梁文锋认为，面临的主要限制并非资金，而是高端算力的使用权限，这些芯片对于训练先进AI模型至关重要。

除了这些方面，众多细节也受到网友的密切关注。

在一次采访中，梁文锋被问及：如何看待同时从事量化和大规模基础研发，不进行过度投资？

他的回答显示：有些事情是不能仅仅用金钱来衡量的。就像购买一台钢琴，一方面是因为有能力购买，另一方面是因为有一群渴望弹奏乐曲的人。

海外观察者感慨：

这些人是一群有些理想主义的“技术狂”，他们相信自己可以创造通用人工智能（AGI），而且他们确实具备这种资源和天赋。我真的很喜欢他们！

另外，也难免有一些比较：

梁文锋展现出一种完全不同的心态，他们的成功实至名归，我也很期待看到他们一次又一次让“OpenAI”看清自己。

在AI领域的整体发展中，DeepSeek的出现对于所有人来说无疑是令人激动的。

虽然我觉得他们有些过于天真，毕竟在商业化方面他们可能有点“自毁前程”。但看到一支团队坚守理想并取得成功，确实让人感到鼓舞。

随着R1的惊艳亮相，DeepSeek正在实现其宣言。宽广技术边界、坚持开源、专注于技术开发……

那么，DeepSeek是如何走到今天的呢？

用AI进行量化，再返回AI

梁文锋在浙江大学信息与电子工程学专业完成本硕学业。

2008年，梁文锋毕业后带领团队利用机器学习等技术探索全自动量化交易。

当时，量化投资在国内仍然是个新概念，其是否赚钱尚属未知。2010年，沪深300股指期货推出，量化投资声名鹊起。据公开信息，梁文锋团队抓住了这一机遇，很快自营资金超过50亿元。

与此同时，深度学习浪潮开始兴起，人工智能在硅谷率先崛起。

2015年，梁文锋与校友共同创立幻方量化。仅仅1年后，他们推出了旗下首个AI模型，由深度学习生成的第一个交易仓位上线执行，使用GPU进行计算。

2017年，幻方量化宣称实现了投资策略全面AI化。

2018年，幻方量化确立AI为公司的主要发展方向。

在AI的加持下，幻方量化基金回报率远超同期沪深300指数。2019年，资金管理规模突破100亿元。

2019年，梁文锋在当年的金牛奖颁奖典礼上发表了《一名程序员眼里中国量化投资的未来》主题演讲，这是其难得的公开演讲。

演讲全文充满“程序员视角”：

量化公司没有基金经理，基金经理就是一堆服务器。人类做投资决策时，这是一种艺术，需要凭感觉。程序来决策时，这是一门科学，有最佳解。

同时，在幻方量化的官网上，一直都在强调AI基础科学研究的重要性，即使在大型模型的兴起之前。

幻方量化曾表示，多年来，该公司一直将大部分营收投入人工智能领域，建设领先的AI硬件基础设施，进行大规模研究，探索未知奥秘。

我们相信，几乎所有的创新都源自于大胆尝试和点滴积累。

2023年，幻方量化将研发大型模型的独立组织命名为深度求索，并明确表示将专注于创造真正的人类级别人工智能。

目标不是重复ChatGPT，而是研究和揭示AGI的更多未知信息。

DeepSeek的故事也在此刻开始。

一个80后的程序员在搅动中国量化市场后积累资金，组建了一个年轻充满活力的团队，似乎又回到了最初的起点，回归AI，但所产生的能量正在全球激起涟漪。

DeepSeek-R1 持续震撼硅谷：跻身竞技榜前三，创始人梁文锋采访被“拿放大镜”看

“他们让OpenAI一次又一次看清自己”

用AI进行量化，再返回AI

声明 1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。 相关文章

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。

相关文章