PyTorch 灵魂人物 Horace He 从 Meta 出走，选择 OpenAI 前 CTO 初创公司

xxn 阅读：42243 2025-03-05 14:02:06 评论：0

Python技术专家Horace He突然宣布，加入Thinking Machines。

「在Meta，离职时发布一张工牌照片是一种传统。遗憾的是，我找不到我的正式工牌了，所以只能用临时工牌代替」

毕业后，在Meta的PyTorch工作4年后，Horace He终于决定探索一些新的事物。

在最新博客文章中，他解释了离职PyTorch的原因以及加盟TM的动机：

为什么在PyTorch待了4年？
为什么Thinking Machines对其如此有吸引力？

全文链接：https://www.thonking.ai/p/why-pytorch-is-an-amazing-place-to

前OpenAI CTO，Thinking Machines创始人Mira Murati首次发文，表示期待与Horace He共事。

斯坦福AI实验室教授表示，「Horace He的离职对Meta来说，是一个巨大的损失」。

PyTorch之父SoumithChintala对其给予高度评价：

你对PyTorch的贡献以及间接对AI世界的影响将永远被低估，甚至可能在几年后就被抹去（就像历史记录常常会发生的那样）。
所以，我想郑重地说：这对PyTorch项目来说是一个巨大的损失。如果没有你，PyTorch过渡到编译模式，以及在生成式AI浪潮中保持竞争力将会难上无数倍。

那么，这样一位牛人，为何选择离开并加入Thinking Machines呢？

OpenAI、SSI硅谷大厂为他争破头

坦白说，这个问题不太好回答。

工作了大约4年后，我决定离开PyTorch，加入Thinking Machines担任创始团队工程师。

我特别强调的是「加入Thinking Machines担任创始团队工程师」而不是「离开PyTorch」。因为我一直很享受在PyTorch工作，并愿意继续待上4年。

在过去几年里，我多次听到人们对于我仍在PyTorch工作感到惊讶。

这并非自夸，但也绝非因为缺乏机会-我曾受到OpenAI、Anthropic的职位邀请，也被xAI、SSI、Adept、Inflection等公司招募为创始工程师，同时收到了许多其他初创企业的职位邀请。

现在回头看，这些机会中的许多本可能带来更丰厚的回报，但我从未后悔留在PyTorch。

接下来，我将分享我在PyTorch工作的这4年中的乐趣以及加入Thinking Machines的决定动机。

PyTorch这四年，很享受

与PyTorch的缘分

称自己为AI的「忠实信徒」，似乎是恰当的。

自高中时看到AlphaGo比赛，并阅读了WaitButWhy关于AI的文章后（尽管十年后再看未必经得起批判），我一直坚信AI将成为我生命中最重要的技术。

从2016年进入大学以来，我做的大部分事情都与AI相关。

选修机器学习课程、创建本科生机器学习研究社团、发表论文，甚至认识女友（现在未婚妻）也是在一起从事机器学习研究时的。

然而，纯粹从事机器学习研究，有几点令我感到不满意。

首先，虽然我发表了论文等成果，但即使在当时，我也不确定我所从事的研究是否真的「有意义」。

研究中一个令人沮丧的方面是，回顾历史，99%的论文最终不会成为推动AI发展「主流方向」的一部分。

从悲观的角度看，任何花时间研究n-gram模型的博士基本上都是在浪费时间-他们的论文和著作最终会被历史所遗忘。

尽管不在主流方向上的论文仍可能有价值（例如展示现有方法的局限性，为新方法提供可超越的基准），但这种疑虑一直萦绕在我心头。

其次，我从未能很好地适应机器学习中那种「实验驱动」的工作模式-我的工作风格比较不规律，时而深度思考，时而集中编码。

成为一名优秀的机器学习实验者需要极强的自律-这是一个不断循环的过程：提出假设=>运行实验=>获取上一个实验的结果=>提出新的假设，通常还要同时管理多个实验阶段。

在机器学习研究中，你面临着物理资源限制（GPU），要成为一个好的研究者，你必须学会充分利用GPU资源进行实验。

总的来说，我更倾向于「系统」领域。这不仅是一个我认为能发挥自己优势的方向，我也一直很欣赏系统工作的影响力。

与其直接产生影响，不如通过提升千万甚至数百万人5%的工作效率来间接创造更大的价值！

就这样，我找到了自己的职业定位-不是直接投身于推动机器学习技术的发展，而是专注于建设基础架构，帮助他人加速机器学习领域的创新。

当然，中间经历了不少波折，但这就是我与PyTorch结缘的故事。

PyTorch对行业的影响力

随着这个领域（还有资金）在过去10年的爆炸式增长，人们很容易忽略PyTorch究竟产生了多么深远的影响。

或许追踪这个领域资金流向最直观的指标就是英伟达的股价了，它主要受服务器GPU销售增长的推动。

我认为可以合理推测，至少75%的这些GPU都在运行某种形式的PyTorch代码。

这简直令人难以置信。英伟达增长了约3万亿美元的市值，而PyTorch在这一成就中功不可没。

不仅如此，在整个机器学习社区中，PyTorch依然是大家的「通用语言」。

Papers With Code追踪的研究论文中有59%使用PyTorch（另有29%不使用任何机器学习框架），Huggingface平台上绝大多数模型（超过90%？）都构建在PyTorch之上，最受欢迎的推理服务器如vllm和sglang也都基于PyTorch开发。

即使在顶尖AI实验室中，几乎所有使用GPU的公司都在使用PyTorch。OpenAI、Mistral、Deepseek和Meta主要使用PyTorch（和GPU）。Anthropic也主要在GPU上使用PyTorch，而xAI（虽然在GPU训练上使用Jax）也通过sglang使用PyTorch进行推理！

在高中时期，我最担心的事情之一就是自己会花上10年时间投入某个项目，最后却发现我浪费了大好时光去完善一个无人问津的东西。

而在PyTorch工作的最大幸运之一，就是我确信自己绝对没有做这样的无用功。

PyTorch对我的影响

我的整个职业生涯（到目前为止）都在PyTorch度过，因此，除了PyTorch的整体影响外，我想聊聊为什么我如此享受这里的日常工作。

目标共识

创业公司最棒的事情之一是「目标共识」。因为你的大部分薪酬都与股票升值挂钩，所以「我的同事大获成功」和「我们所有人都大获成功」其实是一回事。

而在大型科技公司，人们的薪酬主要与个人绩效评分（和晋升）挂钩。因此，如果你开始研究一种方法，而其他人提出了一种不同的、非常成功的方法（并取代了你的方法），你的绩效评分很可能会下滑，晋升机会也会随之渺茫。

然而在PyTorch，项目中的许多人都有着共同的使命感-他们真心在乎PyTorch的整体成功及其对机器学习生态系统的影响。

我当然不会说团队中100%的人都是如此，但已经足够多（尤其是在资深人士中），这让工作体验变得更加愉快。

真正致力于开源

Soumith（和其他领导层）在PyTorch营造重视开源的文化氛围方面做得非常出色。

还有许多其他恰好是开源的项目，但你通常只能通过优先考虑内部项目来获得晋升和影响力。

在PyTorch不是这样，我可以说我在这里的全部时间主要专注于开源影响力，而且我在评级和晋升方面都很成功。（当然，也有其他主要关注内部影响的同事同样非常成功）。

在其他方面，重视开源也会让整个项目更加健康。

不可操控的影响力

在大型科技公司中，我不太喜欢的一种现象是我称之为「规划导向的采用模式」。这是指两位经理/主管/副总裁聚在一起，同意应该使用X项目（可能会淘汰Y项目），然后项目的采用被列入几个团队的规划路线中。

虽然这当然有其优势（在某些情况下甚至是完全必要的），但我发现以这种方式采用的项目往往差强人意。

此外，这些项目的成功常常是一种虚假繁荣-只要有某位副总裁赞助项目，它们就会继续存在，但最终人们会厌倦它，副总裁会在内部博弈中失势，或者副总裁只是改变了主意。基

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。