大模型创业太累大牛逃回大厂:融资 1 亿美金捉襟见肘,没日没夜加班胖了 30 斤

xxn 阅读:29092 2024-11-26 20:04:22 评论:0

大型创业项目辛苦,一位知名人士决定回到知名公司。

曾创立Reka AI的Yi Tay曾是谷歌大型项目PaLM、UL2、Flan-2、Bard的重要成员。

本周他重返谷歌,在离开创业一年半后选择回到以前的角色。他将继续担任谷歌DeepMind高级研究员,向谷歌前老板Quoc Le汇报。

回顾创业经历,他分享了许多学到的东西,如基础设施知识和训练大型模型等。但这段经历也带来了挑战:

  • 公司勉强筹到了一亿美元资金,但对于少于15人的团队来说依然紧张,差点陷入危机。

  • 工作压力和不健康的生活方式导致他增重15公斤,对身心健康造成影响。

他说:

放弃舒适区创业对我个人来说是很可怕的。

知名人士回到谷歌

去年三月底宣布离开谷歌创业RekaAI,并担任首席科学家。

此前在谷歌大脑工作了3.3年,参与大型项目研究并出版约45篇论文,包括UL2、U-PaLM、DSI、Synthesizer、Charformer和Long Range Arena等,约有20次产品发布。

从技术方面来看,他表示在谷歌学到了很多无法获得的知识,如使用Pytorch/GPU和其他外部基础设施,以最优的成本构建模型。

他在个人网站上分享了相关经验:获取计算能力是训练模型的关键,但这过程像在买彩票。

硬件的质量差异很大,选择合适的硬件是训练好模型的必要条件,这有点像在抽签。总而言之,这是硬件彩票时代。

他惊讶于GPU的故障率与谷歌TPU相比。

他批评外部代码库质量不如谷歌,对于大规模编码器-解码器训练支持不足。

解决问题的过程实际很有趣,并以自身技术实力度过难关。

创业早期,旗舰模型Reka Core在Lmsys排名第7,公司排名前五,超越GPT-4早期版本。

目前公司拥有四个适用于不同应用场景的模型。

离职的原因更现实。

初创公司在资金、算力和人力等方面落后,即使筹集了一亿美元,对于少于15人的团队还不够。

今年5月,有传闻Snowflake正讨论以超过10亿美元收购Reka AI。

收购尚未达成,公司现在正积极招聘。

这是个压力巨大的时期,刚开始创业时妻子怀孕,他需要兼顾两边,导致身心健康受损。工作强度和不健康生活方式让他增重15公斤。

他透露自己有睡眠障碍。

因此,他选择回到谷歌,重回研究者身份。

在探索一年半之后,我决定回到我的研究基础。

他将继续探索大型项目相关的研究,以高级研究员身份向老板Quoc Le汇报。

在博客结尾,他感谢一直支持他的谷歌老朋友,特别感谢和他在新加坡共进晚餐的Jeff Dean,并提醒他Google很棒。

欢迎重回谷歌

一些谷歌老同事表示:欢迎回来!感觉时间过得飞快。

不只有他,其他大牛也选择回到大公司不是个例。

今年8月,谷歌耗资25亿美元带走了明星AI独角兽Character.AI的核心技术团队,超过Character.AI的10亿美元估值。

其中包括两位创始人Noam Shazeer和Daniel De Freitas。Noam Shazeer将担任Gemini联合技术主管。

对于这些大牛来说,大型创业项目确实挑战重重。重返大公司可能是一个良好选择,财力和算力都足够,可以专心做研究。

随着新一轮洗牌开始,更多技术人才正聚集到科技巨头身边,这一趋势已经初步显现。

参考链接:

  • [1]https://x.com/YiTayML

  • [2]https://www.yitay.net/?author=636616684c5e64780328eece

  • [3]https://www.yitay.net/blog/training-great-llms-entirely-from-ground-zero-in-the-wilderness

  • [4]https://www.yitay.net/blog/leaving-google-brain

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容