7月AI人才抢夺战升级!伯克利系主任加盟Anthropic,大学“输血”AI公司成趋势 从MIT到伯克利理论计算机科学的“标准满配”履历7月1日下午一条推文在硅谷学术圈引起轩然大波。UC伯克利EECS计算机科学部的掌门人理论计算机科学教授Jelani Nelson放下办公室钥匙前往Anthropic。他在X上发帖称“我已加入Anthropic并从大学休假。很高兴与许多有才华、有使命感的人一起研究我们这个时代的决定性技术。”短短两句话透露了丰富信息人已到岗教职保留方式是休假。不过职务、团队、方向等信息一概未提。Nelson在X上的简介已同步更新显示他成为Anthropic技术研究员Member of Technical Staff与5月刚加盟的Karpathy成了同事。这位执掌全美第一梯队计算机科学部的人说走就走。AI公司抢人已持续三年从工程领域拓展到产品领域从对齐方向延伸到多模态方向。这次他们的手伸向了理论计算机科学的塔尖。从MIT到伯克利理论计算机科学的“标准满配”履历Nelson的履历堪称理论计算机科学的标准模板。他初中自学HTML搭建网站高中学会编程大学期间通过竞赛证明自己能快速写出无bug的代码。本硕博都在MIT完成2011年获得计算机科学博士学位研究方向是海量数据的高效算法。他形容这门学科对自己的吸引力“近乎宗教”认为它既是人类思维最核心的基础问题又与真实世界紧密相连。博士毕业后他先后在伯克利、普林斯顿大学和普林斯顿高等研究院IAS做博士后2013年加入哈佛任教。2019年Nelson离开哈佛西迁到UC Berkeley。哈佛校报在标题中表达了惋惜他的离开给计算机系留下了一个巨大空白Big Hole。到了伯克利Nelson如鱼得水投身于西蒙斯理论计算研究所Simons Institute所在的理论圈。2024年秋天他接任EECS计算机科学部主任Chair掌管这个全球顶尖的CS学部之一。他的主攻方向是流式算法streaming algorithms、降维dimensionality reduction、随机算法randomized algorithms简单来说就是研究数据大到装不下时的计算方法。几年前他关注到一个类似小学题的问题让计算机学会数数。这个问题看似简单但当数字大到手机和服务器都记不住“前面数到哪了”存储和速度的代价就会失控。他的团队给出了一个数学公式证明任何解决这个问题的算法至少需要多少内存。Nelson团队的论文证明了近似计数问题的内存下界相关链接为https://arxiv.org/pdf/2010.02116 。工程师追求程序的速度Nelson则证明程序最快能达到的速度。这就是理论计算机科学家的工作为计算设定物理下限。Nelson在学术圈的贡献远不止“数数”这一项。一是他和Kasper Green Larsen一起证明了约翰逊 - 林登斯特劳斯引理Johnson - Lindenstrauss lemma的最优性这是降维领域的基石他将理论下界确定下来。此前他还与Daniel Kane提出了稀疏JL变换。二是他和Kane、David Woodruff一起给出了count - distinct问题一条数据流里究竟有多少个不同元素的渐近最优算法。在他看来即使是“数数”这样简单的事情背后也存在理论最优解。这些工作为他带来了众多荣誉如斯隆研究奖、美国总统青年科学家与工程师奖PECASE等。学术之外的另一面学术之外Nelson还有丰富的经历。2011年还在MIT读博的他前往埃塞俄比亚创办了免费编程夏令营AddisCoder。十四年来近700名学员从这里毕业其中一批人进入哈佛、MIT、斯坦福等高校攻读博士。后来牙买加雷鬼巨星Chronixx主动捐款催生了姊妹项目JamCoders。Nelson还是加州数学课程改革的激烈反对者之一。他的祖父出身贫寒通过优质的公共教育成为一名医生改变了整个家族的命运。因此他认为把严格的数学课从公立学校移除相当于抽走下一代人翻身的梯子。这份“学术之外”的事业为他赢得了ACM Lawler人道主义贡献奖。Anthropic为何需要理论学者一个研究流式算法的教授与大模型公司有什么关联呢Nelson的研究方向流式算法、降维、随机算法本质上都是研究如何用最少的内存和计算处理最大的数据。这与大模型领域最烧钱的几个方面——训练效率、数据压缩、计算复杂度相契合。以他补全的JL引理为例它回答了一个看似常识的问题高维数据最多能压缩到多小而不失真。如今广泛应用的向量检索与嵌入压缩其底层逻辑都基于这条引理。训练前沿模型本质上是在海量数据流上进行压缩和筛选推理过程中显存、缓存、上下文窗口等都与内存和复杂度密切相关。而这正是Nelson钻研了二十年的领域。当模型规模受到算力和数据的限制“节省”的价值超过了“堆积”AI竞争的重点正从“谁的模型更强”转向“谁的底层算法更省”。流式与随机算法这套工具与“用有限资源逼近最优解”的问题天然契合击中了所有前沿实验室的共同痛点。从这个角度看Anthropic签下一位理论计算机科学家更像是在模型、工程、对齐之外进一步夯实理论基础。顶级教授入职AI公司流行“休假模式”关于入职AnthropicNelson表示是“taken leave from the university”即从大学休假leave of absence。休假和辞职不同教职得以保留随时可以返回。这是美国学界的成熟制度教授可以带薪或停薪离校一段时间去业界、创业或从事其他活动。早在2017年李飞飞就利用学术假期出任Google副总裁兼云AI首席科学家两年后回归斯坦福。如今学界和产业之间的交流日益频繁“休假入职”成为主流模式。对学者来说这是一份保障同时产业界还能提供学界所没有的算力、数据和实际问题。对AI公司而言这是一条低阻力的引才途径。更重要的是签下一位学者意味着获得他身后的学生、同行和整个学术网络。“拿到终身教职tenure、干到退休”的传统模式正逐渐被“半只脚进产业”的休假模式取代。对大学来说一旦开启这个通道就很难再关闭。AI巨头抢人大战战火蔓延至大学刚刚过去的6月AI人才市场异常火爆。6月18日Transformer论文作者、Gemini共同负责人Noam Shazeer宣布离开谷歌加入OpenAI。要知道谷歌2024年花费27亿美元将他从Character.AI买回不到两年他就再次跳槽。6月19日凭借AlphaFold获得2024年诺贝尔化学奖的John Jumper宣布离开效力近九年的DeepMind加入Anthropic。由于受DeepMind高层竞业条款约束他可能要到明年才能正式到岗。6月24日Bloomberg报道Gemini核心研究员Jonas Adler和Alexander Pritzel也将加入Anthropic他们都是Jumper蛋白质结构工作的合作者。消息传出后Alphabet股价下跌投资者开始质疑谷歌能否留住人才。此时人才争夺还局限于AI公司之间。很快战火蔓延到了大学。6月25日在伯克利任教19年的AI安全学者Dawn Song宣布加入Meta超级智能实验室担任AI研究副总裁。7月1日Nelson也加入了Anthropic。短短两周内一位诺奖得主、两位Gemini核心研究员、一位资深教授和一位现任系主任纷纷跳槽。其中Jumper、Adler、Pritzel、Nelson四人都流向了Anthropic。这波人才流动的背景不难理解。OpenAI已秘密递交IPO文件Anthropic也被多个信源指向临近上市。对顶级研究者来说此时入职意味着获得上市前的股权这是大厂无法提供的待遇。伯克利在这轮人才迁徙中扮演了重要角色。Simons理论计算研究所和全美第一梯队的EECS都位于此地理论、机器学习系统、AI安全三条线不断为Anthropic、OpenAI、DeepMind输送人才。AI巨头上一轮争夺的是会训练模型的人这一轮则瞄准了了解模型极限的人。当顶级学者纷纷涌入AI公司这些公司正在逐渐形成一套“第二研究机构体系”。如果最好的理论家都在公司“休假”大学将何去何从无人知晓。唯一可以确定的是AI竞赛的焦点已经从模型能力深入到算法理论层面。