这篇 Anthropic 研究员的文章,讲透了高手如何做成事 这篇 Anthropic 研究员的文章讲透了高手如何做成事从 Vivek 的研究方法论说起当 AI 降低执行成本后人最该训练的是选问题、快试错、看结果、持续修正的能力。最近读到 Anthropic 研究员 Vivek 写的一篇文章标题是《How to be good at research》。中文版本Anthropic 研究员 Vivek如何真正擅长研究表面看这是一篇写给研究者的文章怎么选研究问题怎么读论文怎么做实验怎么训练自己的 taste怎么让研究循环跑得更快。但我读完之后反而觉得它不只是研究方法论。它真正讲的是一件更普通、也更重要的事一个人如何在模糊、不确定、没人给标准答案的情况下把事情一步步做成。先说结论AI 正在降低很多事情的执行成本。找资料更快了写代码更快了生成方案更快了总结论文更快了写一版文档也更快了。但也正因为执行变快了另一些能力开始被放大你能不能选对问题你能不能把一个大而模糊的目标拆小你能不能快速验证而不是空想你能不能看懂失败而不是只看好看的指标你能不能持续修正自己而不是只是持续产出Vivek 这篇文章最好的地方就是它没有把这些东西讲成抽象道理。它讲得非常实在几乎每一点都可以直接变成行动。一、高手不是先忙起来而是先选对问题很多人做事的第一个问题是太快进入执行。老板给了一个题目导师给了一个方向市场上突然流行一个概念同行都在做某件事于是自己也开始做。这看起来很勤奋但里面有一个危险你接过来的往往只是别人的结论不是别人的推理过程。你知道别人为什么在做这个方向吗你知道他们期待看到什么结果吗你知道如果结果不对他们什么时候会放弃吗你知道这个问题背后真正的约束是什么吗如果这些都不知道你其实不是在做一个自己理解的问题而是在追一个别人已经定义好的战场。这在 AI 时代尤其危险。因为一旦某个方向变热AI 会让更多人更快地涌进去。大家都能快速读论文快速生成方案快速写 demo快速发文章。执行速度被普遍抬高以后盲目跟随热门问题的代价反而更大。真正厉害的人第一步不是“我能不能更快做完”而是“这个问题值不值得我做”。这不是说每个人都必须做原创研究也不是说不能接任务。而是说即使问题来自别人你也要把它重新变成自己的问题这个问题为什么重要如果做成了会改变什么如果做不成最可能卡在哪里有没有更小、更清楚的版本我为什么是适合做这件事的人很多事情做不成不是因为执行力差而是因为一开始就没有真正理解自己在做什么。二、不要继承结论要继承推理Vivek 提到一个很有意思的点被动接来的问题麻烦在于你拿到了结论却没有拿到推理过程。这句话放在今天特别值得反复看。我们现在每天接触的信息太多了。大模型发布一个能力行业里马上出现一批解读某家公司发布一个产品朋友圈马上开始转发某个技术方向被资本或大厂关注很快就变成“大家都应该研究一下”。这些东西本身不一定错。问题是大多数人只看到了结果他们在做 Agent他们在做具身智能他们在做 eval他们在做端侧模型他们在做企业知识库但真正有价值的是背后的推理为什么是现在做他们看到了什么信号他们押注的约束变化是什么他们认为旧路线哪里不够了他们愿意承担什么代价如果没有这些推理你学到的只是表面动作。这就像一个人看到高手每天写日志、跑实验、发文章于是也开始照做。但他不理解这些动作为什么存在就很容易把方法变成仪式。真正的学习不是复制动作而是恢复推理。当你看到一个好结果时不要只问“他做了什么”还要问如果我站在他当时的位置我能不能推导出他为什么这样做这个习惯比多看十篇总结更重要。三、别只追最新经典论文常常更耐用Vivek 原文里还有一个很重要的提醒旧材料被严重低估了。这点在今天尤其反直觉。我们太容易被最新信息牵着走。今天一个新模型明天一个新框架后天一个新 benchmark再过几天又有一个新产品发布。AI 时代的信息流速度太快快到很多人会本能地觉得越新的东西越重要。但很多时候真正能帮你形成判断的反而不是最新论文而是经典论文。因为经典材料通常回答的是更底层的问题一个问题为什么重要一个方向为什么会反复出现一个方法为什么在很多年后仍然有效一个领域真正长期起作用的变量是什么Vivek 举了几个例子mixture of experts 可以追溯到 1991 年LSTM 到 1997 年backprop 在 1986 年成为主流。Rich Sutton 的《The Bitter Lesson》篇幅很短却比许多长篇综述更能预测这个领域的走向。这背后的意思不是“不要看新东西”。而是说如果你只看最新发布就很容易被表层变化带着跑。你看到的是热闹是更新是别人已经包装好的结论。但如果你读经典论文、经典文章、经典演讲你更容易看到那些长期没有变的东西。AI 时代信息获取已经不再稀缺。真正稀缺的是判断哪些信息值得进入你的大脑。所以一个人想把事做成不能只问“最近有什么新东西”还要问哪些旧东西今天仍然在解释现实这个问题很重要。因为真正的高手不是永远站在信息流最前面的人而是知道哪些东西只是浪花哪些东西是河床。四、把大问题缩小先跑通最便宜的版本Vivek 在文章里提到 Claude Shannon 的一个方法把问题缩小直到它几乎变得微不足道先解决这个小版本再一点点把困难加回来。这几乎是所有成事方法里最朴素、也最有效的一条。很多人失败不是因为没有野心而是因为一上来就试图吞下完整问题。想做一个复杂系统一开始就设计全量架构。想学一个新领域一开始就列几十本书。想做一个 AI 应用一开始就想覆盖所有场景。想写一篇深度文章一开始就想把所有观点一次性讲透。结果是问题太大反馈太慢挫败太早。真正会做事的人会先问一个更实际的问题这个目标最小的可验证版本是什么不是最完整版本不是最漂亮版本不是以后可以宣传的版本而是最便宜、最快、最能暴露关键问题的版本。做模型训练先过拟合一个 batch。做产品功能先跑通一个真实用户场景。做管理机制先在一个小团队里试一周。做文章选题先写出一段核心论证看它是不是站得住。做学习计划先用一个具体问题检验自己是否真的理解。AI 会让我们更容易生成“完整外观”。但外观完整不等于问题被解决。越是有 AI越要警惕一上来就做大。高手不是把事情想得更复杂而是更快找到那个小到可以动手的版本。五、真正的速度是更快知道自己错在哪里很多人理解的速度是产出速度。一天写多少代码读多少资料生成多少方案跑多少实验做多少页面。但 Vivek 文章里有一句很重要的话研究速度大部分是你发现自己错了的速度。这句话如果泛化到所有事情里也成立。一个人真正的成事速度不是他看起来多忙而是他多久能发现这个方向不对这个假设不对这个用户不买账这个指标没有意义这个方案只是看起来完整这个需求背后的真实问题不是这个AI 很容易让人产生一种错觉我产出得更快所以我进步得更快。但如果你的产出没有带来校正只是在堆东西那速度可能只是更快地偏离。所以 Vivek 反复强调预测、记录、实验、复盘。实验前先写下你预期会发生什么。读论文时先盖住结果自己猜数字。看到一个新发布先判断它两年后还重不重要。做一件事之前先写下你认为它为什么会成。这些动作看起来很慢但它们会让你有机会比较我原来以为的世界和真实发生的世界差在哪里这就是成长。不是多做而是每做一次都让自己更接近现实一点。六、别只看指标要去看失败样本这篇文章里我最喜欢的一部分是“盯着输出看”。Vivek 说下降的 loss 曲线不是分析它只是安慰。这句话太适合今天了。我们很容易被漂亮的指标安慰阅读量涨了准确率涨了转化率涨了响应时间降了benchmark 高了一点demo 看起来能跑但指标只告诉你一个方向不告诉你里面发生了什么。真正的信息往往藏在失败样本里。模型为什么在这个问题上答错用户为什么在这一步离开客户为什么嘴上说需要最后却不用文章为什么有人点开却没有读完系统为什么大部分时候正常但在某些边界条件下崩掉Andrew Ng 反复讲过一个很朴素的方法抽出一百个失败样本全部读一遍把它们分类然后先处理最大的一类。这听起来不高级但极其有效。因为真正的理解往往不是来自总体指标而是来自你认真看过的那些具体失败。AI 时代尤其如此。AI 可以帮你总结数据但它不能替你形成真实的触感。你不亲自看失败样本就很容易被平均数骗过去。高手不是只看 dashboard 的人。高手会蹲下来看那些不漂亮、不整齐、让人不舒服的输出。七、写下来是为了不骗自己很多人把写作理解成表达。但在 Vivek 这篇文章里写作首先是一种防御防止自己骗自己。一个想法在脑子里时常常显得很完整。你觉得逻辑通了路径清楚了下一步也知道了。但一写下来问题就暴露了这个假设我其实没验证这个因果关系并不成立这个步骤中间缺了一环这两个判断其实互相冲突我所谓的结论只是一个感觉写作会让模糊的东西变硬。它逼你把脑子里那些看似连贯的东西落到一句一句话上。只要落到文字上漏洞就没那么容易藏住。所以做事的人应该保留一种简单日志我现在的假设是什么我准备怎么验证我预期会发生什么实际发生了什么我的判断要怎么更新这不是为了以后写回忆录也不是为了显得专业。这是为了在一个月后回头看时你能诚实地看到自己当初到底是怎么想的又是在哪里错的。没有记录就没有真正的复盘。没有复盘所谓经验很容易只是情绪和记忆混在一起的故事。八、找人不是社交是让现实更早打到你Vivek 写到 Hamming 对开放办公室门的观察关着门的人一年里可能做完更多事但开着门的人更可能做出重要的工作因为打断会带来世界真正需要什么的信息。这句话也很适合今天。很多人把“找人交流”理解成社交把“公开表达”理解成打造影响力。但它更本质的作用是让你的想法更早接触现实。一个半成形的想法如果只在自己脑子里转可能会自我美化很久。但你把它讲给别人听别人一句话就可能指出这个问题不重要这个假设别人试过了这个场景不存在这个方案成本太高这个东西真正有用的是另一部分这当然不舒服。但这种不舒服很便宜。比你投入三个月之后才发现方向不对要便宜太多。所以公开写作、复现别人的结果、发布自己做的小工具、解释一个难题本质上都不是“秀自己”。它们是在把自己放进一个更大的校正环境里。你给别人提供价值别人也会在未来某个时刻把信息、机会、批评、合作带回来。这种关系买不来只能靠长期积累。九、AI 时代成事的人会更像研究者这篇文章原本写的是研究。但我觉得它之所以值得更广泛地读是因为 AI 正在让很多普通工作变得越来越像研究。过去很多工作有明确流程需求来了拆任务写代码测试上线。题目来了找资料整理汇报。目标来了分解计划按步骤推进。但 AI 时代真正有价值的问题会越来越不标准。简单执行会被工具加速标准流程会被自动化覆盖已有答案会越来越容易获得。剩下更难的部分是面对那些没有清晰定义的问题这个方向要不要做用户真正需要什么这个 AI 能力应该落在哪个场景这个系统的问题到底出在哪里这个团队为什么推进不动这个新技术到底是短期噪音还是长期趋势这些问题没有现成答案。你只能像研究者一样工作先选问题再拆小提出假设快速试认真看结果记录判断找人碰撞不断修正这不是“科研人员的专属能力”而是 AI 时代很多人都要补上的基本功。最后AI 会让很多事情更快。但快不等于做成。真正把事做成的人不只是更会使用工具而是更会处理不确定性。他们知道怎么选问题怎么把问题变小怎么让错误早点出现怎么盯着失败看怎么写下来防止自欺怎么找到能让自己更快接近现实的人。Vivek 这篇文章给我的启发是高手不是拥有更多答案的人而是更会把模糊问题推进成结果的人。当 AI 把执行成本降下来之后这种能力只会越来越贵。