最近看了对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去,我最大的感受不是“这个人很厉害”,也不是“物理转 AI 很传奇”,而是:他身上有一套非常值得学习的做事方法。

这套方法可以概括成一句话:

选择有清晰反馈的战场,把问题定义清楚,用实验验证,用系统性排错推进,用结果建立判断力。

这对我很有启发。因为我自己也在做科研、跑论文实验、接触 AI 项目、组织小团队。过去我经常会纠结:自己基础是不是不够?方向是不是太难?老师到底想让我做什么?队友该怎么协作?看完这次访谈后,我意识到,真正重要的不是一开始就什么都会,而是能不能把一个复杂任务拆清楚、做下去、验证出来、总结出来。


一、不要只做“高级”的事,要做能够被验证的事

姚顺宇读博士时做的是高能理论物理,这是一个非常难、非常高级的方向。但他后来反思,这个方向的问题在于“不特别可以验证”,缺少客观评价标准。相比之下,AI 让他更兴奋的一点是:一个想法能不能成立,可以通过实验、训练、指标、评测去验证。访谈中他也提到,高能理论方向足够难,但实验追不上,评价标准不够客观;而 AI 里很多事情可以通过数值实验去推进。

这对我来说是一个很大的提醒。

以前我容易被“听起来高级”的方向吸引,比如某个新概念、某个新模型、某个前沿名词。但真正做科研时,只高级是不够的。一个方向再高级,如果不能实验、不能对比、不能复现、不能形成结果,就很难真正推进。

以后我判断一个科研方向,不能只问:

这个方向牛不牛?

而要问:

它能不能实验? 有没有 baseline? 有没有指标? 有没有可视化结果? 能不能和别的方法对比? 能不能写进论文? 能不能汇报给老师?

比如我现在做 3DGS、VACE、FlashAvatar、AIGC 检测,这些方向真正有价值的地方,不是名词本身,而是它们可以形成实验闭环:

3DGS 可以看重建效果,可以算 PSNR、SSIM、LPIPS; VACE 可以做视觉对比,可以看发型、身份、背景是否保持; AIGC 检测可以看 detector score 是否下降,同时看图像质量是否保持; FlashAvatar 可以作为对比方法,判断它在同一数据上的表现。

这就是可验证的战场。


二、他不是先补完整个计算机专业,而是在真实项目中补关键能力

姚顺宇从物理转到 AI,并不是按传统路线先把计算机本科所有课程补完,再进入行业。他的方式更像是:围绕一个真实目标,快速补必要知识,然后用项目验证自己。

这对我非常重要。

我现在经常会觉得自己基础不够,比如 bash 不熟、Linux 不熟、Python 和 PyTorch 也还需要补。但看完这个访谈,我意识到,真正有效的学习不是“等我把所有基础补完再做科研”,而是:

做项目时缺什么,就补什么;补完之后立刻用到实验里。

比如为了跑论文实验,我需要补的是:

  • Linux / bash;
  • conda / 环境配置;
  • Git;
  • Python;
  • PyTorch;
  • 数据路径;
  • 训练脚本;
  • 日志分析;
  • 可视化和指标。

这些不是孤立知识,而是被真实任务牵引出来的能力。

所以我以后不能一直停留在“我不会,所以我不敢做”的状态,而要变成:

我不会,但我知道当前任务缺什么;我可以用 AI、文档、代码和实验把它补起来。

这才是 AI 时代更实际的学习方式。


三、AI 时代最重要的能力之一,是“定义问题”

访谈里有一句话我印象很深:现在大家已经不太担心“AI 能不能做得到”,更担心的是“这件事是不是被良好定义”。姚顺宇也说,现在更难的事情,是想明白要做什么、定义想要的行为。

这句话对我非常有用。

我发现自己很多时候卡住,不是因为完全不会,而是因为问题没有定义清楚。

比如我问:

AIGC 检测方向怎么做?

这其实还是一个很模糊的问题。

更好的问题应该是:

能不能训练一个 residual editor,在保持图像视觉质量的前提下,降低某个 AIGC detector 的 fake score?

这个问题就清楚很多。它有输入、有输出、有目标、有指标,也能设计实验。

再比如我问:

FlashAvatar 怎么跑?

这也不够清楚。

更好的问题是:

我现有的数据是否满足 FlashAvatar 的输入格式?如果不满足,缺哪些文件?能不能构造一个最小 demo 来做论文对比?

再比如我问:

队友能帮我做什么?

这也很模糊。

更好的任务定义是:

你负责调研 3 篇 AIGC 检测论文,输出一页表格,包含方法、输入、输出、数据集、指标、代码是否开源、能不能为我们所用。

这就是问题定义能力。

我以后做任何事情,都要先问三句话:

输入是什么?
输出是什么?
成功标准是什么?

只要这三句话说不清楚,这个任务就还没有真正开始。


四、真正稀缺的不是“聪明”,而是靠谱、做事细、负责任

姚顺宇说 AI 这个行业最重要的特质是:靠谱、做事细、对自己做的事负责任。这个判断非常现实。

这句话对我冲击很大。

因为我以前容易把厉害理解成:懂很多理论、会很多名词、看起来很聪明。但现在我意识到,在真实科研和真实项目里,更重要的是:

交给你一件事,你能不能把它做成一个清楚、完整、可复现、可汇报的结果。

比如我做 VACE 实验,不能只说“我跑了”。我必须说清楚:

  • 原始视频在哪里;
  • 输入帧是哪几张;
  • mask 是怎么来的;
  • bbox 是多少;
  • prompt 是什么;
  • 分辨率是 480p 还是 720p;
  • 输出视频在哪里;
  • 截了哪几帧;
  • 为什么这样展示;
  • 有什么失败案例;
  • 下一步怎么改。

比如我做 AIGC 检测,也不能只说“我想做一个 GAN 风格的检测规避方法”。我必须说清楚:

  • 检测器是什么;
  • 数据是什么;
  • 编辑器结构是什么;
  • loss 怎么设计;
  • detector score 是否下降;
  • 图像质量是否保持;
  • 是否有 LPIPS、SSIM、L1;
  • 有没有可视化;
  • 有没有消融实验。

这才叫靠谱。

靠谱不是“我什么都会”,而是:

我不会糊弄,我会记录,我会验证,我会复盘,我会把事情交付出来。


五、不要迷信 idea,真正难的是把 idea 拆成可执行步骤

姚顺宇对很多空泛的 idea 很反感。他强调,现在 AI 已经不是单纯个人英雄主义时代,很多想法本身并不稀缺,真正重要的是一个团队能不能围绕目标把事情做出来。访谈中他也提到,现代 AI 训练是一个大的系统,很多技术细节必须放到系统里理解,脱离基础设施单独谈 tips 反而可能误导人。

这对我来说也很重要。

我以前容易被“一个很好的想法”打动,但现在我更应该追问:

这个想法怎么变成实验? 数据在哪里? 代码在哪里? 指标是什么? baseline 是谁? 结果怎么展示? 失败了怎么解释?

比如“做 AIGC 检测方向”只是一个 idea。

真正可执行的版本应该是:

固定一个 AIGC detector,训练一个 residual editor,在图像 L1 变化较小的情况下,让 detector fake score 下降,并用 detector score、LPIPS、SSIM、可视化和消融实验验证。

这才是科研语言。

所以我以后听到任何宏大想法,都要把它翻译成:

输入
输出
方法
数据
指标
对比
图表
结论

不能翻译成这些东西的 idea,暂时就还不成熟。


六、失败不是终点,系统性排错才是科研能力

姚顺宇讲 Bug 的部分也很重要。他说很多人觉得“撞墙了”,其实可能只是实验里有 Bug;当结果和预期不一致时,关键是能不能系统性排除各种可能性,并设计 ablation 实验验证。

这对我太现实了。

我跑实验时经常会遇到各种问题:

  • 环境装不上;
  • 数据路径不对;
  • repo 跑不通;
  • 指标不对;
  • 视觉效果差;
  • 视频不一致;
  • 老师觉得实验不够有说服力。

以前遇到这些问题,我容易焦虑,甚至怀疑自己。但现在我应该换一种方式:

结果不好,不一定是我不行,也不一定是方向错了,可能只是某个环节还没排查清楚。

以后我遇到失败,要用这个模板:

现象是什么?
预期是什么?
可能原因有哪些?
哪个原因最可能?
用什么最小实验验证?
结果说明什么?
下一步怎么改?

比如 VACE 发型不一致,可能原因有:

  • 三个 clip 独立生成,风格不一致;
  • bbox 没完整覆盖头发;
  • prompt 不够稳定;
  • mask 和视频尺寸不匹配;
  • 截帧顺序有问题;
  • 分辨率太低;
  • 随机性导致波动。

这时就不能只说“效果不好”,而要逐个验证。

这就是科研能力。


七、他不迷信权威,但不是无脑叛逆

姚顺宇访谈里有很多关于“老登”的表达,听起来很冲。但我觉得真正值得学的不是这种表达方式,而是他背后的判断标准。

他反感的不是年龄大的人,而是低质量权威:

  • 不在一线;
  • 不懂细节;
  • 喜欢指手画脚;
  • 评价标准模糊;
  • 讲很多大词;
  • 不能给出可执行路径;
  • 靠资历压人。

但同时,他其实很有边界。涉及公司机密时他不说;具体人名他会收住;谈自己的贡献时,他也多次强调自己只是幸运加入重要项目,成果是团队贡献。

所以我不能简单模仿他的“嘴毒”。我更应该学的是:

心里判断要锋利,嘴上表达要克制;标准要严格,语言要专业。

比如我觉得一个方案不行,不应该说:

这个太蠢了。

而应该说:

这个方案目前缺少可验证指标。如果要进入论文,至少需要补充输入输出定义、baseline、评价指标和实验对比。

比如我觉得队友交付不合格,不应该说:

你太不靠谱了。

而应该说:

这个版本目前还不能用于最终汇报,因为缺少数据来源、运行日志和结果截图。你先补这三项,我再审核。

这才是真正有力量的表达。


八、对我最直接的帮助:从“会想”变成“会推进”

看完这次访谈,我觉得自己最需要改变的不是“多学几个名词”,而是从:

会想、会问、会总结

升级成:

会定义、会实验、会验证、会交付、会组织

我现在最应该建立的是一套自己的科研工作流。

每个项目都应该有一个 README,记录:

1. 当前目标
2. 当前进度
3. 数据路径
4. 环境信息
5. 关键命令
6. 当前结果
7. 当前问题
8. 下一步计划
9. 可汇报内容

每次实验都要留下四样东西:

命令
路径
日志
结果

每次组会前,都要能回答:

我做了什么?
结果在哪里?
有什么问题?
下一步怎么做?
需要谁帮忙?

这比单纯“我很努力”更重要。


九、我接下来应该怎么行动

我给自己定几个具体原则。

第一,优先做有反馈的事情

以后判断方向,不只看它是否前沿,而要看它能不能形成实验闭环。

第二,任何任务先定义输入、输出和成功标准

模糊任务不直接开始,先把它定义清楚。

第三,先做最小闭环,再追求高级

不要一开始就追求完整系统。先跑通一个小实验,先出一张图,先有一个 baseline。

第四,失败后先排错,不先否定自己

实验失败是正常的,关键是系统性排查。

第五,用 AI 提升执行密度

让 AI 帮我读 README、写 bash、分析报错、整理实验、生成汇报,但我必须能审查它的输出。

第六,带团队靠标准,不靠情绪

以后给队友任务,要明确交付物、截止时间和验收标准。

第七,表达要克制,判断要清楚

不盲从权威,但也不情绪化攻击别人。用证据和结果建立话语权。


十、最终总结

这次访谈让我意识到,姚顺宇真正值得学习的地方,不是他敢说话,也不是他的履历,而是他选择战场、定义问题、快速学习、系统实验、持续校准方向的能力。

他从物理转向 AI,不只是换了一个行业,而是从一个反馈较慢、评价较模糊的系统,进入了一个反馈更快、更能实验、更能产生现实影响的系统。

对我来说,最重要的启发是:

不要迷信高级名词,不要迷信权威,不要迷信灵感。 要选择能验证的方向,把问题定义清楚,做最小实验,系统排错,记录证据,形成可汇报成果。

我现在不需要幻想自己一夜之间变成天才。

我真正要做的是成为一个靠谱的人:

能定义任务;
能跑实验;
能看结果;
能排错;
能记录;
能汇报;
能带队;
能持续交付。

如果我能把这套能力练出来,无论是做科研、做项目、做产品,还是以后进入 AI 行业,都会比单纯会说概念更有价值。

真正的成长,不是看完一次访谈后觉得“这个人好厉害”,而是能把他的做事方法拆下来,变成自己的行动系统。