从姚顺宇访谈里，我真正学到的不是“天才”，而是一套做事方法

最近看了对姚顺宇的4小时访谈：请允许我小疯一下！在Anthropic和Gemini训模型、技术预测、英雄主义已过去，我最大的感受不是“这个人很厉害”，也不是“物理转 AI 很传奇”，而是：他身上有一套非常值得学习的做事方法。

这套方法可以概括成一句话：

选择有清晰反馈的战场，把问题定义清楚，用实验验证，用系统性排错推进，用结果建立判断力。

这对我很有启发。因为我自己也在做科研、跑论文实验、接触 AI 项目、组织小团队。过去我经常会纠结：自己基础是不是不够？方向是不是太难？老师到底想让我做什么？队友该怎么协作？看完这次访谈后，我意识到，真正重要的不是一开始就什么都会，而是能不能把一个复杂任务拆清楚、做下去、验证出来、总结出来。

一、不要只做“高级”的事，要做能够被验证的事

姚顺宇读博士时做的是高能理论物理，这是一个非常难、非常高级的方向。但他后来反思，这个方向的问题在于“不特别可以验证”，缺少客观评价标准。相比之下，AI 让他更兴奋的一点是：一个想法能不能成立，可以通过实验、训练、指标、评测去验证。访谈中他也提到，高能理论方向足够难，但实验追不上，评价标准不够客观；而 AI 里很多事情可以通过数值实验去推进。

这对我来说是一个很大的提醒。

以前我容易被“听起来高级”的方向吸引，比如某个新概念、某个新模型、某个前沿名词。但真正做科研时，只高级是不够的。一个方向再高级，如果不能实验、不能对比、不能复现、不能形成结果，就很难真正推进。

以后我判断一个科研方向，不能只问：

这个方向牛不牛？

而要问：

它能不能实验？有没有 baseline？有没有指标？有没有可视化结果？能不能和别的方法对比？能不能写进论文？能不能汇报给老师？

比如我现在做 3DGS、VACE、FlashAvatar、AIGC 检测，这些方向真正有价值的地方，不是名词本身，而是它们可以形成实验闭环：

3DGS 可以看重建效果，可以算 PSNR、SSIM、LPIPS； VACE 可以做视觉对比，可以看发型、身份、背景是否保持； AIGC 检测可以看 detector score 是否下降，同时看图像质量是否保持； FlashAvatar 可以作为对比方法，判断它在同一数据上的表现。

这就是可验证的战场。

二、他不是先补完整个计算机专业，而是在真实项目中补关键能力

姚顺宇从物理转到 AI，并不是按传统路线先把计算机本科所有课程补完，再进入行业。他的方式更像是：围绕一个真实目标，快速补必要知识，然后用项目验证自己。

这对我非常重要。

我现在经常会觉得自己基础不够，比如 bash 不熟、Linux 不熟、Python 和 PyTorch 也还需要补。但看完这个访谈，我意识到，真正有效的学习不是“等我把所有基础补完再做科研”，而是：

做项目时缺什么，就补什么；补完之后立刻用到实验里。

比如为了跑论文实验，我需要补的是：

Linux / bash；
conda / 环境配置；
Git；
Python；
PyTorch；
数据路径；
训练脚本；
日志分析；
可视化和指标。

这些不是孤立知识，而是被真实任务牵引出来的能力。

所以我以后不能一直停留在“我不会，所以我不敢做”的状态，而要变成：

我不会，但我知道当前任务缺什么；我可以用 AI、文档、代码和实验把它补起来。

这才是 AI 时代更实际的学习方式。

三、AI 时代最重要的能力之一，是“定义问题”

访谈里有一句话我印象很深：现在大家已经不太担心“AI 能不能做得到”，更担心的是“这件事是不是被良好定义”。姚顺宇也说，现在更难的事情，是想明白要做什么、定义想要的行为。

这句话对我非常有用。

我发现自己很多时候卡住，不是因为完全不会，而是因为问题没有定义清楚。

比如我问：

AIGC 检测方向怎么做？

这其实还是一个很模糊的问题。

更好的问题应该是：

能不能训练一个 residual editor，在保持图像视觉质量的前提下，降低某个 AIGC detector 的 fake score？

这个问题就清楚很多。它有输入、有输出、有目标、有指标，也能设计实验。

再比如我问：

FlashAvatar 怎么跑？

这也不够清楚。

更好的问题是：

我现有的数据是否满足 FlashAvatar 的输入格式？如果不满足，缺哪些文件？能不能构造一个最小 demo 来做论文对比？

再比如我问：

队友能帮我做什么？

这也很模糊。

更好的任务定义是：

你负责调研 3 篇 AIGC 检测论文，输出一页表格，包含方法、输入、输出、数据集、指标、代码是否开源、能不能为我们所用。

这就是问题定义能力。

我以后做任何事情，都要先问三句话：

text
输入是什么？
输出是什么？
成功标准是什么？

只要这三句话说不清楚，这个任务就还没有真正开始。

四、真正稀缺的不是“聪明”，而是靠谱、做事细、负责任

姚顺宇说 AI 这个行业最重要的特质是：靠谱、做事细、对自己做的事负责任。这个判断非常现实。

这句话对我冲击很大。

因为我以前容易把厉害理解成：懂很多理论、会很多名词、看起来很聪明。但现在我意识到，在真实科研和真实项目里，更重要的是：

交给你一件事，你能不能把它做成一个清楚、完整、可复现、可汇报的结果。

比如我做 VACE 实验，不能只说“我跑了”。我必须说清楚：

原始视频在哪里；
输入帧是哪几张；
mask 是怎么来的；
bbox 是多少；
prompt 是什么；
分辨率是 480p 还是 720p；
输出视频在哪里；
截了哪几帧；
为什么这样展示；
有什么失败案例；
下一步怎么改。

比如我做 AIGC 检测，也不能只说“我想做一个 GAN 风格的检测规避方法”。我必须说清楚：

检测器是什么；
数据是什么；
编辑器结构是什么；
loss 怎么设计；
detector score 是否下降；
图像质量是否保持；
是否有 LPIPS、SSIM、L1；
有没有可视化；
有没有消融实验。

这才叫靠谱。

靠谱不是“我什么都会”，而是：

我不会糊弄，我会记录，我会验证，我会复盘，我会把事情交付出来。

五、不要迷信 idea，真正难的是把 idea 拆成可执行步骤

姚顺宇对很多空泛的 idea 很反感。他强调，现在 AI 已经不是单纯个人英雄主义时代，很多想法本身并不稀缺，真正重要的是一个团队能不能围绕目标把事情做出来。访谈中他也提到，现代 AI 训练是一个大的系统，很多技术细节必须放到系统里理解，脱离基础设施单独谈 tips 反而可能误导人。

这对我来说也很重要。

我以前容易被“一个很好的想法”打动，但现在我更应该追问：

这个想法怎么变成实验？数据在哪里？代码在哪里？指标是什么？ baseline 是谁？结果怎么展示？失败了怎么解释？

比如“做 AIGC 检测方向”只是一个 idea。

真正可执行的版本应该是：

固定一个 AIGC detector，训练一个 residual editor，在图像 L1 变化较小的情况下，让 detector fake score 下降，并用 detector score、LPIPS、SSIM、可视化和消融实验验证。

这才是科研语言。

所以我以后听到任何宏大想法，都要把它翻译成：

text
输入
输出
方法
数据
指标
对比
图表
结论

不能翻译成这些东西的 idea，暂时就还不成熟。

六、失败不是终点，系统性排错才是科研能力

姚顺宇讲 Bug 的部分也很重要。他说很多人觉得“撞墙了”，其实可能只是实验里有 Bug；当结果和预期不一致时，关键是能不能系统性排除各种可能性，并设计 ablation 实验验证。

这对我太现实了。

我跑实验时经常会遇到各种问题：

环境装不上；
数据路径不对；
repo 跑不通；
指标不对；
视觉效果差；
视频不一致；
老师觉得实验不够有说服力。

以前遇到这些问题，我容易焦虑，甚至怀疑自己。但现在我应该换一种方式：

结果不好，不一定是我不行，也不一定是方向错了，可能只是某个环节还没排查清楚。

以后我遇到失败，要用这个模板：

text
现象是什么？
预期是什么？
可能原因有哪些？
哪个原因最可能？
用什么最小实验验证？
结果说明什么？
下一步怎么改？

比如 VACE 发型不一致，可能原因有：

三个 clip 独立生成，风格不一致；
bbox 没完整覆盖头发；
prompt 不够稳定；
mask 和视频尺寸不匹配；
截帧顺序有问题；
分辨率太低；
随机性导致波动。

这时就不能只说“效果不好”，而要逐个验证。

这就是科研能力。

七、他不迷信权威，但不是无脑叛逆

姚顺宇访谈里有很多关于“老登”的表达，听起来很冲。但我觉得真正值得学的不是这种表达方式，而是他背后的判断标准。

他反感的不是年龄大的人，而是低质量权威：

不在一线；
不懂细节；
喜欢指手画脚；
评价标准模糊；
讲很多大词；
不能给出可执行路径；
靠资历压人。

但同时，他其实很有边界。涉及公司机密时他不说；具体人名他会收住；谈自己的贡献时，他也多次强调自己只是幸运加入重要项目，成果是团队贡献。

所以我不能简单模仿他的“嘴毒”。我更应该学的是：

心里判断要锋利，嘴上表达要克制；标准要严格，语言要专业。

比如我觉得一个方案不行，不应该说：

这个太蠢了。

而应该说：

这个方案目前缺少可验证指标。如果要进入论文，至少需要补充输入输出定义、baseline、评价指标和实验对比。

比如我觉得队友交付不合格，不应该说：

你太不靠谱了。

而应该说：

这个版本目前还不能用于最终汇报，因为缺少数据来源、运行日志和结果截图。你先补这三项，我再审核。

这才是真正有力量的表达。

八、对我最直接的帮助：从“会想”变成“会推进”

看完这次访谈，我觉得自己最需要改变的不是“多学几个名词”，而是从：

会想、会问、会总结

升级成：

会定义、会实验、会验证、会交付、会组织

我现在最应该建立的是一套自己的科研工作流。

每个项目都应该有一个 README，记录：

text
当前目标
当前进度
数据路径
环境信息
关键命令
当前结果
当前问题
下一步计划
可汇报内容

每次实验都要留下四样东西：

text
命令
路径
日志
结果

每次组会前，都要能回答：

text
我做了什么？
结果在哪里？
有什么问题？
下一步怎么做？
需要谁帮忙？

这比单纯“我很努力”更重要。

九、我接下来应该怎么行动

我给自己定几个具体原则。

第一，优先做有反馈的事情

以后判断方向，不只看它是否前沿，而要看它能不能形成实验闭环。

第二，任何任务先定义输入、输出和成功标准

模糊任务不直接开始，先把它定义清楚。

第三，先做最小闭环，再追求高级

不要一开始就追求完整系统。先跑通一个小实验，先出一张图，先有一个 baseline。

第四，失败后先排错，不先否定自己

实验失败是正常的，关键是系统性排查。

第五，用 AI 提升执行密度

让 AI 帮我读 README、写 bash、分析报错、整理实验、生成汇报，但我必须能审查它的输出。

第六，带团队靠标准，不靠情绪

以后给队友任务，要明确交付物、截止时间和验收标准。

第七，表达要克制，判断要清楚

不盲从权威，但也不情绪化攻击别人。用证据和结果建立话语权。

十、最终总结

这次访谈让我意识到，姚顺宇真正值得学习的地方，不是他敢说话，也不是他的履历，而是他选择战场、定义问题、快速学习、系统实验、持续校准方向的能力。

他从物理转向 AI，不只是换了一个行业，而是从一个反馈较慢、评价较模糊的系统，进入了一个反馈更快、更能实验、更能产生现实影响的系统。

对我来说，最重要的启发是：

不要迷信高级名词，不要迷信权威，不要迷信灵感。要选择能验证的方向，把问题定义清楚，做最小实验，系统排错，记录证据，形成可汇报成果。

我现在不需要幻想自己一夜之间变成天才。

我真正要做的是成为一个靠谱的人：

text
能定义任务；
能跑实验；
能看结果；
能排错；
能记录；
能汇报；
能带队；
能持续交付。

如果我能把这套能力练出来，无论是做科研、做项目、做产品，还是以后进入 AI 行业，都会比单纯会说概念更有价值。

真正的成长，不是看完一次访谈后觉得“这个人好厉害”，而是能把他的做事方法拆下来，变成自己的行动系统。

一、不要只做“高级”的事，要做能够被验证的事#

二、他不是先补完整个计算机专业，而是在真实项目中补关键能力#

三、AI 时代最重要的能力之一，是“定义问题”#

四、真正稀缺的不是“聪明”，而是靠谱、做事细、负责任#

五、不要迷信 idea，真正难的是把 idea 拆成可执行步骤#

六、失败不是终点，系统性排错才是科研能力#

七、他不迷信权威，但不是无脑叛逆#

八、对我最直接的帮助：从“会想”变成“会推进”#

九、我接下来应该怎么行动#

第一，优先做有反馈的事情#

第二，任何任务先定义输入、输出和成功标准#

第三，先做最小闭环，再追求高级#

第四，失败后先排错，不先否定自己#

第五，用 AI 提升执行密度#

第六，带团队靠标准，不靠情绪#

第七，表达要克制，判断要清楚#

十、最终总结#