Yao Shunyu - 核心观点总结

aiyao-shunyuinterview-notes

姚舜宇访谈核心观点总结

这版只提炼访谈里的核心判断和可迁移观点,不保留完整问答。

一句话主线

姚舜宇对 AI 竞争的核心判断是:模型能力仍在快速进步,但公开指标差距会越来越难说明问题;真正的竞争会落到“问题定义、数据与环境构造、系统工程、组织执行、产品形态”上。AI 不是个人英雄主义,而是少数清晰方向被大组织持续系统化推进后的结果。

1. Google 的强项:简单产品形态下,把技术卷到极致

他对 Google 的一个关键判断是:Google 传统上产品节奏慢,但极擅长一种场景:产品形态非常简单、所有玩家长得差不多,然后 Google 通过技术优势把体验做到别人追不上。

典型例子是搜索。大家都是一个搜索框、一个按钮,但 Google 搜得更快、更准,用户很难因为“产品功能”去替代它。这个逻辑迁移到 AI 上,就是如果未来 AI 产品形态也变得足够简单、标准化,Google 的工程能力、预训练能力、基础设施和系统管理能力会非常强。

但反过来,如果 AI 的关键胜负手是复杂 C 端产品、社会化分发、内容生态、商业闭环、用户心智和产品创意,Google 未必天然占优。他认为中国公司更擅长复杂 C 端产品,美国公司更擅长“直接、清晰、技术可优化”的产品。

2. AI 竞争从“能不能做”转向“问题是否定义得好”

他认为现在大模型公司已经不太担心“能不能追上”,至少 OpenAI、Anthropic、Google DeepMind 这类公司不会认为自己没有能力跟上。难点变成:到底应该做什么、怎么定义问题、怎样定义模型行为。

过去模型差距可以从 benchmark 上看出来,比如 reasoning、coding、数学能力谁强谁弱。现在公开指标越来越接近,很多差距只有一两个点,噪声大于信号。真实体验仍有差异,但差异不再简单地体现在榜单上,而体现在模型行为、产品场景、工具使用、数据、后训练和基础设施里。

3. OpenCloud / Manus 这类“壳”的意义:展示可能性,不一定形成护城河

他觉得 OpenCloud 这类产品在技术上不是突然出现的范式突破,更像模型能力自然外溢后的产品展示。业内其实早有人做类似 demo,只是大公司要正式发布,需要考虑安全、法律、品牌、资源和稳定性,流程更重。

这类产品真正的价值是让大家意识到:模型可以控制多个工具、多个模型,执行长周期任务,并把结果汇总起来。它把一种可能性显性化了。

但“壳”要长期活下来很难。姚舜宇认为大概有两条路:

如果壳面对的是通用、高价值、模型公司必争的场景,就很容易被模型公司吞掉或逼到竞争关系里。

4. 2026 的关键技术方向:训练时有限上下文,使用时近似无限上下文

他认为 2026 年一个很重要的技术方向是:模型训练时用有限 context,但使用时可以接近无限 context。也就是模型能长期和用户交互,持续吸收信息,同时在运行过程中不断丢掉不重要的信息,保留重要状态。

这会解锁真正的个人助手形态:模型不是每次重新开始,而是能持续理解用户、任务、历史、环境和上下文。

他认为这件事今年技术上大概率会实现,但路线还没收敛。可能有多条技术路线都能跑通,最后要看在真实用户场景下哪条效率最高。

5. 预训练没有明显到头,很多“撞墙”可能只是 bug

他不同意“预训练 scaling law 已经到头”的强判断。至少从他的体验看,过去几个月预训练仍在变强,未来几个月也还看不到明确撞墙迹象。

他认为很多人觉得撞墙,可能来自三类原因:

他更强调第三种情况:很多时候修好一个 bug 带来的进展,大于某些看起来很聪明的技巧。AI 研究很大一部分不是玄学灵感,而是系统性排查、设计 ablation、理解变量关系、确认到底哪个因素在起作用。

6. Coding 为什么先爆发:反馈清楚、数据好、标准统一

他认为 coding 发展快,有三个原因。

第一,反馈信号清楚。代码任务天然可以测试:输入输出对不对、功能有没有实现、测试能不能过。训练和评估都更容易定义。

第二,数据基础好。GitHub 上有大量高质量代码和工程历史,这比普通网页数据更干净、更结构化。

第三,产品需求相对单一。优秀代码有共同标准:简洁、结构清楚、抽象合理、便于维护。相比社交、游戏、内容产品这类偏主观场景,coding 更容易形成一致评价。

所以 coding 是模型能力、数据、反馈、产品标准同时匹配的场景。

7. AI 让程序员不是少写代码,而是工作密度变高

他提到自己保守估计 90% 的代码由模型生成,不保守可能是 99% 甚至 100%。人的工作重点不再是逐行写代码,而是设计代码逻辑、理解代码应该和哪些文件相关、给模型合适 context、检查模型写得是否合理。

AI 带来的不是工作变轻,而是试错速度变快后,想试的东西更多,工作密度更高。过去一个文件不懂,可能要找人问、等几个小时;现在问模型几秒钟就能继续做。所以研究和工程效率可能提升 20 到 50 倍,但工作时间反而可能更长。

8. 产品经理暂时比程序员更难被训练出来

他认为很多“智力上看起来最难”的事情,反而容易被 AI 做好,例如数学、代码、科学研究,因为这些事情一旦评价标准清楚,就知道怎么训练。

真正难的是反馈信号模糊的工作,比如产品经理。什么是好产品,没有一个明确刻度。很多产品只有做出来、被用户使用后,大家才知道它好不好。没有清晰反馈,就很难训练 AI 做到真正优秀。

这也是他区分“技术优化型产品”和“复杂 C 端产品”的原因:前者更容易被工程和模型能力卷到极致,后者更依赖人类对需求、分发、心理和商业结构的复杂判断。

9. Anthropic 的特殊性:技术一号位能 top-down make bet

他认为 Anthropic 的独特性在于:技术一号位能用 top-down 方式坚定 make bet。大公司和创业公司打法不同,创业公司必须赌一个方向,而且要有组织能力把赌注贯彻下去。

Anthropic 在 coding 方向上的成功,不只是某个模型突然强,而是组织、文化、基础设施、数据、后训练和技术判断共同作用的结果。

他也强调这种 top-down 机制不是所有模型公司都容易做到。组织越大,负担越重,方向越容易分散;能否让技术判断变成全公司的资源配置,是关键能力。

10. Google 的变化:预训练变成可控的大工程

他认为 Google 近来的变化,不是突然多了人,也不是突然有了技术,而是组织运行变清晰了。谁负责什么、节点在哪里、责任怎么分配,这些变得更明确。

Google 原本就有很强的技术背景和系统工程能力。当预训练变成相对确定的大工程项目,Google 就进入舒适区:把复杂项目拆清楚、管理清楚、规模化推进。

这和 Anthropic 的 top-down make bet 不同。Anthropic 强在小组织坚定下注;Google 强在确定性问题工程化之后,用庞大的技术系统把它做深做稳。

11. AI 不是个人英雄主义,而是系统工程

姚舜宇反复强调,AI 已经过了个人英雄主义时代。模型训练是大系统:数据、算力、基础设施、实验设计、评估、后训练、产品反馈和组织协作缺一不可。

他认为研究员真正重要的品质不是“特别聪明”,而是:

他甚至用面试题考察候选人:让候选人在 24 小时内用 AI 完成一个强化学习项目。重点不是代码是不是自己写,而是候选人有没有理解 AI 做了什么,能不能在讨论里解释清楚。

12. 年轻人机会:纯语言模型不是蓝海,但 AI 仍有大量未解方向

他认为纯做语言模型已经不是蓝海,末班车大概已经发车。但 AI 远不止语言模型,仍然有很多机会:

他的建议不是追当下最热的方向,而是去做现在还没有被充分解决、没有被所有人挤进去的方向。

13. 中美产品能力差异:美国擅长直接产品,中国擅长复杂 C 端

他认为美国过去十年的正反馈更多来自 ToB、enterprise、效率工具这类直接产品:帮你写代码,成本 150,卖你 200,赚 50,逻辑很直接。

中国强在复杂 C 端产品:免费内容、广告、直播、电商、推荐、社交关系、商业化闭环揉在一起,用户未必直接感受到自己在付费,但公司完成了复杂变现。

所以如果 2026 年 AI 的关键是 super app、C 端生态、复杂产品结构,中国团队可能更有优势;如果关键是模型能力外溢到一个简单清晰的产品形态,美国大模型公司,尤其 Google,会很强。

14. 对 OpenAI / ChatGPT 的判断:形态还没到终局

他认为 ChatGPT / chatbot 很强,但不一定是 AI 的终极形态。聊天机器人像搜索的延伸:它能追问、浓缩复杂信息,所以会吃掉一部分搜索场景;但它不会完全替代搜索,因为很多搜索需求极其简单,用户不想进入一轮对话。

OpenAI 先做出 ChatGPT,让 Google 意识到聊天机器人重要,但没有把搜索完全吃掉,也没有把形态做到不可追。于是 Google 有时间追上来。

所以他认为现在谁的位置都不稳。AI 还没有到终局之战,未来可能出现完全不同的产品形态,把今天的 chatbot 变成一个子集。

15. 最值得记住的几条判断