China's "Four AI Giants" Rarely Share the Stage: Alibaba, Tencent, Kimi, and KNOWLEDGE ATLAS Discuss the Next Steps for Large Models and the Possibility of China's Catch-Up

大模型竞争已从 “Chat” 转向 “Agent” 阶段，重心从榜单分数位移至真实环境的复杂任务执行。行业预判 2026 年为商业价值落地元年，技术路径正向可验证强化学习（RLVR）演进。面对 “中国反超” 议题，领军者持冷静态度，将领先概率评估为 20% 以内，认为中美在算力投入结构、新范式引领及 toB 生态上的本质差距。

近日，由清华大学基础模型北京市重点实验室发起AGI-Next 前沿峰会，把 AI 圈大半边天聚到了一块。基模四杰全员到场：智谱唐杰、Kimi 杨植麟、阿里林俊旸，还有 “突然贴脸跳屏” 的姚顺雨。

要点提炼：

竞争坐标迁移：Chat 时代的工程问题已基本解决，未来的胜负手不再是更聪明的 “搜索框”，而是能否完成复杂、长链路的真实任务。AI 的核心价值正从 “提供信息” 转向 “交付生产力”。
核心门槛更迭：Agent 的瓶颈不在于思维深度，而在于环境反馈。未来的训练范式将从人工标注转向 RLVR（可验证强化学习），只有让模型在具备明确对错判定（如代码、数学、真实业务流）的 “关卡系统” 中自我迭代，才能实现落地。
效率成为新杠杆：高质量数据即将枯竭，未来的竞争是 “能源转化效率” 的竞赛。通过二阶优化器和线性架构实现更高的 Token Efficiency（单位数据学习效果），是在算力受限背景下突破智能天花板的关键。
概率的清醒认知：行业共识认为中国在旧范式（工程复现、局部优化、toC 落地）上的反超胜率很高，但在引领新范式（底层架构革新、长期记忆等）上的胜率可能不超过 20%，因为美国在基础研究上的算力投入高出数个量级。
弯道超车的机会窗口：反超的机会藏在两个变量里：一是当 Scaling Law 遭遇边际效应递减，全球被迫进入 “智能效率” 竞赛时，中国的节俭式创新可能突围；二是随着学术界算力条件的改善，2026 年前后可能出现由学术驱动的范式转向。
成功的终极变量：中国最缺的不是榜单分数，而是对不确定性的容忍度。真正的反超取决于我们是否敢于从 “确定性的交付压力” 中抽身，将资源投向那些可能失败但能定义未来的新范式，而非仅仅在旧赛道刷榜。

如果只看热搜，会觉得这场清华峰会的气氛是：

“中国模型崛起、开源占榜、AGI 在望。”

但只要把圆桌那段关于 “中国能否反超” 的讨论完整读一遍，你会发现他们的真实情绪更接近——

“我们有机会，但别自嗨；短期能追平，长期能引领范式才算赢。”

甚至有人把概率直接压到一个非常 “反公众号” 的数字：不超过 20%。

姚顺雨：乐观，但前提是 “新范式要敢赌”——否则就是追分追到天花板

姚顺雨的结论其实分两层：

第一层：复现与工程，中国很强

他说得很直接：任何一个事情一旦被证明可行，中国往往能很快复现、并在局部做得更好——类似制造业、电动车的路径已经反复发生。

这对应的是 “追平甚至反超现有范式” 的能力：更卷的工程、更快的迭代、更强的交付。

第二层：真正的难点是 “引领新范式”

他强调：“中国唯一要解决的问题” 是——

能不能引领新的范式（比如长期记忆、持续学习、真正的自主学习框架），而不是在旧范式里刷榜。

因为旧范式里你可以靠效率、组织、工程追上；
但新范式里你需要愿意长期投入、承受不确定性、容忍失败。

他给出的关键约束：三道门槛

算力瓶颈：光刻机/产能/软件生态如果卡住，会拖慢上限。
toB 市场与国际商业环境：国内付费文化与企业侧采用速度，会影响 “把技术变成现金流” 的能力。
文化与组织的冒险程度：敢不敢把资源投到 “不确定但可能改变游戏规则” 的方向。

姚顺雨的 “乐观” 更像：有条件，有窗口，但不自动发生。如果生态继续只奖励确定性、只奖励榜单数字，那 “反超” 就会停留在口号里。

林俊旸：最明确的 “概率上限”——20%，理由是 “美国的 Research 投入量级更大”

在四个人里，林俊旸是最 “掐数字” 的那个：

他认为领先的概率 “20%”，而且已经算非常乐观。

为什么他会把上限压这么低？核心不是 “我们不行”，而是他看到了结构性差异：

结构差异 1：算力投入的 “用途” 不同

他提到美国的 Computer（算力）可能比我们大 1-2 个数量级，更关键的是——他们大量算力投向 “下一代 Research”，而我们大量算力被交付与产品化占据。

翻译成人话就是：

美国在 “赌未来”，容错高；
中国在 “先活下来”，交付压力大。

结构差异 2：穷则生变，但也可能被现实消耗

他当然也讲了反转可能性：

富哥浪费卡，穷人更有动力做算法 +infra 联合优化，可能出现 “穷则生变” 的创新。

但他仍然把概率压在 20%，说明他判断：“节俭式创新” 能追平效率，但要 “领先范式”，仍然难度很大。

林俊旸的核心态度：不是没机会，而是不要把 ‘能追上’ 误当成 ‘会领先’。

唐杰：承认差距，但押注 “2026 范式革新”——机会来自学术界开始回到牌桌

唐杰的说法更像一个 “路径判断”：

先承认：中美在企业 AI Lab 研究上确实有差距

他说得很明确：要承认差距存在。

但他押注：2026 一定会发生范式变化

理由是两点：

学术界开始跟上：
过去工业界卡多、学术界几乎没卡；现在学校算力条件改善，研究种子开始发芽。
一旦学术界参与度上来，范式探索的可能性会增大。
效率成为硬瓶颈：
继续 Scaling 当然有效，但投入巨大、收益边际变小，会逼出 “智能效率” 的新范式——用更少的投入换同样的智能增量。

唐杰的乐观点不是 “我们现在就领先”，而是：

当效率成为瓶颈时，新的算法/架构/训练范式更可能出现，而这是追赶者可能反超的窗口。

他更像在说：“领先靠资源，反超靠拐点。” 而他押注拐点会在 2026 前后出现。

杨强：更偏 “结构性乐观”——toC 更可能先赢，toB 要补课；联邦/协作式路线是现实机会

杨强并不直接给概率，但他的态度很明确：

他更看好中国先在 toC 做出世界级形态

理由类似互联网史：底层技术先在美国出现，但中国能在应用形态上做到极致（例如微信的例子）。

他对 toB 的判断更谨慎：需要补 “企业侧弥合 gap” 的能力

他提到类似 Palantir 那种 “把 AI 与企业流程之间的 gap 弥合” 的工程体系（本体、FDE 等），中国需要发展自己的 toB 解法。

他的技术押注：通用大模型 + 本地小模型协作（隐私/安全）

联邦学习的视角，是一条更适合中国落地的路线：在医疗、金融等强隐私场景下，协作式架构会越来越重要。

杨强的最终结论是：

中国会在 toC 百花齐放；toB 也会跟上，但路径不是照抄硅谷，而是发展自己的 “协作与落地体系”。