
黄仁勋深度访谈:“Token 经济” 爆发,AI 计算占 GDP 比重将翻百倍,英伟达 10 万亿是必然
计算机已从不赚钱的 “存储仓库” 升级为生产 “Token 商品” 的创收工厂。黄仁勋推演,这一转变将使计算占全球 GDP 的比重暴增 100 倍,公司极大可能迈向 10 万亿美元市值。针对电力瓶颈,他提出利用电网长期闲置冗余,构建可在高峰期主动降速的 “优雅降级” 数据中心破局。此外他认为,能自主创收的 AGI 已经实现,AI 门槛的消除不仅不会引发失业,反而将使全球 “程序员” 群体从 3000 万激增至 10 亿人。
近日,英伟达CEO黄仁勋做客知名科技播客Lex Fridman Podcast,围绕AI缩放定律(Scaling Laws)、算力与电力瓶颈、AI工厂、公司未来展望以及AI对人类社会的影响等核心议题,进行了超两小时的深度对话。
Token已成全新商品,计算占全球GDP比重将翻百倍
黄仁勋的一个核心观点是,计算的本质已经发生了根本性的跃迁——从过去人类预先录制、计算机负责检索的“存储系统”,转变为具备上下文感知能力的“生成系统”。
更重要的是,计算机在现实经济中的角色变了。过去的计算机是检索系统,主要功能是文件存储。黄仁勋将其比喻为“仓库”,而仓库本身是不直接产生高额利润的。
而现在的AI计算机变成了“工厂”,并直接与企业的收入创造挂钩。他认为,AI代工厂正在制造一种名为“Token”的商品,且这种商品已经被细分和定价。
“我们不仅看到这家代工厂在生产人们想要消费的商品,而且这些代工厂制造的Token对许多不同受众都极其有价值,甚至开始像iPhone一样出现分层:你有免费的Token,有高级Token,还有处于中间层级的Token。”黄仁勋表示,“有人愿意为每一百万个Token支付1000美元,这个想法就在不远的将来,这不是会不会发生的问题,而是何时发生的问题。”
基于这种“Token工厂”模式,计算设备完成了从成本中心向利润中心的跨越。
黄仁勋笃定地推演了这一宏观趋势:“如果生产力大幅提升,全球GDP将加速增长。我完全确信,未来用于计算的GDP占比将是过去的100倍。”
迈向10万亿美元市值?黄仁勋:增长是必然的
基于“Token”的经济理论,黄仁勋回答了,英伟达能否迈向10万亿美元的新市值巅峰的讨论。
他表示:“这个数字(10万亿)只是一个数字。”但他明确指出:“英伟达的增长极大概率会发生,在我看来是必然的。”未来实现3万亿美元营收的体量并非不可能。
电力瓶颈解法:“用好闲置电”、打造“优雅降级”的数据中心
关于AI扩张的瓶颈,黄仁勋直言:“电力是个担忧,但不是唯一担忧。”他给出两条并行路径:一是把能效继续推高;二是想办法获得更多电力。
在能效上,他强调指标是“每瓦每秒token数”,并称通过“极致协同设计”提升能效:“我们的计算机价格在上升,但token生成效率上升得更快,所以token成本在下降……每年下降一个数量级。”
在“如何获得电力”上,他给出一个更具体的思路:电网按极端峰值设计,绝大多数时间有闲置。黄仁勋称:目前的电网是按照极端天气的最高峰值(加上安全余量)来设计的。“99%的时间里,我们的电网都没有达到最坏情况。”大多数时候可能只在峰值的60%左右运行。
为利用这部分闲置能源,他认为需要改变云厂商与电力公司之间严苛的供电合同,放弃对“六个九”(99.9999%)绝对可用性的盲目追求。
“我们需要构建能够‘优雅降级’(gracefully degrade)的数据中心。”黄仁勋解释,“当电网说‘我们需要把你的电力降到80%’时,数据中心可以把关键负载转移,或者降低计算速率。计算服务质量会轻微下降,但我们消耗的能源减少了。”
供应链与内存:汇聚200家供应商,提前三年布局HBM
面对市场对ASML光刻机、台积电CoWoS先进封装等环节可能制约AI产能的担忧,黄仁勋表示并不焦虑。他说:“我告诉他们我需要什么,他们告诉我打算怎么做,我相信他们。”
在系统工程上,英伟达正在深刻改变基础设施的制造模式。黄仁勋透露,仅一个Vera Rubin机架就包含130万到150万个组件,背后汇聚了200家供应商的技术。
为了匹配这种极高的互联密度(如NVLink-72),过去在数据中心现场拼装零组件的传统模式已彻底失效。英伟达将数据中心的“超算组装”前置到了供应链的“超算制造”环节。现在,机架必须在供应链中建好,每次以两三吨的重量整机发货。这意味着供应链在整机出厂前的测试阶段,自身就需要具备吉瓦(GW)级的庞大电力储备。
而在最容易卡脖子的内存(Memory)领域,黄仁勋透露,大约三年前,HBM(高带宽内存)的使用率极低,几乎只在极少数超算中露面。但他当时就成功说服了多家内存大厂的CEO,让他们相信HBM将是未来数据中心的主流,并促使产业链果断投资扩产。
此外,他还打破常规,推动供应商将原本专属于手机的低功耗内存(LPDDR)改造并引入超算领域。
“推理是思考”:从训练、测试时扩展到“代理式扩展”
对于AI缩放定律(Scaling Laws),黄仁勋把AI扩张拆成四条“扩展规律”:预训练、后训练、测试时扩展、代理式扩展。
他回顾“数据枯竭”担忧时称:“我们会继续扩大训练数据……很多会是合成数据。”并给出判断:“训练不再受数据限制,数据将受限于算力。”
对推理侧的算力强度,他说得更直接:“推理就是思考,我认为思考很难……怎么可能是算力轻的?”他认为测试时扩展包含“推理、规划、搜索”等,会推动推理算力需求上升。
最深护城河、太空算力痛点与评价马斯克
当被问及英伟达最大的护城河时,黄仁勋明确指向了CUDA庞大的装机量与信任生态。
“这不是3个人成就的CUDA,而是43000名员工共同推动的。”黄仁勋强调,这种护城河建立在数百万开发者对英伟达持续优化底层的信任之上,辅以横向整合进入全球各类云厂商、OEM和边缘设备的极广生态。
在算力基建的前沿探索上,针对将数据中心搬上太空以解决能源分配的设想,黄仁勋证实英伟达GPU已经进入太空,但当前主要用于卫星高分辨率图像的边缘端筛选。
对于构建大规模太空数据中心,黄仁勋直言其存在核心的物理痛点:“太空中没有传导,没有对流,只能靠辐射散热。虽然极地有24/7的太阳能,但我们需要巨大的散热器。”现阶段最务实的做法,仍是先榨干地球上的闲置电力。
此外,任何算力蓝图的落地都需要极致的工程执行力。针对马斯克旗下xAI仅用4个月便建成了拥有10万块GPU的Colossus超算中心,黄仁勋在市场化基建层面给出了极高评价。
他将马斯克的成功归结为第一性原理思维与极简主义。“他质疑一切:这有必要吗?必须这样做吗?需要花这么长时间吗?”
黄仁勋表示,“埃隆在众多不同领域都有极深的造诣,同时他也是一个非常优秀的系统思考者。”他继续评价道,“他能够质疑一切,直到把一切缩减到不能再减的最低必要限度……他亲自出现在行动的第一线。当你以如此强烈的紧迫感亲自行动时,会促使其他所有人也以紧迫感行动。”
AI将颠覆就业?“全球程序员将从3000万暴增至10亿”、“AGI已实现”
针对全球劳动者对AI技术的焦虑,黄仁勋给出了一个非常务实的标准。他直言,如果今天要在两名应届毕业生中做选择,他一定会雇佣那个“AI专家”,而非对AI一窍不通的人。
黄仁勋强调,这一准则不仅限于技术岗位,而是涵盖了会计师、律师、销售人员、供应链经理、药剂师,甚至是电工和木匠。在他看来,每个职业、每个层级都没有例外,善用AI的人将展现出更高的交付价值。
他进一步厘清了“被取代”的边界:如果一个人的工作本质上就是一系列“任务”(Task),即任务本身就是你贡献的全部价值,那么被AI颠覆几乎是必然的。但如果你的工作具有更深层的“目标”(Purpose),你就可以利用AI自动化处理那些常规琐事,从而从一名单纯的“执行者”跨越成为所属行业的“创新者”。
对于那些尚未起步的人,黄仁勋给出了最 disarming(令人宽慰)的建议:“如果你不知道如何使用AI,你大可以去问AI‘我该如何使用你’。它会从头开始引导你完成全过程。”他认为,现在起步的门槛已经降至零,唯一的障碍只在于你是否决定开始。因为在这个时代,等待的成本正在随着AI的进化而与日俱增。
对于程序员,黄仁勋抛出了一个震撼的观点:“英伟达软件工程师的数量将会增长,而不是减少……如果编程的定义是‘描述规范让计算机去构建’,那么能做到这一点的人数,刚刚从3000万变成了可能达到10亿。未来每个木匠都会是程序员,每个水管工都会因此疯狂。”
在谈及AGI(通用人工智能)的时间表时,如果将AGI定义为一个能够自主开发应用并实现盈利的系统,黄仁勋表示:“我认为就是现在。我认为我们已经实现了AGI。”他设想了一个由AI自主创建的Web服务或数字影响力应用,突然获得数十亿用户使用并赚取利润的场景,这在当下已经具备技术可行性。
访谈全文如下:
黄仁勋访谈文字稿:英伟达——4万亿美元的公司与AI革命 | 莱克斯·弗里德曼(Lex Fridman)播客 #494
目录
0:00 – 介绍
0:33 – 极限协同设计与机架级工程
3:18 – 黄仁勋如何管理英伟达
22:40 – AI缩放定律
37:40 – AI缩放定律的最大阻碍
39:23 – 供应链
41:18 – 内存
47:24 – 电力
52:43 – 埃隆·马斯克与Colossus
56:11 – 黄仁勋的工程与领导哲学
1:09:50 – 台积电与台湾
1:15:04 – 英伟达的护城河
1:20:41 – 太空中的AI数据中心
1:24:30 – 英伟达市值会达到10万亿美元吗?
1:34:39 – 压力下的领导力
1:48:25 – 电子游戏
1:55:16 – AGI时间表
1:57:29 – 编程的未来
2:11:01 – 意识
2:17:22 – 死亡介绍
莱克斯·弗里德曼
(00:00:00) 接下来是与英伟达首席执行官黄仁勋的对话。英伟达是人类文明史上最重要、最具影响力的公司之一,它是推动AI革命的引擎。英伟达的巨大成功在很大程度上可以直接归功于黄仁勋纯粹的意志力,以及他作为领导者、工程师和创新者所做出的众多卓越押注和决策。这里是莱克斯·弗里德曼播客。亲爱的朋友们,现在有请黄仁勋。极限协同设计与机架级工程
莱克斯·弗里德曼
(00:00:33) 您将英伟达推向了AI的新时代,将焦点从芯片级设计转移到了机架级设计。莱克斯·弗里德曼
(00:00:42) 我想可以公平地说,长期以来,英伟达的制胜法宝在于构建尽可能完美的GPU。你们现在依然如此,但如今已经将此扩展到了对GPU、CPU、内存、网络、存储、供电、冷却、软件、机架本身、你们宣布的计算舱(Pod),甚至整个数据中心进行极限协同设计。让我们谈谈极限协同设计。协同设计一个拥有如此多复杂组件和设计变量的系统,最困难的部分是什么?黄仁勋
(00:01:11) 谢谢你的提问。极限协同设计之所以必要,是因为现在的问题已经无法装入单台计算机并仅靠单个GPU来加速了。你试图解决的问题是,你希望计算速度的提升能超过你增加的计算机数量。假设你增加了1万台计算机,但你希望速度提升一百万倍。突然之间,你必须提取算法,将算法拆解、重构,对流水线进行分片,对数据进行分片,对模型进行分片。当你以这种方式分布式地处理问题时,不仅仅是扩大问题的规模,而是分散问题,那么所有环节都会成为瓶颈。黄仁勋
(00:02:03) 这就是阿姆达尔定律(Amdahl's law)的问题:某项任务的加速幅度取决于它在总工作量中所占的比例。如果计算占问题的50%,即使我将计算速度无限提升(比如一百万倍),整个工作量的速度也只提升了两倍。现在突然之间,你不仅要分配计算任务、以某种方式对流水线进行分片,还必须解决网络问题,因为所有这些计算机都连接在一起。在我们这样的规模下进行分布式计算,CPU是个问题,GPU是个问题,网络是个问题,交换机也是个问题。在所有这些计算机上分配工作负载同样是个问题。黄仁勋
(00:02:57) 这是一个极其复杂的计算机科学问题。我们必须发挥各种技术的威力。否则,我们只能线性地扩展,或者依靠摩尔定律的能力来扩展,而随着登纳德缩放定律(Dennard scaling)的放缓,摩尔定律已经在很大程度上停滞了。黄仁勋如何管理英伟达
莱克斯·弗里德曼
(00:03:16) 这其中肯定有权衡。而且你们涉及了完全不同的学科。我确信你们在这些领域都有专家:高带宽内存、网络和NVLink、网卡、光学和铜缆连接、供电、冷却等等。这些都是世界级的专家。你是如何把他们聚在一个房间里弄清楚——黄仁勋
(00:03:34) 这就是为什么我的管理团队这么庞大。莱克斯·弗里德曼
(00:03:37) 专家和通才的合作过程是怎样的?当你清楚必须要把哪些东西塞进一个机架时,你们是如何把机架组装起来的?把它们全部设计在一起的过程是怎样的?黄仁勋
(00:03:51) 首先我们要问:什么是极限协同设计?我们正在对从架构到芯片、到系统、到系统软件、再到算法和应用程序的整个软件栈进行优化。这是一个层面。我们刚才谈论的第二个层面,超越了CPU、GPU、网络芯片、向上扩展(scale-up)交换机和向外扩展(scale-out)交换机。当然,你还得把供电和冷却等因素包括进去,因为所有这些计算机都极其耗电。它们完成大量工作,能效非常高,但总体上仍然消耗大量电力。所以第一个问题是:它是什么?黄仁勋
(00:04:34) 第二个问题是:为什么需要它?我们刚刚讨论了原因。你希望分配工作负载,使得收益超过单纯增加计算机数量的收益。第三个问题是:如何实现?你是怎么做到的?黄仁勋
(00:04:51) 这可以说是这家公司的奇迹。当你设计一台计算机时,你必须有一个计算机操作系统。当你设计一家公司时,你应该首先思考你想让这家公司产出什么。我见过很多公司的组织架构图,它们看起来都一样。汉堡型组织架构图、扁平型组织架构图,以及汽车公司的组织架构图,看起来如出一辙。这对我来说毫无意义。一家公司的目标是成为产出成果的机器、机制和系统。这个产出就是我们想要创造的产品。公司架构的设计应该反映它所存在的环境。黄仁勋
(00:05:36) 这几乎直接决定了你应该如何设置组织架构。直接向我汇报的管理团队有60人。我不会和他们进行一对一的会议,因为那是不可能的。如果你想完成工作,你的团队里就不可能有60个人还能一一对谈——莱克斯·弗里德曼
(00:05:51) 但你依然有60个直接下属,并且跨越了——黄仁勋
(00:05:53) 还要更多。莱克斯·弗里德曼
(00:05:54) 更多。而且大多数明星员工至少都涉足工程领域。黄仁勋
(00:05:59) 几乎所有人都是。有内存专家,有CPU专家,有光学专家。莱克斯·弗里德曼
(00:06:06) 难以置信。黄仁勋
(00:06:06) 还有GPU、架构、算法、设计等领域的专家。莱克斯·弗里德曼
(00:06:11) 所以你时刻关注着整个技术栈,并且必须就整个技术栈的设计进行激烈的讨论?黄仁勋
(00:06:18) 从来没有哪次对话是单人进行的。这就是为什么我不做一对一会议。我们提出一个问题,然后所有人一起攻克它。因为我们在做极限协同设计。毫不夸张地说,公司一直都在进行极限协同设计。莱克斯·弗里德曼
(00:06:33) 即使你们在讨论一个特定的组件,比如冷却、网络,所有人也都在旁听?黄仁勋
(00:06:40) 完全正确。莱克斯·弗里德曼
(00:06:41) 并且他们可以提出意见:“这不适合配电。这不适合——”黄仁勋
(00:06:45) 正是如此。莱克斯·弗里德曼
(00:06:45) “……这不适合内存。这不适合那个。”黄仁勋
(00:06:49) 完全正确。谁想不听就可以不听。原因在于,团队里的人知道什么时候该集中注意力。如果这件事他们本可以做出贡献却没有做,我会点名批评他们。所以我会说:“嘿,快来,加入讨论。”莱克斯·弗里德曼
(00:07:07) 正如你所说,英伟达是一家适应环境的公司。你觉得在哪个时间点可以说环境发生了改变,公司开始悄悄地适应?从早期用于游戏的GPU,到深度学习革命的早期,再到现在我们开始将其视为一个AI工厂?英伟达是做什么的?它生产AI,让我们建立一个生产AI的工厂吧。黄仁勋
(00:07:32) 我可以系统地推理这个过程。我们最初是一家加速器公司。但加速器的问题在于应用领域太窄了。它的优势是针对特定工作进行了极度的优化。任何专家都有这个优势。极度专业化的问题在于,你的市场范围更窄,但这也没关系。真正的问题在于,市场规模也决定了你的研发能力。而你的研发能力最终决定了你在计算领域可能产生的影响力。当我们最初作为一个非常具体的加速器起步时,我们一直知道那是我们的第一步。黄仁勋
(00:08:23) 我们必须找到一种方法成为加速计算公司。问题是,当你成为一家计算公司时,目标变得太过通用,这削弱了你的专业性。我把这两个实际上存在根本冲突的词连在了一起。我们作为计算公司做得越好,作为专家的表现就越差。我们越是专家,进行整体计算的能力就越弱。我故意把这两个词连在一起,这意味着公司必须一步一步地找到那条极其狭窄的道路,既要扩大我们的计算范围,又不能放弃我们拥有的一最重要的专业能力。我们超越加速器迈出的第一步,是发明了可编程像素着色器。黄仁勋
(00:09:13) 这是迈向可编程性的第一步。这是我们向计算世界进军的第一段旅程。我们做的第二件事是将单精度浮点数(FP32)引入我们的着色器。支持IEEE标准的FP32是朝着计算方向迈出的一大步。这也是为什么所有从事流处理器和其他类型数据流处理器研发的人发现了我们。他们说:“突然之间,我们也许可以使用这个计算密集度极高、且兼容IEEE标准的GPU了。”黄仁勋
(00:09:55) 我可以把以前在CPU上编写的软件拿过来,看看能不能用GPU来运行。这促使我们在FP32之上添加了C语言特性,我们称之为Cg。Cg的发展路径最终将我们引向了CUDA。一步一步地,我们将CUDA引入了GeForce,这是一项极具挑战的战略决策,因为它耗费了公司大量的利润,当时我们根本负担不起。但我们还是这样做了,因为我们想成为一家计算公司。计算公司必须有计算架构。计算架构必须兼容我们构建的所有芯片。莱克斯·弗里德曼
(00:10:42) 能详细讲讲那个决定吗?把CUDA放进GeForce,负担不起却依然决定这么做?你能解释一下这个决定吗?为什么敢于做出这样的选择?黄仁勋
(00:10:53) 那是第一个几乎可以说是关乎生死存亡的战略决策。莱克斯·弗里德曼
(00:11:06) 给不了解这段历史的人剧透一下,后来证明这是公司历史上做出的最辉煌、最睿智的决策之一。CUDA成为了这个AI基础设施世界中令人难以置信的计算基础。所以设定一下背景,这最终被证明是一个好决定。黄仁勋
(00:11:27) 是的,后来证明这是一个好决定。事情是这样的。我们发明了这个叫CUDA的东西,它扩大了我们的加速器可以加速的应用程序范围。问题是,我们如何吸引开发者来使用CUDA?因为计算平台的核心是开发者。开发者不会仅仅因为一个平台能执行一些有趣的操作就跑过来。他们来到一个计算平台,是因为它的装机量大。因为开发者和所有人一样,想要开发能触及大量用户的软件。装机量实际上是架构中最重要的一部分。这个架构本身可能会招致大量的批评。黄仁勋
(00:12:18) 例如,没有哪个架构受到的批评比x86更多,它被认为是一个不够优雅的架构,但它却是当今的定义性架构。这是一个例子。实际上,许多由世界上最聪明的计算机科学家设计的极其优雅的RISC架构都在很大程度上失败了。我举了这两个例子,一个是优雅的,另一个仅仅是勉强能用,然而x86存活了下来,原因在于——莱克斯·弗里德曼
(00:12:58) 装机量就是一切。黄仁勋
(00:12:59) 装机量定义了架构。其他一切都是次要的,明白吗?当时还有其他架构,CUDA出来了,OpenCL也在。有几个竞争的架构。但我们做出的正确决定是,我们说:“听着,归根结底这是关于装机量的问题,我们能把新计算架构推向世界的最好方法是什么?”那个时候,GeForce已经取得了成功。黄仁勋
(00:13:29) 我们每年已经能卖出数百万个GeForce GPU。我们说:“我们应该把CUDA放到GeForce上,把它放进每一台PC里,不管客户用不用,并把它作为培养我们装机量的起点。”与此同时,我们去吸引开发者,去大学里写书、开课,把CUDA放到各个地方。渐渐地,人们发现了它。当时PC是主要的计算工具,还没有云,我们可以把一台超级计算机交到学校里每个研究员、每个科学家、每个工科学院、每个学生的手中。最终,奇迹一定会发生。黄仁勋
(00:14:15) 问题在于,CUDA极大地增加了GPU这个消费级产品的成本,完全吞噬了公司所有的毛利润。那时候公司市值大概是80亿美元?或者是六七十亿美元?当我们推出CUDA后,我意识到它会增加很多成本,但这是我们坚信的东西。我们的市值一度跌到了大概15亿美元。我们在谷底徘徊了一段时间,然后慢慢爬了回来,但我们坚持在GeForce上搭载CUDA。我总是说英伟达是GeForce建立起来的殿堂,因为是GeForce把CUDA带给了所有人。黄仁勋
(00:15:10) 研究人员、科学家,他们之所以在GeForce上发现CUDA,是因为他们中很多人也是游戏玩家。很多人反正也要自己组装PC。在大学实验室里,很多人使用PC组件自己搭建集群。我们就是这样起步的。莱克斯·弗里德曼
(00:15:31) 然后这成为了深度学习革命的平台和基础。黄仁勋
(00:15:35) 那也是一个非常伟大的观察结果。莱克斯·弗里德曼
(00:15:38) 在那个生死存亡的时刻,你还记得那些会议是什么样的吗?作为一家公司决定拿一切去冒险,讨论的情形是怎样的?黄仁勋
(00:15:48) 我必须向董事会表明我们想做什么,管理团队也知道我们的毛利率会被压垮。你可以想象这样一个世界:GeForce背负着CUDA的成本,但没有游戏玩家欣赏它,也没有玩家愿意为它买单。他们只愿意付特定的价格,根本不在乎你的成本是多少。我们将成本增加了50%,而我们原本是一家毛利率35%的公司。所以做出这个决定非常艰难。但你可以想象,总有一天它会进入工作站,进入超级计算机,在这些领域,也许我们能获取更高的利润。黄仁勋
(00:16:36) 所以你可以用理性的推导让自己觉得能承受这个代价,但这仍然花了十年时间。莱克斯·弗里德曼
(00:16:45) 那更多是与董事会沟通说服他们,但在心理层面,随着英伟达不断做出预测未来的大胆押注,并在一定程度上特别是现在定义了未来。我想向您请教一些智慧,关于您是如何有能力做出这些决策,带领公司实现跨越的?黄仁勋
(00:17:14) 首先,我有极强的好奇心。在某个时刻,会有一个推理系统非常清晰地使我确信这个结果将会发生。这必然会发生。所以在我的脑海中我是坚信的,当我内心坚信时,你也知道那是怎样的。你在脑海中显化了一个未来,那个未来如此令人信服,它不可能不发生。在这中间会有很多磨难,但你必须坚持你的信念。莱克斯·弗里德曼
(00:17:52) 所以你设想了未来,本质上从工程的角度,你将它变成了现实?黄仁勋
(00:17:59) 是的。你要推理如何到达那里。你要推理它为什么必须存在。我们在这里一起推理。管理团队会去推理。我会花很多时间去推理。下一部分可能是一项管理技能。通常在领导层中,领导者会保持沉默,或者他们了解到一些事情,然后发表一些宣言:“这是全新的一年,到明年年底我们要有一个全新的计划。”这里进行大裁员,那里进行大架构调整,提出新的使命宣言,设计新标识之类的东西。黄仁勋
(00:18:43) 我从不这样做。当我了解到某件事,并且它开始影响我的思考时,我会向我身边的每个人明确表示:“这件事很有趣。这将会带来改变。这将会影响那件事。”我会一步一步地去推理。很多时候我已经做出了决定,但我会抓住每一个可能的机会——外部信息、新的洞察、新的发现、工程上的新启示、新设立的里程碑——我会利用这些机会来塑造其他人的信念系统。我几乎每天都在这么做。我和董事会这么做,和管理团队这么做,和员工这么做。黄仁勋
(00:19:33) 我试图塑造他们的信念系统,这样当某天我说“嘿,我们收购Mellanox吧”时,大家都会觉得这是理所当然的,我们绝对应该买。当我说“伙计们,让我们在深度学习上全力以赴”并且告诉他们原因时,其实我已经为公司内部的各个组织铺好了砖。每个组织、每个人可能都听到了一些内容,大多数人都听到了其中的片段。当我宣布的那天,每个人都已经接受了其中的许多部分。黄仁勋
(00:20:19) 在很多方面,当我宣布这些事情时,我能想象员工们都在说:“黄仁勋,你怎么这么久才说?”事实上,我一直在塑造他们的信念系统。所以领导力,有时候看起来像是你在后面引导,但你一直在塑造他们,直到我宣布的那天,大家100%买账。但这正是你想要的结果。你想带所有人一起前进。否则,如果我们突然宣布关于深度学习的计划,所有人都会说:“你在说什么?”如果你宣布全力投入某件事,你的管理团队、董事会、员工、客户会觉得:“这是从哪儿冒出来的?”黄仁勋
(00:21:02) “这太疯狂了。”如果你回顾过去的GTC大会,看看那些主题演讲,其实我同时也在塑造行业内合作伙伴的信念系统,我利用这一点来塑造我员工的信念系统。所以到了我宣布某件事的时候,比如我们刚刚宣布了Groq,其实过去两年半我一直在谈论相关的基石。你回顾过去会发现:“天哪,他们已经谈论这个谈了两年半了。”我一直在一步一步地打地基,所以当时机成熟宣布时,大家都在说:“你怎么花了这么长时间?”莱克斯·弗里德曼
(00:21:44) 但这不仅仅是在公司内部。你正在塑造这个行业,以及更广泛的全球创新格局。把这些想法抛出来,你真的在使现实具象化。黄仁勋
(00:21:53) 我们不造计算机。实际上我们不建云。我们原来是一家计算平台公司。所以没有人能直接从我们这里买到成品。这很奇妙。我们进行垂直整合以完成设计和优化,但在每个层级我们将整个平台完全开放,以便集成到其他公司的产品、服务、云、超级计算机和OEM计算机中。所以令人惊叹的是,如果没有先说服他们,我根本做不成我现在做的事。GTC大部分的作用就是展现未来,以至于当我们的产品准备好时,他们会说:“你怎么这么慢才拿出来?”AI缩放定律
莱克斯·弗里德曼
(00:22:39) 是的。很长一段时间以来,你都是广义缩放定律(Scaling Laws)的信徒。你现在依然相信缩放定律吗?黄仁勋
(00:22:49) 是的。现在我们有了更多的缩放定律。莱克斯·弗里德曼
(00:22:51) 我认为你总结了四个阶段的缩放定律:预训练、后训练、测试时间(推理)和智能体(Agentic)缩放。当你思考未来,深远的未来和近期的未来时,你最担心、最让你彻夜难眠、为了继续扩展必须克服的阻碍是什么?黄仁勋
(00:23:12) 我们可以回顾一下人们过去认为是阻碍的因素。在最初的预训练缩放定律阶段。人们理所当然地认为,我们拥有的高质量数据量将限制我们能达到的智能水平。这个缩放定律非常重要。模型越大,相应更多的数据就会带来更聪明的AI。这就是预训练。伊利亚·苏茨克维(Ilya Sutskever)当时说:“我们的数据用光了”或者类似的话。“预训练结束了”。整个行业都恐慌了,认为这就是AI的尽头。但这显然不是真的。黄仁勋
(00:23:57) 我们将继续增加用于训练的数据量。其中很多数据可能是合成的(Synthetic),这也让人们感到困惑。人们没有意识到,或者忘记了,我们用来相互教导、相互告知的大部分数据其实也是“合成”的。它是合成的,因为它不是从自然界中直接长出来的。你创造了它。我消费它。我修改它,增强它,我重新生成它,其他人再消费它。我们现在已经达到了这样一个水平:AI能够获取基础事实(Ground Truth),对其进行增强……合成生成海量的数据。黄仁勋
(00:24:47) 后训练这部分继续扩展,因此我们可以使用的人类生成的数据量将变得越来越小。我们用来训练模型的数据量将继续增长,直到我们不再受限于数据……训练现在受限于算力。原因就是大部分数据是合成的。然后下一个阶段是测试时间(推理),我还记得人们告诉我:“推理?哦,那很简单。预训练才难呢。那可是巨型系统。推理肯定很简单。所以推理芯片只会是一些小芯片——”黄仁勋
(00:25:32) “它们不会像英伟达的芯片那样。那太复杂、太昂贵了。在未来,推理将是最大的市场,它会变得很简单,我们会把它商品化。每个人都能造自己的芯片。”这对我来说一直是不合逻辑的,因为推理就是思考,而我认为思考很难。思考比阅读难得多。黄仁勋
(00:25:59) 预训练只是记忆和泛化,在关系中寻找模式。你只是在不停地读。而测试时间缩放(推理)涉及的是思考、推理、解决问题。将未探索的经历、新经验分解为可解决的片段,然后我们通过第一性原理推理,或通过以前的例子和先前的经验去解决它。或者仅仅是探索、搜索、尝试不同的方法。推理阶段的整个测试时间缩放过程,实际上是关于思考的。它是关于推理、规划和搜索的。黄仁勋
(00:26:50) 这怎么可能是轻算力的呢?我们在这方面完全正确。测试时间的扩展是极度耗费算力的。接下来的问题是,现在我们在推理和测试时间缩放阶段,那这之后是什么?显然,我们现在创造了一个智能体“人”,这个智能体“人”拥有我们开发的大语言模型。但在测试期间,这个智能体系统会去进行研究,敲击数据库,去使用各种工具,而它做的最重要的一件事,就是衍生并生成一大堆子智能体(Sub-agents)。这意味着我们正在组建庞大的团队。通过雇佣更多的员工来扩展英伟达,比扩展我自己要容易得多。黄仁勋
(00:27:44) 因此,下一个缩放定律就是智能体缩放定律(Agentic Scaling Law)。这就好比复制AI。我们可以随心所欲地快速衍生智能体。所以,我总结了四个维度的缩放定律。当当我们使用智能体系统时,它们会创造更多的数据,创造大量的经验。对于其中一些,我们会说:“哇,这真的很好。我们应该把这个记住。”黄仁勋
(00:28:12) 然后这个数据集又会回到预训练阶段。我们记忆并泛化它。然后我们在后训练阶段对其进行微调和完善。接着我们利用测试时间和智能体系统进一步增强它,然后输出到行业中。这个循环会不断持续下去。归根结底,智能水平将通过一件事来扩展,那就是算力。莱克斯·弗里德曼
(00:28:41) 但这里有一个棘手的问题,你必须预测未来,因为其中一些组件需要不同类型的硬件才能以最佳状态运行。所以你必须预测AI的创新将走向何方。比如,混合专家模型(MoE)——黄仁勋
(00:28:57) 非常对。莱克斯·弗里德曼
(00:28:58) 带有稀疏性的模型。黄仁勋
(00:28:59) 完全正确。莱克斯·弗里德曼
(00:29:00) 硬件不可能在一周内说换就换。你必须预测未来的形态。要做到这点非常可怕,也非常困难,对吧?黄仁勋
(00:29:09) 比如,这些AI模型架构大约每六个月就会更新一次。而系统架构和硬件架构大约三年更新一次。所以你需要预测两三年后可能会发生什么。有几种方法可以做到这一点。首先,我们自己在内部进行研究,这也是为什么我们既有基础研究,也有应用研究的原因。黄仁勋
(00:29:40) 我们创建自己的模型。因此我们在这里有第一手的生活经验。这是我谈到的协同设计的一部分。我们也是世界上唯一一家几乎与世界上所有AI公司合作的AI公司。我们在力所能及的范围内,试图去感知人们正在经历哪些挑战。莱克斯·弗里德曼
(00:29:59) 所以你在倾听整个行业、各大AI实验室的低语。黄仁勋
(00:30:02) 没错。你必须倾听并向所有人学习。最后一部分是拥有一个灵活的、能随风而动的架构。CUDA的好处之一是,一方面它是极其强大的加速器;另一方面,它非常灵活。这种在专业化(否则无法加速CPU)和通用性(以便适应不断变化的算法)之间的惊人平衡,非常非常重要。这也是为什么CUDA一方面极具韧性,另一方面我们还能不断对其进行增强。黄仁勋
(00:30:44) 我们现在已经到了CUDA 13.2。我们进化架构的速度非常快,以至于我们能够跟上现代算法的步伐。例如……当混合专家模型(MoE)出现时,这就是我们推出NVLink 72而不是NVLink 8的原因。我们现在可以将一个拥有4万亿、10万亿参数的模型放入一个计算域中,就好像它在一个GPU上运行一样。人们可能没注意到我说过这句话,但如果你看看Grace Blackwell机架的架构,它完全专注于做一件事:处理大语言模型(LLM)。仅仅一年后,你看到了Vera Rubin机架。它有存储加速器,有被称为Vera的出色新CPU。它有Vera Rubin和NVLink 72来运行LLM。黄仁勋
(00:31:46) 它还拥有一个名为Rock的全新附加机架。所以这整个机架系统与上一个完全不同,它包含了所有这些新组件。原因在于上一代系统是为了运行MoE大型语言模型推理设计的。而这一代是为了运行智能体,智能体会调用各种工具。莱克斯·弗里德曼
(00:32:10) 显然,该系统的设计肯定在Open-Claude、Codex等出现之前就已经完成了。所以你本质上是在预判未来。这来源于什么?来自于行业内的低语,还是对技术最前沿的理解?黄仁勋
(00:32:25) 不。莱克斯·弗里德曼
(00:32:25) 不是?黄仁勋
(00:32:26) 没那么复杂。你只需要去推理。不管发生什么,如果在某个时候我们要让大语言模型成为一个数字工作者……让我们用这个比喻。假设我们希望LLM成为数字工作者。它必须做什么?它必须访问基础事实(Ground truth)。那就是我们的文件系统。它必须能够做研究。它不可能无所不知。我不想等到这个AI变得对过去、现在和未来的一切都无所不知之后再让它发挥作用。因此,我不如让它去做研究。很明显;如果它想帮我,它就得使用我的工具。黄仁勋
(00:33:13) 很多人会说:“AI会彻底摧毁软件。我们不再需要软件了。我们甚至不再需要工具了。”这太荒谬了。让我们用一个思想实验。你可以坐在那儿,品一杯威士忌,思考所有这些事情,一切都会变得显而易见。如果我们要在未来10年内创造出能想象到的最神奇的智能体,假设它是一个人形机器人。如果这个人形机器人被创造出来,它是更有可能走进我家,用我现有的工具来完成它的工作?黄仁勋
(00:33:54) 还是说它的手在一个场景下变成一把10磅重的锤子,在另一个场景下变成手术刀,而为了烧水,它的手指能发射微波?或者是它更可能直接使用微波炉?第一次走向微波炉时,它可能不知道怎么用。但没关系。它连接在互联网上。它读取这台微波炉的手册,读完后立刻成为专家。然后它就可以使用了。我认为我刚才描述的,实际上几乎囊括了Open-Claude的所有属性。黄仁勋
(00:34:35) 它将使用工具,访问文件,能够进行研究。它有一个IO子系统。当你以这种方式推理完毕后,你会说:“天哪,这对计算未来的影响是极其深远的。”原因是,我认为我们刚刚重新发明了计算机。然后你现在会问:“好,我们是什么时候推理出这个的?我们什么时候推理出Open-Claude的?”如果你去看我在GTC大会上使用过的Open-Claude示意图,你会发现那是两年前的事。就在两年前的GTC上,我就在谈论智能体系统,这与今天的Open-Claude完全吻合。当然,许多事情必须汇聚在一起才能发生。黄仁勋
(00:35:26) 首先,我们需要Claude、GPT以及所有这些模型达到一定的能力水平。因此,他们的创新、突破和持续进步非常重要。然后,当然有人必须创建一个足够稳健、足够完整的开源项目,以便我们大家都能将其投入使用。我认为Open-Claude对智能体系统的影响,就如同ChatGPT对生成式系统的影响一样。我认为这是一件非常重要的事情。莱克斯·弗里德曼
(00:36:02) 是的,这是一个非常特殊的时刻。我不太确定为什么它能吸引全世界如此多的关注,但它确实做到了,甚至比Claude Code和Codex等还要引人瞩目。黄仁勋
(00:36:12) 因为消费者能够接触到它。莱克斯·弗里德曼
(00:36:13) 确实。但这很大程度上也是一种氛围。彼得(Peter),我曾邀请他上过播客,他是个很棒的人。所以部分原因也是代表这个产品的人带来的影响。黄仁勋
(00:36:25) 毫无疑问。莱克斯·弗里德曼
(00:36:25) 部分原因是因为迷因(Memes),而且我们都在试图弄清楚它。当拥有如此强大的技术时,如何移交你的数据让它们能做有用的事?这里存在极其严肃且复杂的安全问题,与之相关的事情也很可怕。无论是作为个体还是作为一种文明,我们都在摸索如何找到正确的平衡点。黄仁勋
(00:36:44) 是的,我们立刻采取了行动,派出了许多安全专家。我们做了一个叫做OpenShell的项目。它已经被集成到了Open-Claude中。莱克斯·弗里德曼
(00:36:55) 英伟达推出了NemoClaw(注:此处指英伟达相关安全工具)。黄仁勋
(00:36:58) 没错。莱克斯·弗里德曼
(00:36:59) 它安装起来非常简单,能确保安全性。黄仁勋
(00:37:03) 我们给你三项权限中的两项。智能体系统可以访问敏感信息,可以执行代码,也可以与外部通信。如果我们在任何时候只给你这三项能力中的两项,而不是全部三项,我们就能保证安全。在授予的这两项能力中,我们还根据企业赋予你的任何权利来提供访问控制。然后我们将其连接到所有这些企业已经拥有的策略引擎上。所以我们将尽最大努力帮助Open-Claude变得更好。AI缩放定律的最大阻碍
莱克斯·弗里德曼
(00:37:40) 你雄辩地解释了我们如何拥有着一段被认为是阻碍、但最终我们克服了阻碍的漫长历史。但现在展望未来,既然智能体将无处不在已经显而易见,显然我们需要大量的算力。那么,进一步扩展的阻碍将会是什么?黄仁勋
(00:37:59) 电力是一个顾虑,但不是唯一的顾虑。这也是我们为什么大力推进极限协同设计的原因,以便我们每年都能将每瓦每秒生成的Token数提高几个数量级。在过去的10年中,按照摩尔定律,计算能力会提高大约100倍。而我们在过去10年中通过扩大规模,将计算能力提升了一百万倍。我们将通过极限协同设计继续这样做。能效,即每瓦性能,完全影响着一家公司的收入,影响着一家工厂的收入。我们将把能效推向极限,以便尽可能快地降低Token的成本。黄仁勋
(00:38:51) 我们的计算机价格在上涨,但我们生成Token的效率提升得快得多,因此Token的成本正在下降。每年都在以一个数量级的速度下降。莱克斯·弗里德曼
(00:39:04) 电力是一个很有趣的问题。试图绕过电力障碍的方法是,通过提高每瓦每秒生成的Token数,使其变得越来越高效。当然,如何获取更多的电力也是个问题。黄仁勋
(00:39:16) 我们确实也应该获取更多电力。供应链
莱克斯·弗里德曼
(00:39:17) 这是一个非常复杂的问题。你谈到过小型模块化核电站。针对能源有很多想法。AI供应链的瓶颈问题有多少次让你彻夜难眠?比如拥有EUV光刻机的ASML,拥有像CoWoS这样的先进封装技术的台积电,以及拥有高带宽内存的SK海力士?黄仁勋
(00:39:38) 一直都在想,我们无时无刻不在解决这些问题。历史上从未有一家公司在以我们这样的规模增长的同时,还能加速这种增长。这简直难以置信。人们甚至很难理解这一点。在整个AI计算领域,我们正在增加市场份额。因此,供应链的上下游对我们来说都极其重要。我花了很多时间与我合作的所有CEO交流:有哪些动态将促使这种增长继续甚至加速?这部分原因解释了为什么在GTC上,坐在我右边的几乎是整个上游IT行业的CEO和整个下游基础设施行业的CEO。黄仁勋
(00:40:32) 他们都在。有好几百位CEO。我不认为历史上曾有过几百位CEO出席的主题演讲。原因之一是,我在告诉他们我们现在的业务状况。我在告诉他们不久的将来的增长驱动力以及正在发生的事情。我还在描述我们下一步将走向何方,以便他们可以利用所有这些信息和动态来指导他们的投资决策。就像我通知我自己的员工一样,我也这样通知他们。内存
黄仁勋
(00:41:06) 当然,然后我会亲自去拜访他们,确保“嘿,听着,我希望你们知道,在这个季度、今年、明年,这些事情将会发生。”如果你去看看DRAM(动态随机存取内存)行业的CEO们——世界上排名第一的DRAM曾经是数据中心CPU使用的DDR内存。大约三年前,我成功说服了几位CEO:尽管当时HBM(高带宽内存)的使用非常稀少,甚至超级计算机都很少用,但这将成为未来数据中心的主流内存。一开始这听起来很荒谬,但有几位CEO相信了我,并决定投资制造HBM内存。黄仁勋
(00:41:55) 另一种放到数据中心显得有些奇怪的内存是用于手机的低功耗内存。我们希望他们能对其进行改造,以适用于数据中心的超级计算机。他们说:“用手机内存做超级计算机?”我向他们解释了原因。现在看看这两种内存:LPDDR5和HBM4。需求量简直惊人。这三家公司(生产这些内存的)都迎来了历史上创纪录的一年,而这些都是拥有45年历史的老牌公司。所以,我的部分工作就是去告知、塑造和启发。莱克斯·弗里德曼
(00:42:36) 所以你不仅仅是在构想未来并激励英伟达公司的不同工程师,你还在塑造未来的供应链。你在和台积电、ASML进行对话。黄仁勋
(00:42:50) 上游、下游。莱克斯·弗里德曼
(00:42:51) 上游,下游。所以这就是关键。黄仁勋
(00:42:53) GE(通用电气)、Caterpillar(卡特彼勒)。没错,那是我们的下游。就是这样。莱克斯·弗里德曼
(00:42:59) 是的,整个系统。整个半导体行业涉及的极度困难的工程技术太多了,供应链是如此错综复杂,组件如此之多,这让人感到可怕,但它竟然奇迹般地运转起来了。黄仁勋
(00:43:18) 没错,深度的科学。深度的工程,不可思议的制造。如今大部分制造都已经是机器人化了。但我们有几百家供应商,他们提供的技术组成了我们拥有130万个组件的机架。每个机架有一百三十到一百五十万个组件。Vera Rubin机架背后有200家供应商。莱克斯·弗里德曼
(00:43:45) 有趣的是,在让你彻夜难眠的阻碍清单中,你没有列出这一点。黄仁勋
(00:43:49) 因为我已经做了所有必要的事情去——莱克斯·弗里德曼
(00:43:52) 好的。黄仁勋
(00:43:52) 明白了吗?我可以安心睡觉了,因为我已经搞定了。我对自己说:“好了,让我推理一下。什么对我们最重要?”因为我们将系统架构从你记忆中最初的DGX-1改变为NVLink-72机架级计算——这意味着什么?这对软件意味着什么?对工程意味着什么?对我们设计和测试的方式意味着什么?这对供应链意味着什么?其中一个影响是,我们将原本在数据中心进行的超级计算机集成工作,前置到了供应链中的超级计算机制造环节。黄仁勋
(00:44:42) 如果你这么做,你还必须认识到……假设你想建一个数据中心,需要50千兆瓦的超级计算机同时运行,而在供应链中制造那50千兆瓦的超级计算机需要一周的时间。那么供应链每周就需要一千兆瓦的电力来构建和测试这些在供应链中的超级计算机,然后我才能发货。莱克斯·弗里德曼
(00:45:25) 哦。黄仁勋
(00:45:25) 而NVLink-72真的是在供应链里构建超级计算机,然后以每个机架两三吨的重量直接发货。过去组件是分开运来的,我们在数据中心内部组装。但现在不可能了,因为NVLink-72的密度太高了。所以这就是一个例子。我必须飞到供应链那里,去见我的合作伙伴,说:“嘿,猜猜看?这就是我们将要做的……这是我们过去构建DGX的方式。现在我们要这样构建。这将会好得多,因为我们在推理方面将需要它们。”推理的市场正在到来。推理的拐点即将到来。这将是一个巨大的市场。黄仁勋
(00:46:05) 首先我向他们解释发生了什么,为什么会发生,然后我要求他们每家都投入几十亿美元的资本支出。因为他们信任我,我也非常尊重他们,我给他们充分的机会来质疑我,我花时间向人们解释事物,用第一性原理去推理。我画图表,进行第一性原理推理。当我跟他们谈完时,他们知道该怎么做了。莱克斯·弗里德曼
(00:46:35) 所以很大一部分是关于关系,以及建立对未来的共同愿景。但你会担心某些瓶颈吗?供应链中最大的瓶颈是什么?你担心ASML的EUV工具吗?担心台积电的CoWoS封装技术扩张速度够不够快吗?正如你所说,你们不仅增长得难以置信地快,而且还在加速增长。感觉供应链中的每个人,这些显然都是瓶颈环节,都必须扩大规模。你有没有和他们沟通,比如如何才能更快地扩大规模?黄仁勋
(00:47:12) 无时无刻不在沟通。莱克斯·弗里德曼
(00:47:12) 你担心吗?黄仁勋
(00:47:13) 不担心。莱克斯·弗里德曼
(00:47:13) 好的。黄仁勋
(00:47:14) 因为我已经告诉他们我需要什么。他们理解了我的需求。他们告诉了我他们将去做什么,我也相信他们会去做到。电力
莱克斯·弗里德曼
(00:47:22) 很有意思。听到这个太好了。我们再在电力问题上稍作停留。你对解决能源问题有什么期望?黄仁勋
(00:47:30) 莱克斯,这是我特别想探讨的一个领域,把这个信息传递出去。我们的电网是为最坏的情况设计的,并且还留有一定的余量。但实际上99%的时间里,我们根本达不到最坏的情况,因为最坏的情况仅仅是冬天最冷的几天、夏天最热的几天以及极端天气。大多数时候我们远没有达到极限情况,可能只运行在峰值负荷的大约60%。黄仁勋
(00:48:08) 所以99%的时间里,我们的电网都有多余的电力被闲置着。但它们必须被闲置备用,以防万一。当关键时刻到来时,医院必须有电,基础设施必须有电,机场必须运转等等。我的问题是,我们是否可以去帮助他们理解并签订合同协议,重新设计计算机架构系统和数据中心。这样,当社会基础设施需要最大电力时,数据中心获得的电力就会减少。黄仁勋
(00:48:49) 反正这种情况也非常罕见。在那段时间里,我们或者为那一小部分需求配备备用发电机,或者让我们的计算机将工作负载转移到其他地方,或者让计算机运行得慢一点。我们可以降低性能,减少功耗,并在有人请求答案时提供稍微长一点的延迟响应。我认为,相比于期望100%的正常运行时间——这些要求极其严苛的合同给电网带来了巨大的压力,现在他们将不得不进一步提高最大容量。我只是想利用他们闲置的多余电力而已。莱克斯·弗里德曼
(00:49:36) 是的,这个话题讨论得还不够。是什么阻碍了这一点?是监管吗?是官僚主义吗?黄仁勋
(00:49:43) 我认为这是一个三方面的问题。首先是从最终客户开始的。最终客户对数据中心提出要求,认为它们绝对不能出现不可用的情况。所以最终客户期望的是完美。为了交付这种完美,你需要发电机和电网供应商结合起来兑现这100%的承诺。每个人都要求“六个九”(99.9999%的可用性)。首先,现在我们必须让所有人都明白,当客户提出这些要求时,你们数据中心运营团队的人可能并没有和CEO沟通。我打赌CEO不知道这件事。我要去和所有的CEO谈谈。黄仁勋
(00:50:28) CEO们可能根本没关注正在签署的合同条款,所有人当然都想签最好的合同。他们去找云服务提供商(CSP),那些参与谈判的合同谈判员……我都能想象出他们的样子。他们谈判这些多年的合同,双方都想要最有利的条款。结果就是,CSP接着去找公用事业公司,要求“六个九”的保障。我认为第一件事就是要确保所有客户、CEO们明白他们到底在要求什么。第二件事,我们需要建设能够优雅降级(Gracefully degrade)的数据中心。黄仁勋
(00:51:13) 所以,如果公用事业公司、电网告诉我们:“听着,我们必须把你们的电力供应降到80%。”我们会说:“完全没问题。”我们会移动工作负载。我们会确保数据绝不丢失,但我们可以降低计算速率,使用更少的能源。服务质量会稍微下降一点。对于关键工作负载,我立刻把它转移到其他地方,这样我就没有问题了。找到仍然拥有100%正常运行时间的数据中心。莱克斯·弗里德曼
(00:51:44) 在数据中心里实现智能的、动态的电力分配,这是一个多难的工程问题?黄仁勋
(00:51:49) 只要你能设定出规范,你就能把它造出来。这句话说得很好。只要它符合第一性原理和物理定律,我认为就没问题。莱克斯·弗里德曼
(00:51:58) 你刚提到的第三件事是什么?黄仁勋
(00:52:00) 所以第二件事是数据中心。第三件事是我们需要公用事业公司也认识到这是一个机会。与其说“听着,我需要五年时间才能增加电网容量”,不如说“如果你愿意接受这种保障级别的电力,我下个月就能以这个价格为你提供”。如果公用事业公司提供更多不同层级的电力交付承诺,我认为所有人都能找出应对之策。目前电网里的浪费实在是太多了。我们应该去解决这个问题。埃隆·马斯克与Colossus
莱克斯·弗里德曼
(00:52:43) 你高度赞扬了埃隆·马斯克和xAI在孟菲斯(Memphis)的成就,他们在创纪录的时间内——仅仅四个月,就建成了Colossus超级计算机。现在它拥有20万个GPU,并且还在快速增长。在你的理解中,他解决问题的方法是否对所有数据中心建设者都有指导意义,从而促成了那样的成就?他对待工程的态度,对待整个建设管理的方法?黄仁勋
(00:53:15) 首先,埃隆在很多不同领域都有很深的造诣。同时,他也是一个非常优秀的系统思考者。因此,他能够贯穿多个学科进行思考,他显然会推动事物发展,质疑一切:第一,这是必要的吗?第二,必须这样用这种方式做吗?第三,需要花这么长时间吗?他有能力质疑一切,直到把所有东西缩减到绝对必要的最低限度,你无法再剔除任何东西,而产品依然保留了必需的功能。他做到了你能想象到的极致的极简主义,并且是在系统层面上做到这一点的。我还喜欢的一点是,他会亲临现场。黄仁勋
(00:54:25) 他会亲自去那里。如果出现问题,他就会直接去现场说:“把问题指给我看。”当你将这些结合起来时,你就克服了许多过去的惯性思维:“我们一直都是这样做的”,“我在等他们”。这完全是在找借口。最后一点,当你带着如此强烈的紧迫感亲力亲为时,会让所有人也充满紧迫感。每个供应商都在同时处理很多客户的很多项目,但他有办法让他自己成为其他所有人项目中优先级最高的那一个。他通过亲身示范做到了这一点。莱克斯·弗里德曼
(00:55:09) 是的,我参加过很多那样的会议。看他工作很有趣,因为真的没有足够多的人会去问这样的问题:“这能做得更快一点吗?怎么做?为什么非得花这么长时间?”黄仁勋
(00:55:21) 是的,对。莱克斯·弗里德曼
(00:55:22) 然后这通常会变成一个工程问题。当你到了解实际的基层真相时……我记得有一次我和他在一起,他真的在从头到尾过一遍如何将电缆插入机架的整个流程。他与在现场执行该任务的工程师合作,他只是想了解这个过程是什么样的,如何才能减少出错的可能。从组装数据中心的每一个单项任务中建立直觉——莱克斯·弗里德曼
(00:55:52) 你开始在细节尺度和广阔的系统尺度上立刻感觉到哪里存在低效,因此你可以让它变得越来越高效。此外,你还拥有强大的执行力去说:“让我们完全用不同的方式来做——”黄仁勋
(00:56:08) 是的。没错。莱克斯·弗里德曼
(00:56:09) “——并移除所有可能的阻碍。”黄仁勋
(00:56:10) 没错。黄仁勋的工程与领导哲学
莱克斯·弗里德曼
(00:56:11) 你觉得英伟达极限系统协同设计的方法,与埃隆处理系统工程的方式有相似之处吗?黄仁勋
(00:56:18) 首先,协同设计是终极的系统工程问题。所以我们从第一性原理出发来开展工作。我们做的另一件事——这也是我在30年前提出的一种哲学、一种心态或者说一种方法——叫做“光速”。光速不仅仅是指速度。光速是我的一个缩略语,代表着物理学的极限所在。所以我们做的每一件事都会与“光速”进行对比。内存速度、数学计算速度、电力、成本、时间、精力、人员数量、制造周期时间。黄仁勋
(00:57:09) 当你思考延迟与吞吐量的权衡,当你思考成本与吞吐量、成本与容量的关系时,你会对所有这些不同的约束条件分别进行测试,将其逼近物理极限(光速)。然后当你综合考量时,你知道必须做出妥协。因为实现极低延迟的系统架构与实现极高吞吐量的系统架构在根本上是不同的。但你想知道实现高吞吐量系统的极限是什么?实现低延迟系统的极限又是什么?然后当你考虑整个系统时,你就可以进行权衡。所以我强迫每个人从第一性原理、从极限出发去思考。黄仁勋
(00:58:01) 在做任何事情之前,想想物理学允许的极限在哪里。我们用这个标准来测试一切。这是一种很好的思维框架。我不太喜欢另一种被称为“持续改进”的方法。持续改进的问题在于……首先,你应该利用“光速思维”,从第一性原理出发来设计工程,仅受限于物理极限。当然,在这之后你会随着时间不断改进它。但我不喜欢面对一个问题时,有人说:“嘿,现在做这件事需要74天。我们现在能帮你缩短到72天。”我宁愿把它全部推倒重来,归零。黄仁勋
(00:58:52) 然后说:“首先,解释给我听为什么一开始需要74天。想想看我们今天能做到什么程度。如果我完全从零开始构建它,需要多长时间?”通常,你会感到惊讶,答案可能是6天。剩下的那部分,从6天到74天的差距,可能是基于非常合理的妥协、降低成本以及各种各样的原因。但至少你知道这些差距在哪。既然你知道6天是有可能实现的,那么从74天探讨如何降到6天的对话,就会极其有效得多。莱克斯·弗里德曼
(00:59:30) 在你构建如此极其复杂的系统时,简单性有时是一个值得追求的好启发式原则吗?拿你们发布的Vera Rubin计算舱(Pod)来说,这真是令人难以置信。我们谈论的是7种芯片、7种芯片类型、5种专用机架类型、40个机架、1.2千万亿个晶体管、近2万个英伟达裸片、超过1100个Rubin GPU、60百亿亿次浮点运算能力(exaflops)、10 PB/s的扩展带宽。而这仅仅是一个……黄仁勋
(01:00:03) 这仅仅是一个计算舱。莱克斯·弗里德曼
(01:00:04) 仅仅是一个计算舱。黄仁勋
(01:00:06) 是的,仅仅是一个计算舱。莱克斯·弗里德曼
(01:00:07) 所以你有……甚至单单一个NVL72机架就有130万个组件,1300个芯片,4000根线缆,全部塞进一个宽19英寸的机架里。黄仁勋
(01:00:19) 而且莱克斯,我们可能每周都要生产大约200个这样的计算舱,给你提供个视角。莱克斯·弗里德曼
(01:00:25) 组件数量如此之多,我猜想“简单性”是不可能实现的。但是在尝试设计时,它是否会作为一种你努力追求的衡量指标?黄仁勋
(01:00:35) 我最常说的一句话是,我们需要事物像必要时那样复杂,但又要尽可能简单。所以问题是,所有这些复杂性都是必要的吗?我们必须对此进行测试,必须提出挑战。除此之外的任何多余的东西都是不必要的。莱克斯·弗里德曼
(01:00:56) 但这几乎是不可思议的。从整个半导体行业来看,英伟达正在做的是历史上最伟大的工程之一。这些系统真的是工程学的奇迹。黄仁勋
(01:01:10) 它是世界上制造过的最复杂的计算机。莱克斯·弗里德曼
(01:01:13) 是的,这些工程团队。我不是在比较,如果有一个工程团队的奥运会,台积电在各个层面上都做着令人难以置信的工程工作,正如我所说的ASML也是,但英伟达绝对是强有力的竞争者。真是令人惊叹的团队。黄仁勋
(01:01:28) 可以说,这是每个单项运动的金牌得主,全都聚集在这里了。中国
(01:01:33) ……并且必须协同工作。而且直接向你汇报。这真是太棒了。你最近去了中国。所以问你这个问题很有意思,中国在建设其科技领域方面取得了令人难以置信的成功。据你了解,中国是如何在过去10年里建立起这么多令人难以置信的世界级公司、世界级工程团队,以及这个技术生态系统……从而生产出这么多令人惊叹的产品的?
黄仁勋
(01:02:05) 原因有很多……嗯,首先,让我们从一些事实开始。全球大约 50% 的 AI 研究人员是华人,而且他们大多仍在中国。我们这里也有很多,但中国仍然有很出色的研究人员。他们的科技产业出现的时间点非常精准。在移动云时代,他们贡献的方式是软件,所以这个国家有着在科学和数学方面受过良好教育的优秀孩子。他们的科技产业是在软件时代创建的。他们对现代软件非常熟悉。中国不是一个单一的经济大国。它有很多省份和城市,其市长们相互竞争。
(01:03:01) 这就是为什么有这么多电动汽车公司。这就是为什么有这么多 AI 公司。这就是为什么有这么多——你能想象到的每一类公司,他们都会创立其中一些。因此,结果就是他们内部有着极其激烈的竞争。你知道,最终存活下来的是那些令人难以置信的公司。他们的社会文化也是,家庭第一,朋友第二,公司第三。所以他们之间的交流非常多……他们本质上一直是开源的。
(01:03:47) 所以他们为开源做出更多贡献是非常合理的,因为他们可能会想,“我们要保护什么呢?”我的工程师,他们的兄弟在那家公司,他们的朋友在那家公司,他们都是校友。你知道,校友这个概念。一旦是校友,就是一生的兄弟。所以他们分享知识非常非常快。所以保守技术秘密没有意义。还不如把它开源。然后开源社区会放大、加速创新过程。所以你得到了这种快速、令人难以置信的优秀人才,由于开源以及朋友间的交流性质和激烈的竞争,创新速度极快。
(01:04:35) 在公司之间,涌现出来的东西是不可思议的。所以这是当今世界上创新最快的国家,而这一点,我刚才所说的一切,都从根本上解释了这些孩子是如何成长的,他们拥有出色的教育,父母希望他们在学校表现出色,他们的文化就是如此。这些,你知道,这些都是他们国家的一些特点,而且他们恰好在技术呈指数级发展的时代出现了。莱克斯·弗里德曼
(01:05:09) 另外,从文化上来说,成为一名工程师是很酷的事情。这与你提到的所有因素都有关联……黄仁勋
(01:05:16) 这是一个建设者国度。莱克斯·弗里德曼
(01:05:18) 这是一个建设者国度。黄仁勋
(01:05:19) 是的,这是一个建设者国度。我们国家的领导人,很了不起,但大多是律师。他们国家的领导人——因为我们要靠法治来保障安全——他们的国家是从贫困中建立起来的。所以他们的大多数领导人都是了不起的工程师。一些最聪明的人。莱克斯·弗里德曼
(01:05:43) 稍微岔开一下,因为你提到了开源,我必须提到 Perplexity,你长期以来一直是它的粉丝。黄仁勋
(01:05:51) 很喜欢,是的。莱克斯·弗里德曼
(01:05:52) 感谢你开源了 Nemotron 3 Super,你也可以在 Perplexity 里面用它来查找信息。这是一个 1200 亿参数的开源权重 MoE 模型。你对开源有什么愿景?你提到了中国,提到了 DeepSeek 和 MiniMax,所有这些公司都在真正推动开源 AI 运动,而 英伟达 在接近最先进水平的开源大语言模型方面确实处于领先地位。你对此的愿景是什么?黄仁勋
(01:06:28) 首先,如果我们要成为一家伟大的 AI 计算公司,我们必须理解 AI 模型是如何演变的。
(01:06:36) 我喜欢 Nemotron 3 的一点是,它不仅仅是一个纯粹的 Transformer 模型,它结合了 Transformer 和 SSM。而且我们很早就开始开发条件 GAN,也就是渐进式 GAN,它一步步地引向了扩散模型。所以,我们在模型架构和不同领域进行基础研究,这让我们能够洞察什么样的计算系统对未来模型有好处。这是我们极致协同设计策略的一部分。第二,我认为我们正确地认识到,一方面,我们希望将世界级的模型作为产品,它们应该是专有的。另一方面,我们也希望 AI 能够渗透到每一个行业、每一个国家、每一位研究人员、每一位学生中。
(01:07:37) 如果一切都是专有的,那么进行研究就很难,在其基础上、周围、与之一起创新也很难。所以……开源对于许多行业加入 AI 革命是根本必要的。英伟达 拥有规模,我们也有动力——不仅有技能、规模,还有动力——只要我们还存在,就持续构建这些 AI 模型。因此,我们应该这样做。我们可以开放,我们可以激活每一个行业、每一位研究人员、每一个国家,让他们能够加入 AI 革命。还有第三个原因,那就是认识到 AI 不仅仅是语言。这些 AI 很可能会使用基于其他信息模态训练的工具、模型和子代理。
(01:08:39) 可能是生物学、化学、物理学定律,或者流体力学和热力学,并非所有这些都包含在语言结构中。所以必须有人去确保天气预报、生物学 AI、用于生物学的 AI、物理 AI,所有这些都能被推向极限,推向前沿。我们不制造汽车,但我们希望确保每个汽车公司都能接触到优秀的模型。我们不发现药物,但我希望确保礼来公司拥有世界上最好的生物学 AI 系统,这样他们就可以用它来发现药物。所以这三个根本原因,既认识到 AI 不仅仅是语言,AI 非常广泛,我们希望让每个人都参与到 AI 世界中来,同时也要进行 AI 的协同设计。莱克斯·弗里德曼
(01:09:32) 嗯,我必须说,再次感谢你开源,真正地开源了 Nemotron 3 以及……黄仁勋
(01:09:39) 是的,谢谢你提到这一点。我们开源了模型,开源了权重,开源了数据,开源了我们创建它的方法。是的,这非常了不起。台积电与中国台湾
莱克斯·弗里德曼
(01:09:48) 这真的非常了不起。你来自中国台湾,并且与台积电关系密切。所以我得问问,我认为台积电在工程团队和他们所做的令人难以置信的工程工作方面,也是一家传奇公司。你如何理解台积电的文化和方法,来解释他们是如何在半导体领域所做的一切中取得这种独一无二、无与伦比的成功的?黄仁勋
(01:10:19) 你知道,首先,关于台积电最深的误解是,他们拥有的只是技术。以为他们只是有非常好的晶体管,如果有人拿出另一种晶体管,游戏就结束了。是技术,当然,我指的不只是晶体管,还有金属化系统、封装、3D 封装、硅光子学,他们拥有的所有技术。是技术让这家公司变得特别。他们的技术让这家公司变得特别。
(01:10:59) 但他们协调需求的能力,协调全球数百家公司动态需求的能力,因为它们在上升、转移、增加、减少、推迟、提前、客户更换、晶圆启动、晶圆停止、紧急晶圆启动,所有这些随着世界不断变化而产生的复杂动态,而他们却能以高吞吐量、高良率、非常好的成本、卓越的客户服务来运营工厂。他们认真对待自己的承诺。
(01:11:49) 当你的晶圆——因为他们知道他们在帮助你运营公司——当承诺的晶圆该出现时,晶圆就会出现,这样你才能恰当地运营你的公司。所以他们的系统,他们的制造系统,我想说,是完全神奇的。第二点是他们的文化。这种文化一方面同时聚焦于技术,推进技术;另一方面同时以客户服务为导向。很多公司非常以客户服务为导向,但技术并不卓越。他们不在技术的最前沿。
(01:12:27) 有很多公司处于技术的最前沿,但他们并不是最好的以客户服务为导向的公司。所以这取决于他们如何平衡这两者,而且他们在两方面都是世界级的。然后第三点可能是我最看重的他们创造的技术,这种无形的东西叫做信任。我信任他们,把我的公司托付给他们。这是非常重要的一点。莱克斯·弗里德曼
(01:12:55) 当他们信任时,我的意思是,你们之间建立了非常紧密的关系,这种信任是基于多年来的表现建立的,但其中也涉及到人际关系。黄仁勋
(01:13:05) 三十年了,我不知道通过他们做了多少成百上千亿美元的业务,而我们没有合同。这太棒了。莱克斯·弗里德曼
(01:13:15) 太神奇了。好的,有这么个故事……在 2013 年,台积电的创始人张忠谋曾邀请你成为台积电的首席执行官,而你说你已经有工作了。这个故事是真的吗?黄仁勋
(01:13:30) 故事是真的。我没有,我没有轻视它。我深感荣幸,当然,我当时就知道,正如我现在所知,台积电是历史上最重要的公司之一。张忠谋是我生命中评价最高的高管之一,也是我的商业伙伴和个人朋友。他的邀请让我受宠若惊,真的非常荣幸。但我在这里做的工作非常重要,我在心中已经看到了 英伟达 的未来以及我们能产生的影响。这是非常重要的工作。这是我的责任,我唯一的责任,就是要实现它。所以我拒绝了,不是因为它不是一个令人难以置信的机会。这是一个令人难以置信的机会,但我就是不能接受。莱克斯·弗里德曼
(01:14:38) 我认为 英伟达,英伟达 和台积电都是人类文明史上最伟大的两家公司。运营其中任何一家,我相信都是一项极其复杂的工作,需要……你必须全身心投入。各个层面的每个人,不仅仅是 CEO 层面。每个人都真的是全身心投入……黄仁勋
(01:14:57) 是的。是的,毫无疑问。莱克斯·弗里德曼
(01:14:59) ……来完成这种程度的复杂性。黄仁勋
(01:15:00) 所以现在我可以帮助两家公司了。英伟达的护城河
莱克斯·弗里德曼
(01:15:02) 没错。现在 英伟达 是世界上最有价值的公司。我得问一下,正如科技界人士所说,英伟达 最大的护城河是什么?即保护你免受竞争的优势。黄仁勋
(01:15:20) 作为一家公司,我们最重要的资产是我们计算平台的安装基础。今天我们最重要的东西是 CUDA 的安装基础。20 年前,当然没有安装基础。但关键是……如果有人搞出一个 GUDA 或 TUDA,那根本不会有任何影响。原因在于,这从来都不仅仅是技术的问题。技术当然是不可思议的、有远见的。但关键在于公司对它的投入、坚持、并扩大了它的影响力。让 CUDA 成功的不是三个人,而是 43,000 个人。
(01:16:17) 还有数百万相信我们、信任我们会继续开发 CUDA 1、2、3、13 的开发者,他们决定移植并将他们的软件、他们堆积如山的软件构建在 CUDA 之上。所以安装基础是第一大最重要的优势。这个安装基础,再结合我们以这种规模执行的速度,历史上没有哪家公司曾经构建过如此复杂的系统,绝对没有。然后还要一年构建一次,这是不可能的。这种速度与安装基础相结合,在开发者的心目中,你只需……从开发者的角度来看,如果我支持 CUDA,明天它就会好 10 倍。我平均只需要等六个月。
(01:17:16) 不仅如此,如果我在 CUDA 上开发,我能接触到数亿人、数亿台计算机。我存在于每一个云,每一家计算机公司,每一个行业,每一个国家。所以如果我创建一个开源包,并且首先把它放在 CUDA 上,我会同时获得这两个属性。不仅如此,我 100% 相信 英伟达 会一直保留 CUDA,维护它,改进它,并持续优化这些库,只要他们存在。这一点你可以完全放心,最后这一点,信任。你把所有这些放在一起,如果我今天是一名开发者,我会首先瞄准 CUDA。我会最优先瞄准 CUDA。我认为归根结底,这就是我们的首要,甚至是我们首要的……
(01:18:16) ……核心优势。我们的第二个优势是我们的生态系统。我们垂直整合了这个极其复杂的系统,但我们横向集成到每一家公司的计算机中。我们进入了谷歌云,进入了亚马逊,进入了 Azure。我们现在正在疯狂地扩展 AWS。我们进入了像 CoreWeave 和 Nscale 这样的新公司。我们进入了礼来公司的超级计算机。我们进入了企业计算机。我们在边缘的无线基站里。我的意思是,这简直疯狂。一个架构存在于所有这些不同的系统中。我们在汽车里,在机器人里,在卫星里,我们甚至在太空中。所以你拥有这一个架构,并且生态系统如此广泛,它基本上覆盖了世界上每一个行业。莱克斯·弗里德曼
(01:19:03) 那么,随着 AI 工厂成为护城河,CUDA 的安装基础在未来将如何演变?你认为未来的 英伟达 有可能完全围绕 AI 工厂吗?黄仁勋
(01:19:16) 嗯,对我们来说,计算单位曾经是 GPU。然后它变成了一台计算机,然后变成了一个集群。现在它是一个完整的 AI 工厂。当我看到一台计算机,当我看到 英伟达 建造的东西时,在过去,我会想象芯片。然后当我发布新产品、新一代产品时,比如,“女士们先生们,我们今天发布 Ampere,”我会拿起芯片。那是我对正在构建的东西的心理模型。今天,我不会……拿起芯片仍然有点可爱。
(01:19:47) 但它只是可爱。它不是我所做事情的心理模型。我的心理模型是这个巨大的千兆瓦级的东西,它连接到电网的发电系统。它有冷却系统和极其庞大的网络。有 1 万人在里面试图安装它,数百名网络工程师在里面,成千上万的工程师在背后试图给它通电。你知道,给那些工厂之一通电,正如你所知,不是某个人说“现在开机了”那么简单。需要成千上万的人才能让它启动。莱克斯·弗里德曼
(01:20:22) 所以在心理上,你实际上……当你思考一个计算单元时,你实际上,当你晚上睡觉时,你现在思考的是一组机架,也就是整柜,而不是单个芯片。黄仁勋
(01:20:33) 是整个基础设施。我希望我的下一个思维跳跃是,当我考虑建造计算机时,是行星级的规模。那将是下一个跳跃。太空中的 AI 数据中心
莱克斯·弗里德曼
(01:20:42) 嗯,你怎么看埃隆谈到的太空角度,即在太空中进行计算,以解决一些……它可以使扩展能源方面的某些能源问题更容易解决。黄仁勋
(01:20:56) 散热问题并不容易。是的。莱克斯·弗里德曼
(01:20:58) 散热。嗯,这涉及到大量的工程复杂性。所以……你知道,英伟达 也已经宣布你们已经在考虑这个问题了。黄仁勋
(01:21:09) 是的,我们已经做到了。英伟达 GPU 是太空中的第一批 GPU。我之前没意识到,这很有趣……我可能早就该宣布了。我们在太空中。你知道,我们某个 GPU 上有一个小小的宇航服。但我们已经在太空了。那里是做大量成像工作的好地方。
(01:21:32) 你知道,因为这些卫星拥有非常高分辨率的成像系统,它们现在正在持续扫描地球。你希望为全球进行持续的厘米级成像,这样你基本上就能拥有所有东西的实时遥测数据。你不想把这些数据传回地球。那将是 PB 级、PB 级的数据。你只需要就在边缘进行 AI 处理,扔掉所有不需要的东西,那些你之前见过、没有变化的东西,然后只保留你需要的东西。所以 AI 必须在边缘完成。显然,如果我们放在极地,我们有 24/7 的太阳能。但是,那里没有传导,没有对流。
(01:22:23) 所以,基本上只能靠辐射。但是,太空很大。我想,我们只需要在那里放置巨大、巨型的散热器。莱克斯·弗里德曼
(01:22:32) 你认为这个想法有多疯狂?这是五年后、十年后、二十年后的事?我们正在谈论 AI 扩展的障碍。黄仁勋
(01:22:41) 你知道,我只是更务实一些。我首先寻找我下一个、再下一个机会所在。与此同时,我在培育太空领域。所以我派工程师去研究这个问题。我们开始……我们学到了很多。如何处理辐射?如何处理性能下降?如何处理持续的缺陷测试和验证?如何处理冗余?如何优雅地降级等等?所以我们可以做……软件呢?你如何看待太空中的软件、冗余和性能?
(01:23:24) 让计算机永远不会坏,它只是变慢而已。所以我们可以提前进行大量的工程探索。但与此同时,我最喜欢的答案是消除浪费。你知道,我们有那么多闲置的电力,我想尽快利用起来。莱克斯·弗里德曼
(01:23:47) 是的。那里,那里……是的,地球上有很多唾手可得的果实……我们可以利用它们来扩展 AI。快速暂停一下。快速感谢我们的赞助商 30 秒。请在描述中查看他们。这确实是支持本播客的最佳方式。请访问 lexfridman.com/sponsors。我们有用于好奇心驱动知识探索的 Perplexity,用于在线销售的 Shopify,用于电解质的 LMNT,用于客户服务 AI 代理的 Fin,以及用于电话系统(通话、短信、联系人)的 Quo,为您的业务服务。明智选择,我的朋友们。现在,回到我与 黄仁勋 的对话。你认为 英伟达 有朝一日会值 10 万亿美元吗?让我们换个方式问。如果这是真的,那么世界的未来会是什么样子?英伟达 会值 10 万亿美元吗?
黄仁勋
(01:24:45) 我认为 英伟达 的增长极有可能,而且在我看来是不可避免的。让我解释一下原因。我们是历史上最大的计算机公司。仅这一点就应该引出一个问题:为什么?当然原因……有两个原因。首先,两个基础性的技术原因。第一个原因是,计算从一个基于检索的文件检索系统转变而来。几乎所有东西都是一个文件……我们预先编写一些东西,预先录制一些东西。我们画一些东西,把它放到网上,放到一个文件里。我们使用推荐系统,一些智能过滤器,来找出要为你检索什么。所以,我们过去是一个预录制、人类预录制和文件检索系统。这很大程度上就是计算机的定义。
(01:25:39) 而现在,AI 计算机是上下文感知的,这意味着它必须实时处理和生成令牌。所以,我们从基于检索的计算系统转变为基于生成的计算系统。在这个新世界里,我们将需要比旧世界多得多的处理能力。在旧世界里,我们需要大量的存储。在这个新世界里,我们需要大量的计算。这是第一部分。我们从根本上改变了计算以及计算的方式。唯一会导致它倒退……
(01:26:15) ……就是如果这种计算方式,这种生成上下文相关、情境感知、在生成信息之前基于新见解的计算方式,这种计算密集型的方式,如果它没有效果,它才会倒退。所以,如果在过去 10 到 15 年从事深度学习的过程中,在任何一刻我得出了这样的结论:“你知道吗?这行不通。我认为这是条死胡同。”或者“它无法扩展,无法解决这种模式,无法用于这个应用。”那么,我当然会有截然不同的感受,但我认为过去五年给了我比之前十年更多的信心。
(01:27:04) 第二个想法是,计算机,因为它是一个存储系统,所以大体上是一个仓库。我们现在正在建造工厂。仓库赚不了多少钱。工厂与公司的收入直接相关。所以,计算机做了两件事。它不仅改变了它的运作方式,它在世界上的目的也改变了。它不再是一台计算机,而是一个工厂。它是一个工厂,用于产生收入。我们现在看到,这个工厂不仅在生产人们想要消费的产品、商品,我们还看到这些商品如此有趣,对如此多的不同受众如此有价值,以至于令牌开始像 iPhone 那样进行细分。你有免费令牌,有高级令牌,还有几种中间层级的令牌。
(01:28:10) 所以,事实证明,智能是一种可扩展的产品。有极高智能的产品,用于专门用途的令牌,人们愿意为此付费。有人愿意为每百万令牌支付 1000 美元的想法即将到来。这不是会不会的问题,只是什么时候的问题。所以,现在我们看到这个工厂生产的商品实际上是有价值的,并且能够产生收入和利润。现在的问题是,世界需要多少这样的工厂?世界需要多少令牌?社会愿意为这些令牌支付多少钱?如果生产力如此显著地提高,世界经济会发生什么?会发生什么……
(01:29:08) 我们是否会……我们是否会发明新药、新产品、新服务?所以,当你把这些事情结合起来,我绝对确信世界 GDP 的增长将会加速。我绝对确信,用于计算的 GDP 占比将比过去多 100 倍——嗯——因为它不再是一个存储单元。它是一个产品生成单元。所以,当你从这个角度来看,然后再反推 英伟达 是什么,英伟达 做什么,以及我们需要从多少新经济、新产业中受益来解决这个问题,我认为我们会变得非常非常大。
(01:29:58) 然后剩下的部分,对我来说,是:英伟达 有可能在不久的将来成为一家收入达 3 万亿美元的公司吗?答案当然是肯定的。原因在于它不受任何物理限制。我没有看到任何东西说,天哪,3 万亿美元是不可能的。事实证明,英伟达 的供应链——这个负担由 200 家公司分担。我们在与这个生态系统的合作中扩展,问题是:我们有足够的能源这样做吗?我们当然会有足够的能源。所以,所有这些结合起来,那个数字只是一个数字,你知道?
(01:30:51) 我还记得,英伟达 是……在我们首次突破 10 亿美元时,有位 CEO 提醒我,“你知道,Jensen,从理论上讲,一家无晶圆半导体公司不可能超过 10 亿美元。”我不会赘述原因,但这显然不合逻辑,而且有很多证据表明并非如此。然后有人告诉我,“你知道,Jensen,因为其他某家公司,你永远不会超过 250 亿美元。”有人告诉我,“你永远不会,你知道,因为……”所以这些都不是基于原则、基于第一性原理的思考。思考这个问题的简单方法是,我们制造的是什么,我们能创造的机会有多大?
(01:31:42) 现在,英伟达 做的不是市场份额生意。我刚才谈到的大部分东西都不存在。这是困难的部分。如果 英伟达 是一家 100 亿美元的公司,试图去夺取 英伟达 的份额,那么股东们很容易看到,哦,是的,如果他们能拿到 10% 的份额,他们就能变得这么大。但人们很难想象我们能有多大,因为我没有可以从谁那里夺取份额的对象。你知道?所以我认为这是世界面临的挑战之一,即对未来的想象力。但我有的是时间,我会继续推理,继续谈论它,每一次 GTC 都会让它变得越来越真实。
(01:32:27) 你知道,然后越来越多的人会谈论它,总有一天,我们会到达那里。我 100% 确信我们会到达那里。莱克斯·弗里德曼
(01:32:34) 是的,你的这种观点,基本上是令牌工厂,即每瓦每秒的令牌数,并且每个令牌都有价值。就像它是一个实际带来价值的东西,它为不同的人带来不同种类、不同数量的价值。这就是实际的产品——它确实可以粗略地看作是令牌。所以你有一堆令牌工厂。然后,根据第一性原理,很容易想象一个未来,考虑到 AI 可以解决的所有潜在问题,你将需要指数级更多的令牌工厂。黄仁勋
(01:33:05) 是的。非常有趣的是,我对此如此兴奋的原因是,令牌的 iPhone 已经问世了。莱克斯·弗里德曼
(01:33:11) 你怎么称呼它?等等,你是说 OpenClaw 的 iPhone?黄仁勋
(01:33:13) 是的。莱克斯·弗里德曼
(01:33:14) 这很有意思。黄仁勋
(01:33:15) 代理。莱克斯·弗里德曼
(01:33:16) 是的,代理。没错。黄仁勋
(01:33:18) 总的来说是代理。令牌的 iPhone 已经问世了。它是历史上增长最快的应用程序。它直线上升。直线上升。莱克斯·弗里德曼
(01:33:26) 这说明了问题。黄仁勋
(01:33:27) 是的,毫无疑问,OpenClaw 就是令牌的 iPhone。莱克斯·弗里德曼
(01:33:31) 是否有什么真正特别的事情,大约从 12 月开始发生,人们真正意识到了 Claude Code、Codex、OpenClaw 的力量?我的意思是,我很尴尬地承认,在来这里的机场路上,我第一次在公共场合这样做。我通过跟我的笔记本电脑说话来编程,打个引号。黄仁勋
(01:33:59) 是的,没错。莱克斯·弗里德曼
(01:33:59) 我感到尴尬,因为我假装在和一位人类同事说话。我不确定自己对未来的感觉,那时每个人……都在走来走去和他们的 AI 说话,但这是完成事情的一种非常高效的方式。黄仁勋
(01:34:13) 更有可能的是,你的 AI 会一直打扰你。原因在于它做事太快了。它会向你报告,“我完成了那个。”“接下来你想让我做什么?”你知道,它……我认为大多数人没有意识到的是,与他们聊天、发短信最多的人,将是他们的“爪子”或“龙虾”。压力下的领导力
莱克斯·弗里德曼
(01:34:37) 多么不可思议的未来。我读到过,你将你的很多成功归功于你比任何人都努力工作,并且比任何人都能承受更多痛苦的能力。所以我们可以列出这包含的许多事情。我的意思是,应对失败、我们谈到的成本和工程问题。人的问题、不确定性、责任、疲惫、尴尬、你提到过的公司濒临死亡的时刻,还有压力。现在,作为这家公司的 CEO,各个经济体和民族都围绕它制定战略,规划他们的财务分配,规划他们的 AI 基础设施,你是如何应对如此巨大的压力的?在如此多的国家和人民都依赖你的情况下,是什么给了你力量?黄仁勋
(01:35:38) 我意识到 英伟达 的成功对美国非常重要。我们产生了巨额的税收。我们为我们的国家确立了技术领导地位。技术领导地位对国家安全很重要。国家安全不仅仅是一个方面,而是所有方面。当我们的国家更加繁荣时,我们可以在国内政策和帮助社会福利方面做得更好。因为我们在美国创造了如此多的再工业化,我们创造了大量的就业机会。我们正在帮助将如何建造东西的方式转回到美国,体现在许多不同的工厂、芯片、计算机,当然还有这些 AI 工厂。我完全意识到,这一点……
(01:36:35) 而且我受益于此,这真是主流投资者、教师、警察的一份礼物,他们不知为何,出于什么原因投资了 英伟达,或者因为他们看了 Jim Cramer,买了一些股票,现在成了百万富翁。
(01:36:57) 我完全清楚这种情况。我清楚 英伟达 是我们身后和下游一个庞大生态系统合作伙伴网络的核心。所以我处理这个问题的方式,正是我刚才所做的。我推理我们正在做什么?它导致了什么?它对其他人的利益有什么影响,无论是积极的,还是例如通过巨大的负担施加给供应链?因此,问题是,你打算怎么做?对于我感受到的几乎所有事情,我都会分解它,推理,“好吧,情况是怎样的?发生了什么变化?难在哪里?我打算怎么做?”我……
(01:37:56) 我分解它,解构问题,将这些情况的解构转化为我可以做的、可管理的事情。之后我唯一能做的就是,“你做了吗?是你做的还是你让别人去做的?如果你没做,你推理出你需要做,而你没做,也没有让别人去做,那就别再为此烦恼了。”……你知道?所以,所以——
(01:38:27) 所以我对自己相当严格。但是,我也会分解事情,这样我就不会恐慌。我可以安心睡觉,因为我已经列出了需要做的事情清单,并且我确保所有可能危及我们公司、危及我的合作伙伴、危及我们行业的事情,我都告诉了某个人。所有我觉得可能危及任何人的事情,我都告诉了某个人。我告诉了那个能对此采取行动的人。所以,我要么把这事从心里放下了,要么正在处理它。在那之后,Lex,你还能做什么呢?莱克斯·弗里德曼
(01:39:10) 考虑到在建立 英伟达 的旅程中经历了那么多疯狂、强烈的痛苦,你有没有经历过心理上的低谷?黄仁勋
(01:39:22) 哦,是的。哦,是的。当然。一直都有。一直都有。莱克斯·弗里德曼
(01:39:27) 然后你——黄仁勋
(01:39:27) 一直都有。莱克斯·弗里德曼
(01:39:27) ……你只是把问题分解成碎片?看看你能做些什么?黄仁勋
(01:39:33) 一部分,Lex,一部分是遗忘。你知道,AI 学习最重要的属性之一就是系统性遗忘。你需要知道什么时候该忘记一些事情。你不能记住所有事情。你不能保留所有事情,你也不想背负所有事情。我很快做的一件事就是分解问题,推理问题,然后分担它。我说我告诉所有人,我本质上是在分享那个负担。
(01:40:04) 尽可能快地。无论我担心什么,告诉别人。不要只是自己扛着。不要吓到他们。把问题分解成更小的部分,让人们参与进来,激励他们能够对此采取行动。但一部分就是遗忘。很多时候,你必须对自己狠一点。振作起来,别再为此烦恼了。让我们行动起来。然后你起床。另一部分是你被下一束光所吸引,下一个未来,下一个机会,下一个,“好吧,那已经过去了。接下来是什么?”我认为这就像你看伟大运动员那样。他们只担心下一分。上一分已经过去了。尴尬,挫折。
(01:40:56) 你知道,因为我做了很多公开的工作。Lex,你也做了不少公开的工作。所以我做了很多公开的工作。所以你知道,我说了很多当时看起来合理或当时觉得有趣的话,大多只是因为我当时觉得有趣。然后,当你回想起来,就没那么有趣了,但是……莱克斯·弗里德曼
(01:41:20) 是的。不,相信我,我知道。但你基本上是让自己被未来的光芒所牵引。忘记过去,继续——黄仁勋
(01:41:27) 没错。莱克斯·弗里德曼
(01:41:28) ……继续朝着那个目标努力。我的意思是,你说过,有句很有名的话,如果你事先知道打造 英伟达 会有多难——实际上比你预期的要难一百万倍——你就不会去做了。黄仁勋
(01:41:46) 是的,没错。莱克斯·弗里德曼
(01:41:47) 但是,你知道,当我听到这句话时,所有值得做的事情可能都是如此,对吧?黄仁勋
(01:41:53) 没错。顺便说一句,这正是我想解释的,拥有孩子般的心态是一种不可思议的超能力。当我看到某件事时,我经常对自己说,几乎所有事情我的第一反应都是,“能有多难呢?”你让自己进入那种状态,能有多难呢?从来没有人做过。它看起来巨大无比。它将耗资数千亿美元。它将需要所有这些……你就想,“是啊,但能有多难呢?”能有多难呢?
(01:42:37) 所以,你必须让自己进入那种心态。你其实不希望对所有事情、所有挫折、所有磨难、所有失望都进行过度模拟。你不想提前模拟所有那些。你不想知道那些。你想带着“这将完美、这将很棒、这将非常有趣”的想法进入新的体验。然后,当你身处其中时,你需要有耐力,需要有韧性,这样当挫折真的发生时,那些挫折会让你惊讶,失望会让你惊讶,尴尬会让你惊讶,屈辱会让你惊讶。
(01:43:17) 你不能让……现在你只需要启动另一部分,那就是忘掉它。继续前进,持续前行。只要我对未来的假设以及未来为何会实现的那些假设没有改变,或者没有实质性地改变,那么我就应该预期结果不会改变。所以我模拟的未来结果仍然会发生。如果它仍然会发生,我仍然会去追求它。
(01:43:54) 我相信它会,你知道,所以这里有二三种人类特质的结合:以清新心态进入体验的能力,忘记挫折的能力,相信自己、相信你所相信的并忠于那个信念的能力。但你也在不断地重新评估。
(01:44:20) 我认为这种三、四、五种特质的结合对于韧性来说非常重要。我很幸运,无论是什么人生经历造就了这些,我拥有了那四、五种特质。我总是充满好奇,总是在学习。我总是向每个人学习。我总是问我的……因为我凡事都很谦逊,我总是想,“天哪,他们做得真好。他们做得太棒了。”我想知道他们在想什么。他们如何……所以我在模拟每个人。在很多方面,我在模仿我观察到的几乎每个人,对吧?你对他们所做、你所观察和尊重的一切都感同身受。所以你一直在学习。莱克斯·弗里德曼
(01:45:10) 你现在是地球上最富有的人之一。地球上最成功的人之一。保持谦逊并能够……你是否觉得金钱、权力和名声的影响,让你更难在心里承认自己是错的?更难去听取别人不同意的意见并向他们学习?诸如此类的事情。黄仁勋
(01:45:41) 令人惊讶的是,并没有。实际上我会说恰恰相反。因为我做了那么多公开的工作,当我错了的时候,几乎每个人都能看到。莱克斯·弗里德曼
(01:45:53) 你被教育了。有道理。黄仁勋
(01:45:55) 当我错了——当我错了或者结果并非如此,或者,你知道,我在外面说的大部分事情,我都是相当确定的。原因在于它会影响到别人,我想对此非常在意,非常谨慎。对于那些我在会议中推理的事情,很多事情的结果可能不同。但这从未阻止我推理。我管理和领导的方式是,我经常在人们面前推理。即使在我和你说话的时候,你也能看到我实时推理的过程。我想确保你理解我所说的,不是因为我告诉了你——
(01:46:40) ……而是因为我对我要告诉你的事情非常谦逊。我向你展示了我是如何得出这个结论的步骤。然后你可以自己决定是否相信我最后说的话。所以我整天在会议上都是这么做的。对我所有的员工,我不断地推理,“让我告诉你我是怎么看的。”然后我进行推理。这给了每个人机会介入并说,“我不同意那一点。”通过推理并让人们参与其中的好处是,他们不必不同意你的结果。他们可以不同意你的推理步骤。他们可以把我的思路引向不同的方向,然后我们可以一起向前推理。所以我们有点像在共同寻找路径。这真的很棒。莱克斯·弗里德曼
(01:47:29) 是的,你有一种特质……当你解释事情的时候,我能感觉到你实际上是在当场推理,带着一种持续的开放心态,我可以感觉到我可以引导你的思维。这是非常美好的,你在这么多年的成功和痛苦之后,还能保持这种状态。我认为有时候痛苦会让你封闭一点。我认为能保持——黄仁勋
(01:47:57) 是的。对尴尬的容忍度,我认为是……莱克斯·弗里德曼
(01:47:59) 是的,那是……容忍度……我的意思是,这是真实存在的。就是多年来让自己难堪。即使在那些会议上,知道周围有人,你宣布了一个想法,结果证明那个想法是错的……并且能够承认这一点并从中成长。这在人的层面上是非常困难的。黄仁勋
(01:48:17) 是的。嗯,你知道。他们知道,他们知道我最近的第一份工作是刷厕所,所以。电子游戏
莱克斯·弗里德曼
(01:48:25) 我很高兴你保留了在丹尼餐厅时的那种精神。我的意思是,那很美好。你从丹尼餐厅开始的整个旅程是美好的。让我问你关于电子游戏的问题。我是一个狂热的游戏迷。所以我必须感谢 英伟达 多年来提供的令人难以置信的图形。黄仁勋
(01:48:47) 顺便说一句,GeForce 至今仍然是我们的首要营销策略。没错。人们在青少年时期就了解 英伟达。然后他们上大学,知道 英伟达 是谁,起初只是玩使命召唤、堡垒之夜。然后后来他们使用 CUDA,然后后来他们使用 英伟达,还有 Blender、Dassault 和 Autodesk。莱克斯·弗里德曼
(01:49:16) 是的。我的意思是,我应该说我告诉一个朋友我要和你谈话。他说,“哦,他们生产很棒的游戏 GPU。”黄仁勋
(01:49:25) 是的,没错。莱克斯·弗里德曼
(01:49:26) 就好像——黄仁勋
(01:49:26) 没错。莱克斯·弗里德曼
(01:49:27) 你知道,还有更多,但是,是的,人们真的很喜欢它。它确实给很多人带来了很多快乐。硬件真正将这些世界变得栩栩如生。DLSS 5 曾引发一些争议。你能给我解释一下这个争议吗?我想在线上的玩家们担心它会让游戏看起来像 AI 垃圾。你怎么看这个争议?黄仁勋
(01:49:56) 是的。我认为他们的观点有道理,我能理解他们的想法,因为我自己也不喜欢 AI 垃圾。你知道,所有 AI 生成的内容看起来越来越相似,而且它们都很漂亮,所以我对他们的想法感同身受。但这不是 DLSS 5 试图做的事情。我展示了几个例子。DLSS 5 是 3D 条件下生成的,有 3D 引导的。它是由真实结构数据引导的。所以艺术家决定了几何形状。我们在每一帧中都完全忠实于几何形状。它由纹理、艺术家的艺术性来引导。所以每一帧,它都在增强,但不会改变任何东西。
(01:50:55) 现在,问题在于增强。DLSS 5 也允许,因为系统是开放的,你可以训练自己的模型来决定,你甚至可以在未来提示它。我希望它是一个卡通着色器。我希望它看起来像某种风格,所以你可以给它一个例子。它会以那种风格生成,完全符合艺术家的艺术性、风格和意图。所以所有这些都是为艺术家做的,这样他们就可以创造出更美丽但仍符合他们想要风格的东西。我认为他们得到的印象是游戏会原样发布,然后我们会对它进行后期处理。这不是 DLSS 的意图。
(01:51:50) DLSS 是与艺术家集成的,所以它是关于给艺术家提供 AI 工具、生成式 AI 工具的。他们可以选择不使用它,你知道?莱克斯·弗里德曼
(01:52:01) 我认为人们对人脸非常敏感。我们现在生活在这样一个时刻,我认为这是一个美丽的时刻,人们对 AI 垃圾很敏感。它为我们提供了一面镜子,帮助我们意识到我们所追求的是不完美。我们追求的有时不是完美的图形。它帮助我们理解我们在创造的世界中发现什么引人入胜。这很美。只要它是帮助我们创造那些世界的工具——黄仁勋
(01:52:28) 是的,没错。莱克斯·弗里德曼
(01:52:28) ……它就很好。黄仁勋
(01:52:29) 没错。又多了个工具而已,而且他们希望生成模型生成与照片级真实相反的东西。是的,它也能做到。所以这只是一个额外的工具。我想玩家们也可能很感激,在过去的几年里,我们向游戏开发者介绍了皮肤着色器。许多游戏都有皮肤着色器,包括次表面散射,使皮肤看起来更像皮肤。所以游戏开发者们正在寻找越来越多的工具来表达他们的艺术。所以这只是一个额外的工具,他们可以决定使用什么。莱克斯·弗里德曼
(01:53:16) 一个可笑的问题。你认为有史以来最伟大或最具影响力的游戏是什么?也许从 英伟达 的角度来看?黄仁勋
(01:53:24) 毁灭战士。莱克斯·弗里德曼
(01:53:25) 毁灭战士,毫无疑问。那是 3D 的开始。黄仁勋
(01:53:28) 我会说是毁灭战士,从艺术、文化影响以及行业的角度来看,它将 PC 变成了游戏设备。那是一个非常重要的时刻。当然,在此之前有飞行模拟公司。但他们没有毁灭战士那样的普及度,未能让整个行业将 PC 从办公自动化工具转变为家庭和玩家的个人电脑。所以毁灭战士在这方面确实影响深远。从实际游戏技术角度来看,我会说是VR战士。所以,你知道,我们和两者都是很好的朋友。莱克斯·弗里德曼
(01:54:07) 还有最近的游戏——我的意思是,赛博朋克 2077,非常棒的 GPU 加速图形。就像——黄仁勋
(01:54:16) 完全光线追踪。莱克斯·弗里德曼
(01:54:17) 完全光线追踪。还有,我个人非常喜欢,我是天际、上古卷轴的超级粉丝,你知道,它很久以前就发布了,但人们发布模组并且——黄仁勋
(01:54:29) 我们喜欢模组。莱克斯·弗里德曼
(01:54:30) ……他们创造了这些令人难以置信的,我的意思是,它就像一个不同的游戏,让我可以一遍又一遍地重玩。它让你意识到,你可以用一种全新的方式重新体验你已经热爱的世界。所以——黄仁勋
(01:54:45) 没错。莱克斯·弗里德曼
(01:54:45) ……我一直都这么做。我最喜欢的事情之一就是在天际中漫步。黄仁勋
(01:54:48) 我们创建了一个叫做 RTX Mod 的东西。是的,它是一个模组工具。莱克斯·弗里德曼
(01:54:53) 太棒了。黄仁勋
(01:54:53) 它允许社区将最新技术注入到旧游戏中。莱克斯·弗里德曼
(01:55:00) 当然,造就一款伟大电子游戏的不仅仅是图形,还有故事和角色发展,但是——AGI 时间线
黄仁勋
(01:55:06) 没错。莱克斯·弗里德曼
(01:55:06) ……美丽的图形可以增加沉浸感。那种仿佛被传送到另一个地方的感觉。啊,你说过,我认为很准确,AGI 的时间线问题取决于你对 AGI 的定义。所以让我问你一下可能的时间线。让我们采用这个可能很荒谬的 AGI 定义,即一个能够基本上完成你工作的 AI 系统。所以,运营,不,是创办、发展并运营一家成功的科技公司,价值——黄仁勋
(01:55:52) 一家好的公司还是一家普通的公司?莱克斯·弗里德曼
(01:55:54) 不。它必须价值超过 10 亿,超过 10 亿美元。所以,你知道,你知道做所有这些事情有多难。那么,我们离那一步还有多远?所以,我们谈论的是 Open-Claude,它能做所有极其复杂的事情,首先需要创新,找到客户,向他们销售,管理,建立一个由一些代理、一些人组成的团队,诸如此类的事情。这是 5 年、10 年、15 年、20 年后的事?黄仁勋
(01:56:31) 我认为就是现在。我认为我们已经实现了 AGI。莱克斯·弗里德曼
(01:56:35) 你认为可以由这样的 AI 系统来运营一家公司吗?黄仁勋
(01:56:37) 有可能,原因如下。你说的是 10 亿,你没有说永远。所以例如……一个 Claude 能够创建一个网络服务,一些有趣的小应用,突然之间,几十亿人花 5 毛钱使用它,然后不久之后就倒闭了,这并非不可能。在互联网时代,我们看到了大量这类公司,而且那些网站中的大多数并不比今天 Open-Claude 能生成的更复杂。莱克斯·弗里德曼
(01:57:20) 有意思。实现病毒式传播并将这种病毒式传播变现。黄仁勋
(01:57:23) 是的。只是我不知道它是什么,但我当时也无法预测那些公司中的任何一个,你知道?编程的未来
莱克斯·弗里德曼
(01:57:30) 你的这个说法会让很多人兴奋。黄仁勋
(01:57:32) 是的,不。是的。莱克斯·弗里德曼
(01:57:33) 就像,你什么意思?我可以直接启动一个代理,然后赚很多钱?黄仁勋
(01:57:38) 嗯,顺便说一句,这正在发生,对吧?你知道当你去中国时,你会看到,你会看到很多人教他们的 Claude,让他们的 Claude 出去找工作,工作,赚钱。我其实……如果出现某种社交事件,或者有人创建了一个数字影响者,超级可爱,或者某个社交应用,喂养你的小拓麻歌子之类的,然后一夜之间爆红,我也不会感到惊讶。很多人用了几个月,然后就消失了。现在,这 10 万个代理中有一个能建成 英伟达 的几率是零。
(01:58:28) 然后,有一点我不会做,也希望我们大家都做的是,要认识到人们真的很担心他们的工作。我只想提醒他们,你工作的目的与你用来完成工作的任务和工具是相关的,但不是一回事。我已经做了 33 年的工作。我是世界上在职时间最长的科技公司 CEO,34 年了。在过去 34 年里,我用来完成工作的工具一直在变化,有时在两三年的时间里变化相当剧烈。有一个故事我非常想确保每个人都听到,那就是计算机科学家、AI 研究人员说的第一个会消失的工作是放射科医生。
(01:59:25) 因为计算机视觉将达到超人的水平,它确实做到了。CV……计算机视觉在 2019、2020 年达到了超人水平,也许稍晚一点,2020 年?
(01:59:39) 对吧?所以计算机视觉达到超人水平已经很久了。所以预测是放射科医生会消失,因为研究放射扫描已成过去。AI 会做这件事。嗯,他们完全正确。计算机视觉完全是超人的。今天每一个放射学平台和软件包都由 AI 驱动,然而放射科医生的数量却增长了。那么问题是为什么?现在我们在世界范围内缺少放射科医生。所以,第一,危言耸听的警告过头了,它吓退了人们从事这个对社会如此重要的职业。所以它造成了伤害。那么,为什么它是错的?原因在于,放射科医生的目的是诊断疾病,帮助病人和医生诊断疾病。
(02:00:38) 因为我们现在可以更快地研究扫描结果,你可以研究更多的扫描,你可以诊断得更好,你可以更快地收治病人,你可以看到更多的人。医院赚更多的钱。医院里有更多的病人。你需要更多的放射科医生。我的意思是,令人惊奇的是,这是如此显而易见地会发生的事情。英伟达 的软件工程师数量将会增长,而不是减少。原因在于,软件工程师的目的与软件工程师编码的任务是相关的,但不是一回事。我希望我的软件工程师解决问题。我不在乎他们写了多少行代码,你知道?但他们的工作,他们工作的目的没有改变。
(02:01:25) 解决问题,团队合作,诊断问题,评估结果,寻找要解决的新问题,创新,连接点。这些事情都不会消失。莱克斯·弗里德曼
(02:01:39) 你认为是否可能……我们甚至就拿编程来说。你认为世界上的程序员数量可能会增加,而不是减少吗?黄仁勋
(02:01:45) 是的。原因如下。什么是编程?我相信……今天编程的定义,简单地就是指定、规格说明,也许如果你想要更具指导性,你甚至可以给出你想要编写的软件的架构。那么问题是,有多少人能做到?描述一个规格,让计算机去……告诉计算机去构建什么。有多少人?我认为我们从 3000 万可能增加到了 10 亿。所以未来的每一个木匠都将是一个程序员,只不过有了 AI 的木匠同时也是建筑师。他们只是增加了能为客户提供的价值。他们的艺术性极大地提升了。
(02:02:43) 我相信每一个会计师,也是你的金融分析师,也是你的财务顾问。所以,所有这些职业都得到了提升……如果我是一个木匠,我看到 AI,我会完全疯狂。我作为水管工能带给客户的服务,完全会疯狂。莱克斯·弗里德曼
(02:03:04) 而目前是程序员和软件工程师的人,我认为他们处于最前沿,能直观地理解如何使用自然语言与代理沟通,以设计出最好的软件。黄仁勋
(02:03:20) 没错,完全正确。莱克斯·弗里德曼
(02:03:20) 所以随着时间的推移,他们会融合,但我认为学习如何编程仍然有价值,比如学习什么是编程语言。旧式的编程,编程语言的良好实践是什么,大型软件系统的设计原则是什么——黄仁勋
(02:03:39) 没错。莱克斯·弗里德曼
(02:03:40) ……语言的?黄仁勋
(02:03:43) 原因在于,Lex,你知道,正如你对听众所说的,我认为规格说明的目标,规格说明的艺术性,其目标和艺术性将取决于你试图解决什么问题。当我思考,当我思考为公司制定战略、规划公司方向以及我们应该做的事情时,我会在一个足够具体的层面上描述它,让人们大致理解方向并且可以采取行动。它足够具体,他们可以据此采取行动,但我有意地降低规格说明的程度,这样就能让 43,000 名优秀的人把它做得比我想象的更好。
(02:04:36) 所以当我与工程师共事,与人们共事时,我会考虑,我在试图解决谁的问题,什么问题?我和谁一起工作?规格说明的程度、架构定义的程度与此相关。所以每个人都将不得不学习,他们想在编程光谱的哪个位置。编写规格说明就是编程。所以你可能决定非常具体地规定,因为你寻求一个非常具体的结果。你可能决定,这是一个你想要更多探索的领域,所以你可能降低规格说明的程度,让你能与 AI 来回互动,甚至突破自己的创造力边界。所以这种你在光谱中位置的艺术性,这就是编程的未来。莱克斯·弗里德曼
(02:05:31) 但让我们在编程之外再稍微谈一下,我认为很多人,理所应当地,担心他们的工作,对他们的工作有很多焦虑,尤其是在白领领域。我认为我们谁都不知道该如何应对自动化与新技术到来时总会带来的动荡时代。我只是……首先,我认为我们都需要有同情心和责任感,去感受那些失去工作的个人和家庭所承受的实际痛苦。我认为每当像人工智能这样的变革性技术到来时,就会有很多痛苦,我不知道该如何应对这种痛苦。
(02:06:21) 希望随着工具的发展,它能给同样的人创造更多的机会,让他们从事同类型的工作,并使他们更高效、更有趣,就像在编程领域那样。我不得不说,我在编程中获得了如此多的乐趣。我从未有过如此多的乐趣。所以希望它能让他们的工作自动化枯燥的部分,而把创造性的部分留给人类去负责。但仍然会有很多痛苦和磨难。黄仁勋
(02:06:51) 所以我的第一个建议……这就是我现在处理焦虑的方式。事实上,我们之前刚谈到过。对未来的巨大焦虑,对压力的巨大焦虑,对不确定性的巨大焦虑,我首先分解它,然后我会告诉自己,“好吧,有些事情你可以做点什么,有些事情你什么都做不了。但对于你能做点什么的事情,让我们推理,推理一下,然后去做。”
(02:07:20) 如果今天我们招聘一个新毕业的大学生,我有两个选择,一个对 AI 一无所知,另一个是使用 AI 的专家,我会雇佣那个使用 AI 的专家。如果我有一个会计,一个市场营销人员,那个使用 AI 的专家,供应链,客户服务,销售人员,业务拓展,律师,我会雇佣那个使用 AI 的专家。所以我建议每一个大学生,每一位老师都应该鼓励他们的学生去使用 AI。每一个大学生毕业时都应该是 AI 专家。每个人,如果你是木匠,如果你是电工,去用 AI。去看看它能做什么来改变你当前的工作,提升你自己。
(02:08:21) 如果我是农民,我绝对会用 AI。如果我是药剂师,我会用 AI。我想看看它能做些什么来提升我的工作,让我自己成为革新这个行业的创新者。所以这将是我会做的第一件事。然后我也会帮助他们……事实是,技术将取代并消除许多任务。因为它会自动化,如果你的工作就是那个任务——那么你很可能被颠覆。如果你工作的目的包含你,某些任务……那么你去学习如何使用 AI 来自动化这些任务就至关重要。然后中间还有广阔的光谱。莱克斯·弗里德曼
(02:09:14) 顺便说一句,AI 的美妙之处,比如聊天机器人版本,在于你可以分解……你有焦虑,你可以通过和它交谈来分解问题。就像,我最近……你真的可以通过它思考你生活中的问题,通过……我不是指像治疗那样的问题。我指的是,非常实际地,“好吧,我担心我的……”字面意思是,“我担心我的工作。需要什么技能?我需要采取哪些步骤?”我如何更好地使用 AI?”你刚才说的一切,你都可以直接问,它会给你……一个逐点的计划。我的意思是,它简直就是一个很棒的人生教练,就是这样。这——黄仁勋
(02:09:51) 我不知道怎么用 AI,AI 会说,“嗯,让我来教你。”莱克斯·弗里德曼
(02:09:54) 没错。这非常元,但它——它有点不可思议。所以人们绝对应该——黄仁勋
(02:10:00) 你不能走到 Excel 前说,“我不知道怎么用 Excel。”莱克斯·弗里德曼
(02:10:02) 没错。黄仁勋
(02:10:02) 你完蛋了。莱克斯·弗里德曼
(02:10:03) 我的意思是,这真的是 AI 在生活的各个方面为我所做的,消除了作为初学者第一次使用某物时的初始摩擦。我真的可以问任何一件事,“我需要采取的第一步是什么?”黄仁勋
(02:10:16) 没错。莱克斯·弗里德曼
(02:10:17) 它提供的这种手把手的指导,消除了世界提供的一切体验中的摩擦……你知道,就像我私下跟你提到的,你提到,“我要去中国和台湾。”黄仁勋
(02:10:30) 太棒了。莱克斯·弗里德曼
(02:10:31) 直接问,“我去哪里——”黄仁勋
(02:10:31) 为你感到兴奋。莱克斯·弗里德曼
(02:10:32) “我去哪里……做什么……” “你知道,我去哪里?我怎么……” 所有这些问题……立即得到回答,这太美好了。黄仁勋
(02:10:37) 嗯,你去台湾的时候,直接问 AI……“Jensen 在台湾最喜欢的餐厅有哪些?”它实际上会——莱克斯·弗里德曼
(02:10:45) 你不知道?黄仁勋
(02:10:45) 哦,知道。莱克斯·弗里德曼
(02:10:46) 准确吗?好的。好吧。黄仁勋
(02:10:47) 遍布台湾。莱克斯·弗里德曼
(02:10:50) 嗯,你在那边是个大明星。就像我们私下提到的,也许我们会在计算机会展上碰面,那会非常棒。黄仁勋
(02:10:58) 台北电脑展。英伟达 GTC 台湾。意识
莱克斯·弗里德曼
(02:11:01) 你认为关于人类本性、人类意识,是否存在某些根本上是非计算性的东西?也许是某些东西,无论芯片多么强大,都无法复制?黄仁勋
(02:11:18) 我不知道芯片是否会紧张。你知道,当然,导致焦虑、紧张或任何情绪的条件。我相信 AI 将能够识别和理解这些。我不认为我的芯片会感受到这些。因此,那种焦虑、那种感觉、那种兴奋、那种……所有这些感觉都体现在人类的表现中。例如,极其出色的人类表现,运动表现,平均或低于平均水平。同样的情境,在不同的人身上,会产生整个光谱的人类表现,展现出不同的结果,展现出不同的表现。
(02:12:15) 我认为我们正在构建的任何东西中,没有任何东西表明,两个不同的计算机在完全相同的情境下,会产生……当然,它们会产生统计上不同的结果,但那不是因为它们感觉不同。莱克斯·弗里德曼
(02:12:34) 是的,主观体验……天哪,我们人类的主观体验确实有些特别的东西。就像我对你说的,和你谈话我相当紧张。就像我对你说的,希望、恐惧、焦虑,以及生活本身,生活的丰富性。一切是多么神奇。我们爱得有多深,我们的心碎得有多深,我们有多害怕死亡,当我们所爱的人去世时我们有多痛苦。所有这一切,全部。我知道很难……想象 AI 能够……一个计算设备能够做到那样。但这整件事还有很多我们尚未发现的奥秘,我对此持开放态度,愿意接受惊喜。在过去——莱克斯·弗里德曼
(02:13:23) ……几个月和几年里,我已经被惊到了很多次。扩展可以在智能领域创造一些不可思议的奇迹。看着这一切真的非常奇妙,所以我愿意接受惊喜。黄仁勋
(02:13:34) 分解什么是智能是非常重要的。你知道,我们一直使用的这个词,它不是一个神秘的词。智能是有含义的,你知道?
(02:13:46) 它是一个系统……它是我们所做的事情,包括感知、理解、推理和制定计划的能力。那个循环,那个循环,就是……智能的根本。智能不是一个完全等同于人性的词。我认为区分这两者非常重要。我们有两个词来描述。我不过度幻想,也不过度浪漫化智能。智能是……人们以前听我说过,我实际上认为智能是一种商品。我被聪明人包围着。我周围都是比我聪明的人,在他们各自的领域里。
(02:14:39) 然而,我在那个圈子里有一个角色。这其实挺有意思的。他们比我受教育程度高。他们上的学校比我好。他们在各自领域都比我深入。所有人。我有 60 个这样的人。对我来说,他们都是超人。而不知何故,我却坐在中间,协调着所有这 60 个人。所以你得问问自己……一个洗碗工有什么特质,能让这个洗碗工坐在一群超人的中间?这说得通吗?
(02:15:15) 所以,这就是我的观点。我的观点是,智能是功能性的。人性不是用功能性来定义的。它是一个大得多的词。我们的人生经历、我们对痛苦的忍耐力、我们的决心,这些都是不同于智能的词。所以,我想帮助听众理解的是,如果我只能给他们一个信息,那就是智能这个词随着时间推移被我们提升到了一个非常高的地位。莱克斯·弗里德曼
(02:15:50) 我们真正应该提升的词是人性的光辉。黄仁勋
(02:15:53) 品格,人性的光辉。莱克斯·弗里德曼
(02:15:55) 所有这些。黄仁勋
(02:15:55) 所有这些。同情心、慷慨,你刚才说的一切,我相信这些都是超人的力量。而现在的智能将被商品化。因为我们谈到了,最重要的是你的教育。现在,即使他们说你最重要的是你的教育,当你上学时,你获得的不仅仅是知识。
(02:16:22) 但不幸的是,我们的社会把所有东西都归结为一个词,而生活远不止一个词。我只是想告诉你,我的生活表明,在智力曲线上比我周围的每个人都低,并不改变我是最成功的事实。所以,我希望这能激励其他人——不要让智能的民主化、智能的商品化导致你的焦虑。你应该为此受到鼓舞。莱克斯·弗里德曼
(02:17:00) 是的。我认为 AI 将帮助我们更多地颂扬人类。当然,人性与人类至上,我认为让这个世界不可思议的是人类将永远如此,而 AI 正是这个让我们人类变得更强大的不可思议的工具——黄仁勋
(02:17:18) 完全正确。莱克斯·弗里德曼
(02:17:18) ……人类更强大。黄仁勋
(02:17:19) 完全正确。死亡
莱克斯·弗里德曼
(02:17:21) 英伟达 的成功以及我提到的数百万人的生活都依赖于你。但你只是一个人,就像我们提到的,和我们一样终有一死。你会考虑自己的死亡吗?你害怕死亡吗?黄仁勋
(02:17:42) 我真的不想死。我生活很美好。我有一个很棒的家庭。我有非常重要的工作要做。这不是一生一次的经历所暗示的,那种经历可能很多人都有过,只是不是同一个人。我正在经历的是人类史上一次的经历。英伟达 是历史上最重要的科技公司之一。我们在做非常重要的工作。我对此非常认真。所以当然有些实际的事情,比如我们如何考虑继任计划?我以不相信继任计划而闻名。
(02:18:36) 天哪。黄仁勋
(02:18:36) 原因不是因为我长生不老。原因在于,如果你担心继任计划,如果你对继任计划充满焦虑,那么你该怎么做?然后你把它层层分解。如果你关心你离开后公司的未来,你今天应该做的最重要的事情,就是尽可能频繁、持续地传递知识、信息、见解、技能、经验,这就是为什么我不断在我团队面前推理每一件事的原因。每一次会议都是一次推理会议。我在公司内外度过的每一刻,都是为了尽可能快地把知识传递给人们。
(02:19:23) 我学到的东西在我桌上停留的时间不会超过一秒钟。我正在传递这些信息、这些知识——哦,天哪,这个太酷了。在我自己还没完全学完之前,我已经把它指给其他人了。“看看这个。这太酷了。你会想学这个的。”所以我不断地传递知识,赋能于人,提升我周围每个人的能力,这样我所寻求的、我希望的结果是,我能死在工作中。并且希望我能瞬间死在工作中。没有长时间的痛苦,你知道?这,呃——莱克斯·弗里德曼
(02:20:06) 嗯,从一个粉丝的角度来看,鉴于你对文明产生的极其巨大的积极影响,当然,我希望你能继续下去。而且,看着 英伟达 所做的一切本身就很有趣。就是那种创新速度。我是一个超级工程迷。英伟达 持续进行着如此多令人难以置信的工程。光是看着就很有趣。这是对人性的颂扬,是对伟大建设者的颂扬,是对伟大工程的颂扬。所以,它代表着一些特别的东西。所以我希望你和 英伟达 继续下去。关于我们正在进行的这一切,关于人性,关于人类的未来,是什么给了你希望?当你展望未来,当你经常思考未来,当你展望 10 年、20 年、50 年、100 年后,是什么给了你希望?黄仁勋
(02:20:56) 我一直对善良、慷慨、同情心、人类的能力抱有极大的信心。我一直对此非常有信心。有时甚至超过了我应该的程度。我也会被利用,但这从未让我停止相信。我总是首先相信人们想做好事。人们想帮助别人。绝大多数情况下,事实证明我是对的。不断地被证明是对的。而且常常超出我的预期。所以我对人类的能力充满信心。我认为给我带来巨大希望的是,我现在看到什么是可能的,以及根据我们正在做的事情进行推断,什么将很可能发生。
(02:22:22) 有那么多我们想要解决的问题。有那么多我们想要解决的问题。有那么多我们想要建造的东西。有那么多我们想做的好事,现在都触手可及,而且在我有生之年触手可及。你不可能不对那感到浪漫。你明白我的意思吗?莱克斯·弗里德曼
(02:22:46) 活在当下是多么激动人心的时刻。就像,真的——黄仁勋
(02:22:49) 怎能——莱克斯·弗里德曼
(02:22:49) ……真的是这样。黄仁勋
(02:22:50) 你怎么能不对那感到浪漫?事实上,期望疾病的终结是合理的。期望这是合理的。期望污染会大幅减少是合理的。期望以光速旅行确实在我们的未来是合理的。然后,不是远距离,而是短距离。人们问我怎么做。嗯,首先,很快,我会把一个人形机器人放在宇宙飞船上,它会是我的那个人形机器人,我们会尽快把它送出去,它会在飞行途中不断改进和增强。
(02:23:36) 然后到时候,我所有的意识都已经——你知道,我一生中的大部分信息都上传到了互联网。把我所有的收件箱,把我所做的一切,我所说的一切。你知道,它们被收集起来,变成了我的 AI。到时候,我们只需以光速发送它,追上我的机器人。莱克斯·弗里德曼
(02:24:00) 哦,太棒了。我的意思是,但对我来说,那是有点应用层面的。但同样,对我来说,从最大化好奇心的角度来看,我只是,所有这些奥秘。那里有太多……令人着迷的科学问题。黄仁勋
(02:24:14) 理解生物机器就在眼前。不是 10 年。大概是 5 年。莱克斯·弗里德曼
(02:24:20) 然后你的生物机器,人类思维,并打开物理学、理论物理学的大门。太令人兴奋了。黄仁勋
(02:24:26) 解释意识,那将是很棒的。莱克斯·弗里德曼
(02:24:29) 这一切都触手可及。Jensen,非常感谢你多年来所做的一切。感谢你为世界所做的一切。感谢你成为你这样的人。我看得出你是一个伟大的人,祝你今年取得巨大的成功。我等不及了。作为一个粉丝,我迫不及待地想看看你接下来会做什么,希望能在台湾见到你,非常感谢你今天能来聊天。黄仁勋
(02:24:52) 谢谢你,Lex。我过得很愉快。还有,如果我能再说一点。谢谢你做的所有采访,你所展现的深度、尊重,以及你为揭示我们所有人所做出的研究,这些年你采访过的那些了不起的人。我非常喜欢这些采访。作为一个创新者,创造了这种长格式的、难以置信的、但又引人入胜的内容。总之,谢谢你做的一切。莱克斯·弗里德曼
(02:25:25) 这对我来说意义重大。谢谢你,Jensen。黄仁勋
(02:25:27) 谢谢你,Lex。莱克斯·弗里德曼
(02:25:29) 感谢您收听本次与 黄仁勋 的对话。要支持本播客,请查看描述中的赞助商链接,您还可以在那里找到联系我、提问、反馈等链接。现在,让我用 Alan Kay 的一句话作为结束。“预测未来的最佳方式是创造未来。”谢谢收听,希望下次再见。
