TPU vs GPU: Google's chip commercialization accelerates, can NVIDIA's moat hold up?

华尔街见闻
2025.12.03 07:02
portai
I'm PortAI, I can summarize articles.

虽然单颗 TPU 不及最强 GPU,但谷歌借助超大规模集群和更高性价比,正在撬动英伟达的定价权和市场控制力。真正的战场在生态与商业模式——英伟达靠 CUDA 锁定用户,谷歌则用 TPU + Gemini 打开新入口。英伟达在通用性和生态成熟度上占据明显优势,但当越来越多头部客户开始 “试水” TPU,任何一丝松动,都会被市场迅速放大。

当谷歌开始尝试把自研的 AI 芯片 TPU(Tensor Processing Unit)卖向更广阔的市场,这场原本只发生在云端的 “芯片暗战” 正在被推到台前,并对 AI 芯片霸主英伟达构成实质性挑战。

科技媒体 The Information 最新文章分析称,英伟达无法忽视的是,全球最先进的两个 AI 模型——来自谷歌和 Anthropic 的模型,完全或部分使用谷歌自研的 TPU 芯片开发,而非英伟达的 GPU。这一现实已促使英伟达最大客户之一 Meta 认真考虑使用谷歌的 TPU 来开发新模型。

这意味着,TPU 的角色已从 “谷歌内部工具” 升级为一个可以被大型 AI 公司认真考虑的替代方案。据摩根士丹利此前分析,谷歌计划 2026 年生产超过 300 万片 TPU,2027 年约 500 万片,而英伟达目前的 GPU 产量约为谷歌 TPU 的三倍。

虽然单颗 TPU 不及最强 GPU,但谷歌借助超大规模集群和更高性价比,正在撬动英伟达的定价权和市场控制力。真正的战场在生态与商业模式——英伟达靠 CUDA 锁定用户,谷歌则用 TPU + Gemini 打开新入口。英伟达在通用性和生态成熟度上占据明显优势,但当越来越多头部客户开始 “试水” TPU,任何一丝松动,都会被市场迅速放大。

性能对比:单芯片输,系统赢?

从纯粹的算力来看,最先进 TPU(代号 Ironwood)在每秒浮点运算次数(FLOPS)上约为英伟达 Blackwell GPU 的一半。

但这并不意味着 TPU 就处于下风。

The Information 称,谷歌的策略是通过 “集群化” 来放大性能优势:数千颗 TPU 可以被串联成一个 “超级 Pod”,在训练超大模型时具备出色的性价比与能效比。而英伟达单个系统最多只能直接连接约 256 颗 GPU 芯片,尽管用户可以通过额外的网络设备扩展规模。

在大模型时代,已经很难用 “单芯片性能” 简单定胜负,系统级设计、互连能力和能效比,正在成为新的核心指标。

关键差异:软件生态仍是英伟达护城河

真正构成英伟达 “护城河” 的,不只是硬件,而是深度绑定的 CUDA 软件生态。

根据 The Information 对谷歌和英伟达前员工的调研,TPU 的使用成本还跟模型相关。

对已使用英伟达 Cuda 编程语言运行 AI 的客户而言,租用英伟达芯片更具成本效益。而有时间和资源重写程序的开发者可通过使用 TPU 节省成本。

相较而言,对 Anthropic、苹果和 Meta 等技术水平较高的 TPU 客户,使用 TPU 的挑战相对较小,因为它们更善于为 AI 应用编写服务器芯片软件。TPU 在运行针对其优化的谷歌 Gemini 模型时成本效率尤其突出。

然而软件兼容性仍是 TPU 面临的主要挑战。TPU 仅能与 TensorFlow 等特定 AI 软件工具顺畅配合,而大多数 AI 研究人员使用的 PyTorch 在 GPU 上运行效果更佳。多名工程师表示,如果开发者花时间编写定制软件充分利用 GPU,其性能可能超过 TPU。

成本之战:TPU 并非 “廉价”

在制造成本上,TPU 与 GPU 其实相差不大。Ironwood 使用了比 Blackwell 更先进、也更昂贵的制程技术,但由于芯片体积更小,同一片晶圆上可切割出更多 TPU,从而部分抵消了成本劣势。

两者都使用高带宽内存(HBM),而在工艺和封装方面,博通扮演了极其关键的角色——不仅参与封装设计,还提供了 SerDes(高速数据传输核心技术)等关键 IP。分析机构估算,博通从 TPU 项目中获得的收益至少达到 80 亿美元。

值得注意的是,英伟达当前的硬件业务毛利率高达 63%,而谷歌云整体只有 24%。这也解释了,为什么英伟达能在价格战中仍保持极强的盈利能力。

产能博弈:台积电的 “平衡术”

在晶圆代工端,台积电并不会将所有产能押注在单一客户上。即使英伟达需求极其旺盛,也很难获得 “无限供应”。这意味着,市场上始终会留出空间给其他方案——包括 TPU。

根据摩根士丹利的预测,谷歌计划在 2026 年生产 300 万颗 TPU,到 2027 年达到 500 万颗,甚至可能更高。目前,英伟达 GPU 的产量大约是 TPU 的 3 倍左右,差距正在缩小。

当供应开始变得多元化,客户自然也会更加愿意比较、议价与分散风险。

商业化难题:卖芯片远比想象难

The Information 认为,如果谷歌真的想大规模对外销售 TPU,它需要几乎重建一整套产业链——包括服务器厂商、分销网络、企业级售后支持等,这基本就是 “复制一个英伟达”。

此外,如果客户把 TPU 部署在自己的数据中心,谷歌将失去部分云服务收入(如存储、数据库服务等),这就意味着:未来 TPU 很可能并不会走 “低价路线”,而是通过其他费用来弥补收入缺口。

换句话说,这并不是一门 “便宜就能赢” 的生意,而是一场复杂的战略选择。

从更高维度看,TPU 对谷歌的意义并不只在硬件收入本身。更重要的是:可以成为与英伟达谈判的筹码;有助于推广 Gemini 及其 AI 生态让谷歌在 AI 基础设施上拥有更大自主权。只要客户愿意 “多一个选项”,英伟达就不再拥有绝对定价权。

这,或许才是谷歌真正想要的。