
NVIDIA's biggest competitor has emerged.

芯片三巨头鏖战 AI。
作者 | 周智宇
编辑 | 张晓玲
一周涨价 30%,单片售价超十万。人工智能的火热,芯片的短缺,让英伟达 A800 成了市场上炙手可热的硬通货。
趁此东风,英伟达 CEO 黄仁勋一举成为和马斯克并肩,最受瞩目的企业家之一。英伟达的市值也飙升至 1.17 万亿美元,成了市场上最热门的科技公司。
然而一面是高端 AI 芯片的稀缺,一面则是 “百模大战”,下游对算力需求高涨。面对才不过刚刚起势的市场,大大小小的竞争对手们,都在奋力追赶。它们希望打破眼下 “AI 芯片=英伟达” 的格局,从这个万亿级的市场里分得一杯羹。
就在 7 月 11 日,英特尔在北京发布了专供中国市场的 AI 处理器 Gaudi 2,它对标英伟达 100 系列,专为训练大语言模型而构建。
Gaudi 2 的推出,意味着 AI 芯片市场里又有一位巨头下场。在英特尔之前,AMD 也推出了自家的 AI 产品。英伟达、英特尔、AMD 这三家从 PC 时代就鏖战不止的芯片三巨头,又在 AI 时代里正面交锋。
AI 芯片市场里不会一家独大,随着一位位巨头入场,一场全新的竞逐,开始了。
交锋
借着推出 Gaudi 2,英特尔向英伟达发起了正面进攻。
PC 市场萎缩以及数据中心业务走软,让英特尔业绩承压。原本是服务器芯片市场 “一哥” 的英特尔的市场份额,被 AMD 等竞争对手蚕食。人工智能浪潮带来对算力的需求,则让英特尔看到了新的发力点。
Gaudi2 由英特尔 2019 年斥资 20 亿美元收购的 AI 初创公司 Habana Labs 设计,从推出的一开始,Gaudi 平台就是为云端和数据中心提高深度学习训练效率而构建。
发布会现场,英特尔公司执行副总裁、数据中心与人工智能事业部总经理 Sandra Rivera 花了大量时间介绍 Gaudi 2 的性能,对比的对象,就是英伟达高端 GPU A100 和 H100。
从演示的数据看,比如说 Bert 模型预训练,Gaudi 2 的性能是英伟达 A100 的 1.7 倍。至于更先进的英伟达 H100,Habana Labs 的首席运营官 Eitan Medina 表示,Gaudi 2 是目前为能够替代英伟达 H100 进行 LLM 训练的 “唯一替代品”。在 MLPerf 3.0 基准测试中,仅有 Gaudi 2 与 H100 能够进行 GPT-3 训练。
从目前的数据来说,基于 GPT-3 模型训练,Gaudi 2 与 H100 尚有一定差距,单个 H100 的性能是 Gaudi 2 的 3.6 倍。不过 Eitan Medina 表示,随着 9 月英特尔发布对 FP8 的软件支持与新功能,Gaudi2 的性价比预计将超越 H100。
性价比,是 Gaudi 2 对抗英伟达 100 系列的一个核心优势。Eitan Medina 告诉华为见闻,Gaudi2 在运行 ResNet-50 时,每瓦性能约是英伟达 A100 的 2 倍,运行 1760 亿参数 BLOOMZ 模型的每瓦性能,则大概是 A100 的 1.6 倍。
也就是说,在提供不错的性能的同时,Gaudi 2 在能耗上明显优于英伟达 A100,并且 Gaudi 2 也能从性价比层面挑战 H100。英特尔也借此成为目前一众英伟达的挑战者中,最具竞争力的对手。
尽管同 A100 类似,Gaudi 2 为了符合美国工业与安全局相关规定,与国际版存在差别。不过 Eitan Medina 表示,中国版 Gaudi 2 在整体性能上与国际版差别不大。明年计划推出的 5nm Gaudi 3,也会在合规的情况下,提供给中国客户。
目前,英特尔已经与浪潮信息、新华三和超聚变等国内服务器厂商,以及百度智能云等公司展开合作。浪潮信息副总裁、浪潮 AI&HPC 产品线总经理刘军也表示,联合英特尔发布新一代 AI 服务器 NF5698G7,支持 8 颗 Gaudi2。
此外,Sandra Rivera 透露,到 2025 年的时候,英特尔会把 Gaudi 的 AI 芯片和 GPU 两条产品线进行整合,届时会推出一个更完整的下一代 GPU 产品。通过广泛的产品线,满足各种不同的需求。
竞逐
英特尔不是首家向英伟达发起冲锋的芯片巨头。
去年 6 月,AMD 也推出 CPU+GPU 架构的 Instinct MI300,进军 AI 训练市场。随后在今年 6 月,AMD 又通过祭出高达 192 GB HBM 内存的 MI300X,进一步为满足大模型训练进行优化。
AMD 的数据中心硬件主管 Forrest Norrod 称,ChatGPT 引领的 AI 热潮让 AMD 也感到意外。业内还是迫切希望英伟达有一个竞争对手,能够在英伟达的芯片之外,还有一个替代的选项。
事实也是如此。日益增长的大模型训练需求,与产能受限,让英伟达充满了 “幸福的烦恼”。英伟达方面透露,其订单已经排至 2024 年,像 H100 在明年一季度之前都处于售罄状态。
前不久的世界人工智能大会(WAIC)上,清华大学电子工程系主任汪玉也强调了目前算力资源的紧张。他表示,部署成本高、模型算力缺口大以及国产芯片生态需要扩张和构建,是目前大模型落地的三大挑战。
算力需求持续增长,以及大模型玩家渴望通过使用更优秀产品,以减少与 OpenAI 等厂商算力支持差距,都让市场里对算力的需求高企。半导体市场里的玩家也随之迎来全新的机遇。
Sandra Rivera 表示,在一季度,人工智能带来的芯片需求,让英特尔包括 Gaudi 在内的产品需求翻了至少两倍。此外,在 AI 用例及市场需求爆发式增长的时候,第四代至强处理器也有很好的市场回响。
按照摩根士丹利的预计,包括英伟达和 AMD 的 GPU、AI 计算专用芯片以及这些芯片的外包生产在内,今年全球 AI 计算半导体市场年销售规模大概会在 430 亿美元。四年内,全球 AI 计算半导体市场销售额会达到 1250 亿美元。这在全球半导体受消费电子销售放缓,收入下降预期中,是一个增长的亮点。
这个万亿人民币的市场,也自然吸引了大小玩家,前赴后继地蜂拥而入。他们相信,市场里不止有一个英伟达。
英伟达确实有自己的壁垒。GPU 相比 CPU 在并行计算能力、内存带宽等性能和浮点运算速度上具备明显优势,英伟达也借此在模型训练和推理上先行一步,领先了 AMD 和英特尔等玩家。英伟达统一计算设计架构 CUDA 也靠着封闭的生态,形成了自己的软件生态,绑定了百万计的开发者。
Sandra Rivera 也承认,在目前进行人工智能、AI 运算的时候,很多人都在用 CUDA。然而在她的观察中,很多大模型的开发者不会做这么底层的开发,会在 PyTorch、TensorFlow 上做创新。
这也是英特尔等玩家的机遇。Sandra Rivera 认为,软件开发或者开发者生态一直是英特尔的强项,在数据中心领域,除了 CUDA,就是英特尔的 X86 软件生态。英特尔则希望为摆脱封闭生态系统,寻求效率与规模的的客户提供更具竞争力的选择。
除了英伟达、AMD 和英特尔三个芯片巨头,市场上仍有大玩家摩拳擦掌,准备下场。马克·扎克伯格旗下的 Meta Platforms 在 7 月 18 日宣布,将携手高通,采用高通芯片,以在手机和个人电脑上运行 Meta 新大型语言模型 Llama 2;马斯克也在 xAI 会议上表示,准备自研 AI 芯片。
在火热的 “百模大战” 之外,硬件端的战役也已打响。传统芯片巨头和不断涌现的新玩家们在 AI 上战得火热,如今浪潮初起,一场全新领域里的王者之争,方拉开序幕。
