
NVIDIA's AI dominance faces a major test! OpenAI is dissatisfied with some of its latest AI chips

据报道,OpenAI 对英伟达最新的一些人工智能芯片并不满意,自去年以来一直在寻找替代方案,这可能会使这两家 AI 热潮中最受关注的公司之间的关系变得更加复杂。分析称,OpenAI 及其他公司决定在推理芯片市场寻找替代方案,标志着对英伟达 AI 主导地位的重大考验。不过报道出炉后不久,OpenAI CEO Altman 隔空反驳,赞扬英伟达的 AI 芯片。
据媒体援引多位知情人士表示,OpenAI 对英伟达最新的一些人工智能芯片并不满意,并且自去年以来一直在寻找替代方案,这可能会使这两家 AI 热潮中最受关注的公司之间的关系变得更加复杂。
OpenAI 这一战略转变,源于其对用于执行 AI 推理中特定环节芯片的重视程度不断提高。所谓推理,是指像支撑 ChatGPT 应用的 AI 模型在响应用户问题和请求时所进行的计算过程。英伟达在训练大型 AI 模型所需的芯片领域仍占据主导地位,而推理正成为竞争的新战场。
分析称,OpenAI 及其他公司决定在推理芯片市场寻找替代方案,标志着对英伟达 AI 主导地位的一次重大考验。
不过报道出炉后不久,OpenAI CEO Sam Altman 隔空反驳,赞扬英伟达的 AI 芯片。Altman 在社交平台 X 发文表示:“我们热爱与英伟达合作,并且他们生产世界上最好的 AI 芯片。我们希望在很长一段时间里成为超级大客户。我不明白这些疯狂的说法是从哪里来的。”
周一,英伟达收跌近 2.9%。当日美股盘后 Altman 隔空反驳后,英伟达盘后反弹约 0.6%。
OpenAI 和英伟达合作
当前,OpenAI 和英伟达这两家公司仍在进行投资谈判:
去年 9 月,英伟达表示,计划向 OpenAI 投入高达 1000 亿美元,作为一项交易的一部分。该交易将使英伟达获得这家初创公司的股份,同时为 OpenAI 提供购买先进芯片所需的资金。
在此期间,OpenAI 已与 AMD 等公司达成协议,采购可与英伟达竞争的 GPU。然而,知情人士称,OpenAI 不断调整的产品路线图也改变了其所需的计算资源类型,从而使与英伟达的谈判变得更加复杂、进展缓慢。
上周六,英伟达首席执行官黄仁勋淡化了有关其与 OpenAI 存在紧张关系的报道,称这种说法 “纯属无稽之谈”,并表示英伟达仍计划对 OpenAI 进行巨额投资。英伟达在一份声明中表示:“客户在推理领域仍然选择英伟达,因为我们在大规模应用中提供了最佳性能和总体拥有成本。”
OpenAI 的一位发言人在另一份声明中表示,公司在其绝大多数推理算力集群中依赖英伟达,而且英伟达在推理方面提供了最佳的性价比。
知情人士称,OpenAI 对英伟达硬件在某些特定问题上的响应速度并不满意,例如软件开发以及 AI 与其他软件之间的交互。OpenAI 需要新的硬件,未来最终可满足其约 10% 的推理计算需求。
报道称,OpenAI 曾讨论与包括 Cerebras 和 Groq 在内的初创公司合作,以获得更快推理速度的芯片。不过,英伟达与 Groq 达成了一项价值 200 亿美元的授权协议,从而终止了 OpenAI 与 Groq 的谈判。
芯片行业高管表示,英伟达迅速拿下 Groq,看起来是为了在快速变化的 AI 行业中巩固其技术组合、提升竞争力。英伟达在声明中称,Groq 的知识产权与英伟达的产品路线图高度互补。
在推理芯片上寻找替代方案
英伟达的 GPU 非常适合用于训练像 ChatGPT 这样的大型 AI 模型所需的海量数据处理,这也是迄今为止全球 AI 爆炸式增长的重要基础。但随着 AI 的不断进步,重点正日益转向对已训练模型进行推理和推断,这可能成为 AI 的一个新阶段。
自去年以来,OpenAI 在寻找 GPU 替代方案时,重点关注那些在同一块硅片上集成大量内存(称为 SRAM)的芯片制造商。尽可能在每颗芯片上塞入昂贵的 SRAM,可在聊天机器人和其他 AI 系统处理数百万用户请求时带来速度优势。
与训练相比,推理对内存的需求更高,因为芯片需要花费相对更多时间从内存中获取数据,而不是进行数学运算。英伟达和 AMD 的 GPU 技术依赖外部内存,这会增加处理时间,降低用户与聊天机器人交互的速度。
有知情人士称,在 OpenAI 内部,这一问题在其用于生成计算机代码、并正被公司大力推广的产品 Codex 中尤为明显。OpenAI 员工将 Codex 的部分性能不足归因于基于英伟达 GPU 的硬件。
上月,OpenAI 首席执行官 Sam Altman 表示,使用 OpenAI 编程模型的客户 “会为编码工作的速度支付很高的溢价”。OpenAI 满足这一需求的方式之一,是其最近与 Cerebras 达成的合作协议。对于普通的 ChatGPT 用户而言,速度并非那么关键。
相比之下,Anthropic 的 Claude 和谷歌的 Gemini 等竞争产品,更多依赖谷歌自研的 TPU 进行部署。TPU 专为推理所需的计算而设计,在性能上可能优于像英伟达 GPU 这样的通用型 AI 芯片。
英伟达的应对举措
当 OpenAI 明确表达了对英伟达技术的保留态度后,英伟达曾接洽包括 Cerebras 和 Groq 在内、专注于高 SRAM 芯片的公司,探讨潜在收购的可能性。知情人士称,Cerebras 拒绝了收购提议,并与 OpenAI 达成了一项商业合作,该合作已于上月宣布。
媒体称,Groq 也曾与 OpenAI 就提供算力展开讨论,并吸引投资者兴趣,拟以约 140 亿美元的估值为公司融资。
但到 12 月时,英伟达以一项非独家的全现金交易,获得了 Groq 技术的授权。尽管该协议允许其他公司也可授权使用 Groq 的技术,但目前 Groq 正将重心转向销售云端软件,因为英伟达已挖走了 Groq 的芯片设计人员。
