
The biggest risk for NVIDIA is NVIDIA itself?

英伟达受益于市场对 GPU 的强劲需求,但其高售价同样推升了 AI 企业成本,导致下游应用落地不佳——英伟达的增长故事还能说多久?
成本高企,正在成为 AI 企业们的 “头号焦虑”。
近日,花旗银行的分析师 Yitchuin Wong 等参加了在奥兰多举行的 Gartner 数据分析峰会。在会后总结报告中,花旗指出,AI 目前仍面临诸多挑战,尤其是在成本高昂的情况下,很多企业客户开始重新关注 ROI(投资回报率)。
为什么会成本高昂?这就不得不谈到 “AI 芯片之王”——英伟达。
伴随 AI 技术蓬勃发展,英伟达生产的图形处理器(GPU)能够满足 AI 训练的庞大算力需求,在市场上长期 “供不应求”,芯片售价随之激增,一再将公司股价推至历史新高。
疯狂押注 “AI 信仰” 的交易行为也让英伟达的上游硬件供应商受益其中。据媒体报道,英伟达的主要硬件供应商之一、高带宽内存芯片制造商美光科技到 2025 年的产品均已售罄。
在接受媒体采访的过程中,美光直言:
“我在历史上从未见过内存提前 18 个月分配的情况。这完全是由英伟达和这场 AI 游戏中的许多其他公司共同推动的。”
成本高企导致下游应用落地不佳
此前华尔街见闻提及,一块 H100 GPU 的价格在 2022 年就已经超过了 3 万美元。到去年,Ebay 网站上每块 H100 的售价已经飙涨至 4 万美元上方,其平均售价是 AMD 竞争产品 MI300X 的四倍之多。
而对 GPU 的部署还远未结束。扎克伯格曾在今年表示,Meta 今年将大规模投资 GPU,其中包括高达 35 万块英伟达 “Hopper” H100 以及其他设备,到年底达到 “相当于近 60 万个 H100 的计算能力”。
一边是技术发展带来的持续 “缺芯”,另一边是居高不下的 GPU 售价。企业们不得不开始思考 AI 商业化变现的能力,接下来对 GPU 的市场需求还能继续强劲吗?
花旗称,对于生成式 AI 的热情正在冷却,大规模项目落地还 “为时尚早”。
报告表示,尽管生成式 AI 依然是大多数参会管理层关注的焦点,但实际的项目规模和使用案例还比较小(比如文本/图像生成)而不是大规模的转型变革。
据媒体报道,亚马逊网络服务和其他生成人工智能提供商们已经降低了销售预期,OpenAI 的主要竞争对手之一 Cohere 的去年营收实际上也微乎其微,该公司表示,在寻求融资的过程中,客户对成本持谨慎态度,并正在衡量该技术的功能性。
花旗提及,据信息技术研究和咨询公司 Gartner 预计,将有约三分之一的项目会因为过早推出 POC(Proof Of Concept,概念验证)而失败。
美光科技的高管 Narasimhan 以及 IBM 半导体研究部门总经理 Mukesh Khare 均表示,AI 的成本远远超过传统计算的成本,只有成本先降下来,才能对吸引更多企业客户。
美光科技表示:
“目前,涉及大语言模型的成本相当高,对于大型企业来说或许可接受,但对于大众而言则不然。”
“坦率地说,今天我认为投资正在变得……我不想用炒作这个词……有太多人对此感到兴奋,如果你有预算,你那么你可能会优先考虑投资在生成式 AI 服务器上,而不是其他任何领域。”
对于 “成本何时能下降” 的问题,美光认为这 “是一个价值十亿美元的问题”,但 “它会下降,这是不可避免的竞争”。
另外,花旗还指出,企业客户对于数据治理的担忧也在增加。为了提升数据和 AI 素养,数据治理和质量将成为企业持续投资的更优先事项。
