
Targeting Nvidia! Report: Amazon is deploying 100,000 second-generation self-developed chips to challenge industry monopoly

目前,亚马逊的 Trainium2 芯片已开始在数据中心部署,预计很快将在包括俄亥俄州在内的多个核心数据中心全面推广。相比上一代产品,其性能提高了四倍,内存容量增加了三倍,且在能效和成本上具备显著优势。
科技巨头的 AI 角力正如火如荼地进行。据彭博社报道,亚马逊正在悄然推进一项极具雄心的计划,意在挑战目前英伟达在 AI 芯片领域的垄断地位。
报道称,亚马逊目前正在其位于德克萨斯州奥斯汀的工程实验室加紧研发一款新的 AI 芯片:Trainium2。相比上一代产品,其性能提高了四倍,内存容量增加了三倍,且在能效和成本上具备显著优势。
亚马逊希望通过这些优化,降低 AI 芯片的采购成本,并提升在数据处理方面的整体效率。
然而,要想真正挑战英伟达在 AI 硬件市场的领导地位,亚马逊面临的挑战依然巨大。
Trainium2 性能大幅提升,计划今年年底之前完成测试和交付
目前,亚马逊的核心芯片设计工程师 Rami Sinno 正在带领团队加速研发第二代自研 AI 芯片——Trainium2。
Sinno 在接受彭博社采访时表示,他们的目标是尽快在数据中心中部署这些芯片,计划在今年年底之前完成测试和交付。
这款芯片是亚马逊在 AI 硬件领域的第三代产品,旨在为机器学习模型训练提供更高效、更具成本竞争力的解决方案。
亚马逊的芯片业务由 James Hamilton 领导,他曾是云计算领域的开创者之一。
Hamilton 的团队早在 2013 年便提出了自主研发芯片的构想。亚马逊的第一个 AI 芯片 Inferentia 于 2019 年面世,专注于推理任务,而 Trainium 系列则主要面向训练机器学习模型的需求。
目前,亚马逊的 Trainium2 芯片已开始在数据中心部署,预计很快将在包括俄亥俄州在内的多个核心数据中心全面推广,亚马逊的目标是将 Trainium2 串成多达 100000 个芯片的集群。
亚马逊表示,Trainium2 相比上一代产品,性能提高了四倍,内存容量增加了三倍,且在能效和成本上具备显著优势。
亚马逊希望通过这些优化,降低 AI 芯片的采购成本,并提升在数据处理方面的整体效率。分析认为,如果亚马逊的 Trainium2 能够承担更多公司内部的 AI 工作,以及偶尔来自 AWS 大客户的项目,那么它很可能会被视为成功。
亚马逊 AI 硬件之路道阻且长
分析认为,要想真正挑战英伟达在 AI 硬件市场的领导地位,亚马逊面临的挑战依然巨大。
首先,设计可靠的 AI 芯片是一项极为复杂的任务,尤其是需要兼顾性能、能效和成本。
其次,软件工具的支持同样至关重要。尽管亚马逊的 Trainium 系列芯片在硬件层面取得了一定进展,但其相较于英伟达的成熟软件工具(如 CUDA 等)仍显不足。分析认为目前,亚马逊提供的 Neural SDK 软件工具尚处于初期阶段,无法与英伟达的解决方案相匹敌。
为了克服这一技术鸿沟,亚马逊正积极与大型客户和合作伙伴合作,推动其 AI 芯片的应用落地。知名企业如数据分析公司 Databricks 和 AI 初创公司 Anthropic,已经开始试用亚马逊的 Trainium 芯片,并在一些项目中取得了初步成果。
Anthropic 的首席计算官 Tom Brown 表示:
“亚马逊 Trainium 芯片的性价比给我们留下了深刻印象。我们一直在稳步扩大其在越来越广泛的工作负载中的应用。”
