Amazon launches a major challenge to Google and Nvidia: AI chip Trainium 3 is faster and more energy-efficient, with four Nova 2 models, pioneering "open training"

华尔街见闻
2025.12.02 21:02
portai
I'm PortAI, I can summarize articles.

Trainium 3 是首款 3nm AWS AI 芯片,提供 2.52 PFLOPs FP8 算力,内存容量较前代增加 1.5 倍、带宽提升 1.7 倍,搭载它的 Trn3 UltraServer 系统能效较前代提高 40%。开发中的 Trainium 4 将支持英伟达 NVLink Fusion 互联技术。新模型包括亚马逊最智能推理模型 Nova 2 Pro 和业内首款统一的多模态推理和生成模型 Nova 2 Omni。开创” 开放式训练” 模式的服务 Nova Forge 为企业构建定制 Nova 模型。新服务 Nova Act 实现浏览器任务自动化突破。更新中

美东时间 12 月 2 日周二,亚马逊云计算部门 AWS 在年度云计算盛会 re:Invent 上推出新一代人工智能(AI)训练芯片 Trainium 3,预告了下一代产品 Trainium 4 的开发计划,加大力度挑战英伟达和谷歌在 AI 芯片市场的主导地位,同时推出 Nova 2 系列模型和全新 AI 服务,试图在激烈的 AI 竞争中抢占更多市场份额。

AWS 宣布,Trainium 3 芯片已于近期部署至少数几个数据中心,并从本周二当天起向客户开放使用。AWS 的副总裁 Dave Brown 表示:“进入明年初,我们将开始非常非常快速地扩大规模。”

这款芯片的推出速度超出业界常规。亚马逊在部署前一代加速器约一年后便发布了 Trainium 3,与英伟达承诺的每年发布新芯片的快节奏相当。

亚马逊希望吸引寻求性价比的公司。公司宣称,Trainium 芯片能以比英伟达市场领先的图形处理单元(GPU)更低廉和高效的方式,为 AI 模型背后的密集计算提供动力。Brown 表示:"我们对 Trainium 实现正确的价格性能比的能力感到非常满意。"

亚马逊周二不仅发布了四款新模型,还推出了业内首创的"开放式训练"服务 Nova Forge,并发布了专注于浏览器任务自动化的代理服务 Nova Act。此次发布的 Nova 2 家族涵盖推理、多模态处理、对话式 AI 和代码生成等多个领域,主打价格性能比优势。

新 AI 芯片的消息公布后,亚马逊股价逼近 239 美元刷新日高,日内涨幅扩大到将近 2.2%,而盘初曾涨 3.2% 的英伟达股价进一步收窄涨幅,美股早盘尾声时刷新日低,几乎抹平所有涨幅。其竞争对手 AMD 的股价跌幅扩大、日内跌近 1.7%。到收盘,亚马逊涨逾 0.2%,英伟达涨近 0.9%,AMD 跌近 2.1%。

Trainium 3 性能大幅跃升

AWS 称,其第四代 AI 芯片 Trainium 3 是首款 3 纳米(nm)制程的 AWS AI 芯片,专为下一代智能体、推理和视频生成应用程序 App 提供最佳代币经济效益而打造。

据 AWS 官方数据,搭载 Trainium 3 芯片的 Trn3 UltraServer 系统在训练和推理性能上都实现了显著提升。相比第二代产品,新系统速度提升超过 4 倍,内存容量增加 4 倍。

每颗 Trainium 3 芯片提供 2.52 千万亿次浮点运算 (PFLOPs) 的 FP8 算力,内存容量较 Trainium 2 增加 1.5 倍至 144GB HBM3e,内存带宽提升 1.7 倍至 4.9TB/s。单台完整配置的 Trn3 UltraServer 可容纳 144 颗芯片,总算力达 362 PFLOPs,并提供高达 20.7TB 的 HBM3e 内存和 706TB/s 的聚合内存带宽。

能效提升同样引人注目。AWS 表示,Trn3 UltraServer 的能效比前代产品提高 40%,性能功耗比提升 4 倍。在 Amazon Bedrock 平台上,Trainium 3 成为 AWS 最快的加速器,性能较 Trainium 2 提升 3 倍,每兆瓦输出 token 数量增加超过 5 倍,且延迟水平相当。

Brown 在采访中表示:"我们对 Trainium 在价格性能方面的表现非常满意。"该系统还可在 EC2 UltraClusters 3.0 中扩展至数十万颗芯片,AWS 称其目标是年底前为 AI 初创公司 Anthropic 提供 100 万颗芯片。

Trainium 4 将支持英伟达互联技术

亚马逊在会上还预告了正在开发中的 Trainium 4 芯片。这款下一代产品将带来性能的重大跃升,并将支持英伟达的 NVLink Fusion 高速芯片互联技术。

这一技术兼容性意味着,搭载 Trainium 4 的 AWS 系统将能够与英伟达 GPU 互操作并扩展性能,同时仍使用亚马逊自研的低成本服务器机架技术。这可能帮助 AWS 吸引那些基于英伟达 GPU 开发的大型 AI 应用迁移至亚马逊云平台。

值得注意的是,英伟达的 CUDA 架构已成为所有主流 AI 应用支持的事实标准。Trainium 4 对 NVLink 的支持或将降低这些应用转向 AWS 的技术门槛。

亚马逊未公布 Trainium 4 的具体发布时间表。按照以往发布节奏,外界预计将在明年的 re:Invent 大会上获得更多信息。

软件生态仍是短板

尽管硬件性能强劲,亚马逊芯片仍面临生态系统挑战。与英伟达相比,AWS 芯片缺乏帮助客户快速部署的深度软件库。

建筑设备自动驾驶公司 Bedrock Robotics 的首席技术官 Kevin Peterson 表示,虽然该公司在 AWS 服务器上运行基础设施,但在构建指导挖掘机的模型时仍使用英伟达芯片。"我们需要它性能强大且易于使用,"Peterson 说,"那就是英伟达。"

目前使用 Trainium 芯片的主要客户是 Anthropic,这些芯片分布在印第安纳州、密西西比州和宾夕法尼亚州的数据中心。AWS 今年早些时候表示,已将超过 50 万颗芯片串联起来帮助 Anthropic 训练最新模型,,并计划在年底前为这家 OpenAI 的劲敌提供 100 万颗芯片。

不过 Anthropic 同时也在使用谷歌的 TPU(张量处理单元),并在今年早些时候与谷歌达成协议,获得价值数百亿美元的计算资源。

除 Anthropic 外,亚马逊公布的其他主要客户寥寥,令分析师难以评估 Trainium 的实际效果。AWS 表示,日本的 LLM Karakuri、Splashmusic 和 Decart 等客户已在使用第三代 Trainium 芯片和系统,并显著降低了推理成本。

AWS 承诺通过 AWS Neuron SDK 和原生 PyTorch 集成,让开发者无需更改任何模型代码即可进行训练和部署,试图以此缩小与英伟达的软件生态差距。

四款 Nova 2 模型各有侧重

亚马逊此次推出的四款 Nova 2 模型针对不同应用场景设计。Nova 2 Lite 是一款快速、经济的推理模型,专为日常工作负载设计,可处理文本、图像和视频并生成文本。在与竞争对手的基准测试对比中,该模型在 15 项测试中有 13 项表现优于或持平 Claude Haiku 4.5,在 17 项测试中有 11 项优于或持平 GPT-5 Mini。

Nova 2 Pro 是亚马逊最智能的推理模型,可处理文本、图像、视频和语音并生成文本,适用于代理编码、长期规划等高度复杂任务。该模型在与 Claude Sonnet 4.5 的 16 项基准测试中有 10 项表现更优或持平,与 GPT-5.1 的 16 项测试中有 8 项更优或持平,与 Gemini 2.5 Pro 的 19 项测试中有 15 项更优或持平。

Nova 2 Sonic 是亚马逊的语音到语音模型,统一了文本和语音理解及生成功能,支持实时、类人对话式 AI。该模型拥有 100 万个 token 的上下文窗口,支持扩展的多语言功能,并可与 Amazon Connect、Vonage、Twilio 等电话服务提供商无缝集成。

Nova 2 Omni 是业内首款统一的多模态推理和生成模型,可处理文本、图像、视频和语音输入,同时生成文本和图像。该模型可同时处理多达 75 万个单词、数小时音频、长视频和数百页文档,一次性分析整个产品目录、客户评价、品牌指南和视频库。

Nova Forge 开创"开放式训练"模式

Nova Forge 是 AWS 推出的首创服务,让企业能够构建自己的 Nova 模型定制版本——亚马逊称之为"Novellas"。该服务开创了"开放式训练"模式,为客户提供对预训练、中期训练和后训练 Nova 模型检查点的独家访问权限,使客户能够在模型训练的每个阶段将专有数据与亚马逊 Nova 策划的数据集混合。

这一服务解决了企业在将专有知识嵌入 AI 应用时面临的三大难题:定制专有模型时整合深度有限、继续训练开源权重模型时缺乏原始训练数据访问权限,或从零开始构建模型成本高昂。

除了模型检查点和数据混合能力,Nova Forge 还提供三项核心功能:使用客户自己的环境(称为强化学习"gyms")训练 AI 的能力,创建更小、更快模型的选项,以及实施安全控制的负责任 AI 工具包。

Reddit 正在使用 Nova Forge 改进内容审核系统。Reddit 首席技术官 Chris Slowe 表示:"我们正在用单一、更准确的解决方案替代多个不同的模型,使审核更加高效。用一种统一的方法替代多个专门的机器学习工作流程,标志着我们在 Reddit 上实施和扩展 AI 方式的转变。"

Booking.com、Cosine AI、Nimbus Therapeutics、野村综合研究所、OpenBabylon 和索尼等公司也在使用 Nova Forge 构建自己的模型。客户使用 Nova Forge 创建的模型可以部署在 Amazon Bedrock 上,享有与其他 Bedrock 模型相同的企业级安全性、可扩展性和数据隐私保护。

Nova Act 实现浏览器任务自动化突破

Nova Act 是 AWS 推出的新服务,用于构建和部署能在网络浏览器中执行操作的高可靠性 AI 代理。该服务由定制的 Nova 2 Lite 模型驱动,为构建和管理自动化浏览器任务的代理提供最快、最简便的路径。Nova Act 在早期客户工作流程中实现了 90% 的可靠性,并在相关基准测试中表现优于竞争模型。

Nova Act 通过强化学习训练定制的 Nova 2 Lite 模型,在数百个模拟网络环境中运行数千项任务,从而实现突破性可靠性。这种训练方式使 Nova Act 在基于用户界面的工作流程中表现出色,例如更新客户关系管理系统中的数据、测试网站功能或提交健康保险索赔。

开发人员可以在几分钟内使用无代码平台通过自然语言提示开始原型设计,然后在 VS Code 等熟悉的集成开发环境中完善代理,最后部署到 AWS。客户在本地构建和测试的内容可以在生产环境中扩展,并通过 Nova Act AWS 控制台获得全面的管理工具和监控。

亚马逊介绍,多家企业已经注意到 Nova Act 的成效。其中,初创公司 Sola Systems 集成 Nova Act 后,每月为客户自动化数十万个工作流程,涵盖对账支付、协调货运和更新医疗记录等关键业务任务。

1Password 使用 Nova Act 减少用户访问登录信息的手动步骤,只需一个简单提示即可在数百个不同网站上自动工作。Hertz 通过使用 Nova Act 自动化其租赁平台的端到端测试,将软件交付速度提高了 5 倍,消除了质量保证瓶颈,将原本需要数周的工作缩短至数小时。