Microsoft, a partner and a new opponent! Microsoft launches its first AI chip and establishes new partnerships with AMD and NVIDIA.

华尔街见闻
2023.11.15 16:10
portai
I'm PortAI, I can summarize articles.

微软推出被视为英伟达对手的首款 AI 芯片 Maia 100,以及英特尔 CPU 的竞品:基于 Arm 架构的云原生芯片 Cobalt 100。作为定制芯片的补充,微软拓展同芯片制造商的合作,将 Azure 中添加 AMD MI300X 加速虚拟机,并为英伟达 H100 打造的 NC H100 v5 虚拟机开放预览,还计划发布配备 H200 的 AI 优化虚拟机。

微软正在人工智能(AI)领域积极地 “跑马圈地”,缔结新的合作关系,同时又将在拓展 AI 掘金的工具,要和英伟达等芯片巨头分一杯羹。

美东时间 11 月 15 日周三,微软在官网宣布,与 AMD 和英伟达建立新的合作伙伴关系。AMD 将为微软客户带来新的 AI 和计算能力;英伟达在微软智能云 Azure 上为全球企业和初创公司推出生成式 AI 代工服务。

在公布和两家芯片巨头新合作的同时,微软在 Ignite 2023 技术大会上首次推出两款定制芯片,均为微软设计,为 Azure 服务。

其中Azure Maia 100是一款AI 加速器芯片,也是微软的首款 AI 芯片用于 OpenAI 模型、Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载运行云端训练和推理。它采用台积电的 5 纳米工艺制造,有 1050 亿个晶体管,比 AMD 挑战英伟达的 AI 芯片 MI300X 的 1530 亿个晶体管少约 30%。

媒体称,Maia 100 可能和英伟达的芯片正面对决,成为英伟达芯片的替代品。

微软主管 Azure 硬件系统和基础设施的副总 Rani Borkar 表示,她没有详细了解 Maia 与英伟达 H100 等替代品相比的性能如何。不过她指出,Maia 芯片支持微软首次实现亚 8 位数据类型、MX 数据类型,以便共同设计硬件和软件。这有助于微软支持更快的模型训练和推理时间。

Maia 100 的问世印证了今年稍早的微软自研 AI 芯片消息。当时媒体称,芯片是为训练大语言模型(LLM)等软件而设计,同时可支持推理,能为 ChatGPT 背后的所有 AI 软件提供动力。近几年,微软一直努力开发面向其服务器的定制芯片,为 Azure 云计算服务提供支持。

另一款Azure Cobalt 100是一款基于 Arm 架构的 128 核云原生芯片,用于处理通用的计算任务,针对通用工作负载的性能、功率和成本效益进行了优化。它是英特尔处理器的竞品。

微软同时宣布,另一基于微软数据中心集群的创新产品 Azure Boost 将正式商用。该系统可将存储和网络进程从主机服务器转迁移到专用硬件和软件上,从而提高存储和网络速度。

微软介绍,作为定制芯片的补充,公司正在拓展与芯片供应商的合作伙伴关系,为客户提供基础设施选项,包括以下分别同 AMD 和英伟达的合作:

  • 微软将在 Azure 中添加 AMD MI300X 加速虚拟机(VM)。ND MI300 VM 将采用 AMD 最新的 GPU——AMD Instinct MI300X,旨在加速 AI 工作负载的处理,以实现高范围的 AI 模型训练和生成式推理。
  • 微软为英伟达 H100 芯片打造的全新 NC H100 v5 VM 系列开放预览,将提高大中型 AI 训练和生成式推理的性能、可靠性和效率。微软还发布了ND H200 v5虚拟机系列计划,这是一款AI 优化虚拟机配备即将推出的英伟达 H200 芯片

微软主管 Azure 硬件系统和基础设施的副总 Borkar 表示,在 Cobalt 100 上运行的虚拟机实例将于 2024 年通过微软 Azure 云实现商业化。她并未透露发布 Maia 100 的时间表。

Borkar 说,微软基于客户的反馈打造用于 AI 计算的芯片。微软正在测试 Maia 100 如何满足旗下搜索引擎必应的 AI 聊天机器人 Copilot、GitHub Copilot 编码助手和 OpenAI 模型 GPT-3.5 Turbo 的需求。

在 Azure AI 方面,本次微软 Ignite 技术大会介绍,支持 16K token 提示词长度的 GPT-3.5 Turbo 模型将正式商用,GPT-4 Turbo 将于本月底在 Azure OpenAI 服务中公开预览。GPT-4 Turbo 将使客户能够扩展提示词长度,为生成式 AI 应用带来更多控制和效率。