Apple M4 initiates AI PC battle: Will TOPS become the future benchmark for switching devices?

华尔街见闻
2024.05.09 09:45
portai
I'm PortAI, I can summarize articles.

美银美银指出,TOPS 是指每秒万亿次运算,数值越大表明处理器在处理 AI 任务时的越快,类似于 2nm 和 3nm 衡量芯片性能,TOPS 将用来对比苹果及其 PC 竞争对手设备 “AI 性能”。

本文作者:赵颖

本文来源:硬 AI

苹果本周发布史上最贵 iPad Pro,将最强 M4 芯片首发在 iPad 上,拉开 AI PC 大战的帷幕。

美银美林在周三的报告中介绍称,苹果 M4 芯片使用 Arm 架构,是一款片上系统 (SoC),拥有超过 280 亿个晶体管,基于台积电的第二代 3nm 工艺,配备 10 核 CPU 和 10 核 GPU。

美银美林指出,值得一提的是,M4 包含一个 16 核神经处理单元(NPU),SoC 中专门用于加速 AI 任务的部分,其性能以每秒万亿次运算(TOPS)来衡量,M4 的 NPU 性能为 38 TOPS(假设为 INT8 精度),比 M2 芯片快了整整一倍,比 A11 仿生芯片强了近 60 倍。

美银美林表示:

尽管 AI PC 市场还处于初期阶段,但我们预计 TOPS 指标将是一个不完美但简单的方式(类似于 3nm/2nm),用于对比苹果及其 PC 竞争对手的 “AI 性能”。

美银美林还预计,消费者对 AI 功能的 PC/平板的需求将增长:

到 2027 年,AI PC 可能从目前的 5000 万台增长到 1.67 亿台,苹果 PC 及其竞争对手将在 AI PC 方面发力,关注微软的 Windows/Surface AI 活动(5 月 20 日)和台北 Computex(6 月 2 日及以后)活动。

TOPS 引领 AI PC 之战

美银美林指出:

苹果 M4 的 TOPS 性能为 38,媒体报道称,微软将把 AI PC 的 “最低规格” 设为 40 TOPS,目前还没有 PC 能够达到这一标准,尽管有多个即将推出的选项可能提供 45 TOPS。

英特尔的 Meteor Lake(首款 “AI PC” 品牌 “Core Ultra”)中的 NPU 支持 11 TOPS,但它承诺今年用 Lunar Lake 达到 45 TOPS。

高通也计划在不久的将来推出一款 45-TOPS 的 Snapdragon Elite X CPU。

但根据英伟达的说法,大约 45 TOPS 的 PC 只能执行非常基本的 AI 任务,而更高性能的 AI 任务则需要 PC 中有一个专用的 GPU,有超过 1 亿个 RTX GPU(100-1300+ TOPS)的部署基础,尽管需要 2 到 5 倍的电力。

内存和 NPU 市场将受益

同时,美银美林指出,内存是被低估的受益者:

更大的 AI 模型意味着需要更多的处理能力,更大尺寸、更快带宽和更高能效,更高平均售价 ASP 的内存规格,内存将成为端侧 AI 升级的独特受益者。

根据 Anandtech 的说法,苹果的新 M4 拥有更快的 LPDDR5X 内存,可能比传统 LPDDR 快 1.2 倍(120 GB/s)并且能效更好。

此外,NPUs 对于端侧 AI 也是必要的,美银美林表示:

随着 AI(如微软的 Copilot)向端侧/设备上(PC、手机、平板电脑)转移,它需要除了 CPU、GPU 之外的额外专用芯片 NPU。

NPU 的 AI 推理性能潜力以 TOPS 来衡量,可以将 NPU 视为数据中心中使用的 GPU/ASIC 加速器的较小规模版本。NPU 虽然规模较小,但具有类似的处理能力,能够在一定的频率和精度下处理 MAC 操作,这种处理涉及在速度和准确性之间做出权衡。

根据高通的说法,高精度的 AI 模型使用 32 位或 16 位浮点数来确保准确性,而低精度、高速度的模型使用 8 位或 4 位整数精度。目前,行业标准通常采用 8 位或 INT8 精度,这在保持可接受精度的同时,提高了处理速度。