Hyper Racetrack | Meta Platforms' Self-developed Inference Chip: Deployment to be Completed This Year

华尔街见闻
2024.02.03 12:43
portai
I'm PortAI, I can summarize articles.

作者:周源/华尔街见闻

在 Meta 创下美股史上单日最高涨幅纪录的同时,该公司一份内部文件曝光:Meta 计划今年在该公司的数据中心部署新版自研定制芯片(ASIC),以支持其 AI 业务的进一步发展。

在过去的 2023 年,这家公司在推动 AI 和元宇宙的愿景方面,“取得了很大进展”,Meta 首席执行官马克·扎克伯格(Mark Zuckerberg)在其财报会议上说。

Meta 发言人证实了这项计划并称,其自研芯片将与 Meta 购买的现成的英伟达 GPU 协同以增强 AI 算力,共同夯实该公司的 AI 基础设施能力。

这位发言人表示,Meta 自研芯片将在 2024 年投产,以此降低 AI 加速卡采购成本,减少对英伟达的依赖。

公开信息显示,Meta 的这款 ASIC 在内部被称为 “Artemis”,主要性能集中在推理领域,技术开发基于 2023 年宣布的第二代内部芯片产品线。

北美时间 2 月 1 日,Meta 公布了截至 2023 年 12 月 31 日的 2023 财年第四财季业绩:各项财务数据大幅超出此前市场预期;同时,Meta 对今年一季度的经营业绩也做出了超出预期的乐观预估,故而 Meta 股价在 2 月 2 日(北京时间)录得美股史上最大单日涨幅纪录。

自研推理 ASIC 以降低成本

从 2022 年 12 月 22 日 OpenAI 发布 ChatGPT-3.5 以来,推进 GenAI(生成式人工智能:Genetic Artificial Intelligence)技术应用所需的 AI 芯片成本、基础设施能力和能耗,成为科技公司资金的 “虹吸器”,在一定程度上抵消了围绕这项技术的显性或隐性收益。

故而,包括微软、亚马孙和谷歌,英特尔、AMD 和高通等等在内的美国科技巨头,无不加入自研 AI 芯片的大军,Meta 也是其中的一员。

英伟达 H100 的价格已经飙升至 2.5 万-3 万美元,这意味着 ChatGPT 单次查询的成本将提高至约 0.04 美元。即使只维持 ChatGPT 的基本运作,每年也需要约 160 亿美元成本。

Meta 的 “Artemis” 芯片和其前代产品一样,也只能执行 “推理” 负载工作,模型被要求使用它们的算法做出排名判断,并对用户提示做出回应。这家曾于 2023 年分享其首代 Meta 训练和推理加速器(MTIA)项目的相关细节,但此后这个项目再未有新进展披露。

Meta 公司发言人在一份声明中表示,“我们认为内部开发的 AI 加速器与商用 GPU 具有高度互补性,可以在 Meta 特定工作负载上提供性能和效率的最佳组合。”

据马克·扎克伯格在今年 1 月发布的视频信息,Meta 计划在 2024 年底前拥有大约 35 万颗来自英伟达的旗舰 AI 芯片 H100,这是英伟达研发的当前全球最受欢迎的用于人工智能工作负载的服务器 GPU。扎克伯格强调,与自研版全新 AI 芯片和其他潜在供应商的 AI 芯片累加,Meta 将累积等效于 60 万颗 H100 AI GPU 的算力。

在视频中,扎克伯格透露了 Meta 人工智能计划的更新路线图:Meta 将围绕即将推出的 Llama 3 构建全新的 Meta AI 路线图,目前正在推进 Llama 3 的 AI 训练。Llama 3 将与 Google 最近发布的 Gemini 模型和 OpenAI 的 GPT-4、以及即将推出的 GPT-5 模型竞争。

关于 Llama 3 的最早传闻出现在 2023 年 8 月,但 Meta 从未正面承认这项全新的 GenAI 产品的技术迭代,直到今年 1 月扎克伯格发布的这则视频。

到了今年 1 月 30 日,扎克伯格在一条推特中直接提到了 Llama 3。行业认为 Meta 透露 2024 年部署自研的 “Artemis” AI 推理芯片与 Llama 3 有关。

扎克伯格暗示,Llama 3 很可能是 Meta 的第一个支持多媒体和语音输入的多模式模型。Llama 2 则只是一个聊天机器人,用户只能在其中提出问题并编写故事。

目前,Meta 仍未正面透露 Llama 3 的发布时间,或许这与 Artemis 何时真正能部署在该公司的数据中心有关。

公开消息显示,Meta 正在加速建设数据中心(IDC),以专注于 GPU 计算。Meta 更新其 IDC 的最新努力主要集中在构建拥有数千个加速器的大型集群;IDC 的核心网络以网格形式组织,加速器之间的带宽为每秒 1 TB。Meta 在全球拥有 21 个数据中心。

但很显然,这还不够。要实现扎克伯格的最终目标,还需要更多的 GPU。

“很明显,下一代服务需要构建全面的通用智能、构建最好的 AI 助手、为企业创造者以及更多要在 AI 各个领域取得进步——从推理到规划到编码到记忆和其他认知能力。” 扎克伯格说,“人们还需要新的人工智能设备,这将 AI 和元宇宙结合在一起,因为随着时间的推移,我认为我们很多人会在一天中频繁地与 AI 交谈。”

VR/AR 部门单击营收创纪录

Meta 引人注目的最新表现,是在 2 月 1 日。

这一天,Meta 公布了截至 2023 年 12 月 31 日的 2023 财年第四财季业绩。

财报显示,Meta 在 2023 年第四季度实现营收 401.1 亿美元,较去年同期增长 25%,高于分析师预期的 390.1 亿美元,这也是 Meta 自 2021 年三季度以来最大的营收增幅;净利润同比增长 201% 至 140.17 亿美元,高于市场预期的 128.90 亿美元;摊薄后每股收益同比增长 203% 至 5.33 美元,高于市场预期的 4.95 美元。

2023 年全年,Meta 实现营收 1349.02 亿美元,同比增长 16%;净利润同比增长 69% 至 390.98 亿美元。

不仅如此,Meta 预计在今年一季度,公司营收将达到 345 亿美元至 370 亿美元之间,高于分析师预期的 336.4 亿美元。

比这更夺人眼球的是 Meta 宣布增加 500 亿美元股票回购,将在今年三月进行公司史上首次发放股息红利,包括 A 类普通股和 B 类普通股,每股派发 0.50 美元现金。

受多项利好消息刺激,2 月 1 日盘中,Meta 市值增加了约 2000 亿美元,为美股历史上首次。

至收盘,Meta 录得 20.32% 的巨大涨幅,超越苹果和亚马逊此前创出的最佳单日表现纪录。苹果市值曾在 2022 年 11 月 10 日增加 1909 亿美元,亚马逊于同年 2 月 4 日增加 1908 亿美元市值,英伟达市值在 2023 年 5 月 25 日增加了 1841 亿美元。

值得一提的是 Meta 的 VR/AR 部门 Reality Labs,负责 Quest 头显、Ray-Ban 智能眼镜、Horizon 平台以及 AR 眼镜及其神经腕带输入设备的研发。

据 Meta 最新财报显示,Reality Labs 的季度收入为 10.7 亿美元,也创出了一项新纪录。Meta 首席财务官 Susan Li 称,这一创纪录的收入 “由 Quest 3 在假期期间的销售推动”。Quest 3 于 2023 年 10 月 10 日推出,Meta 第四季度营收包含 10 月、11 月和 12 月。

苹果在今年 1 月 19 日开始预订 Vision Pro,至 2 月 1 日,据称已售出超过 20 万台(3499 美元/台,据 2 月 2 日美国苹果门店的用户称,当日有人接受每台 2000 美元的加价),这给苹果带来了约 7 亿美元的收入。

Meta 财报显示,由于 2023 年第四季度 Reality Labs 的成本达到有史以来最高的 57.2 亿美元,故而导致该部门季度亏损了 46.5 亿美元。

但市场对此显得很宽容,认为像 Quest 这样的 XR 头显仍然是一项相对早期的技术,远未成熟,因此将这项亏损认为是早期投资的必须。目前,Meta 还没推出 AR 眼镜,但 Reality Labs 超过 50% 的支出都集中在 AR 眼镜的研发上。

据 Valve 公布的 2024 年 1 月 Steam 平台的 VR 设备使用数据显示,1 月 VR 头显使用量增加 0.4%。其中,占比排名第一的是 Quest 2,1 月使用份额为 40.64%;Valve Index HMD 排名第二,使用份额为 15%;Quest 3 排第三,占整体使用份额的 14.05%。