GPT-5 被 5 万张 H100 卡脖子!Altman 急筹数十亿美元,欲取代英伟达建起 AI 芯片帝国

Wallstreetcn
2024.01.22 07:05
portai
I'm PortAI, I can summarize articles.

最近,OpenAI 的 GPT-5 训练需要大量的芯片资源,为了不让英伟达垄断市场,Sam Altman 计划筹集数十亿美元,建立全球性的半导体晶圆厂网络。Altman 希望未来几年内建成一个自给自足的半导体供应链帝国,以满足 AI 技术的广泛应用需求。他正在与中东投资者和台积电谈判合作关系,以训练和运行 AI 模型的芯片。Altman 认为算力和能源将成为未来世界的两大货币。

Sam Altman 正在筹集数十亿美元,建立一个全球性的半导体晶圆厂网络!

这一事件背后的原因很可能就是,OpenAI 已经无「芯」训练「GPT-5」了。

此前,据英国《金融时报》报道,OpenAI 正在开发一种新的 AI 模型,该模型将是 GPT-4 的「重大升级」,预计将于今年晚些时候发布。

训练 GPT-4,用了大约 25000 块 A100 GPU 。而训练 GPT-5,还需要 5 万张 H100。如今,英伟达的 H100 售价为 2.5 万至 3 万美元。

英伟达的 AI 芯片,基本垄断了市场,这一命脉怎能掌握在他人手中?

果然,最近外媒接连曝出,Sam Altman 正在和中东投资者以及台积电谈判,展开合作关系,以训练和运行 AI 模型的芯片。

算力货币决定着 OpenAI 的前途,绝不能把握在英伟达手里!Altman 这次,是下定决心了。

训 GPT-5,OpenAI 对芯片的需求只会越来越大

Altman 的野心是,随着 AI 技术的广泛应用,在未来几年建成一个自给自足的半导体供应链帝国。

所以,OpenAI 也有意跟英特尔、台积电和三星等行业巨头竞争了?

Altman 在达沃斯经济论坛上表示,今后世界的两大货币,就是算力和能源

比起亚马逊、谷歌、微软等大厂,Sam Altman 显然有更宏大的计划:建立一个 AI 芯片工厂网络。

Altman 应该是很确信,现在的台积电、三星、英特尔之类的代工厂,未来几年内肯定无法满足对 AI 芯片的需求。

现在,Altman 正在筹集数十亿美元,目标就是建立一个遍布全球的 AI 芯片工厂网络。

现在,他正在和多家潜在的大型投资者进行谈判,包括总部设在阿布扎比的 G42 和软银集团。

显然,在 AGI 时代,芯片会供不应求。Altman 现在十分担心,随着 AI 技术的日益普及,现有的芯片供应将无法满足大规模部署的需求。

目前生产的 AI 芯片,远远落后于预期的需求。只有立刻行动,才能确保十年内能有充足的芯片供应。

然而,建立一个全球性的芯片工厂网络需要庞大的投资,并且耗时多年。

而且,与行业中其他公司不同的是,建设和维护半导体工厂的成本要高得多。一个先进工厂的建设成本,可能高达数百亿美元。

亚马逊、谷歌、微软都倾向于设计自家的定制芯片,将制造外包,这也是因为建造和维护半导体的晶圆厂的成本,实在太高了!

毕竟,建造一家最先进的晶圆厂可能需要数百亿美元的投资,而建立这样的设施网络可能需要数年时间。

根据彭博社的报道,仅在 OpenAI 与 G42 的谈判中,涉及金额就接近 80 亿到 100 亿美元。

OpenAI 新金主:中东土豪

OpenAI 的前任金主是微软。而现在为了筹资,Altman 联系上了中东土豪们,比如阿联酋的一些投资者。

其中一位,就是阿布扎比最富有、最有影响力的人物之一——谢赫·塔赫努恩。

谢赫·塔赫努恩是阿联酋最有权势的人之一,是总统谢赫·穆罕默德的兄弟,还是阿联酋的国家安全顾问。

他还负责监督迅速扩张的商业帝国,并担任阿布扎比若干最强国家投资基金的主席。其中包括 8000 亿美元的阿布扎比投资局和另一家国有投资实体 ADQ。

另外,他还担任国际控股公司和 G42 的主席。前者是一家庞大的企业集团,已迅速成为阿联酋最大的上市公司;而 G42 是一家雄心勃勃的 AI 公司,已经和微软、OpenAI 建立起了合作伙伴关系。

目前还不清楚 Altman 具体的筹款金额,但要与市值接近 1.5 万亿美元的英伟达竞争,保守来说至少会花费数十亿美元。

G42 集团 CEO Peng Xiao 和 Sam Altman 签订协议

别的不说,Sam Altman 的社交手腕,是真的达到了人类天花板级别。

建厂要花费的,是天文数字

咱们来盘一盘,要建起一座晶圆厂,Sam Altman 究竟需要花多少钱。

开发 2nm 或 3nm 工艺技术的成本,高达数十亿美元,并且随着工艺节点的缩小,这一成本还在上升。

同时,一个能够大规模生产 3nm 或 2nm 芯片的现代晶圆厂,如今成本可达 300 亿美元。

并且,晶圆厂的成本还在迅速上升,比如一台低数值孔径(Low-NA)极紫外(EUV)光刻设备的价格,约为 2 亿美元,而高数值孔径(High-NA)的光刻机,预计售价在 3 亿至 4 亿美元之间。

一个领先的晶圆厂要想生产最先进的 AI 和高性能计算(HPC)芯片,这种设备怎么也得备上若干台。

AI 浪潮中,英伟达坐收渔翁之利

现在,谷歌、亚马逊、Meta、OpenAI 和微软,都在使用英伟达的 GPU 来训练 AI、向客户部署模型。仅 Meta 一家,就计划在年底前为服务器安装 340,000 块 H100。

可以说,英伟达垄断了目前的 AI 算力市场,并且手持定价权,这就导致其收入飞速增长。

像 Graphcore 这样的芯片初创公司,已经很难与英伟达的主导地位竞争了,这是由软件和硬件之间的相互作用造成的。仅仅制造一个更快的芯片,已经远远不够的,何况这本身就相当困难。

显然,各大科技公司都很早就开始布局了。

亚马逊、谷歌和微软这样的大科技公司是这么做的——设计自己的定制半导体产品,将生产过程外包给其他公司。

现在,各家都到了收获的季节。去年 11 月底,微软就推出了首款 AI 芯片,同时,微软也在和 AMD 加紧合作;23 年春季之前,Meta 也推出了自家芯片;谷歌和亚马逊,则分别研发 TPU 和 Trainium 芯片多年。

微软的最新 Azure Maia 100 芯片

OpenAI 曾怒甩 5100 万刀狂买 AI 芯片

去年 12 月,Altman 就被曝出正在进行「芯片交易」,而这也疑似成为 OpenAI 宫斗的导火索。

当时有外媒曝出,OpenAI 在 2019 与 AI 芯片初创公司 Rain AI 签订了一份价值 5100 万美元的意向书,会在 Rain AI 的芯片上市后购买芯片。

Rain AI 正在研发一种「类脑」NPU 芯片,能大幅降低 AI 算力的成本,预计将在 12 月流片,并于 2024 年 10 月开始供货。

而且值得注意的是,Sam Altman 作为 Rain AI 的股东,本人也亲自斥资,投入了 100 万美元。

根据一位不愿意公开身份的人士透露,Sam Altman 之前被 OpenAI 前董事会解雇,部分原因就是他的其他投资与 OpenAI 纠葛的关系。

据悉,Altman 曾为了这个代号为 Tigris 的项目在中东筹集资金

RainAI 开发的神经形态处理单元(NPU),能模仿人类大脑的功能,有希望提供比当今的 GPU 更高的处理能力和能源效率。

这个 NPU「类脑」芯片,号称比 GPU 高出 100 倍的计算能力,而在训练方面的能效,甚至比 GPU 高出 10000 倍。

Rain 的目标是提供一种芯片,既能用于模型和算法的训练,又能用于之后的推理运行。

根据 Rain 的说法,这种芯片将允许 AI 模型根据周围环境实时定制或微调。

——从这个角度来看,它并不是当下英伟达 H100 之类 GPU 的直接竞品。

相关人士表示,这些功能对 OpenAI 来说是一个强大的吸引力,OpenAI 希望利用这些芯片来降低数据中心的成本,并将自己的模型部署在手机和手表等设备中。

如果能够开发成功,OpenAI 自然不会再受制于英伟达。

其实,Altman 的布局很早。

早在 2018 年,他就领导了 Rain 的种子轮融资,一年后,OpenAI 通过了这份价值 5100 万美元的芯片购买意向书。

当然,Altman 的计划也不是一帆风顺的。

此前 Rain 的领导层曾改组,公司的投资者也发生了变化。一个负责监管国家安全风险投资的跨部门政府机构,要求沙特阿拉伯附属基金 Prosperity7 Ventures 出售其 Rain 的股份,之后,硅谷的 Grep VC 收购了这些股份。

——这一切变动,可能会增加 Rain 将新型芯片技术推向市场的难度,也使 OpenAI 的 5100 万美元订单的兑现日期,变得不太清晰。

总的来说,与 Rain 的这项交易也显示,OpenAI 愿意花费大量资金,来确保自己的 AI 项目所需的芯片供应。

现在,从 Rain AI 购买的价值 5100 万美元的 AI 芯片,只是 OpenAI 在 AI 芯片上巨额投入的一小部分而已。

OpenAI 的野心,正在悄悄部署

年前,OpenAI 就任命了前谷歌 TPU 的负责人为硬件主管,并且正在招聘「数据中心设施设计专家」。

消息称,由芯片工程师 Richard Ho 领导生成式 AI 创业公司的新部门,帮助优化合作伙伴的数据中心网络、机架和架构。

「他在 TPU 的创建中也发挥了重要作用。也曾在 DE Shaw 工作并设计过 ASIC。到目前为止,他更多地负责软件硬件集成、DC 设计和加速器芯片选择。但 OpenAI 最近也聘请了不少编译器和内核方面的专家。」

另外,Altman 还曾与包括芯片设计公司 Arm 在内的半导体高管进行过讨论,商讨如何尽早设计出新的芯片,为 OpenAI 降低成本。

OpenAI 的 GPU 短缺有多严重?Altman:都先别用 ChatGPT 了

去年一整年,Sam Altman 都在抱怨 OpenAI 已经陷入了严重的 GPU 短缺。

生成式 AI 爆发仍旧没有放缓,对算力提出了更高的要求。很多公司都在用英伟达性能极高的 H100 来训练模型,但 H100 非常昂贵。

马斯克就表示,GPU 如今比 drug 还紧俏。

Sam Altman 表示,OpenAI 已经严重受到 GPU 限制,不得不推迟了众多短期计划(微调、专用容量、32k 上下文窗口、多模态)。

甚至,因为 GPU 的短缺,Altman 都不希望有很多人使用 ChatGPT。

我们的 GPU 非常短缺,使用我们产品的人越少越好。

如果人们用的越少,我们会很开心,因为我们没有足够的 GPU。

OpenAI 许多用户都在抱怨 API 的可靠性和速度,对此 Sam Altman 解释道,原因也是在于 GPU 太缺了。

训练 GPT-5,需要 5 万块 H100,但此前曾有报道称,英伟达最好的芯片 H100,将在 2024 年之前就会售罄。

如果市场上 GPU 跟不上,将会阻碍 OpenAI 提升和训练新模型的能力。

如今到处奔走的 Altman,能为建立晶圆厂筹到数十亿甚至数千亿美元的资金吗?能维持厂子的运营吗?

目前我们只知道,他的举动有可能改变整个代工市场的格局。

参考资料:

https://www.tomshardware.com/tech-industry/artificial-intelligence/openais-sam-altman-raises-billions-to-build-chip-empire-report

https://the-decoder.com/gpt-4-successor-reportedly-a-major-upgrade-openais-altman-in-talks-with-tsmc-for-ai-chips/

https://www.ft.com/content/1cdaadc3-b384-4f50-88ff-291c062c8376

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。