AI 算力短缺,边缘计算或被寄予厚望,华为高通已布局
华为、高通已开始探索在手机——这个当前最重要的终端上部署 AI 模型的方式,而国内各家物联网模组厂商已经在此方向推出产品,有望在边缘 AI 领域获得市场地位。
近日,ChatGPT 又又又 “崩” 了。
4 月 5 日,ChatGPT 官网一度停止 Plus 付费项目的购买,OpenAI 表示 “因需求量太大暂停了升级服务”。就在前两日,ChatGPT 刚刚 “封杀” 了不少亚洲账号。此外,早些时候 GPT4 也频频下调提问限制次数。
国盛证券表示,这是由于 ChatGPT 背后的算力资源出现明显缺口,导致 OpenAI 不得不暂时踩下用户增长的 “刹车”。事实上,算力、芯片、服务器等 AI 产业链公司一直是近期 A 股最活跃的方向。
而除了这些方向外,多家券商近期也提及边缘计算爆发的潜力。
“边缘计算”为有效算力补充
国盛证券表示,由于算力爆发下产生的海量数据传输需求,完全依靠 IDC 提供中心化算力支撑乃是效率较低的选择,在此背景下,边缘计算便成为了传统云端算力的很好补充。
资料显示,边缘计算是在靠近物或者数据源头得到网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷联接,实时业务、数据优化、应用智能、安全与隐私保护封方面的关键需求。
其指出,边缘计算具有低延迟、高安全性的优势,有望分担推理计算的压力,符合对 AI 安全性的要求,同时边缘设备也利于 AIGC 产品的市场下沉,迎接更多用户。
AI 巨头大动作不断
首先是,全球首个 AI 模型在手机终端运行部署。
3 月 2 日,高通中国发布全球首个运行在 Android 手机上的 Stable Diffusion 终端侧演示,将 AI 绘图功能推向边缘端。Stable Diffusion 能够在智能手机上运行,在 15 秒内执行 20 步推理,生成一张 512x512 像素的图像。这是在智能手机上最快的推理速度,能媲美云端时延,且用户文本输入完全不受限制。
资料显示,Stable Diffusion 是一个非常出色的从文本到图像的生成式 AI 模型,能够基于任何文本输入,在数十秒内创作出逼真图像。Stable Diffusion 的参数超过 10 亿,此前主要限于在云端运行。
天风证券表示,随着 AI 云端大模型开始转向在边缘终端上运行,高通打造智能网联边缘的愿景正在加速实现,尽管 Stable Diffusion 模型看起来过于庞大,但它编码了大量语言和视觉相关知识,几乎可以生成任何能想象到的图片。
其认为,在智能手机上运行 Stable Diffusion 只是开始,让这一目标得以实现的所有全栈研究和优化都将融入高通 AI 软件栈。凭借高通的统一技术路线图,高通 AI Research 能够利用单一 AI 软件栈并进行扩展,以适用于不同的终端和不同的模型。
除高通外,华为也有大动作,据上海证券报,3 月 23 日举行的华为春季旗舰新品发布会上,华为带来智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,实现了自然语言手机图库搜索体验。
中信证券指出,华为、高通均推出边缘 AI 产品,有望推动AI大模型在边缘端落地,并验证了通过模型压缩 + 联网智能实现高性能边缘 AI 的可能性。
其表示,在华为与高通的示范效应下,我国智能物联网模组相关企业有望获得发展。小模型 + 联网智能是当前一类主流方案,国内各家物联网模组厂商已经在此方向推出产品,有望在边缘 AI 领域获得市场地位。
比如移远通信、广和通、美格智能均有带有 15TOPS 以上 AI 算力的无线物联网模组,中科创达则有望直接受益于高通智能物联网业务发展。
存算一体助力解决行业两大痛点
据中信证券研报,AI 大模型对算力以及功耗的高要求导致其往往只能运行在云端,而对于边缘端场景则难以实际应用。在此情况下,如果能降低 AI 算力需求和功耗需求,则有助于 AI 进入边缘端市场,打开广阔的市场空间。
其指出,算力需求方面,主要靠压缩模型规模降低算力需求,或采用联网方式降低本地算力需求;而功耗方面则可以从硬件入手,采用存算一体的方式,打破功耗瓶颈。具体来看
其一,通过大模型压缩,解决边缘AI算力不足问题。
其指出,以 GPT 为代表的以 Transformer 架构为基础的生成式预训练大模型通常具备较多的参数,所以推理部署上,尤其是边端智能,模型需要通过剪枝、蒸馏、量化等方法进行压缩。
其二,存算一体,解决边缘AI功耗问题。
其表示,功耗问题是边缘 AI 发展的一大约束条件,根据智芯科微电子等公司统计,90% 以上能量消耗来自数据搬运。为解决功耗问题,存算一体方案应运而生,存算一体免去了频繁的数据读写,直接在存储单元内完成数据计算,理论上能够有 2-3 个数量级的能效提升。
华西证券也指出,在大模型兴起的背景下,存算一体适用于从云至端各类计算:
端测方面,人工智能更在意及时响应,即 “输入” 即 “输出”,目前存算一体已经可以完成高精度计算。
云端方面,随着大模型的横空出世,参数方面已经达到上亿级别,存算一体有望成为新一代算力因素;存算一体适用于人工智能各个场景,如穿戴设备、移动终端、智能驾驶、数据中心等。
华西证券表示,存算一体为下一代技术趋势并有望广泛应用于人工智能神经网络相关应用、感存算一体,多模态的人工智能计算、类脑计算等场景。
算力网络建设有望奔向太空
天风证券认为,商业卫星通信网络基础初步建立进入加速建设阶段 + 以 ChatGPT 为代表的新兴 AI 应用带动算力需求高增长 + 算力资源成为科技竞赛战略性资源,太空数据中心建设有望迎来从0到1突破的黄金机遇期。
资料显示,太空数据中心是指在太空中运行的数据中心,可提供数据存储、处理和传输等服务,天风证券指出,太空数据中心建设有助于:1)降低数据中心能耗(利用太阳能&空间低温环境);2)提高太空数据的利用效率和传输速率,减少卫星和地面间传输的数据容量;3)提高低轨卫星全生命周期经济效益产出(信息的传输➡信息的处理&存储)。
其指出,目前科技巨头(SpaceX,Amazon,NTT 等)&太空初创公司(LeoCloud、Ramon.Space、OrbitsEdge、Cloud Constellation 等)积极加码空间算力网络建设有望带动太空数据中心建设加速。
市场空间方面,其表示太空数据中心对应市场空间包括硬件/基础设施建设 + 太空数据中心云服务市场,硬件先行,服务有望打开长期成长空间,预计 2027 年太空数据中心对应的硬件设备市场空间为 366.3 亿美元,NSR 预计 2021-2031 年卫星云服务能够累计创造 310 亿美元收入。