
生成式 AI 之战,谁能破局而出?

随着腾讯的入局,国内生成式 AI 大模型赛道集齐 BAT 三大巨头,竞争日趋白热化。
4 月 14 日,腾讯云发布面向大模型训练的新一代高性能计算集群,搭载英伟达最新一代 H800 GPU,服务器互联带宽高达 3.2T,算力性能较上一代提升 3 倍,号称目前国内性能最强的大模型计算集群。
除了算力基础设施,腾讯去年 6 月发布混元大模型,微信也在去年 10 月发布 WeML 大模型。在上月底的财报电话会议上,腾讯总裁刘炽平表示,对于腾讯整个业务来说,AI 及大模型是一个增长的扩大器。
在腾讯下场之前,百度、阿里和华为等公司已经先后落子这一领域。
3 月中旬,百度推出 “文心一言”;半个多月后,华为在一场行业峰会上披露了 “盘古” 大模型的研发及落地情况;4 月 11 日,阿里大模型 “通义千问” 高调亮相,未来将接入阿里全线业务。
与此同时,360、网易、知乎、科大讯飞、昆仑万维等先后公布自己的大模型;此前淡出中心舞台的王慧文和王小川重出江湖,迅速敲定数千万美元的融资,正在四处招兵买马。
掀起新技术浪潮的 AI 大模型,已经成为科技公司必须参加的一场大考。在 AI 领域深耕多年的商汤科技,也在本月交出自己的答卷。
Part 1 入局 AI 大模型 “马拉松”
4 月 10 日,商汤公布以 “大模型 + 大算力” 推进 AGI(通用人工智能)发展的战略布局,并发布 “日日新 SenseNova” 大模型体系,涵盖自然语言处理、图片视频及 3D 内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
其中,最引人关注的是 “商量 SenseChat”,一款千亿级参数的自然语言处理大模型。在现场演示中,SenseChat 能够结合上下文语境,流畅准确地回答各类问题,还具备超长文本理解能力,可以从复杂文档中提取和概括信息,帮助开发者编程,提供个性化的健康咨询等。
此外,商汤还展示了多款基于大模型体系的生成式 AI 模型及应用:“秒画 SenseMirage” AI 内容创作社区平台可以根据文本生成图片,拥有超 10 亿参数,支持二次元、三次元等多种生成风格,最高支持 6K 分辨率,还可支持自行上传数据集进行 finetune、自训练等功能,定制训练属于自己风格的 LoRA 模型,显著降低模型的训练门槛;“如影 SenseAvatar” AI 数字人视频生成平台仅需一段 5 分钟的真人视频素材,即可生成数字人分身;“琼宇 SenseSpace” 和 “格物 SenseThings” 3D 内容生成平台能够生成大模型 3D 场景和精细 3D 物件,为搭建元宇宙虚拟空间提供高效、低成本的工具。
秒画 SenseMirage 可根据文本生成多种风格的高清图片
AI 大模型是中国科技企业的又一块兵家必争之地。随着 BAT 等互联网公司,以及商汤、科大讯飞等 AI 老兵的入局,每个人都摩拳擦掌、跃跃欲试,准备大干一场。
业内人士普遍认为,国产大模型与 GPT 至少有 2~3 年的差距。怎样尽快赶上世界先进水平,是摆在大大小小玩家面前的命题。将这一命题拆解开来,最关键的是数据、算法和算力三大要素。
三要素中,算法的研发难度相对较低,且有众多开源项目可作为参考,中国公司最容易缩短甚至抹平差距;但在数据和算力方面,想要拉近与 OpenAI 的距离要困难得多。它需要更漫长的积累沉淀,也需要企业持之以恒地拿出真金白银,投入到 AI 相关的 “硬科技” 中。
这也意味着,大模型之争不是一场停留在应用层面的百米赛跑,而是一场由综合能力定胜负的马拉松。谁能在数据和算力上建立壁垒,谁就有望率先踏入生成式 AI 的新时代,在新技术浪潮中吃到更多红利。
Part 2 数据和算力,AI 大模型两大根基
ChatGPT 之所以一鸣惊人、经受住了上亿用户不同场景下的考验,首先得益于 OpenAI 给它 “投喂” 了大量数据。
OpenAI 此前披露,为了 AI 像人类那样流畅交谈,研发人员给 GPT-3.5 提供多达 45TB 的文本语料,相当于 472 万套中国 “四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等,甚至还将代码开源平台 Github 纳入其中。
丰富而庞大的语料库,让 ChatGPT 不仅能够聊天、讲故事,还会回答专业问题、帮学生写作业、给码农写代码。在一些读写测试中,ChatGPT 展现出来的能力不亚于高中生。
与之类似,商汤语言大模型 SenseChat 也使用了大量数据进行训练,并充分考虑中文语境,能够更好地理解和处理中文文本。在发布会上,SenseChat 一问一答应对自如,甚至还能够根据《专利法》答疑解惑,结合法条和最新资讯给出合理答案。
可以看出,足够多、足够丰富的数据,是生成式 AI 大模型的根基。商汤在这方面有自己的独特优势。
商汤的 AI 技术和产品已经在众多领域得到应用,在长期实践中,商汤积累了大量真实世界的高质量视觉数据,视觉信息可以转化为更多结构化的表达,形成丰富的多模态语料库,为大模型研发奠定基础。正如商汤董事长兼 CEO 徐立所言,“商汤积累了大量视觉类信息,这类信息作为知识,输入我们的多模态网络中,会带来完全不一样的数据基础。” 不断增长的多模态数据池,让商汤从源头上建立了壁垒。
视觉大模型是商汤的核心技术突破点。早在 2019 年,商汤就发布了 10 亿参数的视觉大模型,2022 年扩大至 320 亿参数,为迄今为止全球最大的视觉模型。而在自然语言处理、多模态和生成式 AI 大模型方面,商汤也已有产品落地。这些大模型的迭代生长和融合汇聚,最终造就了商汤 SenseNova 大模型体系。
除了海量数据,大算力是大模型的另一个根基。
AI 大模型所需要的计算量,大致上相当于参数量与数据量的乘积。而大模型之所以 “大”,就是因为参数众多和数据量庞大。过去 5 年,AI 大模型的参数量几乎每年提升一个数量级,例如 GPT-4 参数量是 GPT-3 的 16 倍,达到 1.6 万亿个;而随着图像、音视频等多模态数据的引入,大模型的数据量也在飞速膨胀。
这意味着,想要玩转大模型,必须拥有大算力。OpenAI 在生成式 AI 赛道上一骑绝尘,关键能力之一就是空前强大的算力底座。仅仅是为了跑出 GPT-3.5 模型,OpenAI 就使用了约 1 万颗英伟达 GPU 来训练。
商汤很早就开始建设自己的算力底座。2018 年前后,商汤就着手筹备大模型所需的算力、算法、数据等方面的工作;2022 年 1 月,造价数十亿元的商汤人工智能计算中心(AIDC)交付使用,初始峰值算力达到 3740 Petaflops,已具备完整训练万亿参数规模的大模型的能力。再加上数据层和模型层,商汤 AI 大装置逐渐成型。
如今,商汤的 AI 大装置 SenseCore,依靠 2.7 万块 GPU,其算力达到 5000 Petaflops,可支持 20 个千亿参数超大模型同时训练,并提供涵盖数据、训练工具、推理部署、性能优化一条龙的大模型基础设施服务体系。
不过,AI 大装置的效能如何,总算力并不是唯一指标。在日常应用中,AI 大装置需要尽可能提高多卡并行状态下的算力利用率,尽可能保持长时间稳定运行。目前,SenseCore 支持最大 4000 卡并行单任务训练,实现了多卡并行状态下的高算力利用率,还能持续 7 天以上不间断稳定训练。
此外,SenseCore 提供了模块化、全链条的数据、训练及推理能力,可实现百亿级数据管理及检索、人工标注服务,一键量化、一键部署、一键应用,实现大模型快速上线验证。
自研自建的算力底座,为商汤在大模型领域施展手脚提供了舞台。
像 SenseCore 这样的 AI 大装置,其价值不仅体现在对于商汤现有大模型的支撑上,更指向未来发展。在源源不断的数据浇灌下,AI 大装置能够以更高效、更经济的方式批量训练大模型,并缩短从研发到部署再到应用的链条,成为商汤大模型体系应用落地的推力引擎。
Part 3 政策指引行业发展,AI 大模型加速落地
目前,生成式 AI 大模型已经成为全球各国的关注焦点。作为下一代互联网的关键基础设施,中国科技行业正在积极自主研发大模型,而配套的监管政策也已在路上。
近日,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》。征求意见稿指出,国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源。
同时,征求意见稿对于生成式 AI 产品及服务的提供者做出多项明确要求,包括遵守法律法规的要求,尊重社会公德、公序良俗等,为其发展路径指明方向、划定红线。
上述文件有望成为国内生成式 AI 产业的首份监管文件。它在释放鼓励发展的积极信号的同时,也设置了一系列监管规则,目标是促进生成式 AI 的健康发展和规范应用。
各领域企业正在积极拥抱生成式 AI,利用新技术实现降本增效,并把 AI 能力输出给第三方企业,勾勒出充满想象空间的商业化图景。
以阿里为例,除了通义千问接入阿里的所有产品外,阿里云的 AI 能力和算力也已经在多个企业和机构落地,包括 OPPO、南方电网、复旦大学等。此外,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
商汤最新发布的日日新 SenseNova 大模型体系,同样应用于诸多行业和场景,目前已落地 20 多个业务场景。
比如,智能汽车是商汤长期布局的赛道。2022 年,商汤智能汽车板块量产交付数超 50 万辆,新增定点数超 800 万辆,覆盖 30 多家车企的 80 多款车型。如今,随着 SenseNova 大模型体系的推出,商汤正通过 AI 大模型进一步赋能自动驾驶和智能车舱的产品研发。
在本周的上海车展上,商汤展示了与 SenseNova 深入融合的绝影未来展示舱。在展示舱内,商量 SenseChat 可以与用户交流、推荐个性化内容,甚至自动提炼邮件信息,帮助节省阅读时间,如果是儿童上车后还会自动推荐进入儿童模式;而秒画 SenseMirage 能够为用户自动生成各种风格的照片,为出行增添乐趣。
商汤绝影未来展示舱
借助大模型能力,商汤实现了 BEV 环视感知在国内首批量产落地,还首创自动驾驶 GOP 感知体系。此外,商汤绝影通过大模型进行自动化数据标注和产品检测,搭建的完整数据闭环体系,将模型迭代效率提升数百倍,目前已获得知名车企的定点。
此外,在生物制药领域,商汤与企业合作,利用 AI 大装置为蛋白质结构大模型提供 AI 推理算力,并为蛋白质相互作用模型,提供研发平台及训练算力,使得抗体筛选效率提升 60%。
商汤以 AI 赋能实体经济的能力矩阵进一步扩充。SenseNova 一方面服务商汤自身业务,另一方面,向政企客户开放了多种 API(应用程序接口)。客户可根据自身需求调用 SenseNova 的各项 AI 技术能力,比如文本生成、图片生成、视觉感知、标注服务等,从而低门槛、低成本、高效率地实现各类 AI 应用。
基于商汤大装置和 SenseNova 大模型体系,商汤面向行业提供 “大模型即服务(Model-as-a-Service)”,涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多项能力。
可以说,商汤已经实现了 “技术 - 产品 - 应用” 的商业化内外双循环。长期重注 AI 的商汤,正站在新一波技术革新的潮头之上继续前行。
The copyright of this article belongs to the original author/organization.
The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.

