LB Select
2023.02.13 07:35
I'm PortAI, I can summarize articles.

跳上 ChatGPT 快车,抖音上市的最后一跃?

无论是为了中短期的上市,还是长期的互联网技术代际竞争,抖音都需要自己的 ChatGPT:从机器推荐向机器人推荐跃升,除了业务层面的价值外,也是在战略层面上抵御人工智能对于机器算法的降维打击。

本文来源:字母榜

上市之门展现出重启的征兆,而抖音的现有业务却已经耗尽了想象力。幸运的是,迎面驶来的时代快车 ChatGPT 上,装载的全是故事。

2 月 9 日,有媒体爆料称,抖音旗下的人工智能实验室(AI Lab)正在开展类似 ChatGPT 和 AIGC(人工智能生成内容)的研发,未来将为 VR(虚拟现实)部门 PICO 提供技术支持。

PICO 相关负责人随后回应称,相关传言不实,PICO 目前没有采用类似 ChatGPT 技术的产品规划。

ChatGPT 是一个由美国人工智能科技公司 OpenAI 推出的大型语言预训练模型,去年 11 月底上线。凭借看似无所不知、无所不能的 AI 聊天能力,ChatGPT 短短三个月就吸引了超 1 亿活跃用户,也促使科技公司争先恐后扎身同一条赛道。

在美国,长期押注 OpenAI 的微软成为 ChatGPT 全球浪潮的最大赢家,今年 1 月底宣布再向该公司投入 100 亿美元,并计划在 Office、Bing 等核心产品中植入相关功能;深感搜索引擎遭遇史诗级挑战的谷歌,也在 2 月初匆忙上线对标产品 Bard。

国内科技公司中,BAT 争相入局。百度 2 月 7 日宣布将推出类 ChatGPT 应用 “文心一言”,预计 3 月完成内测、面向公众开放;腾讯宣称在 ChatGPT 和 AIGC 相关方向已有布局;阿里也放出达摩院版本 ChatGPT 正在内测的消息。次一级的中小玩家也不甘落后,京东、知乎、快手、小米、360 等公司都和 ChatGPT 产生了或远或近的关联。

作为中国互联网的第三极,抖音 2016 年就设立了人工智能实验室,追赶这波 ChatGPT 的热浪顺理成章。同时,PICO 是抖音元宇宙的探路急先锋,倘若将元宇宙和 ChatGPT 两大热点勾连起来,即便找不到应用场景,也有助于进一步打响品牌、提升销量。

但对于抖音而言,ChatGPT 及其背后的通用人工智能的价值远不止于此。无论是为了中短期的上市,还是长期的互联网技术代际竞争,抖音都需要自己的 ChatGPT。

抖音上市筹谋已久,但靴子迟迟未能落地。进入 2023 年,中概股及互联网行业转暖,给整个产业注入新期待。而抖音去年已经完成集团更名、CFO 更换等多项关键动作,今年重启 IPO 恰逢其时。

但尴尬的是,抖音目前盘子很大,但要么是逐渐步入成熟期的老业务,比如抖音 APP、今日头条等,要么是扶不起来的阿斗,比如教育、游戏等;集团发力点也集中在能够迅速带来现金流的业务上,比如货架电商和生活服务等。以抖音的底子,这些业务固然能够贡献收入,但都属于一眼望到头的生意,缺少超越时代的想象空间,难以让投资人感到兴奋。

倘若抖音趁着这波 ChatGPT 的空前热度,拿出自己的通用人工智能路线图,哪怕暂时只是一张大饼,也极有可能在一级二级市场上掀起浪花,给不断下滑的公司估值带来提振。百度、知乎等公司股价飙升,已经验证了资本市场对于 ChatGPT 概念的追捧。

从长远来看,以 ChatGPT 为代表的 AI 技术,将是抖音完成技术底座升级的钥匙。

抖音一直借助中心化算法进行图文和视频内容分发,但如今算法的效率正在逼近极限,反映到业务上就是抖音、今日头条等主要产品增长放缓甚至停滞。再考虑到互联网新用户红利枯竭,抖音只有从底层做出改变,才能让内容池和用户池的联通更加精准高效,进而重启整个生态的增长引擎。

ChatGPT 背后的 AIGC 恰好具备这种潜能。它借助人工智能完成了对存量非标准化信息的海量整合,并以自然语言聊天方式实现了更精细的个性化分发。这是抖音尚未涉足的信息分发路径,也是它需要在推荐算法之外增添的新引擎。

抖音从机器推荐向机器人推荐跃升,除了业务层面的价值外,也是在战略层面上抵御人工智能对于机器算法的降维打击。ChatGPT 引领着的通用人工智能浪潮已经到来;而应对浪潮的最佳方式,就是成为它的一部分。

A

抖音很早就注意到了类似 ChatGPT 的技术风向,却起了个大早、赶了个晚集。

2019 年 7 月,抖音人工智能实验室负责人李航在一场演讲中谈到,自然语言对话存在不错的发展机遇,从产品设计角度可以重点考虑四个机会,包括:任务驱动的对话机器人,信息类机器人,情感类机器人,以及游戏类机器人。其中,“任务驱动的对话机器人” 的理想形态已经与今天的 ChatGPT 十分接近。

同一个月,大洋彼岸的 OpenAI 实现了公司化转型后的第一个重大突破,拿到微软 10 亿美元投资,同时也借助微软 Azure 云计算平台打通了商业化路径。

可以说,在自然语言大模型研究方面,抖音 AI 技术人员颇有前瞻性,对其产品形态的预测也和日后发展相吻合。而在资金方面,抖音虽然不及微软,但也已经是中国互联网新贵,掏钱支持 AI 研究不在话下。

然而,与 OpenAI 可以心无旁骛地 all in 通用人工智能相比,抖音人工智能团队的 KPI 要繁杂得多,越来越多地趋向与业务部门打配合。这最终导致两者的成长曲线天差地别。

从公开信息来看,抖音对于 AI 技术在集团内部落地有着明确要求。它的人工智能实验室官网宣称,自己的研究重点是开发为字节内容平台服务的新技术;具体领域则包括自然语言处理、数据挖掘、计算机视觉、机器学习等,且和抖音各业务板块贴合紧密。

比如,在自然语言处理这块,网站列出了几个应用场景:Byte Translator,为字节跳动所有产品提供翻译服务;AI 写稿机器人 Xiaomingbot,涉猎体育、金融、时事的新闻写作机器人;以及头条和抖音的搜索服务。而在计算机视觉方面,抖音将 AI 技术运用在内容审核、短视频推荐系统、足球比赛理解和尬舞机等方面。

相比之下,OpenAI 在诞生之初就把目标放在了通用人工智能上,也就是让机器能够像人一样思考、从事多种多样的活动。如果说抖音做 AI 是为了某一应用场景而研发技术,那么 OpenAI 恰恰相反,它首先试图让 AI 变得尽可能像人,至于能够做什么事,完全留给市场和公众去探索和检验。

其结果是,抖音 AI 部门虽然近几年成果不少,但整体集中在集团内部,尚不具备打破圈层的划时代技术力。而在许多时候,即便是抖音自己,对于自家 AI 能力的运用也并不算纯熟。

以自然语言处理为例,这是抖音 AI 团队的重点研究对象之一,而集团也在 2017 年前后试图扶持悟空问答,并连续两年投入 10 亿元补贴答主。但在这场并不成功的问答社区攻坚战中,抖音 AI 并未发挥显著功用,仅仅疑似在热点问题自动生成方面起了一点儿作用。

应用场景受限,又反过来拖累了技术实力的提升。根据市场研究公司 statista 的统计,2021 年全球持有 AI 专利最多的 7 家公司中,腾讯、百度和 IBM 位居前三,而抖音并未上榜。

另一边,OpenAI 一年一个台阶,与谷歌交替站在全球人工智能行业的顶峰。从 2018 年期,GPT(生成式预训练变换器)模型经过三次迭代,其中 GPT-3 模型在微调之后,成为如今的 ChatGPT,几乎可以生成任何类型的文字,包括聊天、问答、论文、营销方案、诗歌、剧本甚至代码,拥有了近乎无穷无尽的应用可能。

在最新一轮融资中,OpenAI 的估值达到 290 亿美元,约相当于 1/10 个抖音,且增长前景远未看到尽头。ChatGPT 大火,或许会促使抖音重新审视自身的 AI 战略,并给 AI 团队更多时间和空间。

B

倘若抖音发力通用人工智能,集团内部的直接受益者当属今日头条。

今日头条发展至今,增长空间已经极为有限,负责人多次更迭。但它毕竟是整个抖音的龙兴之地,同时也是第二大活跃用户池,数亿 MAU 无法轻言放弃。

过去一两年间,抖音试图从供给侧激活今日头条,围绕创作者生态做文章,主要是提供更多的流量激励和现金补贴等。这类活动或许能够发挥局部效用,但无法真正改写今日头条增长基本停滞的大局。

根本问题在于,今日头条用户在被平台推荐算法 “投喂” 多年后,沉浸于信息茧房之中,越来越难以对那些超越认知和口味的内容产生兴趣。这种需求侧的活力下滑,很容易导致任何运营动作的效能大打折扣。

要想打破僵局,抖音必须在需求侧做出改变。它之前试图做问答、搜索等,都是希望让用户更加主动地获取信息,而非单纯等着平台上菜。但受限于各种短板,抖音的这些尝试并未取得显著成效。

如今,ChatGPT 的爆红,让抖音看到了激活今日头条内容池、提升用户活跃度的新路径。

先看内容侧。自然语言大模型需要巨量文本数据进行训练:OpenAI 的 GPT-1 的数据规模为 4GB,GPT-2 增至 40GB,GPT-3 膨胀至 2TB。一般来说,数据多、质量越高,最终训练出来的模型的能力也就越强。

对抖音而言,这意味着今日头条沉淀十年的内容池突然有了广阔的应用前景。作为网络资讯,这些内容很多已经丧失了时效性,但由于不少内容具备较好的文本和信息价值,仍不失为大模型训练的养料,继续发挥余热。

再看用户侧。抖音擅长的算法推荐能够洞察用户喜好,却难以察觉人类获取结构化信息和系统知识的高层次需求,这也是它做不好问答的底层原因之一。

但 ChatGPT 开辟了一种新的信息获取范式:用户设计和提出问题,由 AI 整合梳理内容,并以用户期待的形态即时反馈。它提供的体验迥异于算法推荐、搜索和问答社区等旧工具,同时又在效率和准确度上有了显著提升。这种基于通用人工智能的个性化信息整合输出能力,是抖音提升图文用户活跃度的终极秘钥。

更长远来看,ChatGPT 这样的大模型除了应用在文本信息方面,也必然向图片、音频、视频等富媒体形态延展。抖音倘若做出自己的 ChatGPT,受益者除了今日头条,也将是整个抖音阵营。

以 “图文转视频” 功能为例,知乎此前已经推出基于文本产出视频的功能,但效果差强人意;抖音也已经支持输入文字、搭配图片生成短视频,但 AI 在其中的运用并不多,成品质量主要取决于创作者自身。

人工智能有望改变这一现状。OpenAI 此前发布了基于文本生成图像的模型 DALL-E,国内的腾讯、百度等公司也上线了自己的 AI 绘图工具。抖音 2022 年发布了基于开源模型的 AI 绘画功能,累计近 2800 万人使用。对于通用人工智能而言,从生成文字到图片,再到视频,不过是一步之遥。

对于抖音集团而言,加码通用人工智能,即便暂时搞不出来 ChatGPT 同等量级的成果,也能带来资本市场所渴求的新故事,进而为上市增添筹码。毕竟,这一动作本身就表明,抖音并不是一家只专注于 “去肥增瘦” 的普通公司,仍然保有探索科技前沿的野心和能力。

C

不过,通用人工智能的研发需要耗费大量时间,每年的资金投入也以亿计。这对于花钱愈发谨慎的抖音而言,是一个不小的负担。

根据业内人士估算,目前大语言模型的单次训练硬件成本已经突破 3000 万元人民币,且仍在随着模型体量的放大而攀升。再加上其他成本,各大巨头需要准备百亿美元,才能最终决出胜负。

即便是有微软撑腰的 OpenAI,也不得不在模型精度和成本之间做出平衡。它仅仅对 GPT-3 训练了一次;尽管 AI 模型存在错误,但OpenAI 认为成本太高,没有再次训练模型。

作为一家中国公司,抖音还面临着先进芯片难以获取的问题。目前,英伟达是全球主流大预言模型开发者的主要芯片供应商,其客户包括微软、谷歌、Meta 等。但受地缘政治因素影响,中国企业越来越难第一时间买到最先进的芯片,在模型训练等方面势必遭遇掣肘。

与百度、腾讯、阿里等公司一样,抖音想要做出与 ChatGPT 等量齐观的产品,可谓难上加难。但倘若能够杀出一条血路,其回报也将是巨大的。

对于抖音而言,一个拥有自主知识产权的自然语言大模型,除了能够给今日头条及其他板块带来飞跃外,还能向外输出 AI 底座能力,构建商业模式闭环。无论是内容创作、客户管理,还是代码编写、重复工作替代等,都可以发掘出大量应用场景。

以 ChatGPT 为例,除了充当免费的聊天机器人外,它还作为 AI 组件融入了微软 Office 等众多第三方产品,并通过 API(应用程序接口)链接中小开发者,由后者探索出更多玩法。2 月初,ChatGPT 还上线了付费版本,用户可以支付 20 美元月费,从而在高峰时段访问聊天机器人。

母公司 OpenAI 已经从中获得不少收入。该公司预计,2023 年营收将达到 2 亿美元,2024 年将超过 10 亿美元。抖音倘若做出自己的 ChatGPT,在前期的高投入之后,商业变现之路也会很快越走越宽。

不考虑财务因素,发展自己的通用人工智能,也是抖音避免沦为时代 “恐龙” 的必由之路。

ChatGPT 横空出世后,整个科技行业都看到了 AIGC 的强大威力,互联网内容生态有可能被改写,直接感受到威胁的谷歌和百度马上官宣了类似产品。与两家公司相比,抖音已经完成从图文到视频的跃迁,ChatGPT 至少目前威胁不到它,但并不意味着可以高枕无忧。

抖音的看家本领是推荐算法,它之所以击败了传统门户和视频网站,靠的是 “机器取代人工” 所带来的效率和体验提升。但推荐算法也面临着一个更加强大的对手——AI,后者以 “机器人取代机器”,能够更准确地实时掌握用户需求和反馈,从而让信息分发更精准和高效。

就像当年算法推荐对于人工编辑的降维打击一样,通用人工智能相对于算法推荐也是另一个维度的存在。如今,它通过 ChatGPT 初露峥嵘,就已经显露出颠覆旧格局的巨大潜能。

对于握有互联网信息分发权的抖音而言,冲击浪潮虽尚未到来,但已经在路上。倘若无法避开来自下一个时代的冲击,那么最好的应对方式,就是成为下一个时代的一部分。尽快上马自己的 ChatGPT,或许是抖音 2023 年必须要做的事之一。