掐起来了!微软将推特移除广告平台,马斯克反击:小心我起诉你 “滥用推特数据”
微软因未来无法免费访问推特数据颇为不满,宣布将推特移除广告平台,马斯克立刻反击,称微软非法使用推特数据进行 AI 训练,诉讼时间到了。
AI 竞争日趋白热化,马斯克和微软间的火药味也越来越浓。
4 月 19 日,微软发布公告称,自本月 25 日起,其为广告商提供服务的平台 Smart Campaigns 将不再支持推特。此举意味着用户无法通过微软提供的平台创建并管理推文,同时也将无法在 Microsoft Advertising 平台上查看他们广告及推文的浏览量。
Smart Campaigns 为一个面向广告主的社交媒体规划和调度工具,可帮助广告商在该平台管理 Facebook、Instagram 和 LinkedIn 等多个社交媒体。
微软 “狠狠踹了一脚”,马斯克随即发起反击。
马斯克于 4 月 20 日发推文称可能会起诉微软,指控微软 “非法” 利用推特数据训练 AI:
“他们非法使用 Twitter 数据进行训练。诉讼时间到了。”
而这一切的导火索或许是推特计划向用户收取高额数据访问费用,这也进一步证明了在 AIGC 热潮下,数据对于科技巨头们显得更为重要。
访问推特数据要付费
今年 2 月 2 日,马斯克宣布平台 API 访问将在一周内设置付费墙。一周后,他决定将这一措施的上线推迟到 2 月 13 日。结果因为推特遭遇宕机事件,这个最后期限也过去了,目前这项收费措施没有实施。
自 2006 年成立以来,学者们可以免费访问推特的应用程序编程接口(API),从而获取平台上的各种信息数据。
根据 2020 年的数据来看,已有超过 17500 篇学术论文基于推特平台的数据进行分析。
但推特新规让大多数依赖 API 访问开展研究的学者和组织将无法继续使用推特。
根据推特客户代表在今年 3 月初公布的一份文件来看,该公司现在计划就开发者平台向相关用户提供三个级别的企业包 (Enterprise Packages),每年最少支付超 50 万美元:
其中最便宜的 Small Package 每月需要支付 4.2 万美元,可以访问 5000 万条推文。更高的级别可以让研究人员或企业访问更多数据,分别为 1 亿条和 2 亿条推文,但每月的费用分别为 12.5 万美元和 21 万美元。
很多免费使用现有推特 API 的用户都证实了这一消息,他们都收到来自推特公司的电子邮件,称新的定价计划将在几个月内生效。
数据已成 AI 军备竞赛的重要一环
AIGC 热潮下,数据重要性愈发凸显,像 GPT 这样大型语言模型(LLM)的训练往往需要 TB 级的数据量。
无独有偶,4 月 18 日,美国访问量最大的网站之一 Reddit 宣布,将向使用其 API 数据训练的公司收取数据使用费,其中便包含微软、谷歌、OpenAI 等:
谷歌聊天机器人 Bard 的底层算法之一便是用 Reddit 聊天数据训练而来;OpenAI 的 ChatGPT 也将 Reddit 数据纳入大型语言模型的训练内容。
目前,Reddit 暂未公布具体收费标准,但其表示,将会给出不同的等级,根据使用者的规模和需求来收费。
华尔街见闻此前分析指出,AI 公司是否有权从互联网上抓取内容,并把这些数据输入他们的训练模型,是一项模糊不明的法律问题。
今年 2 月,在线图库 Getty Images 已起诉 AIGC 领域独角兽 Stability AI,称其侵犯了 Getty Images 的版权。
此前,OpenAI 首席执行官 Sam Altman 在谈到版权问题时表示,ChatGPT 是根据两年前的数据进行训练的。他还表示,OpenAI 也在积极和内容公司合作,获得授权,表示公司愿意为特定领域的高质量数据支付高价。
去年,OpenAI 与在线图库 Shutterstock 达成了协议,Shutterstock 给 OpenAI 提供数据,OpenAI 给 Shutterstock 提供技术。与此同时,Shutterstock 还设立了一个基金,那些作品被用于 AI 训练的艺术家提供补偿。