“我们的内容有价值，是真正的人类辛苦劳动的成果，却不断被用来为其他人创造收入，我们必须得到补偿。”

AI 聊天机器人凭借其出色的能力，成为环球市场的焦点，让互联网公司之间掀起了新一轮 “军备竞赛”。

但是，用于训练人工智能的数据，如新闻、书籍等，许多都是有版权归属的，AI 公司该为使用这些内容付费吗？

据媒体报道，近期，出版行业的高管，已经开始审查他们的内容在多大程度上被用于 “训练” ChatGPT 等 AI 聊天机器人，他们应该如何获得补偿，以及他们有哪些法律选择。

新闻媒体联盟 (News Media Alliance) 执行副总裁兼总法律顾问 Danielle Coffey 表示：

“我们的内容有价值，是真正的人类辛苦劳动的成果，却不断被用来为其他人创造收入，我们必须得到补偿。”

据知情人士向媒体透露，美国内容社区 Reddit 已经与微软就其内容在 AI 训练中的使用进行了商议。

此外，拥有《华尔街日报》、《纽约邮报》、《巴伦周刊》等媒体的美国新闻集团正准备采取行动。

首席执行官 Robert Thomson 在最近的一次投资者会议上表示，他已经 “开始与某一方进行讨论。”

Robert Thomson 认为：

“很明显，他们在使用独家内容——显然，我们应该因此得到一些补偿。”

除了出版商，图片作品的版权方也在向 AIGC 公司讨要授权费。今年 2 月，在线图库 Getty Images 已起诉 AIGC 领域独角兽 Stability AI，称其侵犯了 Getty Images 的版权。

AI 公司是否有权从互联网上抓取内容，并把这些数据输入他们的训练模型，是一项模糊不明的法律问题。

在中国、美国、日本、欧盟等地的法律中，均有 “合理使用” 条款，允许个人、公司在某些情况下未经许可使用受版权保护的材料。

许多 AI 公司也援引这一条款为自己申辩，但出版商则认为，大量使用受版权保护的内容训练 AI，是对这一特许权利的滥用。

并且，人工智能工具可能会让他们的网站上损失流量和广告收入。在搜索引擎时代，用户还需要点进网页找资料，但现在，大部分时候，搭载 GPT-4 引擎的 Bing 都能直接帮你生成答案，几乎不需要再查阅网页。

此前，OpenAI 首席执行官 Sam Altman 在谈到版权问题时表示，ChatGPT 是根据两年前的数据进行训练的。他还表示，OpenAI 也在积极和内容公司合作，获得授权，表示公司愿意为特定领域的高质量数据支付高价。

比如，去年，OpenAI 与在线图库 Shutterstock 达成了协议，Shutterstock 给 OpenAI 提供数据，OpenAI 技术给 Shutterstock 提供技术。与此同时，Shutterstock 还设立了一个基金，那些作品被用于 AI 训练的艺术家提供补偿。

现在的问题是，AI 工具仍处于进入商业应用的早期，如果真的要让 AI 公司为大规模复制作品支付许可费用，在实践中也很难完成。对版权问题，整个行业还没有形成固定的准则。

我们此前提到，涉及软件公司 Adobe 是解决 AI 版权问题的先行者。它在最近推出新工具"Firefly" (萤火虫) ，致力于让 AI 生成作品安全地商用，同时给让艺术家自主选择，要不要把作品交给 AI 训练。Adobe 希望能塑造行业的新标准，但这一切，都需要时间。

版权商准备和微软、谷歌、OpenAI 打官司！训练 AI 模型，也得付钱？