qbitai.com
2023.12.16 08:40
portai
I'm PortAI, I can summarize articles.

字节 GPT 账户突遭冻结,OpenAI:正在调查不当行为

字节跳动的账户被 OpenAI 冻结,原因是字节跳动使用了 OpenAI 的技术来开发自家大语言模型。OpenAI 暂停了字节跳动的账户,并表示将进一步调查。如果发现违规行为,将要求字节跳动进行必要的更改或终止账户。这次抄袭风波是根据字节跳动的一份内部文件揭露的,文件显示字节跳动在 “种子计划” 项目中依赖 OpenAI 的 API 进行开发。目前还不清楚微软是否也会暂停字节跳动的账户。

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

字节跳动,陷入大模型舆论风波。

据 The Verge 报道:

字节跳动一直在秘密使用 OpenAI 的技术,来开发自家大语言模型(LLM)。

而在此消息被披露不久,The Verge 进一步称 OpenAI 已经暂停了字节跳动的账户

具体而言,OpenAI 发言人 Niko Felix 发布的声明如下:

虽然字节跳动使用我们 API 的量很少,但我们已经暂停了他们的账户,同时我们会进一步调查。

如果我们发现他们的使用不符合规则,我们将要求他们进行必要的更改或终止他们的帐户。

这里提到的 “规则” 是指在 OpenAI 的服务条款中有一项明确的规定,那就是 OpenAI 提供的模型能力,不允许用来被 “开发任何与之产品和服务形成竞争的 AI 模型”。

据了解,字节跳动是通过微软购买的 OpenAI 访问权限,但是微软也制定了与 OpenAI 同样的政策。

The Verge 表示正在向微软做进一步的咨询,是否也会跟 OpenAI 采取同样的措施暂停字节跳动的账户。

那么,此次的抄袭风波具体是怎么一回事呢?

根据 The Verge 的说法,证据是来自字节跳动的一份内部文件——海外版飞书 Lark 的聊天记录。

这份文件表明,字节跳动在代号为 “种子计划”(Project Seed)基础大语言模型项目中,几乎是在每个开发阶段都依赖 OpenAI 的 API 来进行开发,包括训练和评估模型。

“种子计划” 是大约在一年前启动,目前主要研发两个产品,一个是在国内已经上线的 Doubao;另一个是针对商业用户的聊天机器人平台,目前正在开发中。

据称,参与 “种子计划” 的员工是深知过度依赖 OpenAI API 的后果,于是他们就开始讨论如何通过“数据脱敏”来粉饰证据。

以至于经常会出现员工达到 OpenAI API 的最大访问上限的情况。

更具体而言,字节跳动更多的是在 “种子计划” 的早期阶段使用了 OpenAI 的技术。

The Verge 根据内部文件表示,字节跳动大约是在几个月前下达了 “模型开发的任何阶段停止使用 GPT 生成的文本” 的命令。

不过也正是在这个时候,字节跳动发布了自家大语言模型 Doubao。

但 The Verge 表示即便到了这个时候,字节跳动依旧没有停止违规行为:

字节跳动继续以违反 OpenAI 和微软服务条款的方式使用 API,包括评估豆包背后模型的性能。

并且还表示一位对字节跳动内部情况有一手消息的人指出:

他们说他们想确保一切都是合法的,但他们实际上只是不想被抓住把柄。

在 The Verge 发出这篇报道之后,字节跳动发言人 Jodi Seth 做出了如下回应:

GPT 生成的数据在 “种子计划” 的早期开发中用于注释模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。

字节跳动得到了微软的授权,可以使用 GPT API。

我们在非中国市场利用 GPT 支持我们的产品;但在中国市场,则是使用我们自研的模型来支持 Doubao

微软方面,发言人 Frank Shaw 则表示:

像 Azure OpenAI 服务这样的 Microsoft AI 解决方案,属于我们的有限访问框架的一部分,意味着所有客户都必须申请并得到 Microsoft 的批准。

我们还制定了标准,并提供资源帮助客户负责任地使用这些技术,并符合我们的服务条款。

我们有流程来检测滥用,并在发现违反行为准则的公司时,将停止他们的访问权限。

量子位也在第一时间与字节跳动取得了联系,但目前字节跳动并未做出正式回应。

我们将在评论区对此次事件的进展做进一步跟进。

参考链接:
[1] https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm
[2] https://openai.com/policies/business-terms