<div id="readability-page-1"><blockquote> 金磊 发自 凹非寺 量子位 | 公众号 QbitAI </blockquote> 字节跳动，陷入大模型舆论风波。 据 The Verge 报道： <blockquote> 字节跳动一直在秘密使用 OpenAI 的技术，来开发自家大语言模型（LLM）。 </blockquote> <img src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/d2c181e26c8a1fb048f983bb5d97ad6c.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" original-src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/d2c181e26c8a1fb048f983bb5d97ad6c.png"/> 而在此消息被披露不久，The Verge 进一步称 OpenAI 已经暂停了字节跳动的账户。 具体而言，OpenAI 发言人 Niko Felix 发布的声明如下： <blockquote> 虽然字节跳动使用我们 API 的量很少，但我们已经暂停了他们的账户，同时我们会进一步调查。 如果我们发现他们的使用不符合规则，我们将要求他们进行必要的更改或终止他们的帐户。 </blockquote> <img src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/e979e9ca9534cc88517ce57f1b95074b.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="640" height="452" original-src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/e979e9ca9534cc88517ce57f1b95074b.png"/> 这里提到的 “规则” 是指在 OpenAI 的服务条款中有一项明确的规定，那就是 OpenAI 提供的模型能力，不允许用来被 “开发任何与之产品和服务形成竞争的 AI 模型”。 <img src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/f90a867a418eb12c0d6c947f1c96199d.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="640" height="276" original-src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/f90a867a418eb12c0d6c947f1c96199d.png"/> 据了解，字节跳动是通过微软购买的 OpenAI 访问权限，但是微软也制定了与 OpenAI 同样的政策。 The Verge 表示正在向微软做进一步的咨询，是否也会跟 OpenAI 采取同样的措施暂停字节跳动的账户。 那么，此次的抄袭风波具体是怎么一回事呢？ 根据 The Verge 的说法，证据是来自字节跳动的一份内部文件——海外版飞书 Lark 的聊天记录。 这份文件表明，字节跳动在代号为 “种子计划”（Project Seed）基础大语言模型项目中，几乎是在每个开发阶段都依赖 OpenAI 的 API 来进行开发，包括训练和评估模型。 <img src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/9ea49b7b22dc5e7ba367cb4f0c2b4b76.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="640" height="426" original-src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/9ea49b7b22dc5e7ba367cb4f0c2b4b76.png"/> “种子计划” 是大约在一年前启动，目前主要研发两个产品，一个是在国内已经上线的 Doubao；另一个是针对商业用户的聊天机器人平台，目前正在开发中。 据称，参与 “种子计划” 的员工是深知过度依赖 OpenAI API 的后果，于是他们就开始讨论如何通过“数据脱敏”来粉饰证据。 以至于经常会出现员工达到 OpenAI API 的最大访问上限的情况。 更具体而言，字节跳动更多的是在 “种子计划” 的早期阶段使用了 OpenAI 的技术。 The Verge 根据内部文件表示，字节跳动大约是在几个月前下达了 “模型开发的任何阶段停止使用 GPT 生成的文本” 的命令。 不过也正是在这个时候，字节跳动发布了自家大语言模型 Doubao。 <img src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/fa8f2b8fe251d0e5cb5e7ff65c4e143b.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="640" height="299" original-src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/fa8f2b8fe251d0e5cb5e7ff65c4e143b.png"/> 但 The Verge 表示即便到了这个时候，字节跳动依旧没有停止违规行为： <blockquote> 字节跳动继续以违反 OpenAI 和微软服务条款的方式使用 API，包括评估豆包背后模型的性能。 </blockquote> 并且还表示一位对字节跳动内部情况有一手消息的人指出： <blockquote> 他们说他们想确保一切都是合法的，但他们实际上只是不想被抓住把柄。 </blockquote> 在 The Verge 发出这篇报道之后，字节跳动发言人 Jodi Seth 做出了如下回应： <blockquote> GPT 生成的数据在 “种子计划” 的早期开发中用于注释模型，并且在今年年中左右的时候已从字节跳动的训练数据中删除。 字节跳动得到了微软的授权，可以使用 GPT API。 我们在非中国市场利用 GPT 支持我们的产品；但在中国市场，则是使用我们自研的模型来支持 Doubao。 </blockquote> <img src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/c2a1f1599c1d06e72ef03ab8d80a6c6e.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="640" height="426" original-src="https://imageproxy.pbkrs.com/https://www.qbitai.com/wp-content/uploads/replace/c2a1f1599c1d06e72ef03ab8d80a6c6e.jpeg"/> 微软方面，发言人 Frank Shaw 则表示： <blockquote> 像 Azure OpenAI 服务这样的 Microsoft AI 解决方案，属于我们的有限访问框架的一部分，意味着所有客户都必须申请并得到 Microsoft 的批准。 我们还制定了标准，并提供资源帮助客户负责任地使用这些技术，并符合我们的服务条款。 我们有流程来检测滥用，并在发现违反行为准则的公司时，将停止他们的访问权限。 </blockquote> 量子位也在第一时间与字节跳动取得了联系，但目前字节跳动并未做出正式回应。 我们将在评论区对此次事件的进展做进一步跟进。 参考链接： [1] https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm [2] https://openai.com/policies/business-terms</div>

OpenAI

字节跳动

字节跳动的账户被 OpenAI 冻结，原因是字节跳动使用了 OpenAI 的技术来开发自家大语言模型。OpenAI 暂停了字节跳动的账户，并表示将进一步调查。如果发现违规行为，将要求字节跳动进行必要的更改或终止账户。这次抄袭风波是根据字节跳动的一份内部文件揭露的，文件显示字节跳动在 “种子计划” 项目中依赖 OpenAI 的 API 进行开发。目前还不清楚微软是否也会暂停字节跳动的账户。

字节 GPT 账户突遭冻结，OpenAI：正在调查不当行为