字节GPT账户突遭冻结,OpenAI:正在调查不当行为 字节GPT账户突遭冻结,OpenAI:正在调查不当行为
admin
2023-12-16 18:01:34
0

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

字节跳动,陷入大模型舆论风波。

据The Verge报道:

字节跳动一直在秘密使用OpenAI的技术,来开发自家大语言模型(LLM)。



而在此消息被披露不久,The Verge进一步称OpenAI已经暂停了字节跳动的账户

具体而言,OpenAI发言人Niko Felix发布的声明如下:

虽然字节跳动使用我们API的量很少,但我们已经暂停了他们的账户,同时我们会进一步调查。
如果我们发现他们的使用不符合规则,我们将要求他们进行必要的更改或终止他们的帐户。



这里提到的“规则”是指在OpenAI的服务条款中有一项明确的规定,那就是OpenAI提供的模型能力,不允许用来被“开发任何与之产品和服务形成竞争的 AI 模型”。



据了解,字节跳动是通过微软购买的OpenAI访问权限,但是微软也制定了与OpenAI同样的政策。

The Verge表示正在向微软做进一步的咨询,是否也会跟OpenAI采取同样的措施暂停字节跳动的账户。

那么,此次的抄袭风波具体是怎么一回事呢?

内部文件被曝光

根据The Verge的说法,证据是来自字节跳动的一份内部文件——海外版飞书Lark的聊天记录。

这份文件表明,字节跳动在代号为“种子计划”(Project Seed)基础大语言模型项目中,几乎是在每个开发阶段都依赖OpenAI的API来进行开发,包括训练和评估模型。



“种子计划”是大约在一年前启动,目前主要研发两个产品,一个是在国内已经上线的Doubao;另一个是针对商业用户的聊天机器人平台,目前正在开发中。

据称,参与“种子计划”的员工是深知过度依赖OpenAI API的后果,于是他们就开始讨论如何通过“数据脱敏”来粉饰证据。

以至于经常会出现员工达到OpenAI API的最大访问上限的情况。

更具体而言,字节跳动更多的是在“种子计划”的早期阶段使用了OpenAI的技术。

The Verge根据内部文件表示,字节跳动大约是在几个月前下达了“模型开发的任何阶段停止使用 GPT 生成的文本”的命令。

不过也正是在这个时候,字节跳动发布了自家大语言模型Doubao。



但The Verge表示即便到了这个时候,字节跳动依旧没有停止违规行为:

字节跳动继续以违反OpenAI和微软服务条款的方式使用 API,包括评估豆包背后模型的性能。

并且还表示一位对字节跳动内部情况有一手消息的人指出:

他们说他们想确保一切都是合法的,但他们实际上只是不想被抓住把柄。

字节跳动已作回应

在The Verge发出这篇报道之后,字节跳动发言人Jodi Seth做出了如下回应:

GPT 生成的数据在“种子计划”的早期开发中用于注释模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。
字节跳动得到了微软的授权,可以使用GPT API。
我们在非中国市场利用GPT支持我们的产品;但在中国市场,则是使用我们自研的模型来支持Doubao



微软方面,发言人Frank Shaw则表示:

像Azure OpenAI服务这样的Microsoft AI解决方案,属于我们的有限访问框架的一部分,意味着所有客户都必须申请并得到 Microsoft 的批准。
我们还制定了标准,并提供资源帮助客户负责任地使用这些技术,并符合我们的服务条款。
我们有流程来检测滥用,并在发现违反行为准则的公司时,将停止他们的访问权限。

量子位也在第一时间与字节跳动取得了联系,但目前字节跳动并未做出正式回应。

我们将在评论区对此次事件的进展做进一步跟进。

参考链接:
[1]https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm
[2]https://openai.com/policies/business-terms

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...