OpenAI媒体管理器明年投用!识别内容版权,允许创作者退出AI训练 OpenAI媒体管理器明年投用!识别内容版权,允许创作者退出AI训练
admin
2024-05-08 22:27:23
0


智东西
编译 庞小春
编辑 香草

智东西5月8日消息,昨日,OpenAI宣布正在开发一款名为媒体管理器(Media Manager)的工具,旨在让创作者能够更好地控制其原创内容在生成式AI训练中的使用方式。OpenAI可以通过媒体管理器识别内容创作者的作品,并按照他们的要求将这些作品纳入或排除在AI研究或训练之外。

OpenAI计划2025年之前将该工具投入使用,可能会通过公司最近加入的C2PA(内容来源和真实性联盟)的行业指导委员会,联合创作者、内容所有者和监管机构共同制定一项标准。OpenAI在公告中写道:“作为有史以来的第一个此类工具,媒体管理器需要大量的学习研究,来帮助我们识别多个来源的受版权保护的文本、图像、音频和视频,并反映创作者的偏好。”并称随着时间的推移,他们会推出更多的选择和功能。

无论最终采用何种形式,媒体管理器似乎都是OpenAI对其开发AI的方式日益受到批评的回应,即严重依赖于从网络上收集公开可用的数据。最近,包括《芝加哥论坛报》在内的八家美国著名报纸以侵犯知识产权为由,对OpenAI提起诉讼,指控其窃取文章用于训练生成式AI模型,并且在没有补偿或署名的情况下商用。

以ChatGPT为代表的生成式AI大模型,通常都是利用来自公共网站和数据集的大量数据进行训练。这些生成式AI公司认为,基于公平使用的法律原则,他们有权从公共数据中获取并用于模型训练。但并非所有人都这样认为。

事实上,OpenAI认为,如果没有版权材料,就不可能创建有用的AI模型。但为了回应批评人士,并在未来的诉讼中为自己辩护,OpenAI已采取措施,与内容创作者达成妥协。

去年,OpenAI允许艺术家“选择退出”,对于他们不希望用于训练图像生成模型的数据进行删除。公司还允许网站所有者通过robots.txt标准对其网站内容进行指示,选择是否可以用来训练AI模型。

OpenAI将继续与新闻机构、媒体库、问答网站等海量数据管理者签订许可协议,但一些内容创作者表示,OpenAI做得还不够。艺术家们认为OpenAI的图像选择退出工作流程太过繁琐,对于要删除的图像都需要提交单独副本以及描述,并且OpenAI为授权内容支付的费用也相对较少。另外,OpenAI也在公告中承认,公司目前的解决方案无法解决创作者的作品在其他无法控制的平台上被引用、二次创作或转发的情况。

除了OpenAI之外,其他大模型公司也正在尝试为生成式AI构建来源标注和选择退出工具。初创公司Spawning与其合作伙伴Stability AI和Hugging Face等共同构建了一款应用程序,可以识别和跟踪机器人的IP地址以阻止抓取尝试,并且提供一个数据库,艺术家可以在其中注册自己的作品,阻止AI供应商用于大模型训练。Steg.AI和IMATAG公司也通过应用人眼无法察觉的水印来帮助创作者建立图像的所有权。另外,芝加哥大学开发了一种名为Nightshade的工具,可以使AI图像生成器无法使用未经许可的图像进行训练。

结语:OpenAI推出媒体管理器,助力AI训练数据应用规范化

AI大模型严重依赖大量公开可用数据,其使用方式容易侵犯内容创作者的知识产权,OpenAI推出媒体管理器,使内容创作者能够控制其作品在AI研究和训练中的使用方式。

作为AI大模型引领者,OpenAI这一做法或许会助力AI训练数据应用走向规范化,加快AI大模型迭代升级。

来源:OpenAI官网

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...