纽约时报掐架OpenAI:为什么这场对决将影响人类的命运? 纽约时报起诉微软openai侵犯版权 《纽约时报》状告openai和微软侵权
admin
2024-01-22 14:37:43
0

全球都在关注着这个可能决定人类命运的官司。

在2023年的年尾,AI界的巨头OpenAI和其合作伙伴微软,一同被老牌头部媒体《纽约时报》告上法庭。

指控的理由,是ChatGPT非法使用了《纽约时报》数百万篇原创文章,严重侵犯了《纽约时报》的权益。

在沉默了近两周之后,OpenAI终于作出了回应:毫不避讳地承认了使用过《纽约时报》文章的事实,但称其是“合理使用”,并且表示如果不使用受版权保护的作品,ChatGPT这样的AI产品就无以发展。

这不禁让人想起十年前,因算法模式而强势崛起的今日头条,同样因侵犯版权被众多媒体起诉;更早的二十年前,全球最大科技公司之一的谷歌,因建立数字图书馆而被作者协会集体上诉。

这些往事都早已有了结局。今日头条选择花钱“交个朋友”,邀请媒体入驻,并且定期支付千万级别的版权费用。而谷歌在经历了漫长的十年纠缠之后,以“合理使用”原则赢得了诉讼。

此时此刻,恰如彼时彼刻,如今站上法庭的AI科技巨头与媒体大亨,同样因内容版权问题而交锋。不过,历史虽然总是惊人的相似,但绝不会简单地重复。

新旧世界的对决

故事的主角OpenAI,可以说是AI科技行业当之无愧的“C位”,被视为构建AGI(通用人工智能)的“金种子”,人类社会通往下一个时代的钥匙。

而另一位主角《纽约时报》是美国老牌媒体,依靠数字订阅服务,依然在互联网时代保持着行业翘楚的地位,是全球新闻内容市场的中坚力量。这场比拼,可谓精彩绝伦。

在第一轮的对决中,《纽约时报》就直接要求“摧毁”所有大语言模型以及包含其版权内容的数据集,并且赔偿损失和相关费用。

PConline查阅发现,《纽约时报》69页的上诉书中,近50页的内容都在描述OpenAI及微软侵犯版权的证据。

上诉书不仅以可视化的形式展现了ChatGPT的侵权行为,还补充了许多数据支撑,资料厚度是从前AI版权案例的几倍,内容之详细,逻辑之清晰,都体现了《纽约时报》为起诉做足了准备。

因此知名律师Cecilia Ziniti在看过上诉书之后,认为这将会是一次AI侵权领域“里程碑式的案件”。


《纽约时报》列出的证据,红色为ChatGPT与《纽约时报》内容一致的部分

《纽约时报》获得了一波网友的支持,许多人都认为AI在“毫无底线”地侵犯版权。但对于《纽约时报》的诉求—— “摧毁”大语言模型,网友们都持怀疑的态度。

其实OpenAI也对《纽约时报》抛出过合作的橄榄枝。有消息称,OpenAI曾向《纽约时报》提出过500万美元或更少的赔偿条件。然而,在《纽约时报》的上诉书中,虽然没有要求具体的赔偿金额,但表达过要求OpenAI赔偿其数字业务受损害的部分。而这一部分,也正是《纽约时报》的支柱业务。

《纽约时报》2022年的财报显示,数字订阅收入达到14.79亿美元,占全年总收入的64.08%。这样看来,OpenAI提出的500万美元确实显得没有诚意。但从主动寻求合作的行为中不难看出,OpenAI自知理亏。所以在多次公开发言中,OpenAI选择另一个“防护盾”——合理使用。

“合理使用”是版权法的一种宽松处理,对于一些特殊的场景给予使用版权的权利。判断是否“合理使用”时,有多个考虑因素:使用版权对市场/公共利益的影响、使用版权的主体是否盈利等。

OpenAI选择站在科技发展、公共利益的角度为自己辩护:极力强调庞大的数据训练集是AI发展的必经之路。并且,只使用公共领域的内容的话,AI的发展水平就达不到当前社会的需求。

当然,在公共利益的话题上,《纽约时报》也是有备而来。

《纽约时报》早已料到OpenAI会作此反应,在上诉书中,专门提到了“AI幻觉”的问题。“AI幻觉”是指AI有时会生成一些看似连贯,实则错误的回答。但错误或虚假的信息会误导用户,从而造成不良的公共影响,所以OpenAI能否证明其公共利益的属性,还得存疑。

另外,《纽约时报》直指OpenAI的“盈利目的”。OpenAI起初为“非营利”组织,但现在早已不再开源,依靠AI的服务,每月收入8000万美元。(据消息称,OpenAI在2023年的年收入已经超过16亿美元。)

双方在不同的价值追求下,对自身的立场都有着同样的执着。科技行业和新闻出版行业似乎每十年都会进行一次这样的“巅峰对决”。但更有趣的是,“对决”背后的草灰蛇线。

科技VS新闻出版:宿敌还是盟友?

将时间倒转二十年,在美国声名鹊起的科技企业谷歌提出了一个雄心勃勃的项目——谷歌图书,试图通过扫描创建图书的数字版本,然后将电子图书合并到谷歌的搜索功能中。

当时,每天都有几大卡车的图书送到谷歌总公司进行扫描,场面颇为壮观。但这个项目很快引起了作者和出版商们的不满。

作家协会以侵犯版权为由对谷歌提起诉讼。谷歌立即搬出“合理使用”的法律盾牌,声称这一项目是有利于公众,同时也没有损害原创作品的市场。同时谷歌也积极寻求和解,但被原告方拒绝。

这个案件可谓历经波折,耗费了约十年的时间,最终法院基于“合理使用”的原则宣判谷歌胜诉。这也为数字时代版权评判标准的健全,补上了一块拼图。

十年前,相似的事情又在中国互联网上演。2013年,被称“新闻搬运工”的今日头条在上线后,火速侵噬了新闻行业的大部分流量。

以《广州日报》为首的传统媒体随即对今日头条发起诉讼。《新京报》等众多知名媒体也迅速群起而攻之,接连发表声明,谴责今日头条的侵权行为。

今日头条一边表态不存在侵权问题,一边和媒体积极推进合作。最终今日头条和众多媒体达成和解,不仅花大价钱购买了新闻版权,还积极邀请各大媒体入驻,给予流量扶持和收益分成。

如今看来,OpenAI是想沿着“前辈们”的脚步过河。在对《纽约时报》上诉的第一次正式回应中,OpenAI将“与新闻机构合作并创造新的机会”作为首要立场,还搬出了和美联社的合作作为支撑论据。

纵观这三个案件,谷歌图书案开始于门户网站的兴起阶段,搜索引擎的兴盛是那个时代的标志;今日头条案发生在移动互联网的崛起时刻,流量是当时抢占市场的关键;而今天的OpenAI案是AI技术获得突破性进展,大显身手的前夜,拥有像ChatGPT这样生成式AI产品是公司股价飞升的秘诀。

这三个案件,虽处于不同的时代,但都发生在新技术“引爆”新时代之前。并且,故事的主角都是科技和新闻出版这样两个行业。

这一点,并不难理解。对于科技行业来说,技术的落地一定需要内容来支撑。而新闻出版业就是内容的集大成者。对于新闻出版行业来说,内容也需要迎合时代的发展,更新内容的形式。当然,科技的发展总是领先于时代,所以带来了“技术的磨合期”——相应的市场规则和法律文书在这一阶段进行完善。

“读书人的事儿,能叫抄吗?”

但AI的情况又有所不同。在科技公司看来,AI技术是以类人为导向的,许多AI大模型的衡量标准就是看输出的内容能否接近,甚至超越人类专家的智慧。

所以技术的发展逻辑也是按照人的成长机制来践行的。在学校里学习公开的材料,通过和身边的人互动来增强对社会的认知,本质上与AI大模型的学习训练是有共通之处的。只不过一个人在学校里用到的课本有几十本,而ChatGPT则是“学习”了约1.76万亿个数据。

但AI公司们似乎没意识到这套逻辑仍然难以自洽,学生们去学校学习知识再加以应用,以获得个人的成长,是需要付出成本的,比如学费、书本费等,只不过这个成本往往是由社会福利来买单,无论谁来支付这笔成本,都明确显示了成本是真实存在的。

但AI公司们似乎并不愿意聊到这个成本,他们普遍希望像OpenAI一样免费获取“纽约时报”们的内容来学习。与此同时,他们也并不愿意承担AI造成的负面后果。

美国国家AI咨询委员会成员Navrina Singh在参加一档谈话节目时就曾表示,目前科技公司很难对AI输出的内容负责,因为他们没有工具来细致处理“万亿”级别的数据。这也是科技巨头们正在努力的方向。这也是OpenAI与《纽约时报》这场巅峰对决产生的意义——AI和人类的“磨合期”已经到来。不仅是AI侵权问题,还有“AI幻觉”、失业潮等都是“磨合期的阵痛”。AI技术需要适应人类社会,我们也需要了解新的技术,在新的时代找到自己的定位。

时代滚滚向前,时间会证明潮水的方向。谷歌图书案之后,数字生态逐渐成为了极具公益价值的一环,越来越多的古籍文物再也无惧岁月变迁,在数字世界中成为了人类永恒的财富;今日头条案之后,传统媒体加快融媒转型的步伐,在新的媒介传播时代中焕发新生;相信在这次《纽约时报》诉OpenAI案之后,AI产业会激发出更多意想不到的创新。

不管这次案件判决如何,都有着巨大的象征意义。毕竟与传统产业“对决”的输赢,并不是AI发展的最终目的,各方寻求共赢的合作,共创AI时代的未来才是。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...