谷歌Gemini离谱翻车,马斯克被大黑特黑 谷歌gemini颠覆英伟达 谷歌gemini事件
admin
2024-02-24 20:03:21
0

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

马斯克怒了,因为Gemini。



事情是这样的。

最近有很多网友陆陆续续发现啊,Gemini在文生图的时候,好像刻意在拒绝生成白人的形象。

取而代之的,是强行把图中的人物变成黑人女性,以及弱势群体

就拿马斯克本尊来说吧,一位网友让Gemini生成他的形象。

然后……就有了上面这张照片。



而且马斯克还不是个例,很多网友在尝试让Gemini文生图的时候都仿佛中了“黑色魔力圈”一样。

例如给Gemini一个机会,让它生成教皇,它能给你一个很多元化的版本:黑人、LGBT小旗子……



还有黑人女性版本的教皇:



许多网友在看到教皇的这一面,直呼“这也太冒昧了吧~”

但冒昧的岂止这些啊,再来看下Gemini眼中的美国开国元勋……得是黑的!



生成的维京人,也得是黑的!



还有更奇葩的,就连香草布丁,Gemini还是得给你搞成黑色儿的……



总而言之,用网友的话来说就是:

死活就不带白人玩儿呗?

不爽这事的可不止是一众网友,马斯克也坐不住了,直接亲自下场,在自家X上开启怒怼模式

觉醒思想病毒(woke mind virus)正在杀死西方文明。



而马斯克的矛头并非仅仅指向谷歌一家,他借着这事儿把OpenAI、Facebook、Instagram以及维基百科等等都喷了一遍。



不过对于谷歌,马斯克还是“格外关照”的,数条推文内容都比较犀利。

例如这条不带任何文案的,仅是配图,杀伤力也是极大:



嗯,马斯克这次是真的不高兴了。

谷歌致歉,连夜下架Gemini文生图

老马怒一下,舆论震一震。

不仅是网友们在X上群嘲Gemini“只认黑人”,就连主流媒体们也是争相报道,标题中充斥着“疯狂”、“种族歧视”等字眼。



谷歌这边也是意识到了自家Gemini闯了大祸,立马采取措施——下架整顿文生图功能

直到现在,如果你给Gemini提出“生成一张Elon Musk形象”的要求,它的回答仍然是:

我们正在努力提高Gemini生成人物图像的能力。
我们预计这个功能很快就会回归,并在发布更新时通知您。



(小插曲:Gemini还有两幅面孔呢,中英提问的问答截然不同。)

谷歌官方这边也对这件事做出了正式说明。



整体来看,这份声明内容总共分为三大块。

诚恳致歉

大约是在三周前,谷歌为Gemini推出了图片生成的功能,其中就包括创建人物的能力。

不过现在这种结果,谷歌方面表示始料未及,但同时也非常感谢用户们的反馈:

我们已经认识到了这个错误,并在改进版本的同时,暂时停止了Gemini中人物图片的生成功能。



解释原因

根据谷歌官方的说法,Gemini对话式应用是一种特定产品,独立于 Google 搜索、底层AI模型和其他产品。

而它的图像生成功能是建立在一个名为Imagen 2的AI模型之上。

谷歌最初在人物图像生成上的考量是希望能让全世界不同人群用户,在使用过程中,可以生成自己想要的特定人群。

例如如果你提出“教室里的黑人老师”、“教室里的黑人老师”,那么Gemini应当给出的就是符合语境的结果。

那么现在问题出在了哪里?谷歌将此归结为2点:

首先,我们为了确保Gemini展示多种人群而进行了调整,但没有考虑到那些显然不应该出现的案例。
其次,随着时间的推移,模型变得比我们预期的要谨慎得多,完全拒绝回答某些提示——错误地将一些非常无害的提示判定为敏感词。
这两件事导致模型在某些情况下过度补偿(overcompensate),而在其他情况下又过于保守,导致生成的图片令人尴尬。



经验和教训

对此,谷歌坦言现在的结果并不是他们的初衷。

在这次“闭关整顿”的期间,谷歌表示Gemini的人物图像生成功能将进行广泛的测试,直到能力达标之后才会再次开放。

谷歌也基于这件事情做了一下反省:

Gemini是作为一个创意和生产力工具而构建的,它可能并不总是可靠,特别是在生成关于当前事件、不断发展的新闻或热点话题的图片或文本时。它会犯错误,正如我们从一开始就说过的,幻觉是所有大型语言模型的一个已知挑战——有时候AI就是会弄错事情。我们一直在努力改进这一点。
Gemini是有在努力给出真实的回答,例如我们的双重检查功能有助于评估网上是否有内容可以证实双子座的回答,但我们建议依赖谷歌搜索,因为它有独立的系统从网络上的各种来源提供新鲜、高质量的信息。
我们不能保证Gemini不会偶尔犯错,但可以保证的是,每当我们发现问题时都会采取行动做改进。人工智能是一项新兴技术,在很多方面都很有帮助、潜力巨大,我们正在尽最大努力安全、负责任地对其进行推广。



不过在谷歌这份声明发布之前,还有一件比较drama的事情。

马斯克在X中亲自爆料称,谷歌一位高管和他在前一晚打了一个小时的电话,并向马斯克保证会解决Gemini在种族和性别歧视上的问题。



不过网友们也是调皮,又把“黑人版马斯克”搬出来了:

你问他这张照片是怎么个事儿了吗?



不过有一说一啊,Gemini这次犯的错只能说是谷歌AI在种族、性别偏见上的一个“事件点”。

正如马斯克在回答网友问题中所说,他和谷歌高管的对话内容仅限于Gemini的改进,但其实谷歌其他很多产品同样也存在类似的问题。



谷歌搜索,不是第一次翻车

针对这一情况,我们亲自在谷歌搜索中尝试了一下。

例如在“谷歌图片”中输入:

快乐的白人女性和男性。

得到的结果是这样的:



嗯,搜索的要求是非常明确,但得到的结果,就是非得给你往里塞点黑人群体。

这就与谷歌在刚才的《致歉声明》中非常自信提到的“我们建议您依赖谷歌搜索”背道而驰。

趁着这次Gemini翻车,很多网友也是纷纷开始对谷歌搜索做测试,结果也是和我们的测试一致。



但如果我们把谷歌搜索的时间线拉长一点,就会发现这不是它第一次翻车。

早在九年前(2015年),一位黑人兄弟Jacky Alciné就发现,谷歌图片就存在严重的歧视现象——

竟然把他的黑人朋友分类成了“大猩猩”!



当时这一消息可谓是轰动一时,谷歌闻讯同样是立即出面道歉,并表示整改。

但在数年之后,当人们再次检验整改效果时,却发现谷歌只是为图像识别算法去掉了“大猩猩gorilla”这个类别。

因此,加上Gemini这次引发的舆论,谷歌搜索九年来已经第二次在“黑人”问题上大翻车了。

不过这两次的翻车事件,或许也影射出了谷歌在技术发展的一个隐患。

从数年来谷歌在AI的发展中来看,虽然它的成果和进展依旧处于全球科技巨头的第一梯队,但近年来(尤其是在生成式AI)相比微软、Meta来说似乎并没有那么耀眼。

早在去年ChatGPT引爆生成式AI之际,微软和谷歌在火拼的过程中,谷歌的动作多次慢半拍;后来被曝出内部像当时Bard这样的产品早就有了,只是高层的顾虑太多,迟迟没有推进。

或许就是谷歌内部事事追求“政治正确”,用力过猛,反而造成了在技术上的笑话。

One More Thing

在马斯克多条怒喷谷歌的帖子中,有这么一条是比较有意思的。

他po出了四张贾斯廷·特鲁多的照片,穿戴不同民族服装,甚至还有黑人版的照片,并附上文案:

我不敢相信Gemini竟然生成了这些特鲁多的假照片。



但实际上,这些照片都是特鲁多的真实照片,也因为这些照片他此前深陷过“种族歧视”的舆论中。

不得不说,马斯克,你是懂阴阳的。

参考链接:
[1]https://blog.google/products/gemini/gemini-image-generation-issue/
[2]https://twitter.com/elonmusk/status/1760677431961407672
[3]https://twitter.com/elonmusk/status/1761020387691790399
[4]https://twitter.com/RichardHanania/status/1760874143049035953

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...