老黄再曝惊人语录:LLM幻觉有解,AGI五年内必来! 老黄说过的话 老黄爆料
admin
2024-03-21 04:55:46
0


新智元报道

编辑:编辑部

【新智元导读】AGI竞赛,正在大科技公司之间紧锣密鼓地展开,作为万亿显卡帝国掌舵人的老黄自然也不会缺席。在最近举办的GTC 2024上,老黄发表了自己对于AGI以及幻觉问题的看法。

各大科技公司,现在都在疯狂冲刺AGI!

毫无疑问,这是一个赢家通吃的局。

最近,Sam Altman在韩国活动和Lex Fridman上的几小时发言,被广大群众反复研读。只因为,GPT-5和AGI的前景,实在是太刺激了。

著名爆料人Jimmy Apples猜测,现在OpenAI一定在酝酿一盘大棋,如果有必要的话,Altman甚至有足够的聪明想出plan B,来对抗微软。


对此,有网友描绘了AI公司之间的竞争:


「OpenAI的一名董事会成员来自微软,所以他们在内部有一个间谍。」

还有阴谋论的网友不禁畅想:


利用技术进步来压低价格并使竞争对手破产。操纵媒体来压低竞争对手的收入。制造了一场大规模事件,导致人工智能的研究暂停,同时秘密建立一个由机器人组成的先进实验室,并建造一台超出人类理解的隐藏的超级计算机,或者开始对世界进行黑客攻击和勒索以实现类似的目标。

而在昨天举办的英伟达GTC大会上,老黄也对AGI发表了自己的看法:AI幻觉可解,AGI五年内必来!

老黄GTC发言

近日,英伟达主办的AI开发者盛会GTC 2024隆重开幕,大会的场地圣何塞SAP中心座无虚席。

红旗招展、人山人海,宛如摇滚演唱会。


而聚光灯的中心,就是这位身着皮衣的61岁英伟达CEO黄仁勋。

除了抛出震惊所有观者的地表最强芯片,老黄也对AI相关的问题给出了自己的思考。


AGI 五年内必来

通用人工智能(AGI),体现着超越人类的水平、以及广泛的适用性。

简单来说,人类能做的,AGI基本都能做,人类做不到的,AGI甚至也能搞定。

这种强AI与仅专注于特定任务的窄AI不同,可以处理各种复杂的任务,比如检测产品缺陷、总结新闻、创建网站等,以超越人类的水平执行广泛的认知任务。

真正的AGI何时能够到来?

作为大家最关心的问题,老黄已经快被问麻了。

不过毕竟AGI涉及到未来,在机器能够在几乎所有领域超越人类的情况下,人类将扮演怎样的角色,以及根本的控制权问题。

当前的AI强大如斯,但仍然是不可解释的,未知使人感到恐惧,如果AGI的决策与人类的价值观产生冲突,而人类又干不过AGI,那时候就麻烦了。

虽然AI公司的CEO们,并不愿意讨论这种倾向于AI末日论的话题,但老黄还是花时间向媒体表达了自己的看法。


老黄认为,这取决于人们如何定义AGI。

比如对于我们来说,即使位于不同的时区,你也知道新年何时到来,2025年何时开始。

「如果你正开车前往举办今年GTC大会的圣何塞会议中心,当你看到巨大的GTC横幅时,你就知道你已经到达了目的地。」

对于AGI来说,也可以是这种确切的定义,比如认为AGI在许多领域拥有广泛的知识。

「举个例子,在数学测试、阅读测试、阅读理解测试、逻辑测试、医学考试、律师考试、GMAT、SAT,等等你能想到的几乎所有考试,AI都可以做得很好。」

老黄表示,「如果你将AGI定义为在这些测试中表现良好,几乎比任何人都好,然后你问,你认为计算机可以在五年内做到这一点吗,那么答案可能是肯定的。」

「如果你只问一般智力问题,而不是定义通过测试的能力,答案就更模糊了。」

AI幻觉可解

对于AI,人们另一个最关注的话题就是幻觉。

如果说探讨AGI表达了人们对强大AI的担忧,那么幻觉问题则表现了人们对AI能力的质疑。

当前的大模型经常会制造出听起来合理,但实际上并非基于事实的答案。

在周二的问答环节中,有人向老黄提出了这个棘手的问题:如何应对AI幻觉?


老黄表示:so easy!——你可能不知道有一种方法叫做RAG(检索增强生成),用了都说好~

大模型可以通过RAG审查信息的来源和上下文,将源信息中的事实与已知的真相进行比较,如果发现答案事实上有误——哪怕只是部分错误——就应该放弃该信息源,寻找下一个,最终为用户找到最好的答案。

「AI在给出答案前,应该先做研究,从而确定最佳的答案,——这相当于你的研究助理。」

对于一些比较重要的问题,比如事关身体健康,老黄建议,还是应该查阅多个资源和已知的真实信息来源。

并且AI系统需要能够表达出「我不知道你的问题答案」,或者「我无法就这个问题找到一个共识答案」,甚至是「嘿,超级碗比赛还没进行,所以我不知道谁赢了」等回答。


事实上,对于这个问题,GTC已经给出了解决方案。

Pure Storage 的抗幻觉技术

为了让RAG过程更简单快捷,Pure Storage与英伟达联手推出了一种全新的检索增强生成(RAG)流程。

其工作原理如下:

英伟达GPU负责进行计算,Pure Storage提供企业级的全闪存存储,用于存放大型向量数据库及其相关的原始数据。

随后,RAG通过向模型提供一个对经过清洗和向量化后的数据进行向量搜索的查询(包括新的或专有文档),提高了大语言模型推理的准确性和相关性。这样不仅为模型输入的参数提供了更准确的指导,还能够针对用户需求调整模型输出。

而这也意味着,对于组织而言,大语言模型推理查询的准确度、时效性和相关性得到了显著提升,使其在问答和文档摘要等应用场景中,为最终用户提供了更大的价值。


Pure Storage分别测试了文档嵌入和索引过程的三个关键阶段:

1. 向量文件上传至对象存储 2. 向量批量插入向量数据库 3. 索引文件的创建与写入

结果表明,将RAG过程分布在两组服务器和索引节点上,速度明显快于仅使用单组节点的配置。


当使用原生S3接口的Pure Storage FlashBlade//S,取代服务器内置的本地固态硬盘(SSD)时,文档嵌入和索引的速度提高了36%。


AGI与机器人

对于当前的AI发展,老黄表示,这是一场新的工业革命!

而今年,将是AI模型加持人形机器人高速发展的一年。

英伟达拥有1000多名机器人开发人员。在GTC的现场,老黄向观众展示了一大批GROOT项目诞生的机器人——包括来自《星球大战》的两位著名朋友。


老黄表示,新的AI模型将通过观看人类活动的例子来学习,同时也会在图书馆中学习,这将有助于它了解现实世界——多少有点令人毛骨悚然......

随后的一段视频展示了这些人形机器人在工厂、医疗保健和科学领域的开发过程,以及在现实世界中的运行情况,——人类与机器人共存的未来已经不远了。

虽然人工智能的未来常常让人联想到终结者式的机器人消灭人类的景象,但现实往往更加平凡。


老黄在会上介绍了一个将机器人技术和人系统融合在一起的虚拟仓库的演示,展示了如何提高生产力和效率。

我们可以从中窥见未来的工业将如何运作,而英伟达已经与工业巨头西门子签约来实施这个项目。

参考资料:

https://techcrunch.com/2024/03/19/agi-and-hallucinations/

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...