“机器人都去写诗了,人类还在洗碗” “机器人都去写诗了,人类还在洗碗”
admin
2024-04-08 12:39:09
0

*本文为《半月谈内部版》2024年第4期内容

“我们希望机器人帮助人类扫地、洗碗,是因为人类要去写诗、画画。现在机器人都去写诗、画画了,人类却还在扫地、洗碗。”

网上的这个段子听上去搞笑,却暗含对人工智能的深层追问:生成式人工智能飞驰,带来的推背感固然令人兴奋,但人类究竟需要怎样的智能?“规模化”的大模型之路能否带我们去往那个理想之境?

一年多来,看涨大模型的声浪已经很高。这一次看看热闹之外的另一面,看看里面隐藏几多陷阱几多“坑”。

后发者陷阱

春天是人工智能故事密集的季节。GPT4发布一周年之季,Figure01成为第一个“拿起苹果”的人形机器人。这一天距离被视作“世界模拟器”的Sora诞生还未满月,OpenAI和Figure官宣合作仅过去13天。

国内,“百模大战”依旧激战正酣。大模型卷出了新高度,一边“卷参数”、一边“拼落地”,消费电子厂商竞相把大模型装进手机,技术与产品加速迭代。多方红利释放下,产业似乎一片向好。但模型与模型之间,更多的是趋同。模型林立、参数浩瀚,但剥开外壳,想要找到够用的、扛打的、鹤立鸡群的,其实不太容易。

从GPT到Sora,同样的问题又一次摆到国内厂商面前:如何追赶、如何复现。每一次现象级“王炸”问世后,扎堆跟随成为不少从业者的路径依赖。

这种习惯由来已久。过去很长一段时间,是后发优势让我们尝到了甜头。后发者引进先发者的技术和经验,能避免大量试错纠偏成本以获得更快发展。毕竟自己搭梯子去摘高处的果实费时费力,还是“低垂的果实”捡起来多快好省。

然而,成长期的大模型,像鱼需要水一样等待算力、数据、资本、人力、能耗的投喂。这些因素过半受制于人或滞后于人时,后发劣势就会逐步显现。此时,先发者兴许早已坐收渔翁之利。


2023年7月6日,在2023世界人工智能大会展会现场拍摄的特斯拉机器人。方喆 摄

1848年,美国加利福尼亚发现了金矿,无数淘金客从世界各地涌向西海岸。10年过去后,大部分淘金者不仅没有发财,反而流离失所,而金矿旁边卖铲子的人最终得到了暴利和财富。

如今,大模型这波热潮,还没真正让多少人尝到实惠,但“卖铲子”的英伟达如同大象坐上火箭,率先成为赢家。出门走一走,几个创业者中总有一个在做大模型。有句话说,大模型创业者睁开眼就能看到对手。但今天,特别是在越发细分的AI级别芯片市场中,英伟达已经没了对手。

路线陷阱

站上风口的大模型光芒有多耀眼,其他技术路线的背影就有多落寞。这几年,大模型忙着刷参数、搞“军备竞赛”,但打败它的往往不是大模型。

时下最热的是自回归生成式路线,即大数据、大模型、大算力的“暴力美学”。从GPT到Sora,都是这一路线的代表产物。它的最大信仰是“规模”(scaling law)——“有疑问时,那就扩大规模”“如果还不够好,那就扩大规模”。

过去一年,“暴力美学”连赢两次,但这条路值得我们集体梭哈吗?

回溯技术发展史,路线之争一直伴随着人工智能的发展。没有一种路线始终独占上风,而是螺旋式推动技术向上走。另一方面,选择“暴力美学”需要算力的优势。而我们,算力遭到掣肘;投资,不比3年前充裕;数据,质量和数量是否够用有待时间检验。200多个(可能更多)大模型在嗷嗷待哺,等待无止境的算力投喂。与能够把一万张GPU连起来用的公司相比,时间窗口正不断错过。

大模型的尽头是AGI(通用人工智能)吗?至今,大数据、大算力炼出的大模型,实现的仍是小任务:回复一段话、做一段视频。这些任务如果交给人类大脑,也许只消耗25瓦的功率,但交给大模型之后,这个计算量就需要把一万张GPU连成串……这是“大数据、小任务”与“小数据、大任务”的不同。当我们琢磨起自己的每一个闪念、每一个行为是如何产生,其实不难发现,一些重要的任务、重要的功能根本无法在规模上无限扩展。

前者好比“鹦鹉学舌”,模仿人说话,既无法解释也不能理解。后者好比“鹦鹉喝水”,复杂架构,无需很多数据,却能实现感知、认知、推理、学习、执行等行为。

事实上,先发者已在看不见的地方,分散布局多点开花。后发者却信了风口造神的神话。

眼下,大模型建设如火如荼,越做越大,也越来越“贵”。最新的AI芯片一颗已经超过3万美元,还不是想买就能买得到。一个百亿级参数的大模型每天的用电量相当于1.7万个家庭的日用电量总和。“暴力美学”不烧脑,但真烧钱啊。

哪怕这条路追得起,跟随的人也总在雾里看花,风口来了一哄而上、泡沫破了一哄而散。因为不知其所以然,所以既不懂得什么应当舍弃,也不知道什么时候应当停下。

认知陷阱

向前看,人类依然期望在硅基上创造一个“人类镜像”。AGI的终极目的依然是让计算机像人类一样智能。AI也依然是那个改变“我们是谁、我们能做什么、我们成为什么”的技术。但仍有相当多的问题没有形成共识。

什么是智能?是数据海洋里的涌现吗?相比于有问才有答的聊天界面,人类是实境生物。人的生命力源自改造世界的实践,AGI的实现终将建立在与真实世界的互动之中。

而今天,等待人类投喂的大模型,还是一个被动接收的信息压缩器,不依赖内部意图驱动,也尚未形成感知世界、收集信息、归纳整合、提出理论、应用实践、修正理论的闭环。因此,自回归生成的语言、内容仅与人类的语言、创造有表面的相似,却没有内在机制的因果关联。


2023年10月17日,工作人员介绍应用大模型的智能驾驶舱。张漫子 摄

沿大模型的路走下去,如果新生的万物皆由过去的数据生成,那么世界如何朝前走——亚里士多德提出的“重的物体落地快,轻的物体落地慢”理论但凡被机器学习之后,伽利略的比萨斜塔实验就不会再有了,更不会出现推翻亚里士多德的“自由落体理论”了。

人类的重大发现,最初往往是基于一种实境中的违反逻辑的直觉,一种基于对现实和已有理论批判的顿悟,而不是对既有理论、历史结论的归纳、推演。

AI的进阶,既是一道工程问题,也是一道科学问题。不能仅运行在虚拟世界的语言、图像的生成之上,而应真正与现实交互、关联。

或许,在物理世界与数字世界中学习进化,以在理解世界、与世界交互的基础上完成复杂任务为目标的具身智能,将为AGI补全最后一块拼图。

下一波智能的竞争中,在算法、工程、数据、场景、软件、硬件交织杂糅的,从基础电机到减速器、控制器再到机械臂、灵巧手都需要持续技术突破的竞技场上,我们能否摆脱后发者的追逐、形成独特的核心优势?

通用人工智能这张“饼”够大。但要避得开陷阱,才能接得住富贵。

半月谈记者:张漫子 / 编辑:张曦

原标题:《跨越人工智能三大“坑”》

责编:褚孝鹏 / 校对:张子晴

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...