如果你的大脑可以模拟,会发生什么? 如果人类大脑开发100%会发生什么 如果你的大脑能对话
admin
2024-05-09 21:59:05
0

*本文为《半月谈》2024年第8期内容

人工智能的战场,是算法之争、数据之争,更是算力之争。AI烧热的,不只是一个个街谈巷议的话题,更是一颗颗大模型须臾不可离的GPU。

算力焦虑,犹如人工智能头顶的一朵乌云。吹散这朵乌云,能仅凭传统芯片不断升级的力量吗?也许,我们应该换个思路,转而向我们自己的大脑学习……

要论能效,还看大脑

1946年,世界上第一台电脑诞生。1973年,世界上第一台手机接通。经过半个多世纪的发展,今天的电脑手机已经成为人们追求智能生活不可或缺的基础设施。只不过,若论能效——算力与所需能量消耗之比,它们与人脑相比还是略逊一筹。

不妨用数字说话。训练一款ChatGPT,需要烧掉多少算力?如Open AI所透露的,ChatGPT背后有一个庞大的计算网络——Azure AI超算平台。这个微软专门建设的高性能网络集群包含1万颗GPU,为ChatGPT付出的总算力消耗超过3640 PF-days(以每秒计算1000万亿次计,持续计算3640天)。

而人类大脑在25瓦的极低能耗下,就能实现复杂环境中的关联记忆、快速识别、自主学习。这是为什么呢?

人类大脑活动是精密而连续的动力学过程,复杂程度远超当前算力资源模拟的上限。大脑约有1000亿个神经元,100万亿个突触,突触连接的平均长度约10-1000微米。以记忆为例,就与突触形态与功能的长期变化有关。

清华大学集成电路学院长聘副教授高滨举了一个例子:生理学先驱巴甫洛夫每天在狗吃饭前敲响铃声,再给它食物。经过一段时间,狗只要听到铃声,第一反应就是分泌唾液。这是因为狗的大脑已经在摇铃铛和吃东西之间建起连接,微观层面而言,就是两个神经元之间的突触连接变强,记忆由是产生,在此基础上,完成一次自适应学习。

小小芯片,模拟大脑

与人类大脑不同,迄今计算机的计算体系结构采取冯·诺依曼架构,计算与存储分离。数据在处理器和存储器之间不停地来回传输,约80%至90%的功耗都消耗在“搬运”中。

“每运算一次,就相当于把贮藏在遥远仓库(存储器)中的原材料(数据)运输到相距甚远的加工厂(处理器),而且运输的道路很是狭窄。这就导致实际生产效率非常低下,生产能力受到了运输能力的限制——这个局限就是‘存储墙’。运算量越大,这个瓶颈就越显著。”高滨说,冯·诺依曼架构在进行大规模的矩阵运算时,局限更为明显。

试想一下,人类大脑在思考时会有计算和存储的分别吗?左半球计算、右半球存储?“不是的。大脑的计算、存储发生在同一处,无需把数据搬来搬去。”中国科学院微电子研究所研究员尚大山说。


让我们重新回到人脑的工作原理。神经元接收来自其他神经元的信号,达到一定阈值时,即会向其他神经元发送信号。突触则负责信号传递,而且会依据信号的强度调整传递的强度(突触权重)。这个看似简单无奇的过程,却是身为“万物灵长”的人类智慧得以承传的前提,学习与记忆发生的基础。

简洁、高效而灵活,这样的计算方式让芯片科学家感慨演化的神奇之余,也不禁设想:何不设计一种可以模拟人脑的芯片?

一种新型电路元件——忆阻器,使这一设想有了实现的可能。

尚大山将忆阻器比作一条流动的河流:“河流的宽度(电阻值)可以根据流过的水量(电荷)而变化。如果流过更多的水,河床可能会变宽,使后续的水流更容易通过(电阻减小)。即使水流停止(断电),河流的宽度(忆阻器的电阻状态)也不会变化,直到有新的水流来改变它。”

为何说忆阻器能够模拟大脑?高滨说,忆阻器的奇妙特性,就在于可以通过外加电压的调制来改变其电阻值,这样,忆阻器器件就可理解为一个“电子突触”,突触权重用忆阻器电阻值来模拟。忆阻器阵列就可模拟人脑神经元的突触连接;神经元的功能,则可以搭建具体的功能电路模拟。当前人工智能的核心算法——深度神经网络,就转化为了忆阻器阵列的模拟计算。

简单说,忆阻器存算一体芯片是存储器中实现计算。“这相当于将加工厂放到了仓库边上,做到了本地加工生产,把交通运输过程中的时间、能源耗费降到最低。”高滨说。

超越“摩尔”,有待时日

衡量信息技术进步速度的摩尔定律,大家也许都耳熟能详。不过,在一颗芯片上已可集成800亿个晶体管的今天,这一“定律”还能适用多久,业界不无忧心。为芯片革新寻求增加晶体管数量之外的可能,在追求更高性能的同时尽量满足低功耗、低延迟、低成本,成为当务之急。

打破“存储墙”的存算一体模式,成为超越摩尔定律的潜在方向。而忆阻器,某种程度上就是存算一体的未来。


清华大学研究人员在实验室进行忆阻器电学特性实验

“忆阻器存算一体芯片最大的优势在于能效高,有望比冯·诺依曼架构提升2至3个数量级,是弥补工艺制程代差的可选路径。”中国移动研究院物联网研究所副所长牛亚文说,近期清华大学联合中国移动研发的110纳米忆阻器存算一体芯片已经达到冯·诺依曼架构28纳米GPU的能效。

访问密集型任务尤其是这种新型芯片的用武之地。人脸识别、图像识别、语义分割、大数据检索……种种人工智能时代的寻常场景,都可让忆阻器高密度和非挥发性存储的特性一展长才。

当然,当前忆阻器存算一体芯片仍存在集成规模受限、推理精度误差大、软件生态构建难等问题,将硬件、软件、系统、算法、库以及终端应用一体化整合,还有很长一段路要走。有专家提醒,忆阻器芯片一个有待突破的局限在于其耐久性。传统存储芯片依恃的晶体管靠控制电子的移动来存储数据,而忆阻器控制的是离子的移动。离子较电子更重,时间一长,灵活性、耐久性不免打了折扣。

芯片研发是需要在产业化中不断淬厉的事业。从科学到工程,从实验室到生产线,忆阻器芯片可以期待的明天,还在业界不断尝试的努力之中。

半月谈记者:张漫子

原标题:《缓解算力焦虑,向“大脑”要答案》

责编:褚孝鹏 / 校对:张子晴






相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...